Slovníček pojmů z oblasti AI a veřejné správy

Umělá inteligence není jen vizí budoucnosti – už dnes mění způsob, jakým úřady pracují a jak mohou občanům poskytovat služby. Slovníček proto přináší přehled klíčových pojmů, které formují svět AI a její uplatnění ve veřejné správě.

Každý pojem je vysvětlen srozumitelně a doplněn o praktický příklad využití, aby bylo jasné, jak se z teoretických principů stávají konkrétní řešení. Cílem je ukázat, že digitální technologie nejsou jen technickým nástrojem, ale inspirací k efektivnějšímu a odpovědnějšímu výkonu veřejné správy.

AI gramotnost (AI literacy) legální definice

Dovednosti, znalosti a chápání, které poskytovatelům, zavádějícím subjektům a dotčeným osobám umožňují, aby s přihlédnutím k jejich příslušným právům a povinnostem v souvislosti s tímto nařízením zaváděli systémy AI informovaným způsobem a aby si byli vědomi možností a rizik spojených s AI i možných škod, které může způsobit (čl. 3 odst. 56 nařízení o umělé inteligenci).

Algoritmus

Přesný postup nebo návod, kterým lze vyřešit daný typ úlohy krok za krokem. V informatice se algoritmus typicky vyjadřuje ve formě sekvence instrukcí či pravidel pro zpracování vstupních dat a dosažení požadovaného výsledku. Algoritmy mohou být jednoduché (např. algoritmus na seřazení čísel) nebo velmi komplexní (např. algoritmus pro trénování neuronové sítě).

Automatizace

Proces nahrazování nebo zjednodušování lidských činností stroji či technologiemi. V praxi to znamená využití samočinných řídicích systémů k ovládání zařízení a procesů, typicky za účelem zvýšení efektivity, přesnosti a rychlosti prováděných úkolů.

CAPTCHA

Automatizovaný test, jehož cílem je odlišit lidského uživatele od počítačového programu (bota). Typická CAPTCHA úloha vyžaduje, aby uživatel provedl něco, co je pro člověka snadné, ale pro stroj obtížné – např. opsal zkreslený text z obrázku, identifikoval objekty na několika fotografiích nebo vyřešil jednoduchý vizuální úkol. Používá se jako bezpečnostní opatření na webových stránkách k zamezení automatizovaného spamu či zneužívání služeb.

Černá skříňka (black box)

Systém nebo model, u něhož nejsou z vnějšího pohledu srozumitelné vnitřní mechanismy rozhodování. U AI se tak označují např. složité modely (jako hluboké neuronové sítě), kde víme, jaké vstupy jdou dovnitř a jaké výstupy ven, ale je obtížné vysvětlit, proč model dal konkrétní výsledek. Black-box modely tedy postrádají transparentnost ohledně svého vnitřního fungování.

Digitální (virtuální) asistent

AI aplikace, která pomáhá uživateli komunikovat se zařízením a plnit různé úkoly prostřednictvím přirozené konverzace. Typicky využívá rozpoznávání hlasu a zpracování přirozeného jazyka k porozumění pokynům a umí reagovat hlasem nebo textem. Příklady digitálních asistentů jsou hlasoví asistenti jako Siri, Alexa nebo Google Asistent, kteří dokáží zodpovídat dotazy, nastavovat upomínky, ovládat chytrá zařízení a podobně.

Distributor (distributor) legální definice

Fyzická nebo právnická osoba v dodavatelském řetězci, jiná než poskytovatel nebo dovozce, která dodává systém AI na trh Unie (čl. 3 odst. 7 nařízení o umělé inteligenci).

Dovozce (importer) legální definice

Fyzická nebo právnická osoba nacházející se nebo usazená v Unii, která uvádí na trh systém AI označený jménem, názvem nebo ochrannou známkou fyzické nebo právnické osoby usazené ve třetí zemi (čl. 3 odst. 6 nařízení o umělé inteligenci).

Evropský úřad pro umělou inteligenci (European Artificial Intelligence Office) legální definice

Evropský úřad pro umělou inteligenci je součástí správní struktury Generálního ředitelství pro komunikační sítě, obsah a technologie a podléhá jeho ročnímu plánu řízení. (Rozhodnutí Komise ze dne 24.1.2024, kterým se zřizuje Evropský úřad pro umělou inteligenci C(2024) 390).

Expertní systém

Expertní systém je počítačový program navržený tak, aby poskytoval odborné rady či rozhodnutí v určité specifické oblasti na úrovni lidského experta. Typicky obsahuje znalostní bázi (souhrn pravidel a faktů daného oboru) a inferenční stroj, který z těchto znalostí a zadaných vstupů odvodí závěry nebo doporučení pro daný problém.

Generativní AI (generative AI)

Modely AI, které jsou navrženy k vytváření nového obsahu – ať už psaného textu, obrázků, hudby či jiných médií – na základě naučených vzorů z trénovacích dat. Generativní AI dokáže na vstupní zadání (prompt) vygenerovat originální výstup, který dodržuje kontext a styl požadovaný uživatelem.

Generování rozšířené o vyhledávání (retrieval-augmented generation, RAG)

Metoda, která kombinuje velký jazykový model s externí znalostní databází, aby se zvýšila aktuálnost a přesnost jeho odpovědí. Při RAG přístupu model nejprve dostane k dotazu uživatele relevantní informace vyhledané v databázi znalostí (retrieval) a teprve poté generuje finální odpověď s odkazem na tyto dodatečné informace. Tím se překonává omezení jazykových modelů, které by jinak odpovídaly jen na základě statických dat ze svého tréninku – RAG umožňuje zahrnout aktuální či specializované znalosti bez nutnosti model přeučovat.

Halucinace

Jev, kdy model umělé inteligence (zejména velký jazykový model) generuje výrok či odpověď, která zní přesvědčivě a sebevědomě, avšak není pravdivá ani fakticky podložená. Model si tak obrazně vymyslí neexistující fakta nebo nesprávné informace. Halucinace jsou důsledkem statistické povahy generativních modelů – model může vytvořit obsah, který nebyl v trénovacích datech, a nic mu nebrání v tom, aby byl fakticky chybný.

Hluboké učení (deep learning)

Typ strojového učení založený na umělých neuronových sítích s mnoha vrstvami. Tyto hluboké neuronové sítě se dokáží naučit velmi složité vzory a reprezentace v datech hierarchicky – vyšší vrstvy sítě postupně navazují na výstupy nižších vrstev a umožňují tak počítači porozumět komplexním charakteristikám vstupních dat (např. rozpoznávat objekty na obrázcích či porozumět kontextu vět).

Chatbot

Počítačový program navržený pro simulaci přirozené konverzace s uživatelem. Využívá technologie zpracování přirozeného jazyka k porozumění dotazům a generování odpovědí. Chatboti mohou fungovat textově (např. v chatovacích oknech) i hlasově a často se využívají pro zákaznickou podporu, informační služby nebo jako virtuální asistenti.

Inteligentní agent

Autonomní entita (softwarová nebo hardwarová), která vnímá své okolní prostředí senzory a na základě toho v prostředí jedná pomocí aktuátorů tak, aby dosáhla svých cílů. Klíčovými vlastnostmi inteligentního agentu jsou autonomie (jedná samostatně bez neustálého dohledu člověka), proaktivita (sleduje cíle) a reaktivita (reaguje na změny prostředí).

Kávový test

Neformální zkouška navržená spoluzakladatelem Apple Stevem Wozniakem, která má prověřit skutečnou obecnou inteligenci robota. Robot úspěšně projde kávovým testem, pokud dokáže vstoupit do libovolné cizí domácnosti, najít v ní kuchyň a uvařit v ní kávu, aniž by měl předem jakékoli konkrétní instrukce o uspořádání dané domácnosti.

Nařízení o umělé inteligenci (AI Act) legální definice

Nařízení Evropského parlamentu a Rady (EU) 2024/1689 ze dne 13. června 2024, kterým se stanoví harmonizovaná pravidla pro umělou inteligenci, tzv. akt o umělé inteligenci, stanovující harmonizovaná pravidla pro vývoj, uvádění na trh a využívání systémů umělé inteligence v Evropské unii. Zavádí povinnosti pro jednotlivé role v životním cyklu AI, klasifikaci systémů podle rizika a opatření na ochranu základních práv.

Neuronová síť (neural network)

Model strojového učení, inspirovaný strukturou a funkcí biologického mozku, tvořený více vrstvami lineárních a nelineárních transformací, které automaticky extrahují a reprezentují relevantní rysy ze vstupních dat za účelem predikce, klasifikace či generování..

Poskytovatel (provider) legální definice

Fyzická nebo právnická osoba, veřejný orgán, agentura nebo jiný subjekt, který vyvíjí systém AI či obecný model AI nebo nechává vyvíjet systém AI či obecný model AI a uvádějí je na trh nebo které uvádějí systém AI do provozu pod svým vlastním jménem, názvem nebo ochrannou známkou, ať už za úplatu, nebo zdarma (čl. 3 odst. 3 nařízení o umělé inteligenci).

Počítačové vidění (computer vision)

Oblast umělé inteligence, která se zaměřuje na umožnění počítačům interpretovat a chápat vizuální svět (obrázky a videa) podobně jako člověk. Zahrnuje metody pro zpracování a analýzu digitálních obrazů za účelem rozpoznávání objektů, detekce událostí či získávání informací z vizuálních dat. Pomocí trénovacích dat se modely počítačového vidění naučí identifikovat konkrétní objekty v obrazech a vyhodnocovat jejich význam v kontextu.

Prompt

Vstupní instrukce nebo otázka, kterou uživatel zadá modelu umělé inteligence, aby vyvolal požadovanou odpověď či výsledek. Prompt je formulován v přirozeném jazyce (případně s určitými zvláštními značkami či klíčovými slovy) a kvalita a formulace promptu zásadně ovlivňuje kvalitu generovaného výstupu modelu.

Prompt inženýrství (prompt engineering)

Postup a disciplína spočívající v navrhování, testování a optimalizaci promptů pro generativní modely umělé inteligence tak, aby tyto modely poskytovaly co nejlepší a nejpřesnější výstupy. Zahrnuje techniky, jak formulovat instrukce, dávat modelu kontext, příklady nebo jiná vodítka v promptu, aby model porozuměl úloze a vygeneroval požadovaný výsledek.

Předpojatost (Bias)

Sytémová odchylka nebo zkreslení v chování modelu, které vyplývá z nevhodných či nevyvážených trénovacích dat nebo ze zaujatosti v návrhu algoritmu. Algoritmické zkreslení se projevuje tak, že model dává přednost nebo znevýhodňuje určité skupiny nebo vlastnosti (např. pohlaví, etnikum) bez legitimního důvodu, pouze na základě vzorů v datech. Důsledkem mohou být nespravedlivé či diskriminační rozhodnutí systému.

Regulační sandbox pro AI (AI regulatory sandbox) Legální definice

Kontrolovaný rámec zřízený příslušným orgánem, který poskytovatelům nebo potenciálním poskytovatelům systémů AI nabízí možnost vyvíjet, trénovat, ověřovat a testovat inovativní systém AI, případně v reálných podmínkách, podle plánu testování v sandboxu po omezenou dobu pod regulačním dohledem (čl. 3 odst. 55 nařízení o umělé inteligenci).

Strojové učení (machine learning)

Podoblast umělé inteligence, která se zaměřuje na algoritmy a modely umožňující počítačovým systémům zlepšovat své chování na základě dat a zkušeností namísto explicitního naprogramování. Model se během trénování učí odhalovat vzory v datech a následně dokáže predikovat či rozhodovat i o nových vstupních datech.

Systém AI (AI system) Legální definice

Strojový systém navržený tak, aby po zavedení fungoval s různými úrovněmi autonomie a který po zavedení může vykazovat adaptabilitu a který za explicitními nebo implicitními účely z obdržených vstupů odvozuje, jak generovat výstupy, jako jsou predikce, obsah, doporučení nebo rozhodnutí, které mohou ovlivnit fyzická nebo virtuální prostředí (čl. 3 odst. 1 nařízení o umělé inteligenci).

Teplota (temperature)

Parametr velkých jazykových modelů (LLM), který určuje míru náhody v generování textu. Hodnota se obvykle pohybuje v rozmezí od 0 do 2. Nízká teplota znamená vyšší předvídatelnost a konzistenci odpovědí, zatímco vyšší teplota přináší větší variabilitu a kreativitu. Prakticky to znamená, že model s nižší teplotou vybírá slova s nejvyšší pravděpodobností, zatímco model s vyšší teplotou častěji zkouší méně pravděpodobné, ale zajímavé možnosti.

Testovací data

Podmnožina původního datového souboru, která slouží výhradně k vyhodnocení modelu po dokončení trénování, aby se zjistilo, jak dobře model dokáže predikovat výstupy na dosud neviděných datech.

Testovací data (testing data) Legální definice

Data používaná k zajištění nezávislého zhodnocení systému AI za účelem potvrzení očekávané výkonnosti tohoto systému před jeho uvedením na trh nebo do provozuu (čl. 3 odst. 32 nařízení o umělé inteligenci).

Token

Sekvence znaků (typicky část slova, celé slovo nebo znak) považovaná za jednotku textu pro model AI. Jazykové modely pracují s textem právě na úrovni tokenů.

Tokenizace

Proces převodu textu do posloupnosti tokenů, se pracuje model AI.

Trénovací data

Datová sada, na které se model umělé inteligence učí rozpoznávat vzory, vztahy a pravidelnosti v datech. Obsahuje buď označené vzorky (u modelů učení s učitelem), nebo neoznačené vzorky (u modelů učení bez učitele). Trénovací data slouží k postupné optimalizaci vnitřních parametrů modelu tak, aby dokázal co nejpřesněji reagovat na nové vstupy. Kvalita, reprezentativnost a rozmanitost trénovacích dat mají zásadní vliv na výslednou přesnost, spolehlivost a spravedlivost modelu.

Trénovací data (training data) Legální definice

Data používaná pro trénování systému AI přizpůsobováním jeho parametrů, které lze ovlivnit učením (čl. 3 odst. 29 nařízení o umělé inteligenci).

Turingův test

Myšlenkový experiment a metodický návrh Alana Turinga z roku 1950, který má odpovědět na otázku, zda může stroj „myslet“. Test spočívá v tom, že člověk (tazatel) komunikuje písemně se dvěma subjekty – jedním je člověk a druhým stroj. Pokud tazatel na základě odpovědí nedokáže spolehlivě určit, kdo je kdo, považuje se stroj za inteligentní v lidském smyslu.

Umělá inteligence (artificial intelligence, AI)

Oblast vědy, která se zabývá tvorbou strojů vykazujících známky inteligentního chování. Cílem je umožnit strojům vnímat své okolí, učit se z dat, přizpůsobovat se novým situacím a samostatně rozhodovat nebo řešit problémy, které by jinak vyžadovaly lidské myšlení.

Případ využití (use case)

Konkrétní scénář nebo způsob využití technologie či systému k dosažení určitého cíle. Jde o popis, jak uživatel nebo organizace může prakticky použít dané řešení v reálné situaci. V oblasti IT a AI se pojem „use case“ používá k ilustraci aplikace technologie.

Učení bez učitele (unsupervised learning)

Typ strojového učení, kdy se model trénuje na neoznačených datech – nemá předem dané správné odpovědi. Snaží se v datech nalézt skryté struktury, podobnosti nebo rozdělení do skupin. Typickými úlohami učení bez učitele jsou shlukování (clustering), kdy model rozdělí data do skupin s podobnými vlastnostmi, nebo hledání anomálií (detekce odlehlých hodnot).

Učení s učitelem (supervised learning)

Typ strojového učení, při kterém model trénujeme na trénovacích datech obsahujících vstupy i správné výstupy (tzv. označená data). Model postupně upravuje své parametry tak, aby pro dané vstupy produkoval co nejpřesněji požadované výstupy. Supervizované učení se používá např. pro klasifikaci (model se učí z příkladů přiřazovat vstupům kategorie) či regresi (predikci číselné hodnoty).

Validační prompt

Speciálně formulovaný vstup pro jazykový nebo generativní model, jehož cílem je ověřit správnost, úplnost či konzistenci výstupu modelu. Typicky se používá k tomu, aby model sám sebe znovu zkontroloval, vyhodnotil varianty odpovědí nebo potvrdil, zda výsledek splňuje stanovená kritéria.

Vektor

Uspořádaná číselná reprezentace, která slouží k matematickému vyjádření datového prvku. Modely strojového učení převádějí vstupy jako slova, obrázky či jiná data do vektorů tak, aby s nimi mohly efektivně pracovat (počítat).

Vektorová databáze

Specializovaný úložný systém pro ukládání a vyhledávání dat ve formě vektorových reprezentací (embeddingů). Každý objekt (např. text, obrázek, zvuk) je převeden na vektor čísel a spolu s metadaty uložen do databáze. Základní funkcí je vyhledávání „nejbližších sousedů“ – tedy vektorů, které jsou nejpodobnější zadanému vektoru podle určité metriky podobnosti (např. kosinové). Vektorové databáze se používají k vyhledávání podobných textů, obrázků, videí či jiných nestrukturovaných dat podle jejich významu, nikoli jen podle shody slov.

Vektorová reprezentace (Embedding)

Transformace nějakého objektu (slova, věty, obrázku, videa) do podoby číselného vektoru tak, aby tento vektor zachycoval klíčové vlastnosti či význam původního objektu. Výsledný vektor (embedding) leží v mnohorozměrném prostoru, kde lze sémantickou podobnost dvou objektů posuzovat například vzdáleností jejich vektorů – podobné objekty mají vektory blízko u sebe.

Velký jazykový model (large language model, LLM)

Pokročilý model zpracování přirozeného jazyka s velmi velkým počtem parametrů, trénovaný na rozsáhlých objemech textových dat. Díky své velikosti a komplexitě dokáže rozumět složitým jazykovým vstupům a generovat souvislé a kontextově relevantní texty.

Velký multimodální model (large multimodal model, LMM)

Model umělé inteligence, který dokáže zpracovávat a generovat více než jeden typ dat (neboli modality), typicky kombinaci textu a dalších médií (např. obrazů, videí či zvuku). Na rozdíl od čistě jazykových modelů může LMM přijímat vstupy ve formě textu či jiných médií a podle toho vytvářet odpovídající výstupy.

Vysvětlitelná AI (Explainable AI, XAI)

Přístup k AI kladoucí důraz na to, aby modely a jejich rozhodnutí byly pro lidi srozumitelné a mohli jsme pochopit důvody, proč AI k určitému výsledku došla. Cílem je vyvinout takové modely nebo metody, které umožní nahlédnout do vnitřního fungování „černých skříněk“ a vysvětlit jejich rozhodovací procesy. To zvyšuje důvěru uživatelů v AI a umožňuje odhalit případné chyby či zkreslení (bias).

Zavádějící subjekt (Deployer) Legální definice

Fyzická nebo právnická osoba, veřejný orgán, agentura nebo jiný subjekt, které v rámci své pravomoci využívá systém AI, s výjimkou případů, kdy je systém AI využíván při osobní neprofesionální činnosti (čl. 3 odst. 4 nařízení o umělé inteligenci).

Zpracování přirozeného jazyka (Natural Language Processing, NLP)

Interdisciplinární obor na pomezí lingvistiky a informatiky (umělé inteligence), který se zabývá analýzou a generováním textu nebo mluvené řeči tak, aby jí počítač rozuměl a dokázal je smysluplně zpracovat. Typickými úlohami jsou například strojový překlad, odpovídání na otázky nebo automatická korektura textu.