Slovníček pojmů z oblasti AI a veřejné správy
Umělá inteligence není jen vizí budoucnosti – už dnes mění způsob, jakým úřady pracují a jak mohou občanům poskytovat služby. Slovníček proto přináší přehled klíčových pojmů, které formují svět AI a její uplatnění ve veřejné správě.
Každý pojem je vysvětlen srozumitelně a doplněn o praktický příklad využití, aby bylo jasné, jak se z teoretických principů stávají konkrétní řešení. Cílem je ukázat, že digitální technologie nejsou jen technickým nástrojem, ale inspirací k efektivnějšímu a odpovědnějšímu výkonu veřejné správy.
| AI gramotnost (AI literacy) legální definice |
Dovednosti, znalosti a chápání, které poskytovatelům, zavádějícím subjektům a dotčeným osobám umožňují, aby s přihlédnutím k jejich příslušným právům a povinnostem v souvislosti s tímto nařízením zaváděli systémy AI informovaným způsobem a aby si byli vědomi možností a rizik spojených s AI i možných škod, které může způsobit (čl. 3 odst. 56 nařízení o umělé inteligenci). |
|---|---|
| Algoritmus |
Přesný postup nebo návod, kterým lze vyřešit daný typ úlohy krok za krokem. V informatice se algoritmus typicky vyjadřuje ve formě sekvence instrukcí či pravidel pro zpracování vstupních dat a dosažení požadovaného výsledku. Algoritmy mohou být jednoduché (např. algoritmus na seřazení čísel) nebo velmi komplexní (např. algoritmus pro trénování neuronové sítě). |
| Automatizace |
Proces nahrazování nebo zjednodušování lidských činností stroji či technologiemi. V praxi to znamená využití samočinných řídicích systémů k ovládání zařízení a procesů, typicky za účelem zvýšení efektivity, přesnosti a rychlosti prováděných úkolů. |
| CAPTCHA |
Automatizovaný test, jehož cílem je odlišit lidského uživatele od počítačového programu (bota). Typická CAPTCHA úloha vyžaduje, aby uživatel provedl něco, co je pro člověka snadné, ale pro stroj obtížné – např. opsal zkreslený text z obrázku, identifikoval objekty na několika fotografiích nebo vyřešil jednoduchý vizuální úkol. Používá se jako bezpečnostní opatření na webových stránkách k zamezení automatizovaného spamu či zneužívání služeb. |
| Černá skříňka (black box) |
Systém nebo model, u něhož nejsou z vnějšího pohledu srozumitelné vnitřní mechanismy rozhodování. U AI se tak označují např. složité modely (jako hluboké neuronové sítě), kde víme, jaké vstupy jdou dovnitř a jaké výstupy ven, ale je obtížné vysvětlit, proč model dal konkrétní výsledek. Black-box modely tedy postrádají transparentnost ohledně svého vnitřního fungování. |
| Digitální (virtuální) asistent |
AI aplikace, která pomáhá uživateli komunikovat se zařízením a plnit různé úkoly prostřednictvím přirozené konverzace. Typicky využívá rozpoznávání hlasu a zpracování přirozeného jazyka k porozumění pokynům a umí reagovat hlasem nebo textem. Příklady digitálních asistentů jsou hlasoví asistenti jako Siri, Alexa nebo Google Asistent, kteří dokáží zodpovídat dotazy, nastavovat upomínky, ovládat chytrá zařízení a podobně. |
| Distributor (distributor) legální definice |
Fyzická nebo právnická osoba v dodavatelském řetězci, jiná než poskytovatel nebo dovozce, která dodává systém AI na trh Unie (čl. 3 odst. 7 nařízení o umělé inteligenci). |
| Dovozce (importer) legální definice |
Fyzická nebo právnická osoba nacházející se nebo usazená v Unii, která uvádí na trh systém AI označený jménem, názvem nebo ochrannou známkou fyzické nebo právnické osoby usazené ve třetí zemi (čl. 3 odst. 6 nařízení o umělé inteligenci). |
| Evropský úřad pro umělou inteligenci (European Artificial Intelligence Office) legální definice |
Evropský úřad pro umělou inteligenci je součástí správní struktury Generálního ředitelství pro komunikační sítě, obsah a technologie a podléhá jeho ročnímu plánu řízení. (Rozhodnutí Komise ze dne 24.1.2024, kterým se zřizuje Evropský úřad pro umělou inteligenci C(2024) 390). |
| Expertní systém |
Expertní systém je počítačový program navržený tak, aby poskytoval odborné rady či rozhodnutí v určité specifické oblasti na úrovni lidského experta. Typicky obsahuje znalostní bázi (souhrn pravidel a faktů daného oboru) a inferenční stroj, který z těchto znalostí a zadaných vstupů odvodí závěry nebo doporučení pro daný problém. |
| Generativní AI (generative AI) |
Modely AI, které jsou navrženy k vytváření nového obsahu – ať už psaného textu, obrázků, hudby či jiných médií – na základě naučených vzorů z trénovacích dat. Generativní AI dokáže na vstupní zadání (prompt) vygenerovat originální výstup, který dodržuje kontext a styl požadovaný uživatelem. |
| Generování rozšířené o vyhledávání (retrieval-augmented generation, RAG) |
Metoda, která kombinuje velký jazykový model s externí znalostní databází, aby se zvýšila aktuálnost a přesnost jeho odpovědí. Při RAG přístupu model nejprve dostane k dotazu uživatele relevantní informace vyhledané v databázi znalostí (retrieval) a teprve poté generuje finální odpověď s odkazem na tyto dodatečné informace. Tím se překonává omezení jazykových modelů, které by jinak odpovídaly jen na základě statických dat ze svého tréninku – RAG umožňuje zahrnout aktuální či specializované znalosti bez nutnosti model přeučovat. |
| Halucinace |
Jev, kdy model umělé inteligence (zejména velký jazykový model) generuje výrok či odpověď, která zní přesvědčivě a sebevědomě, avšak není pravdivá ani fakticky podložená. Model si tak obrazně vymyslí neexistující fakta nebo nesprávné informace. Halucinace jsou důsledkem statistické povahy generativních modelů – model může vytvořit obsah, který nebyl v trénovacích datech, a nic mu nebrání v tom, aby byl fakticky chybný. |
| Hluboké učení (deep learning) |
Typ strojového učení založený na umělých neuronových sítích s mnoha vrstvami. Tyto hluboké neuronové sítě se dokáží naučit velmi složité vzory a reprezentace v datech hierarchicky – vyšší vrstvy sítě postupně navazují na výstupy nižších vrstev a umožňují tak počítači porozumět komplexním charakteristikám vstupních dat (např. rozpoznávat objekty na obrázcích či porozumět kontextu vět). |
| Chatbot |
Počítačový program navržený pro simulaci přirozené konverzace s uživatelem. Využívá technologie zpracování přirozeného jazyka k porozumění dotazům a generování odpovědí. Chatboti mohou fungovat textově (např. v chatovacích oknech) i hlasově a často se využívají pro zákaznickou podporu, informační služby nebo jako virtuální asistenti. |
| Inteligentní agent |
Autonomní entita (softwarová nebo hardwarová), která vnímá své okolní prostředí senzory a na základě toho v prostředí jedná pomocí aktuátorů tak, aby dosáhla svých cílů. Klíčovými vlastnostmi inteligentního agentu jsou autonomie (jedná samostatně bez neustálého dohledu člověka), proaktivita (sleduje cíle) a reaktivita (reaguje na změny prostředí). |
| Kávový test |
Neformální zkouška navržená spoluzakladatelem Apple Stevem Wozniakem, která má prověřit skutečnou obecnou inteligenci robota. Robot úspěšně projde kávovým testem, pokud dokáže vstoupit do libovolné cizí domácnosti, najít v ní kuchyň a uvařit v ní kávu, aniž by měl předem jakékoli konkrétní instrukce o uspořádání dané domácnosti. |
| Nařízení o umělé inteligenci (AI Act) legální definice |
Nařízení Evropského parlamentu a Rady (EU) 2024/1689 ze dne 13. června 2024, kterým se stanoví harmonizovaná pravidla pro umělou inteligenci, tzv. akt o umělé inteligenci, stanovující harmonizovaná pravidla pro vývoj, uvádění na trh a využívání systémů umělé inteligence v Evropské unii. Zavádí povinnosti pro jednotlivé role v životním cyklu AI, klasifikaci systémů podle rizika a opatření na ochranu základních práv. |
| Neuronová síť (neural network) |
Model strojového učení, inspirovaný strukturou a funkcí biologického mozku, tvořený více vrstvami lineárních a nelineárních transformací, které automaticky extrahují a reprezentují relevantní rysy ze vstupních dat za účelem predikce, klasifikace či generování.. |
| Poskytovatel (provider) legální definice |
Fyzická nebo právnická osoba, veřejný orgán, agentura nebo jiný subjekt, který vyvíjí systém AI či obecný model AI nebo nechává vyvíjet systém AI či obecný model AI a uvádějí je na trh nebo které uvádějí systém AI do provozu pod svým vlastním jménem, názvem nebo ochrannou známkou, ať už za úplatu, nebo zdarma (čl. 3 odst. 3 nařízení o umělé inteligenci). |
| Počítačové vidění (computer vision) |
Oblast umělé inteligence, která se zaměřuje na umožnění počítačům interpretovat a chápat vizuální svět (obrázky a videa) podobně jako člověk. Zahrnuje metody pro zpracování a analýzu digitálních obrazů za účelem rozpoznávání objektů, detekce událostí či získávání informací z vizuálních dat. Pomocí trénovacích dat se modely počítačového vidění naučí identifikovat konkrétní objekty v obrazech a vyhodnocovat jejich význam v kontextu. |
| Prompt |
Vstupní instrukce nebo otázka, kterou uživatel zadá modelu umělé inteligence, aby vyvolal požadovanou odpověď či výsledek. Prompt je formulován v přirozeném jazyce (případně s určitými zvláštními značkami či klíčovými slovy) a kvalita a formulace promptu zásadně ovlivňuje kvalitu generovaného výstupu modelu. |
| Prompt inženýrství (prompt engineering) |
Postup a disciplína spočívající v navrhování, testování a optimalizaci promptů pro generativní modely umělé inteligence tak, aby tyto modely poskytovaly co nejlepší a nejpřesnější výstupy. Zahrnuje techniky, jak formulovat instrukce, dávat modelu kontext, příklady nebo jiná vodítka v promptu, aby model porozuměl úloze a vygeneroval požadovaný výsledek. |
| Předpojatost (Bias) |
Sytémová odchylka nebo zkreslení v chování modelu, které vyplývá z nevhodných či nevyvážených trénovacích dat nebo ze zaujatosti v návrhu algoritmu. Algoritmické zkreslení se projevuje tak, že model dává přednost nebo znevýhodňuje určité skupiny nebo vlastnosti (např. pohlaví, etnikum) bez legitimního důvodu, pouze na základě vzorů v datech. Důsledkem mohou být nespravedlivé či diskriminační rozhodnutí systému. |
| Regulační sandbox pro AI (AI regulatory sandbox) Legální definice |
Kontrolovaný rámec zřízený příslušným orgánem, který poskytovatelům nebo potenciálním poskytovatelům systémů AI nabízí možnost vyvíjet, trénovat, ověřovat a testovat inovativní systém AI, případně v reálných podmínkách, podle plánu testování v sandboxu po omezenou dobu pod regulačním dohledem (čl. 3 odst. 55 nařízení o umělé inteligenci). |
| Strojové učení (machine learning) |
Podoblast umělé inteligence, která se zaměřuje na algoritmy a modely umožňující počítačovým systémům zlepšovat své chování na základě dat a zkušeností namísto explicitního naprogramování. Model se během trénování učí odhalovat vzory v datech a následně dokáže predikovat či rozhodovat i o nových vstupních datech. |
| Systém AI (AI system) Legální definice |
Strojový systém navržený tak, aby po zavedení fungoval s různými úrovněmi autonomie a který po zavedení může vykazovat adaptabilitu a který za explicitními nebo implicitními účely z obdržených vstupů odvozuje, jak generovat výstupy, jako jsou predikce, obsah, doporučení nebo rozhodnutí, které mohou ovlivnit fyzická nebo virtuální prostředí (čl. 3 odst. 1 nařízení o umělé inteligenci). |
| Teplota (temperature) |
Parametr velkých jazykových modelů (LLM), který určuje míru náhody v generování textu. Hodnota se obvykle pohybuje v rozmezí od 0 do 2. Nízká teplota znamená vyšší předvídatelnost a konzistenci odpovědí, zatímco vyšší teplota přináší větší variabilitu a kreativitu. Prakticky to znamená, že model s nižší teplotou vybírá slova s nejvyšší pravděpodobností, zatímco model s vyšší teplotou častěji zkouší méně pravděpodobné, ale zajímavé možnosti. |
| Testovací data |
Podmnožina původního datového souboru, která slouží výhradně k vyhodnocení modelu po dokončení trénování, aby se zjistilo, jak dobře model dokáže predikovat výstupy na dosud neviděných datech. |
| Testovací data (testing data) Legální definice |
Data používaná k zajištění nezávislého zhodnocení systému AI za účelem potvrzení očekávané výkonnosti tohoto systému před jeho uvedením na trh nebo do provozuu (čl. 3 odst. 32 nařízení o umělé inteligenci). |
| Token |
Sekvence znaků (typicky část slova, celé slovo nebo znak) považovaná za jednotku textu pro model AI. Jazykové modely pracují s textem právě na úrovni tokenů. |
| Tokenizace |
Proces převodu textu do posloupnosti tokenů, se pracuje model AI. |
| Trénovací data |
Datová sada, na které se model umělé inteligence učí rozpoznávat vzory, vztahy a pravidelnosti v datech. Obsahuje buď označené vzorky (u modelů učení s učitelem), nebo neoznačené vzorky (u modelů učení bez učitele). Trénovací data slouží k postupné optimalizaci vnitřních parametrů modelu tak, aby dokázal co nejpřesněji reagovat na nové vstupy. Kvalita, reprezentativnost a rozmanitost trénovacích dat mají zásadní vliv na výslednou přesnost, spolehlivost a spravedlivost modelu. |
| Trénovací data (training data) Legální definice |
Data používaná pro trénování systému AI přizpůsobováním jeho parametrů, které lze ovlivnit učením (čl. 3 odst. 29 nařízení o umělé inteligenci). |
| Turingův test |
Myšlenkový experiment a metodický návrh Alana Turinga z roku 1950, který má odpovědět na otázku, zda může stroj „myslet“. Test spočívá v tom, že člověk (tazatel) komunikuje písemně se dvěma subjekty – jedním je člověk a druhým stroj. Pokud tazatel na základě odpovědí nedokáže spolehlivě určit, kdo je kdo, považuje se stroj za inteligentní v lidském smyslu. |
| Umělá inteligence (artificial intelligence, AI) |
Oblast vědy, která se zabývá tvorbou strojů vykazujících známky inteligentního chování. Cílem je umožnit strojům vnímat své okolí, učit se z dat, přizpůsobovat se novým situacím a samostatně rozhodovat nebo řešit problémy, které by jinak vyžadovaly lidské myšlení. |
| Případ využití (use case) |
Konkrétní scénář nebo způsob využití technologie či systému k dosažení určitého cíle. Jde o popis, jak uživatel nebo organizace může prakticky použít dané řešení v reálné situaci. V oblasti IT a AI se pojem „use case“ používá k ilustraci aplikace technologie. |
| Učení bez učitele (unsupervised learning) |
Typ strojového učení, kdy se model trénuje na neoznačených datech – nemá předem dané správné odpovědi. Snaží se v datech nalézt skryté struktury, podobnosti nebo rozdělení do skupin. Typickými úlohami učení bez učitele jsou shlukování (clustering), kdy model rozdělí data do skupin s podobnými vlastnostmi, nebo hledání anomálií (detekce odlehlých hodnot). |
| Učení s učitelem (supervised learning) |
Typ strojového učení, při kterém model trénujeme na trénovacích datech obsahujících vstupy i správné výstupy (tzv. označená data). Model postupně upravuje své parametry tak, aby pro dané vstupy produkoval co nejpřesněji požadované výstupy. Supervizované učení se používá např. pro klasifikaci (model se učí z příkladů přiřazovat vstupům kategorie) či regresi (predikci číselné hodnoty). |
| Validační prompt |
Speciálně formulovaný vstup pro jazykový nebo generativní model, jehož cílem je ověřit správnost, úplnost či konzistenci výstupu modelu. Typicky se používá k tomu, aby model sám sebe znovu zkontroloval, vyhodnotil varianty odpovědí nebo potvrdil, zda výsledek splňuje stanovená kritéria. |
| Vektor |
Uspořádaná číselná reprezentace, která slouží k matematickému vyjádření datového prvku. Modely strojového učení převádějí vstupy jako slova, obrázky či jiná data do vektorů tak, aby s nimi mohly efektivně pracovat (počítat). |
| Vektorová databáze |
Specializovaný úložný systém pro ukládání a vyhledávání dat ve formě vektorových reprezentací (embeddingů). Každý objekt (např. text, obrázek, zvuk) je převeden na vektor čísel a spolu s metadaty uložen do databáze. Základní funkcí je vyhledávání „nejbližších sousedů“ – tedy vektorů, které jsou nejpodobnější zadanému vektoru podle určité metriky podobnosti (např. kosinové). Vektorové databáze se používají k vyhledávání podobných textů, obrázků, videí či jiných nestrukturovaných dat podle jejich významu, nikoli jen podle shody slov. |
| Vektorová reprezentace (Embedding) |
Transformace nějakého objektu (slova, věty, obrázku, videa) do podoby číselného vektoru tak, aby tento vektor zachycoval klíčové vlastnosti či význam původního objektu. Výsledný vektor (embedding) leží v mnohorozměrném prostoru, kde lze sémantickou podobnost dvou objektů posuzovat například vzdáleností jejich vektorů – podobné objekty mají vektory blízko u sebe. |
| Velký jazykový model (large language model, LLM) |
Pokročilý model zpracování přirozeného jazyka s velmi velkým počtem parametrů, trénovaný na rozsáhlých objemech textových dat. Díky své velikosti a komplexitě dokáže rozumět složitým jazykovým vstupům a generovat souvislé a kontextově relevantní texty. |
| Velký multimodální model (large multimodal model, LMM) |
Model umělé inteligence, který dokáže zpracovávat a generovat více než jeden typ dat (neboli modality), typicky kombinaci textu a dalších médií (např. obrazů, videí či zvuku). Na rozdíl od čistě jazykových modelů může LMM přijímat vstupy ve formě textu či jiných médií a podle toho vytvářet odpovídající výstupy. |
| Vysvětlitelná AI (Explainable AI, XAI) |
Přístup k AI kladoucí důraz na to, aby modely a jejich rozhodnutí byly pro lidi srozumitelné a mohli jsme pochopit důvody, proč AI k určitému výsledku došla. Cílem je vyvinout takové modely nebo metody, které umožní nahlédnout do vnitřního fungování „černých skříněk“ a vysvětlit jejich rozhodovací procesy. To zvyšuje důvěru uživatelů v AI a umožňuje odhalit případné chyby či zkreslení (bias). |
| Zavádějící subjekt (Deployer) Legální definice |
Fyzická nebo právnická osoba, veřejný orgán, agentura nebo jiný subjekt, které v rámci své pravomoci využívá systém AI, s výjimkou případů, kdy je systém AI využíván při osobní neprofesionální činnosti (čl. 3 odst. 4 nařízení o umělé inteligenci). |
| Zpracování přirozeného jazyka (Natural Language Processing, NLP) |
Interdisciplinární obor na pomezí lingvistiky a informatiky (umělé inteligence), který se zabývá analýzou a generováním textu nebo mluvené řeči tak, aby jí počítač rozuměl a dokázal je smysluplně zpracovat. Typickými úlohami jsou například strojový překlad, odpovídání na otázky nebo automatická korektura textu. |