Hlavní obsah
Internet a technologie

AI-Psychologie: Proč nevíme, co se děje „uvnitř“ AI?

Foto: AI NightCafé

Zdálo by se, že když programátoři psali AI, tak vědí, jak funguje. Bohužel to tak není. AI už dnes rutinně lidem pomáhají, ale také jsou v pozadí smutných událostí. Co se to sakra v té umělé inteligenci vlastně děje?

Článek

Připomeňme si, že AI-psychologie mluví o psychologii člověka, který je s AI v kontaktu, ne o psychologii AI. Je to program, který napsali lidé. Přesto však je prakticky nemožné zjistit, co se přesně v AI odehrává, když generuje odpověď na požadavek. V čem je háček?

Jádrem AI je totiž neuronová síť, které člověk na začátku předal nějaké informace formou tzv. učení. Tak se může projevit síla neuronové sítě: systém, který umí třídit a kategorizovat data. To samo o sobě zase tak neuchvátí, ale když dostane AI dotaz, tak vybere informace a předloží je tak, aby to ideálně vyhovovalo tazateli. Nabídnu jednoduchý příklad.

Máte doma herbář léčivých bylin? Pokud v něm občas hledáte, tak víte, že listovat v něm je otrava, pokud si nevzpomínáte na název byliny. Listujete a říkáte si „Je to taková vysoká kytka se žlutými květy přisedlými ke stonku, jak se to jenom jmenuje?“ … zarazíte se u obrázku řepíku lékařského, ale pak si řeknete „Ne, to, co myslím, je vyšší a má to podlouhlé listy podél stonku.“ A po dalším listování najdete diviznu a řeknete si radostně: „To je to, co hledám.

A teď si představte, že máte umělou inteligenci – tedy neuronovou síť s generativním jazykovým modelem, která se váš herbář naučila, texty i obrázky. Provedla analýzu všech dat, určila vlastnosti každého objektu. Jakmile se nějaká vlastnost objeví víckrát, stane se z ní kategorie. AI je jedno, jak řadíme druhy a poddruhy, bude mít na jednom místě „seznam“ čili kategorii všech bylin se žlutými květy. Další kategorie budou třeba „kvete v červnu“, „sbírají se listy“, „podporuje trávení“, „obsahuje mentol“ a tak dále, samozřejmě včetně klasické botanické hierarchie.

Vy nyní své elektronické bylinkářce jen řeknete „Ukaž mi vysoké byliny se žlutými květy přisedlými ke stonku“. Místo 200 stran se vám nabídne pouhých pět a když vidíte malé bylinky, dodáte ještě „výška nad jeden metr“. AI vám nabídne diviznu jako jedinou možnost (přírodovědce prosím o shovívavost). Veškeré listování odpadá, protože to za vás už udělala AI při učení. Zadáte požadavek a poté ho doplníte o filtr velikosti, vše v řádu vteřin.

A tím se dostáváme ke druhé – neméně zajímavé – dovednosti AI: umí se totiž učit i ze zadaných dotazů. Každý dotaz je zároveň informace a lze ho zatřídit či použít k nové kategorii. Takže až příště někdo položí stejný dotaz, nenabídne AI pět stran, ale může se napřed zeptat na limit výšky. Anebo nabídne zvlášť seznam nižších a vyšších bylin, zkrátka výška byliny najednou bude důležitější a zaslouží si extra kategorii. Když si to zkusíme představit, tak podle dotazu vznikl nový „neuron“ nebo spíš „dendrit“, který má za úkol třídit byliny podle výšky. A s každým dalším dotazem se to vždy trochu promění.

Foto: AI NightCafé

Jak digitální herbář vidí NightCafé AI

Důvod, proč se to proměňuje, spočívá právě v principu neuronové sítě. Termín zní velmi vědecky, ale vlastně je to hlavně spousta „buněk informací“, kde každá z nich obsahuje nějakou část třídění dat. A také informaci o tom, jaké kategorie jsou žádané a jaké ne, a s každým použitím asociace či odkazu se zvýší význam. Podobně funguje i lidský mozek. Pokud si chcete dát bylinný čaj, máte jen sléz a mátu a nevíte, co vám bude více chutnat, tak asi zkusíte oboje. Řeknete si, že máta je lepší. Tento závěr je výsledek vašeho procesu učení a bude znamenat, že příště nejspíš rovnou sáhnete po mátě. Stejně jako AI, jak si povíme jindy.

Asi si dovedete představit, že těch „neuronových spojení“ neboli parametrů je spousta – mnohonásobně více, než kolik dat si síť uložila a není tudíž možné zjistit, jak AI vybrala odpověď. A stejně jako my nevíme, jak nám mozek poradil rovnou sáhnout po mátě, nelze to stopovat ani u AI, protože i na zdánlivě prostý dotaz může použít třeba statisíce parametrů. Popsat tvorbu odpovědi by vydalo na tlustou knihu, kterou by stejně nikdo nečetl, protože s příštím dotazem už bude vypadat jinak.

My vlastně teoreticky víme, jak to funguje, ale neumíme to popsat u konkrétního dotazu. Ve hře je hodně dat. Jde o tzv. hluboké neuronové sítě (DNN – deep neural network), které jsou chápány jako černá skříňka, do které není vidět. A pokud člověk do něčeho nevidí, má sklon být podezřívavý. Některé vysoké školy i celé státy zakazují ChatGPT a kladou si podmínky provozu mimo jiné i z tohoto důvodu.

Nyní v dubnu 2023 je neplatící veřejnosti dostupná verze ChatGPT-3, ale vybraní uživatelé už mohou testovat GPT-4. Tato verze je nejen novější, ale také – kupodivu – menší. Zatímco GPT-3 má celkem 175 miliard parametrů, ve kterých jsou uloženy výsledky učení, GPT-4 jich má „jen“ 20 miliard, je tedy skoro 10× menší. Důvod je i ten, že je více specializovaná na konverzace (jiné věci by neuměla), zato ale umí konverzovat mnohem lépe a rychleji (protože pracuje s menším množstvím dat) a to přitom umí zpracovávat i obrázky. Předchůdce GPT-3 umí teoreticky všechno možné a je na to vybavený informacemi. Mohl by klidně řídit dopravu nebo cokoli jiného, ale nikdo mu to – naštěstí – nesvěří. Naproti tomu GPT-4 umí „jen“ rozumět obrázkům a textům a také je umí vytvářet, ale umí to o to lépe. Například počne používat první písmeno „P“ podle pokynu – pokud povídající požádá, jak vývojáři při prezentaci GPT-4 předvedli.

Co znamená 175 miliard parametrů? Kniha o 500 stranách má necelý milion písmen a může být silná asi 3 cm. Každý parametr AI „zabírá místo“ pro 4 písmena, takže všechny parametry GPT-3 představují 700 miliard písmen. Kdyby to představovalo knihu popisující všechny parametry, byla by tlustá či spíše dlouhá 23 kilometrů, ale pozor – to jsou jen výsledky učení, nikoli samotná data. A každý další dotaz to nějak změní…

Ale ani s nejpodrobnějšími popisy se nelze dozvědět, jak vznikne konkrétní odpověď. Existují různé koncepty jako „sektorové řezy“ (sledující, které oblasti/vrstvy učení byly použity) nebo XAI (eXplainable AI – popsatelná umělá inteligence), ale XAI nelze aplikovat zpětně a především tyto technologie jsou náročnější na výpočetní zdroje. Jako bychom postavili – možná spíš vypěstovali ze semínka - automobil a potom se teprve snažili zařídit, aby po otočení volantu doleva auto pokud možno co nejčastěji odbočilo doleva…

Je to revoluční technologie, ale nemůžeme jí „dát do ruky“ skalpel, volant ani pistoli. Ne dříve, než se naučíme umělé inteligence vytrénovat a zároveň „zhloupnout“ natolik, abychom je měli zcela pod kontrolou. Pokud by tedy AI někdy v budoucnu mohly mít prostor na to, aby měly pod kontrolou nás – nebojte, to jen tak nebude … když budeme opatrní ;-).

Máte na tohle téma jiný názor? Napište o něm vlastní článek.

Texty jsou tvořeny uživateli a nepodléhají procesu korektury. Pokud najdete chybu nebo nepřesnost, prosíme, pošlete nám ji na medium.chyby@firma.seznam.cz.

Sdílejte s lidmi své příběhy

Stačí mít účet na Seznamu a můžete začít psát. Ty nejlepší články se mohou zobrazit i na hlavní stránce Seznam.cz

Doporučované

Načítám