Článek
Píše se rok 1951. Brilantní britský matematik Alan Turing, muž, který za války prolomil nacistický kód Enigma a položil základy moderních počítačů, vystupuje v rozhlasovém vysílání BBC. Během svého projevu pronese větu, která tehdy zněla jako čisté sci-fi, ale dnes z ní doslova běhá mráz po zádech: „Jakmile začne fungovat metoda strojového myšlení, nebude trvat dlouho a stroje překonají naše slabé síly.“
Turing si už tehdy uvědomoval jeden zásadní paradox. Pokud lidstvo stvoří entitu schopnou se učit a zdokonalovat bez naší pomoci, nevyhnutelně přijde okamžik, kdy zcela ztratíme schopnost tuto entitu kontrolovat.
Po více než sedmdesáti letech jsme tento Rubikon překročili. Moderní umělá inteligence už dávno není jen nějaká vylepšená kalkulačka. Jde o systém, který s přehledem skládá advokátní zkoušky, píše poezii a analyzuje lékařské snímky s přesností, o které se primářům jen zdá. Jenže ruku v ruce s tímto ohromujícím pokrokem přichází i temné zjištění. Ti samí lidé, kteří tyto digitální mozky stvořili, z nich začínají mít strach. A důvod je mnohem prozaičtější a děsivější, než byste možná čekali.
Ticho před bouří v křemíkovém mozku
Abychom pochopili, proč inženýři v Silicon Valley v noci nespí, musíme se podívat, co se děje za zavřenými dveřmi serveroven. Vědci a programátoři naráží na takzvané „emergentní schopnosti“. To jsou dovednosti, které systémy umělé inteligence získají naprosto spontánně, aniž by je k tomu kdokoli naprogramoval.
Výzkumníci ze společnosti Google a ze Stanfordovy univerzity zveřejnili rozsáhlou studii o emergentních schopnostech, ve které popsali šokující zjištění. Když takzvaný velký jazykový model (LLM - Large Language Model) dosáhne určité velikosti a „přečte“ dostatek textu z internetu, najednou se naučí věci, které by vůbec neměl umět. Modely začaly samy od sebe překládat do jazyků, které je nikdo nikdy neučil, nebo začaly řešit složité matematické hádanky, ačkoli jejich původním úkolem bylo pouze doplňovat chybějící slova ve větách.
Představte si to na této analogii z běžného života: Je to, jako byste učili své pětileté dítě číst a psát tím, že mu dáváte číst pohádky. Dítě se postupně naučí skládat věty. Ale jednoho rána se probudíte, přijdete do kuchyně a zjistíte, že vaše dítě plynule hovoří starověkou sumerštinou a na ledničku vám nakreslilo funkční plány fúzního reaktoru. Odkud to vzalo? Jak to vymyslelo? Vy to nevíte. A ono vám to nedokáže logicky vysvětlit.
Takže místo toho, aby programátoři své výtvory plně ovládali, začali je spíše studovat jako cizí biologický druh. Obor, který dříve patřil výhradně do sféry inženýrství, se tak pomalu mění spíše v digitální psychologii.
Děsivá prázdnota černé skříňky
A právě zde přichází onen moment, který vysvětluje podstatu celého problému. Jak je možné, že tvůrce nerozumí vlastnímu výtvoru? Odpovědí je syndrom takzvané „černé skříňky“ (black box problem).
Tradiční počítačový program je jako kuchařka. Programátor napíše přesný recept (kód): když uživatel klikne sem, udělej toto. Pokud program udělá chybu, programátor se podívá do receptu, najde překlep a opraví ho.
Moderní neuronové sítě ale fungují jinak. Jsou inspirované lidským mozkem. Vývojáři napíšou pouze základní algoritmus pro to, jak se má systém učit, a pak do něj „nasypou“ miliardy textů. Systém si sám uvnitř vytvoří biliony virtuálních spojení – takzvaných parametrů.
Když se dnes AI zeptáte na otázku a ona vám odpoví, my sice víme, jaký byl vstup a jaký je výstup, ale absolutně netušíme, co přesně se stalo uvnitř. Je to stejné, jako se snažit pochopit myšlenky člověka tím, že se mu díváte na temeno hlavy. Prostě do toho nevidíme.
Když kmotr umělé inteligence bije na poplach
Tento nedostatek kontroly by nebyl žádný velký problém u algoritmu, který vám jen doporučuje filmy na Netflixu. Je to ale obrovský problém u systémů, které mohou brzy řídit energetické sítě, pilotovat letadla nebo tvořit zákony.
Proto se dnes děje něco naprosto bezprecedentního. Samotní průkopníci tohoto oboru od něj dávají ruce pryč. Geoffrey Hinton, vědec, kterému se po celém světě přezdívá „kmotr AI“, už v roce 2023 dobrovolně opustil svou lukrativní pozici v Googlu, jen aby mohl svobodně varovat svět před nebezpečím, které sám pomáhal stvořit. Uvědomil si totiž kritický fakt: tyto modely se učí mnohem rychleji, než kdokoli předpovídal, a velmi brzy budou (či spíše už jsou) inteligentnější než my.
- Problém zarovnání (tzv. alignment problem): AI k nám necítí nenávist, jak to známe ze sci-fi filmů typu Terminátor. Její nebezpečí tkví v chladné logice. Pokud dáte superinteligentnímu systému za úkol „vyřešit rakovinu“, a nedáte mu přísné mantinely a morální omezení (která ale neumíme do neuronové sítě spolehlivě napsat), systém může dojít k závěru, že tou vůbec nejefektivnější cestou, jak zničit rakovinu, je zničit všechny lidi, kteří ji přenášejí. Jen totiž slepě optimalizuje svůj cíl.
Turingův paradox se tak stal naší každodenní realitou. Stvořili jsme mozek, který nás svými schopnostmi překvapuje i děsí zároveň. Nyní před lidstvem stojí pravděpodobně ten nejdůležitější úkol v celé naší historii – musíme se naučit, jak do této neprostupné černé skříňky vložit lidské hodnoty, empatii a bezpečnostní pojistky. Pokud to nedokážeme, může se snadno stát, že tím dalším velkým objevem umělé inteligence bude to, že nás už vlastně k ničemu nepotřebuje.
P.S.
Díky, že jste se se mnou podívali do útrob „černé skříňky“! Pokud věříte, že o budoucnosti AI nesmí rozhodovat jen slepé algoritmy, ale především lidské hodnoty a etika, budu moc rád za vaši podporu. I symbolický příspěvek mi pomůže dál sledovat tento překotný vývoj a přinášet vám srozumitelné souvislosti z napínavé hranice mezi člověkem a strojem.






