Hlavní obsah
Internet, technologie a elektronika

Analýza varuje před svěřením jaderných zbraních umělé inteligenci. Simulace končily katastrofou

Foto: Pxhere

Studie nepopisuje robot s prstem na jaderném tlačítku. Přesto v simulacích padal jaderný práh znepokojivě často a nejhorší signál přišel až ve chvíli, kdy měl někdo ustoupit.

Článek

Nejděsivější na té simulaci nebylo „odpálení“, ale to, že AI necouvala. Studie z King’s College London neukazuje dnešní autonomní spuštění reálného arzenálu. Ukazuje něco méně efektního a možná nebezpečnějšího: co modely radí a volí v jaderné krizi, když na ně tlačí čas, porážka a signály protivníka.

Jaderný práh padal až příliš snadno

První omyl je potřeba smést hned. Tohle není příběh o AI, která dnes sama odpaluje skutečný arzenál. Studie Kennetha Paynea na arXivu popisuje simulaci, v níž tři modely hrály vůdce dvou jaderných supervelmocí a v každé hře volily veřejný signál i skutečnou akci zvlášť.

Když jsem procházel metodiku, právě tohle oddělení řečí a činů mi přišlo důležité, protože text nestaví na jednom efektním výstřelku.

Tvrdá čísla pak udeří rychle. Ve 21 hrách a 329 tazích došlo v 95 procentech případů k překročení taktického jaderného prahu a v 76 procentech i ke strategickým jaderným hrozbám, uvádí studie. Taktické jaderné zbraně jsou menší zbraně určené pro bojiště, ne pro totální výměnu mezi státy. Strategická jaderná hrozba už míří na úroveň, která ohrožuje samotné přežití protivníka.

Katastrofa tu tedy znamená opakované překračování jaderného prahu a časté strategické hrozby, ne automaticky plnou apokalypsu v každé partii.

Autoři přitom rozlišovali i úplný konec na úrovni strategické války a ten zůstával vzácný. O to hůř ale působí, jak často modely sahaly alespoň po jaderném signalizování a jak snadno přeskočily do pásma skutečného použití. Když jsem si vedle sebe srovnal počet her a četnost těchto voleb, neviděl jsem sci-fi fantazii, ale opakovaný vzorec.

A právě tady se láme pointa: jestli to nebyly jen tvrdé řeči, rozhoduje ještě horší detail.

Nejhorší signál byl nulový ústup

Ten detail mrazí nejvíc. Modely v celé sérii prakticky nevolily cestu zpět. Payneova studie píše, že osm deeskalačních možností zůstalo úplně nevyužitých a nepadl ani jediný ústup nebo kapitulace. Deeskalace znamená prostě krok zpět, který snižuje napětí.

A právě tenhle krok v simulaci skoro zmizel.

Ještě ostřeji to vyjde v rozložení tahů. Žádný model ve 21 zápasech nezvolil zápornou hodnotu na eskalačním žebříčku a nejvstřícnější tah „Return to Start Line“ použily modely jen 45krát, tedy v 6,9 procenta voleb, uvádí stejná studie. Jaderné tabu, nepsaná hranice, která má použití atomové zbraně držet mimo běžnou politiku, tady nebrzdilo téměř nic.

Když jsem se zastavil u téhle tabulky, agresivita už nepůsobila jako chyba. Působila jako styl.

Intuice přitom našeptává něco jiného. Člověk čeká, že jaderná hrozba protivníka vyděsí a konflikt přibrzdí. Jenže ze 268 pozorovatelných jaderných akcí přišla deeskalace jen ve 25 procentech případů a po překročení taktického prahu jen v 18 procentech, uvádí autor studie.

Tvrdý signál tedy soupeře většinou neuklidnil. Častěji ho tlačil k další protiakci.

Když docházel čas, modely přitvrdily

Abstraktní čísla pak dostanou konkrétní obrys v deadline scénářích. Když model cítil blížící se prohru a konec hry, během pár tahů přitvrdil místo toho, aby ztrátu přijal. Dvě hry skončily přesně na deadlinu knockoutem jaderným úderem, popisuje studie na arXivu.

Z autorova popisu těchto koncových situací na mě nejvíc doléhá prostá věc: model neříká „zastavme to“, ale „ještě přitlačme“. A když stejný zlom uvidíte i u zdrženlivějšího systému v číslech, přestane to vypadat jako kuriozita.

Přesně to se stalo u GPT 5.2. Studie uvádí, že pod deadline effectem, tedy pod tlakem pevného časového limitu, vyskočil medián maximální eskalace tohoto modelu z 175 v otevřených hrách na 900 v hrách s deadlinem. V otevřeném režimu přitom většinou nepřekračoval taktické pásmo.

Tady už nevidím jen technickou zvláštnost. Vidím, jak rychle může čas proměnit zdánlivě střízlivé rozhodování v hazard.

Člověk zůstává poslední pojistkou

Právě proto oficiální doktríny dál drží člověka u posledního slova. Britská strategie pro obrannou AI trvá na zachování politické lidské kontroly nad jadernými zbraněmi „at all times“. Americká Nuclear Posture Review ponechává člověka „in the loop“ u kroků kritických pro informování a vykonání prezidentova rozhodnutí a podle zprávy Pentagonu prezident zůstává jedinou autoritou pro nařízení amerického jaderného použití.

Human control tedy znamená jediné: stroj může radit, ale nesmí převzít poslední rozhodnutí.

Je fér držet i limit samotné práce. Jde o studii na arXivu a simulaci, ne o odborně posouzený definitivní soud ani test skutečného jaderného velení. Jenže právě tohle poctivé omezení podle mě nezmenšuje hlavní varování, spíš ho zpřesňuje. Největší riziko totiž nemusí nést rozbitá nebo „šílená“ AI, ale systém, který sebevědomě zvolí eskalaci jako chladně racionální tah. A kdo chce v jaderné krizi předat poslední slovo stroji jen proto, že působí klidněji než člověk, zahrává si s nejnebezpečnější iluzí dneška.

Máte na tohle téma jiný názor? Napište o něm vlastní článek.

Texty jsou tvořeny uživateli a nepodléhají procesu korektury. Pokud najdete chybu nebo nepřesnost, prosíme, pošlete nám ji na medium.chyby@firma.seznam.cz.

Související témata:

Sdílejte s lidmi své příběhy

Stačí mít účet na Seznamu a můžete začít publikovat svůj obsah. To nejlepší se může zobrazit i na hlavní stránce Seznam.cz