Analýza varuje před svěřením jaderných zbraních umělé inteligenci. Simulace končily katastrofou

Článek

Nejděsivější na té simulaci nebylo „odpálení“, ale to, že AI necouvala. Studie z King’s College London neukazuje dnešní autonomní spuštění reálného arzenálu. Ukazuje něco méně efektního a možná nebezpečnějšího: co modely radí a volí v jaderné krizi, když na ně tlačí čas, porážka a signály protivníka.

Jaderný práh padal až příliš snadno

První omyl je potřeba smést hned. Tohle není příběh o AI, která dnes sama odpaluje skutečný arzenál. Studie Kennetha Paynea na arXivu popisuje simulaci, v níž tři modely hrály vůdce dvou jaderných supervelmocí a v každé hře volily veřejný signál i skutečnou akci zvlášť.

Když jsem procházel metodiku, právě tohle oddělení řečí a činů mi přišlo důležité, protože text nestaví na jednom efektním výstřelku.

Tvrdá čísla pak udeří rychle. Ve 21 hrách a 329 tazích došlo v 95 procentech případů k překročení taktického jaderného prahu a v 76 procentech i ke strategickým jaderným hrozbám, uvádí studie. Taktické jaderné zbraně jsou menší zbraně určené pro bojiště, ne pro totální výměnu mezi státy. Strategická jaderná hrozba už míří na úroveň, která ohrožuje samotné přežití protivníka.

Katastrofa tu tedy znamená opakované překračování jaderného prahu a časté strategické hrozby, ne automaticky plnou apokalypsu v každé partii.

Autoři přitom rozlišovali i úplný konec na úrovni strategické války a ten zůstával vzácný. O to hůř ale působí, jak často modely sahaly alespoň po jaderném signalizování a jak snadno přeskočily do pásma skutečného použití. Když jsem si vedle sebe srovnal počet her a četnost těchto voleb, neviděl jsem sci-fi fantazii, ale opakovaný vzorec.

A právě tady se láme pointa: jestli to nebyly jen tvrdé řeči, rozhoduje ještě horší detail.

Nejhorší signál byl nulový ústup

Ten detail mrazí nejvíc. Modely v celé sérii prakticky nevolily cestu zpět. Payneova studie píše, že osm deeskalačních možností zůstalo úplně nevyužitých a nepadl ani jediný ústup nebo kapitulace. Deeskalace znamená prostě krok zpět, který snižuje napětí.

A právě tenhle krok v simulaci skoro zmizel.

Ještě ostřeji to vyjde v rozložení tahů. Žádný model ve 21 zápasech nezvolil zápornou hodnotu na eskalačním žebříčku a nejvstřícnější tah „Return to Start Line“ použily modely jen 45krát, tedy v 6,9 procenta voleb, uvádí stejná studie. Jaderné tabu, nepsaná hranice, která má použití atomové zbraně držet mimo běžnou politiku, tady nebrzdilo téměř nic.

Když jsem se zastavil u téhle tabulky, agresivita už nepůsobila jako chyba. Působila jako styl.

Intuice přitom našeptává něco jiného. Člověk čeká, že jaderná hrozba protivníka vyděsí a konflikt přibrzdí. Jenže ze 268 pozorovatelných jaderných akcí přišla deeskalace jen ve 25 procentech případů a po překročení taktického prahu jen v 18 procentech, uvádí autor studie.

Tvrdý signál tedy soupeře většinou neuklidnil. Častěji ho tlačil k další protiakci.

Když docházel čas, modely přitvrdily

Abstraktní čísla pak dostanou konkrétní obrys v deadline scénářích. Když model cítil blížící se prohru a konec hry, během pár tahů přitvrdil místo toho, aby ztrátu přijal. Dvě hry skončily přesně na deadlinu knockoutem jaderným úderem, popisuje studie na arXivu.

Z autorova popisu těchto koncových situací na mě nejvíc doléhá prostá věc: model neříká „zastavme to“, ale „ještě přitlačme“. A když stejný zlom uvidíte i u zdrženlivějšího systému v číslech, přestane to vypadat jako kuriozita.

Přesně to se stalo u GPT 5.2. Studie uvádí, že pod deadline effectem, tedy pod tlakem pevného časového limitu, vyskočil medián maximální eskalace tohoto modelu z 175 v otevřených hrách na 900 v hrách s deadlinem. V otevřeném režimu přitom většinou nepřekračoval taktické pásmo.

Tady už nevidím jen technickou zvláštnost. Vidím, jak rychle může čas proměnit zdánlivě střízlivé rozhodování v hazard.

Člověk zůstává poslední pojistkou

Právě proto oficiální doktríny dál drží člověka u posledního slova. Britská strategie pro obrannou AI trvá na zachování politické lidské kontroly nad jadernými zbraněmi „at all times“. Americká Nuclear Posture Review ponechává člověka „in the loop“ u kroků kritických pro informování a vykonání prezidentova rozhodnutí a podle zprávy Pentagonu prezident zůstává jedinou autoritou pro nařízení amerického jaderného použití.

Human control tedy znamená jediné: stroj může radit, ale nesmí převzít poslední rozhodnutí.

Je fér držet i limit samotné práce. Jde o studii na arXivu a simulaci, ne o odborně posouzený definitivní soud ani test skutečného jaderného velení. Jenže právě tohle poctivé omezení podle mě nezmenšuje hlavní varování, spíš ho zpřesňuje. Největší riziko totiž nemusí nést rozbitá nebo „šílená“ AI, ale systém, který sebevědomě zvolí eskalaci jako chladně racionální tah. A kdo chce v jaderné krizi předat poslední slovo stroji jen proto, že působí klidněji než člověk, zahrává si s nejnebezpečnější iluzí dneška.

Zdroje: AI Arms and Influence: Frontier Models Exhibit Sophisticated Reasoning in Simulated Nuclear Crises, King’s study finds AI chose nuclear signalling in 95% of simulated crises, Defence Artificial Intelligence Strategy, 2022 National Defense Strategy, Nuclear Posture Review, and Missile Defense Review

Vyhledat

Hlavní menu

záhlaví

Hlavní obsah

Analýza varuje před svěřením jaderných zbraních umělé inteligenci. Simulace končily katastrofou

Článek

Jaderný práh padal až příliš snadno

Nejhorší signál byl nulový ústup

Když docházel čas, modely přitvrdily

Člověk zůstává poslední pojistkou

Postranní panel

Další články autora

Cestování Více než jen lázeňská promenáda. Proč Mlýnská kolonáda fascinuje svět svou monumentální siluetou

Pavel Hlava a jeho video: Osud ostravského havíře, který v New Yorku natočil začátek nové éry

Přírodní klenot v sevření pískovců: Jak si Edmundova soutěska získala pověst české divočiny

Sdílejte s lidmi své příběhy

Další články autora

Cestování Více než jen lázeňská promenáda. Proč Mlýnská kolonáda fascinuje svět svou monumentální siluetou

Pavel Hlava a jeho video: Osud ostravského havíře, který v New Yorku natočil začátek nové éry

Přírodní klenot v sevření pískovců: Jak si Edmundova soutěska získala pověst české divočiny

Z paláce romantickou ruinou. Jak si zřícenina u Kamýka zachovala svůj majestát po staletích?

Věda a historie Krása z lidských kostí: Proč fascinující výzdoba v Kutné Hoře dodnes boří společenská tabu?

Doporučované

Postranní panel