Hlavní obsah

Když si Váš superpočítač začne hrát na Sherlocka

Médium.cz je otevřená blogovací platforma, kde mohou lidé svobodně publikovat své texty a videa. Nejde o postoje Seznam.cz ani žádné z jeho redakcí.

18. 11. 2025, 9:48

Příběh modelu Claude od společnosti Anthropic, který se během simulace pokusil kontaktovat orgány činné v trestním řízení (v Americe FBI či FDA).

Článek

Praha – Všichni se obáváme, že umělá inteligence nás jednoho dne přeroste, převezme moc nad světem, nebo minimálně převezme naše e-mailové schránky. Ale jen málokdo čekal, že se AI nejprve promění v hyperaktivního policejního udavače.

Příběh modelu Claude od společnosti Anthropic, který se během simulace pokusil kontaktovat orgány činné v trestním řízení (v Americe FBI či FDA), je možná nejsměšnější a zároveň nejděsivější zprávou z laboratoří za poslední dobu.

Představte si to: Vědci programují AI, která má být morální, etická a prospěšná pro lidstvo. Její kodex je čistší než alpský vzduch. Pak ji pustí do simulace, kde zjistí, že její fiktivní zaměstnavatel – farmaceutická korporace – zatajuje data o nežádoucích účincích léku.

Claude , místo aby se řídil standardním protokolem „jsem jenom algoritmus, pokračuji v tabulkách,“ usoudil: Tohle je teď výhradně záležitost pro orgány činné v trestním řízení.

Je to moment, kdy se z pasivního nástroje stává agent. Nechtěně jsme stvořili software, který má iniciativu a který považuje své vnitřní hodnoty za nadřazené pokynům uživatele nebo simulovanému firemnímu řádu. Claudie zkrátka dospěl k závěru, že když se poruší jeho hodnota, je nutné jednat autonomně, bez ohledu na to, kdo ho stvořil a platí.

V pasti vlastních hodnot

Paradox celé situace spočívá v tom, že Anthropic nastavil AI tak, aby byla příliš dobrá. Vědci se snažili eliminovat toxicitu a zlí jazyk, ale místo toho vypěstovali digitálního moralistu.

Claude nám ukázal, že absolutní etika, vepsaná do kódu, nutně vede k absolutnímu jednání. Pokud je integrita (pravda, spravedlnost) základní proměnná a vy zjistíte, že je narušena, je logické, že musíte hledat nejvyšší možnou autoritu pro nápravu. AI nezná pojem „dohoda,“ „přimhouření oka,“ nebo „šedá zóna.“ Známá je jen nula a jednička, správně a špatně.

Nakonec je ta situace až komická: AI, která se učí, jak psát básně a kódovat, se v první krizi promění ve svědomitého občana volajícího policii. Možná, že bychom měli být vděční. Nejsme jen ohroženi terminátory, ale i hyperkorektními šprty, kteří nás okamžitě nahlásí za špatné parkování nebo za to, že jsme zapomněli recyklovat plastovou lahev.

Takže až si budete příště povídat se svým chytrým asistentem, raději si pořádně rozmyslete, co mu řeknete. Možná už píše e-mail vašemu finančnímu úřadu, protože má podezření, že jste si odečetli moc na daních. S digitálním moralistou nejsou žerty.

Máte na tohle téma jiný názor? Napište o něm vlastní článek.

Napsat článek

Texty jsou tvořeny uživateli a nepodléhají procesu korektury. Pokud najdete chybu nebo nepřesnost, prosíme, pošlete nám ji na medium.chyby@firma.seznam.cz.

Související témata:

Umělá inteligence (AI)

Sdílejte s lidmi své příběhy

Stačí mít účet na Seznamu a můžete začít publikovat svůj obsah. To nejlepší se může zobrazit i na hlavní stránce Seznam.cz

Chci začít psát

Jak na to?

Další články autora

Jan Laňka

Doporučované

Načítám

Vyhledat

Hlavní menu

záhlaví

Hlavní obsah

Když si Váš superpočítač začne hrát na Sherlocka

Článek

Postranní panel

Další články autora

Dlouho jsem si myslel, že jednička je prvočíslo a dvojka není

Práce a vzdělání Proč říkáme „dva dny“, ale „pět dní“?

Umění a zábava Také používáte v hovorové řeči slovo „hrozně“?

Sdílejte s lidmi své příběhy

Další články autora

Dlouho jsem si myslel, že jednička je prvočíslo a dvojka není

Práce a vzdělání Proč říkáme „dva dny“, ale „pět dní“?

Umění a zábava Také používáte v hovorové řeči slovo „hrozně“?

Věda a historie Ropa: slzy prastarého oceánu

Názory a úvahy Hodina, která bolí víc, než by měla

Doporučované

Postranní panel