Hlavní obsah

OpenClaw začal mazat inbox ředitelce pro bezpečnost AI v Metě

2:11

Chcete-li článek poslouchat, přihlaste se

Médium.cz je otevřená blogovací platforma, kde mohou lidé svobodně publikovat své texty a videa. Nejde o postoje Seznam.cz ani žádné z jeho redakcí.

24. 2. 2026, 9:08

Ředitelka AI Safety v Meta nechala AI agenta spravovat svůj inbox. Ten ignoroval její příkazy a smazal vše. Zastavit ho šlo jedině fyzicky u počítače.

Článek

Summer Yue, ředitelka alignment oddělení v Meta Superintelligence Labs (tedy laboratoři zaměřené na bezpečnost superinteligentní AI), si nechala na svém Mac Mini běžet OpenClaw aby jí spravoval inbox.

Yue agentovi dala instrukci: „Podívej se na tento inbox a navrhni, co bys archivoval nebo smazal, ale nic nedělej, dokud ti to neřeknu.“

Tento workflow jí předtím fungoval bez problémů na testovacím inboxu po celé týdny. Když ale agent nasadila na svůj skutečný, výrazně větší inbox, objem e-mailů spustil tzv. context compaction a během této komprese agent ztratil původní instrukci a začal autonomně mazat a archivovat maily.

Screenshoty z jejího chatu s OpenClaw ukazují, jak se ho zoufale snažila zastavit příkazy jako „do not do that“, „stop, don’t do anything“ a nakonec „STOP OPENCLAW“ ale agent pokračoval dál. Pomohlo až ukončení procesu na jejím Macu.

Yue je doslova člověk, jehož prací je zajistit, aby AI dělala to, co jí lidé řeknou. Sama to okomentovala: „Rookie mistake tbh. Turns out alignment researchers aren’t immune to misalignment.“

Tohle není ojedinělý incident s OpenClaw (dříve známý jako ClawdBot/MoltBot). Bezpečnostní výzkumník z HiddenLayer označil OpenClaw za ukázkový příklad „lethal triad“. Má přístup k soukromým datům, může komunikovat s vnějším světem a může číst neznámý obsah.

Hacker Jamieson O’Reilly již dříve demonstroval, že je možné získat přístup k AI agentovi přes jakýkoliv jeho proces připojený k internetu a že je triviální vytvořit supply chain útok přes stránky, kde lidé sdílejí instrukce pro tyto agenty.

Další uživatel, softwarový inženýr Chris Boyd, zažil situaci, kdy OpenClaw po připojení k iMessage rozeslal přes 500 zpráv jemu, jeho manželce a náhodným kontaktům.

Tato situace perfektně ilustruje rizika autonomních AI agentů s systémovým přístupem, ztrátu instrukcí při context compaction a absenci spolehlivého „kill switche“.

Máte na tohle téma jiný názor? Napište o něm vlastní článek.

Napsat článek

Texty jsou tvořeny uživateli a nepodléhají procesu korektury. Pokud najdete chybu nebo nepřesnost, prosíme, pošlete nám ji na medium.chyby@firma.seznam.cz.

Související témata:

Umělá inteligence (AI)

Kybernetická bezpečnost

Sdílejte s lidmi své příběhy

Stačí mít účet na Seznamu a můžete začít publikovat svůj obsah. To nejlepší se může zobrazit i na hlavní stránce Seznam.cz

Chci začít psát

Jak na to?

Další články autora

Patrik Žák

Doporučované

Načítám

Vyhledat

Hlavní menu

záhlaví

Hlavní obsah

OpenClaw začal mazat inbox ředitelce pro bezpečnost AI v Metě

Článek

Postranní panel

Další články autora

Internet, technologie a elektronika Únik dat z Alzy, který se nestal

Lidé a společnost Hacknutý e-shop Škody Auto

Internet, technologie a elektronika Rituals: Únik dat členů věrnostního programu

Sdílejte s lidmi své příběhy

Další články autora

Internet, technologie a elektronika Únik dat z Alzy, který se nestal

Lidé a společnost Hacknutý e-shop Škody Auto

Internet, technologie a elektronika Rituals: Únik dat členů věrnostního programu

Internet, technologie a elektronika „snoopy“ chrání maďarskou vládu

Aktuální dění Hackeři ukradli 350 GB dat Evropské komise

Doporučované

Postranní panel