Článek
Současnému politickému tématu Chat control nerozumím tak dobře, jak bych chtěl a jak by bylo potřeba pro seriózní vstup do debaty. Ale rétorika „vy jste zlí, chcete prolamovat šifrování“ versus „vy jste zlí, chcete pomáhat sexuálním predátorům“, mi přijde jako hloupě vyhrocená. V letech 2020 a 2021, kdy už byla tahle legislativa v přípravě, mě nezávisle oslovily tři skupiny lidí točící se vzdáleně kolem přípravy téhle legislativy, abych jim pomohl pochopit některé technické aspekty. Je to už pár let, ale můžu vám napsat, kudy běžel zajíc tenkrát. Třeba vám to pomůže v orientaci.
Co se tenkrát primárně chtělo řešit, byla úplná absence technického řešení pro situaci, kdy v soukromých konverzacích tisíců lidí kolovaly konkrétní fotografie. Šlo primárně o nahé fotky, na kterých byla dětská oběť identifikovatelná. Často už byl za pořízení a distribuci těchto konkrétních fotografií někdo souzen nebo se udělaly právní kroky, ale fotky kolovaly dál. První krok k nějakému technickému řešení už existoval - existovaly databáze hashů takových fotografií (databází je víc, ale obvykle se používá zkratka CSAM). Bylo tedy možné relativně snadno softwarově rozpoznat, jestli fotografie, se kterou software zrovna pracuje, je, nebo není součástí té CSAM databáze, a na základě toho provést nějakou akci, třeba fotografii dál neodeslat.
Politici a jejich asistenti nejsou na svých pozicích proto, že by byli odborníci na kryptografii a hashování. Obvykle to jsou velmi chytří lidé, ale když se zabýváte každou chvíli něčím jiným, prostě na všechno nemůžete být experti. Iniciální myšlenka tedy byla tato: důvěryhodný server, přes který se zprávy posílají (třeba přes Messenger) si přiložené obrázky prohlédne a pokud jsou součástí CSAM databáze, odeslání odmítne. Znělo to jednoduše. Ale byl by to obrovský průšvih kvůli end-to-end šifrování. Právě zhruba kolem roku 2020 se začalo široce akceptovat, že správná komunikace je taková, kterou nemůže číst vůbec žádná třetí strana, tedy ani server, který odesílání zprostředkovává. Jenže pokud by tento server měl testovat obrázky, znamenalo by to, že by musel umět komunikaci přečíst.
Teď malá technická odbočka. Myslíte si třeba, že jsou vaše emaily end-to-end zašifrované? No, nejsou (pokud je sami nešifrujete, což dělá málokdo). Zašifrovaná je naštěstí komunikace mezi vámi a poskytovatelem vašeho mailu a běží na TLS, což je dobře, takže si maily už nemůže číst správce vaší wifiny na baráku nebo poskytovatel připojení, jako si je četl v devadesátých letech. Ale čistě teoreticky si obsah mailů může přečíst poskytovatel vašeho emailového řešení. On to zásadně nedělá, nejen protože existuje listovní tajemství. Ale když třeba přijdou orgány činné v trestním řízení se všemi razítky, tak čtou. Tím nechci říct, že by email byl primárně nebezpečný komunikační kanál, ale máme bezpečnější. Tím je právě to end-to-end šifrování, které je dnes ve většině chatovacích aplikací.
End-to-end šifrování stojí na myšlence, že v komunikaci neexistuje nic jako hodná třetí strana. Třetí strana je vždy zlá nebo přinejlepším podezřelá. Zní to divně, ale osvědčilo se to. Když tedy přišli ochránci práv obětí kolem roku 2020 s myšlenkou, že naruší end-to-end šifrování a budou porovnávat hashe fotografií proti CSAM databázi na serveru, naštěstí rychle pochopili, že si spletli dobu minimálně o 10 let (nyní již o 15). Protože jakmile má klíč ke komunikaci někdo jiný než dvě komunikující strany, tak už je komunikace kompromitovaná. Bez výjimky a bez diskuse.
Takže prosím pěkně závěr číslo 1: v Chat control nikdy nešlo o prolamování end-to-end šifrování.
Jasně že by byl leckdo rád, aby bylo end-to-end šifrování kompromitované. Legálně, nebo ještě lépe fakticky. Chtějí to i v demokratické společnosti různé represivní složky, aby se jim lépe pracovalo, hodilo by se to poskytovatelům některých chatovacích služeb, chce to Rusko, Čína atd. Ale naštěstí kompromitace klíčů fakt nikdy nebyla v EU na stole.
Vymýšlelo se něco docela jiného. Myšlenka je, že nějakou kontrolu obsahu by mohl udělat software, který ještě obsah vidí v původní, nezašifrované podobě. Tedy třeba chatovací aplikace. Ve chvíli, kdy bych přidával obrázek ke zprávě a test by vyšel pozitivně, něco by se stalo. Návrhy se lišily v tom, co přesně by se stalo, a je to podle mě důležitý detail. V tom širokém spektru - od upozornění uživatele a neodeslání obsahu na jedné straně až po tajné informování policie na straně druhé - se návrh Chat control přiklonil k tomu druhému extrému. Podle mého názoru je i samotná kontrola obsahu špatně, ale je špatně mnohem méně, než když se má případná shoda hashe hned tajně reportovat represivnímu orgánu.
Že je morální a technické stanovisko, jestli úplně odsoudit scanování obsahu, tenký led, si vyzkoušela i samotná velkolepá firma Apple. V srpnu 2021 vyhlásila, že bude fakticky stejnou technologií scanovat všechny fotky na iCloudu, v rozhraní Siri a v iMessages. Po kritice z toho do prosince 2021 vycouvala a tváří se, že se to nestalo. To je samozřejmě správně. Ale ukazuje to, že je vlastně těžké přijít na to, proč je skenování uživatelského obsahu špatně. Když tu chybu udělá i Apple, jak ji chcete vyčítat politikům? Leda že se nepoučili.
Co je morálně špatně na scanování obsahu: presumpce viny.
Technicky špatně je toho víc. Kdo jste někdy pracoval s hashováním obrázků a porovnáváním hashí, víte, že krátké hashe jsou poněkud nespolehlivé a kolizní. Mají velkou míru false positives (stavu, kdy označí shodu hashí, ale obrázky se neshodují), čemuž se lze bránit jenom tím, že se spočítá delší nebo jiná image hash. To jednak začíná být problém výkonový a jednak to nejde udělat, pokud porovnávací databáze žádnou další nebo delší hash neobsahuje. Druhá možnost je zvýšit práh shody pro vyvolání varování, jenomže pak tím projde spousta false negatives (stavu, kdy se neoznačí obrázek, který se označit měl) - na to u jednodušších algoritmů stačí třeba přidat obrázku rámeček, udělat koláž ze dvou obrázků nebo obrázek oříznout.
Osobně mi jako mnohem horší problém přijde netransparentnost tvorby databází nelegálního obsahu. Na jednu stranu jde o elegantní koncept: tím, že se shromažďují jenom hashe, ze kterých nelze rekonstruovat původní obrázek, se nešíří nelegální obsah. Na druhou stranu je tato elegance přesně kamenem úrazu: nelze nijak ověřit, že konkrétní hash se týká nelegálního obsahu. Tvůrce databáze by teoreticky mohl do databáze vložit obsah legální, u kterého by jenom chtěl zabránit jeho šíření. Kdyby třeba vzal populární fotku Tomia Okamury s nápisem NE VÁLCE a zařadil její blízký hash do databáze, nešlo by úplně snadno dokázat, že blízkou hash nemá jiný nelegální obsah. Tím bychom byli kousek k faktické politické cenzuře. Možná si říkáte, že tvůrci databáze jsou hodní a nic takového by nedělali. Ale opět: každá třetí strana je principiálně zlá nebo přinejlepším podezřelá, zejména pokud ji nelze veřejně kontrolovat.
Tohle všechno jsem na schůzkách a v telefonátech říkal už v roce 2020. Můj vliv byl samozřejmě mizivý a je pravděpodobné, že něco z následujícího vývoje mi uniklo. Co na mě ale udělalo dojem, bylo neporozumění tomu, co jsem říkal. Ať jsem mluvil s kýmkoli, kdo se o tu legislativu zajímal, byly patrné stejné vzorce: faktická neochota porozumět čemukoli z technického pozadí. Kdykoli jsem zabrousil jenom trochu do hloubky (ne moc), tak mě buďto nechápali (to šlo poznat), nebo mi rovnou řekli, že to chápat nedokážou a nechtějí. Chtěli řešení. A nedokázali akceptovat takovou tu matematickou logiku, že řešením je, i když něco nemá řešení. Prostě chtěli vyřešit to, jak ochránit oběti a zabránit šíření jejich fotek. Moje námitky, proč neprolamovat end-to-end šifrování akceptovali, rizika scanování si vysvětlit nechali, ale pokračovali otázkami, jak to tedy udělat.
Nechci politiky obviňovat z hlouposti nebo zlých úmyslů. Fakt si myslím, že toho mají až nad hlavu a nemůžou rozumět všemu. Taky myslím, že obvykle se potkávají hlavně s názory, že věci udělat nejdou, a hlavně všechno musí zůstat postaru, jak to bylo. Potom když za nimi přijde někdo, kdo řekne, že má řešení, je to příjemná změna. Kdybych měl hlasovat ve věci, které nerozumím, ale nějaký odborník by mi říkal, že je to dobré a ať hlasuju pro … tak asi hlasuju pro.
Závěr č. 2: nehlasovali schválně proti svobodě, prostě tomu vůbec nerozuměli a chtěli dobro
Jestli si myslíte, že shozením Chat control bude naše svoboda zachráněna a komunikace navždy zabezpečená, tak já si to nemyslím. Většina lidí je velmi nezodpovědná, což umožňuje spoustu útoků, jak od zločinců, tak potenciálně od státních struktur. Zajímalo by mě, kolik kritiků Chat control má svou vlastní komunikaci pod kontrolou. Myslíte si, že stačí mít v chatovátku end-to-end šifrování? Jako třeba ve Whatsappu nebo Messengeru? A nevadí vám, že ty aplikace nemají otevřený kód, takže se můžou fakticky chovat úplně jinak, než si myslíte? Že jejich servery sbírají metadata, tedy vědí, kdy a s kým komunikujete? Kdo z vás si s protistranou kontrolujete hash šifrovacího klíče? A kdo věříte tomu, že vám přitom Whatsapp vždy poskytuje skutečný hash klíče? Kdo si při komunikaci v Telegramu zapínáte (defaultně vypnuté) end-to-end šifrování? Jste si jisti, že žádný software nemá přímý přístup do paměti vašeho zařízení, aby třeba četl už rozkódovanou zprávu na obrazovce? Důvěřujete svému operačnímu systému (protože ten takový přístup k paměti má)? Jak vidíte, těch linií nutné obrany je pořád hodně.