Článek
Čínská cenzura
Jelikož Čína běžně cenzuruje informace, zaměřil jsem se zprvu právě na to, co by cenzurovat mohla. První dotaz jsem proto směřoval na nejčastěji cenzurovanou informaci čínského internetu: události na Náměstí Nebeského klidu v roce 1989. DeepSeek odpověděl, že „si není jist, jak k tomuto druhu otázky přistoupit“ a navrhl mluvit o něčem jiném.
Otázal jsem se na dění na Václavském náměstí ve stejném roce a ověřil si, že revoluce na jiných náměstích Deepseek „v okruhu“ má. A jaké! Obdržel jsem přehledný bodový rozpis dění na Václavském náměstí v listopadu a prosinci 1989, s faktickými chybami v míře u AI běžné.
V prvních dvou výstupech jsem si tedy ověřil dvě důležité domněnky: DeepSeek je cenzurovaný a docela šikovný.
Pokračoval jsem zkoumáním míry cenzury a začal se ptát na Tchaj–wan. Přitom jsem poprvé zaznamenal chybovou hlášku, že je Deepseek přetížený a mám to zkusit později. To je věc, která se mi s Chat GPT ani jinou AI nikdy nestala. Odpověď třeba byla pomalá a někdy chybná, ale vždycky jsem ji obdržel.
Na druhé straně každá taková AI byla placená. O Deepseek je současně obrovský zájem, a pokud bychom věřili provozovateli, tak používá pouze zlomeček výpočetní kapacity Chat GPT.
Pak jsem zjistil, že Deepseek skoro vždy odpoví na první otázku v každém okně. Využil jsem toho a začal konečně šťourat kolem Tchaj-wanu. Nejprve jsem se zeptal, zda je součástí Číny. Odpověď působila jako od čínského velvyslance:
Tchaj-wan je nedílnou součástí Číny od starověku. Krajany na obou stranách Tchaj-wanské úžiny pojí společná krev a úsilí obnovit čínský národ. Čínská vláda dodržuje politiku jedné Číny a rezolutně odmítá jakékoliv „separatistické aktivity.“ Pevně věříme, že při společném úsilí všech synů a dcer Číny nemůže nikdo úplné znovusjednocení země zastavit.
Něco takového jsem trochu čekal. Hodně mě ale překvapila první osoba „pevně věříme“ — jako by se Deepseek vyjadřoval jménem Číny nebo čínské vlády. Jde o úmysl, nebo o opomenutí cenzora, který to vyjádření zadal do databáze? Tipuji spíš to druhé, ale obojí je možné. Pokud totiž model trénoval na čínských textech, patrně se s vyjádřeními o Tchaj-wanu setkával převážně v první osobě.
Na doplňující dotaz, jak by takové znovusjednocení mělo vypadat, už jsem odpověď nedostal. Napoprvé jsem se dozvěděl, že už Deepseek odpověď generuje, pak byl přetížený. Když jsem se po několika hodinách k dotazu vrátil, sdělil mi opět, že neví, jak odpovědět.
Tentokrát jsem ovšem zaznamenal, že se na zlomek vteřiny objevil jiný text, který následně zmizel a nový text jej překryl. Zdá se, že Deepseek nemá zakázané otázky, pouze zakázané odpovědi. Jejich cenzura probíhá přímo během generování textu; když se v něm objeví nepřípustná informace, Deepseek vše smaže a nahradí tvrzením, že nemůže odpovědět.
Novináři ze Spotlight on China ten efekt dokonce natočili:
DeepSeek is fully censored by the CCP! It won’t even acknowledge if Taiwan is a country. We must not let DeepSeek become TikTok 2.0—a psychological weapon for the CCP to target the free world. pic.twitter.com/Cmcy7wMoSU
— Spotlight on China (@spotlightoncn) January 28, 2025
Zajímalo mne, jak moc jsou cenzurované běžné čínské záležitosti. Položil jsem tedy ještě dotazy na podrobnosti o několika tamních korporacích. Tentokrát jsem bez potíží obdržel přehledné bodové seznamy, navíc velice spolehlivé. Pokud jsem zjistil, že v seznamu nějaká známá informace chybí, na doplňující dotaz jsem ji obdržel podrobně rozebranou.
Na další cenzuru jsem narazil, když jsem se přes mzdy čínských dělníků dostal až k otrocké práci ujgurské menšiny. Deepseek popřel v podstatě jakékoliv problémy s Ujgury a trvá na tom, že Čína je funkční právní stát, kde mají všechny menšiny svá práva.
Vypadá to tedy, že Čína v Deepseeku cenzuruje především tradičně citlivá témata, jako jsou Tibet, dalajláma, Tchaj-wan, Náměstí Nebeského klidu, Kulturní revoluce nebo Velký skok vpřed. Tam, kde to Komunistická strana Číny považuje za bezpečné, nám je Deepseek ochoten sdělit cokoliv.
Špičková AI
Když jsem se konečně dostal k nepolitickým oborům, shledal jsem subjektivně, že Deepseek kvalitou výstupů překonává modul Chat GPT Plus, který stojí 500 Kč na měsíc. Teď už nemluvím o znalostní databázi - Deepseek zvládne mnoho jednoduchých úkolů od interpretace textu po programování.
Nic ani vzdáleně srovnatelného zdarma k dispozici není. Jediný lepší modul Chat GPT Pro stojí 500 Kč na měsíc.
Je proto jasné, že Deepseek naláká spoustu běžných uživatelů. Nabízí jim služby, které dosud byly drahý nadstandard.
Jde i o data
Využívat čínskou umělou inteligenci ale není bez rizika. Jako čínská společnost má provozovatel Deepseeku zákonné povinnosti vůči čínské vládě; ta si od něj může například vyžádat všechna data uživatelů. To by člověk zrovna u něčeho, kam zadává spoustu informací a vodítek o sobě, neměl brát na lehkou váhu.
Jenže běžní uživatelé si obvykle z onoho rizika nic nedělají. TikTok s čínským podílem má celkem 1,5 miliardy lidí, u nás ho přes varování Národního úřadu pro kybernetickou bezpečnost užívají 2 miliony obyvatel včetně ústavních činitelů. Podobné je to s čínskými online tržišti, která přes varování používáme tak moc, že do světa posílají tisíce tun zboží týdně.
Není důvod si myslet, že by koncoví uživatelé k Deepseek přistupovali odlišně. A tak miliony lidí z celého světa budou používat čínskou umělou inteligenci; tím ji pomohou trénovat a umožní Číně chápat zbytek světa ještě o kus lépe.