Hancockův paradox: Proč píšeme víc ironie tam, kde ji nikdo nerozpozná

Článek

V roce 2004 provedl Jeffrey Hancock z Cornellu experiment, který dal tušit něco podivného o tom, jak komunikujeme online. Nechal participanty konverzovat ve dvojicích — jednou tváří v tvář, jednou přes textový chat — a počítal, kolikrát použijí ironii. Výsledek šel proti intuici. V textovém chatu, kde chybí tón hlasu, mimika, gesta — tedy vše, na čem rozpoznání ironie závisí — participanti ironii nepoužívali méně. Používali ji více.

Hancockův nález potvrdili Aguert a kolegové (2016) u adolescentů. A Raymond W. Gibbs (2000) v analýze šedesáti dvou konverzací mezi přáteli zjistil, že ironie tvoří přibližně 8 % všech konverzačních obratů — v běžném hovoru tváří v tvář.

Vzniká tím paradox, který stojí za prozkoumání. Textová komunikace je ze všech modalit prokazatelně nejhorší v přenosu ironického záměru. A přesto ji v textu produkujeme hojněji než kdekoli jinde. Buď jsme iracionální — nebo víceznačnost textu není chybou, kterou se snažíme obejít, ale vlastností, kvůli které ironii v textu volíme.

Co textu chybí

Že je text špatný přenašeč ironie, není dojmologie. Je to experimentálně měřitelný deficit.

Bromberek-Dyzman, Jankowiak a Chełminiak (2021) testovali polsko-anglické bilingvní participanty v rozpoznávání ironie ve třech modalitách: čtení, poslech a audiovizuální prezentace. Textová modalita vykazovala nejnižší přesnost ze všech tří. Ještě zajímavější byl vedlejší nález: v textu participanti reagovali na ironické a neironické výroky srovnatelnou rychlostí. Žádné zaváhání, žádný kognitivní signál, že něco nesedí. Ve mluvených modalitách naopak zpracování ironie trvalo déle — mozek rozpoznal nesoulad a investoval kognitivní zdroje do reinterpretace. V textu k tomuto procesu často vůbec nedocházelo. Čtenář ironii jednoduše minul.

Proč? Rozpoznání ironie závisí na detekci nesouladu mezi výrokem a kontextem. V mluvené řeči tento nesoulad signalizuje hlas (ironický tón, přehnaná intonace), mimika (pozvednuté obočí, úsměv) a gesta. Cheang a Pell (2011) kvantifikovali sílu samotného hlasového signálu v cross-lingvistickém experimentu s angličtinou a kantonštinou: rodilí mluvčí angličtiny rozpoznali sarkasmus z hlasu v 85 % případů. Když ale slyšeli sarkastický tón v kantonštině, které nerozuměli, přesnost klesla na úroveň blízkou náhodě. Hlas nese ironický signál spolehlivě, ale potřebuje jazykovou zkušenost jako kotvu. Text nemá ani jedno.

Rozsáhlá studie z roku 2024 v Journal of Psycholinguistic Research (574 participantů, šest jazyků) hierarchii potvrdila: mimika dominuje nad hlasem, hlas dominuje nad textem. V čistě textové modalitě zůstává jediným vodítkem kontext — a ten je v online komunikaci často nedostatečný, nejednoznačný, nebo zcela chybí.

Ale možná je deficit pointa

Tady se příběh láme. Proč bychom dobrovolně volili komunikační kanál, který naši ironii systematicky znehodnocuje? Odpověď, ke které konverguje několik nezávislých výzkumných linií, je provokativní: právě proto.

Steven Pinker, Martin A. Nowak a James J. Lee publikovali v roce 2008 v Proceedings of the National Academy of Sciences herně-teoretický model nepřímé řeči — kategorie, do které ironie spadá. Jejich klíčový vhled formalizuje intuici, kterou sdílí každý, kdo kdy řekl něco, co nemyslel, a doufal, že správný člověk to pochopí a nesprávný ne.

Představme si scénář, který autoři v článku analyzují: řidič zastavený policistou chce nabídnout úplatek, ale neví, zda je policista zkorumpovaný. Přímá řeč („Dám vám peníze, pokud mě pustíte”) je katastrofální, pokud je policista čestný. Mlčení je bezpečné, ale nepřináší žádný zisk. Nepřímá řeč („Nemohli bychom to vyřešit tady na místě?”) je optimální strategie: kooperativní policista pochopí implikaci, čestný policista nemůže reagovat, protože doslovný obsah je nevinný.

Ironie funguje identicky. Ironik říká X a míní ne-X, přičemž spoléhá na to, že „správné“ publikum dekóduje záměr, zatímco „nesprávné“ publikum slyší jen doslovný obsah. Textové médium tuto strategii zesiluje, protože absence prozodických vodítek činí popiratelnost ještě robustnější. Nikdo nemůže dokázat, že jste to mysleli ironicky — ale ti praví to poznají.

Eric Eisenberg (1984) tuto dynamiku pojmenoval „strategická víceznačnost“ a přisoudil jí čtyři funkce: sjednocování rozmanitých interpretací, zachování privilegovaných pozic, umožnění popiratelnosti a facilitace změn. Odvolal se přitom na Labova a Fanshela (1977), kteří formulovali základní tezi výstižně: lidé potřebují formu diskursu, která je popiratelná, aby mohli komunikovat — a kdyby taková neexistovala, vytvořili by si ji.

Švejk jako algoritmus popiratelnosti

Český čtenář nepotřebuje herní teorii, aby tomuto mechanismu rozuměl. Stačí mu Švejk.

Haškův protagonista je dokonalá implementace strategické víceznačnosti v textu. Jeho ironický modus operandi spočívá v idiotském, zdánlivě upřímném souhlasu s autoritou, který ji současně subverzuje — ale jehož subverzivní vrstva je nedokazatelná. Švejk nikdy nepřizná ironii. Každý jeho výrok je kompatibilní s doslovnou interpretací (je skutečně blbý) i s ironickou (je geniální subverzivec). Čtenář osciluje mezi oběma čteními a Hašek tuto oscilaci záměrně nikdy nerozřeší.

Toto není jen literární objev. Je to kulturní kód, který Češi interiorizovali natolik, že Michael Palin z Monty Pythonu o Češích prohlásil, že mají „nejlepší smysl pro humor na světě“. Výzkumníci Dewaele a kolegové (2021) kvantifikovali kulturní variabilitu ironie: 68 % Britů interpretovalo zdvořilostní frázi „with the greatest respect“ jako „myslím, že jste idiot“, zatímco 49 % Američanů ji chápalo doslovně. Britská a česká tradice sdílejí kořeny v suchém, popiratelném humoru — a obě narazily na stejný problém: jejich ironický kód je nepřenositelný bez sdíleného kulturního kontextu.

A právě o ten kontext text systematicky připravuje.

Když strategie selže: Poeův zákon

Popiratelnost, jak ji popsali Pinker i Eisenberg, je užitečná, dokud funguje asymetricky — správné publikum dekóduje, nesprávné ne. Ale co když nikdo nedekóduje? Nebo naopak — co když dekódují všichni, včetně těch, kteří neměli?

V srpnu 2005 napsal uživatel Nathan Poe na křesťanském diskusním fóru christianforums.com větu, která se stala jedním z mála internetových memů s epistemologickým statusem: bez zjevného signálu humoru je nemožné parodovat extrémní pozici tak, aby ji někdo nepovažoval za vážně míněnou. Poeův zákon byl původně omezený na kreacionismus, ale záhy se ukázalo, že platí univerzálně.

Aikin (2009) jej podrobil první akademické analýze a demonstroval, že představuje legitimní problém epistemologie online diskursu — ne vtip o vtipu, ale strukturální vlastnost textového média. Historicky ovšem Poe nebyl první, kdo na problém upozornil. Již v roce 1983 varoval Jerry Schwarz na Usenetu: vyhněte se sarkasmu a žertovným poznámkám, protože bez hlasové intonace jsou snadno nepochopeny.

Důsledky sahají dál než k neškodným nedorozuměním. Studie v Communication Theory (2024) dokumentuje, jak politici využívají polysémické zprávy s více plauzibilními interpretacemi pro různé segmenty publika — takzvané „dog whistles“ s jedním významem pro mainstream a jiným pro radikály. Ironie, která měla být nástrojem subverze zdola (jako u Švejka), se stala nástrojem manipulace shora. A fenomén „irony poisoning“ — stav, kdy vrstvená ironie eroduje schopnost rozlišovat upřímnost od parodie — je přímým důsledkem dynamiky, kterou Poeův zákon pojmenovává.

39,8 %: AI jako dokonalý doslovný čtenář

Pokud text činí ironii obtížně rozpoznatelnou pro lidi, jak si vedou stroje?

Odpověď nabízí studie SarcasmBench (Zhang et al., 2024), dosud nejkomplexnější srovnání jedenácti velkých jazykových modelů a osmi předtrénovaných modelů na šesti benchmarcích. A také dataset iSarcasm (Oprea & Magdy, 2020), unikátní tím, že labely pocházejí od samotných autorů tweetů — tedy od lidí, kteří vědí, zda to mysleli ironicky.

GPT-4 v zero-shot režimu na datasetu iSarcasm dosáhlo F1 skóre 39,8 %. S few-shot příklady se zlepšilo na 52,3 %, ale stále výrazně zaostávalo za lidskými hodnotiteli. Pro srovnání: BERT s fine-tuningem na rozsáhlém korpusu SARC (1,3 milionu komentářů z Redditu sebeoznačených tagem /s) dosáhl F1 91,7 % — ale s masivním tréninkovým kontextem a metadaty, nikoliv z čistého textu bez nápovědy.

Nejpozoruhodnější je však nález o chain-of-thought promptingu. Technika, která u většiny kognitivních úloh výkon LLM zlepšuje (rozložení problému na kroky), u detekce sarkasmu výkon zhoršuje. Data ze SarcasmBench ukazují, že model Qwen 2 zaznamenal pokles F1 o 25,1 %. Tento nález koresponduje s interpretací studie SarcasmCue (Yao et al., AAAI 2025): detekce ironie je holistický a neanalytický kognitivní proces, který se vzpírá analytickému rozkladu. Ironie se nedá „vysvětlit krok za krokem“, protože její podstata spočívá v simultánním uchopení kontextu, tónu a záměru — tedy přesně v tom, co textu chybí a co analytický rozklad neumí replikovat.

Mrkající smajlík: záplata, která funguje napůl

Kompenzační mechanismy existují. Fungují ale jen částečně.

Filik a kolegové (2016) v experimentu se 192 participanty zjistili, že v jednoznačném kontextu emotikony na rozpoznání ironie nemají signifikantní vliv — kontext sám stačí. V nejednoznačném kontextu ale mrkající emotikon (;-)) signifikantně zvýšil pravděpodobnost sarkastické interpretace. Thompson a Filik (2016) potvrdili, že emotikony s vyplazeným jazykem (:p) a mrknutím jsou hlavními textovými ukazateli sarkastického záměru.

Průlomový nález přinesli Weissman a Tanner (2018): ironický emoji vyvolává v mozku stejné elektrofyziologické odpovědi (komponenty P200 a P600) jako verbální ironie. Mozek zpracovává ironické emoji stejným neuronálním mechanismem jako ironická slova.

Jenže: Howman a Filik (2020) v eye-trackingové studii ukázali, že mrkající emotikon zvyšuje sarkastickou interpretaci pouze u mladších dospělých (18–30 let), nikoliv u starších (65+). Na Redditu vznikl systém tónových ukazatelů (/s pro sarkasmus), ale ten je používán zejména u sociomorálních témat, kde by nedorozumění mělo závažné důsledky — ne univerzálně. Emoji je záplata, která funguje pro některé lidi, v některých kontextech, po některou dobu. Univerzální řešení to není.

Kde je pravda komplikovanější

Bylo by pohodlné vyprávět příběh o médiu, které ironii neumí. Ale data jsou nuancovanější.

Za prvé, kontext pomáhá víc, než by izolované experimenty naznačovaly. Ve skutečných konverzacích mezi přáteli, kolegy nebo členy komunity je sdílený kontext bohatý — participanti znají humor druhé strany, vědí, co je „typické“ ironické chování partnera, a rozpoznávají narážky na společné zážitky. Experimenty typicky testují rozpoznání ironie mezi cizinci v umělých podmínkách, což baseline přesnost systematicky podhodnocuje.

Za druhé, Hancockova data ukazují nejen víc ironie v online komunikaci, ale také to, že participanti většinu ironie v chatu rozpoznali — jen ne spolehlivě. Problém není binární (text neumí ironii), ale graduální (text přenáší ironii méně spolehlivě než hlas a mimika). To je důležitý rozdíl.

Za třetí, samotný Poeův zákon má meze. Platí nejsilněji pro extrémní pozice a anonymní komunikaci. V komunitách se sdíleným kontextem — od firemních Slacků po rodinné WhatsApp skupiny — je ironický kód funkční, protože jeho dekódování závisí na vztahu, ne na médiu.

Závěr: paradox, který zůstává

Hancockův paradox se nerozpouští, ani když přidáme nuance. Textová komunikace je prokazatelně nejslabší kanál pro přenos ironického záměru — a přesto v ní ironii produkujeme hojněji než kdekoli jinde.

Vysvětlení je méně absurdní, než se zdá. Text neprodukujeme ironii navzdory jeho nejednoznačnosti, ale díky ní. Popiratelnost, strategická víceznačnost, možnost říct a současně neříct — to jsou vlastnosti, které mluvená řeč s jejími prozodickými signály nabízí mnohem méně. Švejk by v podcastu nefungoval. Potřebuje text, kde jeho idiotský souhlas zůstává nerozluštitelný.

Mrkající smajlík je zatím nejblíž, co se lidstvo dostalo k textovému tónu hlasu. Funguje — ale jen pro některé lidi, v některých kontextech, a ne pro důchodce. A možná je to tak správně. Možná ironie, která se dá signalizovat smajlíkem, přestává být ironií. Možná její síla spočívá právě v tom, že ji nikdo nemůže s jistotou identifikovat — včetně strojů za miliardy dolarů, které na ni hází mincí.

Transparentnost tvorby:

Koncepce, struktura a redakční linie článku jsou dílem autora, který vypracoval obsahovou skicu, stanovil klíčové teze a řídil celý proces tvorby. Generativní AI (Claude, Anthropic) byla využita jako nástroj pro rešerši, ověřování faktů a rozepsání autorovy předlohy.

Autor výstupy průběžně redigoval, ověřil klíčová zjištění a schválil finální znění. Žádná část textu nebyla publikována bez lidské kontroly. Všechny faktické údaje byly ověřeny proti veřejně dostupným zdrojům uvedeným v textu.

Postup je v souladu s požadavky Čl. 50 Nařízení EU 2024/1689 (AI Act) na transparentnost AI-generovaného obsahu. #poweredByAI

Vyhledat

Hlavní menu

záhlaví

Hlavní obsah

Hancockův paradox: Proč píšeme víc ironie tam, kde ji nikdo nerozpozná

Článek

Co textu chybí

Ale možná je deficit pointa

Švejk jako algoritmus popiratelnosti

Když strategie selže: Poeův zákon

39,8 %: AI jako dokonalý doslovný čtenář

Mrkající smajlík: záplata, která funguje napůl

Kde je pravda komplikovanější

Závěr: paradox, který zůstává

Postranní panel

Další články autora

Internet, technologie a elektronika Z drahého experimentu standardem: devět let architektury Mixture-of-Experts

Internet, technologie a elektronika AI píše kód, testy i jejich kontrolu. Slepou skvrnu si řetězec sám nevidí

Internet, technologie a elektronika Když kód předběhne porozumění

Sdílejte s lidmi své příběhy

Další články autora

Internet, technologie a elektronika Z drahého experimentu standardem: devět let architektury Mixture-of-Experts

Internet, technologie a elektronika AI píše kód, testy i jejich kontrolu. Slepou skvrnu si řetězec sám nevidí

Internet, technologie a elektronika Když kód předběhne porozumění

Finance Za osm hodin odešlo 42 miliard dolarů. Proč se velké firmy nehroutí pomalu, ale naráz

Internet, technologie a elektronika Příliš mnoho dobrého: proč víc motivace a víc optimalizace často zhoršuje výsledek

Doporučované

Postranní panel