Článek
Umělá inteligence (AI) se rychle stává součástí našich životů, zejména pak generátory textu založené na velkých jazykových modelech (Large Language Model, LLM). Že AI nepoužíváte? I tak se s velkou pravděpodobností vašich životů dotýká a ani o tom nemusíte vědět. Chatbota na telefonní infolince asi pozná každý, složitější je ale identifikace uměle generovaného textu, zejména pak na internetu.
Určité vodítko k rozpoznání generovaného textu poskytují detektory, které mohou, ale nemusí, poznat, že text nepsal člověk. Jak fungují? Na to jsem se zeptal populárního jazykového modelu ChatGPT.
Tady je hezky formulovaná odpověď: Detektory textu generovaného umělou inteligencí fungují na základě analýzy vzorců v textu, které se liší od lidského psaní. AI texty často vykazují vysokou konzistenci ve struktuře, opakování určitých frází nebo klíčových slov a mohou postrádat nuance či stylistické odchylky typické pro člověka. Detektory využívají algoritmy strojového učení, trénované na rozsáhlých datech lidských a AI textů, aby identifikovaly tyto rozdíly. Přesnost těchto nástrojů však není stoprocentní a může se lišit v závislosti na kvalitě modelu, který text vytvořil.
Jak už sama AI naznačila, odpověď nemusí být stoprocentní, což je velice zásadní tvrzení. Stejně tak jako sama AI může odpovídat zjevné nesmysly a sama doporučuje kontrolovat důležité informace, ani na detektory se nelze spoléhat. Generátory textu často opakují určitá slova, na která mohou být čtenáři až alergičtí - například výrazy „klíčové“, „výzva“, „fascinující“, „což“, opakují stále „nebo“ a nenahradí je jinde „či“, v budoucím čase často stále používají „bude“, budu" a tak dále. Jenže takový text může narychlo naťukat unavený copywriter nebo někdo, kdo se chce jen rychle vypořádat s pracovním nebo domácím úkolem.
Vyzkoušel jsem trojici detektorů, které si umí poradit s češtinou a jsou volně dostupné (nebo alespoň částečně). Čekal jsem, že výsledek nebude stoprocentní, ale z protichůdnosti některých odpovědí jsem byl nepříjemně překvapen.
Jaké detektory jsem použil?
- Copyleaks AI Detector (https://copyleaks.com/ai-content-detector)
- ZeroGPT (https://www.zerogpt.com/)
- Writer AI Content Detector (https://writer.com/ai-content-detector/)
Každému nástroji jsem naservíroval tři shodné texty. První psaný člověkem, druhý vytvořený AI a upravený člověkem do čtivější podoby a třetí zcela vytvořený AI.
Text psaný člověkem
Dlouhý článek s více než 1800 znaky napsaný pěkně postaru bez AI rozeznaly jen dva nástroje.
Copyleaks AI Detector jej správně označil jako lidský text. ZeroGPT zde zcela selhal a článek označil s téměř 94% pravděpodobností, že je dílem AI. Nástroj Writer AI Content Detector správně uvedl, že se z 99 % jedná o práci člověka. Jak je vidět, přístup detektorů k textu se velmi liší a výsledky jsou zcela protichůdné.
Hodnocení spolehlivosti:
- Copyleaks AI Detector - 100 %
- ZeroGPT - 6 %
- Writer AI Content Detector - 99 %
Text generovaný AI a následně upravený člověkem
I v tomto případě servírovaly nástroje zcela protichůdná tvrzení. Jeden se ale pěkně trefil. Opět šlo o delší text o jedné normostraně.
Copyleaks AI Detector označil celý článek jako uměle generovaný. ZeroGPT se tentokrát trefil a uvedl, že jej s pravděpodobností 42 % vytvořil generátor, což by asi tak odpovídalo dodatečným lidským úpravám. Writer AI Content Detector naopak text označil jako lidský s 99% pravděpodobností.
Hodnocení spolehlivosti:
- Copyleaks AI Detector - 50 %
- ZeroGPT - 100 %
- Writer AI Content Detector - 50 %
Text čistě generovaný AI
Poznaly detektory umělou inteligenci podle textu, který byl opět o délce minimálně jedné strany?
Copyleaks AI Detector správně uvedl, že se jedná o generovaný článek. Nástroj ZeroGPT to viděl padesát na padesát. Writer AI Content Detector naopak opět řekl, že jde z 99 % o lidský výtvor.
Hodnocení spolehlivosti:
- Copyleaks AI Detector - 100 %
- ZeroGPT - 50 %
- Writer AI Content Detector - 1 %
Celkové hodnocení spolehlivosti AI detektorů
- Copyleaks AI Detector - 83,3 %
- ZeroGPT - 52 %
- Writer AI Content Detector - 50 %
Jak je vidět, spolehlivé výsledky neposkytuje žádný detektor. Nejlepší výsledky na základě mého malého vzorku vykazuje Copyleaks AI Detector, u ostatních dvou nástrojů je to spíše takové házení korunou. Zarážející je ale skutečnost, že nástroje u stejného textu poskytují zcela protichůdné odpovědi. Nejen z tohoto důvodu je zřejmé, že se na detektory nelze spoléhat, což může být problematické.
Vezmeme si třeba příklad personalisty, který třídí obdržené motivační dopisy uchazečů o zaměstnání na základě toho, zda jim s textem nepomáhala AI a ty, které detektor označí jako podezřelé, rovnou vyřazuje. Neprávem tak může uzavřít cestu k nové práci i poctivým uchazečům. A takových příkladů se najde více. Lidský cit pro pěkně napsaný text totiž zatím žádný detektor nenahradí.