Článek
Albrecht Dürer stál v roce 1506 před benátským soudem. Žaloval italského rytce Marcantonia Raimondiho za kopírování jeho dřevorytů. Dürer prohrál. Soud rozhodl, že drobné změny, které Raimondi provedl, činí jeho práci legitimní.
Pravděpodobně první zaznamenaný soudní spor o duševní vlastnictví v umění skončil verdiktem: kopírování s drobnými úpravami není krádež. O pět set let později sledujeme podobnou debatu. Jen místo rytce stojí před pomyslným soudem jazykový model.
Jak funguje jazykový model
Když se řekne, že AI vytváří plagiáty, představíme si obří databázi plnou textů, ze které model vytahuje kousky a skládá je dohromady. Jenže takhle to nefunguje. Jazykový model je v podstatě soustava statistických vztahů. Biliony parametrů, které zachycují pravděpodobnosti, jaké slovo následuje po jiném v jakém kontextu.
Když napíšete „Země obíhá kolem…“, model neprojíždí databázi, aby našel větu, kterou někdo napsal. Spočítá, že po této sekvenci slov následuje „Slunce“ s pravděpodobností blížící se jedné.
Je tohle kopírování? Nebo je to něco jako když člověk, který přečetl tisíce knih, píše vlastními slovy to, co vstřebal?
Když si model vzpomene
Existuje ale také fenomén zvaný memorizace. Někdy model téměř doslova vygeneruje text, který již existuje. Stává se to u obsahu, který se v trénovacích datech objevoval opakovaně. Virální články. Často citované pasáže. Texty, které internet recykloval tisíckrát.
V roce 2023 žalují New York Times společnost OpenAI. V žalobě ukazují příklady, kdy ChatGPT údajně reprodukoval jejich články téměř doslova. OpenAI odpovídá: „Memorizace je vzácná chyba učícího procesu, ne funkce. A mimochodem, vyžadovalo to tisíce až desítky tisíc pokusů s manipulovanými prompty, aby se tohle podařilo.“ Model si zkrátka „pamatuje“ víc toho, co viděl častěji.
Zní to povědomě. Takhle funguje i lidská paměť.
Středověký malíř nepodepisoval
Vraťme se o sedm století zpátky. Středověký malíř svá díla nepodepisoval. Nebyl umělec. Byl řemeslník. Člen cechu, jako kovář nebo tkadlec. Díla vznikala kolektivně. Mistr navrhl, učedníci provedli pozadí, detaily, méně důležité figury. Kdo držel štětec na konkrétním místě obrazu? Nikoho to nezajímalo. Důležité bylo dílo, ne tvůrce. Kopírování bylo standardní praxe. Učedník se naučil malovat tak, že kopíroval mistra. Vznikaly tak techniky a styly. Tintoretto kopíroval Michelangela. Ingres kopíroval Leonarda. Rubens to považoval za nezbytnou součást uměleckého vzdělání. A nikdo tomu neříkal plagiát.
Kdy se kopírování stalo hříchem
První autorský zákon vznikl v roce 1710. Anglický Statute of Anne. Zajímavé je, koho původně chránil. Ne autory, ale především tiskaře. Církev a vláda chtěly kontrolovat, co se tiskne. Tiskaři chtěli monopol na určité texty. Ochrana „autorských práv“ byla nástroj regulace a obchodu dřív, než se stala morální kategorií.
Nejasná hranice
Položme si otázku jinak: kde přesně končí inspirace a začíná plagiát? Když malíř vidí Monetův obraz a pak maluje vlastní lekníny v podobném stylu, je to plagiát? Když muzikant slyší jazzový standard a napíše vlastní skladbu s podobnou harmonickou progresí? Když spisovatel přečte stovky detektivek a pak napíše vlastní, s podobnou strukturou, podobnými zápletkovými obraty? „Dobří umělci kopírují, skvělí kradou,“ údajně řekl Picasso. Ta věta rezonuje právě proto, že zachycuje něco pravdivého o povaze kreativity.
Každý tvůrce vstřebává to, co viděl, četl, slyšel. A pak to transformuje. Někdy hodně. Někdy málo. Hranice je neostrá, subjektivní, závislá na kontextu.
Následuj peníze
New York Times žalují OpenAI o miliardy dolarů. Požadovaly dokonce zničení celého trénovacího datasetu. Mezi tím jiné velké mediální domy jako AP, Axel Springer nebo News Corp, uzavřely s OpenAI licenční dohody. New York Times ne.
Nejde o to, že by obavy NYT nebyly legitimní. Jde o to, že spor má zřetelný ekonomický rozměr. Kdo bude profitovat z toho, že AI umí shrnout zprávy? Původní vydavatel, nebo provozovatel modelu? Když se církev a vlády v 17. století rozhodly regulovat tisk, šlo jim o kontrolu informací a peněz. Když dnes vydavatelé žalují AI firmy, jde jim o to samé.
Morální argumenty o autorství a originalitě jsou reálné. Ale jádro sporu je ekonomické. Vždycky bylo.
Co vlastně chráníme
Zákon o autorských právech chrání specifické vyjádření, ne ideje. Nikdo nemůže vlastnit myšlenku, že Země obíhá kolem Slunce. Ale může vlastnit konkrétní větu, kterou to popíše. Jazykový model nevytváří kopie vět. Generuje pravděpodobné sekvence slov na základě naučených vzorců. Většinou unikátní. Občas podobné tomu, co model viděl.
Je statistická rekonstrukce totéž co kopírování? Právně to zatím nikdo nerozhodl. Soudy teprve začínají tyto otázky řešit. Jedna věc je jasná: stávající právní rámec, vytvořený pro svět tiskáren a xeroxů, na tohle není připravený.
Možná na tom nezáleží
Dürer prohrál svůj spor v roce 1506. Raimondi pokračoval v kopírování jeho děl. A Dürerova sláva tím neutrpěla. Spíš naopak, kopie pomáhaly šířit jeho jméno po Evropě.
Středověcí malíři nepodepisovali svá díla. A přesto vznikla katedrála v Chartres, Kniha z Kellsu, mozaiky v Ravenně.
Možná je posedlost autorstvím a originalitou specifická pro určitou historickou epochu. Možná se za sto let budeme dívat na dnešní debaty o AI plagiátu podobně, jako se dnes díváme na Dürerovu prohranou žalobu.
Tiskařský lis. Fotografie. Xerox. Internet. AI. Každá nová technologie reprodukce nutí společnost znovu definovat, co znamená tvořit, kopírovat a krást.
A ta definice vždycky nakonec sleduje peníze víc než morálku.
Zdroje:
Tento text vznikl ve spolupráci s jazykovým modelem Claude. Autor dodal myšlenky, strukturu a finální úpravy.


