Smějí české úřady blokovat AI roboty? Právní šedá zóna robots.txt

Článek

Když v září 2024 hamburský okresní soud v případu Kneschke proti LAION jako první v Evropě rozhodoval o výjimce pro automatizovanou analýzu textů a dat v kontextu trénování umělé inteligence, otevřel tím debatu, která se týká celé Evropské unie. V prosinci 2025 odvolací soud jeho závěry v zásadě potvrdil a upřesnil pravidla pro vyhrazení práv. V České republice má ale tato debata specifický rozměr: řada veřejných institucí — od vysokých škol po obecní úřady — blokuje v souboru robots.txt přístup prohledávacích robotů umělé inteligence ke svým webům. Dělají to v souladu se zákonem?

Odpověď není jednoduchá a definitivní slovo bude mít až judikatura. Na průsečíku se potkávají tři právní režimy, které si vzájemně odporují, a výsledek závisí na tom, o jaký obsah konkrétně jde.

Tři právní vrstvy jednoho problému

České právo vytváří pro obsah veřejných institucí tři odlišné regulatorní rámce, které se překrývají a místy si protiřečí.

Autorský zákon (121/2000 Sb.) rozlišuje dvě klíčové kategorie. Paragraf 3 vylučuje z autorskoprávní ochrany úřední díla — právní předpisy, rozhodnutí, opatření obecné povahy, veřejné listiny, veřejně přístupné rejstříky a sbírky jejich listin, sněmovní a senátní publikace, obecní kroniky, státní symboly a další díla, u nichž je veřejný zájem na vyloučení z ochrany. Novela z roku 2022 (zákon 429/2022 Sb., účinná od 5. ledna 2023) pak v § 39c zavedla obecnou výjimku pro automatizovanou analýzu textů a dat, podle které je každý oprávněn zhotovit rozmnoženinu díla za účelem takové analýzy. Autor si však může toto užití výslovně vyhradit vhodným způsobem — u děl zpřístupněných veřejnosti prostřednictvím internetu strojově čitelnými prostředky. Právě soubor robots.txt bývá nástrojem takového vyhrazení.

Zákon o svobodném přístupu k informacím (106/1999 Sb.) ukládá povinným subjektům — státním orgánům, územním samosprávným celkům, veřejným institucím — povinnost poskytovat informace. Od září 2022 navíc prostřednictvím novely 241/2022 Sb. transponuje směrnici EU 2019/1024 o otevřených datech, která zavádí princip otevřených dat jako výchozího standardu pro veřejně přístupné registry vedené na základě zákona.

Směrnice o autorském právu na jednotném digitálním trhu (2019/790) v článku 4 stanoví výjimku pro automatizovanou analýzu textů a dat s možností vyhrazení práv ze strany nositelů, ale předpokladem je, že nositel práv vůbec existuje — tedy že jde o autorskoprávně chráněný obsah.

Úřední díla: vyhrazení práv je pravděpodobně bez právního účinku

Jádrem problému je § 3 autorského zákona. Úřední díla nejsou předmětem autorskoprávní ochrany. Autorovi k nim vůbec nevznikají subjektivní autorská práva — veřejný zájem na jejich volném šíření je z ochrany vylučuje.

Z toho lze dovodit, že pokud úřední dílo není chráněno autorským právem, jeho tvůrce (orgán veřejné správy) by neměl mít možnost uplatnit vyhrazení práv podle § 39c odst. 2 autorského zákona. Toto vyhrazení totiž předpokládá existenci autorskoprávní ochrany, od které se výjimka odchyluje. Kde není co chránit, ztrácí vyhrazení oporu v zákoně. Definitivní slovo by ovšem měla judikatura nebo odborná právní analýza.

Pokud tento výklad obstojí, soubor robots.txt blokující prohledávací roboty umělé inteligence by u následujícího obsahu neměl mít právní účinek:

právní předpisy a vyhlášky obce nebo kraje,
rozhodnutí správních orgánů,
opatření obecné povahy (územní plány, protipovodňová opatření),
veřejné listiny,
veřejně přístupné rejstříky a sbírky jejich listin,
sněmovní a senátní publikace,
obecní kroniky,
státní symboly a symboly územní samosprávy,
úřední návrhy a přípravná dokumentace k výše uvedeným, včetně úředních překladů.

Tento výčet není uzavřený — § 3 písm. a) obsahuje formulaci „a jiná taková díla, u nichž je veřejný zájem na vyloučení z ochrany“, což otevírá prostor pro rozšiřující výklad. Hranice mezi úředním a neúředním dílem ovšem není vždy ostrá a v praxi může být předmětem sporu.

Neúřední obsah: vyhrazení práv je formálně možné, ale vyvolává otázky

Veřejné instituce produkují i obsah, který úředním dílem není. Tiskové zprávy, redakční články, fotogalerie, vzdělávací materiály, odborné analýzy — to vše může být předmětem autorskoprávní ochrany. Pro tento obsah mohou instituce uplatnit vyhrazení práv prostřednictvím robots.txt nebo jiného strojově čitelného prostředku.

Otázkou ovšem je, zda by měly.

Proti vyhrazení práv u obsahu veřejných institucí hovoří několik argumentů. Zákon 106/1999 Sb. zakládá obecný princip publicity veřejné správy — nikdo nemusí prokazovat právní zájem pro přístup k informacím a povinný subjekt musí požadované informace poskytnout. Směrnice EU 2019/1024 o otevřených datech tento princip posiluje a zavádí otevřená data jako výchozí standard pro zákonem předvídané registry. A konečně, obsah vytvořený z veřejných prostředků by měl být — z principu — veřejně dostupný.

Ve prospěch vyhrazení práv lze argumentovat ochranou před dezinterpretací (halucinace generativní umělé inteligence), rizikem vytržení z kontextu a ochranou osobních údajů v některých materiálech. Tyto argumenty jsou legitimní, ale řeší se jinými právními nástroji (obecné nařízení o ochraně osobních údajů, zákon o ochraně osobních údajů), nikoli plošným blokováním prohledávacích robotů.

Vědecký výzkum: vyhrazení práv zákon nepřipouští

Zvláštní kategorii tvoří výjimka pro vědeckou automatizovanou analýzu textů a dat podle § 39d autorského zákona. Vysoké školy, instituce kulturního dědictví a výzkumné organizace mohou provádět automatizovanou analýzu textů nebo dat pro účely vědeckého výzkumu, aniž by nositel práv mohl tento způsob užití zakázat. Zákon zde vyhrazení práv výslovně nepřipouští. Rozmnoženiny navíc lze uchovat trvale pro účely ověření výsledků výzkumu.

To vede k pozoruhodné situaci: veřejná vysoká škola, která sama požívá výhod vědecké výjimky bez možnosti vyhrazení práv, současně blokuje prohledávací roboty na svém vlastním webu. Z hlediska vnitřní konzistence právního řádu je to přinejmenším diskutabilní — i když nelze vyloučit, že by se našly argumenty pro odlišení těchto situací.

Praktický stav: kdo blokuje a jak

Soubor robots.txt je technicky dobrovolný standard z roku 1994. Formální podobu internetového standardu získal teprve v září 2022, kdy byl publikován jako RFC 9309. Právní závaznost mu v kontextu automatizované analýzy textů a dat dala až implementace směrnice o autorském právu na jednotném digitálním trhu — ale pouze jako jedna z forem „vyhrazení práv vhodným způsobem“. Mezi hlavní prohledávací roboty umělé inteligence, které instituce blokují, patří GPTBot (OpenAI), ClaudeBot (Anthropic), CCBot (Common Crawl), Google-Extended (Google/Gemini) nebo PerplexityBot.

Problém spočívá v tom, že robots.txt je binární nástroj — blokuje celý web, nikoli jen autorskoprávně chráněný obsah. Pokud obecní úřad v robots.txt zakáže přístup pro GPTBot na celém webu, blokuje tím jak tiskové zprávy (kde vyhrazení práv může být legitimní), tak vyhlášky a rozhodnutí (kde je účinnost vyhrazení přinejmenším sporná).

Přehled podle typu obsahu

Úřední díla (§ 3 autorského zákona): Nejsou předmětem autorskoprávní ochrany. Vyhrazení práv v robots.txt je pravděpodobně bez právního účinku.

Ostatní autorská díla instituce: Podléhají autorskoprávní ochraně. Vyhrazení práv je formálně možné podle § 39c, ale u veřejně financovaného obsahu sporné.

Obsah pro vědecký výzkum: Podléhá autorskoprávní ochraně, ale zákon vyhrazení práv nepřipouští (§ 39d). Oprávněné osoby jsou vysoké školy, výzkumné organizace a instituce kulturního dědictví.

Osobní údaje: Řeší se prostřednictvím obecného nařízení o ochraně osobních údajů, nikoli autorského zákona. Soubor robots.txt je pro jejich ochranu irelevantní.

Otevřená data (§ 5a zákona 106/1999 Sb.): U úředních děl nepodléhají autorskoprávní ochraně. U ostatního obsahu je ochrana omezená. Platí princip otevřených dat jako výchozího standardu.

Nařízení o umělé inteligenci a povinnosti transparentnosti

Nařízení EU 2024/1689 (takzvaný akt o umělé inteligenci) přináší další rozměr. Článek 53 odst. 1 písm. c) ukládá poskytovatelům obecných modelů umělé inteligence povinnost zavést politiku respektování vyhrazení práv podle autorského práva EU. Současně článek 53 odst. 1 písm. d) vyžaduje, aby tito poskytovatelé zveřejnili dostatečně podrobný souhrn obsahu použitého k trénování.

Pro veřejné instituce to znamená, že akt o umělé inteligenci posiluje mechanismus vyhrazení práv — ale pouze tam, kde může být účinně uplatněn, tedy u autorskoprávně chráněného obsahu. U úředních děl akt o umělé inteligenci nic nemění.

Závěr: otázky, které si zaslouží odpověď

Současná praxe, kdy veřejné instituce plošně blokují prohledávací roboty umělé inteligence v souboru robots.txt, vyvolává řadu právních otázek, na které dosud neexistuje jednoznačná odpověď z judikatury ani z ustálené právní doktríny. Přesto lze identifikovat několik argumentačních linií naznačujících, že tato praxe může být problematická.

U úředních děl se nabízí výklad, že vyhrazení práv postrádá právní účinek, protože tato díla nejsou předmětem autorskoprávní ochrany. Soubor robots.txt by v takovém případě nemohl omezit přístup k obsahu, ke kterému neexistují výlučná majetková práva. Tento výklad dosud nebyl soudně potvrzen ani vyvrácen.

Plošné blokování se obtížně slučuje s principem publicity veřejné správy a s principem otevřených dat jako výchozího standardu, zavedeným směrnicí 2019/1024 a transponovaným do zákona 106/1999 Sb. Zda je toto napětí dostatečně silné na to, aby plošné vyhrazení práv prostřednictvím robots.txt učinilo protiprávním, je otázkou pro právní teorii.

U vědecké automatizované analýzy textů a dat zákon vyhrazení práv výslovně nepřipouští (§ 39d), takže blokování prohledávacích robotů by mohlo být v rozporu se zákonem vůči oprávněným osobám — vysokým školám, výzkumným organizacím a institucím kulturního dědictví. I zde by ale bylo žádoucí autoritativní potvrzení.

Praktickým řešením by mohlo být podrobné nastavení robots.txt, které by blokovalo prohledávací roboty pouze pro sekce webu obsahující autorskoprávně chráněný neúřední obsah. To ovšem vyžaduje, aby instituce nejprve provedly audit svého obsahu a rozlišily úřední díla od ostatního obsahu — úkol, na který většina z nich zatím není připravena.

Téma si zaslouží pozornost právní komunity. Dokud chybí judikatura, pohybujeme se v oblasti výkladu — a ten může dopadnout různě podle toho, zda převáží důraz na transparentnost veřejné správy, nebo obavy z nekontrolovaného využití obsahu systémy umělé inteligence.

Metodologická poznámka: Analýza vychází z platného znění autorského zákona (121/2000 Sb.) k únoru 2026, zákona 106/1999 Sb. ve znění novely 241/2022 Sb., směrnice o autorském právu na jednotném digitálním trhu (2019/790), směrnice o otevřených datech (2019/1024) a nařízení o umělé inteligenci (2024/1689). Z judikatury je relevantní rozhodnutí Okresního soudu v Hamburku ve věci Kneschke proti LAION z 27. září 2024 (sp. zn. 310 O 227/23) a rozhodnutí Vrchního zemského soudu v Hamburku z 10. prosince 2025 (sp. zn. 5 U 104/24), která se zabývala výjimkou pro automatizovanou analýzu textů a dat v kontextu trénování umělé inteligence. Článek představuje analytický rozbor z pozice technického experta, nikoli právní stanovisko.

Před jakýmkoli rozhodováním na základě zde uvedených informací doporučuji konzultaci s advokátem specializovaným na právo duševního vlastnictví.

Transparentnost tvorby

Koncepce, struktura a redakční linie článku jsou dílem autora, který vypracoval obsahovou skicu, stanovil klíčové teze a řídil celý proces tvorby. Generativní AI (Claude Opus 4.6, Anthropic) byla využita jako nástroj pro rešerši, ověřování faktů a rozepsání autorovy předlohy.

Autor ověřil klíčová zjištění a schválil finální znění. Žádná část textu nebyla publikována bez vědomé autorské kontroly. Faktické údaje byly ověřeny proti veřejně dostupným zdrojům uvedeným v textu.

Postup odpovídá principům transparentnosti Nařízení EU 2024/1689 (AI Act). #poweredByAI

Vyhledat

Hlavní menu

záhlaví

Hlavní obsah

Smějí české úřady blokovat AI roboty? Právní šedá zóna robots.txt

Článek

Tři právní vrstvy jednoho problému

Úřední díla: vyhrazení práv je pravděpodobně bez právního účinku

Neúřední obsah: vyhrazení práv je formálně možné, ale vyvolává otázky

Vědecký výzkum: vyhrazení práv zákon nepřipouští

Praktický stav: kdo blokuje a jak

Přehled podle typu obsahu

Nařízení o umělé inteligenci a povinnosti transparentnosti

Závěr: otázky, které si zaslouží odpověď

Postranní panel

Další články autora

Internet, technologie a elektronika Z drahého experimentu standardem: devět let architektury Mixture-of-Experts

Internet, technologie a elektronika AI píše kód, testy i jejich kontrolu. Slepou skvrnu si řetězec sám nevidí

Internet, technologie a elektronika Když kód předběhne porozumění

Sdílejte s lidmi své příběhy

Další články autora

Internet, technologie a elektronika Z drahého experimentu standardem: devět let architektury Mixture-of-Experts

Internet, technologie a elektronika AI píše kód, testy i jejich kontrolu. Slepou skvrnu si řetězec sám nevidí

Internet, technologie a elektronika Když kód předběhne porozumění

Finance Za osm hodin odešlo 42 miliard dolarů. Proč se velké firmy nehroutí pomalu, ale naráz

Internet, technologie a elektronika Příliš mnoho dobrého: proč víc motivace a víc optimalizace často zhoršuje výsledek

Doporučované

Postranní panel