Článek
V roce 1985 popsal dánský informatik Peter Naur případ, který se dnes čte jako varování napsané o čtyři desetiletí dřív, než měl kdo poslouchat. Jeden tým napsal překladač programovacího jazyka. Druhý ho měl rozšířit a dostal k tomu všechno, co si lze přát: úplnou dokumentaci, okomentované zdrojové kódy, písemné poznámky k návrhu i osobní konzultace s původními autory. A přece navrhoval jednu úpravu za druhou tak, že nevyužívaly vnitřní stavbu překladače a místo toho na něj lepily záplaty rozbíjející jeho původní jednoduchost. První tým to viděl na první pohled a pokaždé nabídl řešení vedené existující strukturou. Druhý tým nakonec uspěl, ale jen díky té osobní pomoci. Když překladač později převzali další programátoři už bez ní, dopadlo to jinak: po deseti letech byla původní elegantní konstrukce pořád rozpoznatelná, jen pohřbená pod beztvarými nánosy a fakticky k ničemu.
Naur z toho vyvodil tezi, která dala jeho stati Programming as Theory Building trvalou hodnotu. Skutečným produktem programování není kód. Je jím teorie v hlavách programátorů: vědění o tom, jak se program mapuje na svět, proč je každá jeho část taková, jaká je, a co by byla rozumná a co zhoubná změna. Kód je jen ztrátová projekce téhle teorie. Když tým, který teorii drží, zmizí, je program podle Naura mrtvý; oživit ho ze samotného textu nejde, protože text teorii nepřenáší. Nepřenesla ji ani v onom překladači, kde jí byl nadbytek.
Tady začíná moje úvaha: generativní umělá inteligence dělá s programováním něco, co dřív nešlo: rozpojuje dvě věci, které spolu vždy rostly svázané – samotný kód a teorii v hlavě toho, kdo ho píše. Před érou jazykových modelů rostl program zhruba tempem, jakým rostla autorova teorie, protože psaní kódu bylo zároveň budováním té teorie; jedno bez druhého nešlo. Asistent založený na velkém jazykovém modelu tohle pouto přetíná. Vyrobí správně vypadající artefakt, aniž v lidské hlavě vznikla odpovídající teorie, a vyrobí ho řádově rychleji, než by si ji člověk stihl postavit sám.
Je to rozdíl v druhu, ne v míře. Fred Brooks v eseji No Silver Bullet z roku 1987 rozlišil podstatnou a nahodilou složitost softwaru. Historické skoky produktivity, ať už vyšší programovací jazyky, nebo lepší nástroje, útočily na tu nahodilou, na pracnost reprezentace; podstatná složitost, tedy návrh samotného pojmového konstruktu, zůstávala nedotčená. Generování kódu modelem zrychluje právě reprezentaci, tu snazší půlku problému, a pojmový konstrukt nechává být – navíc odpojený od člověka. Útočí na špatnou polovinu.
Předpověď, kterou data potvrdila
Dobrá hypotéza má říct, čím by se dala vyvrátit. Z Naurova rámce plyne konkrétní předpověď: jestliže modely vyrábějí kód bez teorie, musí klesat refaktoring. Ten je totiž ze všech programátorských činností na teorii nejzávislejší – je to přesně schopnost, kterou Naur popisuje: vidět podobnost mezi novým požadavkem a existující stavbou a konsolidovat kód do znovupoužitelných celků. Bez teorie systému ho dělat nelze. Kdyby refaktoring s rostoucím objemem strojově generovaného kódu neklesal, moje teze by se podstatně oslabila.
Analytická firma GitClear prošla 211 milionů změněných řádků kódu z let 2020 až 2024. Podíl přesunutých, tedy refaktorovaných řádků klesl z 24,1 % v roce 2020 na 9,5 % v roce 2024, zatímco podíl kopírovaných řádků vzrostl z 8,3 % na 12,3 %. Rok 2024 byl první, kdy kopírování předběhlo přesun. Výskyt duplicitních bloků o pěti a více řádcích se v témže roce zvýšil osminásobně. Objem kódu přitom rostl. Předpověď tedy vyšla v očekávaném směru. Jde o korelaci, ne o prokázanou příčinu: adopci modelů firma odvozuje z časování, ne z přímého měření u každého commitu. I tak je to nejtvrdší jednotlivý nález celé úvahy.
Druhá linie důkazů míří na samotného člověka. Kontrolovaný experiment METR z roku 2025 sledoval šestnáct zkušených vývojářů otevřeného softwaru na 246 reálných úkolech v repozitářích, které sami dlouhodobě znají. Před začátkem čekali, že jim modely práci zrychlí o 24 %. Po skončení experimentu odhadovali zrychlení o 20 %. Ve skutečnosti byli s asistencí modelu o 19 % pomalejší. Ten rozpor mezi pocitem a měřením je důležitější než samotné číslo. Patří k němu výhrada: šlo o experty na kódu, který důvěrně znají, tedy přesně o situaci, kde má model nejnižší mezní přínos; z toho neplyne, že nepomáhá nikdy.
Třetí linie ukazuje, co se děje s učením. Výzkumníci z Anthropiku v lednu 2026 nechali dvaapadesát vývojářů řešit úlohy v asynchronní knihovně, kterou neznali. Skupina s asistencí modelu skórovala v následném testu porozumění o 17 procentních bodů hůř, 50 % proti 67 %, a největší propad byl v ladění chyb. Záleželo přitom na způsobu užití: kdo se modelu ptal na principy a souvislosti, porozumění si uchoval; kdo úlohu plně delegoval, ztratil nejvíc. Stejné schéma se neukazuje jen u programování – průzkum mezi více než třemi sty znalostními pracovníky, který provedli Microsoft Research a Carnegie Mellon, zjistil, že čím větší je důvěra v model, tím méně vlastního kritického myšlení člověk vynaloží. A za zaznamenání stojí, kdo studii o ztrátě dovedností publikoval: firma, jejíž obchodní zájem míří opačným směrem.
Čtvrtá a pátá linie posouvají pohled na úroveň celých systémů a týmů. Bezpečnostní firma Veracode v roce 2025 zjistila, že ve 45 % testovaných případů zavedl model do kódu zranitelnost z žebříčku OWASP Top 10; u Javy to bylo přes 70 % a s novějšími modely se výsledek nelepšil. Telemetrie firmy Faros AI od dvaadvaceti tisíc vývojářů ukázala, že s rostoucí adopcí modelů vzrostl poměr incidentů na jednu pull request o 242,7 %, podíl změn sloučených bez jakéhokoli review o 31,3 % a počet chyb na vývojáře o 54 %. Zpráva Google DORA za rok 2024 přiřadila každému 25procentnímu nárůstu adopce odhadovaný pokles stability dodávek o 7,2 %; současně ale naměřila i zlepšení v kvalitě kódu, rychlosti review a dokumentaci, takže obraz není jednostranný. To všechno jsou data od dodavatelů a z telemetrie, směrová, nikoli recenzovaný důkaz. Konvergují však nápadně.
Proti tomu se nabízí obrana, že vždyť testy to pohlídají. Jenže pokrytí testy ověřuje, že kód dělá to, co dělá – neověřuje, proč to dělá. Verifikuje chování, ne teorii. Michael Feathers kdysi definoval legacy kód prostě jako kód bez testů; rozpojení, o němž tu mluvím, plodí jeho nástupce – kód bez teorie, který testy klidně projde. Zelená kontrolka pak dává falešný klid: svítí, a teorie systému v hlavě člověka přesto zaostává za kódem. Je to dluh, který se nikde neúčtuje – dokud ho někdo nemusí splatit.
Námitky, které je třeba brát vážně
Nejsilnější protiargument zní, že umělá inteligence je prostě další vrstva abstrakce. Překladači, procesoru ani knihovnám taky nerozumíme do hloubky, a přesto stavíme funkční software; model je jen další patro nad assemblerem, jazykem C a Pythonem. Námitka je vážná, ale na jednom místě selhává. Stabilní abstrakce jsou deterministické, specifikované a smluvní – na překladač se spoléhám právě proto, že jeho teorii znát nepotřebuji; jeho chování je zaručené. Kód generovaný modelem je nedeterministický, nespecifikovaný a sedí na patře, kde teorie rozhoduje; je to nosná byznysová logika, ne pevný podklad pod nohama. Žádná další vrstva abstrakce to tedy není – je to rozpojení.
Druhou námitku přináší sama data. Pokračování zprávy DORA z roku 2025, postavené na zhruba devadesátiprocentní adopci modelů, ukazuje, že umělá inteligence se chová spíš jako zesilovač než jako jednotný ničitel: urychluje zralé týmy a znásobuje dysfunkci nezralých. Tady musím ustoupit a tezi zúžit – škodí nejvíc tam, kde jsou slabé základy nebo kde člověk práci plně deleguje. Podmíněné tvrzení unese víc než absolutní. Dlužno ovšem dodat, že i tahle úleva je sporná: telemetrie Farosu citovaná výše nenašla žádný náznak, že by zralé organizace byly před zhoršením kvality chráněny – degradace přicházela bez ohledu na výchozí vyspělost. Mezi zesilovačem a rovnou daní pro všechny zatím data nerozhodla.
Třetí námitka je prostá: miliony lidí denně odesílají s pomocí modelů fungující software, tedy teze musí být falešná. Jenže odeslat ještě neznamená rozumět. Moje teze předpovídá skrytou hnilobu – a přesně to je pozorovaný podpis těch pěti linií výše: bobtnající duplikace, klesající stabilita dodávek, incidenty množící se rychleji než revize. „Funguje to dnes“ a „zevnitř to práchniví“ si nijak neodporují.
Čtvrtá námitka je ze všech nejvážnější: modely se zlepší a teorii nakonec udržet dokážou, ať už díky velkému kontextu, nebo díky agentním smyčkám. V záznamech práce dnešních agentů je vidět, jak si tvoří hypotézy o systému a ověřují je. Že se přitom modely lepší rychle, ostatně ukázal i sám METR: když svůj experiment v únoru 2026 zopakoval s nástroji z konce roku 2025, zpomalení u nově nabraných vývojářů činilo jen 4 % proti původním 19 %; u části těch původních ovšem zůstalo blízko 18 %. Tady je moje teze nejzranitelnější a je férové to přiznat. Zatím ale agenti staví teorii lokální a prchavou, vázanou na kontextové okno; nedrží trvalou teorii konkrétního systému, namapovanou na konkrétní realitu světa, přes mnoho sezení. A i u lidí, kteří je používají, ukázala studie Anthropiku, že si teorii staví míň. Den, kdy se prokáže, že uživatelé agentů si systém pamatují a umějí ho později sami a bez pomoci upravit stejně dobře jako ti, kdo ho psali ručně, bude dnem, kdy tahle úvaha bude potřebovat přepsat.
Zbývá nepříjemná část. V roce 1983 popsala inženýrská psycholožka Lisanne Bainbridgeová ironie automatizace. Automat odebere člověku rutinu, která budovala jeho dovednost, a nechá mu zrovna ty nejtěžší úkoly, na které ho mezitím odnaučil. Vývojář, který systém nenapsal a plně mu nerozumí, je přesně tím operátorem: člověkem, kterého úkol odnaučil a kterého přesto ve tři ráno při výpadku v produkci žádáme, aby převzal řízení stroje, jehož teorii nikdy nepostavil. Edsger Dijkstra to pojmenoval už v roce 1972: programátor naráží na striktně omezenou velikost vlastní lebky. Rozpojení tu mez nikam neposouvá – jen zrychluje příliv kódu, který se za ni má vejít. Únava z práce s modely proto není únavou z kontroly v jednom okamžiku. Je to únava z odpovědnosti bez porozumění, držená nepřetržitě a proti cíli, který roste rychleji, než ho stíháme obsáhnout.
Otázka tedy nezní, jestli umělá inteligence píše dobrý kód. Zní, kdo bude držet teorii ve chvíli, kdy bude program potřeba zachránit – a jestli vůbec poznáme, že je mrtvý, dřív než přestane běžet.
Poznámka:
Data a zdroje byly ověřeny k 3. červnu 2026. Údaje z firemních zpráv a telemetrie (GitClear, Veracode, Faros AI, DORA) jsou směrové, nikoli recenzovaný důkaz; jádrová teze o porozumění, které roste pomaleji než kód, nemá přímou studii a je autorovou hypotézou opřenou o triangulaci nezávislých zdrojů. Před použitím pro rozhodování doporučuji aktualizaci dat a nezávislé ověření klíčových zjištění.
Zdroje
- Naur, P. (1985). Programming as Theory Building. Microprocessing and Microprogramming 15(5), 253–261. DOI 10.1016/0165-6074(85)90032-8. (Pojem „teorie” převzat od G. Rylea, The Concept of Mind, 1949; popsaný případ překladače = „Case 1”.)
- Brooks, F. P. (1987). No Silver Bullet: Essence and Accidents of Software Engineering. Computer 20(4), 10–19. (Původně IFIP Congress, 1986.)
- Dijkstra, E. W. (1972). The Humble Programmer (Turingovská přednáška, EWD 340). Communications of the ACM 15(10), 859–866.
- Bainbridge, L. (1983). Ironies of Automation. Automatica 19(6), 775–779.
- Becker, J.; Rush, N.; Barnes, B.; Rein, D. (METR, 2025). Measuring the Impact of Early-2025 AI on Experienced Open-Source Developer Productivity. arXiv:2507.09089. (RCT, 16 vývojářů, 246 úloh; výsledek −19 %.)
- METR (2026). We Are Changing Our Developer Productivity Experiment Design. metr.org, 24. 2. 2026. (Nástroje z konce 2025: −18 % u podmnožiny původních vývojářů, −4 % u nově nabraných.)
- Shen, J. H.; Tamkin, A. (Anthropic, 2026). How AI Impacts Skill Formation. arXiv:2601.20245. (RCT, 52 vývojářů; v testu porozumění 50 % proti 67 % u kontrolní skupiny.)
- GitClear / Harding, W.; Kloster, M. (2024, 2025). AI Copilot Code Quality (211 mil. změněných řádků, 2020–2024). (Refaktoring 24,1 % → 9,5 %; osminásobný nárůst duplikace v roce 2024.)
- Veracode (2025). GenAI Code Security Report. (Zranitelnost z OWASP Top 10 ve 45 % případů; Java přes 70 %.)
- Faros AI (2026). AI Engineering Report 2026 – The Acceleration Whiplash (telemetrie 22 000 vývojářů, 4 000+ týmů). (Incidenty na PR +242,7 %; merge bez review +31,3 %; chyby na vývojáře +54 %.)
- Google DORA (2024, 2025). Accelerate State of DevOps Report / State of AI-assisted Software Development. (2024: −7,2 % stability dodávek na +25 % adopce; 2025: AI jako zesilovač.)
- Lee, H.-P. a kol. (Microsoft Research & Carnegie Mellon, 2025). The Impact of Generative AI on Critical Thinking. Proc. CHI 2025. DOI 10.1145/3706598.3713778.
- Feathers, M. (2004). Working Effectively with Legacy Code. (Pojetí „legacy = kód bez testů”.)
Transparentnost tvorby:
Koncepce, struktura a redakční linie článku jsou dílem autora, který vypracoval obsahovou skicu, stanovil klíčové teze a řídil celý proces tvorby. Generativní AI (Claude, Anthropic) byla využita jako nástroj pro rešerši, vyhledávání primárních zdrojů a formulační rozpracování autorovy obsahové skici.
Autor výstupy průběžně redigoval, ověřil klíčová zjištění a schválil finální znění. Žádná část textu nebyla publikována bez lidské kontroly. Všechny faktické údaje byly ověřeny proti veřejně dostupným zdrojům uvedeným v textu.
Postup je v souladu s požadavky čl. 50 Nařízení EU 2024/1689 (AI Act) na transparentnost AI-generovaného obsahu. #poweredByAI





