Když kód předběhne porozumění

Článek

V roce 1985 popsal dánský informatik Peter Naur případ, který se dnes čte jako varování napsané o čtyři desetiletí dřív, než měl kdo poslouchat. Jeden tým napsal překladač programovacího jazyka. Druhý ho měl rozšířit a dostal k tomu všechno, co si lze přát: úplnou dokumentaci, okomentované zdrojové kódy, písemné poznámky k návrhu i osobní konzultace s původními autory. A přece navrhoval jednu úpravu za druhou tak, že nevyužívaly vnitřní stavbu překladače a místo toho na něj lepily záplaty rozbíjející jeho původní jednoduchost. První tým to viděl na první pohled a pokaždé nabídl řešení vedené existující strukturou. Druhý tým nakonec uspěl, ale jen díky té osobní pomoci. Když překladač později převzali další programátoři už bez ní, dopadlo to jinak: po deseti letech byla původní elegantní konstrukce pořád rozpoznatelná, jen pohřbená pod beztvarými nánosy a fakticky k ničemu.

Naur z toho vyvodil tezi, která dala jeho stati Programming as Theory Building trvalou hodnotu. Skutečným produktem programování není kód. Je jím teorie v hlavách programátorů: vědění o tom, jak se program mapuje na svět, proč je každá jeho část taková, jaká je, a co by byla rozumná a co zhoubná změna. Kód je jen ztrátová projekce téhle teorie. Když tým, který teorii drží, zmizí, je program podle Naura mrtvý; oživit ho ze samotného textu nejde, protože text teorii nepřenáší. Nepřenesla ji ani v onom překladači, kde jí byl nadbytek.

Tady začíná moje úvaha: generativní umělá inteligence dělá s programováním něco, co dřív nešlo: rozpojuje dvě věci, které spolu vždy rostly svázané – samotný kód a teorii v hlavě toho, kdo ho píše. Před érou jazykových modelů rostl program zhruba tempem, jakým rostla autorova teorie, protože psaní kódu bylo zároveň budováním té teorie; jedno bez druhého nešlo. Asistent založený na velkém jazykovém modelu tohle pouto přetíná. Vyrobí správně vypadající artefakt, aniž v lidské hlavě vznikla odpovídající teorie, a vyrobí ho řádově rychleji, než by si ji člověk stihl postavit sám.

Je to rozdíl v druhu, ne v míře. Fred Brooks v eseji No Silver Bullet z roku 1987 rozlišil podstatnou a nahodilou složitost softwaru. Historické skoky produktivity, ať už vyšší programovací jazyky, nebo lepší nástroje, útočily na tu nahodilou, na pracnost reprezentace; podstatná složitost, tedy návrh samotného pojmového konstruktu, zůstávala nedotčená. Generování kódu modelem zrychluje právě reprezentaci, tu snazší půlku problému, a pojmový konstrukt nechává být – navíc odpojený od člověka. Útočí na špatnou polovinu.

Předpověď, kterou data potvrdila

Dobrá hypotéza má říct, čím by se dala vyvrátit. Z Naurova rámce plyne konkrétní předpověď: jestliže modely vyrábějí kód bez teorie, musí klesat refaktoring. Ten je totiž ze všech programátorských činností na teorii nejzávislejší – je to přesně schopnost, kterou Naur popisuje: vidět podobnost mezi novým požadavkem a existující stavbou a konsolidovat kód do znovupoužitelných celků. Bez teorie systému ho dělat nelze. Kdyby refaktoring s rostoucím objemem strojově generovaného kódu neklesal, moje teze by se podstatně oslabila.

Analytická firma GitClear prošla 211 milionů změněných řádků kódu z let 2020 až 2024. Podíl přesunutých, tedy refaktorovaných řádků klesl z 24,1 % v roce 2020 na 9,5 % v roce 2024, zatímco podíl kopírovaných řádků vzrostl z 8,3 % na 12,3 %. Rok 2024 byl první, kdy kopírování předběhlo přesun. Výskyt duplicitních bloků o pěti a více řádcích se v témže roce zvýšil osminásobně. Objem kódu přitom rostl. Předpověď tedy vyšla v očekávaném směru. Jde o korelaci, ne o prokázanou příčinu: adopci modelů firma odvozuje z časování, ne z přímého měření u každého commitu. I tak je to nejtvrdší jednotlivý nález celé úvahy.

Druhá linie důkazů míří na samotného člověka. Kontrolovaný experiment METR z roku 2025 sledoval šestnáct zkušených vývojářů otevřeného softwaru na 246 reálných úkolech v repozitářích, které sami dlouhodobě znají. Před začátkem čekali, že jim modely práci zrychlí o 24 %. Po skončení experimentu odhadovali zrychlení o 20 %. Ve skutečnosti byli s asistencí modelu o 19 % pomalejší. Ten rozpor mezi pocitem a měřením je důležitější než samotné číslo. Patří k němu výhrada: šlo o experty na kódu, který důvěrně znají, tedy přesně o situaci, kde má model nejnižší mezní přínos; z toho neplyne, že nepomáhá nikdy.

Třetí linie ukazuje, co se děje s učením. Výzkumníci z Anthropiku v lednu 2026 nechali dvaapadesát vývojářů řešit úlohy v asynchronní knihovně, kterou neznali. Skupina s asistencí modelu skórovala v následném testu porozumění o 17 procentních bodů hůř, 50 % proti 67 %, a největší propad byl v ladění chyb. Záleželo přitom na způsobu užití: kdo se modelu ptal na principy a souvislosti, porozumění si uchoval; kdo úlohu plně delegoval, ztratil nejvíc. Stejné schéma se neukazuje jen u programování – průzkum mezi více než třemi sty znalostními pracovníky, který provedli Microsoft Research a Carnegie Mellon, zjistil, že čím větší je důvěra v model, tím méně vlastního kritického myšlení člověk vynaloží. A za zaznamenání stojí, kdo studii o ztrátě dovedností publikoval: firma, jejíž obchodní zájem míří opačným směrem.

Čtvrtá a pátá linie posouvají pohled na úroveň celých systémů a týmů. Bezpečnostní firma Veracode v roce 2025 zjistila, že ve 45 % testovaných případů zavedl model do kódu zranitelnost z žebříčku OWASP Top 10; u Javy to bylo přes 70 % a s novějšími modely se výsledek nelepšil. Telemetrie firmy Faros AI od dvaadvaceti tisíc vývojářů ukázala, že s rostoucí adopcí modelů vzrostl poměr incidentů na jednu pull request o 242,7 %, podíl změn sloučených bez jakéhokoli review o 31,3 % a počet chyb na vývojáře o 54 %. Zpráva Google DORA za rok 2024 přiřadila každému 25procentnímu nárůstu adopce odhadovaný pokles stability dodávek o 7,2 %; současně ale naměřila i zlepšení v kvalitě kódu, rychlosti review a dokumentaci, takže obraz není jednostranný. To všechno jsou data od dodavatelů a z telemetrie, směrová, nikoli recenzovaný důkaz. Konvergují však nápadně.

Proti tomu se nabízí obrana, že vždyť testy to pohlídají. Jenže pokrytí testy ověřuje, že kód dělá to, co dělá – neověřuje, proč to dělá. Verifikuje chování, ne teorii. Michael Feathers kdysi definoval legacy kód prostě jako kód bez testů; rozpojení, o němž tu mluvím, plodí jeho nástupce – kód bez teorie, který testy klidně projde. Zelená kontrolka pak dává falešný klid: svítí, a teorie systému v hlavě člověka přesto zaostává za kódem. Je to dluh, který se nikde neúčtuje – dokud ho někdo nemusí splatit.

Námitky, které je třeba brát vážně

Nejsilnější protiargument zní, že umělá inteligence je prostě další vrstva abstrakce. Překladači, procesoru ani knihovnám taky nerozumíme do hloubky, a přesto stavíme funkční software; model je jen další patro nad assemblerem, jazykem C a Pythonem. Námitka je vážná, ale na jednom místě selhává. Stabilní abstrakce jsou deterministické, specifikované a smluvní – na překladač se spoléhám právě proto, že jeho teorii znát nepotřebuji; jeho chování je zaručené. Kód generovaný modelem je nedeterministický, nespecifikovaný a sedí na patře, kde teorie rozhoduje; je to nosná byznysová logika, ne pevný podklad pod nohama. Žádná další vrstva abstrakce to tedy není – je to rozpojení.

Druhou námitku přináší sama data. Pokračování zprávy DORA z roku 2025, postavené na zhruba devadesátiprocentní adopci modelů, ukazuje, že umělá inteligence se chová spíš jako zesilovač než jako jednotný ničitel: urychluje zralé týmy a znásobuje dysfunkci nezralých. Tady musím ustoupit a tezi zúžit – škodí nejvíc tam, kde jsou slabé základy nebo kde člověk práci plně deleguje. Podmíněné tvrzení unese víc než absolutní. Dlužno ovšem dodat, že i tahle úleva je sporná: telemetrie Farosu citovaná výše nenašla žádný náznak, že by zralé organizace byly před zhoršením kvality chráněny – degradace přicházela bez ohledu na výchozí vyspělost. Mezi zesilovačem a rovnou daní pro všechny zatím data nerozhodla.

Třetí námitka je prostá: miliony lidí denně odesílají s pomocí modelů fungující software, tedy teze musí být falešná. Jenže odeslat ještě neznamená rozumět. Moje teze předpovídá skrytou hnilobu – a přesně to je pozorovaný podpis těch pěti linií výše: bobtnající duplikace, klesající stabilita dodávek, incidenty množící se rychleji než revize. „Funguje to dnes“ a „zevnitř to práchniví“ si nijak neodporují.

Čtvrtá námitka je ze všech nejvážnější: modely se zlepší a teorii nakonec udržet dokážou, ať už díky velkému kontextu, nebo díky agentním smyčkám. V záznamech práce dnešních agentů je vidět, jak si tvoří hypotézy o systému a ověřují je. Že se přitom modely lepší rychle, ostatně ukázal i sám METR: když svůj experiment v únoru 2026 zopakoval s nástroji z konce roku 2025, zpomalení u nově nabraných vývojářů činilo jen 4 % proti původním 19 %; u části těch původních ovšem zůstalo blízko 18 %. Tady je moje teze nejzranitelnější a je férové to přiznat. Zatím ale agenti staví teorii lokální a prchavou, vázanou na kontextové okno; nedrží trvalou teorii konkrétního systému, namapovanou na konkrétní realitu světa, přes mnoho sezení. A i u lidí, kteří je používají, ukázala studie Anthropiku, že si teorii staví míň. Den, kdy se prokáže, že uživatelé agentů si systém pamatují a umějí ho později sami a bez pomoci upravit stejně dobře jako ti, kdo ho psali ručně, bude dnem, kdy tahle úvaha bude potřebovat přepsat.

Zbývá nepříjemná část. V roce 1983 popsala inženýrská psycholožka Lisanne Bainbridgeová ironie automatizace. Automat odebere člověku rutinu, která budovala jeho dovednost, a nechá mu zrovna ty nejtěžší úkoly, na které ho mezitím odnaučil. Vývojář, který systém nenapsal a plně mu nerozumí, je přesně tím operátorem: člověkem, kterého úkol odnaučil a kterého přesto ve tři ráno při výpadku v produkci žádáme, aby převzal řízení stroje, jehož teorii nikdy nepostavil. Edsger Dijkstra to pojmenoval už v roce 1972: programátor naráží na striktně omezenou velikost vlastní lebky. Rozpojení tu mez nikam neposouvá – jen zrychluje příliv kódu, který se za ni má vejít. Únava z práce s modely proto není únavou z kontroly v jednom okamžiku. Je to únava z odpovědnosti bez porozumění, držená nepřetržitě a proti cíli, který roste rychleji, než ho stíháme obsáhnout.

Otázka tedy nezní, jestli umělá inteligence píše dobrý kód. Zní, kdo bude držet teorii ve chvíli, kdy bude program potřeba zachránit – a jestli vůbec poznáme, že je mrtvý, dřív než přestane běžet.

Poznámka:

Data a zdroje byly ověřeny k 3. červnu 2026. Údaje z firemních zpráv a telemetrie (GitClear, Veracode, Faros AI, DORA) jsou směrové, nikoli recenzovaný důkaz; jádrová teze o porozumění, které roste pomaleji než kód, nemá přímou studii a je autorovou hypotézou opřenou o triangulaci nezávislých zdrojů. Před použitím pro rozhodování doporučuji aktualizaci dat a nezávislé ověření klíčových zjištění.

Zdroje

Naur, P. (1985). Programming as Theory Building. Microprocessing and Microprogramming 15(5), 253–261. DOI 10.1016/0165-6074(85)90032-8. (Pojem „teorie” převzat od G. Rylea, The Concept of Mind, 1949; popsaný případ překladače = „Case 1”.)
Brooks, F. P. (1987). No Silver Bullet: Essence and Accidents of Software Engineering. Computer 20(4), 10–19. (Původně IFIP Congress, 1986.)
Dijkstra, E. W. (1972). The Humble Programmer (Turingovská přednáška, EWD 340). Communications of the ACM 15(10), 859–866.
Bainbridge, L. (1983). Ironies of Automation. Automatica 19(6), 775–779.
Becker, J.; Rush, N.; Barnes, B.; Rein, D. (METR, 2025). Measuring the Impact of Early-2025 AI on Experienced Open-Source Developer Productivity. arXiv:2507.09089. (RCT, 16 vývojářů, 246 úloh; výsledek −19 %.)
METR (2026). We Are Changing Our Developer Productivity Experiment Design. metr.org, 24. 2. 2026. (Nástroje z konce 2025: −18 % u podmnožiny původních vývojářů, −4 % u nově nabraných.)
Shen, J. H.; Tamkin, A. (Anthropic, 2026). How AI Impacts Skill Formation. arXiv:2601.20245. (RCT, 52 vývojářů; v testu porozumění 50 % proti 67 % u kontrolní skupiny.)
GitClear / Harding, W.; Kloster, M. (2024, 2025). AI Copilot Code Quality (211 mil. změněných řádků, 2020–2024). (Refaktoring 24,1 % → 9,5 %; osminásobný nárůst duplikace v roce 2024.)
Veracode (2025). GenAI Code Security Report. (Zranitelnost z OWASP Top 10 ve 45 % případů; Java přes 70 %.)
Faros AI (2026). AI Engineering Report 2026 – The Acceleration Whiplash (telemetrie 22 000 vývojářů, 4 000+ týmů). (Incidenty na PR +242,7 %; merge bez review +31,3 %; chyby na vývojáře +54 %.)
Google DORA (2024, 2025). Accelerate State of DevOps Report / State of AI-assisted Software Development. (2024: −7,2 % stability dodávek na +25 % adopce; 2025: AI jako zesilovač.)
Lee, H.-P. a kol. (Microsoft Research & Carnegie Mellon, 2025). The Impact of Generative AI on Critical Thinking. Proc. CHI 2025. DOI 10.1145/3706598.3713778.
Feathers, M. (2004). Working Effectively with Legacy Code. (Pojetí „legacy = kód bez testů”.)

Transparentnost tvorby:

Koncepce, struktura a redakční linie článku jsou dílem autora, který vypracoval obsahovou skicu, stanovil klíčové teze a řídil celý proces tvorby. Generativní AI (Claude, Anthropic) byla využita jako nástroj pro rešerši, vyhledávání primárních zdrojů a formulační rozpracování autorovy obsahové skici.

Autor výstupy průběžně redigoval, ověřil klíčová zjištění a schválil finální znění. Žádná část textu nebyla publikována bez lidské kontroly. Všechny faktické údaje byly ověřeny proti veřejně dostupným zdrojům uvedeným v textu.

Postup je v souladu s požadavky čl. 50 Nařízení EU 2024/1689 (AI Act) na transparentnost AI-generovaného obsahu. #poweredByAI

Vyhledat

Hlavní menu

záhlaví

Hlavní obsah

Když kód předběhne porozumění

Článek

Předpověď, kterou data potvrdila

Námitky, které je třeba brát vážně

Poznámka:

Zdroje

Postranní panel

Další články autora

Internet, technologie a elektronika Starý model nikdo nepoužívá. Přesto ho nejde vypnout

Internet, technologie a elektronika Certifikovaná lež: když firemní AI odpoví z neúplného obzoru

Internet, technologie a elektronika Kvantizovat, ne zkracovat: float32 embedding je z většiny prázdné místo

Sdílejte s lidmi své příběhy

Další články autora

Internet, technologie a elektronika Starý model nikdo nepoužívá. Přesto ho nejde vypnout

Internet, technologie a elektronika Certifikovaná lež: když firemní AI odpoví z neúplného obzoru

Internet, technologie a elektronika Kvantizovat, ne zkracovat: float32 embedding je z většiny prázdné místo

Internet, technologie a elektronika Skvělý Claude, slabší impérium. Proč může být IPO Anthropicu past

Internet, technologie a elektronika Už nejsi autor. Jak vás textový editor připraví o práva

Doporučované

Postranní panel