AI screening v češtině: co všechno se může pokazit

Článek

Recruiterka z velké technologické firmy zadala do ATS požadavek: „Programátor, Python, dva roky praxe.“ Systém vrátil čtyřicet výsledků. Třicet pět mužů, pět žen. Ženy v databázi přitom byly. Jenže jejich životopisy obsahovaly slovo „programátorka.“ Femininní tvar. Pro AI model natrénovaný na maskulinních názvech pozic to bylo jiné slovo. Model si z toho vzal, že programátor je chlap.

Tenhle příběh koluje mezi recruitery jako anekdota. Lidi se tomu smějí. Jenže čím víc o tom přemýšlím, tím míň je to vtipné.

Čeština je pro AI past

Angličtina má „programmer.“ Jedno slovo, žádný rod, žádné pády. Čeština to samé slovo ohýbá do desítek tvarů — podle rodu, pádu, čísla. Morfologický slovník MorfFlex, který spravuje Univerzita Karlova, eviduje pro běžné podstatné jméno víc než třicet variant. Pro AI model trénovaný na anglických datech je tohle džungle. Recruiter hledá „programátor,“ ale kandidátka v CV má „programátorka.“ Stejný člověk, stejná profese, jiný tvar. Model neví, že patří k sobě.

A nejde jen o skloňování. Český životopis prozradí rod kandidáta v každé druhé větě. „Pracovala jsem jako…“ „Vedl jsem tým…“ „Byla jsem zodpovědná za…“ Minulý čas sloves v češtině nese rod mluvčího. Anglické „I worked“ nic takového neprozradí. České „pracovala jsem“ řekne AI okamžitě: žena.

Studie Brookings Institution z roku 2024 testovala velké jazykové modely na výběrových řízeních. Výsledek: modely upřednostnily mužská jména v 51,9 % případů, ženská v 11,1 %. A to v angličtině, kde je gender v textu relativně skrytý. V češtině, kde je rod zakódovaný přímo v gramatice, může být ten rozdíl ještě větší. Nikdo to zatím systematicky neměřil. To samo o sobě je problém.

Jméno jako první filtr

Představ si dva životopisy. Stejné vzdělání, stejná praxe, stejné dovednosti. Na jednom stojí Nguyen Thi Thanh. Na druhém Jana Nováková.

Výzkum Derous a Ryan z roku 2018 prokázal, že jména asociovaná s etnickými menšinami dostávají měřitelně méně callbacků od zaměstnavatelů. A AI systémy trénované na historických hiring datech ten vzorec replikují. Nikdo je k diskriminaci nenaprogramoval. Ony se prostě učí z rozhodnutí, která lidé dělali před nimi.

V českém kontextu má tohle konkrétní rozměr. Romská populace čelí dokumentované diskriminaci na trhu práce. Vietnamská jména patří druhé největší menšině v zemi. Ukrajinská jména přibyla masivně od roku 2022. Když AI model dostane trénovací data z českého recruitmentu posledních deseti let, naučí se i předsudky, které v těch datech jsou.

Žádný český ATS vendor tohle veřejně netestuje. Datacruit, Teamio, Recruitis, žádný z nich nepublikuje auditní data o selekčních poměrech podle etnicity nebo pohlaví. Recruitis se aspoň vyjádřil, že jejich AI „analyzuje vstupní informace, aby zabránila diskriminaci.“ Jak přesně? To se nedozvíte.

Rok absolutoria jako proxy pro věk

Věk v životopise formálně být nemusí. V praxi tam ale je. Stačí rok ukončení vysoké školy. Absolvent z roku 1998 má skoro jistě přes čtyřicet pět. AI nepotřebuje datum narození, aby odhadla věk kandidáta na plus minus dva roky.

A pak jsou tu technologie. Někdo, kdo v CV uvádí zkušenosti s Delphi, Visual Basic 6 nebo administraci Novell NetWare, neprozrazuje jen svůj tech stack. Prozrazuje generaci. AI model, který se naučil, že firmy historicky preferovaly kandidáty se zkušenostmi v novějších technologiích, může starší kandidáty odsunout na konec seznamu. Programovat umí. Akorát jejich CV vypadá jinak.

Připomíná to případ Amazonu z roku 2018. Amazon vyvinul interní AI nástroj na screening životopisů, trénovaný na deseti letech firemních hiring dat. Model se naučil penalizovat slovo „women's“, třeba ve „women's chess club captain.“ Protože historicky přijímaní kandidáti byli převážně muži, model si odvodil, že cokoli asociovaného se ženami je negativní signál. Amazon nástroj zrušil.

AI nediskriminuje ze zlé vůle. Diskriminuje, protože jí dáte data, ve kterých diskriminace už je.

Co na to zákon

Od srpna 2026 spadá AI screening životopisů pod EU AI Act jako vysoce rizikový systém. Příloha III, bod 4(a) to říká explicitně: „AI systémy pro recruitment nebo výběr fyzických osob, zejména k analýze a filtrování žádostí o zaměstnání a hodnocení kandidátů.“ Povinnosti? Systém řízení rizik, detekce biasu v trénovacích datech, automatické logování, lidský dohled s reálnou pravomocí přehodnotit to, co AI řekne.

A pak je tu český antidiskriminační zákon. Paragraf 133a občanského soudního řádu umožňuje obrácení důkazního břemene: pokud kandidát prokáže prima facie diskriminační vzorec ve výstupech AI, dokazuje zaměstnavatel. Ne kandidát. Zaměstnavatel.

To je prakticky bomba. Stačí, aby odmítnutý kandidát požádal o informace podle GDPR (článek 22, právo na vysvětlení automatizovaného rozhodnutí), dostal data o selekčních poměrech, a ukázal, že AI jednu skupinu vytrvale vyřazuje. Důkazní břemeno se překlápí. A „my jsme nevěděli, co ten algoritmus dělá“ není obhajoba. Spíš naopak.

Tak co s tím

Firma, která dnes nasazuje AI na screening životopisů a neaudituje výstupy podle pohlaví, věku a etnicity, si kupuje problém. Možná ne dnes. Ale od srpna 2026 určitě. Anonymizace jmen před vstupem do modelu, pravidelný audit selekčních poměrů, lidský dohled, který není jen proklikání toho, co algoritmus doporučil — to všechno funguje. U firem, co to berou vážně, se to dělá. Není jich moc.

A jestli kupujete ATS s AI, zkuste se vendora zeptat na auditní data. Jak testují bias? Na čem trénují? Publikují selekční poměry? Pokud odpověď zní „to je naše proprietární technologie,“ je to důvod odejít od stolu. Ne pokračovat v jednání.

Ten příběh má ale ještě pokračování. Když recruiterka zjistila, že AI vrací hlavně muže, přepla na manuální hledání. Za hodinu našla osm kandidátek, které systém ignoroval. Tři pozvala na pohovor.

Zajímalo by mě, kolik recruiterů ten druhý krok nikdy neudělá. Ne ze zlé vůle. Prostě proto, že systému věří.

Sleduj profil Lidský zdroj, ať ti neuteče další článek z HR praxe.

Vyhledat

Hlavní menu

záhlaví

Hlavní obsah

AI screening v češtině: co všechno se může pokazit

Článek

Čeština je pro AI past

Jméno jako první filtr

Rok absolutoria jako proxy pro věk

Co na to zákon

Tak co s tím

Postranní panel

Další články autora

Práce a vzdělání Švarcsystém v IT: matematika, která drží český trh pohromadě

Právo a státní správa Vrátila se z rodičovské. Její místo bylo obsazené

Sdílejte s lidmi své příběhy

Další články autora

Práce a vzdělání Švarcsystém v IT: matematika, která drží český trh pohromadě

Právo a státní správa Vrátila se z rodičovské. Její místo bylo obsazené

Doporučované

Postranní panel

Hlavní obsah

AI screening v češtině: co všechno se může pokazit

Článek

Čeština je pro AI past

Jméno jako první filtr

Rok absolutoria jako proxy pro věk

Co na to zákon

Tak co s tím

Postranní panel

Další články autora

Práce a vzděláníŠvarcsystém v IT: matematika, která drží český trh pohromadě

Právo a státní správaVrátila se z rodičovské. Její místo bylo obsazené

Sdílejte s lidmi své příběhy

Další články autora

Práce a vzděláníŠvarcsystém v IT: matematika, která drží český trh pohromadě

Právo a státní správaVrátila se z rodičovské. Její místo bylo obsazené

Doporučované

Postranní panel

Práce a vzdělání Švarcsystém v IT: matematika, která drží český trh pohromadě

Právo a státní správa Vrátila se z rodičovské. Její místo bylo obsazené

Práce a vzdělání Švarcsystém v IT: matematika, která drží český trh pohromadě

Právo a státní správa Vrátila se z rodičovské. Její místo bylo obsazené