Článek
Tento volně dostupný online nástroj, který nevyžaduje registraci a neukládá žádné osobní údaje svých uživatelů, vznikl díky spolupráci mezi několika institucemi a jeho tvůrci zahrnují akademické pracovníky a studenty z Ústavu českého jazyka FF MU.
Pokusím se to říct jednoduše. Když do aplikace napíšeme nebo vložíme text, tak jej nejdřív rozdělí na jednotlivá slova. Potom proběhne morfologická analýza využívající data z rozsáhlého morfologického slovníku, přičemž se k jednotlivým slovům přiřadí informace o tom, jaký je to slovní druh apod. Poté proběhne syntaktická analýza, při níž se analyzuje celá věta a určí se větné členy, například podmět a přísudek. Následně program hledá podle formálních jazykových pravidel pravopisné, gramatické a typografické chyby. Pokud budeme mít například slovo myš s „i“, tak ho program zaznamená jako chybu a podtrhne ji, protože takové slovo v českém slovníku není. Uživatel dokonce dostane vysvětlení, proč je to chyba. Pokud půjde o překlep, bude rozpoznán korektorem překlepů, který je postavený na obsáhlém slovníku, kde se porovnává tvar slova z textu se slovníkem, a když ho nenajde, tak jej korektor označí podtržením.
Na vzniku Opravidla se podílely Mgr. Dana Hlaváčková, Ph.D., a Mgr. Hana Žižková, Ph.D., obě působící na Ústavu českého jazyka FF MU. Projekt byl financován z grantu získaného v rámci programu ÉTA Technologické agentury České republiky (TA ČR), určeného pro humanitní a společenské vědy. V budoucnu se autoři plánují soustředit na vývoj nové verze Opravidla, která bude částečně zpoplatněna. Vývoji se dále podíleli pracovníci z Ústavu pro jazyk český Akademie věd České republiky, Ústavu teoretické a komputační lingvistiky FF UK, firmy Seznam.cz a EVE Technologies, s. r. o. Aplikačním garantem byla společnost Seznam.cz a Wikimedia ČR. Tým z FF MU byl tvořen akademickými pracovníky a doktorandy, kteří vytvářeli formální jazyková pravidla a testovali stabilitu serveru.
Opravidlo využívá více než 7 500 formálních jazykových pravidel, jež sepsali studenti a doktorandi. Tato pravidla se musela formulovat tak, aby bylo jisté, že program bude schopen poznat chybu. Uvedu příklad rozpoznání a zpracování pravopisné chyby: pokud máme ve větě spojovací výraz „proto“ a nebude před ním.
Studenti bakalářského a magisterského stupně se podíleli na zpracování dat a v počátečních fázích anotovali chyby v autentických českých textech. Projekt je již ukončen a nástroj je volně dostupný pro veřejnost.
Zdroj: Ústavu českého jazyka FF MU