Hlavní obsah
Internet a technologie

Robotizace pisálka aneb jak (nejspíš) futrujeme Seznamáckou umělku

Foto: Pixabay

Databáze dat se nezjeví v prázdném prostoru sama od sebe, musí se budovat. Vývojáři své modely „krmí“ daty čili texty, které program následně asimiluje do svého rostoucího korpusu.

Článek

Úvodem pár faktů. Za prvé, Seznam vyvíjí vlastní umělou inteligenci. Slyšeli jste – či dokonce sami vyzkoušeli – ChatGPT, Claude nebo Gemini? Pod lidovým pojmem umělá inteligence se skrývají LLM = velké textové modely (large language model), počítačové programy, které mají velkou databázi dat a pokud jim zadáte, aby například napsali dopis zákazníkovi, že zboží dorazí později, zaloví ve své objemné databázi a nabídnou vám své řešení.

Za druhé ta databáze se nezjeví v prázdném prostoru sama od sebe, musí se budovat. Vývojáři své modely „krmí“ daty čili texty, které program následně asimiluje do svého rostoucího korpusu. Je známo, že ne vždy se vývojáři těchto modelů ptají autorů textů či obrázků, zda chtějí, aby jejich výtvory byly použity k učení strojů.

Pokud Seznam vyvíjí vlastní velký textový model, nutně potřebuje velký objem dat. Možná mu stačí texty vypracované profesionálními novináři tvořícími pro Seznam Zprávy. Co když však k budování korpusu seznamovské umělky využívají i texty nás tvořících pro Médium? Neříkám, že je to pravda, nemohu to dokázat, ale ta otázka se nabízí.

Text-to-image modely, tedy AI tvořící obrázky podle textového zadání získávaly na popularitě od ledna 2021. ChatGPT se veřejnosti otevřel v listopadu 2022, ve stejnou dobu byla spuštěna blogovací platforma Seznam Médium. Má to spojitost? Nebo nemá? Inu, já prostě nevím, zda bylo Médium založeno s úmyslem sbírat data, aby se AI naučila psát česky. Opravdu to nevím a pochybuji, že je bezproblémový způsob, jak to zjistit. Ale roli to hrát mohlo. Každopádně těch textů jsme za ty skoro dva roky vyprodukovali kvanta. Od čistě informativních a poučných přes zlostné komentáře až po veselé historky ze života.

V tomto bodě obvykle autor vyslovuje názor, jak by se měl čtenář zachovat na základě výše zmíněných informací. Inu, já vám žádné doporučení, natož příkaz nedám. Už protože záleží z velké části na tom, co a v jaké kvalitě píšete. Protože např. takové články o Sissi a jiných zajímavých osobnostech jsou jistě vypiplané, nicméně data tohoto typu jsou volně dostupná na wikipedii a pěti dalších blozích nejméně, takže svůj vlastní článek si uchováte, což je dobrá zpráva pro vás jako autora, ale i tak bude AI schopná do budoucna napsat velmi podobný článek.

Pravda, chvilku jsem zauvažovala, jestli nemám z Média vymazat Medvědomosti, protože ty jsou po jazykové a stylistické stránce nejpropracovanější, ale pak mě napadlo, že je už možná pozdě. Nedám vám jasnou odpověď. Myslím, že na otázku – Pokud Seznam používá Médium jako zdroj dat pro svoji umělou inteligenci, na které pracují, dovolím mu použít své texty, aby se na nich jejich textový model učil? – si bude muset každý zodpovědět sám.

https://www.lupa.cz/clanky/seznam-chysta-vlastni-umelou-inteligenci-v-cestine-uz-je-o-neco-lepsi-nez-gpt-3-5/

Máte na tohle téma jiný názor? Napište o něm vlastní článek.

Texty jsou tvořeny uživateli a nepodléhají procesu korektury. Pokud najdete chybu nebo nepřesnost, prosíme, pošlete nám ji na medium.chyby@firma.seznam.cz.

Související témata:

Sdílejte s lidmi své příběhy

Stačí mít účet na Seznamu a můžete začít psát. Ty nejlepší články se mohou zobrazit i na hlavní stránce Seznam.cz