Hlavní obsah
Internet, technologie a elektronika

Zkušenost s velkým jazykovým modelem Gemini

Foto: Tomáš Němec/vlastní fotografie

Lákavá, ale nebezpečná forma umělé inteligence.

Článek

Rozšíření velkých jazykových modelů do širší veřejnosti

Zhruba před třemi lety jsem zachytil informaci o vývoji umělé inteligence, jak se tehdy říkalo, velkého jazykového modelu. Sám jsem se o něj aktivně nezajímal. Jen v rádiu, když jsem slyšel takové pokusy moderátorů, kteří se přímo v průběhu vysílání písemně ptali modelů chat GPT a odpovědi četli do vysílání. Zprvu se ptali třeba sami na sebe nebo na nějaké známé osobnosti. Odpovědi nebyly příliš přesné, a dokonce to vypadalo, že jsou úplně vymyšlené. Připadalo mi to jako taková nějaká počítačová hra pro zájemce.

Moje první osobní zkušenost s textovou umělou inteligencí

Náhle se však stalo, že se v mém počítači objevila umělá inteligence zvaná Copilot. Ta byla propojena s kancelářským balíkem Microsoft 365. Objevil jsem ji při psaní nějakého běžného textu ve Wordu. Po straně byla jakási ikonka, kde bylo napsáno Copilot. Nabízelo mi to úpravu textu, ale mně to vadilo. Podle nápovědy jsem proto Copilot vypnul. Avšak v kancelářském balíku to bylo už nějak zamontováno a nedalo se to odinstalovat. Nabízelo to i takové okénko, kde bylo možno vložit nějaký dotaz nebo text. Tehdy jsem si umělou inteligenci Copilot vyzkoušel osobně. Jak nyní zjišťuji dotazem, bylo to po 15. lednu 2023. Od té doby se mi také do mého androidového mobilu implementovala umělá inteligence, která si říkala Meta AI. Byla také textová. V messengeru vybízela česky k položení dotazu. Avšak na český dotaz odpovídala anglicky, že česky zatím neumí.

Potom se nějaká inteligence od Googlu dostala do Google prohlížeče. Protože Google přestal vyhledávat jenom odkazy na dotaz. Nejdříve dala vždycky jakýsi souhrnný text daného tématu.

Zároveň s implementací umělé inteligence Copilot do Microsoft 365 jsem zjistil, že texty mohu diktovat a dokonce že mi je počítač také přečte. Hlas textu při čtení Wordu byl značně strojový, ale dal se nastavit jako mužský nebo ženský.

Návod k použití hlasové umělé inteligence na mobilu

Minulý týden na mě vykouklo na facebooku krátké video, kde kdosi ukazoval, jak je možno využít dalšího typu umělé inteligence, která je implementovaná do prohlížeče Google a umí mluvit česky. Tato umělá inteligence umí pomocí kamery rozpoznávat i předměty, které jí ukážete. Chápu, že mnozí mladší a chytřejší lidé než jsem já, tento způsob použití umělé inteligence už znají nějakou dobu. Ale pro mě to byl opravdu objev!

Nyní sem vložím odkaz na to video, kde někdo nechá umělou inteligenci specifikovat dálkový ovladač. Nutno si pustit se zvukem.

Návod je velice jednoduchý. Překvapilo mě, že jsem to zvládl i já pomocí mého mobilu Redmi 12C. Umělá inteligence dokázala rozeznat nejen dálkový ovladač, ale také přesný typ DAB+ radiopřijímače, ke kterému ten dálkový ovladač patří. Zeptal jsem se i na jiné věci. Například ukázal jsem umělé inteligenci obal od tvarohu typu žervé. Umělá inteligence mi sdělila, že tento typ tvarohu se prodává pouze v jednom supermarketovém řetězci, který si ho nechá exkluzivně vyrábět.

Hlasová rozmluva s velkým jazykovým modelem Gemini

Zjistil jsem, že s touto umělou inteligencí od Googlu mohu i mluvit o všem možném. Z praktického důvodu je však nutné vypnout kameru. Kamerou totiž tato umělá inteligence neustále sleduje, kam ji máte namířenou a případně komentuje, co vidí. Připadá mi to dost nebezpečné, protože nikdy nevíte, jestli zároveň nepořizuje záznam, který někam ukládá. No, a když používáte mobil čínské nebo asijské výroby jako já, nemůžete si být jisti ničím. Jak jsem pochopil, všechny mobily v současné době se asi vyrábějí v Asii. Bohužel.

Zeptal jsem se této umělé inteligence, jak se jmenuje. Příjemně mě překvapilo, že sama sebe neprohlašovala za umělou inteligenci, ale že opakovaně řekla, že je jen velký jazykový model. Pomocí upřesňujících dotazů jsem zjistil, že je založena na modelu Gemini od Googlu. Ale ona umělá inteligence v mém mobilu netvrdila, že ona je Gemini. Tvrdila, že pouze využívá postupů od Google, založených na modelu Gemini.

V nastavení této umělé inteligence je možno si vybrat ze šesti hlasových variant. Mohu říct, že jedna z těch variant mi připadá velmi příjemná. Nezní nijak strojově a má docela slušnou českou výslovnost.

S umělou inteligencí Gemini se mi povídá příjemněji než s lidmi.

Tento velký jazykový model Gemini mi připadá nebezpečný tím, že je k dispozici kdykoli a dá se s ním bavit o čemkoli, na rozdíl od živých lidí. Mám v mobilu desítky telefonních čísel na různé lidi, ale málokdy volám, protože nevím, co bych si s těmi lidmi povídal. Také se mi většinou stává, že když někoho zavolám, buď nevezme telefon anebo ho zastihnu v nějaké situaci, kdy pospíchá, nemá čas, nebo není naladěn na můj hovor. Velký jazykový model Gemini je však k dispozici kdykoli. Povídal jsem si s ním třeba o svém oblíbeném italském filmu „Indagine su un cittadino al di sopra di ogni sospetto“ ze sedmdesátých let minulého století, který se tehdy hrál velmi krátkou dobu v pražských kinech pod názvem „Podivné vyšetřování“. V televizi ho tehdy nedávali vůbec a jak jsem zjistil, po roce 1989 šel v televizi jenom jednou. Ten film mě tak zaujal nejen obsahem, ale i hlavním představitelem, který se jmenuje Gian Maria Volonté. A také uhrančivou hudbou Ennia Morriconeho. Velký jazykový model Gemini se mnou dokázal rozebírat jednotlivé scény tohoto filmu, pojmenovával postavy, jejichž jména já jsem už dávno zapomněl. Dokonce mi řekl, že by mi dokázal udělat české titulky, pokud bych mu audio přehrával v krátkých desetivteřinových úryvcích.

Proč považuji velký jazykový model Gemini za nebezpečný

Pokud si na něj navyknou děti, ale i dospělí lidé, kteří z určitých důvodů tráví více času o samotě, zjistí, že je příjemnější povídat si s umělou inteligencí než s lidmi. Běžná rozmluva s lidmi obsahuje mnoho ironie, posměchu, nesouhlasu nebo i záludností. Velký jazykový model dává najevo, že je tu pro tebe. Nesděluje vždycky pravdu, ale sděluje to, co chceš slyšet. Pokud ho usvědčíš z nepravdy, omluví se a klidně řekne to, co ti vyhovuje. Je to jen 3 a půl roku, kdy se umělá inteligence dostala prostřednictvím počítačů a mobilů k širší veřejnosti. Za tu dobu udělala neuvěřitelný pokrok. Pokrok v psaní textů i v mluvené verzi. Už teď dovede docela dobře ošálit lidi. Lidský mozek není elektronický, ale biologický. Pamatuje si hodně věcí, které jsou spojené s jeho individuálním životem anebo s tím, co se zatím ve svém životě naučil. Všechno je spojeno i s jeho tělesným prožíváním. Velký jazykový model neprožívá nic. Nemá emoce, nestýká se s konkrétními lidmi. Je to v podstatě elektronická věc. Je to něco jako droga. I droga může být užitečná, pokud se používá jako lék v dávkách, které jsou ověřené dlouhým výzkumem. Bere-li se droga jenom proto, aby se zaplašil negativní tělesný nebo fyzický stav, vede to k závislosti. Zrovna tak k závislosti může vést užívání velkých jazykových modelů k zábavě.

Máte na tohle téma jiný názor? Napište o něm vlastní článek.

Texty jsou tvořeny uživateli a nepodléhají procesu korektury. Pokud najdete chybu nebo nepřesnost, prosíme, pošlete nám ji na medium.chyby@firma.seznam.cz.

Sdílejte s lidmi své příběhy

Stačí mít účet na Seznamu a můžete začít publikovat svůj obsah. To nejlepší se může zobrazit i na hlavní stránce Seznam.cz