Článek
Na konci listopadu minulého roku spatřilo světlo světa ChatGPT od OpenAI. Jsem si docela jistý, že jste o tomto revolučním chatbotovi už slyšeli. A slovo revoluční v této větě volím důvodně; vždyť je to první veřejnosti přístupný chatbot, který zvládne splnit Turingův test. Tedy nemusíte nutně poznat, že s vámi nehovoří člověk, ale „umělá inteligence“ (AI).
Spousta lidí si díky ChatGPT přivydělala. Ať už jsou to firmy, které na této technologii staví služby a prodávají je, nebo i jednotlivci využívající umělou inteligenci pro psaní knih či tvorbu videí. A titulky „zbohatl díky umělé inteligenci“, „umělá inteligence mu vydělává desetitisíce“ apod. jsou relativně časté.
Podívejte se třeba, co mi ChatGPT odpovědělo na otázku ohledně krmení štěněte:
Dostal jsem celistvou odpověď, kterou, kdybych našel někde v sekci častých dotazů obchodu zaměřujícího se na domácí mazlíčky, ani mě nenapadne, že ji napsal robot.
Tohle všechno zmiňuji proto, že chci ukázat, jak schopné už dnešní neuronové sítě jsou. Kdyby přede mě někdo tohle postavil před pěti lety (a možná i před rokem), tak mu nejspíš ani nebudu věřit. Můžete se zeptat na cokoliv a dostanete odpověď. Hned.
Revoluční.
Ale…
Dnešní AI nefunguje tak, jak si možná myslíte.
Pro pochopení fundamentálního problému současného AI boomu se v prvé řadě musíme podívat na to, jaké technologie vlastně ChatGPT pohání. Nebojte, nezahltím vás vědeckými nákresy, schématy a termíny. Zůstanu u základů.
Transformer. Takhle se jmenuje architektura neuronových sítí, kterou využilo OpenAI při stavbě ChatGPT. Vyvinul ji vědecký tým Googlu, publikována byla v roce 2017. Ale to je pro tento článek irelevantní. Relevantní je, jak tato architektura funguje.
Jako vstup si vezme váš text. Otázku, příkaz, nebo cokoliv jiného, co napíšete do políčka zprávy pro ChatGPT. Na základě tohoto vstupu generuje textový výstup. Slovo po slově. Po každém se pozastaví a pokusí na základě tréninkových dat předpovědět, jaké bude další slovo. Tenhle cyklus se opakuje během generování odpovědi stále. „Umělá inteligence“ tak vlastně nikdy nepochopí, co jí říkáte. A nechápe ani, co říká ona vám. Vždy jen vybírá to slovo, které je podle jejích složitých matematických výpočtů nejpravděpodobnější.
Pod pokličkou tak není žádný naklonovaný mozek ani žádná jiná logicky uvažující kreatura. Je to zkrátka složitý soubor nespočtu matematických výpočtů, který se potom, co viděl ohromné množství vstupů a výstupů, na základě kterých tyto výpočty upravil, „naučil“ odhadnout lidsky znějící odpověď na vaši otázku.
Ale proč je tohle problém?
Protože mnozí dnešní chatboty pokládají za inteligentní entity. Vzniká tak třeba pocit, že faktické chyby AI vyřeší, když ji je doučíme. Ve skutečnosti ale ChatGPT nemůžete informace jen tak předhodit, a čekat, že si je prostě zapamatuje. Model, který chatbota pohání, je obrovský, přesto ale vnitřní matematické výpočty nemohou zachytit kompletní informační objem internetu. To ani s dnešními superpočítači prostě nejde.
Dnešní AI má limitace a my na ně narážíme.
ChatGPT se bude ještě zlepšovat. Předplatitelé mají už teď v rukou novou verzi chatbota (poháněnou GPT-4), která je ještě lepší a přesnější. To ale neznamená, že je přesná. Není. A ani být nemůže. Se současnými transformery jde ujít jen určitou část cesty. A bez masivního (ale opravdu masivního) vylepšení výpočetních schopností nám k tomuto limitu chybí jen posledních pár kroků. Mluvil o tom dokonce i šéf OpenAI, Sam Altman, když řekl: „Myslím, že jsme na konci éry těchto gigantických modelů. Vylepšíme je jinými způsoby.“
Altman teď sice mluví i o vylepšení technologie transformerů, zmiňuje se ale už i o nové architektuře neuronových sítí, která by „umělou inteligenci“ posunula na další úroveň. OpenAI dokonce zatím ani netrénuje další generaci svého modelu. Transformery navíc nejsou limitující jen co se týče schopností AI, jsou také nesmírně výpočetně náročné. Už GPT-3 (které pohání ChatGPT) musí ve svých výpočtech zohledňovat 175 miliard matematických hodnot. A to je hodně i pro počítače. GPT-4 je pravděpodobně ještě větší.
O to humorněji pak zní Elon Musk mluvící o vytvoření modelu, který by mluvil pouze pravdu a adresoval tak „levicové naklonění“ ChatGPT. To zkrátka bez nové technologie nepůjde. Už jenom dohonit OpenAI by Muska stálo enormní množství peněz. A s obnosy, které teď dozajista do výzkumu vkládá samotné OpenAI, to možná je dokonce nemožné.
Takže pro shrnutí. Modely postavené na transformerech zkrátka nikdy nemůžou tušit, zda mluví pravdu, a tenhle problém nejde úplně eliminovat. Nedokážou nad svými odpověďmi racionálně uvažovat.
Termín „umělá inteligence“ je nepřesný.
Dnešní modely zkrátka nejsou inteligentní. Vždy jen odhadují, jaké slovo má v textu následovat. Tak proč jim vůbec AI říkáme? Za všechno může marketing. „Umělá inteligence“ je totiž při popisu nové funkce mnohem více „sexy“ než „neuronová síť“. Vzbuzuje to ale dojem, že jsou dnešní technologie lepší, než reálně jsou. A to veřejnost mystifikuje.
Bohužel proti zaměňování termínu „AI“ a „neuronová síť“ nejde nic moc dělat. I já termín „umělá inteligence“ používám ve svých článcích a budu to tak dělat i nadále. V očích veřejnosti se totiž tyhle dva termíny staly synonymními. Je ale důležité vědět, že nejsou.
Na druhou stranu je spojení „umělá inteligence“ v dnešní době vlastně volný.