Hlavní obsah
Internet a technologie

DeepSeek: Jak čínský startup mění pravidla AI trhu

Foto: Pexels/UMA Media/ Licence Open source

DeepSeek, čínský startup, překvapil technologický svět svými levnými a výkonnými AI modely. S cílem konkurovat gigantům jako OpenAI přináší inovativní přístupy, které mohou změnit hru v oblasti umělé inteligence.

Článek

AI Assistant společnosti DeepSeek, poháněný technologií DeepSeek V3, předběhl konkurenční ChatGPT a stal se nejlépe hodnocenou bezplatnou aplikací. To vyvolalo pochybnosti o důvodech rozhodnutí některých amerických technologických společností zavázat se miliardy dolarů v investicích do AI, důsledkem čehož byly zasaženy akcie několika velkých technologických hráčů, včetně Nvidie. Kvůli čemu?

DeepSeek-V3 a DeepSeek-R1, jsou na stejné úrovni jako OpenAI a nejpokročilejší modely Meta, ačkoliv je jejich použití levnější. DeepSeek-R1 je 20 až 50krát levnější než model OpenAI, v závislosti na úkolu. To vše za pomocí systému, který aktivuje pouze ty nejrelevantnější části modelu pro každý dotaz, a to šetří peníze a výpočetní výkon.

DeepSeek je startup se sídlem v Chang-čou, jehož hlavním akcionářem je Liang Wenfeng, spoluzakladatel hedgeového fondu High-Flyer, založeného na záznamech čínských společností. Nejedná se ale o první pokus o vytvoření čínské AI. Vydání ChatGPT od OpenAI na konci roku 2022 způsobilo tahanice mezi čínskými technologickými firmami, které se vrhly na vytvoření vlastních chatbotů. Ale po vydání prvního čínského ekvivalentu, vytvořeného gigantem vyhledávačů Baidu. V Číně zavládlo všeobecné zklamání z propasti ve schopnostech umělé inteligence mezi americkými a čínskými firmami.

To se mělo změnit, když Liangův fond v březnu 2023 na svém oficiálním účtu WeChat (pozn. čínská aplikace, která kombinuje messaging, sociální sítě a mobilní platby.) oznámil, že chce začít soustředil zdroje na vytvoření nové a nezávislé výzkumné skupiny, která by prozkoumala podstatu Artificial General Intelligence (AGI). DeepSeek byl vytvořen později v tomto roce. To, co ale zaskočilo investory byly nízké náklady. Ty analytik Wedbush Securities - Dan Ives, stanovil na pouhých 5,58 milionů dolarů (pozn. 133,96 milionů CZK). Pro srovnání, OpenAI, Google a další velké americké společnosti jsou podle Goldman Sachs na dobré cestě investovat v nadcházejících letech do umělé inteligence zhruba 1 bilion dolarů (pozn. 23 bilionů 970 miliard CZK).

Vše nemusí být ale tak růžové, jak se to na první pohled může zdát. Analytici společnosti Bernstein ve své výzkumné zprávě zdůraznili, že celkové náklady na školení DeepSeek pro model V3 nebyly známy, ale byly mnohem vyšší než 5,58 milionu dolarů, které startup uvedl, že byl použit na výpočetní výkon. Analytici také uvedli, že náklady na školení stejně uznávaného modelu R1 nebyly zveřejněny.

Jak na to celé reaguje Sam Altman, Generální ředitel OpenAI. V příspěvku na platformě X uvedl, že model R1 DeepSeek je „působivým“ a dodal, že „v reakci na to zveřejníme nějaké verze nových modelů“. Produktový ředitel OpenAI Kevin Weil také uvedl, že nadcházející model společnosti, který bude uveden na trh v nadcházejících týdnech, bude „dalším velkým krokem vpřed“.

Agent Čína

Podobně jako ostatní společnosti, trénující své AI modely, i DeepSeek shromažďuje velké množství údajů o všem, co na webu chatbota děláme. Všechny tyto informace shromažďují dvě společnosti: Hangzhou DeepSeek Artificial Intelligence Co.. a Beijing DeepSeek Artificial Intelligence Co.

Informace, které společnosti sbírají, jsou všechny chaty, které zadáváte (pozn. kromě osobních údajů, které poskytnete při registraci). Jedná se o chaty, generované texty, zvukové nahrávky a soubory, které jste nahráli, historii používání a mnoho dalšího. Existuje také sekce nazvaná „automatically collected information“, kde jsou seskupeny IP adresa, soubory cookie, diagnostické údaje a to nejzávažnější – stisky kláves. To vše je spojeno s ID uživatele.

Všechna tyto data jsou následně k dispozici i ostatním společnostem ve firemní skupině. Což může být následně využito různými způsoby, vzhledem k tomu, že vše je spojeno s konkrétním ID uživatele. Kromě toho existuje oprávněné podezření, že budou tyto data sdílena s místními orgány, jako je například čínská vláda. (pozn. odborníci upozorňují na čínský zákon o národní zpravodajské službě, který vládě umožňuje přístup k datům soukromých společností.) 20. ledna, v den, kdy byl DeepSeek-R1 uvolněn pro veřejnost, se zakladatel Liang podle státní tiskové agentury Xinhua zúčastnil uzavřeného sympozia pro obchodníky a odborníky, které pořádal čínský premiér Li Qiang

Legislativní opatření

Jihokorejská Komise pro ochranu osobních údajů (PIPC) vznesla obvinění proti start-upu. Podle vyšetřování regulátorů společnost sdílela bez informování uživatelů jejich data s čínskou technologickou firmou ByteDance, známou jako mateřská společnost populární platformy TikTok. Následně se jihokorejská vláda rozhodla zakročit a nařídila odstranění aplikace DeepSeek z digitálních obchodů Apple App StoreGoogle Play v zemi.

Další země budou postupovat obdobně, například EU má velmi přísnou politiku ochrany údajů. Společnost DeepSeek, stejně jako ostatní, bude muset GDPR dodržovat, přestože má servery v Číně. Obdobný postup byl i u ChatGPT nebo Gemini. Jako první zakročil italský úřad pro ochranu údajů, známý jako Garante. Ten zablokoval přístup k aplikaci v kroku, který podle něj ochrání data uživatelů, a oznámil vyšetřování společností stojících za chatbotem.

Další stát, které k omezení přistoupil, byl Tchaj-wan, který oznámil, že zakázal vládním úřadům používat DeepSeek. Podobně se zachovala i Austrálie. Oboustranné duo v americké Sněmovně reprezentantů navrhuje legislativu, která zakáže čínskou aplikaci z federálních zařízení. Návrh zákona by zařadil DeepSeek a jakoukoli aplikaci AI vyvinutou její mateřskou společností, jako zakázanou. Legislativa obsahuje výjimky pro účely národní bezpečnosti a výzkumu, které by federálním zaměstnavatelům umožnily studovat DeepSeek.

Foto: Pexels/Pixabay/ licence open source

Pod společnost ByteDance, patří kromě TikToku i CapCut, Douyin nebo Nuverse

Je opravdu lepší než ostatní AI modely?

Podle výzkumu čínský startup nahradil technologii Supervised Fine-Tuning (SFT), kterou OpenAI používá k trénování ChatGPT s Reinforcement Learning (RL), aby produkovala rychlejší a levnější výsledky. Jaký je rozdíl?

SFT se spoléhá na to, že ukazuje AI způsoby řešení problémů poskytováním přístupu k datům, aby umělá inteligence věděla, jaký druh odpovědí na různé výzvy poskytnout.

RL se spoléhá na model AI, snaží se přijít na odpovědi se zavedeným systémem odměn a poté poskytuje AI zpětnou vazbu. RL umožnilo DeepSeek zlepšit uvažovací schopnosti R1 a překonat nedostatek výpočtů. Jak však vysvětluje VentureBeat , v raných fázích R1, než přešli na RL, bylo potřeba určité školení SFT, kde lidé dohlížejí na AI.

Jaké jsou ale samotné rozdíly, při běžném využívání:

DeepSeek

· Nákladová efektivita – Cenově dostupnější, s efektivním využitím zdrojů.

· Logická struktura – Poskytuje dobře strukturované a úkolově orientované odpovědi.

· Oborově specifické úkoly – Optimalizován pro technické a specializované dotazy.

· Etická uvědomělost – Zaměřuje se na minimalizaci zaujatosti, férovost a transparentnost odpovědí.

· Rychlost a výkon – Rychlejší zpracování pro specifické úlohy.

· Snadné použití – Nabízí flexibilitu pro profesionální a cílené využití.

· Přizpůsobitelnost – Lze doladit pro konkrétní úkoly nebo odvětví.

· Jazyková plynulost – Vyniká v tvorbě strukturovaných a formálních výstupů.

· Praktické využití – Ideální pro výzkum, technické řešení problémů a analýzy.

ChatGPT

· Nákladová efektivita – Nabízí freemium model. (pozn. obchodní model, kde základní verze služby nebo produktu je zdarma, ale pokročilé funkce nebo obsah jsou zpoplatněny pro běžné použití.)

· Logická struktura – Poskytuje konverzační a snadno pochopitelné odpovědi.

· Oborově specifické úkoly – Skvělé pro širokou škálu obecných znalostí a kreativních úloh.

· Etická uvědomělost – Obecné odpovědi s minimální vestavěnou etickou filtrací.

· Rychlost a výkon – Spolehlivý výkon napříč různými tématy.

· Snadné použití – Jednoduché a intuitivní pro každodenní dotazy a interakce.

· Přizpůsobitelnost – Trénován pro široké využití bez nutnosti ladění.

· Jazyková plynulost – Přirozený, neformální a srozumitelný styl komunikace.

· Praktické využití – Perfektní pro běžné učení, kreativní psaní a obecné dotazy.

Tyto základní informace Vám mohou pomoci při rozhodování, který AI model zvolit.

Za zmínku ještě stojí, že je neobvyklé, že čínská společnost vytvořila své modely jako open-source, to znamená, že zdrojový kód softwaru je veřejně dostupný a může být legálně upravován, distribuován a používán každým, kdo má zájem, ale musí dodržovat podmínky příslušné licence.

Je to vše ukradené?

V poslední době se objevují případy, kdy se DeepSeek V3 identifikuje jako ChatGPT, kdy při žádosti o upřesnění trvá na tom, že jde o verzi modelu GPT-4 OpenAI vydaného v roce 2023. Pokud se zeptáte DeepSeek V3 na otázku týkající se jeho API, poskytne vám pokyny k používání API OpenAI. DeepSeek V3 dokonce vypráví některé stejné vtipy jako GPT-4, ale s odlišnými pointami.

Je nutné uvést, že toto neznamená, že jde o jakousi AI loupež. Modely jako ChatGPT a DeepSeek V3 jsou statistické systémy (pozn. metody používané k sběru, analýze a interpretaci dat), vyškoleni na miliardách příkladů, kdy se v těchto příkladech učí vzorce, aby mohli ,,správně“ odpovědět.

Nejedná se ani o první model, který se chybně identifikuje. Gemini od Googlu a další někdy tvrdí, že jsou konkurenčními modely. Například na výzvu v mandarínštině Gemini říká, že je to chatbot Wenxinyiyan čínské společnosti Baidu. Je ale jistě možné, že DeepSeek trénoval DeepSeek V3 přímo na textu generovaném ChatGPT. Google byl kdysi obviněn, že dělá totéž. Nejpravděpodobnější varianta však je, že DeepSeek při trénování svého systému použil data, které mohli být vyprodukované ChatGPT nebo i jiným AI modelem, v jejímž důsledku má problém se svou identifikací.

Přestože DeepSeek představuje významného konkurenta na poli AI, není zatím jasné, zda se stane skutečným průlomem. Jeho nízké náklady a výkonnostní optimalizace přitahují pozornost, ale otázkou zůstává, zda dokáže dlouhodobě konkurovat zavedeným hráčům, jako jsou OpenAI, Google nebo Meta. Vývoj v oblasti AI se neustále mění a je pravděpodobné, že v následujících letech uvidíme další posuny v tomto technologickém závodě.

Máte na tohle téma jiný názor? Napište o něm vlastní článek.

Texty jsou tvořeny uživateli a nepodléhají procesu korektury. Pokud najdete chybu nebo nepřesnost, prosíme, pošlete nám ji na medium.chyby@firma.seznam.cz.

Sdílejte s lidmi své příběhy

Stačí mít účet na Seznamu a můžete začít psát. Ty nejlepší články se mohou zobrazit i na hlavní stránce Seznam.cz