Hlavní obsah
Internet, technologie a elektronika

Když AI počítá kalorie z fotky: Pozná, co máme na talíři a kolik toho je?

Foto: ChatGPT AI

Stačí vyfotit oběd a nechat to na AI? Výzkumníci dali umělé inteligenci fotky běžných jídel a zeptali se jí na to nejjednodušší: kolik toho vlastně je a co to obsahuje? Odpovědi překvapily – někdy mile, většinou však nemile.

Článek

Kolik má tohle jídlo kalorií? Otázka, která dnes hýbe světem častěji než dříve. Někdo si zapisuje vše do aplikace ručně, jiný si jídlo fotí a doufá, že mu technologie jednou odpoví sama. A právě tady vstupuje do hry umělá inteligence – konkrétně velké jazykové modely, které dnes zvládnou nejen psát texty, ale i „koukat“ na obrázky a vyvozovat z nich závěry.

Autoři nedávné studie se rozhodli ověřit, jak dobře si s tímto úkolem poradí tři známé AI systémy: ChatGPT‑4o, Claude 3.5 SonnetGemini 1.5 Pro. Nešlo o žádnou marketingovou demonstraci, ale o poměrně přísný test, ve kterém vědci dostanou AI fotku talíře s jídlem – a podívají se, jak moc se AI odhady liší od reality.

Proč vlastně řešit jídlo přes fotky?

Klasické způsoby sledování stravy (například při snaze o redukci tělesného tuku) mají své mouchy. Třeba vážení jídla, které je považováno za zlatý standard, je pro většinu lidí nepraktické a samo o sobě mění jejich chování - prostě lidé většinou nechtějí počítat kalorie vážením. A pokud se množství jídla jen odhaduje, chyba v odhadu energie se běžně pohybuje v řádu desítek procent.

Fotografie jídla by tedy tyto problémy mohla obejít. Člověk prostě vyfotí talíř a zbytek nechá na algoritmu - jde o usnadnění práce. Otázka ale zní: jsme už technologicky tak daleko?

Studii z roku 2025 přikládám zde, nebo je pod článkem.

Jak studie probíhala?

Výzkumníci si dali práci a nachystali celkem 52 pečlivě nafocených standardizovaných talířů. Někdy šlo jen o jednu věc – třeba samotnou rýži, kousek masa nebo porci zeleniny. Častěji ale šlo o celé jídlo, takové to běžné, jaké člověk zná z oběda: sacharidová příloha, něco bílkovinného a zelenina vedle.

A aby to nebylo tak jednoduché, každé jídlo udělali rovnou třikrát v různém množství – čili porce byly malé, normální a pořádně velké. Právě na tom chtěli vidět, jestli si umělá inteligence všimne rozdílu, nebo bude pořád počítat víceméně stejně.

Dále, aby byl test co nejférovější, všechno jídlo bylo před focením skutečně zváženo. Energetická hodnota a obsah makroživin se spočítaly pomocí nutričního softwaru, který vychází z databází USDA. U hotových balených jídel se použily údaje od výrobce.

Fotky vznikaly za pevných podmínek: stejný talíř, stejné příbory, stejný úhel pohledu. Právě příbory a talíř měly sloužit jako vodítko pro odhad velikosti porce. Každý AI model dostal naprosto stejný úkol a stejný textový pokyn – měl rozpoznat jídlo, odhadnout jeho množství a spočítat energii, sacharidy, tuky a bílkoviny.

Jak si vedly jednotlivé modely?

Ukázalo se, že rozdíly mezi modely nejsou malé. ChatGPT a Claude si vedly velmi podobně. V průměru se jejich odhad hmotnosti a energie lišil od skutečnosti zhruba o třetinu. Jinými slovy: chyba kolem 35 – 37%. To zní jako hodně, ale je dobré si uvědomit, že podobná nepřesnost je běžná i u klasických sebehodnotících metod.

Jazykový model Gemini naopak zaostával výrazně. Chyby v odhadech energie a živin se u něj často pohybovaly nad 60% a u některých živin byly ještě vyšší.

Zajímavé je, že u ChatGPT i Claude byla poměrně slušná shoda mezi tím, jak se měnily skutečné hodnoty a jak se měnily jejich AI odhady. Když porce rostla, AI to většinou „poznala“. Problém byl v tom, že růst systematicky podhodnocovala.

Foto: DeltaWorks | PIXABAY

AI nám talíř jídla zatím přesně nespočítá - většinou ho podhodnocuje.

Velké porce, velký problém

Jedním z nejvýraznějších zjištění studie bylo tedy to, že všechny testované modely mají tendenci čím větší porce, tím více je podceňovat. Malé porce zvládaly relativně dobře. U velkých talířů ale chyby narůstaly a odhady se rozjížděly.

Autoři to dávají do souvislosti i s uspořádáním jídla na talíři. Zelenina byla vždy vpředu, blíže k objektivu, zatímco energeticky bohatší složky často ležely částečně vzadu a byly hůře viditelné. Člověk si to možná domyslí, ale AI s tím bojuje.

Pro běžné sledování stravy to může stačit. Pro sportovce, hubnoucí lidi, nebo klinické použití, kde záleží na přesných číslech, je to zatím problém.

Makroživiny jako další slabé místo

Zatímco energie a hmotnost dopadly jakžtakž obstojně, u jednotlivých makroživin se chyby zvětšovaly. Nejproblematičtější byly bílkoviny a sacharidy.

Stačila jedna chyba v rozpoznání potraviny a čísla se úplně rozpadla. V jednom případě Gemini považoval falafel za masové kuličky, což vedlo k několikanásobnému nadhodnocení bílkovin. Jindy Claude zaměnil míchaná vejce za těstoviny a „vyrobil“ extrémní množství sacharidů.

Takové chyby pak výrazně ovlivňují celkové statistiky a ukazují, jak citlivý celý proces je na správnou identifikaci jídla.

Jak to celé číst v kontextu?

Autoři studie upozorňují, že přesnost ChatGPT a Claude se pohybuje na úrovni běžných sebehodnotících metod, ale bez jejich hlavních nevýhod – žádné paměťové zkreslení, žádná únava, lenost či nechuť, žádné vědomé či nevědomé zkreslování. To je určitá výhoda.

Zároveň ale platí, že současné obecné jazykové modely zatím nejsou vhodné tam, kde je potřeba vysoká přesnost. Zejména u velkých porcí a u detailního rozpisu makroživin.

Limity studie, střet zájmů a financování

Studie pracovala se statickými fotografiemi z jednoho úhlu a s relativně jednoduchými jídly. Skutečný svět je mnohem chaotičtější: složitější recepty, omáčky, vrstvy, různé nádoby. Navíc se testovaly obecné modely bez speciálního tréninku na výživu.

Autoři také záměrně neposkytli AI přesné rozměry talířů a příborů, aby simulovali běžné použití. To mohlo přesnost dále snížit.

A dále vědci uvádějí, že za studií nestojí žádný grant ani komerční partner a že si nejsou vědomi žádného střetu zájmů. Zmiňují také, že při finálních úpravách textu pomáhala jazyková AI, nicméně data, interpretace i závěry zůstávají výhradně jejich vlastní odpovědností.

Závěrem

Výsledky naznačují, že AI už dnes může sloužit jako orientační nástroj pro sledování stravy. Ne jako přesná váha, spíše jako hrubý kompas. S dalším vývojem modelů, lepším „uvažováním“ nad obrazem a možná i s drobnou spoluprací člověka by se přesnost mohla dále zlepšovat.

Revoluce ve výživě zatím nepřišla. Ale první náčrty už na stole leží. Nebo ne?

Zdroj:

Máte na tohle téma jiný názor? Napište o něm vlastní článek.

Texty jsou tvořeny uživateli a nepodléhají procesu korektury. Pokud najdete chybu nebo nepřesnost, prosíme, pošlete nám ji na medium.chyby@firma.seznam.cz.

Sdílejte s lidmi své příběhy

Stačí mít účet na Seznamu a můžete začít publikovat svůj obsah. To nejlepší se může zobrazit i na hlavní stránce Seznam.cz