Proč AI někdy odpovídá nesmyslně? Jazykové modely pracují s čísly, ne se slovy, vysvětluje expert
Umělá inteligence při konverzaci s člověkem někdy odpovídá nesmyslně a zřejmě to tak ještě nějakou dobu zůstane. A to přesto, že v testech chybovosti jsou modely ChatuGPT od OpenAI stále úspěšnější. Podle českých odborníků jsou totiž tyto výsledky zkresleny používáním standardizovaných testovacích sad. Ty se umělá inteligence během opakování už naučila, takže ji otázka nepřekvapí.
Správnou odpověď je umělá inteligence schopna vygenerovat pouze v případě, že se s tématem už někdy setkala.
Poslechněte si reportáž Evy Kézrové o nedostatcích generativní umělé inteligence
„Spousta výzkumníků a výzkumnic, když testovali ChatGPT, odesílala jednotlivé testovací příklady OpenAI,“ vysvětluje Ondřej Dušek z Ústavu formální a aplikované lingvistiky Matematicko-fyzikální fakulty Univerzity Karlovy.
„Všechno, co zadáte na webu do ChatGPT, mají právo použít na zlepšování toho modelu. Takže když si s ním hrajete, ukazujete mu ty příklady, tak ho nevědomky učíte.“
Právě český tým jako první analyzoval 255 článků o zlepšujících se schopnostech konverzující umělé inteligence OpenAI.
„Těch testů probíhala spousta v rozmezí několika měsíců, takže se to už klidně mohlo projevit. A spousta výzkumníků taky testovala na datech, která byla už měsíce nebo třeba i roky veřejně dostupná na internetu. Model má potom i díky tomu mnohem lepší schopnosti,“ dodává Ondřej Dušek.
Slova nezná, pracuje jen s čísly
Umělá inteligence dokáže generovat nová slova a věty jen díky tomu, co se už naučila, a ze své podstaty je schopná pracovat jen s tím, co zná.
Léčba elektrostimulací mozku? Víme, že to funguje, problém je zachytit nemoc včas, tvrdí neurovědec
Číst článek
„Generativní umělá inteligence je pořád matematika a statistika a jediné, co ‚umí‘, je odhadnout, co by asi mohla být následující část slova v té větě. A to je všechno, nic jiného neumí. A na základě toho pak jen generuje nový obsah, který je nám blízký a působí velmi přirozeně,“ vysvětluje Petr Vaculík, vedoucí Centra pro generativní umělou inteligenci IBM.
Potřebuje ale více dat než klasická umělá inteligence, která si s člověkem „nepovídá“. Jejich kvalita a transparentnost je přitom klíčová, aby fungovala správně.
„Samozřejmě když dat pro trénování máte více, je s tím trochu více práce, ale na druhou stranu se na datech učí sama. Nepotřebujete jí říkat: tohle je pes a tohle je kočka. A zároveň generativní umělá inteligence vytváří nové věty, sumíruje obsah, dokáže vytvářet obrázky…“ vyjmenovává expert.
Kolik R je ve slově strawberry?
Velké jazykové modely obsahují obrovské množství parametrů – třetí generace OpenAI jich má přes 175 miliard. Jeden parametr ale není jedno slovo. Jsou to čísla, která každá síť generuje náhodně.
Čeští gynekologové provedou přes 2 miliony stěrů z děložního hrdla ročně. S rozborem jim pomáhá AI
Číst článek
„Každému pořadí ve slovníku přiřadí nějakou pravděpodobnost. Takže když do toho vložíte slovo ‚kočka‘ – to má třeba číslo 3526 – model protáhne toto číslo celou neuronovou sítí a na konci mu vyleze, že nejpravděpodobnější je číslo 12432, tedy slovo ‚leze‘. Takže potom můžete generovat třeba ‚Kočka leze dírou‘,“ ilustruje na příkladu Ondřej Dušek.
Umělá inteligence tak slova vlastně vůbec nezná. A právě to je důvod, proč ChatGPT není schopen odpovědět na zdánlivě jednoduchou otázku, která teď hýbe internetem: Kolik R je v anglickém slově jahoda, tedy ‚strawberry‘?
„Některá slova jsou rozdělená na kousky, protože slov je v jazyce v podstatě nekonečně a vy máte konečně velkou tabulku. Sice má třeba 250 tisíc položek, ale musíte se do ní vejít se všemi slovy,“ popisuje Ondřej Dušek.
„Takže potom třeba slovo strawberry jsou dvě položky v tabulce, a z nich si to upraví. Ale nevidí, jaká jsou tam písmena. Pokud tedy zrovna neviděl nějaký text, kde jsou ta písmena vyspelovaná nebo kde se o tomhle slově pojednává,“ dodává.
A pokud ChatGPT dostane otázku na téma, které nezná, odpověď si jednoduše vymyslí.