Proč AI někdy odpovídá nesmyslně? Jazykové modely pracují s čísly, ne se slovy, vysvětluje expert

Umělá inteligence při konverzaci s člověkem někdy odpovídá nesmyslně a zřejmě to tak ještě nějakou dobu zůstane. A to přesto, že v testech chybovosti jsou modely ChatuGPT od OpenAI stále úspěšnější. Podle českých odborníků jsou totiž tyto výsledky zkresleny používáním standardizovaných testovacích sad. Ty se umělá inteligence během opakování už naučila, takže ji otázka nepřekvapí.

Magazín Experiment Praha 0:10 17. ledna 2025 Sdílet na Facebooku Sdílet na Twitteru Sdílet na LinkedIn Tisknout Kopírovat url adresu Zkrácená adresa Zavřít

Umělá inteligence (ilustrační obrázek) | Zdroj: Shutterstock

Správnou odpověď je umělá inteligence schopna vygenerovat pouze v případě, že se s tématem už někdy setkala.

Přehrát

00:00 / 00:00

Poslechněte si reportáž Evy Kézrové o nedostatcích generativní umělé inteligence

„Spousta výzkumníků a výzkumnic, když testovali ChatGPT, odesílala jednotlivé testovací příklady OpenAI,“ vysvětluje Ondřej Dušek z Ústavu formální a aplikované lingvistiky Matematicko-fyzikální fakulty Univerzity Karlovy.

„Všechno, co zadáte na webu do ChatGPT, mají právo použít na zlepšování toho modelu. Takže když si s ním hrajete, ukazujete mu ty příklady, tak ho nevědomky učíte.“

Právě český tým jako první analyzoval 255 článků o zlepšujících se schopnostech konverzující umělé inteligence OpenAI.

„Těch testů probíhala spousta v rozmezí několika měsíců, takže se to už klidně mohlo projevit. A spousta výzkumníků taky testovala na datech, která byla už měsíce nebo třeba i roky veřejně dostupná na internetu. Model má potom i díky tomu mnohem lepší schopnosti,“ dodává Ondřej Dušek.

Slova nezná, pracuje jen s čísly

Umělá inteligence dokáže generovat nová slova a věty jen díky tomu, co se už naučila, a ze své podstaty je schopná pracovat jen s tím, co zná.

48:21

Léčba elektrostimulací mozku? Víme, že to funguje, problém je zachytit nemoc včas, tvrdí neurovědec

Číst článek

„Generativní umělá inteligence je pořád matematika a statistika a jediné, co ‚umí‘, je odhadnout, co by asi mohla být následující část slova v té větě. A to je všechno, nic jiného neumí. A na základě toho pak jen generuje nový obsah, který je nám blízký a působí velmi přirozeně,“ vysvětluje Petr Vaculík, vedoucí Centra pro generativní umělou inteligenci IBM.

Potřebuje ale více dat než klasická umělá inteligence, která si s člověkem „nepovídá“. Jejich kvalita a transparentnost je přitom klíčová, aby fungovala správně.

„Samozřejmě když dat pro trénování máte více, je s tím trochu více práce, ale na druhou stranu se na datech učí sama. Nepotřebujete jí říkat: tohle je pes a tohle je kočka. A zároveň generativní umělá inteligence vytváří nové věty, sumíruje obsah, dokáže vytvářet obrázky…“ vyjmenovává expert.

Kolik R je ve slově strawberry?

Velké jazykové modely obsahují obrovské množství parametrů – třetí generace OpenAI jich má přes 175 miliard. Jeden parametr ale není jedno slovo. Jsou to čísla, která každá síť generuje náhodně.

Čeští gynekologové provedou přes 2 miliony stěrů z děložního hrdla ročně. S rozborem jim pomáhá AI

Číst článek

„Každému pořadí ve slovníku přiřadí nějakou pravděpodobnost. Takže když do toho vložíte slovo ‚kočka‘ – to má třeba číslo 3526 – model protáhne toto číslo celou neuronovou sítí a na konci mu vyleze, že nejpravděpodobnější je číslo 12432, tedy slovo ‚leze‘. Takže potom můžete generovat třeba ‚Kočka leze dírou‘,“ ilustruje na příkladu Ondřej Dušek.

Umělá inteligence tak slova vlastně vůbec nezná. A právě to je důvod, proč ChatGPT není schopen odpovědět na zdánlivě jednoduchou otázku, která teď hýbe internetem: Kolik R je v anglickém slově jahoda, tedy ‚strawberry‘?

ChatGPT Strawberry count pic.twitter.com/ZIkR6HIrBY
— ℝ (@worldrecordraps) December 31, 2024

„Některá slova jsou rozdělená na kousky, protože slov je v jazyce v podstatě nekonečně a vy máte konečně velkou tabulku. Sice má třeba 250 tisíc položek, ale musíte se do ní vejít se všemi slovy,“ popisuje Ondřej Dušek.

„Takže potom třeba slovo strawberry jsou dvě položky v tabulce, a z nich si to upraví. Ale nevidí, jaká jsou tam písmena. Pokud tedy zrovna neviděl nějaký text, kde jsou ta písmena vyspelovaná nebo kde se o tomhle slově pojednává,“ dodává.

A pokud ChatGPT dostane otázku na téma, které nezná, odpověď si jednoduše vymyslí.

Eva Kézrová, Anna Duchková Sdílet na Facebooku Sdílet na Twitteru Sdílet na LinkedIn Tisknout Kopírovat url adresu Zkrácená adresa Zavřít

iRozhlas

Proč AI někdy odpovídá nesmyslně? Jazykové modely pracují s čísly, ne se slovy, vysvětluje expert

Slova nezná, pracuje jen s čísly

Kolik R je ve slově strawberry?

Umělou inteligenci letos využívalo přes 11 procent českých firem, oproti loňsku je to dvojnásobek

Česká technologie Kardi AI monitoruje srdce s pomocí umělé inteligence. Mohla by nahradit Holter

Mohlo by vás zajímat

‚Vy. Nevíte. Co. Znamená. Bolest.‘ Smrt a traumata se stávají pro Ukrajince trvalou součástí života

Daně v Česku: Češi by zrušili výjimku pro tiché víno a méně danili levnou práci

Očkovací zákon je protiústavní, tvrdí Nejvyšší soud. Náhradu újmy je téměř nemožné získat

Bateriová auta zvítězí, vytlačí i spalovací, tvrdí analytik. Proč v nové disciplíně Čína válcuje Evropu?

Technologie

‚Lucie Výborná prozradila svůj obrovský plat.‘ Podvodníci skrze bulvární články kradou osobní údaje

Největší riziko AI? Že vytvoří svět, ze kterého se nám nebude chtít vystupovat, míní kybernetik Jiří Matas

Kingdom Come 2 je podle britské ankety 7. nejvlivnější videohrou světa. Porazila Tetris i World of Warcraft

Nejčtenější za posledních 24 hodin

Nejčtenější za poslední 3 dny

Nejčtenější za poslední týden

Nejnovější články

První pacientka v Česku dostala experimentální lék na rakovinu. Učí imunitu bojovat s nádorem

Na olympiádě v Los Angeles bude poprvé více žen než mužů. Výrazná změna je především u fotbalu

Policie zasahuje na radnici šestého obvodu v Pardubicích. Prověřuje manipulaci se zakázkami

ONLINE: Při útocích na Kyjev a Mykolajiv bylo zraněno 12 lidí. Rusové pálili proti dronům u Moskvy

Hrozí likvidace národních parků, varují jejich ředitelé před pozměňovacími návrhy k novele zákona

Pohonné hmoty v Česku opět zlevnily. Natural 95 stojí průměrně 34,91 koruny, nafta rovných 34

Aktuální témata

Doporučujeme

Proč AI někdy odpovídá nesmyslně? Jazykové modely pracují s čísly, ne se slovy, vysvětluje expert

Slova nezná, pracuje jen s čísly

Kolik R je ve slově strawberry?

Mohlo by vás zajímat

‚Vy. Nevíte. Co. Znamená. Bolest.‘ Smrt a traumata se stávají pro Ukrajince trvalou součástí života

Daně v Česku: Češi by zrušili výjimku pro tiché víno a méně danili levnou práci

Očkovací zákon je protiústavní, tvrdí Nejvyšší soud. Náhradu újmy je téměř nemožné získat

Bateriová auta zvítězí, vytlačí i spalovací, tvrdí analytik. Proč v nové disciplíně Čína válcuje Evropu?

Technologie

‚Lucie Výborná prozradila svůj obrovský plat.‘ Podvodníci skrze bulvární články kradou osobní údaje

Největší riziko AI? Že vytvoří svět, ze kterého se nám nebude chtít vystupovat, míní kybernetik Jiří Matas

Kingdom Come 2 je podle britské ankety 7. nejvlivnější videohrou světa. Porazila Tetris i World of Warcraft

Nejčtenější za posledních 24 hodin

Otřes v nejuzavřenější tajné službě. Skončil nejvyšší šéf zpravodajských operací, je na úřadu práce

Čína dovozní cla nezrušila, Amerika je od středy zvýší na 104 procent. Trump svoje výhrůžky plní

‚Omlouváme se za zmatky.‘ Trumpova vláda obnovuje šest nedávno zrušených humanitárních programů

Američané jsou velmi nervózní. Očekávají, že cla jsou jenom začátek ekonomické války, varuje Švejnar

Daně v Česku: Češi by zrušili výjimku pro tiché víno a méně danili levnou práci

‚Lucie Výborná prozradila svůj obrovský plat.‘ Podvodníci skrze bulvární články kradou osobní údaje

Nejnovější články

První pacientka v Česku dostala experimentální lék na rakovinu. Učí imunitu bojovat s nádorem

Na olympiádě v Los Angeles bude poprvé více žen než mužů. Výrazná změna je především u fotbalu

Policie zasahuje na radnici šestého obvodu v Pardubicích. Prověřuje manipulaci se zakázkami

ONLINE: Při útocích na Kyjev a Mykolajiv bylo zraněno 12 lidí. Rusové pálili proti dronům u Moskvy

Hrozí likvidace národních parků, varují jejich ředitelé před pozměňovacími návrhy k novele zákona

Pohonné hmoty v Česku opět zlevnily. Natural 95 stojí průměrně 34,91 koruny, nafta rovných 34

Aktuální témata

Doporučujeme