Rozvoj umělé inteligence se musí přibrzdit, možná dojde na on-line certifikáty pravosti, míní Holý

Český rozhlas zařazuje poprvé do vysílání hlas vytvořený pomocí umělé inteligence. Z nahrávky autobiografie zpěváka Karla Gotta, který zemřel v roce 2019, asi nikdo nepozná, že ji nenamluvil on sám. „Zní to dost věrohodně. Písničky a kratší audia udělat lze, ale v tomto případě do toho vstupuje i tón hlasu, emoční zabarvení a důraz, takže vyladit to muselo dát práci,“ konstatuje odborník na umělou inteligenci Josef Holý.

Praha Tento článek je více než rok starý Sdílet na Facebooku Sdílet na Twitteru Sdílet na LinkedIn Tisknout Kopírovat url adresu Zkrácená adresa Zavřít

Odborník na informační technologie, algoritmy a dezinformace Josef Holý

Odborník na informační technologie, algoritmy a dezinformace Josef Holý | Foto: Věra Luptáková | Zdroj: Český rozhlas

Jak vysvětluje Josef Holý, neuronovou síť je nejprve potřeba hlas takzvaně naučit. Z 200 hodin audiozáznamů se zpěvákovým hlasem tvůrci vybrali pro trénink umělé inteligence zhruba desetinu.

Přehrát

00:00 / 00:00

Poslechněte si celé Interview Plus Jana Bumby

Takto vycvičený model pak mohl zpracovávat konkrétní texty. Editoři měli k dispozici 60 verzí každé věty, ze kterých vybírali tu, která v daném kontextu zní nejlépe. Celkem umělá inteligence hlasem Karla Gotta načetla víc než 16 tisíc slov.

„Neuronové sítě dnes už máme prakticky všude. Máte je pravděpodobně ve svém telefonu, když rozpoznává váš obličej a jsou integrované v řadě služeb, které dennodenně používáme. Už řadu let je používá Google, který je jedním z průkopníků, zrovna tak Facebook a další firmy,“ shrnuje Holý.

Podobným způsobem je teoreticky možné vygenerovat hlas libovolného člověka. „Model společnosti Microsoft to umožňuje už ze tří vteřin záznamu. Na jaře se už objevily případy, kdy hackeři podobnou technologii využili k vygenerování hlasu blízké osoby. A pak někomu zavolali, že měli nehodu a potřebují číslo kreditní karty,“ upozorňuje.

Odborníci pracují na modelech, které by měly rozpoznat obrázky, audio nebo text vygenerovaný umělou inteligencí, zatím ale nefungují dostatečně dobře. Lze navíc předpokládat, že generátory dále pokročí a bude velice obtížné je rozpoznat.

Regulace je nutná

Český rozhlas si stanovil pravidla pro práci s hlasovou syntézou, například že nenamluví nic, co člověk sám nevytvořil nebo že to nebude vytrženo z kontextu.

4:01

Různě staří Gottové i ráčkující verze. Za minutu a půl dlouhou promluvou jsou až čtyři hodiny práce

Číst článek

Holý ovšem upozorňuje, že v nedaleké budoucnosti bude mít k podobným technologiím přístup prakticky každý, vymahatelnost pravidel tak bude obtížná.

„Bude potřeba, abychom v digitálním prostoru měli nějakou kotvu, něco autorizovaného. Velké vydavatelské společnosti možná budou dávat certifikáty, že tenhle klip nebo písnička opravdu pochází od Karla Gotta. Možná to ale také otevře nové možnosti příjmů pro interprety,“ zamýšlí se spoluautor podcastu Kanárci v síti.

Holý zároveň poukazuje na rozhodnutí amerického patentového úřadu, podle kterého není možné patentovat obsah vytvořený umělou inteligencí, aniž by v něm byl zásah člověka. „Můžete pro tvorbu využít umělou inteligenci, ale není to tak, že stačí napsat prompt a patentovat si vygenerovaný výsledek,“ dodává.

„Rozvoj umělé inteligence se musí přibrzdit. Instituce musí dohlédnout na regulaci této technologie. Mimochodem algoritmy sociálních sítí se nám ani za deset let zregulovat nepodařilo, dnes z toho máme problémy,“ podotýká Holý a oceňuje Evropskou unii za to, že na regulaci umělé inteligence už pracuje.

Poslechněte si celý rozhovor v Interview Plus výše.

Jan Bumba, ert Sdílet na Facebooku Sdílet na Twitteru Sdílet na LinkedIn Tisknout Kopírovat url adresu Zkrácená adresa Zavřít

Nejčtenější

Nejnovější články

Aktuální témata

Doporučujeme