AI hlasy znejú reálne, no zatiaľ nie hyperreálne: Prelom alebo hrozba?
Výskum ukazuje, že hoci sú voice klony čoraz presvedčivejšie, efekt "hyperrealizmu", známy z vnímania tvárí, sa v prípade hlasov zatiaľ nepotvrdil. Sú však dosť dobré na to, aby zmiatli.

Syntetické hlasy sa stávajú bežnou súčasťou našich životov. Nová štúdia skúmala, či dokážeme spoľahlivo rozlíšiť medzi nimi a skutočnými ľudskými hlasmi a ako ich vnímame.
Umelá inteligencia preniká do rôznych oblastí, a to aj do hlasovej syntézy. Virtuálni asistenti, automatizovaná zákaznícka podpora či voiceovery – syntetické hlasy sú všade okolo nás. S ich rastúcou dostupnosťou a cenovou prístupnosťou je kľúčové skúmať, ako ich ľudia vnímajú.
Nedávny výskum poukázal na zaujímavý fenomén pri AI generovaných tvárach: tie boli vnímané ako "ľudskejšie" než fotografie skutočných ľudí – tzv. efekt hyperrealizmu. Vedci sa preto zamerali na to, či tento efekt existuje aj pri AI generovaných hlasoch.
Štúdia skúmala, do akej miery znejú AI hlasy pre poslucháčov reálne a či ich dokážu odlíšiť od ľudských hlasov. Analyzovali sa aj vnímané sociálne vlastnosti – dôveryhodnosť a dominantnosť. Testovali sa dva typy AI hlasov: voice klony (napodobňujúce konkrétnu osobu) a hlasy vytvorené na základe rozsiahleho modelu.
Komentár redakcie: Umelá inteligencia neustále napreduje a jej využitie v oblasti hlasovej syntézy prináša nielen nové možnosti, ale aj výzvy. Rozlíšenie skutočného a syntetického hlasu je čoraz ťažšie, čo otvára dvere novým formám podvodov. Dôležité je preto zvyšovať povedomie o tejto technológii a jej potenciálnych rizikách. Na druhej strane, realistické AI hlasy prinášajú revolučné riešenia pre ľudí s rôznymi obmedzeniami, umožňujú im plnohodnotnejšiu komunikáciu a prístup k informáciám.
Výsledky ukázali, že voice klony môžu znieť rovnako reálne ako ľudské hlasy, čo sťažuje ich rozlíšenie. Efekt hyperrealizmu sa však nepotvrdil. Oba typy AI hlasov boli hodnotené ako dominantnejšie než ľudské, pričom niektoré boli vnímané aj ako dôveryhodnejšie.
"Tieto zistenia otvárajú dôležité otázky," hovorí vedúci štúdie. "Dá sa vytvoriť hyperrealistický hlas pomocou pokročilejších technológií? Alebo je absencia hyperrealizmu spôsobená rozdielmi medzi vnímaním hlasu a tváre?"
Výskum tiež poukazuje na potenciálne riziká spojené s používaním AI hlasov na dezinformácie a podvody, no zároveň zdôrazňuje ich prínos v oblastiach ako prístupnosť pre zrakovo postihnutých alebo pomoc ľuďom so stratou reči.