Matematický strop obmedzuje kreativitu generatívnej AI na úroveň amatéra, tvrdí štúdia
Štúdia dokazuje, že rozsiahle jazykové modely, ako ChatGPT, sú matematicky obmedzené na úroveň kreativity porovnateľnú s ľudským amatérom.
Nová teoretická analýza publikovaná v Journal of Creative Behaviour spochybňuje názor, že umelá inteligencia čoskoro prekoná ľudské umelecké a intelektuálne schopnosti. Ukazuje, že rozsiahle jazykové modely majú matematicky obmedzenú kreativitu.
Výskum Davida H. Cropleyho z University of South Australia prináša objektívne meranie do polarizovanej diskusie o generatívnej AI. Kým niektorí tvrdia, že AI už prekonáva ľudí v kreatívnych úlohách, iní tvrdia, že systémy len napodobňujú existujúce dáta bez skutočného porozumenia.
Cropley aplikoval štandardnú definíciu kreativity na pravdepodobnostnú mechaniku rozsiahlych jazykových modelov. Chcel zistiť, či spôsob, akým tieto modely fungujú, prirodzene obmedzuje kvalitu ich výstupu.
Na vyhodnotenie kreatívneho potenciálu umelej inteligencie vedec definoval kreatívny produkt ako efektívny a originálny. Efektívnosť znamená, že produkt je užitočný a vhodný pre svoj účel. Originalita znamená, že produkt je nový a prekvapivý. Ľudská kreativita na vysokej úrovni kombinuje obe tieto vlastnosti.
Komentár redakcie: Táto štúdia prináša dôležitý pohľad na obmedzenia súčasnej umelej inteligencie v oblasti kreativity. Hoci AI dokáže efektívne napodobňovať a generovať obsah, jej schopnosť dosiahnuť skutočnú novosť a originalitu je obmedzená matematickým stropom. To poukazuje na dôležitosť ľudského faktora v kreatívnych procesoch.
Cropley sa zameral na „produkt“ kreativity a nie na psychologické procesy. Analyzoval mechanizmus predpovedania nasledujúceho tokenu, ktorý používajú rozsiahle jazykové modely. Systémy rozdeľujú text na menšie jednotky (tokeny) a vypočítavajú pravdepodobnosť, ktorý token by mal logicky nasledovať predchádzajúce tokeny. Tento proces je transparentný a umožňuje matematický výpočet kreativity.
Výskum odhalil kompromis v architektúre rozsiahlych jazykových modelov. Pre efektívnu odpoveď musí model vybrať slová s vysokou pravdepodobnosťou, že zapadnú do kontextu. Napríklad, ak podnet znie „Mačka sedela na…“, slovo „rohož“ je efektívne dokončenie. Avšak, pretože „rohož“ je najpravdepodobnejšie ukončenie, je aj najmenej nové.
Naopak, ak by model vybral slovo s veľmi nízkou pravdepodobnosťou, aby zvýšil novosť, efektívnosť by klesla. Dokončenie vety slovami „červený kľúč“ by bolo nové, ale pravdepodobne nezmyselné. Cropley zistil, že novosť a efektívnosť fungujú ako nepriamo úmerné premenné. Ako sa systém snaží byť efektívnejší výberom pravdepodobných slov, automaticky sa stáva menej novým.
Matematický vzorec určil hornú hranicu kreativity AI na 0,25 na stupnici od nuly do jednej. Táto hodnota nastáva, keď sú efektívnosť a novosť vyvážené na strednej úrovni. To naznačuje, že rozsiahle jazykové modely nemôžu maximalizovať obe premenné súčasne, čo im bráni dosiahnuť vysoké skóre, aké dosahujú ľudskí tvorcovia.
Výskumník porovnal limit 0,25 s údajmi o ľudskej kreativite a zistil, že zodpovedá hranici medzi „malou-c“ kreativitou (amatérska úroveň) a „Pro-c“ kreativitou (profesionálna úroveň).
To naznačuje, že generatívna AI môže presvedčivo replikovať prácu priemerného človeka, ale nedosahuje úroveň expertov. Reálne testy ukazujú, že AI-generované príbehy a riešenia sa konzistentne umiestňujú v 40. až 50. percentile v porovnaní s ľudskými výstupmi.
„Hoci AI dokáže napodobňovať kreatívne správanie, jej skutočná kreatívna kapacita je obmedzená na úroveň priemerného človeka a nikdy nedosiahne profesionálne štandardy,“ vysvetlil Cropley. „Mnohí si myslia, že ChatGPT je kreatívny, pretože generuje príbehy, básne alebo obrázky. Ale generovanie nie je to isté ako byť kreatívny.“
Štúdia zdôrazňuje, že ľudská kreativita nie je rovnomerne rozložená. Profesionáli rýchlo rozpoznajú šablónovitú povahu AI obsahu. Matematický strop zabezpečuje, že softvér môže byť užitočným nástrojom pre bežné úlohy, ale nemôže autonómne generovať transformatívne nápady, ktoré definujú profesionálnu kreatívnu prácu.
Teória má obmedzenia. Model používa lineárnu aproximáciu na definovanie novosti ako inverzie efektívnosti. Štúdia tiež predpokladá štandardný režim prevádzky modelov a nezohľadňuje všetky variácie v stratégiách podnetov.
Budúci výskum môže skúmať, ako rôzne nastavenia teploty (parametre, ktoré riadia náhodnosť odpovedí AI) môžu umožniť malé výkyvy v tomto strope kreativity. Skúmať sa môže aj to, či by techniky posilňovacieho učenia mohli viac zamerať na novosť bez obetovania súdržnosti.
„Aby AI dosiahla expertnú úroveň kreativity, vyžadovala by si novú architektúru schopnú generovať nápady, ktoré nie sú viazané na minulé štatistické vzorce,“ uzavrel Cropley.