Prekvapivé výsledky: Poľština kraľuje v komunikácii s AI, ukazuje výskum
Prekvapivé zistenie! Poľština sa ukázala ako najefektívnejší jazyk pre zadávanie príkazov AI, prekonávajúc aj jazyky s rozsiahlejšími dátovými zdrojmi.
Nová štúdia porovnávala presnosť 26 jazykov pri zadávaní príkazov umelej inteligencii, pričom poľština zvíťazila nad angličtinou a ďalšími.
Content: Varšava 25. októbra (TASR) – Poľština prekvapivo dominovala v nedávnom výskume, ktorý hodnotil presnosť rôznych jazykov pri komunikácii s umelou inteligenciou. Štúdia Marylandskej univerzity v Baltimore a spoločnosti Microsoft, publikovaná ako benchmark OneRuler, odhalila, že poľština je najvhodnejšia na zadávanie príkazov pre rozsiahle jazykové modely (LLM). Varšavský spravodajca TASR informuje na základe denníka Rzeczpospolita.
Štúdia s názvom „One ruler to measure them all: Benchmarking multilingual long-context language models“ (Jedno kritérium pre všetky jazyky: Meranie viacjazyčných modelov s dlhým kontextom) porovnávala 26 jazykov. Poľština dosiahla priemernú úspešnosť 88 percent, čím predstihla francúzštinu, taliančinu a dokonca aj angličtinu, ktorá skončila na šiestom mieste s výsledkom necelých 84 percent. Paradoxom je, že modely AI sa zvyčajne trénujú na najväčšom objeme dát v angličtine a čínštine. Čínština sa však umiestnila až na štvrtom mieste od konca s výsledkom 62 percent.
Výskum sa zameral na sedem typov úloh, rozdelených do kategórií vyhľadávania a agregácie informácií, s kontextami siahajúcimi od 8 000 do 128 000 tokenov. Analýza ukázala, že s rastúcou dĺžkou textu sa zväčšuje rozdiel vo výkonnosti medzi jazykmi s rozsiahlymi zdrojmi, ako sú európske jazyky, a tými s obmedzenými zdrojmi, ako je swahilčina alebo sothčina. Pri najdlhších textoch sa tento rozdiel prehĺbil z 11 na 34 percent.
Napriek relatívne menšiemu množstvu dát, na ktorých sa LLM učia po poľsky, dosahujú v tomto jazyku pozoruhodnú presnosť, menej chýb a lepšie výsledky pri analýze rozsiahlych dokumentov. Autori štúdie zdôrazňujú, že poľština sa ukázala ako ideálny jazyk pre tzv. promptovanie – formulovanie dlhých a komplexných otázok pre umelú inteligenciu.
(spravodajca TASR Slavomír Gregorík)