Hlboké neurónové siete a predikcia akciového trhu: Realita alebo mýtus?

Výskumníci testovali schopnosti transformátorov a CNN, dvoch populárnych typov neurónových sietí, pri predpovedaní pohybov cien akcií. Zistili, že aj napriek pokročilým algoritmom zostáva presná predikcia akciového trhu náročná kvôli jeho inherentnej nestabilite a vplyvu externých faktorov.

Hlboké neurónové siete a predikcia akciového trhu: Realita alebo mýtus?
Zdroj: springernature.com
Nová štúdia skúma využitie pokročilých modelov hlbokého učenia, ako sú transformery a konvolučné neurónové siete (CNN), na predikciu trendov na akciovom trhu. Prináša tento prístup prelom, alebo zostáva len v teoretickej rovine?

Snaha o predikciu správania akciového trhu je stará ako samotný trh. S nástupom umelej inteligencie sa objavili nové možnosti, no zároveň aj otázky o ich reálnej aplikovateľnosti. Táto štúdia sa zameriava na využitie transformátorov, modelov známych z oblasti spracovania prirodzeného jazyka (napr. ChatGPT), a CNN, ktoré sa osvedčili pri rozpoznávaní obrazcov, na analýzu a predikciu vývoja cien akcií.

Transformátory, na rozdiel od starších LSTM modelov, si pamätajú celú sekvenciu dát, čím eliminujú problém „zabúdania“. Ich výpočtová náročnosť je síce vyššia, no paralelná architektúra umožňuje rýchlejšie spracovanie. CNN zasa profitujú z ich schopnosti identifikovať vzory v historických dátach, čo je základný princíp analýzy grafov.

Problémom však zostáva nestabilita akciového trhu a vplyv mnohých externých faktorov, ktoré je ťažké predvídať. Preto štúdia navrhuje predikovať skôr extrapoláciu cenovej série, než presnú cenu. Tento prístup umožňuje lepšie riadenie požadovanej presnosti modelu a zohľadňuje rastúcu neistotu v dlhšom časovom horizonte. Extrapolačné termíny sú navrhnuté tak, aby postupne mizli s časom.

Komentár redakcie: Hoci štúdia prináša zaujímavý pohľad na využitie pokročilých modelov AI na predikciu akciového trhu, komentáre na Reddite poukazujú na dôležité obmedzenia. Používatelia zdôrazňujú nestabilitu trhu a fakt, že historické dáta nemusia byť spoľahlivým indikátorom budúceho vývoja. Napriek rýchlemu vývoju AI, predikcia akciového trhu zostáva komplexnou výzvou.

Modely pracujú s piatimi základnými parametrami: záverečná cena, počet obchodovaných akcií, objem obchodov, najvyššia a najnižšia cena dňa. Na vstupe sa dáta pretransformujú cez plne prepojené vrstvy a následne spracujú pomocou viacvrstvovej pozornosti. CNN model využíva konvolučné vrstvy na extrakciu relevantných prvkov z dát.

Pri optimalizácii modelov sa používa Adam optimizer a minimalizuje sa stredná štvorcová chyba (MSE). Dôležitým zistením je, že modely majú tendenciu preučiť sa (overfit) na dátach akciového trhu, čo je spôsobené ich čiastočne náhodnou povahou. Tento problém sa dá zmierniť použitím väčšieho množstva akcií pri trénovaní modelu (odporúča sa viac ako 1000).

Dáta použité v štúdii pochádzajú z pražskej burzy (TSE) a sú rozdelené chronologicky na trénovaciu (70%) a testovaciu (30%) množinu. Cieľom tohto prísneho oddelenia je zabezpečiť, aby model neinterpoloval dáta a jeho výkon bol nezávislý od ekonomických a sezónnych faktorov.