Analýza vlivu fundamentálních dat na výkonnost akcií pomocí metod strojového učení

advisor: Ing. Pavel Strachota, Ph.D., Ing. Jiří Šimonek, Ph.D.
e-mail: show e-mail
type: bachelor thesis, master thesis
branch of study: MI_MM, MI_AMSM, MINF, APIN
key words: strojové učení, neuronové sítě, obchodní strategie, fundamentální analýza, Python, TensorFlow, Scikit-Learn
description: Akciové trhy poslední dobou zažívají nebývale bouřlivé období. Do ekonomiky se v rámci vládních podpůrných programů dostává obrovské množství peněz, zvyšuje se inflace a do investování či obchodování s akciemi se pouští mnoho malých investorů, kteří nemají zkušenosti. Řada fondů ovšem dokazuje, že aktivním řízením portfolia, tj. vhodně zvolenými a načasovanými operacemi lze získat výnos, který významně předčí růst trhu. Jejich obchodní strategie jsou přitom založeny v zásadě na dvou principech: technické analýze, která hledá vzory či závislosti výlučně v historickém cenovém vývoji, a fundamentální analýze, která využívá k obchodním rozhodnutím aktuálních i historických údajů z reálné ekonomiky, politiky a obecně života lidské společnosti. Úspěšný obchodník musí nejen mít přístup k fundamentálním datům, ale též umět určit, která data jsou pro jeho obchodní strategii podstatná, a pokud jsou, tak jakým směrem, v jakém časovém horizontu a jak výrazně ovlivňují pohyb cen akcií, s nimiž obchoduje. Tyto otázky se pokusíme zodpovědět v naší práci za pomoci klasických statistických metod (např. PCA) i metod strojového učení (zejména neuronových sítí). Analyzovaná data budou nejprve syntetická, avšak díky spolupráci se subjektem pohybujícím se v oboru lze posléze využít i rozsáhlé databáze reálných historických fundamentálních dat o veřejně obchodovaných společnostech na burze v USA (např. obrat, zisk, výše dluhu, cash-flow, prodeje zboží/služeb atd.) a příslušných dat o ceně akcií. Práce obnáší seznámení s matematickým pozadím i praktickými softwarovými nástroji strojového učení, implementaci modelů a jejich testování. Důležitá bude i kreativita a intuice. Lze například kombinovat více metod, kdy v první fázi se vyloučí silně korelované parametry, a v dalším zpracování se podmnožina původních dat podrobí náročnější analýze s cílem najít univerzální závislosti platné nezávisle na zvoleném časovém období. Téma má potenciál vývoje od bakalářské práce až po práci diplomovou.
references: [1] C. C. Aggarwal - Neural Networks and Deep Learning, Springer, 2018.
[2] T. Hastie, R. Tibshirani, J. Friedman – The Elements of Statistical Learning, Data Mining, Inference, and Prediction. 2nd. ed., Springer-Verlag New York, 2009.
[3] A. C. Müller, S. Guido – Introduction to Machine Learning with Python, A Guide for Data Scientists. O‘Reilly, 2016.
[4] F. Chollet - Deep Learning with Python, Manning Publications Co., 2018.
[5] S. Pattanayak - Pro Deep Learning with TensorFlow, Apress, 2017.
last update: 21.09.2022 13:21:27

administrator for this page: Ľubomíra Dvořáková | last update: 09/12/2011
Trojanova 13, 120 00 Praha 2, tel. +420 770 127 494
Czech Technical Univeristy in Prague | Faculty of Nuclear Sciences and Physical Engineering | Department of Mathematics