Dissertação

Bear Market Prediction Using Logistic Regression, Random Forest, and XGBoost EVALUATED

A bolsa de valores é considerado um dos sistemas mais complexos do mundo, composto por muitos segmentos sem um padrão claro definido para as suas variações de preço. Vários fatores influenciam os seus movimentos, e por isso fazer previsões na bolsa de valores, não é considerada uma tarefa fácil. Este trabalho, como uma aplicação na área financeira, tenta prever com uma antecipação de seis e doze meses, três diferentes quedas de preço no indíce americano "Standard & Poor's 500": :(i) -20% ("Bear Markets"), (ii) -17,5% e (iii) -15%. Para isso, foram produzidos e treinados quatro diferentes modelos computacionais baseados em diferentes algoritmos de "Machine Learning" - "Logistic Regression", "Random Forest", "XGBoost" e o conjunto de todos os modelos - e tendo como base os dados históricos de diversas variáveis económicas. Realizaram-se testes desde 1970 até 2019 e foi possível detectar a maioria das grandes quedas no S&P 500, em particular ao detectar os eventos com 12 meses de antecipação. O modelo do "Logistic Regression" superou os restantes, obtendo melhores resultados e detectando as quedas de mercado com mais antecedência. A abordagem de que combina os algoritmos, foi considerada o método mais equilibrado, pois combinava os melhores resultados dos diferentes algoritmos. Com a implementação de um algoritmo genético, também foi possível otimizar os resultados do modelo "XGBoost" para diferentes casos de teste.
"Standard & Poor's 500", "Bear Markets", "Logistic Regression", "Random Forest", "XGBoost", Algoritmo genético

Novembro 21, 2019, 14:30

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

Rui Fuentecilla Maia Ferreira Neves

Departamento de Engenharia Electrotécnica e de Computadores (DEEC)

Professor Auxiliar