Dissertação

{en_GB=Statistical Models and Machine Learning Algorithms to Forecast Future Prices in the Stock Market} {} EVALUATED

{pt=Os preços de ações podem ser interpretados como séries temporais que podem ser previstas, de forma a melhorar os resultados para um investidor. Vários métodos encontram-se em desenvolvimento com o objetivo de obter uma previsão mais precisa. A previsão de uma série temporal é um problema de regressão, visto ser uma variável contínua que é prevista. A presente dissertação aplica um método estatístico, ARIMA, e dois de machine learning, K-Nearest Neighbors (KNN) e Support Vector Regression (SVR), com vista a prever o preço das ações. O presente trabalho apresenta previsões diárias, semanais e mensais, fazendo uso de ações com diferentes características. Os três modelos estudados são comparados em cada uma das situações referidas, considerando o erro das previsões, os retornos de uma estratégia simples e ainda o risco e precisão da estratégia. Os dados utilizados para o período de treino correspondem a 4 anos de uma ação com uma tendência clara e outra ação com tendência lateral. O período de teste corresponde a 1 ano das mesmas ações. O melhor resultado foi obtido com o ARIMA numa previsão mensal, alcançando retornos de 40% e uma precisão de 90.9%. Os algoritmos KNN e SVR demonstraram ser mais precisos em ações de tendência lateral, sendo as soluções destes superiores às soluções obtidas com o ARIMA. Ambas as abordagens de machine learning beneficiam da introdução de um retreino durante o período de teste, tendo em alguns casos decrescido o erro em 10 vezes., en=Stock prices can be interpreted as time series that can be forecasted in order to improve the returns of a trader. Several methods including statistics and artificial intelligence are being developed in order to turn this prediction more accurate and reliable. Forecasting a time series is a regression problem since it is a continuous variable that is being forecasted. This thesis applies a statistical method, ARIMA, and two machine learning models, K-Nearest Neighbors and Support Vector Regression, in order to forecast future stock prices. The presented work shows predictions in a daily, weekly, and monthly range using different stocks with different characteristics. The three studied models are compared in each of these situations considering the error of the forecasted values, the returns of a strategy that relies on these predictions and the risk and accuracy of that strategy. The data sets that were used for the training period correspond to 4 years of data of a clear trend stock and a sideways stock in order to present data with different characteristics. The test period corresponds to 1 year of the same stocks. The best result obtained was by the ARIMA model in a monthly forecast, reaching returns of 40% and an accuracy of 90.9%. The K-Nearest Neighbors and Support Vector Regression algorithms are more precise in a sideways stock being superior to the ARIMA solution. Both machine learning approaches benefit from the introduction of a retraining during the test period, in some cases decreasing the error in 10 times.}
{pt=Séries Temporais, Análise Preditiva, Stock Market, ARIMA, K-Nearest Neighbors, Support Vector Regression, en=Time Series, Forecast, Stock Market, ARIMA, K-Nearest Neighbors, Support Vector Regression}

Junho 29, 2018, 14:0

Orientação

ORIENTADOR

Rui Fuentecilla Maia Ferreira Neves

Departamento de Engenharia Electrotécnica e de Computadores (DEEC)

Professor Auxiliar

ORIENTADOR

Nuno Cavaco Gomes Horta

Departamento de Engenharia Electrotécnica e de Computadores (DEEC)

Professor Associado