Dissertação

{en_GB=A sequential approach in forecasting the S&P500 index: Combining Genetic Algorithm and Random Forests} {} CONFIRMED

{pt=Esta tese propõe investigar a previsibilidade do índice S&P500. Com base no comportamento previsto, temos como objetivo formar uma estratégia de trading rentável, obtendo lucros diários com um baixo risco de investimento associado. O sistema sugerido usa uma nova abordagem baseada no combinação de dois algoritmos, o GA, e, em seguida, um algoritmo de Aprendizagem Automática, o RAF. Como input do sistema são usados, juntamente com um conjunto de indicadores técnicos, preços e volume diários. Primeiramente, será feita uma abordagem recorrendo aos GA onde serão selecionados os parâmetros usados na computação dos indicadores técnicos. Do grupo inicial de indicadores técnicos serão, eleitos os indicadores que conseguirem extrair informação útil dos dados financeiros, reduzindo a dimensão do grupo inicial, mas preservando a essência dos dados. Posteriormente, será formada uma RAF que fará uma previsão do comportamento do mercado, que será avaliada para que o investidor adopte a melhor posição de mercado. Por fim, será realizada uma avaliação. A solução proposta é testada com dados diários de cinco mercados financeiros com características inerentes distintas. Quatro funções de fitness foram usadas para avaliar a performance das diferentes soluções encontradas e os melhores resultados são produzidos por estratégias baseadas no uso de uma função de fitness que mede o rácio entre taxa de retorno e o risco do investimento obtido pelo sinal de transações gerado. Os resultados obtidos demostram que esta abordagem obtém melhores resultados do que os obtidos pela estratégia de B&H na maioria dos mercados testados., en=In this thesis we propose to investigate the predictability of the S&P500 index. Based on the forecasted behaviour, we aim at establishing a profitable trading strategy, achieving daily profits with low risk associated. The suggested system uses a novel approach based on the ensemble of a feature selection method, a GA, with a ML algorithm, more precisely, a RAF learner. This system uses daily prices and volume together with an user's specific set of technical indicators as input. Firstly, a GA approach will be used to select the technical indicators' computation parameters and to elect from the initial group of technical indicators those which will retrieve useful information from historical stock data, thus reducing the number of features but still preserving the stock data's fundamentals. Then, through the usage of the selected technical indicators coupled with the daily stock information, a RAF learner will try to emit a forecast of the market's behaviour, which will be evaluated so that the trader can endorse a wise market position. At last an evaluation is carried to understand if the objectives can be fulfilled. The proposed approach is tested with daily data from five financial markets with different inherent characteristics. Four different fitness functions are used to evaluate the performance of different possible solutions and the most robust results are produced by a fitness function that measures the risk return ratio. The results achieved show that this approach outperforms the B&H strategy in the majority of the tested markets.}
{pt=Previsão dos Mercados Financeiros, Algoritmo de aprendizagem, Aprendizagem conjunta, Hipótese dos Mercados Eficientes, Algoritmos Genéticos, Random Forest, en=Stock Market Forecast, Learning algorithm, Ensemble learning, Efficient Market Hypothesis, Genetic Algorithm, Random Forests}

Novembro 2, 2018, 18:0

Orientação

ORIENTADOR

Rui Fuentecilla Maia Ferreira Neves

Departamento de Engenharia Electrotécnica e de Computadores (DEEC)

Professor Auxiliar

ORIENTADOR

Nuno Cavaco Gomes Horta

Departamento de Engenharia Electrotécnica e de Computadores (DEEC)

Professor Associado