Dissertação

Reinforcement Learning Applied to Forex Trading EVALUATED

Nesta tese é descrita a implementação de um sistema que efectua transacções automáticas no mercado de moeda com o intuito lucrar com flutuações de cotação com aprendizagem por reforço e redes neuronais. O funcionamento de um sistema de aprendizagem por reforço pode ser resumido em três sinais: uma representação do estado do ambiente dada ao sistema, a acção que este toma nesse estado e uma recompensa por essa acção. Uma rede neuronal é composta por neurónios artificiais interconectados que apesar de simples, como um todo estabelecem uma relação complexa e não-linear entre entradas e saídas. Essa relação pode ser ajustada para diferentes fins num processo de treino com aprendizagem automática. O sistema transaccional concebido consiste numa rede neuronal com três camadas ocultas de 20 neurónios ReLU cada e uma camada de output com 3 neurónios lineares, treinada para funcionar sob o paradigma de aprendizagem por reforço. A rede recebe o estado do mercado, composto por características extraídas do histórico de preços e volumes, e dá como saída o valor Q de cada acção possível nesse estado. Valor Q é uma estimativa, construída no processo de treino, das recompensas que uma acção num dado estado vai acumular no futuro. A escolha da acção com melhor valor Q leva ao maior lucro futuro quando os valores estimados de Q têm qualidade. No mercado EUR/USD desde 2010 a 2017 este sistema obteve em 10 testes com diferentes condições iniciais um lucro total médio de 114.0+-19.6%, ou seja, uma média de 16.3+-2.8% por ano.
Aprendizagem de Máquina, Redes Neuronais, Aprendizagem por Reforço, Q-Learning, Mercado de Moeda

Novembro 9, 2017, 16:0

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

Maria Teresa Haderer de la Peña Stadler

Departamento de Física (DF)

Professor Catedrático

ORIENTADOR

Rui Fuentecilla Maia Ferreira Neves

Departamento de Engenharia Electrotécnica e de Computadores (DEEC)

Professor Auxiliar