Dissertação

{en_GB=Portfolio Optimization using a Big Data framework - A passive Management, Spark and Genetic Agorithm approach } {} EVALUATED

{pt=Este trabalho analisa a literatura relativa à gestão de portfólios financeiros e propõe realizar esta tarefa automaticamente. Um modelo de gestão de portfólios – baseado no trabalho seminal de Markowitz–, uma metaheurística para otimização matemática – algoritmo genético – e uma framework de Big Data – Spark – são usados neste sistema para guiar a escolha de ativos. O principal objetivo é desenhar um sistema de gestão de portfólios capaz de usar um algoritmo genético para resolver problemas de otimização de portfólio. Simultaneamente, o sistema é capaz de persistir e processar grandes quantidades de dados. O objetivo secundário é providenciar uma base para testes adicionais de frameworks de Big Data no domínio da gestão de portfólios. A validação da performance computacional foi feita através da análise do impacto de concurrência, processamento iterativo e configurações de memória do Spark no tempo de execução. Esta validação mostrou que o sistema consegue reduzir o tempo de execução através de concurrência, alcançando um speedup superior a 90% entre 1 e 4 cores. Este facto permite concluir que é viável avançar com estudos adicionais em relação à escabilidade em clusters. O sistema também obteve uma performance financeira adequada durante as primeiras duas semanas depois da otimização, tendo melhores resultados que o exchange traded fund SPY que mede o Standard & Poor’s 500, consistentemente, com algumas configurações. Estes ganhos chegam a ser de 2% superiores ao SPY, em termos de return on investment nas primeiras duas semanas após a otimização., en=This work analyzes the literature regarding portfolio management and proposes to perform this task automatically. A portfolio management model – based on the seminal work of Markowitz–, a metaheuristic for mathematical optimization – genetic algorithm – and a Big Data framework – Spark – are used in the system to guide stock selection. The main goal is to design a portfolio management system able to use the extensively studied genetic algorithms to solve a portfolio optimization problem while being capable of storing and processing large datasets. The secondary goal is to provide a basis for further testing of Big Data frameworks in portfolio management. Computer performance validation was done via analyzing the impact of concurrency, iteration processing and Spark memory configurations on runtime. This validation showed that the system can reduce runtime via concurrency – more than 90% latency speedup between 1 and 4 cores – and, thus, it is viable to advance with further studies regarding scalability in clusters. The system also attained adequate financial performance by beating the SPY exchange traded fund consistently, albeit not always the buy and hold strategy, in the first two weeks after optimization. In these two weeks, the solution return on investment gains reached up to 2% above SPY.}
{pt=Markowitz, Big Data, Spark, Algoritmo Genético, Análise Média-Variância, en=Markowitz, Big Data, Spark, Genetic Algorithm, Mean-Variance Analysis}

Dezembro 3, 2018, 15:30

Orientação

ORIENTADOR

Nuno Cavaco Gomes Horta

Departamento de Engenharia Electrotécnica e de Computadores (DEEC)

Professor Auxiliar