Dissertação

{en_GB=Data Resampling for Cryptocurrency Investment with Ensemble of Machine Learning Algorithms} {} EVALUATED

{pt=Neste trabalho é proposto um sistema baseado em aprendizagem automática que visa criar um sinal de transações capaz de efetuar trocas no mercado de câmbio das criptomoedas com lucros elevados mas mínimo risco associado. Para tal, os dados financeiros originais são reamostrados de modo a conceber uma série temporal mais favorecedora a originar retornos elevados. Os resultados obtidos por reamostragens alternativas são comparados aos obtidos pela comum amostragem em ordem ao tempo. Estes métodos reamostram a série temporal original de acordo com variação de preço. Isto é, as amostras originais são agrupadas quando o valor de encerramento ultrapassa uma variação pré-estabelecida de moeda cotada. Este sistema foi testado com variações percentuais, valor logarítmico e valor simples. Através da série reamostrada, é calculado um conjunto de indicadores técnicos enviado como input para quatro algoritmos de aprendizagem automática: Regressão Logística, Floresta Aleatória, Classificador de Vetores de Suporte e Gradient Tree Boosting. Cada um destes algoritmos é responsável por gerar um sinal de transação. Após isto, uma média sem pesos dos quatro sinais é calculada, no total, são testados cinco sinais de transação diferentes. Este trabalho demonstra que todos os algoritmos aplicados conseguem obter melhores resultados que uma estratégia Buy and Hold (B&H) na generalidade dos 100 mercados testados. A média sem pesos, no entanto, obteve em média os melhores resultados, nomeadamente precisões de até 59.26% para a reamostragem em ordem ao tempo. Por fim, conclui-se que os métodos de reamostragem alternativos geram retornos muito superiores que a reamostragem temporal., en=This work proposes a system based on machine learning aimed at creating an investment strategy capable of trading on the volatile cryptocurrency exchange markets with the highest returns and lowest risk. With the former goal in mind, several methods are employed for resampling the original financial data into a time series more prone of obtaining higher returns and the final results are compared to the obtained with commonly utilized time sampled series. These methods resample the original financial time series according to price action rather than a fixed time period. Simply put, the original samples are grouped as the closing value surpasses a threshold variation of quote currency. Three experimental thresholds were analysed: percentual value, fixed amount and fixed logarithmic amount. From the resampled series, a set of technical indicators are calculated and fed as input to the following four machine learning algorithms: Logistic Regression, Random Forest, Support Vector Classifier, and Gradient Tree Boosting. Each of these algorithms is responsible for generating a transaction signal. Afterwards, a simple unweighted average of the signals from these four algorithms is employed as well to improve on their results. This work demonstrates that all learning algorithms outperform the Buy and Hold (B&H) strategy in the overwhelming majority of the 100 markets tested. Nevertheless, the unweighted average obtains the best overall results, namely accuracies up to 59.26% for time resampled series. Additionally, it is concluded that the three alternative resampling methods are capable of generating far greater returns relatively to time resampled data.}
{pt=Mercados Financeiros, Criptomoedas, Análise Técnica, Aprendizagem Automática, Votação por Combinação, Reamostragem de Dados Financeiros., en=Financial Markets, Cryptocurrencies, Technical Analysis, Machine Learning, Ensemble Classification, Financial Data Resampling.}

Junho 28, 2019, 15:30

Orientação

ORIENTADOR

Rui Fuentecilla Maia Ferreira Neves

Departamento de Engenharia Electrotécnica e de Computadores (DEEC)

Professor Auxiliar