Dissertação

{en_GB=Selection of Sustainable Dividend Stocks Combining XGBoost with Genetic Algorithm} {} EVALUATED

{pt=Esta tese introduz uma abordagem que combina XGBoost com o Algoritmo Genético num sistema com o objectivo de selecionar ações geradoras de dividendos do índice S&P500, identificando aquelas com maior sustentabilidade no crescimento dos dividendos regulares e evitando aquelas cujos pagamentos podem ser interrompidos a curto prazo. A implementação proposta define anualmente janelas de treino-teste, em que o algoritmo XGBoost é utilizado para aprender e classificar se empresas na amostra irão manter o aumento dos dividendos no ano seguinte, com base em observações financeiras trimestrais. Em cada janela, o algoritmo usa o modelo para classificar um ano de observações, usando as probabilidades geradas para ordenar as empresas em termos de sustentabilidade. O Algoritmo Genético é usado em cada período como método de optimização dos parâmetros do XGBoost, de acordo com a performance num período de validação, com base nas métricas ROC e PR AUC. Os rankings gerados são atualizados anualmente gerando novos modelos e combinando as probabilidades geradas com as anteriores. Os resultados foram avaliados analisando a performance das ações escolhidas no ano seguinte aos rankings serem gerados, usando um ou múltiplos modelos para ordenar e selecionar ações. Para os períodos de teste, os melhores resultados mostram que o sistema é capaz de escolher até metade das ações de dividendos listadas, evitando acima de 80% daquelas com dividendos insustentáveis. Adicionalmente, as ações mais pontuadas geraram consistentemente retornos totais superiores aos do indíce S&P500. , en=This work presents an approach which combines XGBoost with Genetic Algorithm (GA) to create a novel dividend stock selection system, capable of identifying the safest dividend growth stocks and avoid dividend cuts, using real regularly updated financial data of firms with ongoing dividend streaks from the S&P500. The proposed implementation defines new training windows yearly, on which XGBoost learns to classify how likely it is that a company ends their dividend streak in the space of one year, based on quarterly observations. The probability scores are then used to rank the companies under evaluation. For each window, the GA is used to find the best set of hyperparameters, based on the performance on a defined validation period of observations, in terms of ROC and PR AUC scoring. The system is able to yearly update the rankings and stock selections by generating new models and combining the classification scores with prior ones, in a sliding window fashion. The results were evaluated by analyzing the performance of the top ranking stocks in the year following scoring, using one or several combined models to generate scores. For 2019, the system was able to select as much as one half of S&P500 stocks defined as having ongoing dividend streaks, while avoiding more than 80% of the companies with unsustainable dividends. Furthermore, the top performing stocks consistently generated annual total returns that outperformed those of the S&P500.}
{pt=Dividendos, Política de Dividendos, XGBoost, Algoritmo Genético, Análise Fundamental, S&P500, en=Dividend Investing, Dividend Policy, XGBoost, Genetic Algorithm, Fundamental Analysis, S&P500}

Janeiro 15, 2021, 9:0

Orientação

ORIENTADOR

Rui Fuentecilla Maia Ferreira Neves

Departamento de Engenharia Electrotécnica e de Computadores (DEEC)

Professor Auxiliar