Dissertação

Optimization of Machine Learning Jobs in the Cloud EVALUATED

Para a otimização de sistemas de aprendizagem automática com datasets muito grandes e uma larga quantidade de hiper-parâmetros, a maioria de utilizadores recorre à computação em nuvem para conseguir proceder à sua otimização, facilitando a sua acessibilidade. Para fazer isto, os utilizadores enfrentam a barreira de escolher quais são os parâmetros de configuração na nuvem, para conseguirem executar os seus algoritmos de aprendizagem automática, o que pode ser bastante difícil devido à enorme escolha de configurações possíveis, dado que uma escolha errada destes parâmetros irá traduzir-se em custos elevados. Recentes sistemas de estado da arte têm optado por uma aproximação de otimização de ambos parâmetros de aprendizagem automática e de computação em nuvem, com o objetivo de minimizar custos relacionados enquanto se obtêm a melhor configuração de hiper-parâmetros para o específico algoritmo. Este processo de otimização também requer a exploração de muitas configurações e impõe grandes gastos económicos. Por esta razão é crucial que o algoritmo de otimização seja eficiente a nível de tempo, convergindo para a configuração ótima da forma mais rápida possivél. Esta dissertação propõe Hydra, um sistema que procede à otimização de sistemas de aprendizagem automática, melhorando desvantagens dos sistemas estado-da-arte integrados ao rapidamente convergir em direção à solução ótima sem perder tempo em treinar o modelo, usando muitas configurações de baixo custo enquanto aplica técnicas de transferência de conhecimento para melhorar o desempenho do modelo e, ultimamente a reduzir o custo final por 35%.
Sistemas de Aprendizagem Automática, Computação em Nuvem

janeiro 28, 2021, 13:0

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

Paolo Romano

Departamento de Engenharia Informática (DEI)

Professor Associado