Dissertação

Feature Engineering: Techniques and Applications EVALUATED

Machine Learning é um conceito em crescente evolução na sociedade atual. Na última década, os sistemas baseados em Machine Learning tornaram-se parte do quotidiano da população e a sua aplicação tem vindo a disseminar-se por diversos setores. Este crescimento é suportado pelo aumento exponencial da quantidade de dados gerados a nível mundial, tendo em conta que os dados são um recurso crítico em qualquer sistema de Machine Learning. A diversificação de fontes e o grande volume de informação resultam na obtenção de dados muito heterogéneos e de difícil interpretação para uma máquina. Feature Engineering surge, assim, como um processo chave para os sistemas de Machine Learning, com o propósito de limpar, transformar e consolidar dados em inputs adequados para os algoritmos. O presente trabalho pretende explorar o processo de Feature Engineering, com vista a colmatar uma lacuna identificada na literatura científica – a inexistência de uma base de suporte à sua implementação. Por conseguinte, é proposta uma pipeline de técnicas de Feature Engineering em paralelo com a taxonomia que lhes está subjacente, juntamente com um conjunto de scripts, desenvolvidos na linguagem R, para as implementar. A validade prática do código é, posteriormente, demonstrada através da aplicação dos scripts a um conjunto de dados reais.
Ciência de Dados, Machine Learning, Engenharia de Dados, Engenharia de Atributos, Transformação de Dados

junho 26, 2023, 16:30

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

Luís Manuel Pereira Sales Cavique Santos

Universidade Aberta

Professor Auxiliar