Dissertação

Clustering with Missing Values: a deep learning approach EVALUATED

O foco desta dissertação é o uso de modelos de deep clustering, cuja pesquisa tem vindo a crescer nos últimos anos devido à sua versatilidade em vários campos da ciência. O objetivo principal foi em torno do problema de clustering de dados ausentes usando deep clustering, um problema comum em dados do mundo real, como no caso do estudo de padrões de progressão em doenças neurodegenerativas, onde valores ausentes ocorrem frequentemente. Após explorar as técnicas do estado da arte, concluiu-se que a existência de dados ausentes é um obstáculo à robustez de algumas das melhores metodologias existentes de clustering, uma vez que são muitas vezes desenvolvidas e testadas com dados limpos. Foi também perceptível que as arquiteturas de aprendizagem profunda com a capacidade de trabalhar com dados ausentes, focam-se tipicamente em tarefas de classificação. Com isto em mente, o tópico de clustering com dados ausentes foi explorado para encontrar a melhor solução, estudando diferentes arquiteturas de base que potencialmente poderiam lidar com dados ausentes, e a maior contribuição, a introdução de uma variante de VAE capaz de lidar melhor com dados ausentes. As principais contribuições deste trabalho são: 1) Oferecer uma nova abordagem de deep clustering capaz de lidar com dados ausentes, 2) Uma solução simples, mas eficaz para uma maior robustez ao lidar com dados ausentes, oferecendo resultados semelhantes aos dados completos, 3) Detecção automática de clusters, 4) Arquiteturas dinâmicas dependentes de dados.
Aprendizagem profunda, Agrupamento, Dados Ausentes, Variational Autoencoders, UMAP, HDBSCAN

junho 23, 2022, 18:0

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

Pedro Filipe Zeferino Tomás

Departamento de Engenharia Electrotécnica e de Computadores (DEEC)

Professor Associado

ORIENTADOR

Helena Isabel Aidos Lopes

Instituto de Telecomunicações - IST

Investigador