Dissertação

A Clustering Approach for Bridging Mouse Model Data to Humans EVALUATED

Esta tese tem como objectivo identificar padrões ocultos entre modelos de ratos associados a doenças de diferentes sistemas anatómicos humanos, permitindo às equipas de Investigação Translacional identificar novos biomarcadores, mecanismos ocultos e acelerar os estudos pré-clínicos. Os modelos de rato são, desde há muito tempo, uma fonte de informação imprescindível para a investigação biomédica, proporcionando conhecimentos valiosos sobre a complexidade da biologia humana e das doenças humanas. Procuramos explorar correlações entre doenças distintas através de semelhanças fenotípicas entre os modelos de ratos usados para as estudar, a partir de algoritmos de Clustering, abordando as limitações do estudo e classificação atual de doenças que, de modo geral, negligenciam a natureza interligada de doenças. Ao usar algoritmos de Clustering, pretendemos identificar padrões ocultos nos dados, que permitam estabelecer novas associações entre doenças e identificar biomarcadores relevantes que possam ser traduzidos para humanos. Implementamos dois métodos de Clustering distintos: K-Means e Hierarchical Agglomerative Clustering. Adicionalmente, utilizamos duas técnicas de representação de dados para incorporar a diversidade biológica inerente aos dados fenotípicos: One-Hot Encoding e Contextual Embeddings. Esta abordagem permitiu uma análise detalhada do papel fundamental da representação de dados, assim como dos efeitos da implementação de algoritmos com diferentes níveis de restrição. Como métricas de avaliação, foram utilizadas a Silhouette Score e Distância Média Intra-Cluster. O número de clusters também foi considerado. Os melhores resultados foram obtidos ao utilizar Hierarchical Clustering aplicado ao Contextual Embeddings, o que conduziu a um Silhouette Score de 0.22 e uma Distância Média Intra-Cluster de 0.15.
Modelos de ratos, Aprendizagem não supervisionada, métodos de clustering, semelhança fenotípica, contextual embeddings

novembro 30, 2023, 11:15

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

Ana Catarina Fidalgo Barata

Departamento de Engenharia Electrotécnica e de Computadores (DEEC)

Professor Auxiliar

ORIENTADOR

Aleksandra Polosukhina

IPSEN

Especialista