Dissertação

Explaining Multi-Omics Generative Models for Drug and Biomarker Discovery EVALUATED

A integração de dados multi-ómicos é essencial para uma compreensão integral dos sistemas biológicos, mas a heterogeneidade e grande dimensionalidade destes dados constituem um desafio para uma integração eficaz. O modelo Multi-Omic Synthetic Augmentation (MOSA), um novo autoencoder variacional, foi introduzido para enfrentar este problema ao integrar vários conjuntos de dados ómicos fornecidos pelo Cancer Dependency Map (DepMap). No entanto, a sua complexidade gera uma falta de transparência e explicabilidade, o que limita a interpretabilidade das previsões e dificulta a sua aplicação na saúde. Deste modo, aplicámos técnicas de explicabilidade para interpretar o MOSA e melhorámos a sua interpretabilidade com disentanglement learning. Os resultados mostraram que incluir disentanglement learning no treino do MOSA melhorou a relevância biológica e interpretabilidade do espaço latente, ao reduzir a redundância entre as variáveis latentes. Isto deu origem a representações latentes mais relevantes do ponto de vista biológico, com certas variáveis latentes a exibirem correlações mais fortes com marcadores biológicos importantes. A aplicação de SHapley Additive exPlanations (SHAP) para interpretar o MOSA revelou a importância de variáveis multi-ómicas na formação de clusters no espaço latente e na previsão de resposta a medicamentos. O disentanglement learning aumentou a relevância das variáveis identificadas ao destacar biomarcadores reconhecidos na investigação do cancro. Dada a sua capacidade única de integrar todos os conjuntos de dados do DepMap, aliado à sua interpretabilidade e relevância biológica melhoradas, o MOSA tem grande potencial para contribuir para a investigação do cancro, facilitando a identificação de novos biomarcadores e alvos terapêuticos.
Aprendizagem Não Supervisionada, Autoencoder Variacional, Disentanglement Learning, Explicabilidade, SHAP, Integração Multi-ómica

novembro 26, 2024, 15:0

Documentos da dissertação ainda não disponíveis publicamente

Orientação

ORIENTADOR

Emanuel José Vieira Gonçalves

Departamento de Engenharia Informática (DEI)

Professor Auxiliar

ORIENTADOR

Maria Inês Camarate de Campos Lynce de Faria

Departamento de Engenharia Informática (DEI)

Professor Catedrático