Dissertação
Deep Learning Model using trained SNP vector representations for High Order Epistasis Detection EVALUATED
Em estudos de associação de genoma completo (GWAS), que investigam a relação entre genótipo e fenótipo, Polimorfismos de Nucleotídeo Único (SNP) são um dos biomarcadores mais utilizados. Neste tipo de análise, a epistasia, fenómeno em que o efeito dos SNPs no fenótipo é condicionado pela presença de outros SNPs, deve ser considerado em doenças complexas. Detetar efeitos da interação SNP-SNP em relação ao fenótipo através da aplicação de testes estatísticos de forma exaustiva tem alta carga computacional devido ao número de combinações possíveis, especialmente para interações de ordem superior. Portanto, os pesquisadores propuseram uma ampla variedade de métodos baseados em “machine learning”, técnicas heurísticas ou estocásticas, bem como métodos de filtragem. Esta tese propõe uma rede neural de aprendizagem profunda que usa uma “embedding layer” para representar as informações dos SNPs como vetores e uma “layer de atenção” responsável por produzir um vetor que atua como um filtro da importância dos SNPs. A informação da “camada de atenção” é usada pelo modelo proposto para filtrar e reduzir com precisão suficiente o número inicial de SNPs para um conjunto muito menor no qual testes exaustivos de combinações podem ser aplicados. O modelo proposto é comparado com vários métodos de última geração usando dados simulados com padrões de epistasia formados por 2, 3 e 4 SNPs, onde superou os resultados da maioria dos outros métodos na maioria dos dados simulados e provou ser um método promissor não exaustivo na detecção de interações de ordem superior com e sem efeitos marginais.
novembro 16, 2022, 18:0
Publicação
Obra sujeita a Direitos de Autor
Orientação
ORIENTADOR
Departamento de Engenharia Electrotécnica e de Computadores (DEEC)
Professor Auxiliar