Dissertação
Deep learning on chaos game representation of genetic sequences EVALUATED
Esta dissertação explora a aplicação de técnicas de aprendizagem profunda à representação CGR de sequências genéticas, com um foco especial na classificação de genomas virais. O trabalho desenvolvido analisa as capacidades das técnicas de aprendizagem profunda em extrair características das imagens para o desenvolvimento de um modelo preciso de classificação de genomas virais. Os objetivos desta dissertação são rever e a avaliar o estado da arte relativo à aplicação de técnicas de aprendizagem profunda a representações CGR para a análise de dados genómicos e propor e avaliar um classificador de genomas virais baseado numa CNN, utilizando o CGR como técnica de mapeamento. Esta abordagem é aplicada em duas experiências: na subtipagem dos vírus do HPV, Dengue e Influenza, e na taxonomia do vírus associado à doença COVID-19. As principais contribuições deste trabalho são o desenvolvimento de um classificador de genomas virais eficiente e preciso que consegue bons resultados em ambas as experiências. Este trabalho explora como a utilização de diferentes comprimentos das sequências usados para gerar o CGR afetam o desempenho do classificador, investigando assim o conceito de assinatura genómica. Além disso, também se explora como a utilização de comprimentos diferentes dos k-mer afeta o classificador no caso da representação FCGR. Em conclusão, este trabalho aprofunda a aplicação de técnicas de aprendizagem profunda para análise de informação genética e também estabelece uma abordagem robusta para a classificação de genomas virais, o que é crucial para avanços na investigação médica e em políticas de saúde públicas.
junho 21, 2024, 14:0
Documentos da dissertação ainda não disponíveis publicamente
Orientação
ORIENTADOR
Susana de Almeida Mendes Vinga Martins
Departamento de Engenharia Informática (DEI)
Professor Associado
ORIENTADOR
Arlindo Manuel Limede de Oliveira
Departamento de Engenharia Informática (DEI)
Professor Catedrático