Dissertação

Identification of common gene signatures in microarray and RNA-sequencing data using network-based regularization EVALUATED

Um tumor é caracterizado por um crescimento celular anormal devido à disrupção da expressão de alguns genes. Microarranjos e RNA-seq são tecnologias usadas para medir os níveis de expressão génica, permitindo a obtenção de dados que possibilitam inúmeras aplicações como mineração de dados e algoritmos de Aprendizagem Automática (AA) que melhoram o diagnóstico, o prognóstico e a terapia. Apesar destas tecnologias terem o mesmo propósito, existem algumas diferenças fundamentais entre elas. Assim sendo, pretende-se responder a: I) será que as assinaturas genéticas dependem da plataforma usada na aquisição de dados, e se sim como; II) será que beneficiamos da integração de dados. Propõe-se o uso de um método de regularização baseado em redes de correlação,Twiner, como uma estratégia que promove a seleção de assinaturas genéticas em cancro da mama ER+ com um padrão de correlação semelhante entre microarranjos e RNA-seq. O Twiner alcançou resultados na classificação das amostras em tumorais ou normais de 99.07% e 98.64% nos conjuntos de treino e teste, respetivamente, o que é comparável aos da regularização com EN. Para além disso, os biomarcadores identificados eram relevantes para a doença, uma vez que a maioria deles já tinha sido associado à mesma em estudos anteriores. Nesse sentido, podemos beneficiar da quantidade de dados de microarranjos e RNA-seq existente porque a conclusão biológica deduzida é a mesma independentemente da tecnologia usada.
Microarranjos, RNA-sequencing, Aprendizagem Automática, Biomarcadores, Regularização com redes de correlação

Novembro 13, 2019, 11:0

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

Marta Isabel Belchior Lopes

Instituto de Telecomunicações (IT)

Doutora

ORIENTADOR

Susana de Almeida Mendes Vinga Martins

Departamento de Bioengenharia (DBE)

Professor Associado