Dissertação

{pt=Unravelling regulatory modules in Amyotrophic Lateral Sclerosis} {} EVALUATED

{pt=A esclerose lateral amiotrófica é uma doença de efeitos devastadores cuja patogénese não é totalmente conhecida, ainda que existam evidências de contribuição genética. Neste trabalho foram utilizadas duas diferentes abordagens para o tratamento de dados transcriptómicos adquiridos com a tecnologia de microarray para casos esporádicos desta doença. O objectivo principal prendia-se à potencial descoberta de vias biológicas e genes perturbados nesta condição relativamente ao padrão saudável. Primeiro, técnicas não supervisionadas, o clustering hierárquico e o algoritmo de k-means, foram utilizadas para agrupar tanto as diferentes amostras como os genes. Seguidamente, um método para a construção de redes de regulação genética foi aplicado a este conjunto de dados para determinar módulos de genes correlacionados, o Weighted Gene Co-expression Network Analysis (WGCNA). No processo de determinação destes módulos foram integrados conceitos da literatura de redes complexas. Para melhor comparar os diferentes métodos, realizou-se uma sobreposição de todos os resultados seguida de enriquecimento funcional com a Gene Ontology e a KEGG. Em todos os métodos foram identificados grupos de genes interessantes com a presença de funções potencialmente relevantes no estudo desta doença que devem ser analisados com mais detalhe em trabalhos futuros. Finalmente, é sugerido comparar estes procedimentos utilizando um conjunto de dados com maior número de amostras. , en=Amyothrophic Lateral Sceloris (ALS) is a devastating disease, whose pathogenesis is still not fully understood. In the literature, evidence regarding the genetic framework of disease abounds. In the present work, two different approaches are combined in an attempt to unravel novel disturbed biological pathways in sporadic cases of ALS. First, standard unsuper vised data mining techniques are employed to samples and genes: hierarchical clustering and K-Means clustering. Then, the Weighted Gene Co-expression Analysis based on network concepts is used to obtain modules of highly correlated genes. Several network concepts are integrated to guide the algorithm and assist the selection of the more cohesive modules. The purpose of using both procedures is to identify genes involved in abnormal biological processes. Toward this end, an overlap study of the resulting clusters and modules was performed. This procedure was followed by functional enrichment with Gene Ontology and KEGG terms. With both approaches significant groups of genes were identified, which should be analysed in depth as future work. The application of WGCNA provided a more straightforward identification of enriched modules. However, clustering techniques also led to results with high correlation with the disease. As a future work, it is suggested to compare these different approaches and to improve the confidence of the results, a larger dataset should be considered. }
{pt=Esclerose Lateral Amiotrófica, Clustering, WGCNA, Redes de Regulação Genética, Transcriptoma, en=Amyotrophic Lateral Sclerosis, Clustering, WGCNA, Regulatory Gene Networks, Transcriptomics}

novembro 21, 2012, 11:0

Publicação

Obra sujeita a Direitos de Autor

Orientação

CO-ORIENTADOR

Alexandre Paulo Lourenço Francisco

Departamento de Engenharia Informática (DEI)

Professor Auxiliar

ORIENTADOR

Sara Alexandra Cordeiro Madeira

Departamento de Engenharia Informática (DEI)

Professor Auxiliar