Dissertação

{en=Evaluating differential gene expression using RNA-sequencing data: a case study in host-pathogen interaction upon Listeria monocytogenes infection} {} EVALUATED

{pt=Ao contrário do genoma, o transcriptoma é dinâmico e específico para uma dada fase de desenvolvimento e condição fisiológica da célula. O recente desenvolvimento de novos métodos de alto rendimento para a sequenciação do DNA levaram ao surgimento de uma nova metodologia para a sequenciação de RNA em resoluções sem precedentes. Este método é denominado RNA-Seq e tem vindo a emergir como a tecnologia preferida na caracterização e quantificação de transcritos celulares. Propomos uma pipeline que permite a comparação de duas amostras de RNA-Seq, extraindo os processos celulares que estão diferencialmente activos entre ambas as amostras. Subsequente a esta pipeline, propomos uma nova metodologia que inspecciona a activação de uma via celular num conjunto de leituras de RNA-Seq adquiridas ao longo de um curso temporal. Por fim, hipotetizamos uma nova abordagem para reforçar a inferência de genes diferencialmente expressos, utilizando dados publicamente disponíveis. A avaliação de um conjunto de dados de RNA-Seq, obtidos de células infectadas com Listeria monocytogenes, com as ferramentas desenvolvidas foi utilizado para comprovar o seu funcionamento. Avaliando os dados com a pipeline desenvolvida, foi concluído quais os processos celulares que estão diferencialmente activos entre as leituras de RNA-Seq adquiridas de células submetidas a diferentes condições de crescimento. Da mesma forma, confirmou-se que uma rede genética a descrever a resposta celular após infecção com Listeria monocytogenes modela bem os nossos dados. Finalmente os resultados demonstraram que o uso de dados de RNA-Seq públicos não melhora a confiança na inferência de genes diferencialmente expressos. , en=Unlike the genome, the transcriptome is dynamic and specific for a given cell developmental stage or physiological condition. Understanding the cell transcriptome is essential for interpreting the functional elements of the genome. Recent developments of high-throughput DNA sequencing technologies have provided a new method to sequence RNA at unprecedented high resolutions. This method is termed RNA-Seq and has been emerging as the preferred technology for both characterization and quantification of the cell transcripts. We propose a pipeline to compare two RNA-Seq samples. This pipeline permits to obtain biological insight about the analysed samples by extracting the cellular processes that are differentially active on both samples. Additionally we propose a novel methodology to inspect the activation of a given cellular pathway in a time-course RNA-Seq dataset. Finally, we hypothesise a novel approach to statistically reinforce the inference of differentially expressed genes using publicly available RNA-Seq datasets. The evaluation of a Listeria monocytogenes RNA-Seq dataset with the developed tools testified its proper functioning. Employing the RNA-Seq analysis pipeline, it was concluded which cell processes were differentially active between a set of trancriptomes acquired from cells with different growth environments. In the same way, taking advantage of published genes interactions upon infection with Listeria monocytogenes, it was confirmed the existence of these connections on our dataset. Finally, it was tested if public RNA-Seq data could be used to improve the statistical confidence on the inference of differentially expressed genes. The results prove that this methodology is not reliable. }
{pt=RNA-Sequencing, expressão genética, rede de genes, pipeline para a análise de RNA-Seq, validação de RNA-Seq, Listeria monocytogenes., en=RNA-Sequencing, gene expression, gene networks, RNA-Seq analysis pipeline, RNA-Seq validation, Listeria monocytogenes.}

dezembro 2, 2013, 14:0

Publicação

Obra sujeita a Direitos de Autor

Orientação

CO-ORIENTADOR

Luís Pedro Coelho

Instituto de Medicina Molecular (IMM) & European Molecular Biology Laboratory (EMBL)

Doutor

ORIENTADOR

Ana Teresa Correia de Freitas

Departamento de Engenharia Informática (DEI)

Professor Associado