Dissertação

{en=A system for automated genome annotation} {} EVALUATED

{pt=O Eucalyptus globulus é uma árvore utilizada na produção de pasta de papel. Com o objectivo de estudar os genes responsáveis pela formação de madeira do E. globulus, que ainda não são totalmente compreendidos mas sabe-se que tem um impacto na qualidade da pasta papel, surgiu o projecto GenEglobwq. Um dos objectivos deste projecto é a criação de um módulo de anotação de sequências de ADN. Neste sentido, o objectivo desta tese consistiu em estender o sistema de informação, GEDI, utilizado para gerir os dados do projecto GenEglobwq, a fim de fornecer uma ferramenta para a anotação automática de genomas. Para isso, foi criado um módulo de anotação no sistema GEDI, que faz uso de uma pipeline de anotação automática MAKER, que permite a anotação de qualquer tipo de organismo. Uma das possíveis formas de anotar um genoma é através do uso de marcadores, que permite identificar zonas específicas do genoma. Deste modo, foi também criado um módulo de marcadores para gerir este tipo de dados. De modo a testar o funcionamento do módulo de anotação automática, anotou-se os genomas dos cloroplastos do Eucalyptus globulus e Eucalyptus grandis. No entanto, como qualquer outra ferramenta de anotação automática, não foram anotados todos os genes, sendo posteriormente necessária uma curação manual dos resultados., en=Eucalyptus globulus is a tree used to produce paper pulp. With the aim to study the genes responsible for wood formation in E. globulus, which are not yet fully understood although known to have an impact on the quality of paper pulp, GenEglobwq project was defined. One of the project goals is the development of an annotation module, to automatically annotate the gene sequences obtained. Therefore, the aim of this thesis was to extend a web information system, GEDI, used to manage the data from GenEglobwq project, in order to provide a tool for automated genome annotation. In this sense the annotation module in the GEDI system was created, which makes use of an automatic genome annotation pipeline, named MAKER, which can be used to annotate any type of organism. One way to annotate a genome is through the use of markers to identify specific areas of the genome. Thus, it was also created a marker module to manage marker data. In order to validate the annotation module operation, the chloroplast genomes of Eucalyptus globulus and Eucalyptus grandis was annotated. However, like any automatic genome annotation pipeline, not all the genes were annotated, being necessary a manual curation of the results.}
{pt=Genoma, Anotação, Biomarcadores, Cloroplasto, Eucalyptus globulus, en=Genome, Annotation, Biomarkers, Chloroplast, Eucalyptus globulus}

novembro 22, 2010, 9:0

Publicação

Obra sujeita a Direitos de Autor

Orientação

CO-ORIENTADOR

João André Nogueira Custódio Carriço

Faculdade de Medicina da Universidade de Lisboa

Investigador Principal

ORIENTADOR

Ana Teresa Correia de Freitas

Departamento de Engenharia Electrotécnica e de Computadores (DEEC)

Professor Auxiliar