Dissertação

Identification of Transcription Factors Binding Sites (TFBS) in Yeast using Information Theory EVALUATED

A compreensão dos mecanismos envolvidos na regulação da expressão génica e genómica é um dos maiores focos da biologia molecular com grande impacto no entendimento da biologia celular em diferentes condições. Neste trabalho pretendeu-se explorar a utilização da teoria de informação para melhor compreender a regulação da expressão genómica em três leveduras, a Sacharomyces cerevisiae, Candida glabrata e Hanseniaspora guilliermondii. Para tal foi efectuada uma análise global onde foram construídos os perfis entrópicos para cada uma destas espécies de levedura, considerando substrings de comprimento 8, que foram posteriormente filtrados para obter o top 10 dos padrões mais comuns. Desta análise foi possível identificar dois padrões que se verificaram corresponder a possíveis locais de ligação para factores de transcrição de S. cerevisiae e C. glabrata, demonstrando assim a possibilidade de usar a teoria de informação para identificar motivos de DNA com funcionalidade. A análise local começa por testar a hipótese de que promotores com elevada similaridade são regulados pelos mesmos fatores de transcrição. Para tal foi aplicado o algoritmo k-medoids, usando a divergência de Kullback-Leibler como medida de similaridade. Finalmente foi implementado um algoritmo para procurar transcription factors binding sites numa dada sequência ou num genoma completo.
Teoria da Informação, Transcription Factors Binding Sites, Divergência de KL, S. cerevisiae, C. glabrata, H. guilliermondii

junho 25, 2018, 9:30

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

Susana de Almeida Mendes Vinga Martins

Departamento de Engenharia Informática (DEI)

Professor Associado

ORIENTADOR

Nuno Gonçalo Pereira Mira

Departamento de Bioengenharia (DBE)

Professor Auxiliar