Dissertação

{en=Classification of clinical expression time series: A case study in patients with Multiple Sclerosis} {} EVALUATED

{pt=O constante desenvolvimento visando uma medicina cada vez mais personalizada nos últimos anos conduziu ao aparecimento de análises temporais de expressão genética. Devido à consideração do aspecto temporal, este tipo de análises representa uma grande vantagem num melhor conhecimento da progressão e tratamento de doenças. Todavia, variados desafios acompanham este tipo de estudos, sendo o tamanho da amostra um dos mais relevantes. Esta limitação está patente em duas formas: no número de objectos (neste caso, pacientes) e no número de medições temporais. Neste trabalho, os dados usados são provenientes de múltiplas séries temporais de expressão genética, usadas para classificar a resposta de pacientes com esclerose múltipla ao tratamento com Interferão-Beta, ao qual aproximadamente metade dos pacientes apresenta uma resposta negativa. Assim, a obtenção de um modelo altamente predictivo da resposta destes pacientes permitiria certamente melhorias significativas na qualidade de vida, evitando terapias desnecessárias e muitas vezes acompanhadas de efeitos adversos, especialmente para o grupo de pacientes com resposta negativa. Neste contexto, são propostas algumas estratégias de classificação de séries temporais baseadas numa técnica de biclustering, sendo aplicadas à classificação da resposta ao tratamento com Interferão-Beta para esclerose múltipla, num conjunto de dados já analisado anteriormente. Embora os resultados não tenham ultrapassado as abordagens anteriormente descritas para este problema em particular, realça-se que algumas das estratégias desenvolvidas apresentam importantes potencialidades, encorajando-se uma análise mais extensiva, abordando outros dados de séries temporais de origem clínica, ou mesmo outros problemas de classificação em geral. , en=The constant drive towards a more personalized medicine in the last years led to the arrival of temporal gene expression analyses. Due to the consideration of a temporal aspect, this kind of analyses represents a great advantage to better understand disease progression and treatment results at a molecular level. Nevertheless, several problems accompany studies of this kind, with the sample size limitation being one of the most relevant. This limitation is patent in two ways: in the number of objects (in this case, patients), and in the number of measured time points. In this work, the data used were multiple gene expression time series, used to classify the response of multiple sclerosis patients to the standard treatment with Interferon-Beta, to which nearly half of the patients reveal a negative response. Therefore, obtaining a highly predictive model of a patient?s response would definitely improve the quality of life, avoiding useless and possibly harmful therapies for the non-responder group. In this context, several new strategies for time series classification are proposed, based on a biclustering technique. These are applied to the classification of the Interferon-Beta response by multiple sclerosis patients from a dataset analyzed over the last decade. Although our classification methods do not outperform the ones proposed for this same dataset, it is worth noting that some of the developed strategies reveal important potentialities that should be further explored, either with other clinical time series data, or even in other classification problems, in general.}
{pt=séries temporais, biclustering, bioinformática, esclerose múltipla, Interferão-Beta, data mining, en=time series, biclustering, bioinformatics, multiple sclerosis, Interferon-Beta, data mining}

novembro 24, 2010, 14:0

Publicação

Obra sujeita a Direitos de Autor

Orientação

CO-ORIENTADOR

João André Nogueira Custódio Carriço

Faculdade de Medicina da Universidade de Lisboa

Investigador Auxiliar

ORIENTADOR

Sara Alexandra Cordeiro Madeira

Departamento de Engenharia Informática (DEI)

Professor Auxiliar