Dissertação

{en=A data mining approach to study disease presentation patterns in Primary Progressive Aphasia} {} EVALUATED

{pt=O mundo actual é confrontado por uma população cada vez mais envelhecida e pelos desafios que isso acarreta, nomeadamente, a nível de cuidados médicos, tendo em conta a actual incidência de doenças neuro-degenerativas dos grupos etários mais elevados. A afasia progressiva primária (APP) define-se como uma forma de apresentação de demência de etiologia neuro-degenerativo caracterizada pela perda de capacidades linguísticas. Deste modo, a caracterização das suas diferentes variantes é crucial de modo a possibilitar uma administração adequada de fármacos e intervenções terapêuticas. Esta dissertação pretende usar técnicas de Data Mining para extrair informação de dados clínicos, nomeadamente, perceber quais as principais variantes de APP. Foram aplicados algoritmos standard de clustering, com o intuito de averiguar quantos grupos existem no conjunto de dados e eventualmente, estudar a possível existência de novos grupos, diferentes dos actualmente descritos na literatura. Posteriormente, recorreu-se a técnicas de aprendizagem supervisionada para analisar os pacientes tendo em conta a sua classificação clínica, em uma das três variantes de APP, e consequentemente, desenvolver um modelo de classificação mais preciso. Segundo a análise de aprendizagem não supervisionada, existem dois grupos principais no conjunto de dados analisados. Este estudo inclui a avaliação de diversos conjuntos de atributos de modo a averiguar qual o tipo de atributos que produz melhores resultados. Foram desenvolvidas duas novas metodologias de classificação de APP, tendo obtido uma boa performance com os dados deste estudo. Uma destas novas metodologias foi desenhada para identificar pacientes que não pertençam a nenhuma das três variantes definidas na literatura. , en=Nowadays the world is faced with an ageing population and the related challenges, as healthcare issues given the current incidence of diseases more prevalent in elders, such as neurodegenerative diseases. Primary Progressive Aphasia (PPA) is a neurodegenerative disease characterized by a dissolution of language abilities, being these patients regarded with special attention since they possess higher risk to evolve to dementia. Consequently, discovering the different subtypes of PPA patients is fundamental to the timely administration of pharmaceutics and therapeutic interventions. This thesis proposes a data mining approach to extract relevant knowledge from clinical data, namely to learn the PPA variants. Initially, standard clustering algorithms were applied with the purpose of studying the number of existent groups in the dataset and eventually, study the potential existence of new groups, different from the PPA subtypes defined in the literature. Then, during a second phase, supervised learning techniques were used to analyse patients according to their clinical classification in one of the three PPA variants and develop a new and accurate classification model. The unsupervised learning analysis pointed to the existence of two main groups in the dataset analysed in this work. This study included the evaluation of diverse sets of attributes in order to access which type/set of attributes produced better results. Finally, two new methodologies for classifying patients with PPA were developed, reaching good accuracies in the dataset under study. One of those methodologies enables the identification of instances which are (potentially) not from any of the already defined PPA subtypes. }
{pt=APP, Data Mining, Clustering, Classificação, Diagnóstico., en=PPA, Data Mining, Clustering, Classification, Diagnosis.}

dezembro 12, 2013, 14:0

Orientação

CO-ORIENTADOR

Maria Manuela Gil Guerreiro

Instituto de Medicina Molecular da Faculdade de Medicina da Universidade de Lisboa

Doutora

ORIENTADOR

Sara Alexandra Cordeiro Madeira

Departamento de Engenharia Informática (DEI)

Professor Auxiliar