Dissertação

{en_GB=Imputation Techiques for Clinical Data of Ischemic Stroke Patients} {} EVALUATED

{pt=No século XXI, todos os anos, na Europa, 880 mil pessoas sofrem um acidente vascular cerebral isquémico. Prever a evolução e desfecho do paciente é crucial aquando da escolha do tratamento. Nesta tese de mestrado foram criados vários modelos de modo a prever o desfecho do paciente através da versão binária da escala de Rankin modificada em dois momentos no tempo: três meses e um ano após a ocorrência do derrame. É comum que os dados providenciados pelas entidades de saúde para a realização destes estudos estejam incompletos comprometendo os resultados. Torna-se então necessário escolher uma maneira apropriada de lidar com os dados omissos neste trabalho, optou-se por testar seis métodos de imputação diferentes e, com os dados completos, treinar classificadores com sete modelos de aprendizagem automática distintos. Conclui-se que a área sob a curva característica de operação do recetor, para o melhor classificador, a prever a escala a três meses e um ano foi 0.8217 e 0.7537, respetivamente. Ademais, não foram encontradas diferenças, com significância estatística, no desempenho dos distintos métodos de imputação quando avaliados para cada um dos modelos de aprendizagem automática., en=In the 21st century, every year, approximately 880 thousand people living in Europe suffer an ischemic stroke. Predicting the patient’s outcome is key to choosing the course of treatment. In this master thesis, it was predicted the functional outcome, by the binary version, of the modified Rankin Scale at two points in time: three months and one year after the stroke took place. Often, data provided by health organisations to conduct these studies is incomplete which can impair the results. Thus the need arises to choose a proper way to handle the missing data. Here missing values were imputed with six different methods and the classifiers were then trained with seven distinct machine learning models. It was shown the area under the receiver operating characteristic curve for the best classifiers, at the three months and one-year marks, are 0.8217 and 0.7537, respectively. Moreover, it was not found a statistically significant difference between the performance of the distinct imputation methods for each machine learning model.}
{pt=Acidente Vascular Cerebral Isquémico, Dados Omissos, Técnicas de Imputação, Aprendizagem Automática, en=Ischemic Stroke, Missing Data, Imputation Techniques, Machine Learning}

Janeiro 18, 2021, 13:0

Orientação

ORIENTADOR

Arlindo Manuel Limede de Oliveira

Departamento de Engenharia Informática (DEI)

Professor Catedrático

ORIENTADOR

Alexandre Paulo Lourenço Francisco

Departamento de Engenharia Informática (DEI)

Professor Associado