Dissertação

{en_GB=Estimation of Missing Data From Medical Datasets} {} EVALUATED

{pt=Devido à crescente importância na monitorização de variáveis fisiológicas de forma a aumentar a segurança e qualidade no cuidado de pacientes, a falha ou corrupção temporária desses sinais pode ser problemática. A falha nestes sinais pode ocorrer devido a avarias e/ou desconexão de sensores, evasivos ou não-evasivos, usados nessa monitorização. Usando informação fornecida tanto pelos valores passados destes sinais como dos que não foram afectados pela falha, é possível criar, até certa medida, uma reconstrução destes. Este trabalho é o resultado do esforço empregue no estudo e melhoria de alguns dos melhores modelos apresentados até hoje na estimação de falhas em dados, particularmente de natureza clínica, como é o caso de filtros adaptativos e redes neuronais. Para tal, foi identificado um filtro de Savitzky-Golay, usando conhecimento prévio da dinâmica do sinal antes da sua falha, e posteriormente aplicado à estimação obtida por um modelo. A forma como o filtro é identificado e aplicado torna-o apropriado para qualquer modelo de machine learning. Adicionalmente é proposto uma heurística que irá realizar ajuste de parâmetros envolvidos no treino das redes neuronais. Os dados fornecidos no concurso proposto em 2010 por PhysioNet/CinC serão usados e os resultados comparados com as submissões feitas pelos seus participantes. Ambas as operações de filtragem e ajuste de parâmetros melhoraram a qualidade média das reconstruções de todos os modelos e de todas as variáveis fisiológicas testadas. Adicionalmente, uma versão do melhor modelo testado com uma baixa carga computacional é proposta, abrindo o caminho para uma implementação em tempo-real., en=With the ever increasing importance of monitoring physiological signals to improve patient welfare and quality of care, temporary corruption or loss of these signals can be problematic. Among other reasons, these signal failures are due to the malfunction and/or disconnection of invasive and noninvasive sensors used. To some extent, it is possible to recover these signals from information provided by their past values and their concurrent signals. This work is the result of an effort to study and improve some of the best models proposed so far for missing data estimation, particularly applied to medical datasets, such as adaptive filter models and neural networks. To achieve this, a Savitzky-Golay filter is defined from prior knowledge of the signal behavior and applied to a signal estimation obtained by a model. The filter identification and implementation makes it suitable for all kinds of machine learning models. An heuristic algorithm is also proposed to perform parameter tuning regarding model training. Data provided in the computational challenge of PhysioNet/CinC in 2010 is used and the results obtained compared with the ones submitted by its participants. Both filtering and tuning operations improved the mean quality of the reconstructions of all models across all types of tested physiological signals. Additionally, a version of the best model with low computational effort is proposed that dramatically decreases the neural network training time, maintaining the high quality estimation capabilities and paving the way for online applications.}
{pt=estimação de dados com falhas, filtros adaptativos, redes neuronais, machine learning, filtro de Savitzky-Golay, dados médicos, en=data estimation, adaptive filters, neural networks, machine learning, Savitzky-Golay filter, medical dataset}

Maio 5, 2017, 14:0

Orientação

ORIENTADOR

Susana Margarida da Silva Vieira

Departamento de Engenharia Mecânica (DEM)

Prof Auxiliar Convidado

ORIENTADOR

Alexandra Bento Moutinho

Departamento de Engenharia Mecânica (DEM)

Professor Auxiliar