Dissertação

{pt_PT=Predicting Emergency Department Revisits using Machine Learning and Natural Language Processing} {} EVALUATED

{pt=A taxa de readmissão ao Serviço de Urgência (SU) é uma medida de qualidade dos cuidados de saúde. O objetivo deste trabalho é desenvolver um modelo preditivo capaz de identificar o risco de readmissões de doentes adultos ao SU, até 72 horas após alta. Os dados provêm do Hospital Beatriz Ângelo e contemplam 511301 doentes, desde 2012 até 2016, com uma média de 5.7% readmissões. Os dados consistem em informações demográficas, sinais vitais, queixas principais e outras informações disponíveis aquando da triagem. Para o pré-processamento de texto, uma estrutura de processamento de linguagem natural é desenvolvida. Para modelação de dados, consideraram-se as estratégias: Regressão Logística; Máquina de Vetores de Suporte; Naïve Bayes Multinomial; Naïve Bayes Complementar. Para desenvolvimento do modelo utiliza-se validação cruzada com 10 subconjuntos juntamente com uma abordagem de aprendizagem sensível ao custo. O poder preditivo do modelo é medido recorrendo à estatística-C. São criadas cinco hipóteses relativamente às variáveis. A primeira hipótese considera variáveis padrão, a segunda hipótese considera todas as variáveis numéricas, a terceira hipótese recorre às queixas principais, a quarta hipótese utiliza variáveis da primeira e terceira hipóteses, e a quinta hipótese considera variáveis da segunda e terceira hipóteses. O melhor modelo preditivo atinge uma estatística-C de 0.842 (95% CI: 0.838-0.846), sob a quinta hipótese, utilizando regressão logística. A solução proposta mostra que desempenhos de previsão favoráveis podem ser alcançados, indicando um caminho promissor para desenvolver sistemas de apoio à decisão clínica de modo a prever readmissões ao SU até 72 horas após a alta., en=The rate of Emergency Department (ED) revisits is often considered as a measure of the quality of care. The aim of this work is to develop a predictive model that identifies the risk of adult patients' ED revisits, within 72 hours after discharge. The study data is from Hospital Beatriz Ângelo and contemplates 511301 patients from 2012 to 2016, with an average of 5.7% revisits. Data consists of patient demographics, vital signs, chief main complaints, and other information available at the time of triage. For text preprocessing, a Natural Language Processing framework is developed. For data modelling, Logistic Regression (LR), Support Vector Machine, Multinomial Naïve Bayes, and Complement Naïve Bayes techniques are considered. During model development, 10-fold cross-validation is used alongside a cost-sensitive learning approach. The predictive power of the model is measured by c-statistic. Five hypotheses regarding features are made. The first hypothesis considers baseline variables, the second hypothesis considers all numerical variables, the third hypothesis uses the chief main complaints, the fourth hypothesis uses variables of the first and third hypotheses, and the fifth hypothesis considers variables of the second and third hypotheses. The best predictive model achieves a c-statistic of 0.842 (95% CI: 0.838-0.846), under the fifth hypothesis using the LR technique. The proposed solution shows that favourable predicting performances can be achieved, indicating a promising way to develop clinical decision support systems to predict patient ED revisits within 72 hours after discharge.}
{pt=Processamento de Línguagem Natural, Aprendizagem Automática, Serviço de Urgência, Triagem, Predição, Readmissão., en=Natural Language Processing, Machine Learning, Emergency Department, Triage, Prediction, Revisits.}

Junho 18, 2019, 16:0

Orientação

ORIENTADOR

João Paulo Baptista de Carvalho

Departamento de Engenharia Electrotécnica e de Computadores (DEEC)

Professor Associado

ORIENTADOR

Susana Margarida da Silva Vieira

Departamento de Engenharia Mecânica (DEM)

Professor Auxiliar