Dissertação

{en_GB=Development and optimization of models to support clinical coding } {} EVALUATED

{pt=Grupos de diagnósticos homogéneos (GDHs) correspondem a um sistema de classificação de grande importância para o financiamento de instituições de saúde. Este sistema de classificação de grupos de pacientes com semelhanças do ponto de vista do consumo de recursos e de duração de internamento hospitalar é utiliza atualmente em todos os hospitais em Portugal, para definir alocações orçamentais para o internamento em hospitais do Serviço Nacional de Saúde Português. Esta tese explora a previsão de GDHs através de dados estruturados de registos de saúde eletrónicos (RSEs). Especificamente, desenvolve uma abordagem de aprendizagem automática através do uso de modelos de regressão logística para prever GDHs. A abordagem proposta foi aplicada a uma base dados com 5089 observações de internamento do Hospital Fernando Fonseca. Adicionalmente, aplicou-se á base de dados um filtro de mínima redundância e máxima relevância, de modo a recuperar os atributos mais importantes para cada um dos conjuntos de dados gerados. Cada um dos conjuntos de dados foi aplicada uma série de experiencias de modo a encontrar a combinação de variáveis que apresentava os melhores valores para as medidas de desempenho de sensibilidade e valor preditivo positivo. Os resultados variaram entre os GDHs previstos, com diferentes variações dos modelos a contribuírem para um melhor desempenho dos modelos de GDHs distintos. Para a maioria dos DRGs, os melhores modelos apresentaram valores elevados de sensibilidade e valores baixos para o valor preditivo positivo. Os resultados sugerem que vale a pena explorar o uso de dados estruturados de RSEs para prever DRGs., en=Diagnosis related groups (DRGs) correspond to a classification system of great importance to the financing of healthcare providers. This classification system groups patients with similarities from the point of view of resources consumption and hospital stay duration, and is currently used in all hospitals in Portugal to define budget allocations for inpatient care to hospitals of the Portuguese National Health Service. This thesis explores the extent to which it is possible to predict DRGs with structured data from electronic health records (EHRs). Specifically, it develops a machine learning approach through the use of logistic regression models to predict DRGs, by using EHR structured data. The proposed approach was applied to a database with 5089 inpatient observations from the Fernando Fonseca Hospital. Furthermore, it was applied to the database a minimal-redundancy maximal-relevance filter in order to retrieve the most important attributes for each of the generated datasets. Each of the datasets was applied to a series of experiments in terms of finding the combination of variables that presented the best values for the sensitivity and predictive positive value performance measures. The results varied amongst predicted DRGs, with different model variations contributing to better model performance of distinct DRGs. For most DRGs, the best models presented high values for sensitivity and low values for predictive positive value. Results suggest that it is worth exploring the use of structure EHRs data to predict DRGs.}
{pt=Grupos de Diagnósticos Homogéneos, Registos de Saúde Eletrónicos, Serviço Nacional de Saúde Português, Aprendizagem Automática, Dados Estruturados, Filtro mRMR., en=Diagnosis Related Groups, Electronic Health Records, Portuguese National Health Service, Machine Learning, Structured Data, mRMR Filter.}

Novembro 30, 2015, 9:30

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

Filipe Janela

Siemens

Especialista

ORIENTADOR

Mónica Duarte Correia de Oliveira

Departamento de Engenharia e Gestão (DEG)

Professor Associado