Dissertação

Deep neural models for ICD coding from clinical text EVALUATED

A Classificação Internacional de Doenças (CID) foi adotada a nível mundial no domínio da saúde. No entanto, a codificação manual de documentos clínicos de acordo com esta norma é um processo mais moroso e dispendioso do que desejado, bem como suscetível a erros. Assim, algoritmos de aprendizagem automática, em particular com recurso a redes neuronais profundas, podem e têm sido utilizados para automatizar a codificação clínica. Esta dissertação apresenta um novo método, que tem por base redes neuronais, para atribuir códigos CID a notas de alta hospitalar, combinando o uso de word embeddings, unidades recorrentes e atenção neuronal. A rede neuronal explora a natureza hierárquica dos dados utilizados, construindo representações tanto ao nível das palavras como das frases e incluindo em cada nível um mecanismo de atenção neuronal. Além disso, várias estratégias inovadoras foram testadas juntamente com o modelo proposto, incluindo um mecanismo de suavização multi-label, potenciando a estrutura hierárquica dos códigos CID, bem como estratégias de aumento de dados ou a utilização de unidades recorrentes alternativas. Foram realizadas experiências com o conjunto público de dados do MIMIC III, mostrando que o modelo proposto supera vários modelos anteriores que fazem uso de redes neuronais na maioria das métricas de avaliação. Conclui-se, ainda, que o modelo proposto apresenta um enorme potencial para ser aplicado em hospitais e outras instituições de saúde, como parte de um sistema inteligente que auxilie nas tarefas de codificação.
Codificação CID Automática, Notas de Alta Hospitalar, Aprendizagem com Redes Profundas, Processamento de Linguagem Natural, Classificação Multi-Label

Janeiro 26, 2021, 10:0

Documentos da dissertação ainda não disponíveis publicamente

Orientação

ORIENTADOR

João Paulo Neves Leal

CUF

Especialista

ORIENTADOR

Bruno Emanuel Da Graça Martins

Departamento de Engenharia Informática (DEI)

Professor Auxiliar