Dissertação
Deep neural models for ICD coding from clinical text EVALUATED
A Classificação Internacional de Doenças (CID) foi adotada a nível mundial no domínio da saúde. No entanto, a codificação manual de documentos clínicos de acordo com esta norma é um processo mais moroso e dispendioso do que desejado, bem como suscetível a erros. Assim, algoritmos de aprendizagem automática, em particular com recurso a redes neuronais profundas, podem e têm sido utilizados para automatizar a codificação clínica. Esta dissertação apresenta um novo método, que tem por base redes neuronais, para atribuir códigos CID a notas de alta hospitalar, combinando o uso de word embeddings, unidades recorrentes e atenção neuronal. A rede neuronal explora a natureza hierárquica dos dados utilizados, construindo representações tanto ao nível das palavras como das frases e incluindo em cada nível um mecanismo de atenção neuronal. Além disso, várias estratégias inovadoras foram testadas juntamente com o modelo proposto, incluindo um mecanismo de suavização multi-label, potenciando a estrutura hierárquica dos códigos CID, bem como estratégias de aumento de dados ou a utilização de unidades recorrentes alternativas. Foram realizadas experiências com o conjunto público de dados do MIMIC III, mostrando que o modelo proposto supera vários modelos anteriores que fazem uso de redes neuronais na maioria das métricas de avaliação. Conclui-se, ainda, que o modelo proposto apresenta um enorme potencial para ser aplicado em hospitais e outras instituições de saúde, como parte de um sistema inteligente que auxilie nas tarefas de codificação.
janeiro 26, 2021, 10:0
Publicação
Obra sujeita a Direitos de Autor
Orientação
ORIENTADOR
Bruno Emanuel Da Graça Martins
Departamento de Engenharia Informática (DEI)
Professor Auxiliar