Dissertação

{en_GB=Deep Learning for Multi-Label ICD-9 Classification of Hospital Discharge Summaries} {} EVALUATED

{pt=Notas de alta hospitalar são documentos formados por campos textuais de inserção livre e outros campos estruturados, providenciando a descrição de informação relevante relacionada com a estadia de um dado paciente num serviço de saúde e respectivos tratamentos. A variabilidade do vocabulário médico torna o processamento destes documentos um considerável desafio de processamento de linguagem natural. O modelo proposto combina uma rede neuronal profunda com embeddings da semântica, tipologia e caracteres que compõem a palavra, unidades recorrentes e convolucionais e mecanismos de atenção neuronal, gerando representações intermédias dos conteúdos textuais. A rede neuronal explora também a natureza hierárquica do input, através da construção de representações das sequências de palavras presentes em cada um dos campos. Mecanismos de memória auxiliar são também explorados de modo a providenciar como input uma classificação a priori das diferentes classes. O modelo foi avaliado para classificação automática de diagnósticos em notas de alta hospitalar segundo codificação CID-9 em conjuntos de dados provenientes do Hospital Beatriz Ângelo e da base de dados MIMIC III, revelando ser flexível e adaptável., en=Hospital discharge summaries are composed of free-text and drop-down textual fields, describing relevant information about the patient's hospital stay and treatments. The variability of medical vocabulary makes the processing of these records an important natural language processing challenge. We leverage a deep neural network that combines word, word-type and character embeddings, recurrent and convolutional units and neural attention, for the generation of intermediate representations of the textual contents. The neural network also explores the hierarchical nature of the input data, by building representations from the sequences of words within individual fields. An auxiliary memory mechanism is also leveraged for providing an a priori prediction of classes, being provided as input. The model is evaluated on the automatic assignment of ICD-9 codes to diagnosis on discharge summaries from both Hospital Beatriz Ângelo (Portugal) and the MIMIC III dataset, showing to be flexible and adaptable.}
{pt=Notas de Alta Hospitalar, Codificação de texto clínico, Aprendizagem com Redes Profundas, Processamento de Linguagem Natural, Classificação Multi-label, en=Patient discharge summaries, Coding clinical text, Deep learning, Natural Language Processing, Multi-label classification}

Novembro 22, 2018, 18:0

Orientação

ORIENTADOR

Bruno Emanuel Da Graça Martins

Departamento de Engenharia Informática (DEI)

Professor Auxiliar

ORIENTADOR

Nuno André da Silva

Luz Saúde

Especialista