Dissertação
Accurate and Well-Calibrated ICD Code Assignment with a Chunk-Based Classifier Attending over Diverse Label Embeddings EVALUATED
Embora a Classificação Internacional de Doenças (CID) tenha sido adoptada em larga escala, a atribuição manual de códigos CID a textos clínicos é demorosa, propensa a erros e bastante dispendiosa, razões estas que têm motivado o desenvolvimento de métodos automatizados para realizar esta tarefa. Este documento descreve uma nova abordagem de aprendizagem profunda para a codificação CID, combinando várias ideias de trabalhos anteriores. Em particular, dividimos documentos clínicos longos em pedaços e usamos um modelo baseado em Transformers para processar cada um dos pedaços de forma independente. As representações resultantes são processadas com uma operação de Max Pooling e combinadas com um mecanismo de label embeddings que explora diversos sinónimos de códigos CID. As experiências com diferentes divisões do conjunto de dados MIMIC-III mostram que a abordagem proposta supera os actuais modelos de ponta na codificação da CID, ao mesmo tempo que conduz a um modelo devidamente calibrado que pode efetivamente informar tarefas relacionadas, como a quantificação de texto.
novembro 14, 2023, 17:0
Publicação
Obra sujeita a Direitos de Autor
Orientação
ORIENTADOR
Bruno Emanuel Da Graça Martins
Departamento de Engenharia Electrotécnica e de Computadores (DEEC)
Professor Associado