Dissertação

Adapting State-of-the-Art Named Entity Recognition and Disambiguation Frameworks for Handling Clinical Text EVALUATED

A tarefa de Reconhecimento e Desambiguação de Entidades~(RDE) preocupa-se com o reconhecimento de referências a entidades em documentos de texto (e.g., reconhecimento de nomes de doenças em notas clínicas e em texto livre associado a registos de saúde eletrónicos) e, de seguida, com a associação inequívoca das entidades reconhecidas para com entradas numa base de conhecimento (i.e., associar as doenças reconhecidas a entradas do {\it metathesaurus} do UMLS). A tarefa de RDE em documentos clínicos é especialmente desafiante, devido a problemas como o uso frequente de referências descontínuas a entidades, o uso de abreviaturas específicas ao domínio clínico, ou a insuficiência de informação contextual. Nesta dissertação, descreve-mos adaptações simples a sistemas de reconhecimento e desambiguação de entidades, desenvolvidos para processar documentos jornalísticos, de forma a poderem manipular textos do domínio clínico. Reportamos experiências feitas com dados bem conhecidos na área (e.g., com dados de uma competição prévia na conferência SemEval, com o seu foco em análise de texto clínico), mostrando que os sistemas de RDE já existentes podem ser facilmente modificados de maneira a terem alto desempenho no domínio clínico.
Aprendizagem Automática, Reconhecimento de Entidade, Desambiguação de Entidades, Conditional Random Fields, Terminologias do Domínio Médico

Dezembro 11, 2015, 14:0

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

Paulo Jorge Morais Zamith Nicola

Instituto de Medicina Preventiva e Saúde Pública - Faculdade de Medicina de Lisboa

Especialista

ORIENTADOR

Bruno Emanuel Da Graça Martins

Departamento de Engenharia Informática (DEI)

Professor Auxiliar