Dissertação
Adapting State-of-the-Art Named Entity Recognition and Disambiguation Frameworks for Handling Clinical Text EVALUATED
A tarefa de Reconhecimento e Desambiguação de Entidades~(RDE) preocupa-se com o reconhecimento de referências a entidades em documentos de texto (e.g., reconhecimento de nomes de doenças em notas clínicas e em texto livre associado a registos de saúde eletrónicos) e, de seguida, com a associação inequívoca das entidades reconhecidas para com entradas numa base de conhecimento (i.e., associar as doenças reconhecidas a entradas do {\it metathesaurus} do UMLS). A tarefa de RDE em documentos clínicos é especialmente desafiante, devido a problemas como o uso frequente de referências descontínuas a entidades, o uso de abreviaturas específicas ao domínio clínico, ou a insuficiência de informação contextual. Nesta dissertação, descreve-mos adaptações simples a sistemas de reconhecimento e desambiguação de entidades, desenvolvidos para processar documentos jornalísticos, de forma a poderem manipular textos do domínio clínico. Reportamos experiências feitas com dados bem conhecidos na área (e.g., com dados de uma competição prévia na conferência SemEval, com o seu foco em análise de texto clínico), mostrando que os sistemas de RDE já existentes podem ser facilmente modificados de maneira a terem alto desempenho no domínio clínico.
dezembro 11, 2015, 14:0
Publicação
Obra sujeita a Direitos de Autor
Orientação
ORIENTADOR
Paulo Jorge Morais Zamith Nicola
Instituto de Medicina Preventiva e Saúde Pública - Faculdade de Medicina de Lisboa
Especialista
ORIENTADOR
Bruno Emanuel Da Graça Martins
Departamento de Engenharia Informática (DEI)
Professor Auxiliar