Dissertação

Automatic Annotation of Unstructured Fields in Medical Databases EVALUATED

O aumento do uso de sistemas baseados em Registos de Saúde Eletrónicos causou um enorme crescimento da informação disponível eletronicamente, que pode ser processada por técnicas de Data Mining, levando a resultados relevantes. O resultado esperado era que essa informação se tornasse fácil de aceder, analisar e partilhar. No entanto, o texto presente nas notas clínicas está escrito em língua natural e, portanto, não estruturado e difícil de processar automaticamente. Essas notas clínicas podem conter dados pertinentes para a saúde do paciente. Nesta tese, com a ajuda de técnicas de Processamento de Linguagem Natural e de Extração de Informação, apresentamos um sistema que, dada uma nota clínica, extrai entidades relevantes desta, tais como nomes de doenças, sintomas, tratamentos, diagnósticos e fármacos, gerando informação estruturada do texto não estruturado. Para além disso, de maneira a evitar problemas de privacidade e considerando que estes campos também podem conter referências a nomes de pacientes, médicos ou outros profissionais de saúde, também apresentamos um passo de anonimização. Por fim, adicionamos um módulo que automaticamente corrige erros tipográficos destas notas clínicas. Os resultados finais mostram que o sistema, em geral, está apto para reconhecer e interpretar entidades médicas.
Registos de Saúde Eletrónicos, Extração de Informação, Processamento de Linguagem Natural, dados não estruturados, dados estruturados.

Novembro 13, 2018, 16:30

Documentos da dissertação ainda não disponíveis publicamente

Orientação

ORIENTADOR

Arlindo Manuel Limede de Oliveira

Departamento de Engenharia Informática (DEI)

Professor Catedrático

ORIENTADOR

Maria Luísa Torres Ribeiro Marques da Silva Coheur

Departamento de Engenharia Informática (DEI)

Professor Auxiliar