Dissertação

Anaphora Resolution in Portuguese: An Hybrid Approach EVALUATED

Atualmente, devido à imensa quantidade de informação disponível, existe uma necessidade cada vez maior de extrair e processar informação de textos de língua natural. A Resolução de Anáfora é uma das mais relevantes tarefas de Processamento de Língua Natural (PLN) para responder a tais necessidades e tem sido objecto de estudo desde há vários anos. A anáfora é um importante mecanismo de coesão textual, na medida em que articula e interliga diferentes partes do texto, garantido a sua unidade semântica. Este trabalho visa desenvolver um módulo de anáfora pronominal e co-referencial em Português a integrar na cadeia PLN do L2F, STRING. Este trabalho pretende também melhorar a eficiência do módulo atualmente em uso, cuja avaliação produziu uma medida f de 33.5%. Para tal, anotamos um corpus bastante heterogéneo composto por textos de diferentes géneros: textos literários, notícias, artigos de opinião, artigos de revista, entre outros. No total contém 290.000 tokens e a campanha de anotação produziu 9.268 anáforas. A estratégia adotada assentou na identificação de expressões anafóricas e candidatos através de um sistema de regras; e na seleção do candidato mais provável para antecedente por um modelo construído com base no algoritmo, de aprendizagem automática, de máxima entropia (ME). A avaliação do sistema, distinguindo as diferentes fases de processamento e os diversos tipos de expressões anafóricas considerados, demonstrou uma melhoria significativa na performance do MRA 2.0, apresentando uma medida f de 82% na identificação de expressões anafóricas, 70% na identificação de candidatos a antecedente e 54% na resolução de anáforas.
resolução de anáfora, anáfora pronominal, expressão anafórica, anotação de corpus, aprendizagem automática

Outubro 25, 2013, 15:0

Publicação

Obra sujeita a Direitos de Autor

Orientação

CO-ORIENTADOR

Jorge Manuel Evangelista Baptista

Universidade do Algarve - Faculdade de Ciências Humanas e Sociais

Professor Associado

ORIENTADOR

Nuno João Neves Mamede

Departamento de Engenharia Informática (DEI)

Professor Associado