Dissertação

Morphosyntactic Label Disambiguation EVALUATED

Atribuição de etiquetas morfossintáticas é uma tarefa fulcral em Processamento de Língua Natural, fornecendo não só informação valiosa sobre a estrutura frásica do texto processado, mas também sobre a morfologia de cada palavra. Outrora feita manualmente, esta é, atualmente, uma tarefa clássica de Processamento de Língua Natural executada por atribuidores de etiquetas automatizados. Quanto mais informação o atribuidor inferir, melhor. Os atribuidores mais recentes a alcançar resultados estado de arte nesta tarefa utilizam modelos à base de redes neuronais recorrentes para prever uma única etiqueta para cada palavra. Geralmente, esta etiqueta representa, ou a função sintática da palavra na frase, ou combina a função sintática com várias características morfológicas da palavra. Esta dissertação aborda a tarefa de atribuição de etiquetas morfossintáticas para Portugês Europeu com uma maior ambição. Usando redes recorrentes Long-Short Term Memory e Conditional Random Fields em conjunto com representações de palavras e regras manualmente definidas, esta dissertação apresenta quatro modelos que visam desambiguação de 11 etiquetas morfossintáticas para cada palavra. Com o objetivo final de tentar ultrapassar o atual módulo estatístico de desambiguação de etiquetas morfossintáticas da STRING, MARv4, os modelos foram avaliados utilizando diferentes configurações e diferentes representações de palavras. No geral, todos os modelos mostram bons resultados, revelando que uma única rede neuronal é capaz de atribuir várias etiquetas morfossintáticas. O melhor modelo apresenta um desempenhos satisfatório, tomando partido do uso de regras manuais. No entanto, este modelo fica ligeiramente aquém da precisão média de 97.30% obtida pelo MARv4, com uma precisão média de 94.89%.
Desambiguação etiquetas morfossintáticas, Processamento Língua Natural, Aprendizagem Automática, Conditional Random Fields Restringidos

novembro 8, 2018, 16:30

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

Bruno Emanuel Da Graça Martins

Departamento de Engenharia Informática (DEI)

Professor Auxiliar

ORIENTADOR

Nuno João Neves Mamede

Departamento de Engenharia Informática (DEI)

Professor Associado