Dissertação

Morphosyntactic Label Disambiguation EVALUATED

Atribuição de etiquetas morfossintáticas é uma tarefa fulcral em Processamento de Língua Natural, fornecendo não só informação valiosa sobre a estrutura frásica do texto processado, mas também sobre a morfologia de cada palavra. Outrora feita manualmente, esta é, atualmente, uma tarefa clássica de Processamento de Língua Natural executada por atribuidores de etiquetas automatizados. Quanto mais informação o atribuidor inferir, melhor. Os atribuidores mais recentes a alcançar resultados estado de arte nesta tarefa utilizam modelos à base de redes neuronais recorrentes para prever uma única etiqueta para cada palavra. Geralmente, esta etiqueta representa, ou a função sintática da palavra na frase, ou combina a função sintática com várias características morfológicas da palavra. Esta dissertação aborda a tarefa de atribuição de etiquetas morfossintáticas para Portugês Europeu com uma maior ambição. Usando redes recorrentes Long-Short Term Memory e Conditional Random Fields em conjunto com representações de palavras e regras manualmente definidas, esta dissertação apresenta quatro modelos que visam desambiguação de 11 etiquetas morfossintáticas para cada palavra. Com o objetivo final de tentar ultrapassar o atual módulo estatístico de desambiguação de etiquetas morfossintáticas da STRING, MARv4, os modelos foram avaliados utilizando diferentes configurações e diferentes representações de palavras. No geral, todos os modelos mostram bons resultados, revelando que uma única rede neuronal é capaz de atribuir várias etiquetas morfossintáticas. O melhor modelo apresenta um desempenhos satisfatório, tomando partido do uso de regras manuais. No entanto, este modelo fica ligeiramente aquém da precisão média de 97.30% obtida pelo MARv4, com uma precisão média de 94.89%.
Desambiguação etiquetas morfossintáticas, Processamento Língua Natural, Aprendizagem Automática, Conditional Random Fields Restringidos

Novembro 8, 2018, 16:30

Documentos da dissertação ainda não disponíveis publicamente

Orientação

ORIENTADOR

Bruno Emanuel Da Graça Martins

Departamento de Engenharia Informática (DEI)

Professor Auxiliar

ORIENTADOR

Nuno João Neves Mamede

Departamento de Engenharia Informática (DEI)

Professor Associado