Dissertação

Co-Reference Resolution in Portuguese and Spanish Texts EVALUATED

Resolução de co-referências é uma tarefa focada em identificar as expressões num texto referentes a uma mesma entidade. Tem atraído muita atenção devido à sua importância na compreensão da linguagem e como uma subtarefa para outros problemas de Processamento de Língua Natural. As abordagens atuais do estado da arte são baseadas no treino supervisionado de redes neuronais profundas, o que representa um desafio para línguas com poucos recursos, como o Português. Neste trabalho nós propomos um modelo neuronal para resolução de co-referências em textos Portugueses e Espanhóis, alinhado com o estado da arte. O modelo desenvolvido explora uma abordagem de aprendizagem multilíngue, alinhando os embeddings de Português e Espanhol num espaço vetorial comum, e treinando simultaneamente com dados de ambas as línguas, combatendo o problema do Português ser uma língua com menos recursos. O nosso modelo baseia-se num sistema neuronal para resolução de co-referências pré-existente, desenvolvido e ajustado para dados em Inglês, que nós adaptamos para o cenário multilíngue. O modelo proposto mostra que uma abordagem baseada em aprendizagem multilíngue com dados em Português e Espanhol atinge resultados promissores, próximos dos resultados obtidos pelos respectivos modelos monolíngue.
Co-Reference Resolution, Cross-Lingual Learning, Deep Learning, Natural Language Processing

janeiro 27, 2021, 18:0

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

Henrique Daniel de Avelar Lopes Cardoso

Departamento de Engenharia Informática - FEUP

Professor Auxiliar

ORIENTADOR

Bruno Emanuel Da Graça Martins

Departamento de Engenharia Informática (DEI)

Professor Auxiliar