Dissertação
Co-Reference Resolution in Portuguese and Spanish Texts EVALUATED
Resolução de co-referências é uma tarefa focada em identificar as expressões num texto referentes a uma mesma entidade. Tem atraído muita atenção devido à sua importância na compreensão da linguagem e como uma subtarefa para outros problemas de Processamento de Língua Natural. As abordagens atuais do estado da arte são baseadas no treino supervisionado de redes neuronais profundas, o que representa um desafio para línguas com poucos recursos, como o Português. Neste trabalho nós propomos um modelo neuronal para resolução de co-referências em textos Portugueses e Espanhóis, alinhado com o estado da arte. O modelo desenvolvido explora uma abordagem de aprendizagem multilíngue, alinhando os embeddings de Português e Espanhol num espaço vetorial comum, e treinando simultaneamente com dados de ambas as línguas, combatendo o problema do Português ser uma língua com menos recursos. O nosso modelo baseia-se num sistema neuronal para resolução de co-referências pré-existente, desenvolvido e ajustado para dados em Inglês, que nós adaptamos para o cenário multilíngue. O modelo proposto mostra que uma abordagem baseada em aprendizagem multilíngue com dados em Português e Espanhol atinge resultados promissores, próximos dos resultados obtidos pelos respectivos modelos monolíngue.
janeiro 27, 2021, 18:0
Publicação
Obra sujeita a Direitos de Autor
Orientação
ORIENTADOR
Henrique Daniel de Avelar Lopes Cardoso
Departamento de Engenharia Informática - FEUP
Professor Auxiliar
ORIENTADOR
Bruno Emanuel Da Graça Martins
Departamento de Engenharia Informática (DEI)
Professor Auxiliar