FenixEdu™

Dissertação

Improving the Quality of Neural Machine Translation EVALUATED

Detalhes: Avanços recentes levaram a que a tradução automática neural se tornasse a principal abordagem ao problema de tradução automática. Ainda assim, apesar dos modelos actuais produzirem traduções fluentes, estas nem sempre são adequadas, prejudicando a sua qualidade. Nesta dissertação abordamos duas possíveis causas de traduções não adequadas: má cobertura das palavras durante a tradução, o que pode levar a repetições e a que palavras não sejam traduzidas; existência de palavras raras e frases fora de um certo domínio. De modo a reduzir os problemas de cobertura propomos um modelo baseado na fertilidade das palavras, juntando este conceito a funções de transformação esparsas e restritas do mecanismo de atenção. São ainda apresentadas duas métricas automáticas com o intuito de avaliar os problemas de sobre e sub-tradução de palavras da frase original. Quanto aos problemas de palavras raras e desajuste de domínio, seguimos uma abordagem existente na literatura que usa o conceito de unidade de tradução para guiar a parte de descodificação dos modelos de tradução automática neural. Este modelo é melhorado, introduzindo correções para problemas identificados, e aplicado ao problema de adaptação de domínio, algo que não tinha sido tentando até agora. Por fim, avaliamos empiricamente os métodos propostos em três pares de linguagens e apresentamos uma análise extensa de erros, tornando possível compreender os pontos fortes e fracos de cada método e como melhorá-los no futuro.
Keywords: Aprendizagem profunda, processamento de língua natural, tradução automática neural, funções de transformação de atenção, adaptação de domínio

Discussão: novembro 12, 2018, 10:0