Dissertação

Glass-Box Quality Estimation for Neural Machine Translation EVALUATED

A Estimação de Qualidade de Tradução tem-se tornado cada vez mais relevante nos últimos anos para o desenvolvimento de aplicações de Tradução Automática prácticas, com avanços recentes no campo de Processamento de Linguagem Natural a desbloquear novas abordagens à tarefa. Apesar das grandes melhorias que os sistemas de Estimação de Qualidade mais avançados demonstram, a maior parte negligencia uma fonte de informação promissora: o sistema de tradução sob avaliação é tratado como uma caixa negra, e apenas o seu input e output são considerados. Nesta tese, introduzimos um método que integra informação extraída dos mecanismos internos de modelos de Tradução Automática, no processo de treino de modelos de Estimação de Qualidade - ao qual chamamos Estimação de Qualidade de Caixa de Vidro. Primeiro, com o objectivo de extrair esta informação interna, aproveitamos métodos de quantificação de incerteza existentes baseados em Monte Carlo dropout, os quais publicações recentes demonstraram levar à criação de representações relevantes à estimação de qualidade de traduções automáticas. Depois, propomos uma arquitectura de modelo original baseada no Predictor-Estimator, acompanhada de um método que permite integrar as representações extraídas no processo de treino deste mesmo modelo. Finalmente, realizamos uma análise empírica, baseada em seis pares de linguagens no contexto da WMT Quality Estimation Shared Task, com resultados animadores. A análise do modelo proposto que levamos a cabo sugere várias direções para exploração e melhorias no futuro.
Aprendizagem Profunda, Processamento de Linguagem Natural, Estimação de Qualidade, Quantificação de Incerteza

outubro 1, 2021, 8:0

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

André Filipe Torres Martins

Departamento de Engenharia Electrotécnica e de Computadores (DEEC)

Professor Associado

ORIENTADOR

João Miguel Da Costa Sousa

Departamento de Engenharia Mecânica (DEM)

Professor Catedrático