Dissertação

Difficulty Estimation of Machine Translation EVALUATED

A estimação da dificuldade de tradução de um texto ou de uma frase é uma tarefa complexa e pouco explorada. Este trabalho propõe sistemas automáticos capazes de prever a dificuldade de tradução de um texto e de uma frase. O tópico está relacionado com a tarefa de estimação da qualidade. Por isso, os métodos de classificação tiveram em consideração as características adotadas nesta tarefa e os valores do MQM. O método proposto teve em consideração as anotações feitas por um experiente anotador, e as características sugeridas por este. A principal contribuição reside no estudo da dificuldade de tradução ao nível do texto e da frase, e na construção de dois classificadores que atingem os 75.50 % de exatidão ao nível do texto e 77.67 % ao nível da frase. Os resultados sugerem que o MQM pode avaliar a dificuldade de tradução e que as características de qualidade se correlacionam com a dificuldade. Foi possível verificar que existe uma relação da dificuldade de tradução com a legibilidade do texto e com a HTER da frase. Por último, verificou-se que basta que uma frase seja difícil de traduzir para que o texto a que pertence também o seja. O sistema agora desenvolvido irá ser utilizado para selecionar editores de forma mais eficiente, e consequentemente melhorar a qualidade final da tradução. Este trabalho apresenta alguns resultados promissores e irá ajudar projetos futuros na área da dificuldade de tradução.
aprendizagem de máquina supervisionada, dificuldade de tradução, métricas de avaliação de legibilidade, tradução automática

Novembro 2, 2017, 11:30

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

João de Almeida Vanelas da Graça

Unbabel

Especialista

ORIENTADOR

Isabel Maria Martins Trancoso

Departamento de Engenharia Electrotécnica e de Computadores (DEEC)

Professor Catedrático