
{en_GB=Difficulty Estimation of Machine Translation}

{pt=A estimação da dificuldade de tradução de um texto ou de uma frase é uma tarefa complexa e pouco explorada. Este trabalho propõe sistemas automáticos capazes de prever a dificuldade de tradução de um texto e de uma frase. O tópico está relacionado com a tarefa de estimação da qualidade. Por isso, os métodos de classificação tiveram em consideração as características adotadas nesta tarefa e os valores do MQM. O método proposto teve em consideração as anotações feitas por um experiente anotador, e as características sugeridas por este. A principal contribuição reside no estudo da dificuldade de tradução ao nível do texto e da frase, e na construção de dois classificadores que atingem os 75.50 % de exatidão ao nível do texto e 77.67 % ao nível da frase. Os resultados sugerem que o MQM pode avaliar a dificuldade de tradução e que as características de qualidade se correlacionam com a dificuldade. Foi possível verificar que existe uma relação da dificuldade de tradução com a legibilidade do texto e com a HTER da frase. Por último, verificou-se que basta que uma frase seja difícil de traduzir para que o texto a que pertence também o seja. O sistema agora desenvolvido irá ser utilizado para selecionar editores de forma mais eficiente, e consequentemente melhorar a qualidade final da tradução. Este trabalho apresenta alguns resultados promissores e irá ajudar projetos futuros na área da dificuldade de tradução., en=Estimating the translation difficulty is a complex and little explored task. This thesis proposes automatic systems capable of predicting the translation difficulty of both texts and isolated sentences. The topic is closely related to the quality estimation task. Hence, our classification method took into account the values of the MQM and the features adopted in the quality estimation task. The proposed method also took into account the annotations made by an expert annotator, and the features suggested by him. The main contribution of this work lies in the study of translation difficulty at both text and sentence levels, and in the development of two classifiers that reach 75.50 % accuracy at the text level and 77.67 % at the sentence level. The results suggest that MQM can assess the sentence translation difficulty and that the quality features correlate with difficulty. There is a relationship of the translation difficulty with the text readability and the HTER of a sentence. Finally, it was found that a sentence that is difficult to translate is enough for the text to which it belongs to be so. The developed system will be used to select more efficiently the editors, and thus improve the final quality of the translation. This dissertation presents promising results and may help future projects in the area of translation difficulty.}
{pt=aprendizagem de máquina supervisionada, dificuldade de tradução, métricas de avaliação de legibilidade, tradução automática, en=machine translation, readability assessment metrics, supervised machine learning, translation difficulty}

novembro 2, 2017


João de Almeida Vanelas da Graça




Isabel Maria Martins Trancoso

