Dissertação
Retrieval-based Adaptation For Machine Translation Applications Using Large Language Models And In-Context Learning EVALUATED
Tradução automática, a tarefa de, automaticamente, traduzir uma frase de uma língua para outra, atingiu grande sucesso nos últimos anos, principalmente pelo desenvolvimento e avanço de arquiteturas neuronais. Por outro lado, os grandes modelos de linguagem tiveram também um grande desenvolimento que resultou num impacto de dimensão mundial em várias indústrias diferentes, principalmente pela sua capacidade de executa diferentes tarefas sem precisar de treino adicional, que tem o nome de aprendizagem contextual. Esta tese tira proveito da recentemente descoberta técnica de aprendizagem contextual, utilizando os mesmos grandes modelos de linguagem para três tarefas dentro de tradução automática, que são a avaliação de traduções automáticas, a tradução de frases com restrições de terminologia e a pós-edição automática de traduções automáticas. Esta técnica usa exemplos que são retirados de um banco de dados guardado localmente com tamanho fixo. O conteúdo deste banco, assim como as mensagens enviadas para o grande modelo de linguagem para tirar proveito da aprendizagem contextual são alvo de estudo nesta tese. Através desta tese mostramos que, embora estes modelos de linguagem não tenham sido treinados especificamente para as tarefas propostas, conseguem ter desempenhos fortes e a par das melhores arquite- turas em cada área, com muito menos custo e dificuldade de implementação, face ao que é costume nestas áreas. Além disto, mostramos que estes modelos demonstram uma forte capacidade de se adaptarem a diferentes cenários, como muito pouco esforço, uma habilidade previamente não existente na área de tradução automática.
novembro 17, 2023, 16:0
Publicação
Obra sujeita a Direitos de Autor
Orientação
ORIENTADOR
Departamento de Engenharia Electrotécnica e de Computadores (DEEC)
Professor Associado