Dissertação

Question Generation for the Portuguese Language EVALUATED

A geração de perguntas é uma tarefa importante no esforço de automatizar o processamento de linguagem natural, e pode ser usado em várias tarefas relevantes, tais como sistemas de tutoria automáticos, melhorar a performance de modelos capazes de extrair excertos relevantes e responder a perguntas e também permitir a chatbots conduzir uma conversa. Desenvolvimentos recentes utilizam modelos sequencia para sequencia baseados na arquitetura de transformadores capazes de adquirir resultados do estado da arte, contudo estes progressos foram feitos maioritariamente na linguagem inglesa. Com isto em mente, nós desenvolvemos diferentes modelos baseados na arquitetura de transformadores T5, usando treino supervisionado e treino sequencial autocrítico, utilizando uma versão portuguesa do conjunto de dados SQuAD v1.1 traduzida automaticamente. Comparamos os resultados obtidos com modelos linha de base na língua inglesa utilizando avaliação automática. No final é possível observar que os modelos portugueses geram questões com qualidade inferior e pior sintaxe, contudo com resultados automáticos comparáveis aos obtidos pelos modelos ingleses.
Geração de Perguntas, Transformador, Treino Sequencial Autocrítico, Aprendizagem Profunda, Processamento de Linguagem Natural, Linguagem Portuguesa;

novembro 24, 2022, 18:0

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

Bruno Emanuel Da Graça Martins

Departamento de Engenharia Electrotécnica e de Computadores (DEEC)

Professor Associado

ORIENTADOR

Pedro Alexandre Simões dos Santos

Departamento de Matemática (DM)

Professor Associado