Dissertação
Question Generation for the Portuguese Language EVALUATED
A geração de perguntas é uma tarefa importante no esforço de automatizar o processamento de linguagem natural, e pode ser usado em várias tarefas relevantes, tais como sistemas de tutoria automáticos, melhorar a performance de modelos capazes de extrair excertos relevantes e responder a perguntas e também permitir a chatbots conduzir uma conversa. Desenvolvimentos recentes utilizam modelos sequencia para sequencia baseados na arquitetura de transformadores capazes de adquirir resultados do estado da arte, contudo estes progressos foram feitos maioritariamente na linguagem inglesa. Com isto em mente, nós desenvolvemos diferentes modelos baseados na arquitetura de transformadores T5, usando treino supervisionado e treino sequencial autocrítico, utilizando uma versão portuguesa do conjunto de dados SQuAD v1.1 traduzida automaticamente. Comparamos os resultados obtidos com modelos linha de base na língua inglesa utilizando avaliação automática. No final é possível observar que os modelos portugueses geram questões com qualidade inferior e pior sintaxe, contudo com resultados automáticos comparáveis aos obtidos pelos modelos ingleses.
novembro 24, 2022, 18:0
Publicação
Obra sujeita a Direitos de Autor
Orientação
ORIENTADOR
Bruno Emanuel Da Graça Martins
Departamento de Engenharia Electrotécnica e de Computadores (DEEC)
Professor Associado