Dissertação
Abstractive Multi-document Summarization using Topical Simplicial Curves EVALUATED
Explorámos a eficácia das curvas simpliciais, um método de representação de palavras sensı́vel ao contexto, motivados pelas suas propriedades matemáticas intrı́nsecas (e.g., diferenciação e facilidade de combinação de representações), na tarefa de sumarização multi-documento. Para este efeito, adaptámos o framework das curvas simpliciais para uma nova representação matricial com base em representações densas de palavras e desenvolvemos uma álgebra sobre objetos no simplex. Utilizamos os corpora de sumarização multi-documento DUC 2006 e DUC 2007. Os sumários gerados são comparados com os sumários de referência utilizando as métricas de avaliação ROUGE-1, ROUGE-2 e ROUGE-L. Comparado com a pontuação ROUGE-1 de 0.29 da baseline mais simples escolhida, o nosso método obtém uma pontuação ROUGE-1 de 0.04, ficando assim aquém das expectativas. Concluı́mos com uma exploração dos resultados obtidos e sugerimos outras aplicações do método das curvas simpliciais.
janeiro 20, 2021, 18:0
Publicação
Obra sujeita a Direitos de Autor
Orientação
ORIENTADOR
Departamento de Engenharia Informática (DEI)
Professor Associado