Dissertação

Abstractive Multi-document Summarization using Topical Simplicial Curves EVALUATED

Explorámos a eficácia das curvas simpliciais, um método de representação de palavras sensı́vel ao contexto, motivados pelas suas propriedades matemáticas intrı́nsecas (e.g., diferenciação e facilidade de combinação de representações), na tarefa de sumarização multi-documento. Para este efeito, adaptámos o framework das curvas simpliciais para uma nova representação matricial com base em representações densas de palavras e desenvolvemos uma álgebra sobre objetos no simplex. Utilizamos os corpora de sumarização multi-documento DUC 2006 e DUC 2007. Os sumários gerados são comparados com os sumários de referência utilizando as métricas de avaliação ROUGE-1, ROUGE-2 e ROUGE-L. Comparado com a pontuação ROUGE-1 de 0.29 da baseline mais simples escolhida, o nosso método obtém uma pontuação ROUGE-1 de 0.04, ficando assim aquém das expectativas. Concluı́mos com uma exploração dos resultados obtidos e sugerimos outras aplicações do método das curvas simpliciais.
Sumarização multi-documento, Curvas simpliciais, Representação de palavras

janeiro 20, 2021, 18:0

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

David Manuel Martins de Matos

Departamento de Engenharia Informática (DEI)

Professor Associado

ORIENTADOR

Ricardo Daniel Santos Faro Marques Ribeiro

ISCTE

Professor Associado