Dissertação

Cross-Lingual Argumentation Mining EVALUATED

As estruturas de tipo argumentativo são um dos elementos constitutivos mais importantes do discurso usando línguas naturais, uma vez que estas ajudam a dar coerência e estrutura, principalmente se o objetivo do discurso é a persuasão ou a comunicação de informação. A extração de estruturas argumentativas desde textos de língua natural é uma tarefa com enorme potencial uma vez que a atual Web trouxe um aumento significativo nos fluxos noticiosos ou na possibilidade de partilhar opinião escrita. Esta tarefa é, contudo, de grande complexidade, quer devido às múltiplas construções que as estruturas argumentativas podem apresentar, quer devido à pouca disponibilidade de recursos, consoante as línguas em causa. Nesta dissertação apresentamos um sistema capaz de extrair estruturas de tipo argumentativo desde textos de língua natural, usando um modelo baseado numa rede neuronal profunda treinado com base em técnicas de aprendizagem autónoma supervisionada. Utilizamos dois conjuntos de dados que diferem quer no tipo de textos (i.e., notícias vs ensaios) quer na língua em que estes foram produzidos (i.e., Português vs Inglês). Testou-se ainda a possibilidade de melhorar a performance dos modelos em Português através de abordagens cross-lingual ou multi-task learning, em que se combina, no treino dos modelos, textos de diferentes línguas/tarefas. Os resultados obtidos mostram a validade de uma abordagem baseada em redes neuronais, quando comparada com outros sistemas que recorrem a outro tipo de modelos. Os resultados evidenciam ainda a existência de uma dependência da performance do modelo em relação à quantidade de texto disponível para o treino do mesmo.
Extração de argumentos, Processamento de língua natural, Redes neuronais profundas, Aprendizagem automática

Novembro 30, 2018, 14:30

Documentos da dissertação ainda não disponíveis publicamente

Orientação

ORIENTADOR

Bruno Emanuel Da Graça Martins

Departamento de Engenharia Informática (DEI)

Professor Auxiliar

ORIENTADOR

Miguel Won

INESC-ID - Engenharia de Sistemas e Computadores - Investigação e Desenvolvimento

Investigador