Dissertação

{en_GB=Cross-Lingual Argumentation Mining} {} EVALUATED

{pt=As estruturas de tipo argumentativo são um dos elementos constitutivos mais importantes do discurso usando línguas naturais, uma vez que estas ajudam a dar coerência e estrutura, principalmente se o objetivo do discurso é a persuasão ou a comunicação de informação. A extração de estruturas argumentativas desde textos de língua natural é uma tarefa com enorme potencial uma vez que a atual Web trouxe um aumento significativo nos fluxos noticiosos ou na possibilidade de partilhar opinião escrita. Esta tarefa é, contudo, de grande complexidade, quer devido às múltiplas construções que as estruturas argumentativas podem apresentar, quer devido à pouca disponibilidade de recursos, consoante as línguas em causa. Nesta dissertação apresentamos um sistema capaz de extrair estruturas de tipo argumentativo desde textos de língua natural, usando um modelo baseado numa rede neuronal profunda treinado com base em técnicas de aprendizagem autónoma supervisionada. Utilizamos dois conjuntos de dados que diferem quer no tipo de textos (i.e., notícias vs ensaios) quer na língua em que estes foram produzidos (i.e., Português vs Inglês). Testou-se ainda a possibilidade de melhorar a performance dos modelos em Português através de abordagens cross-lingual ou multi-task learning, em que se combina, no treino dos modelos, textos de diferentes línguas/tarefas. Os resultados obtidos mostram a validade de uma abordagem baseada em redes neuronais, quando comparada com outros sistemas que recorrem a outro tipo de modelos. Os resultados evidenciam ainda a existência de uma dependência da performance do modelo em relação à quantidade de texto disponível para o treino do mesmo. , en=Argumentative structures are one of the fundamental elements composing natural language utterances, since these aim at giving coherence and structure to the documents, especially if the goal of a given natural language utterance is to persuade or inform. The extraction of this kind of structures from natural language texts is a task with great potential in the current Web context, given the significant increase in news streams brought by the Web, or in the possibility to share written opinion, in fora or social networks. This task, however, has a significant complexity, due to both the multiple arrangements that argumentative structures can have, and the uneven availability of supporting resources, according to the languages chosen. In the present dissertation, we present a system capable of extracting argumentative structures from natural language texts, through the use of a deep neural network, with parameters infered through supervised machine learning techniques. Two datasets were used to support the experiments, differing both in the type of texts (i.e., news vs essays) and in the language (i.e., Portuguese vs English). We also tested the possibility to improve the performance of the Portuguese models through the usage of cross-lingual and/or multi-task learning approaches, by combining texts on different languages/tasks during model training. The achieved results show the validity of a neural network based approach, in comparison to other systems using different types of models. They also show that the performance of a model depends on the amount of text available to its training.}
{pt=Extração de argumentos, Processamento de língua natural, Redes neuronais profundas, Aprendizagem automática, en=Argument extraction, Natural language processing, Deep neural networks, Machine learning}

novembro 30, 2018, 14:30

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

Bruno Emanuel Da Graça Martins

Departamento de Engenharia Informática (DEI)

Professor Auxiliar

ORIENTADOR

Miguel Won

INESC-ID - Engenharia de Sistemas e Computadores - Investigação e Desenvolvimento

Investigador