Dissertação

{en_GB=Combining Similarity Features and Deep Representation Learning for Stance Detection in the Context of Checking Fake News} {} EVALUATED

{pt=Neste trabalho, são abordadas técnicas para auxiliar a deteção de notícias falsas. Concretamente, esta dissertação propõe uma abordagem para resolver o problema da deteção automática de postura (stance detection), tendo como base o problema de inferência em língua natural. Em ambas as tarefas, o desafio é prever o tipo de relação entre dois pedaços de texto. No caso da tarefa de deteção de postura, esta previsão é feita através de uma rede neuronal que combina word embeddings, unidades recorrentes, atenção neuronal, max-pooling, e extração de características externas. Esta rede neuronal explora também a natureza hierárquica dos dados à disposição, modelando cada frase como uma sequência de palavras, e um documento como uma sequência de frases. Uma das contribuições principais desta tese assenta na quantificação da utilidade da tarefa de inferência entre frases para a tarefa de deteção de postura. Tal hipótese é demonstrada inicializando os pesos da componente responsável por codificar frases na arquitetura neuronal da tarefa de deteção de postura, com os pesos da componente homóloga da tarefa de inferência. Para além disso, foram também realizados testes onde os modelos de inferência são utilizados na tarefa de deteção de postura para criar um alinhamento entre o título de um artigo e as várias frases que o compõem. Os resultados experimentais confirmam o contributo das componentes acima descritas. O melhor modelo atinge valores de exatidão de 83.38% na tarefa de deteção de postura proposta no contexto do Fake News Challenge, definindo um novo estado-da-arte nessa mesma tarefa., en=This work addresses the development of techniques to assist on the detection of fake news. Concretely, this dissertation proposes an automated approach to address the stance detection problem, based on the natural language inference task. In both tasks, the challenge is to predict the kind of relation between two pieces of text. In the case of stance detection, this prediction is obtained by leveraging a neural network that combines word embeddings, recurrent units, neural attention, max-pooling, and feature engineering. This neural network also explores the hierarchical nature of the available data, modelling sentences as sequences of words, and each document as a sequence of sentences. One of the main contributions of this thesis lies in quantifying the usefulness of the natural language inference task for the stance detection problem. This hypothesis is demonstrated when initializing the weights of the sentence encoding component in the stance detection architecture with the weights of the equivalent component in the natural language inference task. Furthermore, several tests were conducted using the natural language inference models in the stance detection problem, to generate an alignment between the headline of an article and several sentences that compose it. The experimental results attest to the usefulness of the contributions mentioned in the previous paragraphs. The best model achieves a weighted accuracy score of 83.38\% in the stance detection task proposed in the context of the Fake News Challenge, hence defining a new state-of-the-art result.}
{pt=Deteção de Notícias Falsas, Deteção de Postura, Inferência em Língua Natural, Aprendizagem com Redes Profundas, Processamento de Língua Natural, Inteligência Artificial, en=Fake News Detection, Stance Detection, Natural Language Inference, Deep Learning, Natural Language Processing, Artificial Intelligence}

Outubro 31, 2018, 10:30

Orientação

ORIENTADOR

Bruno Emanuel Da Graça Martins

Departamento de Engenharia Informática (DEI)

Professor Auxiliar

ORIENTADOR

Pável Pereira Calado

Departamento de Engenharia Informática (DEI)

Professor Associado