Dissertação
{en_GB=Computational Detection of Irony in Textual Messages } {} EVALUATED
{pt=A utilização de técnicas de processamento de linguagem natural, na análise de conteúdo gerado por utilizadores de redes sociais, envolve a detecção do uso de instrumentos retóricos como o sarcasmo e a ironia. Estes instrumentos podem causar uma resposta errada em sistemas de sumarização de resenhas, classificadores de sentimento, sistemas de classificação de resenhas ou qualquer outro tipo de aplicação que lide com a semântica e a pragmática associada a textos em língua natural. Existem estudos que tentaram abordar a tarefa de detectar ironia através de indícios simples intrínsecos ao texto. Contudo, estes métodos não têm sido suficientes para detectar algumas frases irónicas que não têm essas incluem esses indícios. Contudo, uma nova abordagem para a classificação de texto que permite explorar informação externa (e.g., expressas na forma de word embeddings), tem vindo a ganhar uma importância crescente na área, explorando eficazmente o uso de redes neuronais como forma de melhorar os resultados. Esta dissertação descreve experiências com diferentes arquitecturas de redes neuronais, reportando os resultados obtidos no problema de detecção de ironia em texto. Os resultados das experiências mostram que as redes neuronais, empregando diferentes combinações de word embeddings, conseguem superar, em diferentes domínios, os algoritmos clássicos de aprendizagem automática na tarefa de detecção de ironia., en=Analyzing user generated content in social media, using natural language processing methods, involves facing problematic rhetorical devices, such as sarcasm and irony. These devices can cause wrong responses from review summarization systems, sentiment classifiers, review ranking systems, or any kind of application dealing with the semantics and the pragmatics of text. Studies to improve the task of detecting textual irony have mostly focused mostly on simple linguistic cues, intrinsic to the text itself, although these have been insufficient in detecting ironic sentences that have no intrinsic clues. However, a new approach for classifying text, which can be made to explore external information (e.g. in the form of pre-trained word embeddings) has been emerging, making use of neural networks with multiple layers of data processing. This dissertation focuses on experimenting with different neural network architectures for addressing the problem of detecting irony in text, reporting on experiments with different datasets, from different domains. The results from the experiments show that neural networks are able to outperform standard machine learning classifiers on the task of irony detection, on different domains and particularly when using different combinations of word embeddings.}
novembro 2, 2016, 18:0
Publicação
Obra sujeita a Direitos de Autor
Orientação
ORIENTADOR
Bruno Emanuel Da Graça Martins
Departamento de Engenharia Informática (DEI)
Professor Auxiliar
ORIENTADOR
Departamento de Engenharia Informática (DEI)
Professor Auxiliar