Dissertação

{en_GB=Quantifying Emotional Valence, Arousal and Dominance from Natural Language} {} EVALUATED

{pt=O crescimento das redes sociais chama atenção sobre a área do processamento da língua natural, em particular sobre a área de análise de sentimentos. Estudos anteriores utilizam vários métodos de classificação para a quantificação de emoções em textos, em particular recorrendo a, modelos supervisionados que utilizam conjuntos de dados préviamente anotados. Muitos destes estudos também dependem de métodos como redes neurais profundas. No entanto, tanto quanto se sabe, ainda há uma carência quando se trata da utilização de redes neurais profundas para inferir emoções de línguas que tenham poucos dados de treino disponíveis. Esta tese avalia comparativamente várias técnicas para a quantificação de emoções, nomeadamente perceptrões multicamada (MLP), redes recorrentes (LSTM), redes convolucionais (CNN) e mecanismos de atenção, bem como embeddings trans-linguísticos com o objetivo de combinar dados de múltiplas línguas, com vista a estender o estado da arte nesta área. Os métodos propostos foram validados com datasets usados em estudos anteriores, considerando valência, entusiasmo e dominância em várias línguas. Os resultados obtidos suportam a afirmação que modelos de aprendizagem conseguem prever emoções expressas textualmente, mesmo em várias línguas. Foram obtidos resultados comparáveis, e até superiores, a trabalhos anteriores neste ramo, mesmo comparando com modelos que preveem emoções para dados monolingues. , en=The growth of social media platforms has drawn attention to natural language processing, especially to the sentiment analysis field. Previous studies have covered several classification and regression methods to quantify emotions expressed in textual documents, in particular, supervised models leveraging hand-labelled training datasets. Many of these studies have also relied on neural network methods. However, to the best of my knowledge, there is still a gap when using deep learning to infer emotions from languages that have few or no training resources. This M.Sc. thesis compares the use of multi-layer perceptrons (MLP), recurrent neural networks based on long short-term memory units (LSTM), convolutional neural networks (CNN), and different types of attention mechanisms, as well as cross-language embeddings, as an approach to combine training data in multiple languages to extend the state-of-the-art in this field of emotion analysis. The proposed methods were evaluated with datasets used in previous studies, anotated with ratings regarding valence, arousal and dominance, in several languages. The obtained results support the understanding that machine learning (ML) models can predict emotions expressed in text, even in several languages. The proposed methods perform comparably, and even outperform, previous work in this field, that mostly produced models that use only monolingual data. }
{pt=Processamento de Linguagem Natural, Análise de Sentimento, Redes Neurais, Valor Emocional, Análise Multilíngue, en=Natural Language Processing, Sentiment Analysis, Neural Networks, Emotional Ratings, Multilingual Analysis}

outubro 7, 2020, 9:0

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

Bruno Emanuel Da Graça Martins

Departamento de Engenharia Informática (DEI)

Professor Auxiliar