Dissertação

{en_GB=Using Textual Transcripts of Parliamentary Interventions for Profiling Portuguese Politicians} {} EVALUATED

{pt=Este trabalho apresenta um estudo experimental sobre o tópico de caracterização de intervenientes políticos através de transcrições textuais das suas intervenções no Parlamento. Técnicas de aprendizagem supervisionada foram utilizadas para construir modelos, que tentam classificar políticos portugueses de acordo com o seu género, grupo de idade, afiliação e orientação política. As experiências foram feitas através de diferentes tipos de modelos de classificação, usando técnicas de pesagem de características do estado da arte, usando caraterísticas estilométricas do estado da arte para caracterização de autores e usando características derivadas de clustering de palavras ou análise semântica concisa. Experiências com a técnica de regularização group Lasso para modelos de regressão logística também foram realizadas. As experiências mostraram que a o uso da linguagem é de facto indicativo das características e ideologia das pessoas., en=This work presents an experimental study on the subject of profiling political actors through textual transcriptions of their parliamentary interventions. Supervised learning techniques were used to learn models, which attempt to classify Portuguese politicians according to their gender, their age group, or their political affiliation and orientation. Experiments were made using different types of classification models, using state-of-the-art feature weighting schemes, using stylometric features from state-of-the-art approaches for author profiling, and using features derived from distributional word clustering or from concise semantic analysis. Experiments with the group Lasso regularization technique for logistic regression models were also performed. The experiments showed that language usage is indeed indicative of a person’s characteristics and ideology.}
{pt=Aprendizagem supervisionada, Classificação de texto, Características estilométricas, Caracterizar intervenientes políticos, en=Supervised learning, Text classification, Stylometric features, Profiling political actors}

maio 31, 2016, 10:30

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

Bruno Emanuel Da Graça Martins

Departamento de Engenharia Informática (DEI)

Professor Auxiliar

ORIENTADOR

David Manuel Martins de Matos

Departamento de Engenharia Informática (DEI)

Professor Auxiliar