Dissertação

Information Extraction on Policy Preferences from Party Manifestos, Political Speeches and Opinion Articles EVALUATED

Esta dissertação apresenta uma abordagem multilingue, suportada em modelos linguísticos contextuais (i.e., modelos baseados na abordagem BERT), para a análise de documentos textuais de carácter político, considerando especificamente um procedimento composto por duas tarefas: (a) identificar segmentos de texto que correspondam a declarações políticas (i.e., frases relevantes descrevendo posições políticas), e (b) classificar os segmentos que contêm declarações políticas de acordo com uma taxonomia derivada dos codebooks dos projetos Comparative Agendas e Manifesto Project. Ambas estas tarefas de classificação correspondem a problemas desafiantes que raramente têm sido abordados com sucesso no seio da comunidade do PLN, e.g., devido à ambiguidade semântica, à escassez de recursos de base, ou ao facto de os dados disponíveis para a classificação serem bastante desequilibrados. A abordagem proposta foi avaliada através de experiências em textos portugueses, brasileiros, italianos e espanhóis, recolhidos dos projetos Comparative Manifestos e Comparative Agendas, com resultados que sugerem que a classificação automática de conteúdos é, de facto, uma abordagem viável para estudos em larga escala no âmbito das ciências sociais computacionais.
Classificação Textual, Extração de Informação, Modelos Transformer, Análise de Textos Políticos, Ciências Sociais Computacionais

janeiro 14, 2021, 16:30

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

Bruno Emanuel Da Graça Martins

Departamento de Engenharia Informática (DEI)

Professor Auxiliar

ORIENTADOR

Miguel Daiyen Carvalho Won

INESC-ID

Especialista