Dissertação

Topic Detection within Public Social Networks EVALUATED

A Deteção de Tópicos é uma disciplina cujo objetivo é determinar o tema de um dado documento, a partir de um conjunto de tópicos predefinidos. Através de várias técnicas de pré-processamento, o texto de um documento é transformado em algo que um classificador automático consiga ler e interpretar. Nesta dissertação, aborda-se o tema da Deteção de Tópicos no Twitter através de uma nova técnica chamada ``Twitter Topic Fuzzy Fingerprints''. Inspirada na analogia das impressões digitais em cenas de crime, constrói-se uma lista de palavras-chave que compõem a impressão digital de um dado tópico. Posteriormente, avalia-se um conjunto de tweets cujo tema não esteja explicitado e calcula-se a sua semelhança com várias impressões digitais de tópicos. Compara-se também a eficácia deste método com a de outros dois muito populares, nomeadamente Support Vector Machines (SVM) e K-Nearest Neighbors (kNN). Os resultados apresentados revelam que o Twitter Topic Fuzzy Fingerprints obtém melhores resultados que os métodos supra mencionados. Adicionalmente, o método apresentado também é mais rápido na sua execução, o que representa um parâmetro de particular interesse quando se processa uma quantidade elevada de dados.
Deteção de Tópicos, Twitter, Fuzzy Fingerprints, Data Mining em Redes Sociais

Maio 12, 2014, 9:0

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

João Paulo Baptista de Carvalho

Departamento de Engenharia Electrotécnica e de Computadores (DEEC)

Professor Auxiliar