Dissertação

Text Mining Methods for Mapping Opinions from Georeferenced Documents EVALUATED

Com a crescente disponibilidade de grandes volumes de informação textual na Internet, técnicas de text mining têm vindo a ganhar um interesse crescente. Um dos problemas específicos de text mining diz respeito à detecção de expressões textuais que se referem a opiniões sobre determinados temas e serviços. Um segundo problema de text mining, que tem vindo a ganhar atenção por parte da comunidade científica, é a identificação da localização geográfica que melhor se relaciona com o conteúdo de documentos. Na minha tese de mestrado, eu comparei empiricamente técnicas automatizadas, baseadas em modelos de linguagem, para a atribuição de documentos a classes de opinião e às coordenadas geoespaciais de latitude e longitude que melhor resumem os seus conteúdos. Usando essa informação, analisei a possibilidade de construção de mapas temáticos que retratam a incidência de determinadas classes de opiniões, extraídos de documentos, em diferentes áreas geográficas. O melhor método desempenho para a geocodificação de documentos textuais obteve um erro de previsão médio de 265 quilómetros. No que diz respeito ao mining de opiniões, a análise de opiniões foi feita numa escala binária e um esquema de escala de cinco pontos, onde a escala binária obteve uma exatidão de 0,80, enquanto que a escala de cinco pontos obteve uma exatidão de 0,50. Utilizou-se uma técnica conhecida como estimativa da densidade Kernel para o desenvolvimento de mapas temáticos, e uma análise empírica mostrou que os mapas obtidos através de extracção automática de facto correspondem a uma representação precisa para a distribuição geográfica de opiniões.
Recuperação de Informação Geográfica, Geocodificação de Documentos, Classificadores de Modelos de Linguagem, Prospecção de Opinião, Mapeamento Temático

Novembro 8, 2012, 13:0

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

Bruno Emanuel Da Graça Martins

Departamento de Engenharia Informática (DEI)

Professor Auxiliar