Dissertação

Resolution of Place Name References in Textual Documents EVALUATED

Com a crescente da disponibilização de grandes volumes de informação textual na Web, técnicas de text mining têm ganho um interesse crescente. Um problema de text mining particularmente interessante relaciona-se com o reconhecimento e a desambiguação de nomes de locais mencionados em textos, uma tarefa essencial para a análise de conteúdos textuais, de um ponto-de-vista geográfico. No contexto da minha tese de mestrado, desenvolvi e avaliei um sistema que usa métodos de machine learning na resolução de referências a locais em textos, i.e. para relacionar strings que denotam localizações em documentos, às correspondentes coordenadas geo-espaciais. O método proposto usa uma combinação de dois modelos, no qual um primeiro learner baseado em Conditional Random Fields é usado para anotar referências geo-espaciais nos textos, e em que de seguida um segundo learner, baseado num modelo de regressão, é usado para avaliar e escolher o melhor candidato de um conjunto de possiveis candidatos de desambiguação para as referências geo-espaciais que foram inicialmente anotadas. O método proposto foi avaliado em corpora inglês contendo anotações SpatialML para referências geográficas. Especificamente, medi uma accuracy de 0.95 e 0.55, respectivamente para as tarefas de reconhecimento e desambiguação para referências geoespaciais que são nomes próprios no corpus inglês SpatialML, e de 0.61 e 0.03, respectivamente para as tarefas de reconhecimento e desambiguação para referências nominais, no dataset SpatialML. No dataset LGL, o método proposto atingíu níveis de accuracy de 0.61 e 0.17, respectivamente para as tarefas de reconhecimento e desambiguação.
Resolução de Referências Geo-espaciais, Machine Learning, Recuperação de Informação Geográfica

novembro 8, 2012, 16:30

Documentos da dissertação ainda não disponíveis publicamente

Orientação

CO-ORIENTADOR

Maria Luísa Torres Ribeiro Marques da Silva Coheur

Departamento de Engenharia Informática (DEI)

Professor Auxiliar

ORIENTADOR

Bruno Emanuel Da Graça Martins

Departamento de Engenharia Informática (DEI)

Professor Auxiliar