Dissertação

Toponym Resolution in Text EVALUATED

A resolução de topónimos em texto, onde um topónimo se refere a um nome de local ou a uma referência de local, consiste na desambiguação destas referências, associando-as a uma localização única sobre a superfície da Terra (através da atribuição de coordenadas latitude e longitude). Dado que os nomes dos locais são altamente ambíguos esta tarefa é bastante desafiante. Existem várias aplicações que podem beneficiar dos resultados da resolução de topónimos, incluindo o apoio ao processamento e análise de informação geográfica em coleções extensas de documentos, assim como o suporte à geolocalização de documentos. Este trabalho visa a análise de estudos desenvolvidos anteriormente, assim como o desenvolvimento de um modelo para a resolução de topónimos considerando técnicas do estado-da-arte. A arquitetura de rede neural proposta utiliza unidades recorrentes com múltiplas entradas (o topónimo a ser desambiguado juntamente com as palavras adjacentes), aproveitando especificamente incorporações de palavras contextuais pré-treinadas (incorporações ELMo ou BERT) e unidades bidirecionais de Long Short-Term Memory (LSTM), ambas muito utilizadas para a modelação de dados textuais. Adicionalmente, o modelo proposto foi avaliado em diferentes contextos, (i) usando informações externas extraídas de dados rasterizados com informações geofísicas, incluindo cobertura terrestre, elevação do terreno, entre outras, e (ii) usando dados adicionais de artigos da Wikipédia em inglês para treinar o modelo com o objetivo de guiar e ajudar durante o treino. Os resultados obtidos mostram uma qualidade superior do método proposto, em comparação com abordagens anteriores, particularmente no cenário que envolve incorporações BERT juntamente com a adição de dados.
Análise geográfica de texto, Resolução de topónimos em texto, Aprendizagem profunda para PLN, Redes neuronais recorrentes, Representações contextuais de palavras, Propriedades geofísicas

novembro 27, 2019, 9:0

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

Bruno Emanuel Da Graça Martins

Departamento de Engenharia Informática (DEI)

Professor Auxiliar

ORIENTADOR

Jacinto Paulo Simões Estima

Instituto Politécnico de Setúbal

Prof. Ajunto Convidado