Dissertação
Toponym Resolution in Text EVALUATED
A resolução de topónimos em texto, onde um topónimo se refere a um nome de local ou a uma referência de local, consiste na desambiguação destas referências, associando-as a uma localização única sobre a superfície da Terra (através da atribuição de coordenadas latitude e longitude). Dado que os nomes dos locais são altamente ambíguos esta tarefa é bastante desafiante. Existem várias aplicações que podem beneficiar dos resultados da resolução de topónimos, incluindo o apoio ao processamento e análise de informação geográfica em coleções extensas de documentos, assim como o suporte à geolocalização de documentos. Este trabalho visa a análise de estudos desenvolvidos anteriormente, assim como o desenvolvimento de um modelo para a resolução de topónimos considerando técnicas do estado-da-arte. A arquitetura de rede neural proposta utiliza unidades recorrentes com múltiplas entradas (o topónimo a ser desambiguado juntamente com as palavras adjacentes), aproveitando especificamente incorporações de palavras contextuais pré-treinadas (incorporações ELMo ou BERT) e unidades bidirecionais de Long Short-Term Memory (LSTM), ambas muito utilizadas para a modelação de dados textuais. Adicionalmente, o modelo proposto foi avaliado em diferentes contextos, (i) usando informações externas extraídas de dados rasterizados com informações geofísicas, incluindo cobertura terrestre, elevação do terreno, entre outras, e (ii) usando dados adicionais de artigos da Wikipédia em inglês para treinar o modelo com o objetivo de guiar e ajudar durante o treino. Os resultados obtidos mostram uma qualidade superior do método proposto, em comparação com abordagens anteriores, particularmente no cenário que envolve incorporações BERT juntamente com a adição de dados.
novembro 27, 2019, 9:0
Publicação
Obra sujeita a Direitos de Autor
Orientação
ORIENTADOR
Bruno Emanuel Da Graça Martins
Departamento de Engenharia Informática (DEI)
Professor Auxiliar