Dissertação
Toponym Disambiguation with Contextual Embeddings EVALUATED
A resolução de topónimos consiste na tarefa de atribuir localizações na Terra (por exemplo, através de coordenadas geográficas) aos respetivos nomes de lugares (topónimos) previamente detetados num documento textual. Dentro da resolução de topónimos, este trabalho foca-se especificamente na tarefa de desambiguação de topónimos. Devido à elevada ambiguidade dos nomes de lugares, esta é uma tarefa desafiante, uma vez que múltiplos lugares podem partilhar o mesmo nome ou ter múltiplas designações para a mesma localização. Os resultados da desambiguação de topónimos têm várias aplicações práticas, tais como melhorar a recuperação de informação, permitir uma melhor interpretação de dados textuais e apoiar aplicações que dependem de informação geográfica precisa. Nesta dissertação, temos como objetivo analisar estudos anteriores na área e desenvolver um modelo para a desambiguação de topónimos utilizando técnicas avançadas de processamento de linguagem natural. Apresentamos um novo método de redes neuronais baseado no modelo de linguagem pré-treinado LUKE. Ao incorporar os knowledge-based embeddings do LUKE, aproveitamos a vantagem no seu contextual understanding para melhorar a precisão da nossa tarefa de desambiguação. O modelo proposto foi testado em coleções de documentos textuais utilizados e desenvolvidos em estudos anteriores, e os resultados obtidos mostram que a nossa abordagem pode superar significativamente estudos anteriores.
julho 3, 2023, 10:30
Publicação
Obra sujeita a Direitos de Autor
Orientação
ORIENTADOR
Bruno Emanuel Da Graça Martins
Departamento de Engenharia Electrotécnica e de Computadores (DEEC)
Professor Associado