Dissertação

{en_GB=Toponym Resolution with Deep Neural Networks} {} EVALUATED

{pt=Resolução de topónimos, i.e., inferir as coordenadas geográficas de uma string que representa o nome de um local, é um problema fundamental no contexto de várias aplicações relacionadas com extração de informação geográfica e das ciências de informação geográfica. O estado-da-arte actual depende de regras heurísticas, combinadas com métodos de aprendizagem automática favorecendo métodos lineares simples. Esta dissertação apresenta uma abordagem que favorece Gated Recurrent Units (GRUs), um tipo de rede neuronal recorrente que pode ser utilizada para modelar dados sequenciais, para construir representações das sequências de palavras e caractéres que correspondem às strings que serão associadas às suas respectivas coordenadas geográficas. Estas representações são posteriormente combinadas e passadas como input para nós de feed-forward levando à sua previsão. O modelo pode ser treinado end-to-end com um conjunto de ocurrências de locais rotuladas, e.g., extraidas da Wikipedia. Esta dissertação apresenta os resultados de uma vasta avaliação da performance do método proposto, usando datasets de outros trabalhos na área. O modelo conseguiu alcançar resultados interessantes, por vezes melhores do que alguns métodos do estado-da-arte de resolução de topónimos., en=Toponym resolution, i.e. inferring the geographic coordinates of a given string that represents a placename, is a fundamental problem in the context of several applications related to geographical information retrieval and to the geographical information sciences. The current state-of-the-art relies on heuristic rules, together with machine learning methods leveraging simple linear methods. This dissertation advances an approach leveraging Gated Recurrent Units (GRUs), a type of recurrent neural network architecture that can be used for modeling sequential data, to build representations from the sequences of words and characters that correspond to the strings that are to be associated with the coordinates, together with their usage context (i.e., the surrounding words). These representations are then combined and passed to feed-forward nodes, finally leading to a prediction decision. The entire model can be trained end-to-end with a set of labeled placename occurrences, e.g., collected from Wikipedia. This dissertation presents the results of a wide-ranging evaluation of the performance of the proposed method, using previous works datasets. The model achieved some interesting results, sometimes even outperforming state-of-the-art toponym resolution methods.}
{pt=resolução de topónimos, redes neuronais, redes neuronais recorrentes, recuperação de informação geográfica, en=toponym resolution, deep neural networks, recurrent neural networks, geographic information retrieval}

Novembro 13, 2017, 9:30

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

Bruno Emanuel Da Graça Martins

Departamento de Engenharia Informática (DEI)

Professor Auxiliar

ORIENTADOR

Miguel Daiyen Carvalho Won

Departamento de Engenharia Electrotécnica e de Computadores (DEEC)

Prof Auxiliar Convidado