Dissertação

{en_GB=Mapping Urban Areas Leveraging the Analysis of Ground-Level Imagery with Convolutional Neural Networks} {} EVALUATED

{pt=Os avanços tecnológicos verificados em dispositivos móveis têm vindo a permitir um acesso cada vez mais fácil a ferramentas fotográficas, como a câmara de um smartphone. Este facto, juntamente com os avanços nas tecnologias de conectividade, criou a possibilidade de uma partilha simples de fotografias na web. Em plataformas como o Flickr ou Geograph, é possível encontrar-se uma quantidade quase infinita de imagens partilhadas, frequentemente acompanhadas de informação de geolocalização. Estas constituem fontes de informação das quais se podem extrair detalhes sobre a área onde foram obtidas. Esta dissertação tem como objetivo a exploração da informação disponível nestas colecções de modo a criar dois tipos de mapeamento: o uso dado ao terreno e a beleza cénica. Nestes mapeamentos, as imagens ao nível do solo podem fazer a diferença na obtenção de resultados mais precisos. O procedimento desenvolvido consiste numa recolha de fotografias sobre uma região, seguido da geração de mapeamentos do terreno, através do uso de redes convolucionais e recorrentes, de modo a combinar a informação proveniente de sequências fotográficas. O método apresentado possibilita o uso de um modelo de mapeamento automático alternativo ao mapeamento manual do terreno, mesmo quando aplicado em áreas onde existe uma variação significativa na densidade de fotografias disponibilizadas por zona. No final deste trabalho, são apresentados dois mapeamentos, um do uso do terreno e outro de beleza cénica, que permitem exemplificar de que maneira o uso de redes convolucionais e recorrentes pode ser aproveitado para a análise e extração de informação de sequências de imagens., en=The technological advancements in mobile devices have allowed people to easily take pictures and share them on the web. Within platforms like Flickr and Geograph.uk, we find an almost infinite number of community-shared pictures, often containing the location where they were taken, which might provide information about the surrounding area. This paper proposes an approach that aims to exploit such information to tackle two mapping tasks, land-use and scenic-beauty mapping, which are two examples for which ground-level photos can be the key to achieve accurate results. The procedure explored in this work consists of collecting data for a study region, which comprises the city of London, and generating mappings for both tasks by making use of convolutional and recurrent neural networks. This work presents the results obtained by aggregating images into sequences, which are initially processed by a convolutional neural network and transformed into sequences of features, that are then fed to recurrent neural units, in order to combine their information and extract projections for either land-use or scenic-beauty mapping. The proposed method presents itself as an automated alternative to hand-annotations for terrain mapping, and as an improvement over the analysis of individual images. In the end, the result of applying the methods proposed in this work is presented in the form of two maps for the study region, one for land-use classes and one for scenic beauty, which were automatically generated based on the information extracted from the available set of community-shared photographs.}
{pt=Dados Geo-Espaciais, Informação Partilhada em Redes Sociais, Mapeamento de Uso da Terra, Beleza cénica, Redes Convolucionais Profundas, Redes Recorrentes, en=Geospatial Data, Community-Shared Information, Land-Use Mapping, Scenic-Beauty Mapping, Deep Convolutional Neural Networks, Recurrent Neural Networks}

Janeiro 28, 2021, 18:0

Orientação

ORIENTADOR

Bruno Emanuel Da Graça Martins

Departamento de Engenharia Informática (DEI)

Professor Auxiliar

ORIENTADOR

Jacinto Paulo Simões Estima

INESC-ID

Especialista