Dissertação

{en_GB=Semantic Segmentation and Colorization of Grayscale Aerial Imagery with W-Net Models} {} EVALUATED

{pt=A segmentação semântica de imagens aéreas detetadas remotamente é atualmente uma tarefa amplamente explorada, que consiste em determinar, para cada píxel numa imagem, a classe mais provável a que esse píxel pertence desde um conjunto de possíveis classes. No âmbito de imagens de alta resolução para áreas urbanas, podemos assim discriminar a que classe um determinado píxel pertence: estrada, edifício ou vegetação. Os trabalhos anteriores têm abordado a segmentação semântica em aplicação a imagens modernas de alta resolução. No entanto, existem também aplicações importantes para a segmentação de imagens históricas a preto e branco. Exemplos incluem o desenvolvimento de mapas de estradas históricos, ou a desagregação dasimétrica de dados históricos considerando contornos de localização para edifícios. Considerando métodos recentes baseados em redes neuronais totalmente convolucionais, e tendo como objetivo a segmentação de imagens aéreas a preto e branco, avaliei o comportamento de uma versão modificada do modelo W-Net que tem alcançado bons resultados em outros tipos de tarefas de segmentação. O modelo W-Net proposto é treinado para simultaneamente segmentar as imagens e reconstruir (ou inferir) a cor das imagens fornecidas a partir de representações intermédias. Através de experiências com conjuntos de imagens que têm sido utilizados frequentemente em trabalhos anteriores, foi possível averiguar que a arquitetura W-Net proposta produz bons resultados tanto para a tarefa de colorir como para a de segmentar as imagens. A arquitetura proposta supera um sistema base considerado como referência, e também supera outras abordagens, propostas recentemente na literatura, quando considerando a segmentação de imagens coloridas., en=The semantic segmentation of remotely sensed aerial imagery is nowadays an extensively explored task, concerned with determining, for each pixel in an input image, the most likely class label from a finite set of possible labels (e.g., discriminating pixels referring to roads, buildings, or vegetation, frequently in high-resolution images depicting urban areas). Most previous work in the area has addressed the application to high-resolution modern images, although the semantic segmentation of historical grayscale aerial photos can also have important applications (e.g., to support the development of historical road maps, or the development of dasymetric disaggregation approaches leveraging historical building footprints). Following recent work in the area related to the use of fully-convolutional neural networks for semantic segmentation, and specifically envisioning the segmentation of grayscale aerial imagery, I evaluated the performance of an adapted version of the W-Net architecture, which has achieved very good results on other types of image segmentation tasks. Our W-Net model is trained to simultaneously segment images and reconstruct (or predict) the color of the input images from intermediate representations. Through experiments with distinct datasets frequently used in previous studies, I show that the proposed W-Net architecture is quite effective in both tasks (i.e., coloring and segmenting images). The proposed approach outperforms a baseline corresponding to the U-Net model for the segmentation of both colored and grayscale imagery, and it also outperforms some of the other recently proposed approaches when considering colored imagery.}
{pt=Segmentação Semântica de Fotos Aéreas, Redes Neuronais Totalmente Convolucionais, Arquitetura W-Net, Análise de Fotos Aéreas a Preto e Branco, en=Semantic Segmentation of Aerial Imagery, Fully-Convolutional Neural Networks, W-Net Architecture, Analyzing Grayscale Aerial Photos}

Novembro 20, 2019, 16:30

Orientação

ORIENTADOR

Bruno Emanuel Da Graça Martins

Departamento de Engenharia Informática (DEI)

Professor Auxiliar

ORIENTADOR

Jacinto Estima

Instituto Politécnico de Setúbal

Professor Adjunto Convidado