Dissertação

{en_GB=Efficient Feature Extraction for Person Re-identification via Knowledge Distillation and Kernel Pruning} {} EVALUATED

{pt=Re-identificação consiste em registar todas as ocorrências captadas por imagem ou vídeo por várias câmaras. É uma tarefa complexa devido ao facto de as imagens serem captadas em ambientes nem sempre favoráveis, como por exemplo sistemas de videovigilância em centros comerciais cuja qualidade está longe de ser ideal. Acresce ainda a circunstância de as pessoas nem sempre estarem posicionadas de frente à câmara, podendo mesmo estar parcialmente ocultas. Mais recentemente, a re-identificação tem sido objeto de vários estudos devido ao desempenho alcançado por novas arquiteturas que recorrem a métodos de aprendizagem profunda. Esta tese tem como objetivo desenvolver um sistema de re-identificação com vista à sua utilização num contexto real, recorrendo a aprendizagem profunda. Para garantir um tempo de resposta adequado, será necessário estudar a relação que permita optimizar o compromisso entre a precisão e a complexidade do modelo. Numa fase inicial, pretende-se estudar a capacidade de diferentes modelos de generalizar a imagens capturadas em diferentes condições, de forma a desenvolver um modelo robusto a imagens capturados em cenários reais. De seguida, a distilacão de redes neuronais convolucionais é combinada com poda de filtros convolucionais para produzir um modelo mais compacto. O modelo proposto é avaliado em dois datasets de re-identificação capturados em cenários reais. O modelo final é três vezes mais rápido, sem comprometer a sua performance. A dimensão do vector de descritores extraídos para cada imagem é reduzida em um fator de 8 e o modelo tem 60 vezes menos parâmetros. , en=Person re-identification is the task of finding a person of interest across images or videos captured by different cameras. Cameras are usually placed in uncontrolled environments, for instance surveillance cameras in shopping centre, where the quality of the videos is far from ideal and the subjects are not directly facing the camera and might be partially occluded. Person re-identification has recently received increasing attention due to the high performance achieved by new methods based on deep learning. This thesis aims to to develop a deep learning based re-ID system for deployment in a real world task. To guarantee optimal time response, the optimal tradeoff between accuracy and model complexity is studied. Firstly, the generalization ability of different architectures to data captured in different conditions is studied, in order to produce a model robust to data captured in a real-life scenario. Secondly, deep neural network distillation techniques coupled with convolutional kernel pruning are used for producing a smaller model, reducing the complexity of the system without affecting its performance. The proposed approach is validated by testing on two different person re-identification datasets captured in real-life scenarios. In the end, the compressed model is three times faster, without a decrease in performance. The dimensionality of the feature vector extracted for each input image is reduced by 8 times and it has 60 times less trainable parameters.}
{pt=re-identificação de pessoas, aprendizagem profunda, redes neuronais convolucionais, distilação, compressão de modelos, poda, en=person re-identification, deep learning, convolutional neural networks, distillation, model compression, pruning}

Novembro 15, 2018, 10:0

Orientação

ORIENTADOR

Paulo Luís Serras Lobato Correia

Departamento de Engenharia Electrotécnica e de Computadores (DEEC)

Professor Auxiliar

ORIENTADOR

Rakesh Meta

United Technologies Research Center

Investigador