Dissertação

{en_GB=Efficient Deep Learning Method for Person Re-Identification} {} EVALUATED

{pt=A re-identificação de pessoas tem como objetivo reconhecer se uma pessoa já foi observada numa rede de câmeras de video vigilância. Esta é uma tarefa com muitos desafios porque as câmeras podem ter diferentes resoluções, iluminações, etc. O avanço das redes neuronais e a alta procura por sistemas de vídeo-vigilância inteligentes, faz com que a re-identificação ganhe destaque na comunidade de visão computacional. Nesta tese, uma rede de extração de características baseada numa MobileNet e duas redes que avaliam a semelhança entre dois vetores de características (uma recebe a concatenação dos dois vetores e a outra a sua distância) são propostas. Experiências para avaliar qual rede de semelhança tem melhores resultados e comparar os resultados nos casos de re-identificação em closed-world e em open-world são efetuadas em três datasets, assim como, para comparar a precisão do método com melhores resultados, entre os propostos, a outros métodos disponíveis na literatura. Esta avaliação é efetuada com base nas duas métricas mais utilizadas para avaliar tarefas de re-identificação: a CMC e a mAP. Os resultados mostram uma grande diferença na precisão das duas redes de semelhança, sendo a que recebe como entrada a concatenação dos dois vetores a melhor. Como é comum em problemas de Re-ID, os métodos mostram melhores resultados no caso de re-identificação sob características de closed-world. O melhor modelo proposto mostra um desempenho comparável a outros métodos disponíveis na literatura. Por fim, são feitas algumas indicações para trabalhos futuros, sobre técnicas que podem melhorar o desempeno geral dos métodos propostos., en=Person Re-Identification (Re-ID) aims to match people across non-overlapping camera views in a distributed camera network. This is a challenging task because the cameras can have different resolutions or because the places being captured by the cameras can have different illuminations. With the advancement of deep neural networks and the high demand for intelligent video surveillance, person re-identification has gained a lot of interest in the computer vision community. In this thesis, a feature extraction network (based on the MobileNet architecture) and two matching networks (one that accounts the concatenation of two feature vectors and the other accounts the difference between the two) are proposed. Experiments are made in three widely-used datasets (CUHK01, CUHK02 and Market1501) to evaluate which matching network produces the best results. It is also evaluated the proposed network in closed-world and open-world settings. The obtained results are compared with the ones obtained by other methods in the literature. This evaluation is based on the two most used metrics for person re-identification tasks, the Cumulative Match Characteristic (CMC) Curve and the Mean Average Precision (mAP). Results show a big difference in the accuracy of the two matching networks, being the network that makes the concatenation of the two vectors the best one. As is common in Re-ID problems, the methods show a better performance under closed-world assumptions. Our best model shows comparable results to the other methods in the literature. Finally, some indications for future work about techniques that could improve the method's performance are made.}
{pt=Re-identificação, deep learning, MobileNet, CMC, mAP, en=Person re-identification, deep learning, MobileNet, CMC, mAP}

Fevereiro 4, 2021, 14:0

Orientação

ORIENTADOR

Alexandre José Malheiro Bernardino

Departamento de Engenharia Electrotécnica e de Computadores (DEEC)

Professor Associado