Dissertação
A Deep Neural Network for Object Detection and Tracking with 3D LiDAR EVALUATED
Os veículos autónomos analisam o seu ambiente com diversos sensores (p.e. câmeras, LiDAR) de forma a tomar a ação mais segura na estrada. Consequentemente, localizar e prever a trajetória de outros agentes rodoviários motivou a investigação de métodos de deteção e tracking de objetos, no domínio de Visão por Computador. Esta tese modifica uma rede deep learning usada para a deteção de objetos 3D de forma a fazer simultaneamente deteção e tracking de objectos a partir de point clouds semânticas 3D apenas. Estas point clouds são obtidas num pré-processamento que tira vantagem da fusão de resultados densos de segmentação semântica em 2D com point clouds 3D que oferecem naturalmente informação de profundidade. O método de tracking é incluído na rede de forma a que sejam feitas predições de vetores de deslocamento de objectos entre duas frames consecutivas, podendo assim prever a sua velocidade. Adicionalmente, foi testado um canal extra de input para um heatmap que contém a posição dos objetos na frame anterior. Foram realizados diversos estudos de ablação para testar a performance do modelo proposto ao usar diferentes estilos de heatmaps, e ao não usar o input extra de heatmap de todo. Os resultados demonstram que um modelo sem heatmaps oferece os melhores resultados, porque o modelo não consegue estimar os heatmaps corretamente. A nossa rede deep learning consiste num único modelo end-to-end para a deteção e tracking, e corre 38% mais rápido (18 FPS) que o modelo basal (13 FPS).
setembro 8, 2021, 8:0
Publicação
Obra sujeita a Direitos de Autor
Orientação
ORIENTADOR
Pedro Daniel dos Santos Miraldo
Departamento de Engenharia Electrotécnica e de Computadores (DEEC)
Professor Auxiliar Convidado