Dissertação
Cascade Inference in FPGA for Fast Object Detection in Surveillance Cameras EVALUATED
O objetivo deste trabalho é desenvolver um detector de objetos por inferência em cascata para implementação em Field Programmable Gate Array (FPGA), otimizando precisão, velocidade e eficiência energética na deteção rápida de objetos em câmaras de vigilância. A abordagem utiliza dois modelos Convolutional Neural Network (CNN) com diferentes níveis de precisão e velocidade: um modelo mais rápido e menos preciso é usado inicialmente; se a deteção estiver abaixo de um limiar definido pelos mecanismos preditivos, um modelo mais lento e mais preciso é então usado. Modelos CNN baseados na arquitetura You Only Look Once (YOLO), especificamente YOLOv7 e YOLOv7-tiny, foram treinados. As combinações otimizadas dos dois modelos foram identificadas e preparadas para implementação em FPGA. Os resultados confirmam a funcionalidade do detector de inferência em cascata, ao mostrar que pode gerar modelos com precisão ou velocidade superiores aos modelos de referência. As combinações YOLOv7-tiny e YOLOv7 destacam-se na frente de Pareto, ao alcançar uma aceleração máxima estimada de 7.8 comparada ao modelo mais lento. Isso resulta em uma complexidade de 13.2 Giga Floating Point Operations Per Second (FLOPS). Com uma aceleração estimada de 2, o mean Average Precision (mAP) atingiu 0.484, um aumento de 10% em relação ao modelo menos preciso. Modelos quantizados para FPGA mostraram que o YOLOv7 teve um mAP final de 0.478, com uma queda de 14% na precisão, e o YOLOv7-tiny teve um mAP final de 0.381, com uma queda de 12%.
junho 19, 2024, 14:0
Publicação
Obra sujeita a Direitos de Autor
Orientação
ORIENTADOR
Horácio Cláudio De Campos Neto
Departamento de Engenharia Electrotécnica e de Computadores (DEEC)
Professor Associado