Dissertação
FPGA Design of Mixed-Precision Convolutional Neural Networks EVALUATED
O objetivo deste trabalho é desenvolver uma rede neuronal convolucional (CNN) de precisão mista utilizando um FPGA System-On-Chip (SoC). O sistema desenvolvido visa beneficiar da baixa precisão, mantendo um equilíbrio entre a exatidão da classificação de imagens e o tempo de inferência. A classificação de imagens é uma tarefa crítica em aplicações de visão por computador. Os modelos mais avançados utilizam redes neuronais convolucionais e exigem uma elevada precisão, mas têm custos computacionais elevados. As aplicações que requerem computação embebida não conseguem suportar soluções que requeiram um consumo de energia elevado, razão pela qual são necessárias soluções dedicadas de alto desempenho. Foi projetado um sistema de hardware/software dedicado para implementar um modelo ResNet18 com precisão mista numa FPGA Zynq Ultrascale+ SoC. O modelo CNN foi treinado e avaliado com diferentes configurações de precisão mista e foi selecionada uma solução para implementação que utiliza camadas de convolução com activações de 8 bits e pesos com 4 e 2 bits. Foram projetados dois aceleradores hardware para executar as convoluções, um para cada configuração de quantização, ambos com capacidade para calcular 256 MACs por ciclo de relógio. No sistema final hardware/software, todas as camadas convolucionais (mais de 99% do total de operações) são executadas nos IPs hardware e as duas camadas não convolucionais são executadas em software no processador ARM do FPGA SoC. O sistema atinge um ritmo de processamento de 32 FPS, com um desempenho por watt 4,5 vezes superior ao de uma GPU NVIDIA GeForce RTX 3080 Ti.
junho 19, 2024, 17:0
Documentos da dissertação ainda não disponíveis publicamente
Orientação
ORIENTADOR
Horácio Cláudio De Campos Neto
Departamento de Engenharia Electrotécnica e de Computadores (DEEC)
Professor Associado