Dissertação
CGRA-based Deep Neural Network for Object Identification EVALUATED
A implementação de algoritmos de deteção de objetos em tempo-real requer um aumento simultâneo do desempenho e da eficiência do processo de inferência de redes neuronais. Aceleradores de hardware embutidos possibilitam um alto desempenho com baixos recursos energéticos. A escolha de tipologia de acelerador depende, principalmente, da sua eficiência e versatilidade, e uma das que melhor equilibra estes dois fatores é a de hardware reconfigurável. Este trabalho consiste em converter a arquitetura VersatCNN, uma matriz reconfigurável de grão grosso (CGRA) de 16-bit, para 8-bit e usá-la para acelerar o detetor de objetos YOLOv3-Tiny, de modo a permitir uma comparação direta entre ambas as versões do acelerador. A execução de diferentes detetores de objetos nesta mesma arquitetura não deverá requerer grandes adaptações, uma vez que são usados os mesmos tipos de operações. Os objetivos são superar o desempenho de 33.3 FPS atingido pela versão de 16-bit sem um grande aumento da complexidade do sistema e minimizar a perda de precisão devida à redução do número de bits. O foco do trabalho é a conversão do YOLOv3-Tiny e do VersatCNN para 8-bit. Para tal, foi necessário um maior cuidado com a precisão das operações, através de uma estratégia de quantizacão diferente e de modificações nas unidades computacionais do CGRA. A perda de mAP50 devida à quantizacão foi reduzida em 3.3 %. A arquitetura executa 1664 operações parciais de multiplicação e acumulação em simultâneo, e atinge uma pontuação mAP50 de 28.9 % e 50.6 FPS com uma frequência de relógio de 143 MHz.
junho 14, 2024, 14:0
Documentos da dissertação ainda não disponíveis publicamente
Orientação
ORIENTADOR
José João Henriques Teixeira de Sousa
Departamento de Engenharia Electrotécnica e de Computadores (DEEC)
Professor Auxiliar
ORIENTADOR
Horácio Cláudio De Campos Neto
Departamento de Engenharia Electrotécnica e de Computadores (DEEC)
Professor Associado