Dissertação

{en_GB=CGRA-based Deep Neural Network for Object Identification} {} EVALUATED

{pt=Este trabalho tem como objectivo acelerar uma aplicação para detecção de objectos utilizando a VersatCNN, uma arquitetura de matriz reconfigurável de grão grosso desenvolvida para inferencia de redes neuronais convolucionais (CNNs). O trabalho tem como objectivo final atingir execução em tempo real - 30 imagens por segundo (FPS) - num sistema embebido. A aplicação escolhida para implentar é Tiny YOLOv3, uma CNN desenhada para plataformas com recursos limitados. Para além da inferencia através de uma CNN, a aplicação também inclui funções de pré e pós-processamento. Este trabalho utiliza o IOb-SoC, um sistema num chip (SoC) da IObundle com CPU de arquitetura RISC-V, como plataforma de base para o desenvolvimento do projeto. Ao IOb-SoC são integrados periférios para medição de desempenho e comunicação via ethernet. O desempenho da versão da aplicação em ambientes embebidos é medida para identificar funções a acelerar. A VersatCNN é integrada no sistema como periférico. O trabalho foca-se no desenho de configurações de fluxo de dados distintas para acelerar as diferentes camadas da CNN e as funções de pré e pós-processamento. O sistema final atinge mais de 30 FPS para a aplicação completa, com 143 MHz de frequência de relógio e factor de parallelismo de 832 vezes., en=The objective of this work is to accelerate an object detection application using the VersatCNN, a Coarse Grained Reconfigurable Array (CGRA) architecture developed for efficient inference of Convolutional Neural Network (CNN). The performance objective is to enable real-time execution - 30 frames per second - on low-end embedded systems. The object detection application accelerated is the Tiny YOLOv3, based on a CNN developed for constrained environments. The Tiny YOLOv3 network is composed of Convolutional, Maxpool, Route, Upsample and Yolo layers. The application also includes pre and post-processing routines. This thesis work uses the IOb-SoC, a RISC-V based system on a chip (SoC) from IObundle as a baseline hardware platform for the project development. Peripheral modules for measuring performance and enabling ethernet communication are integrated into the IOb-SoC. The embedded version of Tiny YOLOv3 is profilled for RISC-V only execution to identify the parts that require acceleration. The VersatCNN is integraded into the system as a peripheral. The work mainly focuses on the design of CGRA dataflow configurations, as the different parts of the application require distinct configuration strategies for the multiple layer types and the pre and post-processing routines. The final system achieves over 30 FPS for the complete Tiny YOLOv3, with a clock frequency of 143 MHz and a 832x parallelism factor for convolutional operations.}
{pt=Detecção de Objectos, Redes Neuronais Convolucionais, Sistema num Chip, Matrizes Reconfiguráveis de Grão Grosso, en=Object Detection, Convolutional Neural Networks, Systems on Chip, Coarse Grained Reconfigurable Arrays}

Janeiro 13, 2021, 10:0

Orientação

ORIENTADOR

Horácio Cláudio De Campos Neto

Departamento de Engenharia Electrotécnica e de Computadores (DEEC)

Professor Associado

ORIENTADOR

José João Henriques Teixeira de Sousa

Departamento de Engenharia Electrotécnica e de Computadores (DEEC)

Professor Auxiliar