Dissertação
CGRA-based Deep Neural Network for Object Identification EVALUATED
Este trabalho tem como objectivo acelerar uma aplicação para detecção de objectos utilizando a VersatCNN, uma arquitetura de matriz reconfigurável de grão grosso desenvolvida para inferencia de redes neuronais convolucionais (CNNs). O trabalho tem como objectivo final atingir execução em tempo real - 30 imagens por segundo (FPS) - num sistema embebido. A aplicação escolhida para implentar é Tiny YOLOv3, uma CNN desenhada para plataformas com recursos limitados. Para além da inferencia através de uma CNN, a aplicação também inclui funções de pré e pós-processamento. Este trabalho utiliza o IOb-SoC, um sistema num chip (SoC) da IObundle com CPU de arquitetura RISC-V, como plataforma de base para o desenvolvimento do projeto. Ao IOb-SoC são integrados periférios para medição de desempenho e comunicação via ethernet. O desempenho da versão da aplicação em ambientes embebidos é medida para identificar funções a acelerar. A VersatCNN é integrada no sistema como periférico. O trabalho foca-se no desenho de configurações de fluxo de dados distintas para acelerar as diferentes camadas da CNN e as funções de pré e pós-processamento. O sistema final atinge mais de 30 FPS para a aplicação completa, com 143 MHz de frequência de relógio e factor de parallelismo de 832 vezes.
janeiro 13, 2021, 10:0
Publicação
Obra sujeita a Direitos de Autor
Orientação
ORIENTADOR
Horácio Cláudio De Campos Neto
Departamento de Engenharia Electrotécnica e de Computadores (DEEC)
Professor Associado
ORIENTADOR
José João Henriques Teixeira de Sousa
Departamento de Engenharia Electrotécnica e de Computadores (DEEC)
Professor Auxiliar