Dissertação

{en_GB=CNN Architectures on Heterogeneous Systems} {} EVALUATED

{pt=Os algoritmos de visão artificial presentes nos carros modernos já são capazes de identificar vários objetos, e aferir as condições da estrada para ajudar e assistir o condutor, bem como conduzir o veículo autonomamente dentro de condições restritas. No entanto, estes são executados em dispositivos computacionais complexos que nem sempre são otimizados em termos de capacidade computacional e eficiência energética para veículos elétricos modernos, que comportam restrições energéticas. Para conseguir isto, um algoritmo baseado em redes neuronais convolucionais de baixos recursos é proposto, e uma técnica de mapeamento em hardware é desenvolvida para integrar o sistema numa plataforma de hardware reconfigurável de modo a acelerar o sistema. Um estudo aprofundado de transformações de arquitetura de redes neuronais através de quantização dos parâmetros e transformações de arquitetura é efetuado, de modo a diminuir o seu custo a nível de recursos e tempo de execução na FPGA escolhida, mantendo simultaneamente taxas altas de deteção e classificação. Uma unidade de medida completa é elaborada para aferir a performance de uma rede neuronal convolucional quantizada e transformada, disponibilizando pesos que podem favorecer propriedades desejáveis da rede e penalizar restrições definidas pelo utilizador. Os resultados preliminares da integração de redes numa plataforma CPU+FPGA são apresentados, que mostram uma redução de até 50% no tempo de execução quando comparado com uma recente e mais espaçosa plataforma., en=On-board computer vision algorithms present in modern cars are already capable of identifying multiple objects, and gauge road conditions to help assist the driver, and even autonomously drive the vehicle under restricted circumstances. However, these are executed in complex computing devices that are not always optimal in terms of compute capability and energy efficiency in modern electrical vehicles, which have energy restrictions. To achieve this, an algorithm based in resource constrained convolutional neural networks is proposed, and an hardware mapping methodology is developed to deploy the system in a reconfigurable hardware platform for further acceleration. A thorough study on neural network compression through parameter quantisation and architectural transformations is performed, in order to decrease its resource and execution time cost of the envisioned system on a chosen FPGA device, while maintaining high detection and classification accuracy figures. A comprehensive metric is devised to access the performance of a quantised and modified CNN, providing weighted parameters that may favour a desired network property and penalise user-selected network constrains. The preliminary results of the network deployment into a CPU+FPGA platform are presented, which show up to 50% execution time reduction when compared with a larger state-of-the-art implementation.}
{pt=rede neuronal convolucional, fpga, acelerador, opencl, carro autónomo, assistência ao condutor, en=convolutional neural network, fpga, accelerator, opencl, autonomous car, driver assistance}

Junho 19, 2018, 9:30

Orientação

ORIENTADOR

Leonel Augusto Pires Seabra de Sousa

Departamento de Engenharia Electrotécnica e de Computadores (DEEC)

Professor Catedrático

ORIENTADOR

Aleksandar Ilic

Departamento de Engenharia Electrotécnica e de Computadores (DEEC)

Professor Auxiliar