Dissertação

{en_GB=Using Sensor Fusion for Parallel Image Classification - With non-unifom data sampling and distributed computations} {} EVALUATED

{pt=Com o recente aumento da popularidade da aprendizagem profunda, as tarefas associadas ao reconhecimento de padrões receberam muita atenção por parte de várias equipas, sendo propostas numerosas soluções que atingem precisão quase perfeita em conjuntos de dados públicos. Combinado com os recentes avanços em hardware, estas soluções podem ser distribuídas nos dispositivos móveis, usados na área da robótica ou em aplicações da internet das coisas. Contudo, dada a natureza da aprendizagem profunda, os modelos resultantes tem camadas altamente interconectadas, que cria um desafio ao tentar implementar os modelos nas sistemas distribuídas. Neste tese propomos uma abordagem alternativa que usa aprendizagem convencional de máquina e permite execução paralela e distribuída na tarefa de classificação de imagens. Cada unidade que participe na classificação, recolhe dados de forma independente de outras unidades e só trabalho sobre um subconjunto das classes. De seguida, os resultados do trabalho de cada unidade são combinados com resultados doutras unidades para produzir uma classificação final. O uso de amostragem aleatória durante a aprendizagem e a classificação permite que a abordagem proposta neste trabalho seja mais resistente a transformações geométricas de imagens e ruído. Usando conjunto de dados de reconhecimento das flores, e aplicando uma distribuição normal multivariável durante amostragem de imagem para aprendizagem e para classificação, com classes representados pelos 1,024 vetores, cada com 256 elementos, aplicando algoritmo de k vizinho mais próximo com distancia linear e numero dos vizinhos igual ao 4, 20 imagens no conjunto de treino, classificação com precisão de 79.86% foi atingida., en=With the rise of deep learning in recent years, image pattern recognition tasks have received much attention and have seen many proposed solutions that achieve near-perfect accuracy on public datasets. Combined with hardware acceleration, these solutions may be deployed in portable devices for robotics or Internet of Things applications. By the nature of deep learning, resulting models have highly interconnected layers, which poses a challenge when trying to deploy the model on a distributed system. We study an alternative approach that uses conventional machine learning algorithms and allows for parallel and distributed image classification. Each unit that participates in recognition gathers image data independently of others and operates only on a subset of classes. The result of each unit's work is then combined with results of other units to produce the final classification. Use of random sampling during learning and classification allows for some resistance to noise and affine transformations. Using Flowers Recognition dataset and applying multivariate normal distribution for image sampling during learning and classification, with 1,024 features per class and with each feature containing 256 datapoints, applying linear-distance k-Nearest Neighbours algorithm with k = 4, training set size of 20, classification accuracy of 79.86% was achieved.}
{pt=classificação de imagens, processamento paralelo, aprendizagem convencional de máquina, fusão de dados, en=image classification, parallel processing, conventional machine learning, sensor fusion}

Novembro 13, 2019, 10:30

Orientação

ORIENTADOR

Andreas Miroslaus Wichert

Departamento de Engenharia Informática (DEI)

Professor Auxiliar