Dissertação

Near-Memory Sparse Tensor Processing EVALUATED

Os tensores esparsos são a representação mais utilizada de dados multidimensionais esparsos, fazendo com que operações que os decompõem, selecionando as suas características mais importantes e reduzindo a sua dimensão, se tornem procedimentos predominantes na aprendizagem automática. Um dos algoritmos de decomposição tensorial mais utilizados é a decomposição canónica poliádica por mínimos quadrados alternados, onde a operação mais demorada é o tensor esparso matricizado vezes o produto Khatri-Rao de matrizes, uma operação fortemente limitada pela memória e difícil de implementar eficientemente em hardware de uso geral. Pela primeira vez, este trabalho propôs uma nova abordagem para lidar com esta operação usando tecnologias de Processamento em Memória (PIM) disponíveis comercialmente, nomeadamente o UPMEM PIM. Analisámos também extensivamente diferentes estratégias de mapeamento para as unidades de processamento, formatos de números, otimizações de kernel e uma implementação heterogénea com o CPU para atingir o máximo desempenho. Os resultados experimentais mostram que a abordagem proposta baseada em PIM pode atingir uma aceleração de até 2.5 vezes em comparação com as abordagens de CPU de última geração em grandes cargas de trabalho, enquanto a abordagem heterogénea supera consistentemente estas cargas de trabalho e atinge uma aceleração superior a 2.6 vezes.
Aprendizagem automática, decomposição tensorial, tensores esparsos, computação próxima da memória, processamento em memória, compressão de modelos

novembro 25, 2024, 10:30

Documentos da dissertação ainda não disponíveis publicamente

Orientação

ORIENTADOR

Leonel Augusto Pires Seabra de Sousa

Departamento de Engenharia Electrotécnica e de Computadores (DEEC)

Professor Catedrático

ORIENTADOR

Aleksandar Ilic

Departamento de Engenharia Electrotécnica e de Computadores (DEEC)

Professor Associado