Dissertação
Near-Memory Sparse Tensor Processing EVALUATED
Os tensores esparsos são a representação mais utilizada de dados multidimensionais esparsos, fazendo com que operações que os decompõem, selecionando as suas características mais importantes e reduzindo a sua dimensão, se tornem procedimentos predominantes na aprendizagem automática. Um dos algoritmos de decomposição tensorial mais utilizados é a decomposição canónica poliádica por mínimos quadrados alternados, onde a operação mais demorada é o tensor esparso matricizado vezes o produto Khatri-Rao de matrizes, uma operação fortemente limitada pela memória e difícil de implementar eficientemente em hardware de uso geral. Pela primeira vez, este trabalho propôs uma nova abordagem para lidar com esta operação usando tecnologias de Processamento em Memória (PIM) disponíveis comercialmente, nomeadamente o UPMEM PIM. Analisámos também extensivamente diferentes estratégias de mapeamento para as unidades de processamento, formatos de números, otimizações de kernel e uma implementação heterogénea com o CPU para atingir o máximo desempenho. Os resultados experimentais mostram que a abordagem proposta baseada em PIM pode atingir uma aceleração de até 2.5 vezes em comparação com as abordagens de CPU de última geração em grandes cargas de trabalho, enquanto a abordagem heterogénea supera consistentemente estas cargas de trabalho e atinge uma aceleração superior a 2.6 vezes.
novembro 25, 2024, 10:30
Documentos da dissertação ainda não disponíveis publicamente
Orientação
ORIENTADOR
Leonel Augusto Pires Seabra de Sousa
Departamento de Engenharia Electrotécnica e de Computadores (DEEC)
Professor Catedrático
ORIENTADOR
Departamento de Engenharia Electrotécnica e de Computadores (DEEC)
Professor Associado