Dissertação
Exploring the Limits of Cross-Platform Sparse Tensor Processing EVALUATED
Os tensores são a maneira natural de armazenar dados multidimensionais. Portanto, a computação eficiente de métodos que envolvem tensores é um desafio importante. Alguns destes métodos, como Matricised Tensor Times Khatri-Rao Product (MTTKRP) e Tensor Times Matrix (TTM), apresentam-se como grandes obstáculos ao desempenho de algoritmos frequentemente usados em diversas áreas de investigação. As mais recentes optimizações tendem a concentrar-se em implementações para uma única arquitectura de computação, no entanto, os sistemas modernos estão a evoluir no sentido de se tornarem mais heterogéneos, combinando vários aceleradores, como Central Processing Unit (CPU) multi-core, Graphics Processing Unit (GPU) e Field Programmable Gate Array (FPGA). Nesta Tese, são analisados os mais proeminentes métodos, bem como as características das arquiteturas mais utilizadas no que toca a otimização e aceleração de métodos que envolvem tensores esparsos. Implementações para TTM e MTTKRP são desenvolvidas para todas as arquiteturas mencionadas, alcançando uma melhoria de até 7× em relação às implementações atuais e com a vantagem de não serem específicas para uma arquitectura ou marca. Uma implementação heterogénea, para um sistema com CPU e GPU, também é desenvolvida com o intuito de demonstrar as capacidades do SYCL como uma potencial referência em computação heterogénea.
junho 28, 2023, 10:30
Publicação
Obra sujeita a Direitos de Autor
Orientação
ORIENTADOR
Leonel Augusto Pires Seabra de Sousa
Departamento de Engenharia Electrotécnica e de Computadores (DEEC)
Professor Catedrático
ORIENTADOR
Departamento de Engenharia Electrotécnica e de Computadores (DEEC)
Professor Auxiliar