Dissertação

{pt_PT=Extreme Multicores: Programming of Systems with Thousands of CPUs} {} EVALUATED

{pt=As tendências actuais permitem antever processadores com um número elevado de núcleos no final da década. No entanto, as redes de interligação e os protocolos de coerência de cache existentes não permitem extrair toda o potencial prometido para estes novos processadores. Para além disto, programar adequadamente para estes novos sistemas impõe uma série de desafios, bem como muitas oportunidades. Estes problemas motivam investigação sobre as arquitecturas deste tipo de processadores. Esta deve tentar definir quais são as melhores opções na escolha de redes de interligação, protocolos de coerência de cache, arquitectura de memória, e na estratégia de paralelização. Isto com objectivo final de obter o maior desempenho possível do processador. Neste documento é apresentada uma análise abrangente das questões levantadas, fornecendo uma comparação detalhada das múltiplas opções existentes, culminado com uma discussão sobre a selecção das melhores opções. A avaliação destas opções depende de uma plataforma de testes fidedigna, um simulador, e de um conjunto de testes padronizados para avaliar o desempenho do sistema de uma forma credível. Para escolher o melhor simulador e o melhor conjunto de testes padronizados, é apresentada uma avaliação de múltiplos simuladores e de dois conjuntos de programas de teste usados na indústria. Esta permitiu escolher o simulador Sniper e o conjunto de testes padronizados PARSEC para a realização da investigação. Permitindo identificar a rede de interligação 2D Torus Cluster e a utilização de uma cache L3 partilhada com um directório como as melhores opções para processadores com um número elevado de núcleos., en=Current trends predict many-core processors with thousands of cores by the end of the decade. Yet currently used interconnection networks and cache coherence protocols fall short in harvesting all their promised performance. Furthermore, programming on these systems poses a new set of challenges, but also opportunities. These problems motivate research on the topic of many-core processors, trying to provide a set of insights about the best options on interconnection networks, on cache coherency, on the memory architecture, and on the parallelization strategy. All this with the goal of providing the maximum throughput of the processor. In this document an in-depth analysis about the previous issues is presented, giving a comparison on the available options and providing some early conclusions about which are the best ones and what characteristics should they present. The effective evaluation of these options is dependent on an accurate testing platform and a set of standardised tests to evaluate the system performance. To achieve this, it is also evaluated multiple simulators and benchmark suites. The systematic execution of standardised tests on different architectures, followed by a detailed analysis of the results obtained, leads to verifiable conclusions about the afore mentioned options. This research indicated the Sniper simulator and the PARSEC benchmark suite as the best options. Using them it was possible to perform experiments that pointed to the use of a 2D Torus Cluster interconnection network, and to the use of a shared L3 cache coupled with a directory as the best options for many-core processors.}
{pt=Processadores de muitos núcleos, Redes de interligação, Coerência de cache, Simuladores, Programação paralela., en=Many-core processors, Interconnection networks, Cache coherence, Thousands of CPUs, Simulators, Parallel programming}

outubro 2, 2014, 17:30

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

José Carlos Alves Pereira Monteiro

Departamento de Engenharia Informática (DEI)

Professor Associado