U.S. leadership computers today are giant GPU-based machines, whether you’re talking about the pre-exascale Summit supercomputer in operation today at the Oak Ridge National Laboratory Leadership Computing Facility (OLCF) or […]
www.hpcwire.com
Os computadores de liderança dos EUA hoje são máquinas gigantes baseadas em GPU, quer você esteja falando sobre o supercomputador pré-exascale Summit em operação hoje no Oak Ridge National Laboratory Leadership Computing Facility (OLCF) ou sistemas exascale futuros, incluindo Frontier (OLCF), Aurora ( Argonne National Laboratory) e El Capitan (Lawrence Livermore National Laboratory), que serão lançados nos próximos anos.
Esses grandes sistemas visam alavancar a aceleração da GPU.
Primeiro, aqui estão os comentários de cenário de Roth sobre os sistemas de computação do DOE:
“A palavra que me vem à cabeça é variedade. Eles simbolizam a variedade”, disse Roth. “Temos uma variedade de tipos de hardware em termos de aceleradores e se um sistema os possui, certamente em termos de fornecedores, as diferentes proporções de número de CPUs para GPUs e a conectividade dentro do nó. Da mesma forma, há uma variedade de tipos de interconexões que vemos nas instalações do DOE. Temos a questão da memória não volátil, seja no nó ou próximo do nó ou nem mesmo presente em um sistema.
“Esse hardware, de certa forma, também gera variedade em software. O Summit usa CPUs Power9 e GPUs Nvidia em cada um de seus nós.
Em breve estaremos colocando em campo o Frontier, que usa processadores de CPU x86 da AMD e GPUs da AMD nos nós. [On] Frontier, as NICs serão conectadas diretamente à memória da GPU. O ponto principal que quero destacar neste slide (abaixo) é que mais de 90% da capacidade computacional dos sistemas de produção vem de suas GPUs. Na verdade, é mais de 95% para a Frontier. Vou me concentrar nesta palestra em GPUs, não tanto talvez [em seu] desempenho, mas em fazer uso das GPUs.”
Killer Instinct: AMD Multi-Chip MI200 GPU prepara-se para uma grande estreia global
AMD’s next-generation supercomputer GPU is on its way – and by all appearances, it’s about to make a name for itself. The AMD Radeon Instinct MI200 GPU (a successor to the MI100) will, over the next year, begin to power three massive systems on three continents: the United States’ exascale...
www.hpcwire.com
A GPU de supercomputador de próxima geração da AMD está a caminho – e ao que tudo indica, está prestes a fazer seu nome. A GPU AMD Radeon Instinct MI200 (sucessora do MI100 ) começará, no próximo ano, a alimentar três sistemas massivos em três continentes: o sistema Frontier exascale dos Estados Unidos; o sistema LUMI pré-exascale da União Européia; e o sistema petascale Setonix da Austrália.
A nova GPU – que começou a ser enviada para seus primeiros clientes neste verão – é baseada na arquitetura CDNA2 da AMD e, ao contrário do PCIe MI100, usa um fator de forma mezanino (semelhante às versões SXM das GPUs Nvidia V100 e A100).
O MI200 terá dois dies - cada um com 110 unidades de computação - conectados por meio de um interposer die passivo e até 128 GB de HBM2E DRAM. Prevê-se que o MI200 forneça pelo menos o dobro do desempenho do MI100 de matriz única e 11,5 teraflops, que tinha 120 unidades de computação e 32 GB de memória HBM2. O MI200 certamente será o primeiro módulo multi-chip (MCM) GPU da AMD e também parece prestes a ser o primeiro GPU MCM no mercado em geral.
Fronteira
O cliente de maior perfil da AMD para o MI200 também pode ser o primeiro a lançar: apenas algumas semanas atrás, foi
revelado que o supercomputador exascale Frontier está sendo instalado no Oak Ridge National Laboratory (ORNL), com a instalação programada para ser concluída em algum momento deste ano ou no início do próximo ano.
O Frontier, desenvolvido pela HPE, incluirá mais de 9.000 nós Cray EX. Cada nó incluirá uma CPU AMD Epyc e quatro MI200s, todos programados para fornecer mais de 1,5 exaflops de poder de computação.

A instalação do sistema Frontier está em andamento no ORNL.
Um dos outros dois sistemas exascale anunciados nos EUA, o sistema El Capitan no Laboratório Nacional Lawrence Livermore (LLNL), também está programado para usar CPUs AMD e GPUs Radeon Instinct - mas como El Capitan (espera-se que forneça dois exaflops de desempenho máximo) não Com lançamento previsto para 2023, é incerto que usará o MI200 ou outra versão do Instinct.
Para mais detalhes sobre a Frontier, clique
aqui .
LUMI
Se algum dos outros sistemas vencer o Frontier, é provável que seja o sistema LUMI da EuroHPC. A EuroHPC – que opera como a central de supercomputação da União Européia – lançou recentemente seus primeiros quatro sistemas, todos em escala peta. O LUMI, no entanto, está sendo denominado um sistema pré-exascale, previsto para fornecer mais de 550 petaflops de pico. O módulo de CPU da LUMI acabou de ser instalado em sua linda nova casa no CSC da Finlândia, mas o módulo de GPU estará esperando até março - e é aquele que carrega as GPUs AMD Instinct de próxima geração que, presumivelmente, serão MI200s.

O centro de dados LUMI.
Até agora, o LUMI é a única vitória do EuroHPC para as GPUs da AMD, embora suas CPUs também estejam alimentando os sistemas Discoverer, Karolina, Meluxina e Vega.
Para mais detalhes sobre o LUMI, clique
aqui .
Setonix
Por último, mas certamente não menos importante, será o sistema Setonix no Pawsey Supercomputing Center na Austrália. Espera-se que o Setonix (nomeado em homenagem ao quokka dolorosamente fofo, ou setonix brachyurus) forneça cerca de 50 petaflops de pico - muito abaixo das alturas do Frontier ou LUMI, mas o suficiente para colocá-lo entre os dez principais supercomputadores classificados publicamente agora e, quando lançamentos, o suficiente para torná-lo o que Pawsey acredita que será o supercomputador público mais rápido do hemisfério sul.

O supercomputador Setonix.
Assim como no LUMI, a primeira etapa da instalação do Setonix está em andamento, mas a segunda etapa está prevista para ser entregue “até meados de 2022” para operação no segundo semestre desse ano. Quando concluído, o Setonix fará uso de mais de 200.000 núcleos de CPU AMD Milan e mais de 750 GPUs AMD “MI-Next” de próxima geração (novamente, presumivelmente o MI200). O sistema também terá mais de 548 TB de memória agregada e mais de 100 PB de armazenamento.
Para mais detalhes sobre o Setonix, clique
aqui .
A competição
Claro, a AMD está entrando em uma sala lotada com o MI200 – e só vai ficar mais competitiva, particularmente na frente multi-chip. As GPUs MCM estão sendo desenvolvidas pela Intel (por meio de sua GPU “Ponte Vecchio” de 47 blocos) e pela Nvidia (por meio de GPUs com sua nova arquitetura “Hopper”). As GPUs com vários chips estão, ao que parece, finalmente nascendo em resposta às pressões de rendimento e custo enfrentadas pela fabricação avançada de semicondutores.
Pairando sobre as vitórias do MI200 estão as vitórias desses concorrentes, tanto existentes quanto futuros: a GPU Ponte Vecchio da Intel irá (em conjunto com as CPUs Intel) alimentar o sistema exascale Aurora, e as GPUs da Nvidia estão alimentando o sistema Perlmutter da NERSC e Deucalion, Karolina, Leonardo da EuroHPC , Sistemas Meluxina e Vega. Enquanto isso, sistemas baseados em Arm como o Fugaku estão evitando totalmente as GPUs, e o único sistema EuroHPC não detalhado do primeiro lote – o problemático MareNostrum 5 – está
supostamente atrasado devido a desentendimentos sobre fornecedores, com a UE preferindo adquirir dentro de suas fronteiras.
A AMD, por sua vez, ainda nem anunciou oficialmente o nome do MI200 – mas com o SC21 a apenas algumas semanas e grandes clientes lançando sistemas nos próximos meses, a GPU parece pronta para fazer sua estreia global.