Especificações do AMD RDNA4: GPU monstruosa de 129 FP32 TFLOPS, GDDR7, taxas de clock de 3,5 GHz e muito mais
A RedGamingTech publicou muitas informações sobre a arquitetura AMD RDNA4 e as próximas GPUs Navi 41, Navi 42 e Navi 43. Este é um dos primeiros vazamentos de um vazador conhecido e, embora o RGT tenha um histórico confiável, esta postagem ainda está sendo marcada como um boato neste momento, porque as informações iniciais estão sempre em fluxo e sujeitas a mudanças. Então, com seus saleiros em mãos, vamos nos aprofundar neste deleite absoluto de um vazamento da RGT.
As GPUs AMD Navi 41, Navi 42 e Navi 43 recebem rumores de especificações preliminares para a próxima série Radeon RX 8000
Na primeira ordem do dia, o RGT confirma que a contagem de ALU para as CUs RDNA4 permanecerá exatamente a mesma do RDNA 3 – ou seja, permanecerá em 128 ALUs por CU. A memória GDDR7 está definitivamente em jogo, mas não confirmada no momento, embora o PCIE 5.0 provavelmente seja o padrão de escolha em relação ao PCIE 6.0, pois o último provavelmente não estará pronto a tempo. Curiosamente, a arquitetura RDNA4 terá como alvo uma frequência de clock aumentada de 3,5 GHz e isso combinado com os outros movimentos arquitetônicos significa que você está observando um desempenho líquido por ganho de watt de cerca de 50-60%.
Uma das coisas que faltava na arquitetura RDNA3 da AMD era o rastreamento de raios e o desempenho de AI/ML, e a AMD está procurando consertar isso com o RDNA4. Os caches receberão grandes atualizações e o Infinity Cache de 3ª geração será lançado junto com um novo sistema de pré-busca de dados. WMMA (Wave Matrix Multiply-Accumulate) V2 também permitirá 2x o desempenho por CU para (presumivelmente) instruções de matriz, permitindo o uso total da faixa SIMD. Embora o aumento total em CUs seja de cerca de 50%, o aumento de desempenho geração após geração é de 100% - o que é excelente de se ouvir.
AMD Navi 41 – 144 UCs
Aqui é onde as coisas ficam ainda mais loucas, o Navi 41 é anunciado para ter até 32 GB de vRAM - provavelmente da variedade GDDR7. Uma segunda configuração também existe com 24 ou 48 GB de GDDR7 e 6 MCDs (a variante de 32 GB tem 4 MCDs). O Navi 41 terá 144 CUs, com clock de 3,5 GHz e um cálculo de 128 ALU por CU deve render 129 TFLOPs de desempenho FP32. Escusado será dizer que é um nível de desempenho Godzilla ali.
AMD Navi 42 – 96 UCs
O Navi 42 será ligeiramente silenciado e terá um total líquido de 12.288 CUs com clock de 3,5 GHz, deve render cerca de 86 TFLOPs de desempenho FP32. 96 CU também é exatamente a contagem do carro-chefe do RDNA3, o Radeon 7900 XTX, portanto, este SKU representará a comparação geração após geração de maçãs para maçãs entre RDNA3 e RDNA4 (ou mais precisamente, como maçãs para maçãs que ele sempre terá). Como observa o RGT em seus slides, especificações como essas *podem* e mudam antes da revisão final.
AMD Navi 43 – 48 UCs
Por fim, temos o Navi 43, que terá 48 UCs. Com clock de cerca de 3,5 GHz, isso renderá cerca de 43 TFLOPs de desempenho FP32. Este provavelmente será o limite inferior da linha RDNA4 da AMD e apenas mostra quanto desempenho está sendo empacotado nesta futura arquitetura RDNA4, onde o “extremo inferior” facilmente excede 40 TFLOPs. O padrão de memória ainda será GDDR7 e virá com 2x MCDs. Este também é o único SKU em que o RGT observa que a GPU pode não ter um design MCM - embora estejam sendo informados de que esse é o caso atualmente.