[TÓPICO DEDICADO] NAVI - próxima geração de GPUs da AMD

Estava aqui conversando com meus neurônios e me encucando com o consumo da intercomunicação do RDNA3, até que com a apresentação dos GENOA vi um slide e consegui tirar minha dúvida, mas primeiro vou par um slide antigo, da RDNA2:

infcache.jpg


Informação importante: Gasto energético para mover um dado de/para o Infinity Cache, que é de 1,3 pJ/bit. Certo... e o que esse número significa? Sabendo que 1pJ/bit equivale a 1 mW/Gbps, temos (na 6900XT):
- 1664GBps * 0,0013 W/Gbps = 2,16W * 8 = 17,30W

Certo, e onde está o slide do EPYC? Aqui:

AMD-EPYC-9004-Genoa-Chiplet-Architecture-GMI3-Narrow-and-GMI3-Wide.jpg


A comunicação do chiplet com o IOD dos EPYCs aparentemente utilizam o mesmo protocolo das RDNA3, então é bem provável que o custo para movimentar dados entre ambas seja o mesmo. Por que eu digo que ambos utilizam o mesmo protocolo? Porque esse documento diz que essa intercomunicação também é a da RDNA3:

glink.jpg


Interessante não? Bem, voltando, olhem para quanto caiu o custo de movimentação de dados intra-die: De 1,3pJ/bit para 0,3pJ/bit, então agora temos o valor inter-die e intra-die, e isso possibilita...
- 5300GBps * 0,0018 W/Gbps = 2,65W * 8 = 76,32W

Ou seja, enquanto que a RDNA2 gastava ~17W para ler/escrever dados no InfinityCache a uma velocidade de ~1,5TB/s, a RDNA3 gasta ~76W para ler/escrever nessa mesma LLC a uma velocidade de 5,3TB/s. Logo realmente um clock maior nos shaders vai elevar esse consumo, mas não tanto quanto imaginava (~3GHz shader clock = ~90W InfLink, mas não chegará nisso pois saturaria o limite*** da intercomunicação, portanto o consumo máximo seria de ~79W, ~88W no pior dos casos).

---
OBS1: Interessante saber que essa intercomunicação tem um limite atual de 912,5 GB/s por PHY, o que dá 5,475 TB/s de largura de banda máxima na 7900XTX, ou seja, a AMD já deixou a largura de banda na sua topo de linha praticamente no máximo;

OBS2: Coloquei a eficiência em 1,8pJ/bit pois é o valor do custo do Infinity Fabric (1,5pJ/bit) somado com 0,3pJ, e que fica abaixo dos 2pJ/bit informado nos GENOA, então é um chute bem realista (apesar de ter quem acredite que é o valor é de 2pJ/bit mesmo), logo todo esse consumo é algo aproximado e só teremos certeza quando a AMD soltar um documento ou falar explicitamente.

OBS3: Aqui uma tabela comparativa de custo de movimentação de dados em outras tecnologias/protocolos (o EMIB está mais para 0,5 que 0,3):
Fg4x-4j-VEAATBH2.jpg
 
Estava aqui conversando com meus neurônios e me encucando com o consumo da intercomunicação do RDNA3, até que com a apresentação dos GENOA vi um slide e consegui tirar minha dúvida, mas primeiro vou par um slide antigo, da RDNA2:

infcache.jpg


Informação importante: Gasto energético para mover um dado de/para o Infinity Cache, que é de 1,3 pJ/bit. Certo... e o que esse número significa? Sabendo que 1pJ/bit equivale a 1 mW/Gbps, temos (na 6900XT):
- 1664GBps * 0,0013 W/Gbps = 2,16W * 8 = 17,30W

Certo, e onde está o slide do EPYC? Aqui:

AMD-EPYC-9004-Genoa-Chiplet-Architecture-GMI3-Narrow-and-GMI3-Wide.jpg


A comunicação do chiplet com o IOD dos EPYCs aparentemente utilizam o mesmo protocolo das RDNA3, então é bem provável que o custo para movimentar dados entre ambas seja o mesmo. Por que eu digo que ambos utilizam o mesmo protocolo? Porque esse documento diz que essa intercomunicação também é a da RDNA3:

glink.jpg


Interessante não? Bem, voltando, olhem para quanto caiu o custo de movimentação de dados intra-die: De 1,3pJ/bit para 0,3pJ/bit, então agora temos o valor inter-die e intra-die, e isso possibilita...
- 5300GBps * 0,0018 W/Gbps = 2,65W * 8 = 76,32W

Ou seja, enquanto que a RDNA2 gastava ~17W para ler/escrever dados no InfinityCache a uma velocidade de ~1,5TB/s, a RDNA3 gasta ~76W para ler/escrever nessa mesma LLC a uma velocidade de 5,3TB/s. Logo realmente um clock maior nos shaders vai elevar esse consumo, mas não tanto quanto imaginava (~3GHz shader clock = ~90W InfLink, mas não chegará nisso pois saturaria o limite*** da intercomunicação, portanto o consumo máximo seria de ~79W, ~88W no pior dos casos).

---
OBS1: Interessante saber que essa intercomunicação tem um limite atual de 912,5 GB/s por PHY, o que dá 5,475 TB/s de largura de banda máxima na 7900XTX, ou seja, a AMD já deixou a largura de banda na sua topo de linha praticamente no máximo;

OBS2: Coloquei a eficiência em 1,8pJ/bit pois é o valor do custo do Infinity Fabric (1,5pJ/bit) somado com 0,3pJ, e que fica abaixo dos 2pJ/bit informado nos GENOA, então é um chute bem realista (apesar de ter quem acredite que é o valor é de 2pJ/bit mesmo), logo todo esse consumo é algo aproximado e só teremos certeza quando a AMD soltar um documento ou falar explicitamente.

OBS3: Aqui uma tabela comparativa de custo de movimentação de dados em outras tecnologias/protocolos (o EMIB está mais para 0,5 que 0,3):
Fg4x-4j-VEAATBH2.jpg
Se eu entendi bem o que você escreveu a respeito da RDNA3, o nível de overclock dela será muito baixo ou nulo então?
 
Se eu entendi bem o que você escreveu a respeito da RDNA3, o nível de overclock dela será muito baixo ou nulo então?
Não entendeu muito bem então, só trouxe um pensamento meu quanto ao consumo da intercomunicação off-die MCD-GCD, não significa que isso limite o OC do front-end/shader-engine , apenas que o limite dessa intercomunicação é de 915GB/s e a 7900XTX já opera a 883GB/s.

Simplificando: A velocidade da comunicação entre as cache L2 e L3 já está quase no máximo, mas isso não impactará no OC do GCD (mas poderá no desempenho).

Matematicamente falando, se o IF_CLK for 1:1 com o clock do shader, qualquer OC acima de 2,6GHz (nos shaders) não aumentará a largura de banda do InfinityCache, ela estacionará em 5,47TB/s. Isso significa que acima de 2,6GHz nos shaders o ganho de desempenho será pequeno pois haverá gargalo na largura de banda entre caches (clock sobe, trafego de dados não). Isso também significa que, depois de certo ponto, o gnho de desempenho se inverterá, e em clocks muito altos haverá perda por saturação do barramento, mas isso é hipoteticamente falando.

Podemos até colocar esse detalhe na lista do por quê da AMD não ter colocado um clock mais alto na sua high-end.
 
Última edição:
Não entendeu muito bem então, só trouxe um pensamento meu quanto ao consumo da intercomunicação off-die MCD-GCD, não significa que isso limite o OC do front-end/shader-engine , apenas que o limite dessa intercomunicação é de 915GB/s e a 7900XTX já opera a 883GB/s.

Simplificando: A velocidade da comunicação entre as cache L2 e L3 já está quase no máximo, mas isso não impactará no OC do GCD (mas poderá no desempenho).

Matematicamente falando, se o IF_CLK for 1:1 com o clock do shader, qualquer OC acima de 2,6GHz nos shaders não aumentará a largura de banda do InfinityCache, ela estacionará em 5,47TB/s. Isso significa que acima de 2,6GHz nos shaders o ganho de desempenho será pequeno pois haverá gargalo na largura de banda entre caches (clock sobe, trafego de dados não).

Podemos até colocar esse detalhe na lista do por quê da AMD não ter colocado um clock mais alto na sua high-end.
Grato pela explicação.
 
ok, 46 horas pro lançamento, façam suas apostas, 7900 xtx quantos % da potencia da 4090? big win? bug flop? façam suas apostas!
 
ok, 46 horas pro lançamento, façam suas apostas, 7900 xtx quantos % da potencia da 4090? big win? bug flop? façam suas apostas!
Lançamento é 13 de dezembro.
 
Enquanto não tem as novas, vamos de o que as velhas NAVI 2 fazem

Cyberpunk 2077


00:00 - 1080p, baixa - média 105fps, mínima 69fps
01:57 - 1080p, ultra - média 102fps, mínima 67fps
03:32 - 1080p, RT ultra - média 68fps, mínima 53fps
05:20 - 1440p, baixa - média 105fps, mínima 69fps
07:17 - 1440p, ultra - média 96fps, mínima 69fps
09:06 - 1440p, RT ultra - média 56fps, mínima 45fps
10:51 - 2160p, baixa - média 103fps, mínima 69fps
12:50 - 2160p, ultra - média 50fps, mínima 40fps
14:42 - 2160p, RT ultra - média 40fps, mínima 32fps
16:30 - 2160p, RT ultra FSR OFF (Kamikaze Gameplay) - média 13fps, mínima 10fps

Note que para esse jogo, o CPU limita muito o desempenho.

CPU Ryzen 5 3600X
GPU RX 6800 XT Red Devil
RAM Corsair CL16 3200Mhz
STORAGE Adata SX8200
COOLER Lanshuo China Is Democracy
PSU Corsair 650W
 
sacanagem na gringa os preços das gpu continuam caindo, tirando algumas da nvidia, amd caiu esse mes de novo em media 10% 6950 xt por 654

se eu comprar uma gigabyte na gringa, consigo usar a garantia aqui no hu3zil?
 
6950XT por 5999 na terabyteshop, será se vale?


Nao vale.. 15% aciima da 6800xt, custando 50% mais..

se tu não vai esperar a 7900 xtx acho que sim, o valor mais baixo que vi pra essa placa, mas se o hu3zil não afundar mais(o que tem 99% de chances de ocorrer devido a eventos recentes) o preço cai mais ainda depois que lançar a serie 7000

na gringa essa placa ta 860, na cotação de hoje da uns 4,6k então ta acima, mas ainda a mais barata que vi, fora essa vi na kabum por 6,5k
--- Post duplo é unido automaticamente: ---


compartilha esses cupom bom ai

cupom morreu faz tmpo srs
 
Enquanto não tem as novas, vamos de o que as velhas NAVI 2 fazem

Cyberpunk 2077


00:00 - 1080p, baixa - média 105fps, mínima 69fps
01:57 - 1080p, ultra - média 102fps, mínima 67fps
03:32 - 1080p, RT ultra - média 68fps, mínima 53fps
05:20 - 1440p, baixa - média 105fps, mínima 69fps
07:17 - 1440p, ultra - média 96fps, mínima 69fps
09:06 - 1440p, RT ultra - média 56fps, mínima 45fps
10:51 - 2160p, baixa - média 103fps, mínima 69fps
12:50 - 2160p, ultra - média 50fps, mínima 40fps
14:42 - 2160p, RT ultra - média 40fps, mínima 32fps
16:30 - 2160p, RT ultra FSR OFF (Kamikaze Gameplay) - média 13fps, mínima 10fps

Note que para esse jogo, o CPU limita muito o desempenho.

CPU Ryzen 5 3600X
GPU RX 6800 XT Red Devil
RAM Corsair CL16 3200Mhz
STORAGE Adata SX8200
COOLER Lanshuo China Is Democracy
PSU Corsair 650W


RT numa série 6000 é tipo colocar uma ferrari pra puxar uma cegonha de carros
 
passagem brazil -> usa ida e volta R$3,023

ta compensando ir buscar pessoalmente :D
 
RT numa série 6000 é tipo colocar uma ferrari pra puxar uma cegonha de carros
Sabe que eu pensava isso qdo eu tinha uma RTX 3070... Mas não é tão ruim assim.

O que deixava a guerra feia era o dlss.

Uma 3080 em 1440p RT ultra fica com 65 fps em média e 52 em mínimas, na minha opinião, isso não é tão mais assim do que a 6800xt faz.

As RTX são melhores mas não 70% melhores igual era quando existia o DLSS e não existia o fsr.

Agora é só uns 15%, comparando 6800xt vs 3080.
 
Quero ver a Nvidia anunciando um corte de preço assim que sairem os reviews da 7900XTX. Bom ver a AMD pressionando a verde.
 
Se eu entendi bem o que você escreveu a respeito da RDNA3, o nível de overclock dela será muito baixo ou nulo então?
Não necessariamente. Só está falando da banda disponível para as RDNA3 com o novo cache mas que essa banda extra também trás um consumo extra já que o cache não está mais on die como nas RDNA2. Algo parecido com o infinity fabric dos Zen que possibilita a tecnologia de chiplets mas tem seu custo no consumo total do chip.

Sobre o overclock se o hit rate do cache for bom e com toda essa banda vai tornar a GPU mais shader bound do que banda bound o que na teoria teria melhores resultados com overclock. E tem que lembrar que agora após o cache vai ter um bus de 384 bits na XTX e 320 bits na XT o que também na teoria pode melhorar os resultados no over além também da placa perder menos performance em 4K comparando com os 256 bits das RDNA2.
 
Existe algum programa para placas Radeon equivalente ao Nvidia Profile Inspector? E tem como ativar o 1/2 sync nas GPUs da AMD?
 
Existe algum programa para placas Radeon equivalente ao Nvidia Profile Inspector? E tem como ativar o 1/2 sync nas GPUs da AMD?
Não. Praticamente só dá para fazer o que tem no driver mesmo. Acho que não tem half vsync no driver mas tem um limitador de frames.

Antigamente existia o RadeonPro mas foi descontinuado. Acho que funciona até a série RX200 e win7.
 
Galera nunca elogia oq é bom. Formidável a implementação do FSR2 no RDR2.
 
@dayllann , faça seus comentários por favor.
:isso:
 
To de olho uma 3080 mas por esse preço... infelizmente não fui ligeiro o suficiente kkkkkk

Ziw0aHR.jpg
putzz.....essa valia a pena, mesmo que fosse pra revender, conseguia 1k de lucro fácil

usada o mais barato que vi foi 3.300, mas tu pegou essa promo por acaso ou usa algum serviço que avisa tu?
 

Users who are viewing this thread

  • Voltar
    Topo