[TÓPICO DEDICADO] NAVI - próxima geração de GPUs da AMD

dayllann · 12/11/2022

Estava aqui conversando com meus neurônios e me encucando com o consumo da intercomunicação do RDNA3, até que com a apresentação dos GENOA vi um slide e consegui tirar minha dúvida, mas primeiro vou par um slide antigo, da RDNA2:

Informação importante: Gasto energético para mover um dado de/para o Infinity Cache, que é de 1,3 pJ/bit. Certo... e o que esse número significa? Sabendo que 1pJ/bit equivale a 1 mW/Gbps, temos (na 6900XT):
- 1664GBps * 0,0013 W/Gbps = 2,16W * 8 = 17,30W

Certo, e onde está o slide do EPYC? Aqui:

AMD-EPYC-9004-Genoa-Chiplet-Architecture-GMI3-Narrow-and-GMI3-Wide.jpg

A comunicação do chiplet com o IOD dos EPYCs aparentemente utilizam o mesmo protocolo das RDNA3, então é bem provável que o custo para movimentar dados entre ambas seja o mesmo. Por que eu digo que ambos utilizam o mesmo protocolo? Porque esse documento diz que essa intercomunicação também é a da RDNA3:

Interessante não? Bem, voltando, olhem para quanto caiu o custo de movimentação de dados intra-die: De 1,3pJ/bit para 0,3pJ/bit, então agora temos o valor inter-die e intra-die, e isso possibilita...
- 5300GBps * 0,0018 W/Gbps = 2,65W * 8 = 76,32W

Ou seja, enquanto que a RDNA2 gastava ~17W para ler/escrever dados no InfinityCache a uma velocidade de ~1,5TB/s, a RDNA3 gasta ~76W para ler/escrever nessa mesma LLC a uma velocidade de 5,3TB/s. Logo realmente um clock maior nos shaders vai elevar esse consumo, mas não tanto quanto imaginava (~3GHz shader clock = ~90W InfLink, mas não chegará nisso pois saturaria o limite*** da intercomunicação, portanto o consumo máximo seria de ~79W, ~88W no pior dos casos).

---
OBS1: Interessante saber que essa intercomunicação tem um limite atual de 912,5 GB/s por PHY, o que dá 5,475 TB/s de largura de banda máxima na 7900XTX, ou seja, a AMD já deixou a largura de banda na sua topo de linha praticamente no máximo;

OBS2: Coloquei a eficiência em 1,8pJ/bit pois é o valor do custo do Infinity Fabric (1,5pJ/bit) somado com 0,3pJ, e que fica abaixo dos 2pJ/bit informado nos GENOA, então é um chute bem realista (apesar de ter quem acredite que é o valor é de 2pJ/bit mesmo), logo todo esse consumo é algo aproximado e só teremos certeza quando a AMD soltar um documento ou falar explicitamente.

OBS3: Aqui uma tabela comparativa de custo de movimentação de dados em outras tecnologias/protocolos (o EMIB está mais para 0,5 que 0,3):

FabianoSR · 12/11/2022

dayllann disse:
Estava aqui conversando com meus neurônios e me encucando com o consumo da intercomunicação do RDNA3, até que com a apresentação dos GENOA vi um slide e consegui tirar minha dúvida, mas primeiro vou par um slide antigo, da RDNA2:

Informação importante: Gasto energético para mover um dado de/para o Infinity Cache, que é de 1,3 pJ/bit. Certo... e o que esse número significa? Sabendo que 1pJ/bit equivale a 1 mW/Gbps, temos (na 6900XT):
- 1664GBps * 0,0013 W/Gbps = 2,16W * 8 = 17,30W

Certo, e onde está o slide do EPYC? Aqui:

A comunicação do chiplet com o IOD dos EPYCs aparentemente utilizam o mesmo protocolo das RDNA3, então é bem provável que o custo para movimentar dados entre ambas seja o mesmo. Por que eu digo que ambos utilizam o mesmo protocolo? Porque esse documento diz que essa intercomunicação também é a da RDNA3:

Interessante não? Bem, voltando, olhem para quanto caiu o custo de movimentação de dados intra-die: De 1,3pJ/bit para 0,3pJ/bit, então agora temos o valor inter-die e intra-die, e isso possibilita...
- 5300GBps * 0,0018 W/Gbps = 2,65W * 8 = 76,32W

Ou seja, enquanto que a RDNA2 gastava ~17W para ler/escrever dados no InfinityCache a uma velocidade de ~1,5TB/s, a RDNA3 gasta ~76W para ler/escrever nessa mesma LLC a uma velocidade de 5,3TB/s. Logo realmente um clock maior nos shaders vai elevar esse consumo, mas não tanto quanto imaginava (~3GHz shader clock = ~90W InfLink, mas não chegará nisso pois saturaria o limite*** da intercomunicação, portanto o consumo máximo seria de ~79W, ~88W no pior dos casos).

---
OBS1: Interessante saber que essa intercomunicação tem um limite atual de 912,5 GB/s por PHY, o que dá 5,475 TB/s de largura de banda máxima na 7900XTX, ou seja, a AMD já deixou a largura de banda na sua topo de linha praticamente no máximo;

OBS2: Coloquei a eficiência em 1,8pJ/bit pois é o valor do custo do Infinity Fabric (1,5pJ/bit) somado com 0,3pJ, e que fica abaixo dos 2pJ/bit informado nos GENOA, então é um chute bem realista (apesar de ter quem acredite que é o valor é de 2pJ/bit mesmo), logo todo esse consumo é algo aproximado e só teremos certeza quando a AMD soltar um documento ou falar explicitamente.

OBS3: Aqui uma tabela comparativa de custo de movimentação de dados em outras tecnologias/protocolos (o EMIB está mais para 0,5 que 0,3):

Se eu entendi bem o que você escreveu a respeito da RDNA3, o nível de overclock dela será muito baixo ou nulo então?

dayllann · 12/11/2022

FabianoSR disse:
Se eu entendi bem o que você escreveu a respeito da RDNA3, o nível de overclock dela será muito baixo ou nulo então?

Não entendeu muito bem então, só trouxe um pensamento meu quanto ao consumo da intercomunicação off-die MCD-GCD, não significa que isso limite o OC do front-end/shader-engine , apenas que o limite dessa intercomunicação é de 915GB/s e a 7900XTX já opera a 883GB/s.

Simplificando: A velocidade da comunicação entre as cache L2 e L3 já está quase no máximo, mas isso não impactará no OC do GCD (mas poderá no desempenho).

Matematicamente falando, se o IF_CLK for 1:1 com o clock do shader, qualquer OC acima de 2,6GHz (nos shaders) não aumentará a largura de banda do InfinityCache, ela estacionará em 5,47TB/s. Isso significa que acima de 2,6GHz nos shaders o ganho de desempenho será pequeno pois haverá gargalo na largura de banda entre caches (clock sobe, trafego de dados não). Isso também significa que, depois de certo ponto, o gnho de desempenho se inverterá, e em clocks muito altos haverá perda por saturação do barramento, mas isso é hipoteticamente falando.

Podemos até colocar esse detalhe na lista do por quê da AMD não ter colocado um clock mais alto na sua high-end.

FabianoSR · 12/11/2022

dayllann disse:
Não entendeu muito bem então, só trouxe um pensamento meu quanto ao consumo da intercomunicação off-die MCD-GCD, não significa que isso limite o OC do front-end/shader-engine , apenas que o limite dessa intercomunicação é de 915GB/s e a 7900XTX já opera a 883GB/s.

Simplificando: A velocidade da comunicação entre as cache L2 e L3 já está quase no máximo, mas isso não impactará no OC do GCD (mas poderá no desempenho).

Matematicamente falando, se o IF_CLK for 1:1 com o clock do shader, qualquer OC acima de 2,6GHz nos shaders não aumentará a largura de banda do InfinityCache, ela estacionará em 5,47TB/s. Isso significa que acima de 2,6GHz nos shaders o ganho de desempenho será pequeno pois haverá gargalo na largura de banda entre caches (clock sobe, trafego de dados não).

Podemos até colocar esse detalhe na lista do por quê da AMD não ter colocado um clock mais alto na sua high-end.

Grato pela explicação.

VelhoPobre · 12/11/2022

ok, 46 horas pro lançamento, façam suas apostas, 7900 xtx quantos % da potencia da 4090? big win? bug flop? façam suas apostas!

ThigasRCS · 12/11/2022

VelhoPobre disse:
ok, 46 horas pro lançamento, façam suas apostas, 7900 xtx quantos % da potencia da 4090? big win? bug flop? façam suas apostas!

Lançamento é 13 de dezembro.

EtaLasquera · 12/11/2022

Enquanto não tem as novas, vamos de o que as velhas NAVI 2 fazem

Cyberpunk 2077

00:00 - 1080p, baixa - média 105fps, mínima 69fps
01:57 - 1080p, ultra - média 102fps, mínima 67fps
03:32 - 1080p, RT ultra - média 68fps, mínima 53fps
05:20 - 1440p, baixa - média 105fps, mínima 69fps
07:17 - 1440p, ultra - média 96fps, mínima 69fps
09:06 - 1440p, RT ultra - média 56fps, mínima 45fps
10:51 - 2160p, baixa - média 103fps, mínima 69fps
12:50 - 2160p, ultra - média 50fps, mínima 40fps
14:42 - 2160p, RT ultra - média 40fps, mínima 32fps
16:30 - 2160p, RT ultra FSR OFF (Kamikaze Gameplay) - média 13fps, mínima 10fps

Note que para esse jogo, o CPU limita muito o desempenho.

CPU Ryzen 5 3600X
GPU RX 6800 XT Red Devil
RAM Corsair CL16 3200Mhz
STORAGE Adata SX8200
COOLER Lanshuo China Is Democracy
PSU Corsair 650W

StayHeavy · 12/11/2022

Atsushi disse:
Cadê 6800xt diversas com desconto, várias 3080 aparecendo na faixa dos 5k

https://www.kabum.com.br/produto/131631/placa-de-video-rx-6800-xt-asrock-amd-radeon-16gb-gddr6-radeon-rx6800xt-pgd-16go?awc=17729_1668259288_6788d86b47f0a90a908c60ba6b618034&utm_source=AWIN&utm_medium=AFILIADOS&utm_campaign=PS5FIFA_out22&utm_content=&utm_term=935027

Placa de Vídeo RX 6800 XT ASRock AMD Radeon, 16GB GDDR6 - RADEON RX6800XT PGD 16GO - Placa de Vídeo - Magazine Gpubrasil

Placa de Vídeo RX 6800 XT ASRock AMD Radeon, 16GB GDDR6 - RADEON RX6800XT PGD 16GO com as melhores condições você encontra no Magazine Gpubrasil. Confira!

www.magazinevoce.com.br

Resultados da busca por: 'placa de video powercolor radeon red dragon rx 6800 xt 16gb gddr6 16gbd6 3dhr0c'

www.fgtec.com.br

Atsushi · 12/11/2022

StayHeavy disse:
https://www.kabum.com.br/produto/131631/placa-de-video-rx-6800-xt-asrock-amd-radeon-16gb-gddr6-radeon-rx6800xt-pgd-16go?awc=17729_1668259288_6788d86b47f0a90a908c60ba6b618034&utm_source=AWIN&utm_medium=AFILIADOS&utm_campaign=PS5FIFA_out22&utm_content=&utm_term=935027

Placa de Vídeo RX 6800 XT ASRock AMD Radeon, 16GB GDDR6 - RADEON RX6800XT PGD 16GO - Placa de Vídeo - Magazine Gpubrasil

Placa de Vídeo RX 6800 XT ASRock AMD Radeon, 16GB GDDR6 - RADEON RX6800XT PGD 16GO com as melhores condições você encontra no Magazine Gpubrasil. Confira!

www.magazinevoce.com.br

Resultados da busca por: 'placa de video powercolor radeon red dragon rx 6800 xt 16gb gddr6 16gbd6 3dhr0c'

www.fgtec.com.br

Queria uma das três com mais de um ano de garantia, snme é ASUS, Giga e MSI as melhores (3 anos)

VelhoPobre · 12/11/2022

sacanagem na gringa os preços das gpu continuam caindo, tirando algumas da nvidia, amd caiu esse mes de novo em media 10% 6950 xt por 654

se eu comprar uma gigabyte na gringa, consigo usar a garantia aqui no hu3zil?

hoguga · 12/11/2022

Mushidon disse:
6950XT por 5999 na terabyteshop, será se vale?

Nao vale.. 15% aciima da 6800xt, custando 50% mais..

VelhoPobre disse:
se tu não vai esperar a 7900 xtx acho que sim, o valor mais baixo que vi pra essa placa, mas se o hu3zil não afundar mais(o que tem 99% de chances de ocorrer devido a eventos recentes) o preço cai mais ainda depois que lançar a serie 7000

na gringa essa placa ta 860, na cotação de hoje da uns 4,6k então ta acima, mas ainda a mais barata que vi, fora essa vi na kabum por 6,5k

--- Post duplo é unido automaticamente: 11/11/2022 ---

compartilha esses cupom bom ai

cupom morreu faz tmpo srs

zOLtAm · 12/11/2022

EtaLasquera disse:
Enquanto não tem as novas, vamos de o que as velhas NAVI 2 fazem

Cyberpunk 2077

00:00 - 1080p, baixa - média 105fps, mínima 69fps
01:57 - 1080p, ultra - média 102fps, mínima 67fps
03:32 - 1080p, RT ultra - média 68fps, mínima 53fps
05:20 - 1440p, baixa - média 105fps, mínima 69fps
07:17 - 1440p, ultra - média 96fps, mínima 69fps
09:06 - 1440p, RT ultra - média 56fps, mínima 45fps
10:51 - 2160p, baixa - média 103fps, mínima 69fps
12:50 - 2160p, ultra - média 50fps, mínima 40fps
14:42 - 2160p, RT ultra - média 40fps, mínima 32fps
16:30 - 2160p, RT ultra FSR OFF (Kamikaze Gameplay) - média 13fps, mínima 10fps

Note que para esse jogo, o CPU limita muito o desempenho.

CPU Ryzen 5 3600X
GPU RX 6800 XT Red Devil
RAM Corsair CL16 3200Mhz
STORAGE Adata SX8200
COOLER Lanshuo China Is Democracy
PSU Corsair 650W

RT numa série 6000 é tipo colocar uma ferrari pra puxar uma cegonha de carros

VelhoPobre · 12/11/2022

passagem brazil -> usa ida e volta R$3,023

ta compensando ir buscar pessoalmente

EtaLasquera · 12/11/2022

zOLtAm disse:
RT numa série 6000 é tipo colocar uma ferrari pra puxar uma cegonha de carros

Sabe que eu pensava isso qdo eu tinha uma RTX 3070... Mas não é tão ruim assim.

O que deixava a guerra feia era o dlss.

Uma 3080 em 1440p RT ultra fica com 65 fps em média e 52 em mínimas, na minha opinião, isso não é tão mais assim do que a 6800xt faz.

As RTX são melhores mas não 70% melhores igual era quando existia o DLSS e não existia o fsr.

Agora é só uns 15%, comparando 6800xt vs 3080.

Maximoff · 12/11/2022

Quero ver a Nvidia anunciando um corte de preço assim que sairem os reviews da 7900XTX. Bom ver a AMD pressionando a verde.

DiogoDX · 12/11/2022

FabianoSR disse:
Se eu entendi bem o que você escreveu a respeito da RDNA3, o nível de overclock dela será muito baixo ou nulo então?

Não necessariamente. Só está falando da banda disponível para as RDNA3 com o novo cache mas que essa banda extra também trás um consumo extra já que o cache não está mais on die como nas RDNA2. Algo parecido com o infinity fabric dos Zen que possibilita a tecnologia de chiplets mas tem seu custo no consumo total do chip.

Sobre o overclock se o hit rate do cache for bom e com toda essa banda vai tornar a GPU mais shader bound do que banda bound o que na teoria teria melhores resultados com overclock. E tem que lembrar que agora após o cache vai ter um bus de 384 bits na XTX e 320 bits na XT o que também na teoria pode melhorar os resultados no over além também da placa perder menos performance em 4K comparando com os 256 bits das RDNA2.

cucobr · 12/11/2022

VelhoPobre disse:
ok, 46 horas pro lançamento, façam suas apostas, 7900 xtx quantos % da potencia da 4090? big win? bug flop? façam suas apostas!

ThiagoCatem disse:
Lançamento é 13 de dezembro.

Dureza.

ksio89 · 13/11/2022

Existe algum programa para placas Radeon equivalente ao Nvidia Profile Inspector? E tem como ativar o 1/2 sync nas GPUs da AMD?

DiogoDX · 13/11/2022

ksio89 disse:
Existe algum programa para placas Radeon equivalente ao Nvidia Profile Inspector? E tem como ativar o 1/2 sync nas GPUs da AMD?

Não. Praticamente só dá para fazer o que tem no driver mesmo. Acho que não tem half vsync no driver mas tem um limitador de frames.

Antigamente existia o RadeonPro mas foi descontinuado. Acho que funciona até a série RX200 e win7.

gueras · 13/11/2022

Galera nunca elogia oq é bom. Formidável a implementação do FSR2 no RDR2.

FabianoSR · 14/11/2022

AMD Radeon RX 7000 (RDNA3) Infinity Links operate at 9.2 Gb/s, 10x higher bandwidth density than Ryzen Infinity Fabric - VideoCardz.com

AMD Infinity Links between Navi 31 MCDs and GCDs have 10x bandwidth density than EPYC and Ryzen chiplets Some further details on AMD RDNA3 architecture have been posted by Japanese website ASCII. Some slides were not seen before, which is probably why the article has already been taken down. AMD...

videocardz.com

@dayllann , faça seus comentários por favor.
:isso:

breakman · 14/11/2022

Cantrell · 14/11/2022

Lckhd disse:

Powercolor podia deixar de ser murrinha e dar pelo menos 2 anos de garantia logo. Essas placa capetão edition são as melhores.

insanee420 · 14/11/2022

To de olho uma 3080 mas por esse preço... infelizmente não fui ligeiro o suficiente kkkkkk

VelhoPobre · 14/11/2022

insanee420 disse:
To de olho uma 3080 mas por esse preço... infelizmente não fui ligeiro o suficiente kkkkkk

putzz.....essa valia a pena, mesmo que fosse pra revender, conseguia 1k de lucro fácil

usada o mais barato que vi foi 3.300, mas tu pegou essa promo por acaso ou usa algum serviço que avisa tu?

[TÓPICO DEDICADO] NAVI - próxima geração de GPUs da AMD

Shy Member

know-it-all Member

Shy Member

know-it-all Member

HATES dumb people

know-it-all Member

EtaLasquera

Guest

twitch.tv/stayheavy87

Well-Known Member

HATES dumb people

Gustavo

yolocopter

HATES dumb people

EtaLasquera

Guest

know-it-all Member

Hardcore PC Gamer

PC Master Race

know-it-all Member

Hardcore PC Gamer

know-it-all Member

know-it-all Member

know-it-all Member

What the Hell Have I

know-it-all Member

HATES dumb people

Users who are viewing this thread