[TÓPICO DEDICADO] AMD Ryzen Socket AM4 - Zen, Zen+, Zen 2 & Zen 3

Você vai migrar para um ZEN


  • Total de votos
    1,021
Vou fazer uma postagem a título de curiosidade mesmo:

Já faz algum tempo troquei um Ryzen 5800x por um 5900x, e mais nada. Fiz os vários testes do Aida64 e o desempenho da CPU subiu exatamente o que seria o esperado.

Mas, o que me deixou meio surpreso foi o grande aumento de desempenho nas operações de escrita da RAM. Sei que o cache da CPU maior (L3 é o dobro, 32 contra 64 MB) realmente deveria dar alguma diferença, mas pensei que fosse mais na leitura, só que na leitura mesmo mudou pouco e na verdade na escrita que quase dobrou. Achei curioso isso!

As operações dos caches L1 L2 e L3 eu já suspeitava que seriam muito afetadas mesmo, minha surpresa foi a operação de Write na memória RAM.

Não uso overclock nenhum, deixo todas as opções da BIOS sempre no padrão, está tudo nominal de cada CPU. Vejam os valores abaixo:

nps5upH.png
É pq o 5900x tem 2 CCDs, aí ambos conseguem trabalhar em paralelo por cima do IF, algo assim.

O @dayllann sabe explicar melhor.
Basicamente é da arquitetura dos Ryzens: Como escrita consome mais energia que leitura, e o usuário comum em aplicações comuns depende mais da velocidade de leitura que de escrita, a AMD decidiu otimizar sua uArch nisso, e colocou o canal de comunicação do IOD com cada CCD em 32B/ciclo para leitura e 16B/ciclo para escrita.

Zen3_arch_22.jpg


Como o IMC/UMC se comunica com o IF à 32B/ciclo ida e volta, não temos como realizar uma leitura de 64B/ciclo, então com dois CCDs temos 32B/ciclo de comunicação dos CCDs com a RAM, dando a velocidade plena na escrita e leitura. Mas quando temos apenas um CCD...

Zen3_arch_21.jpg


...passamos a ter uma taxa de escrita limitada, para ser exato metade da de leitura. Com isso o CCD se comunica com a RAM lendo a 32B/ciclo e escrevendo a 16B/ciclo, reduzindo a taxa de leitura total para quase a metade. Na teoria isso interfere bastante no desempenho (fica feio em benchmarks) mas na prática são poucos os programas que são afetados por isso, ressaltando novamente no campo de aplicações comuns, e como a cache L3 é demasiada grande esta penalidade é bem amortizada.

Simplificando, é quase o que o @igormp disse mesmo xD
 
Basicamente é da arquitetura dos Ryzens: Como escrita consome mais energia que leitura, e o usuário comum em aplicações comuns depende mais da velocidade de leitura que de escrita, a AMD decidiu otimizar sua uArch nisso, e colocou o canal de comunicação do IOD com cada CCD em 32B/ciclo para leitura e 16B/ciclo para escrita.

Zen3_arch_22.jpg


Como o IMC/UMC se comunica com o IF à 32B/ciclo ida e volta, não temos como realizar uma leitura de 64B/ciclo, então com dois CCDs temos 32B/ciclo de comunicação dos CCDs com a RAM, dando a velocidade plena na escrita e leitura. Mas quando temos apenas um CCD...

Zen3_arch_21.jpg


...passamos a ter uma taxa de escrita limitada, para ser exato metade da de leitura. Com isso o CCD se comunica com a RAM lendo a 32B/ciclo e escrevendo a 16B/ciclo, reduzindo a taxa de leitura total para quase a metade. Na teoria isso interfere bastante no desempenho (fica feio em benchmarks) mas na prática são poucos os programas que são afetados por isso, ressaltando novamente no campo de aplicações comuns, e como a cache L3 é demasiada grande esta penalidade é bem amortizada.

Simplificando, é quase o que o @igormp disse mesmo xD
Na pratica tem diferença considerável em desempenho?
 
saiu bios beta pra Asus TUF Gaming X570-PLUS/BR e teve atualização pro sistema de iluminação dos led junto pra quem usa isso
o cooler que vem com a mob dura +/- quanto tempo ?
 
saiu bios beta pra Asus TUF Gaming X570-PLUS/BR e teve atualização pro sistema de iluminação dos led junto pra quem usa isso
o cooler que vem com a mob dura +/- quanto tempo ?
Falando em bios, a gigabyte finalmente lançou a versão estável da F63 para as B450, alguém já atualizou para a versão estável, o que achou? Estou ainda na F63d, por enquanto está sólido que nem rocha, tudo funcional, fico até receoso em querer instalar a F63 estável e dar um b.o monstro.
 
16-18-18-36-54 pelo menos, talvez precisará aumentar a voltagem da memória. O resto são timings secundários é mais complicado mexer e muita chance de dar erro então deixa em auto, exceto o tRFC deixa em 440 se ele tiver acima disso (veja no aida64 o valor real), pois quanto mais alto pior. O meu por exemplo fica 600 e pouco por padrão, desnecessário.


Eu fiz experiencias quando comprei os pentes modelo Crucial tentando timings menores , se me lembro também aumentei um pouco a voltagem, mas sempre ficava meio instável, as vezes dava erro quando trabalhando ou jogando, ou tela azul., mesmo usando uma placa mãe X570 que favorece fazer ajustes.

Então deixei quieto isso. Talvez porque uso 4 pentes (4 x 16 mb), isso pode atrapalhar também.

Trabalho o dia inteiro com o PC que funciona com o servidor e desktop então preciso de estabilidade acima de tudo. Por isso aliás peguei uma X570, teoricamente garante mais estabilidade por ter mais fases e componentes melhores, fora que também preciso de muitas portas SATA.

Só dando uma opinião posso estar errado mas acho que o ganho de performance no geral acaba sendo muito peequeno pra compensar mais voltagem, mais energia, mais aquecimento nas memorias.

Nem na CPU eu mexo, deixo tudo no padrão, no AMD ryzen master o clock máximo boost aparece 4,9 ghz, até um pouco maior que o que consta no site da AMD que é máximo boost de 4,8 ghz para o 5900X, assim sendo já está ótimo pra mim. Também acho que overclock não compensa muito no 5900X e talvez na maioria dos ryzen, posso esdtar errado mas penso assim.
 
Última edição:
mais voltagem na memoria e pra tentar dar mais estabilidade
e as satas da mob não e la essa coisa eu to usando em raid mais não soma a velocidade de todas as satas
 
Eu fiz experiencias quando comprei os pentes modelo Crucial tentando timings menores , se me lembro também aumentei um pouco a voltagem, mas sempre ficava meio instável, as vezes dava erro quando trabalhando ou jogando, ou tela azul., mesmo usando uma placa mãe X570 que favorece fazer ajustes.

Então deixei quieto isso. Talvez porque uso 4 pentes (4 x 16 mb), isso pode atrapalhar também.

Trabalho o dia inteiro com o PC que funciona com o servidor e desktop então preciso de estabilidade acima de tudo. Por isso aliás peguei uma X570, teoricamente garante mais estabilidade por ter mais fases e componentes melhores, fora que também preciso de muitas portas SATA.

Só dando uma opinião posso estar errado mas acho que o ganho de performance no geral acaba sendo muito peequeno pra compensar mais voltagem, mais energia, mais aquecimento nas memorias.

Nem na CPU eu mexo, deixo tudo no padrão, no AMD ryzen master o clock máximo boost aparece 4,9 ghz, até um pouco maior que o que consta no site da AMD que é máximo boost de 4,8 ghz para o 5900X, assim sendo já está ótimo pra mim. Também acho que overclock não compensa muito no 5900X e talvez na maioria dos ryzen, posso esdtar errado mas penso assim.
Ah sim, sempre levo para o lado gamer pois da um ganho de fps, principalmente no 5600g que é placa integrada e usará memória ram pra vídeo.
--- Post duplo é unido automaticamente: ---

E não basta só diminuir os timings sem critério e aumentar voltagem, tem que saber a relação deles para deixar equilibrado, principalmente nos secundários, senão dá erro mesmo.
 
Última edição:
Basicamente é da arquitetura dos Ryzens: Como escrita consome mais energia que leitura, e o usuário comum em aplicações comuns depende mais da velocidade de leitura que de escrita, a AMD decidiu otimizar sua uArch nisso, e colocou o canal de comunicação do IOD com cada CCD em 32B/ciclo para leitura e 16B/ciclo para escrita.

Como o IMC/UMC se comunica com o IF à 32B/ciclo ida e volta, não temos como realizar uma leitura de 64B/ciclo, então com dois CCDs temos 32B/ciclo de comunicação dos CCDs com a RAM, dando a velocidade plena na escrita e leitura. Mas quando temos apenas um CCD...

...passamos a ter uma taxa de escrita limitada, para ser exato metade da de leitura. Com isso o CCD se comunica com a RAM lendo a 32B/ciclo e escrevendo a 16B/ciclo, reduzindo a taxa de leitura total para quase a metade. Na teoria isso interfere bastante no desempenho (fica feio em benchmarks) mas na prática são poucos os programas que são afetados por isso, ressaltando novamente no campo de aplicações comuns, e como a cache L3 é demasiada grande esta penalidade é bem amortizada.

Simplificando, é quase o que o @igormp disse mesmo xD


Perfeito. Só acrescentando que alguns criticam a latência entre os 2 CCDs que poderia piorar as coisas em alguns jogos.



 
Perfeito. Só acrescentando que alguns criticam a latência entre os 2 CCDs que poderia piorar as coisas em alguns jogos.




Eu li a respeito e vi que alguns processadores mesmo os inferiores como 5700 e 5800 tinham 2 mesmo um não sendo usado pois era desativado. Acho que poderia ser esse o motivo. Mas realmente alguns vem com os dois ativados, nesse caso não sei se seria "defeito" de fabrica ou se todos 5900x são assim.
 
Última edição:
Na pratica tem diferença considerável em desempenho?

Ele explicou lá: "mas na prática são poucos os programas que são afetados por isso, ressaltando novamente no campo de aplicações comuns, e como a cache L3 é demasiada grande esta penalidade é bem amortizada."
 
Na pratica tem diferença considerável em desempenho?
Depende da sua carga de trabalho. Edição de video, banco de dados e compressão de video, por exemplo, vão sentir o impacto dessa largura de banda reduzida. Jogar, navegar na internet e escritório a diferença será irrisória (tem, mas não incomoda, a cache amortiza). Como esse primeiro grupo depende de muitos núcleos, normalmente quem utiliza o PC para isso irá comprar um com 2 CCDs de qualquer forma (12 e 16 núcleos), e por isso não reclamará/sentirá esta decisão de uArch.


Perfeito. Só acrescentando que alguns criticam a latência entre os 2 CCDs que poderia piorar as coisas em alguns jogos.




Isso, não à toa que se recomenda para jogos CPUs com apenas 1 CCD: A escrita continua em 16B/ciclo, logo caso o jogo pegue dois núcleos em cada CCD ele dividirá a leitura dos dados ao meio, por isso ao invés de ler a 32B/ciclo ele estará lendo a 16B/ciclo e isso para programas sensíveis à latência (como jogos) pode incomodar (some o fato de cópia de dados entre os CCDs para manter a coerência das caches).

Quanto ao caso da série 7000, isso é um erro no escalonador do Windows, inclusive o desempenho é bem melhor no 21H2 que no 22H2 (tanto no Win10 quanto no Win11). Alguma atualização no SO da Microsoft fez com que os dados fossem escritos em CCDs diferentes ao invés de priorizar em apenas um CCD, e isso afeta negativamente a latência pelo que falei mais acima.


Eu li a respeito e vi que alguns processadores mesmo os inferiores como 5700 e 5800 tinham 2 mesmo um não sendo usado pois era desativado. Acho que poderia ser esse o motivo. Mas realmente alguns vem com os dois ativados, nesse caso não sei se seria "defeito" de fabrica ou se todos 5900x são assim.
Tem muito a ver não, esse chiplet morto não recebe ligação de dados, apenas de energia para receber comando de "wake up" e o retorno é nulo, logo não é utilizado.

Impacto na latência? Não chega a ser nulo, mas é tão ínfimo que não se percebe em benchmarks ou uso. O que ocorreu recentemente foi de alguns 7600X que tinham dois chiplets onde o útil era o CCD1 e não CCD0 darem problema pelo escalonador do Windows querer iniciar os dados sempre pelo CCD0. Uma correção foi lançada na AGESA para evitar isso (sim, quem teve que contornar foi a AMD quando o problema é da Microsoft).

E por fim, mais latência em alguns aplicativos com dois chiplets, assim como uma menor largura de banda de leitura da RAM/CACHE com um CCD, é uma decisão/limitação da arquitetur e não um defeito.
 
Última edição:
Eu li a respeito e vi que alguns processadores mesmo os inferiores como 5700 e 5800 tinham 2 mesmo um não sendo usado pois era desativado. Acho que poderia ser esse o motivo. Mas realmente alguns vem com os dois ativados, nesse caso não sei se seria "defeito" de fabrica ou se todos 5900x são assim.
aqui eu senti diferença migrando do windows 10 para o 11 22H2, não entendo como tem pessoas falando que não sentiram melhora... varios benchmark mostrando melhora significativa.

A Propria Intel e AMD já se pronunciaram para adotarem o 11 22H2 para CPUs de ultima geração
 
Depende da sua carga de trabalho. Edição de video, banco de dados e compressão de video, por exemplo, vão sentir o impacto dessa largura de banda reduzida. Jogar, navegar na internet e escritório a diferença será irrisória (tem, mas não incomoda, a cache amortiza). Como esse primeiro grupo depende de muitos núcleos, normalmente quem utiliza o PC para isso irá comprar um com 2 CCDs de qualquer forma (12 e 16 núcleos), e por isso não reclamará/sentirá esta decisão de uArch.



Isso, não à toa que se recomenda para jogos CPUs com apenas 1 CCD: A escrita continua em 16B/ciclo, logo caso o jogo pegue dois núcleos em cada CCD ele dividirá a leitura dos dados ao meio, por isso ao invés de ler a 32B/ciclo ele estará lendo a 16B/ciclo e isso para programas sensíveis à latência (como jogos) pode incomodar (some o fato de cópia de dados entre os CCDs para manter a coerência das caches).

Quanto ao caso da série 7000, isso é um erro no escalonador do Windows, inclusive o desempenho é bem melhor no 21H2 que no 22H2 (tanto no Win10 quanto no Win11). Alguma atualização no SO da Microsoft fez com que os dados fossem escritos em CCDs diferentes ao invés de priorizar em apenas um CCD, e isso afeta negativamente a latência pelo que falei mais acima.



Tem muito a ver não, esse chiplet morto não recebe ligação de dados, apenas de energia para receber comando de "wake up" e o retorno é nulo, logo não é utilizado.

Impacto na latência? Não chega a ser nulo, mas é tão ínfimo que não se percebe em benchmarks ou uso. O que ocorreu recentemente foi de alguns 7600X que tinham dois chiplets onde o útil era o CCD1 e não CCD0 darem problema pelo escalonador do Windows querer iniciar os dados sempre pelo CCD0. Uma correção foi lançada na AGESA para evitar isso (sim, quem teve que contornar foi a AMD quando o problema é da Microsoft).

E por fim, mais latência em alguns aplicativos com dois chiplets, assim como uma menor largura de banda de leitura da RAM/CACHE com um CCD, é uma decisão/limitação da arquitetur e não um defeito.
Mudando um pouco de assunto mas ainda em relação ao cache, vc que tá mais por dentro do funcionamento sabe dizer se nos processadores com vídeo integrado como 5600/5700g, se desativar o vídeo integrado na bios haverá alguma melhora em algum dos cache, ou a parte de vídeo integrado no processador é totalmente isolada e o circuito não pode ser aproveitado, pergunto isso pois o espaço do L3 cache é o dobro no 5600 o que interfere muito nos jogos, queria comprar uma placa de vídeo recente, atualmente não uso, sem precisar trocar de processador por causa do cache limitado.
 
mais voltagem na memoria e pra tentar dar mais estabilidade
e as satas da mob não e la essa coisa eu to usando em raid mais não soma a velocidade de todas as satas
Mas em contra partida a maioria dos timings primários e o trfc são sensíveis a temperatura, então não é tão trivial assim, aqui estabilizou meu over só depois que baixei a voltagem pra 1,52v, tô com 3800-14-8-14-13-21-37.
Mas vou ter que pegar mais dois pentes, aí dificilmente consigo 3800cl14, mas vou ver, meu primo tem pentes que compramos juntos, vou dar alguma outra B-Die pra ele e pegar tudo no mesmo PCB e mesmo lote, talvez eu consiga.
 
Mas em contra partida a maioria dos timings primários e o trfc são sensíveis a temperatura, então não é tão trivial assim, aqui estabilizou meu over só depois que baixei a voltagem pra 1,52v, tô com 3800-14-8-14-13-21-37.
Mas vou ter que pegar mais dois pentes, aí dificilmente consigo 3800cl14, mas vou ver, meu primo tem pentes que compramos juntos, vou dar alguma outra B-Die pra ele e pegar tudo no mesmo PCB e mesmo lote, talvez eu consiga.
O louco, e a temperatura da memória? Me diga que ela tem dissipador bom e ventilação boa dentro do gabinete, senão não vai durar muito tempo.
 
O louco, e a temperatura da memória? Me diga que ela tem dissipador bom e ventilação boa dentro do gabinete, senão não vai durar muito tempo.
Blocada.
Mas eu testei 8h no absolut, se temperatura fosse problema daria erro nele, ao toque nem chega a estar morno tbm xD
O pente não tem sensor, infelizmente.
 
Blocada.
Mas eu testei 8h no absolut, se temperatura fosse problema daria erro nele, ao toque nem chega a estar morno tbm xD
O pente não tem sensor, infelizmente.
Peguei uma netac 3200 Cl 15-15-15-35 1.35v xmp, atualmente deixo ela em 3933 CL16-18-18-36. 1.39v. Já tentei melhorar os timings além disso mas não dá boot nem deixando 1.5v, acho que o motivo é ser A-die de uma marca chinesa. Meu processador não aceita 4000 pra cima.
 
Peguei uma netac 3200 Cl 15-15-15-35 1.35v xmp, atualmente deixo ela em 3933 CL16-18-18-36. 1.39v. Já tentei melhorar os timings além disso mas não dá boot nem deixando 1.5v, acho que o motivo é ser A-die de uma marca chinesa. Meu processador não aceita 4000 pra cima.

Na minha opinião é sempre melhor ativar o XMP e colocar no clock máximo aceito aumenta estabilidade e a performance é igual.
 
Depende da sua carga de trabalho. Edição de video, banco de dados e compressão de video, por exemplo, vão sentir o impacto dessa largura de banda reduzida. Jogar, navegar na internet e escritório a diferença será irrisória (tem, mas não incomoda, a cache amortiza). Como esse primeiro grupo depende de muitos núcleos, normalmente quem utiliza o PC para isso irá comprar um com 2 CCDs de qualquer forma (12 e 16 núcleos), e por isso não reclamará/sentirá esta decisão de uArch.


É esse meu caso, fiz a troca do 5800 pro 5900 pq uso sql server, oracle e postgresql na minha máquina, também tenho um monte de VMs, as vezes tenho duas VMs abertas ao mesmo tempo pq uso diferentes versões de linux e windows server e desktop, então quanto mais nucleos melhor, no meu caso.

Pra frente talvez eu troque por um 5950 mas por enquanto o desempenho tá muito bom, então deixa quieto.
 
Na minha opinião é sempre melhor ativar o XMP e colocar no clock máximo aceito aumenta estabilidade e a performance é igual.
Eu iria aumentar pra 4000 ou mais mas o processador não aceita. Eu gosto de equilíbrio, tem gente que coloca 4400 e deixa timings na altura e aí acaba não sendo vantajoso. Até CL 18 eu deixo.
 
Mas em contra partida a maioria dos timings primários e o trfc são sensíveis a temperatura, então não é tão trivial assim, aqui estabilizou meu over só depois que baixei a voltagem pra 1,52v, tô com 3800-14-8-14-13-21-37.
Mas vou ter que pegar mais dois pentes, aí dificilmente consigo 3800cl14, mas vou ver, meu primo tem pentes que compramos juntos, vou dar alguma outra B-Die pra ele e pegar tudo no mesmo PCB e mesmo lote, talvez eu consiga.
mais vc sabe que DDR4 e 1.4V padrão ne
--- Post duplo é unido automaticamente: ---

Não tô falando de velocidade, preciso de muitas SATA pporque tenho muitos hd e ssd.
usa os adaptadores sas da china pci-e
todo sas controla sata
 
mais vc sabe que DDR4 e 1.4V padrão ne
--- Post duplo é unido automaticamente: ---


usa os adaptadores sas da china pci-e
todo sas controla sata
B-die consegue 1.5V tranquilamente, muitos fazem isso com temperatura controlada, xmp vai de 1.35v até 1.45 por considerar o máximo seguro no geral.
 
mais vc sabe que DDR4 e 1.4V padrão ne
--- Post duplo é unido automaticamente: ---


usa os adaptadores sas da china pci-e
todo sas controla sata
Bdie funciona sem degradação até 1.55v se tiver refrigeração suficiente.
Existe até alguns módulos com xmp de 1.6v.
 

Users who are viewing this thread

Voltar
Topo