[TÓPICO DEDICADO] AMD Ryzen Socket AM4 - Zen, Zen+, Zen 2 & Zen 3

  • Iniciador de Tópicos Iniciador de Tópicos DemonbrsX
  • Data de Início Data de Início
14/3000x2000 = 9,33ms

16/3200x2000 = 10ms

Em teoria, 3000 Cl14 seria melhor, porém tem muitas variáveis.

Quanto mais frequência coloca, maiores são os timings e subtimings, e pode até piorar a latência.

Por isso muita gente aumenta a frequência e perde desempenho, pq mesmo tendo em teoria maior largura de banda, perde no RTL (round trip latency).

Eu sou do time do: vai testando até achar um bom CxB nos testes. Mas se fosse escolher, prefiro menor frequência e menores timings.

Faz muito tempo que n faço over assim, então posso ter falado bobagem.

Aqui eu ativo o XMP e esqueço. Não sou mais user hardcore neurótico hehe
Então amigo , mas com relação a largura de banda dizem que os Ryzen se beneficiam do MHz da memória, quanto maior melhor a performance do CPU.
Não sei até que ponto isso é verdade .
 
As próximas inovações mundiais dependem de um único país, Taiwan

Matéria completa no link: https://erickhun.com/posts/world-innovation-taiwan-semiconductors/?r

Por que não apenas fazer outro TSMC?
Não é tão simples. Todos os anos, bilhões de dólares americanos são investidos em P&D para manter suas vantagens. Então, as instalações de produção custam bilhões para construir:

E essas instalações de produção levariam até 5 anos para gerar lucro na melhor das hipóteses. As empresas devem investigar exaustivamente a demanda do produto, incluindo possíveis mudanças de longo prazo, antes de iniciar a construção da fábrica. O que parece não ser um problema para a TSMC que tem mais demanda do que oferta.

rANDd-breaakeven.jpg



O concorrente mais sério da TSMC hoje é provavelmente a Samsung. Conforme explicado, alguns problemas de confiança ou propriedade intelectual podem surgir, uma vez que a Samsung não está apenas fazendo chips, mas também produtos finais para seus usuários. Muitos países estão se esforçando, mas ainda não chegaram lá:

Também não é apenas dinheiro, é física de semicondutores. A Intel não está tendo os problemas que tem hoje porque falta tempo ou dinheiro. Eles provavelmente carecem de especialistas melhores que possam ajudá-los a melhorar sua tecnologia e escalar para produções em massa. O número de engenheiros que têm conhecimento de como montar os chips é muito pequeno, se comparado à maioria dos engenheiros de software ou hardware do planeta. Não é um grande campo para graduados em Engenharia Elétrica . O problema é encontrá-los e contratá-los , e você quer os melhores.

As barreiras de entrada são extremamente altas para a fabricação de chips. Alguém poderia argumentar que existem poucos, se houver, outros setores que requerem tanto investimento e especialização quanto a fabricação de semicondutores. A Apple está bem ciente disso e certamente pensou em ter suas próprias fábricas . Ela tem o dinheiro no banco ($ 200 bilhões!), Mas não tem nenhuma garantia de que tal investimento resulte na criação de chips da mesma qualidade que a TSMC pode dar a eles.

Conclusão
A fabricação de chips semicondutores de ponta é (e era) feita em Taiwan pela TSMC.








Uma curiosidade com relação a fabricação de chips semicondutores. A matéria prima que a TSMC e Samsung utilizam é fornecida pela China, visto que ela é o maior produtor de terras raras do mundo?
E @dayllann poderia comentar sobre esta nova patente da AMD?
 
Creio que ele já comentou sobre isso no tópico das Navi (inclusive creio que tu tava lá)

Esse ai é outro assunto. No tópico da NAVIs era sobre a patente de chiplet aplicada a GPU, já essa que comentei aqui neste tópico é sobre o uso de tecnologia FPGA em CPUs.
 
Verdade. Falha minha. Grato pelo lembrete.
Nada. Se quiser trazer a discussão pra cá com alguma dúvida ou algo do tipo seria bem legal já que não ficaria off-topic e temos poucas conversas assim aqui nesse fórum :)
 
 
Alguem ja fez um undervolt no 5600X pra ajudar um pouco nas temps? Dicas sao bem vindas.
 
14/3000x2000 = 9,33ms

16/3200x2000 = 10ms

Em teoria, 3000 Cl14 seria melhor, porém tem muitas variáveis.

Quanto mais frequência coloca, maiores são os timings e subtimings, e pode até piorar a latência.

Por isso muita gente aumenta a frequência e perde desempenho, pq mesmo tendo em teoria maior largura de banda, perde no RTL (round trip latency).

Eu sou do time do: vai testando até achar um bom CxB nos testes. Mas se fosse escolher, prefiro menor frequência e menores timings.

Faz muito tempo que n faço over assim, então posso ter falado bobagem.

Aqui eu ativo o XMP e esqueço. Não sou mais user hardcore neurótico hehe
Então amigo , mas com relação a largura de banda dizem que os Ryzen se beneficiam do MHz da memória, quanto maior melhor a performance do CPU.
Não sei até que ponto isso é verdade .

As duas respostas são verdadeiras, vou completar com algumas observações:

Os Ryzen melhoram com maior frequência pois o Infinity Fabric é responsável pela comunicação com dos núcleos com o I/O Die, portanto atividades que exigem vários núcleos (especialmente entre CCD diferentes) se beneficiam do clock maior do IF.

Maior frequência pode as vezes não resultar em ganho performance se os subtimings não forem devidamente ajustados e a placa mãe fazer "training" com timings automáticos muito folgados (leia-se "altos").

Aumentar a frequência pode raramente diminuir a performance em cenários específicos, esse cenário acontece normalmente quando o usuário sai do XMP e vai para um Clock maior manualmente, normalmente esses cenários são cenários dependentes de latência, onde o clock maior não compensou a maior latência.

Não basta simplesmente sair do 3000C15 e ir para 3600C20 e achar que está cuspindo FPS, não é assim que funciona.

A calculadora de latência é um bom indicativo geral se vale a pena ou não ir de uma configuração para outra.

Eu costumo recomendar 3600C16 ou 3600C17 como o "sweetspot" para os Ryzen, não é absurdamente caro de encontrar memórias capazes disso.

Lembre de usar a calculadora de timings do 1usmus, subtimings importam especialmente em jogos quando falamos de 1% low.

tFAW, tRC e tRFC são os 3 que mais impactam seu FPS "1% low" nos jogos.
 
E @dayllann poderia comentar sobre esta nova patente da AMD?
Como o @igormp bem disse, já falei dessa patente como off-topic lá no tópico das Navi, então trazendo a explicação para cá:

dayllann disse:
igormp disse:
AMEI. Será que a AMD vai conseguir emplacar uma CPU com FPGA no mesmo die? A tentativa da intel nisso creio que tenha sido um belo flop.
Rapaz, ao meu ver essa compra da Xilinx vai render muito melhor que a da Altera pela Intel, o InfinityFabric como intercomunicação de baixa latência e alta velocidade será uma combinação bem promissora para criar um XPU eficiente.

igormp disse:
Uma coisa que me deixou curioso foi que eles falaram que PCIe seria um gargalo, porém não citaram qual a alternativa (me corrija se estiver errado). Fiquei curioso para saber oq eles usariam pra comunicar algo de forma a ter latências aceitáveis. Pior ainda, me pergunto como fariam pra reprogramar de forma tão rápida após uma troca de contexto, já que normalmente é um processo lento.
Sim, falaram que o PCIe tem latência alta e não deram alternativa, então o que veio na cabeça foram duas possibilidades, uma comunicação diferente (como o NVLink ou CXL) ou esse FPGA em um interposer MCM como coprocessador se comunicando por InfinityFabric (ou o recém mostrado HBX), são as únicas possibilidades que uniriam velocidade acima e latência abaixo do que o PCI-express pode oferecer até sua 6ª geração.

Mas a pergunta que também estava na minha cabeça logo ao começar a ler a patente foi exatamente esta sua, "Como faria para reprogramar de forma tão rápida após uma troca de contexto?", e ao ler ficou claro que esse FPGA tem vários (e maiores) LUTs, o suficiente para não se reprogramar por inteiro, apenas por blocos/pedaços. Assim ele lê o bitfile, programa um pedaço suficiente para executar o conjunto de instruções A e executa-o, enquanto isso ele lê outro bitfile e vê que o tipo de instrução (e unidades de execução) são diferentes, logo enquanto executa o conjunto A em um bloco ele programa outro bloco para o conjunto B e quando o switch acontecer, as unidades de execução estão prontas. Se o conjunto A não for mais utilizado ele "limpa" aquele bloco para não puxar recursos do sistema e assim repete-se esse esquema, indefinidamente.

Curioso é que esses blocos não só mudam completamente a forma de executar conforme o bitfile, ele também pode expandir ou diminuir de acordo com o que está sendo executado no bitfile: Digamos que o bloco A está fazendo cálculos na proporção de 20% INT e 80% FP, e ai as instruções mudam para uma proporção de 80% INT e 20% FP. Este FPGA analisa com antecedência o bitfile inteiro para detectar isso e prepara dinamicamente outro bloco para aumentar a quantidade de unidades de inteiro, assim quando a proporção mudar já se terá unidades suficientes para não haver gargalo ou redução de desempenho (e logo após o FPGA irá reduzir a quantidade de unidades FP). Isso é muuuuito legal, também é dito que esse método abordado na patente utiliza inteligência artificial para se reprogramar e "adivinhar" quando as unidades precisam ser expandidas e encolhidas, além de oferecer ao programador na hora da sintetização do bitfile opções mais otimizadas de código, caso existam :D

Em spoiler segue uns trechos da patente que fala disso da redução do tempo de switch:
image.png

igormp disse:
Se isso der certo, acho que significaria a morte de toda a ideia de extensões de CPU, visto que vc poderia ter algo dinâmico e bem mais otimizado pra sua aplicação em específico (bem como ter mais de uma ativa ao mesmo tempo!!), sem falar que finalmente seria possível baixar mais ram assim xD
As possibilidades que essa patente mostra são muitas mesmo, e baixar mais RAM é até estranho de se pensar mas com esse sistema será possível mesmo xD

Claro, da para aproveitar e falar mais: Essa patente ainda fala sobre o FPGA estar dentro do mesmo die que um CPU (ou ficar em um encapsulamento próximo, como um interposer) e assim receber comandos e auxiliar ele em qualquer tarefa, e quando falo "qualquer" me refiro de forma literal, já que o FPGA pode ser reprogramad para executar desde instruções comuns como INT e FP a até específicas, como SIMD(AVX) e Bfloat16, ou até estender o funcionamento de um CPU, decodificando instruções obsoletas (por exemplo, o CPU só trabalhará com instruções x86 64bits e o FPGA com as instruções x86 32bits sob-demanda) ou até, que é a parte mais me interessa, adicionar uma unidade de codificação/decodificação de formatos de mídia que pode ser atualizado de acordo com a necessidade da pessoa (codificar HEVC ou decodificar AV1 via hardware só atualizando o sistema).

No geral as melhores possibilidades que isso trás, na prática, são reduzir o tamanho do die de um CPU deixando-o apenas para realizar tarefas de propósito geral, enquanto que o FPGA ficará responsável pelas tarefas de propósito específico e ele cuidaria de forma elástica de realizar tais tarefas priorizando desempenho ou consumo, conforme um arquivo de entrada (bitfile) lhe instruísse & adicionar um grande bloco acelerador dinâmico, que cuidaria de precisões baixas em alta velocidade para acelerar inferências e IA, e que iria mudando sua eficiência de acordo com o que lhe instruísse :)
 
Como o @igormp bem disse, já falei dessa patente como off-topic lá no tópico das Navi, então trazendo a explicação para cá:



Claro, da para aproveitar e falar mais: Essa patente ainda fala sobre o FPGA estar dentro do mesmo die que um CPU (ou ficar em um encapsulamento próximo, como um interposer) e assim receber comandos e auxiliar ele em qualquer tarefa, e quando falo "qualquer" me refiro de forma literal, já que o FPGA pode ser reprogramad para executar desde instruções comuns como INT e FP a até específicas, como SIMD(AVX) e Bfloat16, ou até estender o funcionamento de um CPU, decodificando instruções obsoletas (por exemplo, o CPU só trabalhará com instruções x86 64bits e o FPGA com as instruções x86 32bits sob-demanda) ou até, que é a parte mais me interessa, adicionar uma unidade de codificação/decodificação de formatos de mídia que pode ser atualizado de acordo com a necessidade da pessoa (codificar HEVC ou decodificar AV1 via hardware só atualizando o sistema).

No geral as melhores possibilidades que isso trás, na prática, são reduzir o tamanho do die de um CPU deixando-o apenas para realizar tarefas de propósito geral, enquanto que o FPGA ficará responsável pelas tarefas de propósito específico e ele cuidaria de forma elástica de realizar tais tarefas priorizando desempenho ou consumo, conforme um arquivo de entrada (bitfile) lhe instruísse & adicionar um grande bloco acelerador dinâmico, que cuidaria de precisões baixas em alta velocidade para acelerar inferências e IA, e que iria mudando sua eficiência de acordo com o que lhe instruísse :)
Uma coisa que me pergunto é na questão de segurança. Como que vão fazer pra limitar oq pode programar lá, e como restringir o acesso da FPGA a certas coisas? Será que vai ter algum enclave ala TrustZone só pra isso?
 
As duas respostas são verdadeiras, vou completar com algumas observações:

Os Ryzen melhoram com maior frequência pois o Infinity Fabric é responsável pela comunicação com dos núcleos com o I/O Die, portanto atividades que exigem vários núcleos (especialmente entre CCD diferentes) se beneficiam do clock maior do IF.

Maior frequência pode as vezes não resultar em ganho performance se os subtimings não forem devidamente ajustados e a placa mãe fazer "training" com timings automáticos muito folgados (leia-se "altos").

Aumentar a frequência pode raramente diminuir a performance em cenários específicos, esse cenário acontece normalmente quando o usuário sai do XMP e vai para um Clock maior manualmente, normalmente esses cenários são cenários dependentes de latência, onde o clock maior não compensou a maior latência.

Não basta simplesmente sair do 3000C15 e ir para 3600C20 e achar que está cuspindo FPS, não é assim que funciona.

A calculadora de latência é um bom indicativo geral se vale a pena ou não ir de uma configuração para outra.

Eu costumo recomendar 3600C16 ou 3600C17 como o "sweetspot" para os Ryzen, não é absurdamente caro de encontrar memórias capazes disso.

Lembre de usar a calculadora de timings do 1usmus, subtimings importam especialmente em jogos quando falamos de 1% low.

tFAW, tRC e tRFC são os 3 que mais impactam seu FPS "1% low" nos jogos.
Show !
Vou pesquisar sobre essa calculadora que eu nem sabia que existia .

Valeu
 
Uma coisa que me pergunto é na questão de segurança. Como que vão fazer pra limitar oq pode programar lá, e como restringir o acesso da FPGA a certas coisas? Será que vai ter algum enclave ala TrustZone só pra isso?
Boa dúvida, tinha esquecido de olhar este ponto. Vou até reler aqui a patente para ver se ela fala alguma coisa sobre segurança, mas por enquanto o que você disse é o que faz mais sentido, já que a patente diz que funcionará para qualquer tipo de programação (até instruções exóticas) e inclusive será compatível com os programas de sintetização já presentes no mercado =X
 
já que a patente diz que funcionará para qualquer tipo de programação
Fazer aqui algo pra varrer a ram e dar upload em chaves que encontrar :vish:

inclusive será compatível com os programas de sintetização já presentes no mercado =X
Se funcionar com algum toolchain aberto (tipo o Yosys) ia ser um sonho.
 
Pessoal, to com uma dúvida e estou achando que pode ser boba mas vou perguntar mesmo assim :P
A MSI soltou uma bios beta pra minha placa, a X470 Gaming Plus, e na descrição só tem "- Updated AMD AGESA ComboAm4v2PI 1.1.0.0 Patch D".
Isso significa que agora tem suporte pra ryzen 5000 mas que vai continuar funcionando primeira geração? Tenho um 1700 e pretendo fazer o update da bios e futuramente comprar um 5600x, mas estou em dúvida se o 1700 continua funcionando.
 
Pessoal, to com uma dúvida e estou achando que pode ser boba mas vou perguntar mesmo assim :p
A MSI soltou uma bios beta pra minha placa, a X470 Gaming Plus, e na descrição só tem "- Updated AMD AGESA ComboAm4v2PI 1.1.0.0 Patch D".
Isso significa que agora tem suporte pra ryzen 5000 mas que vai continuar funcionando primeira geração? Tenho um 1700 e pretendo fazer o update da bios e futuramente comprar um 5600x, mas estou em dúvida se o 1700 continua funcionando.

Eu te aconselharia continuar com a bios atual, e quando comprar o 5600x, quando ele chegar ai, você atualiza e troca. Provavelmente não tem mais suporte para Ryzen 1000 nas b450/x470 ao atualizar pra essa bios. Fora que corre risco de suporte de memórias que eu vi acontecendo com atualização da asrock e se não me engano MSI também.
--- Post duplo é unido automaticamente: ---

Eu te aconselharia continuar com a bios atual, e quando comprar o 5600x, quando ele chegar ai, você atualiza e troca. Provavelmente não tenha mais suporte para Ryzen 1000 nas b450/x470 ao atualizar pra essa bios. Fora que corre risco de suporte de memórias que eu vi acontecendo com atualização da asrock e se não me engano MSI também.
 
Pessoal, to com uma dúvida e estou achando que pode ser boba mas vou perguntar mesmo assim :p
A MSI soltou uma bios beta pra minha placa, a X470 Gaming Plus, e na descrição só tem "- Updated AMD AGESA ComboAm4v2PI 1.1.0.0 Patch D".
Isso significa que agora tem suporte pra ryzen 5000 mas que vai continuar funcionando primeira geração? Tenho um 1700 e pretendo fazer o update da bios e futuramente comprar um 5600x, mas estou em dúvida se o 1700 continua funcionando.
até onde sei , todas as fabricantes que soltaram att de b450/x470 , riscaram os 1000 da compatibilidade , inclusive algumas até a 2000. Mantendo apenas 3000 e 5000..

fique com a bios atual até chegar seu novo cpu.
 
@dayllann ou @igormp , saberiam me dizer se a TSMC e a Samsung utilizam matéria prima da China para a fabricação de chips? Visto que empresas chinesas foram banidas de fazer negócios com estas empresas por conta das sanções impostas pelos EUA, o que aconteceria se a China que a maior produtora de terras raras do mundo resolve-se usar este poder econômico neste mercado para azedar a capacidade de produção da TSMC e Samsung? Considerando que estão investindo pesado na modernização de fábricas chinesas para produzirem chips em processos mais modernos (embora bem atrás da TSMC e Samsung) não seria possível de começarem a diminuir a exportação de terras raras para uso próprio no futuro?
 
saberiam me dizer se a TSMC e a Samsung utilizam matéria prima da China para a fabricação de chips?
Provavelmente sim, já que ela tem mais da metade da produção mundial.

Visto que empresas chinesas foram banidas de fazer negócios com estas empresas por conta das sanções impostas pelos EUA
Assim né, banimento parcial. Se for algo que concorre ou põe em risco a hegemonia deles, tá banido. Se for algo que eles precisam, deixam passar (silício se enquadraria nisso).

o que aconteceria se a China que a maior produtora de terras raras do mundo resolve-se usar este poder econômico neste mercado para azedar a capacidade de produção da TSMC e Samsung?
Aí fudeu. Mas acho que não rola, mesmo com produção própria eles não teriam capacidade o suficiente pra fazer uso disso tudo (pelo menos nos próximos 5 anos). E deixar de vender ia ser um belo impacto econômico pra eles mesmos.

Lembrando que isso tudo é pitaco meu tirado da minha bola de cristal, não dá pra ter certeza de nada disso kkkk
 
As duas respostas são verdadeiras, vou completar com algumas observações:

Os Ryzen melhoram com maior frequência pois o Infinity Fabric é responsável pela comunicação com dos núcleos com o I/O Die, portanto atividades que exigem vários núcleos (especialmente entre CCD diferentes) se beneficiam do clock maior do IF.

Maior frequência pode as vezes não resultar em ganho performance se os subtimings não forem devidamente ajustados e a placa mãe fazer "training" com timings automáticos muito folgados (leia-se "altos").

Aumentar a frequência pode raramente diminuir a performance em cenários específicos, esse cenário acontece normalmente quando o usuário sai do XMP e vai para um Clock maior manualmente, normalmente esses cenários são cenários dependentes de latência, onde o clock maior não compensou a maior latência.

Não basta simplesmente sair do 3000C15 e ir para 3600C20 e achar que está cuspindo FPS, não é assim que funciona.

A calculadora de latência é um bom indicativo geral se vale a pena ou não ir de uma configuração para outra.

Eu costumo recomendar 3600C16 ou 3600C17 como o "sweetspot" para os Ryzen, não é absurdamente caro de encontrar memórias capazes disso.

Lembre de usar a calculadora de timings do 1usmus, subtimings importam especialmente em jogos quando falamos de 1% low.

tFAW, tRC e tRFC são os 3 que mais impactam seu FPS "1% low" nos jogos.

Qual programa uso pra saber os sub timings que minha placa mãe aplicou no meu ryzen 5600x?
 
Última edição:
Show !
Vou pesquisar sobre essa calculadora que eu nem sabia que existia .

Valeu
Qual programa uso pra saber os sub timings que minha placa mãe aplicou no meu ryzen 5600x?

A: Calculadora de latência de memória (para saber de forma genérica, qual configuração frequencia vs latencia é melhor).


B: Calculadora de timings sugeridos do 1usmus (se você usar o botão comparar, pode ver os timings atuais em relação ao sugerido).


C: ZenTimings (para ver somente os timings atualmente configurados)


D: Taiphoon Burner (ver qual o chip suas memórias possuem)

www.softnology.biz (obs: Link não funciona para algumas conexões, a minha é Vivo e não funciona, tenho que usar proxy).
 
Última edição:
Pergunta pra quem manja de memória:
Posso ter alguma perda de desempenho reduzindo as voltagens de VDIMM, VSOC, DDG CCD, VDDG IOD e VDDP (esse faz sentido?) pro menor valor possível ou é correto afirmar que quanto menor for, melhor pra não esquentar muito?


Alguem ja fez um undervolt no 5600X pra ajudar um pouco nas temps? Dicas sao bem vindas.

Fiz offset -0.05 no início e pra mim não valeu a pena pq além de não reduzir tanto a temperatura caiu um pouco o desempenho.

Se quer reduzir temperatura sugiro uma dessas opções:
1. Realizar overclock fixo.
2. Desativar PBO.
3. Usar PBO com TDP limitado.
 
Se quer reduzir temperatura sugiro uma dessas opções:
1. Realizar overclock fixo.
2. Desativar PBO.
3. Usar PBO com TDP limitado.

A melhor opção é otimizador de curva com PPT (socket power) reduzido.

Eu tenho basicamente duas opções ao fazer undervolt com o otimizador de curva:

- Manter o PPT em 142W e ganhar de +200MHz de boost all core no CB R20, ou seja, ganha-se performance sem aumentar o consumo/temperaturas.

- Reduzir o PPT para cerca de 110W e reduzir minhas temperaturas de aproximadamente 66 graus para 57 graus no CB R20 all core, ou seja, reduz o consumo/temperaturas sem perder performance).
 
Pessoal, minha esposa tem um dell 7472 e eu uma x470 gaming pro carbon.

Quando eu conecto meu fone no Note dela, o som parece melhor, com graves melhores.

O que pode ser? Será que a placa de Som do Dell é melhor? (Dúvida muito)
Algum software faltando?

PS: Meu fone é um Cloud II
 

Users who are viewing this thread

Voltar
Topo