Relato de primeira mão de quem montou, teve e usou plataformas AMD para +10 horas de uso direto diário – tanto profissional, para desenvolvimento de software e afins, quanto cotidiano – e operação 24/7 em segundo plano – para servir mídia e similares -- em 9 dos últimos 12 anos.
Primeiro, uma breve recapitulação sobre problemas relativamente recentes de estabilidade em plataformas Intel. Vamos lá:
Intel
Deterioração de portas SATA 3Gbps no chipset Z68: problema no nível de hardware que causava uma perda gradual de performance até possível eventual “morte” das portas após um período de cerca de 3 anos. Foi amplamente admitido e comunicado pela Intel, com RMA para usuários afetados que quisessem participar do processo. Reviewers abordaram em escala.
Performance inconsistente com HPET (High Precision Event Timer) ativado em gerações de CPU baseadas em Skylake (pelo menos até Gen 8): provável combinação de hardware com firmware que fazia com que aplicações sensíveis (ex.: jogos) pudesse performar até ~38% menos caso HPET estivesse ligado forçadamente ou fosse o timer selecionado pelo SO/aplicação. Alguns poucos reviewers identificaram e/ou abordaram.
Instabilidade com recurso de HT (Hyper-Threading) ligado em gerações de CPU Skylake: problema corrigível em nível de microcode que causava segfaults intermitentes dependendo da sequência de instruções executadas. Foi corrigido cerca de 1 ano após o lançamento da Gen 6. Alguns poucos reviewers identificaram e/ou abordaram.
Instabilidade em adaptadores de rede 2.5Gb i225-V (Foxville) usados a partir do chipset Z490 e também em mobos AMD: inicialmente, a Intel proveu uma errata sobre o mau funcionamento da stepping B1 do adaptador quando operado em links com velocidade superior a 1Gb, com o problema estando corrigido na stepping B2 (que foi a usada efetivamente para lançamento de produtos finais). Todavia, inúmeros relatos existiram e ainda existem de problemas de desconexão intermitente e instabilidade geral mesmo com stepping B2 e firmware/drivers recentes. Conforme cobertura do website wccftech.com, mesmo na época de lançamento do adaptador com stepping B2, já estava previsto o B3 – que foi lançado e finalmente corrigiu as instabilidades. Experimentei esse em primeira mão. Alguns poucos reviewers identificaram e/ou abordaram.
Desabilitação e remoção dos recursos TSX (Transactional Synchronization Extensions) e SGX (Software Guard Extensions) em CPUs do segmento cliente após acúmulo de problemas e falta de eficácia: progressivamente, esses recursos foram sendo desabilitados (em alguns períodos, foram reativados, mas, depois, desabilitados novamente) até serem removidos completamente das CPUs do segmento cliente a partir da microarquitetura Ice Lake. Alguns poucos reviewers identificaram e/ou abordaram.
Instabilidade nas primeiras levas de microcode para correção de bugs de execução especulativa (classe Spectre) e perda permanente não desprezível de performance até gerações anteriores a Comet Lake: houve diversos tipos de instabilidade relacionados às primeiras levas de updates de BIOS/UEFI, e a degradação de performance das CPUs afetadas especificamente pela variante Meltdown é notória. Reviewers abordaram em escala.
Certamente, não é uma lista exaustiva, mas, como pessoa que se interessa e acompanha exaustivamente changelogs, relatos e discussões em fóruns e demais mídias sociais de hardware/software, acredito que nenhum major ou widespread issue haja ficado de fora.
Pois bem; façamos agora uma recapitulação de problemas relativamente recentes (somente socket AM4) de estabilidade em plataformas AMD.
AMD
Provável problema de hardware em CPUs Ryzen 1K (Zen1) que causam segfaults/BSODs intermitentes: inicialmente, nos fóruns e mídias sociais, acreditava-se ser um problema limitado a batches de produção até a semana ~24 de fabricação, com o sintoma de segfault/BSOD intermitente em Linux e Windows. Posteriormente, a AMD chegou a admitir o problema como sendo um “Linux Performance Marginality Problem” a ser corrigido via firmware/AGESA, o que já começou como diagnóstico/comentário errado já que também ocorria em Windows. Muitos usuários relataram e relatam problemas mesmo depois de todas as atualizações de AGESA para Ryzen 1K. Eu experimentei o problema em primeira mão com um 1800X, precisando passar por RMA (“no questions asked” com a descrição exaustiva que fiz). Alguns poucos reviewers identificaram e/ou abordaram.
Tecnologia de boost essencialmente quebrada/ineficaz em Ryzen 1K (Zen1): o Precision Boost da primeira geração Ryzen era notório por raramente ser ativado ou observável com comportamento esperado, só sendo efetivamente corrigido com as mudanças de hardware que chegaram com Ryzen 2K/Zen+. Alguns poucos reviewers identificaram e/ou abordaram.
Problema de compatibilidade e estabilidade de memórias (em todas as gerações, de Zen1 a Zen3): principalmente nas duas primeiras gerações Ryzen (1K e 2K), era notório como era quase impossível atingir com estabilidade sequer as frequências de memória dentro das specs stock das CPUs. Eu experimentei o problema em primeira mão nas 4 gerações Ryzen, com chipsets X470, B550 e X570, nunca conseguindo operar com estabilidade dentro dos timings XMP, com frequência dentro das specs stock das CPUs, mesmo com um kit Samsung B-die (era impossível passar >=6 passos completos de Passmark memtest sem falhar no teste #7). Alguns poucos reviewers identificaram e/ou abordaram.
Instabilidade ampla e geral nos ~6 primeiros meses após o lançamento de uma nova branch/major version de AGESA para suportar novas gerações de CPUs: a cada nova série AGESA para contemplar novas gerações Ryzen, os primeiros ~6 meses sempre foram um pesadelo de estabilidade, tanto para CPUs antigas quanto para as recém-lançadas. Funcionalidades consertadas em AGESAs recentes paravam de funcionar novamente e surgiam diversos problemas novos. Alguns poucos reviewers identificaram e/ou abordaram.
Instrução RDRAND, Ryzen Master, IOMMU e diversas funcionalidades UEFI quebradas nos primeiros meses de AGESA para Ryzen 3K (Zen2): a primeira série AGESA para contemplar as CPUs Ryzen 3K/Zen2 foi um verdadeiro show de horrores nos primeiros ~4-6 meses; a instrução RDRAND estava quebrada e Destiny 2, que dependia dela, ficou sem poder ser aberto até chegar o fix; o Ryzen Master não funcionava; grupos IOMMU (uma funcionalidade muito importante para quem lida com virtualização) ficaram amplamente quebrados; e outros problemas de diversas naturezas também se manifestaram. Alguns poucos reviewers identificaram e/ou abordaram, exceto pela questão do RDRAND, a qual foi mais amplamente comentada.
Problema intermitente de clock que não sobe acima de ~800MHz em alguns boots de CPUs Ryzen 3K (Zen2) e 5k (Zen3), necessitando reboot: em algumas ocasiões, as CPUs Ryzen ficavam fixadas com todos os núcleos rodando a 800MHz, sendo necessário um reboot para reestabelecer as frequências normais. Eu experimentei o problema em primeira mão diversas vezes com Ryzen 3K (Zen2) e 5K (Zen3), e conheço usuários que ainda tem o problema mesmo com as AGESAs atuais. Alguns poucos reviewers identificaram e/ou abordaram.
Problemas de clocks baixos e segfaults em APUs Raven Ridge (Zen+) e Renoir (Zen2): em fóruns e mídias sociais, bem como na mailing list do kernel do Linux, é notória a quantidade de usuários que frequentemente enfrenta segfaults/BSODs e clocks de GPU que deixam de subir acima da frequência mínima de idle até hoje. Alguns poucos reviewers identificaram e/ou abordaram.
Boost não confiável desde Ryzen 3K (Zen2), presente até o momento em Ryzen 5K (Zen3): a variabilidade de boost entre diferentes CPUs e mobos é notória, bem como a variabilidade entre diferentes execuções de um mesmo workload. Além disso, a frequência máxima de boost listada na caixa/specs é, em grande parte, uma piada, sendo raramente atingida – se atingida at all – em muitas CPUs; e quando o é, frequentemente se trata de um spike observado quando em idle, e não em load 1T ou 2T. Como se não bastasse isso, a “garantia” de atingir essa frequência máxima diz respeito a somente um dos núcleos, e a partir da geração Ryzen 3K/Zen2 não é mais possível saber out-of-the-box qual frequência de boost é um denominador comum entre todos os núcleos. Alguns poucos reviewers identificaram e/ou abordaram.
Problemas de desconexão/mau funcionamento USB em chipsets AMD e ASMedia (presente desde a primeira geração de CPUs e chipsets AM4, e mais graves a partir de Ryzen 3K/Zen2 e presentes até o momento mesmo em B550/X570 e Ryzen 5K/Zen3): esse é mais conhecido do público em geral e afeta todas as gerações Ryzen e chipsets AM4, mas é mais pronunciado de Ryzen 3K/Zen2 em diante. Ganhou reconhecimento oficial da AMD somente após anos de relatos de usuários e uma piora vertiginosa na situação com Zen3/X570/B550. Mesmo em suas comunicações oficiais a respeito, a AMD nunca especificou a natureza do que identificou como causa-raiz ou como tentou consertar o problema via AGESA. Nas mídias sociais, alguns usuários relatam que a solução foi eficaz, muitos tiveram alguma melhora, mas ainda enfrentam problemas, e outros muitos não obtiveram melhora significativa ou at all. Alguns poucos reviewers identificaram e/ou abordaram (houve cobertura extensa sobre os comunicados da AMD, mas não sobre identificação e/ou testes de correção do problema em si etc.). Problema histórico com chipsets/CPUs AMD.
Problemas de compatibilidade e performance inconsistente com alguns drives SATA e NVMe em X570: presente em muitos relatos e mídias sociais. Alguns poucos reviewers identificaram e/ou abordaram. Problema histórico com chipsets/CPUs AMD.
Problemas de estabilidade e performance inconsistente com algumas GPUs em Ryzen 3K (Zen2) e 5K (Zen3): experimentei em primeira mão alguns crashes com GPUs NVIDIA Ampere que sumiram completamente ao migrar para Rocket Lake/Z590, e um amigo próximo também deixou de ter diversos tipos de crashes em jogos, momentos de black screen intermitentes e outros problemas com uma 6900 XT quando também migrou para Z590. Desconheço cobertura de reviewers.
Problemas de estabilidade com WHEA 18 em CPUs Ryzen 5K (Zen3): esse é um verdadeiro pandemônio que assombra inúmeras pessoas em Reddit, fóruns da AMD etc. Experimentei em primeira mão com um 5950X/X570 e jamais foi possível resolver – a máquina podia demorar menos de um dia ou algumas semanas para tomar BSOD com WHEA 18, mas sempre tomava de novo e de novo. Foi meu basta à horrorosa experiência de 4 anos com o amaldiçoado socket AM4 e com os ~9 anos de precariedade geral com AMD; foi a prova cabal de que jamais se tratou de “aguardar o socket novo amadurecer”, mas, sim, de a AMD ser absolutamente incompetente para conceber e implementar plataformas estáveis para o segmento client.
Nem todos os problemas são iguais – e para falar de estabilidade/confiabilidade de plataformas, é preciso analisar e comparar não apenas a quantidade de problemas, mas, também, seus impactos aos usuários, a natureza dos problemas (hardware ou software) e as tratativas por parte do fabricante, por exemplo. Dizer que “todos os fabricantes apresentam alguns problemas em seus produtos” é um truísmo completamente nocivo para qualquer discussão séria e prática, erguendo uma deplorável cortina de fumaça que nos desvia de qualquer análise objetiva e útil.
Notem que, para encontrar 6 problemas de alto impacto com Intel num passado “recente”, precisei ir até 2011 para buscar a falha de portas SATA com Z68 (problema esse que foi publicamente admitido e tratado) e incluir o problema do adaptador i225 (que é contornável ao optar-se por uma mobo mais recente ou que use outro adaptador ou ao adicionar um adaptador de rede discreto). Do contrário, a lista teria apenas 4 itens, dos quais um (Hyper-threading) foi solucionado completamente com atualizações de microcode, dois tiveram o aspecto de estabilidade completamente solucionado apesar de alguma redução permanente de performance/funcionalidade (Meltdown e SGX/TSX) e o último restante pode também haver sido efetivamente solucionado via microcode (HPET). Enquanto isso, a AMD tem 12 grandes problemas em AM4 com apenas 2 deles havendo sido solucionados ou sendo mais provavelmente solucionáveis (péssima branch de microcode inicial para Ryzen 3K/Zen2 e instabilidade geral de novas branches AGESA nos primeiros 6 meses).
(Houve um compatriota na thread que, para contrapor problemas sérios com AMD, comentou sobre um "problema" que enfrentou com Intel: a recusa da CPU/plataforma em operar bem com 6GB de memória, isto é, com pentes de capacidades diferentes. Olha...)
Conclusão
Em qualquer análise ou argumento digno do nome, é preciso estabelecer a conclusão com base nas premissas e seu desenvolvimento, sem ceder ao medo de desviar do “politicamente correto” ou chatear um ou outro grupo de pessoas (seja ele de usuários, reviewers, fabricantes e/ou quaisquer outros). Pois bem; havendo eu estabelecido as premissas que estabeleci, a conclusão é nítida e inescapável: a AMD é uma espécie de Multilaser das CPUs e plataformas, mas tem a vantagem de contar com uma boa dose de fanatismo por parte dos ALUCINADOS de mídias sociais e outra boa dose de análise tendenciosa e/ou incompetente de reviewers no Brasil e afora. Sinceramente, não dá para esperar muito do que temos em território tupiniquim; mas, tratando-se de uma nação tão precária quanto a nossa, qualquer reviewer minimamente ético e profissional teria justamente de fazer um esforço ordens de magnitude maior do que alguém do primeiro mundo para não recomendar PORCARIA a seus seguidores e prejudicá-los severamente. A AMD *NUNCA* soube fazer um chipset client MINIMAMENTE funcional e estável. Se eu tivesse de incluir e comentar mais detalhadamente sobre o pesadelo que foi conviver com SB600, SB700, SB710 e SB750, os quais nunca prestaram sequer para operar corretamente em AHCI e já apresentavam todo esse mau funcionamento com USB/SATA, trar-me-ia VERTIGEM e nojo – sem hipérbole nem sensacionalismo. E já passo mal ao sequer ouvir falar da BOMBA DE CALOR X570... É preciso passar muito álcool gel, sabão, cloro e cloroquina na boca antes de vir pagar de zoeiro “Intel 14nm huehuebr”.
Em casa, com dinheiro do meu bolso, AMD *não* entra mais de 2021 em diante – nem como peso de papel ou estampa de pano de chão. E para qualquer pessoa que venha me solicitar conselhos e direção sobre o que adquirir, farei *tudo* ao meu alcance para enterrar completamente a ideia de que AMD sequer merece figurar como opção. A experiência do inferno acabou, depois de 4 anos com AM4, com a migração para Intel Rocket Lake/Z590, lado esse que eu jamais deveria haver abandonado após os 3 anos com 3770K/Z77 que haviam me mostrado o que era uma plataforma confiável e funcional depois de tantas nojeiras com Athlon X2, Phenom, e por aí vai.
Para os eleitos que puderem ver a luz, sigam-na. Para os demais, meus pêsames. Mas saibam que existe computação confiável e de qualidade em cantos mais azuis. Um abraço! E parabéns ao autor do post original.