Em teoria: uma GPU de quatro teraflop pode dar conta para um console de próxima geração?
Uma questão de escalabilidade.
Um console de próxima geração com apenas 4 teraflops de potência da GPU? Bem, esse é o boato. Enquanto a Microsoft brinca e nos tenta com o gigante de 12TF que é o Xbox Series X, os rumores persistem de que uma segunda caixa está em desenvolvimento, projetada para chegar ao mercado a um preço muito mais baixo, prejudicando o PlayStation 5 enquanto ainda é capaz de jogar cada um e todos os jogos Xbox da próxima geração. Lockhart é seu codinome e acho o conceito básico por trás de sua criação absolutamente fascinante.
Embora eu suspeite que haja nuances importantes no design que ainda não foram reveladas, é seguro assumir que a premissa básica se baseia na teoria de que os gráficos são muito mais escaláveis do que qualquer outro componente de um jogo em particular, com a idéia de que A série X tem como alvo 4K, enquanto Lockhart visa 1440p. Isso é confirmado pelos vários vazamentos de especificações que vimos, que mostram uma imagem de um console que tem muito mais pontos em comum com a Série X do que diferenças. Vazamentos sugerem que o Lockhart possui o mesmo cluster de CPU de oito núcleos / 16 threads que a série X (os relógios da CPU podem ser um pouco diferentes) enquanto ainda usa uma solução de armazenamento de estado sólido baseada no NVMe. Como foi projetado para rodar em resoluções nativas mais baixas que as da Série X, também devemos esperar uma provisão menor de memória GDDR6:
No entanto, é a GPU reduzida que apresenta o maior desafio de marketing para a Microsoft. Em um mundo em que o Xbox One X chegou ao mercado com seis teraflops em 2017, como uma máquina de 4TF pode cortá-lo para a próxima geração? Suspeito que isso se deva a uma combinação das melhorias de arquitetura Navi da AMD, que apresentam muito mais "desempenho para o seu teraflop", provavelmente combinadas com os recursos mais modernos da GPU que as atuais arquiteturas de console da GCN simplesmente não possuem. O lado arquitetônico da equação já é uma questão de registro. Em outubro do ano passado, montamos uma versão da AMD com 9,2 teraflops de potência da GPU Navi e descobrimos que obtivemos mais de 80% de desempenho a partir de apenas 53% de computação.
Eu pensei que seria interessante ver como os resultados se ajustariam se desta vez empilhássemos cerca de quatro placas gráficas Navi teraflop contra os produtos GCN Xbox One X e PC baseados em PC ajustados para oferecer 6TF de desempenho computacional. Eu usei uma Radeon RX 5500 XT, com um clock de 4.8TF baseado no relógio da vida real para cerca de 4.3TF. O RX 5500 XT possui 22 unidades de computação ativas de um total de 24 - e meu pressentimento (e nada mais!) É que uma máquina Lockhart real provavelmente apresentaria velocidades de clock aumentadas e menos UCs, necessitando de um pequeno reequilíbrio por parte do meu PC substituto .
Mesmo assim, acho que nossa GPU baseada em Navi pode estar aquém de uma especificação prospectiva de Lockhart. O RX 5500 XT possui apenas uma interface de 128 bits com 224 GB / s de largura de banda de memória conectada a quatro ou oito gigabytes de GDDR6. Se a Lockhart for fornecida com 12 GB de memória, a solução mais econômica é provavelmente um barramento de 192 bits, com algo na região de 288 GB / s de largura de banda.
Há muitas adivinhações aqui, mas a primeira pergunta que eu queria abordar foi se uma solução Navi de 4TF poderia competir com as partes da GCN de 6TF. O Xbox One X foi um ponto de comparação óbvio, mas eu também instalei um RX 590 com overclock e um R9 390 com overclock, que
realmente não gostavam de ser empurrados para 1172MHz, mas eram praticamente estáveis o suficiente para nossos resultados. Existem muitas variáveis em nossos testes aqui, portanto, esta tabela deve resumir tudo - e sim, enquanto o RX 590 estava com underclock, eu fiz overclock na memória, pois 288GB / s parece ser uma boa opção para Lockhart e o 590 pode acomodar facilmente esta. Também incluí um Radeon RX 5700 XT baseado em Navi, que oferece 9,2 teraflops de computação, uma estimativa equivalente às especificações do PS5 vazadas.
Com todo o nosso hardware em potencial alinhado, vamos começar com um ponto de comparação que apresenta o máximo possível do nosso kit. Mas, antes de tudo, vamos enfatizar que não se trata de testes de jogabilidade de última geração - devemos esperar que a utilização da GPU mude significativamente na próxima onda de jogos. O que estamos tentando fazer aqui é testar as GPUs com cargas de trabalho sensíveis e semelhantes. Para esse fim, a Io Interactive compartilhou conosco suas configurações de qualidade equivalentes ao PC para a versão Xbox One X do Hitman 2, que é executada na resolução 2160p. Apoiei todas as nossas GPUs de 6.0TF e o Navi de gama baixa nas resoluções 1080p, 1440p e 2160p - e também incluí o resultado UHD do nosso RX 5700 XT sintonizado. Como você pode ver nos benchmarks abaixo, existem alguns resultados interessantes aqui.
A principal vantagem é que o 4.3TF Navi é capaz de superar todas as placas GCN de 6.0TF contra as quais eu as compilei, apesar de sua aparente falta de poder de computação bruto e sua enorme desvantagem de largura de banda de memória em relação a qualquer outro concorrente em campo. Obviamente, não é uma vitória abrangente, mas sinto que, apesar das minhas melhores tentativas de equilibrar o RX 5500 XT, a largura de banda provavelmente é muito baixa - e, infelizmente, por razões que não entendo direito, as GPUs Navi da AMD realmente não gostam tendo seus módulos GDDR6 com overclocking, não há muito que eu possa fazer para corrigir o saldo.
Curiosamente, o Xbox One X em 2160p tem uma vantagem pequena, mas significativa, sobre o Navi low-end ajustado, mas o que eu acho especialmente fascinante é como a escalabilidade se compara ao Radeon RX 5700 XT ajustado para 9.2TF. Com uma vantagem computacional de 2,2x, a placa Navi de ponta oferece um desempenho extra de 92%. Meu entendimento é que Lockhart deve entregar em 1440p o que o Xbox Series X oferece em 4K, mas com base na escalabilidade vista aqui, a resolução precisaria ser menor para conseguir isso - talvez em algum ponto intermediário entre 1080p e 1440p. Isso poderia funcionar - o 4.3TF Navi em 1080p ainda comanda uma vantagem de quase 30% sobre o 9.2TF Navi em 4K.
Passando para o próximo caso de teste, estamos bastante confiantes de que os jogos id Tech 6 nos consoles são equivalentes às versões para PC rodando em configurações médias (e devemos enfatizar que eles ainda estão
ótimos , mesmo se não estivermos rodando em alta ou ultra). Novamente, podemos considerar o Xbox One X executando o mesmo conteúdo e, de fato, o nosso Radeon RX 5700 XT ajustado em 9.2TF a 2160p.
No geral, existem resultados semelhantes aos que experimentamos no Hitman 2, embora o RX 5500 XT perca sua liderança em desempenho de 1080p contra seus rivais de 6.0TF baseados em GCN à medida que aumentamos a escala de resolução. Mais uma vez, o Xbox One X tem uma vantagem de desempenho semelhante em 2160p, assim como o Hitman 2. E novamente, eu tenho que me perguntar se a largura de banda de memória restrita pode ser o problema aqui.
Resultados semelhantes ao Hitman 2 também são observados quando analisamos a escalabilidade entre nossas duas partes Navi ajustadas. Nesse cenário, a vantagem de computação 2.2x que o 9.2TF RX 5700 XT possui se traduz em um aumento de desempenho de 93%. No entanto, desta vez, com resolução de 1440p, nosso 4.3TF RX 5500 XT executa o mesmo conteúdo mais rapidamente que o 5700 XT em 4K, enquanto o delta de desempenho em 1080p vs 2160p é francamente maciço. Parece que diferentes mecanismos de jogo escalam de maneiras diferentes na escala de resolução, mas, observando a rapidez com que o 5500 XT está aqui em resoluções mais baixas, você começa a se perguntar se um console em potencial de menor resolução poderia realmente pagar dividendos.
Nossa referência final na parte principal da análise aqui se concentra no Controle do Remedy, demonstrando que existem algumas cargas de trabalho nas quais o tipo de escalabilidade que vimos em testes anteriores simplesmente não se traduz. Em comparação com as placas GCN de 6,0TF, a Radeon RX 5500XT com ajuste de 4,3TF fica dramaticamente aquém em termos de desempenho. É especialmente surpreendente que o relativamente antigo R9 390, baseado no Havaí, consiga fazer o mesmo em qualquer um desses testes, considerando que em todos os casos estamos usando APIs gráficas modernas - DX12 e Vulkan. Vimos anteriormente que as placas GCN de primeira geração baseadas no design do Taiti parecem exibir um desempenho realmente ruim em alguns títulos do DX12, mas o R9 390 mantém-se lindamente em quase todos os nossos testes.
Com isso dito, a escalabilidade entre os cartões Navi permanece relativamente consistente. De fato, o RX 5500 XT em 1440p é ponto a ponto idêntico em termos de desempenho ao 9.2TF RX 5700 XT operando em 2160p, com uma vantagem previsivelmente enorme na taxa de quadros em resolução total HD. No papel, o conceito de qualquer portador de plataforma que lança um console de quatro teraflop para jogos de próxima geração parece quase absurdo, mas os números aqui continuam sugerindo que a idéia de reduzir a resolução - e somente a resolução - pode valer a pena.
No caso do Control, consegui aumentar ainda mais a frequência através do RX 5700 XT, elevando o desempenho da computação até 10,2TF. Fiquei curioso sobre isso, porque alguns sugeriram que a Sony poderia apontar para esse número para obter o nível máximo absoluto de desempenho possível de um chip com 40 unidades de computação em potencial totalmente ativadas. Digamos apenas que o RX 5500 XT não estava particularmente feliz em fazer isso e a melhoria do desempenho simplesmente não valeu o esforço - 11% a mais da computação coletaram apenas 6,5% do desempenho real e a vantagem da taxa de quadros em relação a o RX 5500 XT ajustado em 4,3TF, rodando a 1440p, é de apenas 5,3%.
Como você verá no vídeo incorporado na parte superior da página e, na verdade, no intervalo de benchmarks adicionais, você encontrará escondido na página dois deste artigo, nosso exercício de escalabilidade na arquitetura Navi produz resultados amplamente consistentes. Embora o delta no desempenho entre 1440p em um Navi de ponta inferior e 2160p em um equivalente de ponta alta varie de título a título, os números sugerem que um console de quatro teraflop poderia funcionar. No entanto, o que está claro é que um possível console Lockhart a 1440p ofereceria resultados muito mais próximos de um PlayStation 5 9.2TF fictício, com o Xbox Series X de 12TF talvez muito poderoso em comparação. Mas talvez esse seja o ponto - se olharmos para a estratégia mais ampla da Microsoft, um produto spoiler contra o PlayStation 5 faz muito mais sentido do que tentar roubar vendas do Xbox Series X.
No entanto, também precisa levar em consideração que ainda há muito que não sabemos sobre a próxima geração de consoles - dos nuances importantes "no projeto que me referi anteriormente. Primeiro de tudo, agora temos a confirmação explícita do RDNA 2 como base da arquitetura. Além dos recursos de rastreamento de raios acelerados por hardware e do VRS (sombreamento de taxa variável), de que outra forma a arquitetura evoluiu em comparação com as peças de PC que testamos aqui? A verdade é que simplesmente não sabemos. Além disso, há também a noção do 'molho secreto' do console clássico - ou, mais especificamente, as personalizações em nível de hardware que os titulares da plataforma fazem em seus projetos.
Além disso, há a ideia básica de que estamos rapidamente mudando para o que você poderia chamar de era da pós-resolução, como discutiu meu colega John Linneman em sua análise do Metro Redux no Switch , onde ele demonstrou que uma imagem de 720p de O Switch oferece uma qualidade de imagem muito maior do que uma imagem de 720p do mesmo jogo em execução nos consoles de última geração. O Switch é um exemplo fascinante de como os gráficos são escaláveis, é claro, com o Metro, um dos exemplos mais convincentes de como um jogo pode manter sua identidade visual, apesar de rodar em uma GPU muito menos capaz.
Finalmente, as técnicas de reconstrução de imagem estão melhorando em qualidade a ponto de o upscaling de DLSS AI da Nvidia agora ser capaz de produzir resultados impressionantes com apenas um quarto de resolução nativa - e na verdade temos um exemplo de algumas pesquisas da Microsoft em que a empresa está usando sua própria máquina API baseada em aprendizado, DirectML, para produzir um incrivelmente bom
aprimoramento de IA no Forza Horizon 3 . Até o momento, não tivemos nenhum tipo de dica sobre os recursos de aprendizado profundo acelerado por hardware inseridos nos consoles de última geração ou no RDNA 2, mas o DirectML foi arquitetado em paralelo com a API de rastreamento de raios DXR e acho difícil acreditar que a Microsoft desenvolveria essa tecnologia quando apenas a Nvidia tiver o hardware para aproveitá-la totalmente.
Considerando os avanços na tecnologia GPU, a redução da resolução nativa como uma indicação principal da qualidade geral da imagem e os exemplos extremos de escalabilidade gráfica testemunhados no Switch, há um argumento de que as estrelas estão se alinhando para Lockhart ao fornecer uma entrada de vários níveis que poderia realmente funcionar. Os preços serão críticos, porque há muito dinheiro a ser economizado com um processador menor e menos RAM e, se, digamos, o PS5 chegar ao mercado com cerca de duas vezes o desempenho e custar apenas de US $ 100 a US $ 150, Lockhart pode se esforçar para vencer o argumento . De fato, se a economia não der certo, talvez a máquina nunca seja liberada.
Também é justo dizer que comercializar uma máquina desse tipo também é um desafio considerável. Eu realmente pensava que os titulares da plataforma evitariam teraflops como uma métrica de desempenho para a nova onda de máquinas simplesmente porque o conceito de um teraflop Navi tem pouca relação com um teraflop GCN de última geração - todos os testes mostram que o Navi é muito mais capaz . Apesar disso, no entanto, a Microsoft foi diretamente com o 12TF como uma mensagem de marketing essencial para o Xbox Series X, que certamente não pode refletir favoravelmente na máquina mais barata.
Mas talvez a maior preocupação com a ideia de uma máquina como esta seja que qualquer tipo de linha de base tecnológica mais baixa possa limitar os desenvolvedores a arquitetar experiências de próxima geração - e, como vimos com a geração atual, a capacidade reduzida de memória e gráficos fez com que impacto (às vezes bastante profundo) em certos títulos em execução no Xbox One S e PlayStation 4 Pro. No entanto, embora os testes aqui possam realmente ser considerados uma aproximação aproximada do que a coisa real pode oferecer, o conceito básico de escalabilidade parece dar uma olhada - e com
os preços da próxima geração aparentemente causando preocupação , talvez um valor mais orientado console é o que o mercado vai precisa
A next generation console with just 4 teraflops of GPU power? Well, that's the rumour. While Microsoft teases and tempt…
www.eurogamer.net