Entao, mas nao é possivel uma placa com 120CUs numa linha gaming mesmo sendo grande? A propria rtx 2080ti sao 754mm e pelos boatos a big navi é algo perto se 505mm
Acho que nós 7nm é inviável 120CU, o clock seria baixíssimo.
Nem sei se a estrutura da arquitetura suporta tudo isso.
Viável até deve ser, o problema é o custo provavelmente.
Os 80CU devem ter sido o sweet spot entre custo e desempenho que a AMD escolheu para ser o carro chefe.
Provavelmente mais que isso seria muito custoso ou sofreria muito gargalo por outros fatores...
Normalmente quanto mais núcleos menor a frequência que eles trabalham pra manter o TDP target.
O problema de um produto com muitos produtos e núcleos e frequência baixa... Depende das aplicações e drivers escalarem corretamente a carga de trabalho nessa quantidade de núcleos.
Eu acho que se a parte de software complica bastante.
@dayllann salva nós, uma RDNA2 de 120CU é viável teoricamente?
120CUs é viável, mas não prático. O problema de se ter tantos núcleos é que, além da frequência como já bem dito, a arquitetura precisa suportar tantos ALUs trabalhando (solicitando/entregando dados), isso ocasiona gargalos (principalmente no barramento e caches) e um crescimento não linear de desempenho, fora que jogos têm muitas partes que não são paralelizáveis, então jogar mais núcleos prejudica o desempenho por causa do clock baixo necessário para sustentá-los.
Basta olhar para as Ampere, ou voltar para as Vega: Ao se aumentar consideravelmente a quantidade de núcleos, o desempenho escalou proporcionalmente a esse aumento? Pensem no aumento de núcleos a gráfico matemático com uma curva logarítmica, onde o eixo Y corresponde ao ganho real e o eixo X corresponde ao aumento de núcleos: No início do gráfico o aumento é muito grande, mas conforme adicionamos núcleos o ganho vai reduzindo, até chegar a um ponto que não há retorno (na realidade começará a perder desempenho). Esse gráfico leva em consideração que o barramento de memória é o mesmo, independente da quantidade de CUs.
Minha resposta é bem menos aprofundada por falta de conhecimentos mais específicos sobre a uARCH, mas:
- Um chip 50% maior custaria 125% a mais que o chip de 505mm², que já é bem caro
- Com 120CU você estouraria facilmente os limites de TDP, acredito que RDNA2 já chegue a pelo menos 275W com 80CU...talvez 300W. Nesse caso teria que reduzir MUITO o clock, perdendo o ganho máximo teórico de 50%, chegando talvez a uns 20-25% no máximo
- Triplicar uma uARCH não é fácil, acredito que teríamos problemas na distribuição de tarefas
Resumindo...acho que o ganho seria mínimo, frente a um aumento exponencial do custo.
Isso, tocou bem nos pontos certos. Possível é, mas o custo, retorno de desempenho e consumo tornam a existência de uma placa assim sem sentido.
E é por isso que placas com tantos núcleos ficam restritas para a área de data-centers e HPC, pois lá elas podem ter clocks baixos já que o importante é executar cálculos, e isso é mais fácil de se paralelizar.
120cu seria um chip de 753mm² certo?
Completamente inviável na minha opinião, já tivemos um die desse tamanho ?
120CUs, baseando-se no RDNA1 (já que não tem como usar o RDNA2 sem sabemos se o front e back-end será expandido/reduzido, o quanto os TMUs cresceram para o RTRT e quanto ocupa os 128MB de L2), seria equivalente a (60 WGP + 48 RBE + 3 GP + 12 prim. + MC + IO + caches)... 681,4mm², isso ainda em 256bits, mas se colocarmos tudo o que o RDNA2 tem além do RDNA1 na conta poderemos ter algo entre 720mm² e 800mm².
Aqui uma imagem de como realmente é o chip da Navi10 (calcular o aumento dividindo o total da área pela qtd de CUs e depois multiplicar esse resultado por 120 não resultará no tamanho certo visto que muitas partes de um chip não vão aumentar em quantidade, como os controladores de memória, então é complicado dar um resultado certo):
Ou seja, esse tamanho não é inviável, só será muito caro de ser produzido e pode não trazer o resultado esperado. A NVIDIA mesmo tem o GA100, que é o chip full da Ampere, onde o die dela mede massivos 826mm² (quase no limite da retícula*) no nó de 7nm da TSMC. Além de que a NVIDIA tem as Turing que estão na casa dos 750mm², então cada empresa sabe onde deve parar na contagem de unidades computacionais para se ter um retorno condizente com o valor de fabricação e de venda.
OBS: Retícula, para quem não sabe, é outro nome dado à foto máscara usada no processo de "impressão" de um circuito em uma 'bolacha' de silício. O limite do tamanho de um chip é definido pelo tamanho máximo de uma máscara, e o processo litográfico que se usa hoje (i193 e EUV) tem um limite estipulado em 26mm x 33mm, ou seja, 858mm².