Uma coisa por vez, vamos lá...
Primeiro e principal motivo, hardware compartilhado. Tanto a NVIDIA quanto a Intel possuem hardware dedicado a alguns cálculos do processo de RTRT, e por isso se saem muito melhor nesse quesito. Outros motivos são ausência de técnicas para acelerar os cálculos e otimizações específicas para sua arquitetura. Como a NVIDIA já vai na sua terceira geração ela está com a vantagem em todos os motivos citados, a Intel vem em seguida por ter hardware dedicado e a AMD fica na lanterna por fazer tudo via software + compartilhar SIMDs com RTRT, shader e IA.
Para se ter noção da importância do segundo motivo, foi praticamente 80% de ganho de desempenho nas RDNA3 por acrescentaram sub-tree culling, box sorting e redução de iterações traversal. Agora imagine isso em um hardware dedicado? O desempenho seria muito maior mas trariam novos desafios, e conhecendo a forma de agir da AMD ela continuará em refinar suas unidades computacionais ao invés de dedicar uma boa quantidade de transistores só para isso.
Isso é um assunto chatinho de ficar tocando porque todo mundo quer ter razão e quem pode realmente esclarecer não fala, então vou citar o que é fato:
1) O código em questão é categórico em dizer que, caso o chip seja da revisão A0, independente de ser N31/N32/N33, desativa-se o prefetch via hardware (no caso o prefetch será feito via software, que é mais lento/maior latência);
2) A vBIOS das MBA, assim como da TUF e da MERC, deixam bem claro que o silício a qual ele gerencia é da revisão A0;
3) A revisão exibida pelo GPU-Z é coletada através do driver, que informa a revisão do PCB/board, logo pode/irá variar de acordo com o parceiro/fabricante (até o momento, todas as XTX são revisão C8 e todas as XT são revisão CC).
Falando de uma forma mais clara, "revisão" é na verdade apenas uma parte desse 'A0', o primeiro caractere indica o stepping, logo ao dizer que essas N31 são A0, significa que elas são "stepping A, revision 0" e essa atribuição costuma se dar ao primeiro silício. O que o Shidell falou lá no reddit não desmente nada do que está sendo dito aqui e no twitter, segundo ele é extremamente improvável e que é mais fácil ser o VOPD com funcionamento irregular, algo que eu já tinha dito uma dezena de comentários atrás, mas assim como isso de revisão não tem como dar plena certeza de ser isso.
Temos vários indicativos, como o vBIOS e os problemas. Inclusive eu peguei o vBIOS e ao analisá-lo fica claro como o dia a revisão ao qual ele se atrela/destina: A0.
O vBIOS regula o funcionamento da placa, ele diz o que pode e como pode ser feito as requisições do driver, e assim como colocar o BIOS de uma placa em outra pode trazer instabilidades, colocar um vBIOS destinado às A0 em uma GPU não-A0 implicará em problemas. Se a AMD lanaçr um silício A0 é extremamente improvável, imagina o que é lançar um chip A2 (por exemplo) com um vBIOS A0? Seria de uma extrema incompetência um erro deste tamanho.
O que me leva a acreditar que este, de vBIOS mismatching, não é o problema, até porque para corrigi-lo bastaria uma atualização: Para mim há problemas a nível de silício sim. Problemas como consumo em idle, reprodução de multimídia e multi-monitor já foi indicado ser driver e será corrigido (segundo a própria AMD) em breve, quanto a monitoramento de registradores, prefetch de shaders, VOPD e outros bugs mais intrinsecos ao hardware eles estão sendo corrigidos em um ritmo mais lento mas virão igualmente através de atualizações de drivers, quem sabe até de firmware, mas com qual frequência ou quando ai já não sei estipular.