No lado do CPU a instrução em questão faz parte do pacote BMI2, a PDEP (som da exclamação "!" de MetalGearSolid). No lado da GPU a mesma precisa apenas oferecer suporte a uma leitura 64bits da sua memória (basicamente ter um IMC que reconheça mais que 4GB de VRAM), enquanto que a placa-mãe só precisa permitir essa comunicação. Dando nome aos bois, para usar RBAR o Windows precisa ser o 1709 (com UEFI não-CSM), a mobo precisa ser PCIe 3.0, a GPU precisa ser no mínimo GCN (AMD) ou Kepler (NVIDIA) e o CPU precisa ser do socket 1150 (Intel Haswell) ou socket AM4 (AMD Excavator).
Então na teoria um Zen1, Zen+ e Zen2 funcionam, certo? Na prática também! Mas por que a AMD diz que só funciona nos Ryzen 5000, ela está mentindo? Sim, mas tem motivos:
O conjunto de instruções PDEP não é implementado em hardware nessas primeiras duas gerações do Zen, e sim via software (microcódigo), e por isso é executado de forma extremamente lenta, a ponto de reduzir o desempenho caso seja usado. Antes que perguntem
"basta acessar da forma que faz nos 256MB hoje", a forma como se acessa o BAR é limitado a 32bits, para mais que 4GB é preciso um acesso 64bits (unsigned int _pdep_u32_), então caso se ative o SAM em um Zen/Zen+/Zen2 o desempenho será degradado e não ampliado, por isso a decisão de deixa-los de fora.
Como dito a Intel suporta o PEDP desde os Haswell, e funciona corretamente lá, logo caso ela adicione o RBAR nas suas chipsets será possível usar o SAM em placas RX6000 sem problemas, além é claro da limitação de velocidade do barramento PCIe 3.0, então em plataformas Intel só veremos os mesmos ganhos vistos agora com o SAM quando chegarem os Rocketlake, em placas-mãs com PCIe 4.0.
Por fim este conjunto de instruções não é requerido no Linux, lá ele assume que o usuário sabe que, ao se usar um CPU AM3 (junto dos Zen/Zen+/Zen2) ou 1155 para baixo, o desempenho será degradado, mas como o acesso é dado para motivos de trabalho a velocidade aqui não é importante, e sim a latência. Até onde sei ninguém aumenta o RBAR e vai jogar no Linux, só conheço quem faz um ou outro. Nota que ao se usar um CPU Zen/Zen+/Zen2 da AMD o linux evita usar o PDEP, ele usa as mesmas instruções "desotimzadas" que usa nos demais processadores sem suporte, porque o PDEP nesses CPUs tem uma latência muito alta, como pôde ser visto na imagem acima.