Se for parecido com a H100, vai voltar a ter unidades separadas de FP32 e INT32, com 128 cores de FP32 e 64 de INT32 por SM.Outro rumor que corrobora pro grande aumento de desempenho é que todos os Cuda Cores poderão processar 32 INT32 e 32 FP32 simultaneamente, diferentemente da Ampere com os 'fake cudas' que processam apenas um ou o outro.
Poréeeeem, a A100 não tinha entrado nessa palhaçada de ter um bloco de unidades mistas FP/INT, então talvez a série mais abaixo fique mista ainda também.
E eles não processam um ou outro, isso era na Turing e anteriores, as Ampere podem processar 1 FP32 em paralelo com outro FP32 ou INT32, mas os números que usaram de "cuda cores" ser 2x maior era inflado mesmo pq assumiam que só ia ter código FP32 rodando (e aí sim funcionava como 2x uma Turing), porém para códigos só INT32 ou mistos podia só cortar o número de cuda cores pela metade.