Só passando um relato aqui sobre tudo isso, e o que consegui apurar pessoalmente: Estive com um Raptorlake em mãos por 4 dias, e antes disso estive em contato com o seu dono a respeito de seus problemas de instabilidades (crash e erros de falta de memória de vídeo, compilação de shader na UE e afins), e é realmente tenebroso pois qualquer desavisado pensa que é apenas uma instabilidade comum.
Mas primeiro, sentem que lá vem a história:
Ele não é tão entendido, e saiu seguindo videos e YT de quais peças comprar, como montar (com ajuda) e como extrair o máximo de desempenho (hj em dia qualquer um é ""expert"" de informática por youtube), logo pegou peças de PC high-end (13900KF, Asus B660M TUF, Corsair CX850M, RTX4070Ti, 2x16GB DDR4-3600, WC 240mm, Contact-frame Thermalright) lá por volta de DEZ'22/JAN'23 (praticamente 1 ano e meio de uso) e foi usando sem problemas até out/nov do ano passado, quando começaram a aparecer crashs em Fortnite, e jogos com a UE. De início achou que era problema da NVIDIA (drivers), depois que fosse do jogo (algum update bugado), e por último trocou o WC por um de 360mm (pensou que seria a temperatura).
Voltou a funcionar bem até metade Abril, quando ele disse que começaram a aparecer os mesmos problemas, e foi ai que me procurou, onde sugeri reduzir o perfil de uso de extremo para o performance (basicamente ele desativou o MCE), e aparentemente tinha resolvido. Até que na metade do mês passado os crashs voltaram, e ai fui lá e fiz um UV e, já sabendo desse caso de degradação, pedi para caso voltasse a ocorrer, que me contatasse. Bem, funcionou bem até semana passada.
Pedi para ficar com o PC por 3 dias (acabei ficando com ele até ontem) e fiz toda a análise que podia, e o que constatei foi:
- Removendo o CPU do socket, ele não está empenado, tem apenas a irregularidade padrão do IHS da 13/14ª geração;
- O ILM padrão nem chegou a pressionar o CPU, ele comprou logo um Contact-Frame e o usou desde o dia 1;
- No BIOS da placa, o modo extremo/MCE setava os PL como 4096W (ilimitado), mas estava definido como 253W (enforce all limits);
- Com o WC de 360mm a temperatura chegou aqui a 108ºC com MCE ativado, e 92ºC com ele desativado (temp. ambiente de 26~28ºC);
- Em testes de stress como Aida e Prime95 ele não dá crash, só throttle, mas em jogos aparece tela azul de forma aleatória, ora ao abrir um jogo, ora depois de pouco tempo jogando;
- Desfiz o UV e começaram a aparecer instabilidades até no Sistema Operacional, mas ao reduzir o clock e dar UV novamente e o funcionamento normalizou em todos os cenários.
- Por fim, a revisão do chip é B0, que aparentemente é a revisão que vem apresentando problemas.
Hoje entreguei a máquina e disse para ele entrar com um pedido de RMA para a Intel, pois não vejo outra causa se não degradação do silício, por seja lá qual for a causa, mas não é nem pressão disforme/exarcebada do ILM (pois como disse, tinha um frame de contato), nem temperatura exagerada por períodos prolongados (a temperatura no quarto dele é de 20~22°C, logo nem deve ter chegado em 90ºC com o MCE desativado, nem >100ºC com MCE ativado, ambos em uso padrão, que era jogo+stream e/ou web+discord), e nem o resto do kit apresenta problemas pois testei-o com outro processador / em outra máquina e todas as demais peças funcionaram corretamente. O processador, no entando, pode ter trabalhado acima dos 100ºC por alguns meses quando ele utilizava o WC de 240mm, mas estou apenas supondo visto que ele não monitorava temperatura e o quarto dele era climatizado.
Enquanto espero ele vir com o retorno de um RMA aceito ou recusado, deixei a máquina com PL1 em 125W e PL2 em 180W, com undervolt mais agressivo e temperatura limite de 90ºC por precaução, e pedi para ele fazer o de sempre e se possível até por mais tempo, para termos alguma concusão rápida se é degradação progressiva ou algum problema no CPU mesmo.
---
Aproveitando para informar mais detalhes:
Teve notícia dizendo informando que até processadores de notebook RPL estão apresentando estes problemas, mas a Intel negou e disse que não é o mesmo tipo, e sim outro problema causado por incompatibilidade de sofware ou hardware mal planejado... ou seja, a Intel já tem noção do que é o problema e como ele aje (até o que cause ele, só não sabe ainda como corrigir) para responder isso dessa forma, mas não vem a público informar o progresso, continua em silêncio.
E só para informar a respeito da pressão exercida pelo ILM no socket/processador, a Intel também já está ciente disso antes mesmo desses problemas explodirem, tanto que o seu próximo socket LGA1851 terá um ILM com menor pressão (RL-ILM), mas apenas de forma opcional para que as fabricantes decidam se aderem o ILM comum ou o relaxado (só que este custará um valor por fora, sim, a Intel cobrará por ele). Fora isso, mais relatos aparecendo, aos montes :v