Intel Lunar Lake CPU Architecture Deep-Dive: Lion Cove +14% IPC, Skymont IPC More Than Raptor Cove, Next-Gen Power Managment & Scheduling
Intel has introduced Lunar Lake, its most efficient SOC to date and we are doing a deep dive into its P-Core & E-Core architectures and more.
wccftech.com
Tem MUITA pegadinha nesses números e slides, típico da Intel, mas creio que esses slides
deveriam ir lá no tópico do socket LGA1851, já que o LunarLake utiliza os P-core LionCove, que é o mesmo que os ArrowLake utilizará. Voltando às pegadinhas, temos a justificativa de que tirar o SMT é benéfico, que o LNL faz 120 TOPs e que os novos E-Cores entregam 2x (ST) e 4x (MT) mais desempenho que os do MeteorLake, e isso soa lindo nos slides mas na realidade...
1) Ter SMT requer um silício maior para ser oferecido, e seu funcionamento implica em um núcleo mais "inchado" que acaba não "dormindo" o suficiente, elevando o consumo, mas traz um ganho de desempenho notório na grande maioria dos cenários em que é aplicado. Se olharmos o slide da Intel justificando a desistência do HT, ela diz que a "performance por consumo por área" é melhor sem SMT, ou seja,
nesse cenário (15~28W de TDP, memória inclusa) o SMT é prejudicial, pelo que acabei de explicar, então um chip focado em economia máxima de energia implica não apenas em desativar o HT, e sim removê-lo a nível de silício. O mesmo não pode ser dito do desktop, onde o consumo padrão gira nos 60~100W, então usar esta mesma mentalidade nos ArrowLake (provavelmente) implicará em perdas...
2) Em operações de IA o LNL faz 120 TOPs, mas isso na verdade é a soma das três unidades capazes de realizar IA: O CPU faz até 5 TOPs, o NPU faz 40 TOPs e a iGPU, 67 TOPs. A questão aqui é que
não dá para usar combinado esses três para realizar uma operação, ou em um programa, pois cada unidade cuida de realizar operações de forma distinta (
tem até um slide para deixar isso claro). Ou seja, em alguns programas a performance do LNL será de apenas 5 TOPs, enquanto que em outros será de 67 TOPs, logo dizer 120 TOPs soa bem enganador...
3) Começar logo pelo óbvio:
A comparação da Intel é dos E-cores do LNL (utilizados de forma geral)
contra os LPE-cores do MTL (utilizados apenas no SoC), e isso torna a comparação bastante injusta. O ganho ST é grande (2x) pois além do cluster ter acesso a cache L3 (o LPE-core do MTL não tem L3$), o clock é muito mais alto, enquanto que o ganho MT é maior ainda (4x) porque além do clock e L3$, o cluster do LNL tem 4 núcleos, enquanto que a ilha do LPE-core tem apenas 2 núcleos. O foco desses dois E-cores são distintos, enquanto um é de uso geral (o funcionamento do LNL é diferente dos demais híbridos da Intel: Todo processo roda nos E-cores primeiro, e só aqueles que excedem o poder computacional que eles oferecem que são redirecionados para os P-cores, deixando este último dormindo sempre que possível) o outro está no SoC e cuida do processamento geral apenas para tarefas extremamente leves. Simplificando o máximo, é uma comparação 0P+4E+0LP contra 0P+0E+2LP, ou melhor, comparar LP-core com LPE-core é quase como comparar P-core com E-core.
Não estou dizendo que o resultado será ruim, muito pelo contrário, o LNL é deveras empolgante no papel e as mudanças na arquitetura são bem vindas, então tem tudo para entregar o que foi dito mas não na intensidade que a Intel. Aguardar testes independentes para ver se essa evolução toda se converte em uma bateria mais durável.