Processadores: "Morte do P4"

PROBERTY

know-it-all Member
Registrado
Moçada eu acabei de recer esse artigo do meu irmão e achei interesssante. Pode até ser velho, mas eu desconhecia. então me descupem ai se até alguém já o citou. Mas achei interessante apara quem está em duvida entre em comprar um novo processador

http://www.guiadohardware.net/www/analises/49/

O mercado de processadores é bastante competitivo. Atualmente temos a predominância da Intel e AMD, com uma pequena participação da Via, mas diversas outras empresas, incluindo a IBM, Texas, Transmeta, Cyrix (que foi comprada pela Via) e IDT já tentaram a sorte, sem tanto sucesso. Aqui temos um 486 produzido pela IBM e o Crusoe da Transmeta:


Fabricar processadores é muito mais complexo e arriscado do que fazer placas mãe ou telas de LCD, por exemplo, pois os projetos são muito mais complexos e o investimento inicial absurdamente maior. Leva-se pelo menos 5 anos para projetar um novo processador e uma nova fábrica, com tecnologia de ponta, pode custar entre 2 e 4 bilhões de dólares.
Mesmo para uma grande empresa, como a Intel, um erro estratégico pode custar muito caro. Investir em uma plataforma ineficiente pode gerar um atraso de vários anos, até que o projeto de um novo processador, mais competitivo, seja concluído e seja possível produzi-lo em quantidade.
Com o lançamento do Pentium 4, em 2001, a Intel fez um movimento arriscado, investindo em um processador com um longo pipeline (a primeira versão do Pentium 4 trabalhava com 20 estágios, contra 10 do Pentium III e 11 das primeiras versões do Athlon). Em qualquer processador atual, as instruções são processadas em etapas, como numa linha de produção. Dobrar o número de estágios no processador é como dobrar o número de funcionários, fazendo com que cada um faça metade do trabalho e a esteira corra duas vezes mais rápido.
O plano era simples: Com mais estágios, o processador seria capaz de atingir freqüências mais altas. Para manter as unidades de execução abastecidas, o processador contaria com um cache L1 muito rápido, que armazenada instruções pré-decodificadas, um grande cache L2 e utilizaria um tipo mais rápido de memória RAM, as famosas memórias Rambus.
Entretanto, este design possuía inconsistências óbvias e recebeu críticas desde o lançamento, por parte de praticamente todos os sites especializados. Na época cheguei a publicar duas pequenas análises:
http://www.guiadohardware.net/analises/09/
http://www.guiadohardware.net/analises/10/
Adicionar mais estágios tornou o processador menos eficiente, pois as instruções precisam do dobro do número de ciclos para serem processadas, fazendo com que o processador perca muito tempo em operações de tomada de decisão, onde o processador depende do resultado de uma instrução para processar a próxima.
Possuir o dobro de estágios significa também possuir o dobro de transistores e consumir o dobro da eletricidade. Se isso vem acompanhado de um aumento no clock, chegamos a um processador ineficiente, que consome muito mais energia e gera muito mais calor.
Por armazenar instruções decodificadas, o cache L1 do Pentium 4 também se tornou menos eficiente, já que instruções decodificadas ocupam mais espaço. Enquanto o Athlon possuía 64 KB (metade) do cache L1 reservado para armazenar instruções, o cache do Pentium 4 armazenava o equivalente a apenas 8 KB. Isso tornava o processador mais dependente do cache L2 (que devia ser obrigatoriamente maior, para que o processador mantivesse um bom nível de desempenho) e do barramento com a memória RAM, que deveria ser capaz de alimentar os caches.
O Pentium 4 original (core Willamette) possuía apenas 256 KB de cache L2, por isso era consideravelmente mais lento que um Athlon, ou mesmo um Pentium III do mesmo clock. O core Northwood, lançado em seguida, trouxe 512 KB de cache e o Prescott (lançado em 2004) trouxe 1 MB completo.

O cache L2 é um ítem extremamente caro, pois cada bit de cache adiciona cerca de 6 transístores ao processador. Um cache L2 de 1 MB ocupa pelo menos 60 milhões de transístores, o que é quase o dobro do número de transistores do Athlon Palomino (que possuída 37.5 milhões). Mais transistores tornam o processador proporcionalmente mais caro de se produzir, o que aumenta o preço de venda.
Para completar, existiu o problema das memórias Rambus, um tipo proprietário de memória, que trabalhava a freqüências superiores, porém com tempos de latência mais altos. O Pentium 4 utilizaria apenas memórias Rambus, obrigando os fabricantes de memória a aderirem à nova tecnologia. A Rambus Inc. receberia royalties dos fabricantes e a Intel ficaria com parte do bolo, na forma de incentivos e descontos.
Felizmente não foi o que aconteceu. As memórias Rambus foram um dos maiores fracassos da história. Na época do lançamento do Pentium 4, um módulo de 64 MB custava US$ 99, enquanto um módulo de memória PC-133 da mesma capacidade custava apenas US$ 45. Isto significava gastar US$ 216 (ao comprar 256 MB) a mais, só de memória, sem contar a diferença de preço do processador Pentium 4 e da placa-mãe, que na época ainda eram consideravelmente mais caros.
Pouca gente comprou as versões iniciais do Pentium 4 e quem se arriscou, acabou com um abacaxi nas mãos. Isto obrigou a Intel a modificar a plataforma, passando a utilizar memórias DDR padrão. Esta demora gerou um vácuo, que permitiu que a AMD aumentasse consideravelmente sua participação no mercado, já que contava com o Athlon Thunderbird, um processador mais barato e mais eficiente.
Com o Pentium 4 Northwood, a Intel voltou a ser competitiva, chegando rapidamente aos 3.4 GHz. Foi introduzido também o Hyper Treading, que visa melhorar a eficiência do processador, dividindo-o em dois processadores lógicos. O plano da Intel, de compensar a baixa eficiência do Pentium 4 com freqüências de clock maiores parecia estar dando certo. Na época o roadmap da Intel mostrava processadores Pentium 4 com core Prescott atingindo 5.2 GHz no final de 2004 e planos para o core "Tejas", que alcançaria os 10 GHz no final de 2005.
Porém, nada disso aconteceu. Os 3.4 GHz se tornaram uma barreira difícil de transpor. A partir daí, a Intel conseguiu apenas pequenos incrementos de clock, atingindo a muito custo os 3.8 GHz com o Prescott, que além de ser produzido numa técnica de 0.09 micron, teve o pipeline esticado para um total de 31 estágios (o que soou mais como um ato de desespero para tentar, sem muito sucesso, atingir freqüências mais altas, do que uma evolução técnica). Acima de 3.8 GHz, o gate leakage, ou seja, a eletricidade perdida pelos transistores do processador a cada ciclo, tornava o consumo e dissipação térmica altos demais.
Embora seja possível superar a barreira dos 4.0 GHz com o Prescott, via overclock, o resultado é um processador beberrão demais. É como se cada transistor do processador fosse um minúsculo cano, por onde passa água. Quanto menores os transistores, mais finos são os canos e quanto maior o clock, mais forte é a pressão da água.
Os transistores são compostos por filamentos muito finos, o que causa uma pequena perda de energia, chamada de "gate leakage". É como se os canos do exemplo possuíssem pequenos furos por onde vaza uma pequena quantidade de água. Conforme o clock aumenta, a pressão se torna mais forte e cada vez mais água vaza pelos canos, gerando um desperdício cada vez maior. No caso do processador, toda a energia desperdiçada se transforma em calor, o que traz a necessidade de um cooler mais eficiente, gerando um ciclo vicioso. A partir dos 4 GHz (no caso do Pentium 4), é necessário um grande aumento no consumo e dissipação térmica, para conseguir um pequeno aumento na freqüência.
A Intel chegou a demonstrar uma versão do Prescott refrigerada com nitrogênio líquido, que trabalhava a 6.0 GHz, porém consumia mais de 300 watts. A equipe do akiba-pc foi capaz de reproduzir o feito (a página original não está mais no ar), também usando nitrogênio liquido, porém sem estabilidade e por um curto espaço de tempo:

O pequeno aumento no clock proporcionado pelo core Prescott serviu mais para encobrir a perda de desempenho causada pelo novo aumento no número de estágios do pipeline do que para realmente aumentar o desempenho, transformando o Prescott num dos maiores fiascos da história da Intel. Uma versão atualizada do Prescott, com 2 MB de cache foi lançada no início de 2005, dando um último fôlego à plataforma, porém, novamente sem aumento no clock.
O Cedar Mill, lançado no início de 2006 mais uma vez mostrou a dificuldade em produzir processadores Pentium 4 com clock mais alto. Mesmo produzido numa técnica de 0.065 micron, o Cedar Mill não foi capaz de superar a barreira dos 3.8 GHz. Ao invés disso, a Intel optou por produzir processadores dual core (baseados no core Presler), chegando ao Pentium Extreme Edition 965, que opera a 3.73GHz. Em resumo: em dois anos, a Intel conseguiu apenas ganhos incrementais de desempenho na plataforma Pentium 4. Caminhou bastante, porém para o lado e não para a frente.
Naturalmente, a AMD não ficou parada. Depois do Athlon Palomino e Thoroughbred (quase idêntico ao Palomino, porém produzido numa técnica de 0.13 micron), a AMD lançou o Barton, que trouxe pequenas melhorias de projeto e 512 KB de cache L2. Além de ser usado nas versões mais rápidas do Athlon XP, o core Barton foi utilizado nos Semprons 2400+ a 3000+, os últimos processadores lançados para o saudoso soquete A.
A partir daí, temos os Athlon 64, Athlon X2 e Semprons 64 para as placas soquete 754, 939 e AM2, que temos atualmente no mercado. Pela primeira vez na história, a AMD tomou a dianteira, produzindo processadores mais rápidos que a Intel e fazendo seu padrão de instruções de 64 bits (o AMD64 ou X86-64) prevalecer, obrigando a Intel a desenvolver o EM64T, um conjunto compatível de instruções, incluído no Pentium 4 Prescott, sem muito alarde.
De fato, a participação da AMD no mercado só não cresceu mais neste período devido à sua incapacidade de produzir seus processadores em maior volume. Assim como é demorado desenvolver um novo projeto, é caro e demorado inaugurar novas fábricas.

Mesmo assim, a Intel sofreu grandes perdas, chegando a anunciar a demissão de 1000 executivos, com o objetivo de cortar custos (http://www.dailytech.com/article.aspx?newsid=3313), enquanto a AMD passou a trabalhar com margens mais confortáveis de lucro, aproveitando a grande procura por seus processadores. Pela primeira vez na história, a Intel foi obrigada a vender processadores mais barato que a concorrente.
Enquanto isso tudo acontecia, um pequeno grupo de engenheiros sediados em Israel trabalhava numa versão aprimorada do antigo Pentium III, um processador com menos estágios e menos transístores, incapaz de atingir freqüências de operação muito altas, porém oferecendo um desempenho por clock muito superior ao do Pentium 4.
Este novo processador seria destinado unicamente a notebooks, mas ele acabou roubando a cena e decretando a morte do primo mais velho. Neste ponto, todas as críticas à arquitetura do Pentium 4 começaram a soar como um uníssono "eu avisei...".
A primeira encarnação do novo processador foi o core Banias (lançado em 2003), que chegou ao mercado na forma da primeira versão do Pentium-M. Muitos defendem que que o Banias recebeu tantas melhorias em relação ao Pentium III, que pode ser considerado um novo projeto ao invés de uma evolução deste. Como, neste caso, os critérios são subjetivos, você pode aderir a qualquer uma das duas linhas, como preferir.
O Banias foi fabricado numa técnica de produção de 0.13 micron, com 64 KB de cache L1 e 1 MB de cache L2 em versões de até 1.6 GHz. O barramento com o chipset (o principal ponto fraco do Pentium III) foi substituído pelo mesmo barramento de 400 MHz utilizado do Pentium 4. O Banias recebeu ainda o reforço das instruções SSE2 e uma versão aprimorada do SpeedStep, que gerencia dinamicamente o clock, tensão e componentes do processador, desativando os componentes que não estão em uso e reduzindo a freqüência nos momentos de pouca atividade, reduzindo bastante o consumo do processador. Um Banias de 1.6 GHz consome 24 watts ao operar na freqüência máxima, mas consome pouco mais de 4 watts quando ocioso, operando na freqüência mínima.
Junto com o Banias veio a marca "Centrino", uma jogada de marketing da Intel, para vender o pacote completo com o processador, chipset e placa wireless. Apenas os notebooks com os três componentes podem usar a marca "Centrino", criando uma certa pressão sobre os fabricantes.

O Banias mostrou ser um processador promissor. Mesmo com o agressivo sistema de gerenciamento de energia (que causa uma pequena diminuição no desempenho, mesmo quando o processador está trabalhando em sua freqüência máxima), o Banias era cerca de 50% mais rápido que um Pentium 4 Northwood do mesmo clock. Nestes benchmarks, publicados pelo Anandtech, o Banias de 1.6 GHz chega a bater um Northwood de 2.66 GHz:
http://www.anandtech.com/showdoc.aspx?i=1800&p=14
Em 2004 foi lançado o Pentium-M com core Dothan, equipado com 2 MB de cache L2, melhorias no circuito de branch prediction (que minimiza a perda de tempo com operações de tomada de decisão), um reforço nas unidades de execução de inteiros e melhoria no acesso aos registradores. Combinadas, estas melhorias resultaram num ganho real de cerca de 8% em relação a um Banias do mesmo clock.
O Pentium M com core Dothan atingiu 2.0 GHz (Pentium M 755), com um consumo de apenas 21 W, menos que o Banias de 1.5 GHz. Esta nova rodada de benchmarks (de 2004) mostra o Dothan de 2.0 GHz concorrendo com o Athlon 64 3000+ e o Pentium 4 de 3.2 GHz. Apesar da diferença no clock, o Pentium 4 consegue se sobressair apenas em processamento 3D e compressão de vídeo; perde feio em games e nos demais aplicativos:
http://www.anandtech.com/showdoc.aspx?i=2129&p=8
Como de praxe, foi lançado também uma versão do Celeron baseada no Dothan, o Celeron-M, que se tornou bastante comum nos notebooks de baixo custo. Ele é castrado de duas formas, a fim de não concorrer diretamente com o Pentium-M: vem com metade do cache e vem com o suporte ao gerenciamento de energia desativado, fazendo com que o processador trabalhe sempre na freqüência máxima, desperdiçando energia e reduzindo a autonomia das baterias, como comento aqui: http://www.guiadohardware.net/analises/48/.
Aproveitando o baixo consumo do Dothan, a Intel desenvolveu o Yonah, um processador dual-core para notebooks, produzido usando uma técnica de 0.065 micron. O Yonah original passou a ser vendido sobre a marca "Core Duo", enquanto uma versão de baixo custo, com um único core assumiu a marca "Core Solo".
Assim como o Dothan, o Yonah possui 2 MB de cache L2. Entretanto, ao invés de ser dividido entre os dois cores (1 MB para cada um), o cache é compartilhado, permitindo que ambos os cores acessem os mesmos dados, evitando assim duplicação de informações e desperdício de espaço. Nos momentos em que o processador está parcialmente ocioso, o segundo core pode ser completamente desligado (para economizar energia), deixando o primeiro core com um cache de 2 MB inteiramente para sí.
A desvantagem do cache compartilhado é que ele aumenta o tempo de latência: são necessários 14 ciclos para acessar alguma informação no L2 do Yonah, contra 10 ciclos do Dothan. Apesar disso, o Yonah possui dois cores, o que acaba compensando a diferença e proporcionando um bom ganho em relação ao Dothan. Outro pequeno ganho é proporcionado pela inclusão das instruções SSE3.
Um processador dual core melhora bastante a responsividade do sistema ao executar várias tarefas simultaneamente, já que os processos podem ser divididos entre os dois cores, porém faz pouca diferença ao rodar aplicativos leves. Porém, hoje em dia é comum deixarmos muitos programas abertos simultaneamente, sem falar nos processos em background, o que faz com que um processador dual-core realmente proporcione uma melhora significativa, embora a maioria dos benchmarks não mostrem isso, já que simulam o uso de um único aplicativo.
Você pode ver alguns benchmarks do Yonah, comparado com o Dothan (representado pelo Pentium M 760, ambos a 2.0 GHz) e os Athlon 64 X2 aqui:
http://www.anandtech.com/showdoc.aspx?i=2648&p=6
O Yonah inclui um sistema de gerenciamento de energia bastante agressivo, que desliga partes do processador ociosas, mantendo apenas um dos cores ativos em momentos de pouca atividade. Isso faz com que o consumo médio de um Core Duo, em tarefas leves, não seja muito diferente de um Core Solo do mesmo clock, o que acaba juntando o melhor dos dois mundos.
Ao executar tarefas pesadas, um Core Duo de 2.0 GHz consome 31 watts, contra 21 watts do Dothan do mesmo clock. Ou seja, mesmo com os dois cores ativos, o consumo aumenta menos de 50%, muito longe de dobrar, como seria de se esperar.
O departamento de marketing da Intel passou então a falar em "eficiência" ao invés de freqüências de clock mais altas. Os planos frustrados de lançar um processador de 10 GHz baseado no Pentium 4 foram varridos para debaixo do tapete e a meta passou a ser lançar processadores que executem mais processamento com menos energia, exacerbando os pontos fortes dos processadores Core Solo e Core Duo, baseados no core Yonah.
Este slide do IDF 2006 dá uma amostra do novo discurso. Ele mostra como a eficiência energética (o volume de eletricidade necessária para processar cada instrução) dos processadores vinha caindo desde o Pentium, atingindo seu nível mais baixo com o Pentium 4 Dual Core, até a introdução do Banias, Dothan e Yonah; uma posição pouco honrosa para o Pentium 4, que (segundo a própria Intel) precisa de 5 vezes mais eletricidade para fazer o mesmo trabalho:

Chegamos então à novidade de hoje, que é o lançamento do Core 2 Duo, baseado no core Conroe, também de 0.065 micron. Existem algumas mudanças de arquitetura em relação ao Yonah, mas a mudança mais significativa é que o Yonah é um processador destinado a notebooks, produzido em quantidades limitadas, enquanto o Conroe é um processador para desktops, que será produzido em massa, substituindo os processadores Pentium D e Celerons baseados no Pentium 4. A nova arquitetura é genericamente chamada de "Core" (que é tanto o nome código, quanto o nome comercial), enquanto a arquitetura do Pentium 4 é chamada de "NetBurst".

Sim, o Pentium 4 é coisa do passado. Versões com 4 cores, ou clock mais alto estão fora de questão e, mesmo uma eventual versão de baixo custo parece improvável. Para completar, as versões existentes receberam uma forte redução de preço.
Esta é a tabela de preços de lançamento, divulgada pela Intel, que entra em vigor a partir de 23/07/2006 (estes são os valores para lotes de 1000 processadores, vendidos a integradores; os preços para o consumidor final são sempre um pouco mais altos e no Brasil temos ainda a questão da importação e impostos):
Intel Core 2 Extreme X6800 2.93GHz 4MB $999
Intel Core 2 Duo E6700 2.66GHz 4MB $530
Intel Core 2 Duo E6600 2.40GHz 4MB $316
Intel Core 2 Duo E6400 2.13GHz 2MB $224
Intel Core 2 Duo E6300 1.86GHz 2MB $183
Intel Pentium D 945 3.40GHz 2MBx2 $163
Intel Pentium D 915 2.80GHz 2MBx2 $133
Intel Pentium D 820 2.80GHz 1MBx2 $113
Intel Pentium D 805 2.66GHz 1MBx2 $93
O Pentium D 945 é um processador dual-core, baseado no core Presler, um monstro de 376 milhões de transistores e 162 mm², que é muito mais caro de se produzir que o Core 2 Duo E6300, uma versão do Conroe com apenas 2 MB de cache e 1.86 GHz. Mesmo assim, ele passou a ser vendido mais barato, seguido pelos Pentium D mais lentos, chegando a apenas 93 dólares pelo Pentium D 805, que virou processador entry-level. Este tipo de redução de custo só ocorre quando uma empresa descontinua a produção e quer se livrar do estoque rapidamente.
Um Pentium D 820 por apenas US$ 113 pode parecer uma pechincha, mas lembre-se de que ele consome quase 130 watts, o que vai obrigá-lo a gastar muito mais no cooler e a pagar uma "taxa" mensal adicional na conta de luz, em troca de um desempenho mediocre. Em comparação, o Duo E6700 consome um máximo de 65 watts e o Extreme X6800 um máximo de 75 watts. As versões mais lentas consomem proporcionalmente menos, acompanhando a redução do clock.
Os Core 2 Duo também oferecem suporte ao SpeedStep (como nos Pentium-M), que ajuda a reduzir o consumo para níveis ainda menores, sem prejudicar de forma perceptível o desempenho. Como o SpeedStep ativado, o processador reduz a freqüência de operação e a tensão (diminuindo consideravelmente o consumo), mas volta ao clock máximo assim que é executada alguma tarefa pesada. No Extreme X6800, por exemplo, o processador trabalha nativamente a 2.93 GHz e usa 1.28v. No modo de economia, a freqüência cai para 1.6 GHz e a tensão para apenas 0.9v, resultando num consumo de apenas 25 watts, similar ao de um Pentium III 900.
Temos aqui uma foto do Conroe, antes do encapsulamento do processador, divulgada pela Intel. Na verdade, as versões com 2 e 4 MB de cache são idênticas, porém as de 2 MB tem metade do cache desativado antes do encapsulamento, como nos Celeron:

Este teste compara o consumo de máquinas com o Core 2 Duo, Pentium D e Athlon 64, com e sem o gerenciamento de energia ativado. Note que, no teste, o PC com o Duo E6600 consome apenas 199 watts em full load, enquanto o PC com o Pentium D 840 atinge 344 watts:
http://www.tomshardware.com/2006/07/14/core2_duo_knocks_out_athlon_64/page3.html
A primeira novidade do Conroe em relação ao Yonah é justamente essa: a existência de versões com 2 e 4 MB de cache, que são compartilhados entre os dois cores, ao invés de cada um possuir sua metade independente como no Pentium D e Athlon X2. A segunda é o forte aumento no clock, com versões de até 2.66, além do Extreme X6800, que opera a 2.93 GHz e vem com o multiplicador destravado, permitindo que seja overclocado facilmente.
O TomsHardware afirma ter conseguido estabilidade a 3.472 GHz (com o Extreme X6800) e completar boot com o processador overclocado para 3.739 GHz (!), embora sem estabilidade suficiente para rodar benchmarks:
http://www.tomshardware.com/2006/07/14/core2_duo_knocks_out_athlon_64/page9.html
O Anandtech conseguiu 3.6 GHz com o X6800 e 3.4 GHz com o X6700, em ambos os casos mantendo a estabilidade. O X6700 chegou a ser overclocado para 3.9 GHz (!!) e o E6600 atingiu 4.0 GHz (!!!), com o bus a 1779 MHz (455 MHz x 4) e o multiplicador travado a 9x, um overclock de 67%:
http://www.anandtech.com/cpuchipsets/showdoc.aspx?i=2795&p=18
Para não dizerem que é conto da carochinha, postaram um screenshot do CPU-Z e do teste do Super PI executado com sucesso:

O Core 2 Duo utiliza o mesmo encapsulamento e o mesmo soquete LGA775 usado pelo Pentium D, conservando compatibilidade com placas recentes, que suportem o barramento de 1066 MHz (266MHz com 4 transferências por ciclo) e as tensões utilizadas. Muitas placas 775 poderão ser atualizadas via upgrade de BIOS, mas não espere nenhuma compatibilidade com as antigas placas soquete 478.

O Conroe não inclui nenhum tipo de controlador de memória integrado. Esta continua sendo uma exclusividade do Athlon 64 e sua principal arma, reduzindo de forma substancial o tempo de acesso à memória, o que reduz a pressão sobre os caches. O Athlon 64 também possui 128 KB de cache L1 (64k dados + 64k instruções), o dobro do Conroe, que possui apenas 64k.

Em compensação, o cache L1 do Conroe trabalha com 8 linhas de associação, contra apenas duas do Athlon 64. Isso torna o cache mais eficiente, aumentando a probabilidade da informação necessária ser encontrada. A segunda vantagem é o massivo cache L2, que além de maior, é acessado através de um barramento de dados de 256 bits, muito mais largo que o usado no Athlon 64 (que usa um barramento de 128 bits). Uma observação é que o Conroe voltou a utilizar um cache L1 tradicional, sem vestígios do "trace cache" usado no Pentium 4, que armazenava instruções decodificadas.
O bus de 1066 MHz também ajuda a reduzir a latência do acesso à memória, reduzindo a vantagem do Athlon 64 neste quesito.
Muitas das melhoras estruturais do Conroe em relação ao Pentium 4 e processadores anteriores da Intel já estavam disponíveis no Dothan e Yonah, mas vou abordá-las em conjunto para simplificar a abordagem.
Uma das melhoras mais significativas é o recurso batizado de Macro-fusion, que permite que diversos pares de instruções comuns sejam combinados em uma única instrução, ao invés de serem processados separadamente. Isto causa um efeito cascata, economizando espaço nos buffers, economizando processamento no agendador de instruções (scheduler), e assim por diante, resultando num ganho bruto de até 11%.
O Conroe possui 3 decodificadores de instruções simples e mais um decodificador de instruções complexas, 4 no total. Graças ao Macro-fusion, uma grande quantidade de instruções são combinadas (um par em cada 10 instruções, segundo os engenheiros da Intel), permitindo que em quase metade dos ciclos sejam decodificadas 5 instruções. O Athlon 64 possui apenas 3 decodificadores, capazes de lidar tanto com instruções simples (as mais comuns), quanto com instruções complexas. Isso significa que, na maior parte do tempo, os 4 decodificadores do Conroe levam uma grande vantagem, mas em alguns aplicativos que utilizem predominantemente instruções complexas, o Athlon 64 pode se sair melhor.
O Conroe leva uma grande vantagem também ao processar instruções SSE de 128 bits, pois é capaz de processá-las diretamente, num total de 3 instruções completas por ciclo. O Athlon 64 também possui três unidades SSE, mas nele cada instrução SSE precisa ser dividida em duas instruções de 64 bits, que são processadas separadamente. Ou seja, na prática, o Athlon 64 processa apenas uma instruções SSE e meia por ciclo.
Isso acentua a vantagem do Conroe em aplicativos muito otimizados para as instruções SSE, como programas de processamento de vídeo e alguns games. Só para efeito de comparação, o Pentium 4 possuía apenas duas unidades SSE, que, como as do Athlon 64, eram capazes de processar apenas meia instrução por ciclo. Ou seja, o Conroe possui três vezes mais processamento bruto em SSE que o Pentium 4.
Outro reforço são as unidades de ponto flutuante (o coprocesador aritmético, para quem é das antigas) capazes de processar 4 instruções de dupla precisão por ciclo, contra apenas 3 por ciclo do Athlon 64.
Foi mantido o suporte ao EM64T, que torna o Conroe compatível com os sistemas e aplicativos de 64 bits, desenvolvidos para o Athlon 64. Foi incluído também o Intel VT, um recurso de virtualização via hardware, que será aproveitado pelas próximas versões do VMware, Virtual PC e outros virtualizadores, para melhorar o desempenho e reduzir o overhead ao rodar várias máquinas virtuais simultaneamente.
Você deve se lembrar do pipeline de 31 estágios do Pentium 4 com core Prescott. Sempre que o processador chega a uma operação de tomada de decisão, ele precisa esperar a conclusão do processamento da primeira instrução (o que, no Prescott, demora 31 ciclos) para saber quais instruções deve processar em seguida. Para não ficar parado, o processador utiliza o circuito de branch prediction, que escolhe o caminho mais provável, permitindo que o processador vá "adiantando o trabalho". O problema é que, sempre que é feita a escolha errada, todo o trabalho precisa ser descartado, causando uma grande perda de tempo.
O Conroe possui um pipeline de apenas 14 estágios, e um circuito de branch prediction muito aprimorado em relação ao Pentium 4. Isso faz com que ele tome bem menos decisões erradas e perca muito menos tempo (menos da metade do número de ciclos) em cada um, gerando uma grande aumento no número de instruções efetivamente processadas por ciclo de clock.
O mais interessante é que, apesar de possuir apenas 14 estágios e ser muito mais eficiente, o Conroe já atingiu 2.96 GHz logo no lançamento, se aproximando das freqüências atingidas pelo Pentium 4 e superando por uma boa margem o clock dos Athlon X2.
Durante Maio e Junho, a Intel distribuiu vários processadores e placas para review, porém sob um NDA que impedia a divulgação de detalhes sobre eles e benchmarks. Quando o NDA expirou, vários sites publicaram reviews ao mesmo tempo. Você encontra um conjunto exaustivo de benchmarks nos links abaixo:
http://techreport.com/reviews/2006q3/core2/index.x?pg=3
http://www.anandtech.com/cpuchipsets/showdoc.aspx?i=2795&p=3
http://www.xbitlabs.com/articles/cpu/display/core2duo-e6300_9.html
http://www.firingsquad.com/hardware/intel_core_2_performance/page4.asp
http://www.tomshardware.com/2006/07/14/core2_duo_knocks_out_athlon_64/page11.html

Como era de se esperar, o Athlon X2 continua levando vantagem no acesso à memória, tanto em latência quanto em taxas de transferência, graças ao controlador de memória integrado. Mas, o enorme cache L2 do Conroe, combinado com as demais melhorias na arquitetura fazem com que ele acabe levando a melhor em quase todos os benchmarks. O que chama mais a atenção é a consistência: ele apresenta um desempenho equilibrado em quase todas as tarefas, sem os altos e baixos do Pentium 4, que se saía muito bem em algumas tarefas e muito mal em outras.
O Athlon 64 FX-62 ainda consegue ser competitivo, em alguns dos testes, mas os Athlon X2 perdem quase sempre por uma boa margem, até por que, o Core 2 Duo trabalha a freqüências de clock maiores.
Os Pentium D ficam na lanterna em quase todos os testes, com o 965 Extreme Edition perdendo para o Core 2 Extreme X6800 por uma margem de 40 a 60% em quase todos os testes e esboçando alguma reação apenas no Photoshop, Sysmark 2004, Sandra e em alguns benchmarks envolvendo compressão de audio e vídeo.
Em alguns testes, a desvantagem chega a ser maior: o Core 2 Duo Extreme X6800 chega a ser 100% mais rápido que o Pentium XE 965 no game Rise of The Legends.

Naturalmente, o Extreme X6800 é muito caro para ser considerado na hora da compra, mas os Duo E6300 e E6400 apresentam um bom custo benefício em relação aos Athlon X2, mesmo desconsiderando as possibilidades de overclock.
Os 4 MB de cache incluídos no E6600 em diante são responsáveis por um aumento de apenas 3 a 4% no desempenho em relação às versões com 2 MB. O resto da diferença é proporcionada pelo aumento no clock. Ou seja, enquanto a diferença de preço for grande, os Core 2 Duo com 2 MB oferecem um melhor custo benefício.

O Conroe representa uma reviravolta para a Intel, que volta a ter em mãos um processador mais eficiente, para o qual a AMD ainda não possui resposta. Mas, isso não significa que o jogo esteja terminado. Embora o Athlon X2 não seja mais o processador mais rápido, resta à AMD reduzir suas margens de lucro e voltar a vender seus processadores mais barato, como fazia no passado. Por enquanto, o Core 2 Duo é ainda um processador high-end, por isso, a curto prazo pouca coisa muda no mercado de processadores de baixo custo, onde a AMD possui uma forte presença com o Sempron.
A partir de 2007, devemos ver o lançamento de uma versão single-core, que utilizará o core "Millville" (uma versão simplificada do Conroe) e será vendida sob a marca Core Solo, como um processador de baixo custo.
Tudo indica que o Millville substituirá os Celerons nas posições mais baixas das tabelas de preços, mas por enquanto nada está confirmado. Ao ser lançado, o Core Solo concorrerá com o Sempron e as versões baratas do X2, possivelmente oferecendo boas margens de overclock. Quem não se lembra dos Celerons de 366 e 600 MHz, que suportavam 50% de overclock com estabilidade? ;).
Um fator importante a se lembrar é que todos os processadores AMD são ainda produzidos numa técnica de 0.09 micron, enquanto a Intel já trabalha com processadores de 0.065 micron desde o Yonah e o Cedar Mill. Embora transistores menores não signifiquem mais um grande aumento de clock, como no passado, eles representam uma grande redução no tamanho físico do processador e custo de produção.
Quando finalmente migrar para os 0.065 micron, a AMD terá a chance de responder com uma versão aperfeiçoada do Athlon X2, aproveitando para adicionar mais cache e outras melhorias, ou simplesmente aproveitar a redução no custo de produção para baixar os preços e melhorar a relação custo-benefício de seus processadores.
Ninguém pode prever o futuro, mas o lançamento do Conroe é uma ótima notícia para quem pretende trocar de micro em 2007, pois levará a uma forte redução de preços do lado da AMD e ao lançamento de processadores mais competitivos, eficientes e com maior margem de overclock do lado da Intel. Quanto mais acirrada a concorrência entre os dois, melhor para nós ;).
 
Afe que tamanho de texto!!!

Mereci um "Nem li" :lol: :lol:

Mas muito bom, eu li tudo:yes:
 
Cara, muito obrigado pelas informações, deve ter dado trabalho juntar isso tudo. Valeu mesmo.
:yes:
 
e com tantos defeitos ainda durou 5 anos :S.

Bem, foram nesses 5 anos que a AMD ganhou espaço, espaço que a Intel pretente retomar com o Core 2 Duo que esta se mostrando muito superior se comparado a nova safra da AMD (AM2), fazer o que isso é tecnologia...
 
Não fui eu que escrevi o artigo não:lol: Eu só to repassando como uma forma de contribuir um pouquinho com a moçada que tanto tem me ajudado:cool:
 
Valeu man! Grande contribuição para todos nós!
 
e pior q tem muita gente q acha os P4 os melhores processadores do "mundo".
até hoje as pessoas falam q "EU TENHO UM P4", e acha q está com o melhor processador, não estou dizendo q seja ruim, só estou dizendo q não é tudo isso.

não sou fanboy da amd (estou até querendo comprar um C2D), mas entre a64 e p4, sou mais a64.
minha opinião

t+
 
Eu fui um "sortudo" que tive um P4 Willamette 1.8 GHZ e achava que era bom, até ver o Duron 1.6 da minha namorada ser mais rapido que o meu P4! E hoje com o Sempron fico apavorado em ver os P4 3.2 serem mais lentos que ele notavelmente. Ainda bem que morreu essa porcaria de processador.
 
Ae galera, gostaria de saber uma coisa de vocês, um p4 478 2.8ht contra um A64 939 3800+ ambos sem over, em relação a jogos atuais, o A64 fica quanto em % na frente do p4, ele realmente espanca o p4 ou fica pau a pau. Valeu galera obrigado desde ja.
 
um p4 2.8 s478 faz 60segundos + ou - no super-pi.
já um 3800+ faz 35segundos + ou- .
tire suas conclusões ;D

t+
 
Eu fui um "sortudo" que tive um P4 Willamette 1.8 GHZ e achava que era bom, até ver o Duron 1.6 da minha namorada ser mais rapido que o meu P4! E hoje com o Sempron fico apavorado em ver os P4 3.2 serem mais lentos que ele notavelmente. Ainda bem que morreu essa porcaria de processador.

Eita, vai ser fanático lá na China, desde quando teu sempron é mais rápido que pentium 4 3.2???:lol:
 
um p4 2.8 s478 faz 60segundos + ou - no super-pi.
já um 3800+ faz 35segundos + ou- .
tire suas conclusões ;D

t+

eita............
eu tinha um P4 2.8 478 até 4 meses atrás e fazia exatos 48 seg no PI 1mb em stock
 
Eita, vai ser fanático lá na China, desde quando teu sempron é mais rápido que pentium 4 3.2???:lol:

Dependendo do aplicativo é sim mais rapido e com boa vantagem.
 
P4 é e sempre foi um processador ruim... até do P3 ele apanhava, quando ainda não tinha clock's astronômicos...

bom, o P3 era um baita processador, mas mesmo assim...
 
bom .. q o PIII é melhor q o P4 na sua arquitetura, isto é sim ... mas nossa vcs falam de uma maneira q parece q o P4 era um 486 em relaçao ao A64 ... neim tanto tbm né... tenho meu P4 e rodo tranquilo os jogos ... o A64 se saia melhor mas nao precisa joga o P4 como se ele fosse lixo, hehe .. e tbm vcs abusam, P4 northwood era pra concorrer com os Atlhon XP ... e ai sim era pau a pau... ai a AMD lançou os A64 e o q a intel ia fazer?? .... agora compare os P4 D 9xx e 8xx pra ver se nao da pau a pau ... de over intao esses P4 sao absurdos ....

ta ai minha humilde opiniao :p
 
Eu fui um "sortudo" que tive um P4 Willamette 1.8 GHZ e achava que era bom, até ver o Duron 1.6 da minha namorada ser mais rapido que o meu P4! E hoje com o Sempron fico apavorado em ver os P4 3.2 serem mais lentos que ele notavelmente. Ainda bem que morreu essa porcaria de processador.

Eric! acho que vc falou um pouco de bobagem mais se corrigiu a tempo de um bando de gente começa a precionar e questionalo.... Depende do aplicativo mesmo, sabe o Sempron... mais o P4 não pode ser bom em tudu não é mesmo,ninguem é bom em fazer de tudu... por exemplo a AMD não é boa em fazer seus processadores com um clock maior que da INTEL.... :lol:
 
Eric! acho que vc falou um pouco de bobagem mais se corrigiu a tempo de um bando de gente começa a precionar e questionalo.... Depende do aplicativo mesmo, sabe o Sempron... mais o P4 não pode ser bom em tudu não é mesmo,ninguem é bom em fazer de tudu... por exemplo a AMD não é boa em fazer seus processadores com um clock maior que da INTEL.... :lol:

isso ja virou meu caro ... olhe os clocks dos core 2 duo em comparaçao aos processadores q a AMD vai lançar ano q vem FX70 FX72 FX74 e etc.. os FX sao tudo com clock de 2.7 a 2.9 ... o_O digamos um absurdo em comparaçao aos baixos clocks q a AMD possue hj .... e digamos um E6300 @ 2.4Ghz bate um FX60 @ 2.9 :thumbs_up

quem tem clocks maiores e ta fazendo feiu agora é a AMD hehe
 
alguem q esteja com mais tempo poderia resumir o texto ????
 
Eita preguiça de ler eim, Kin :lol: Mas, adorei o artigo :yes:
 
Dependendo do aplicativo é sim mais rapido e com boa vantagem.


Mostra os benchs aí onde o teu sempron em stock ganha do meu processador. Porcaria é esse teu sempron, opa falei...:lol:

Vou repetir mais uma vez, vai ser fanático assim na Chinaaaa!!!:wave:
 
Mostra os benchs aí onde o teu sempron em stock ganha do meu processador. Porcaria é esse teu sempron, opa falei...:lol:

Vou repetir mais uma vez, vai ser fanático assim na Chinaaaa!!!:wave:

Não sei se tu reparou mais o meu Sempron não esta em stock e nunca disse que ele em stock era melhor. Uso ele com um over leve e fica excelente. Vc com esse velho prescott socket 478 consumindo uma loucura de energia com temperatura alta não pode dizer que o meu Sempron seja uma porcaria. O Sempron Palermo é um processador tão bom como o Athlon 64 e faz frente em alguns casos ao P4 que custa mais que o dobro do Sempron. Olha bem pro teu pc velho e se enxerga antes de falar do meu pc que custou 1300 pila e que pode fazer coisas que esse teu P4 nunca ira fazer.
 
Não sei se tu reparou mais o meu Sempron não esta em stock e nunca disse que ele em stock era melhor. Uso ele com um over leve e fica excelente. Vc com esse velho prescott socket 478 consumindo uma loucura de energia com temperatura alta não pode dizer que o meu Sempron seja uma porcaria. O Sempron Palermo é um processador tão bom como o Athlon 64 e faz frente em alguns casos ao P4 que custa mais que o dobro do Sempron. Olha bem pro teu pc velho e se enxerga antes de falar do meu pc que custou 1300 pila e que pode fazer coisas que esse teu P4 nunca ira fazer.

Mostra ae o que o teu faz de melhor rapaz, vc ta invertendo as coisas aí, o meu faz várias coisas que o seu pede arrego pra fazer, esse teu perto do meu é lixo!!!:ras:
 
Parabéns. Muito bom.
To na metade ainda + ta muito bom mesmo.
 

Users who are viewing this thread

Voltar
Topo