[TÓPICO DEDICADO] AMD Bulldozer, Piledriver, Steamroller[Socket AM3+ FM2 & FM2+]

DemonbrsX · 03/10/2013

Topico Dedicado aos Processadores FX e serie de APUs sockets AM3+,FM2 e FM2+ e algum futuro Socket unificado da AMD
Topico Anterior por Hekinho
http://adrenaline.uol.com.br/forum/...335606-amd-bulldozer-am3-topico-dedicado.html

A palavra chave da arquitetura Bulldozer está no aproveitamento dos processos. Enquanto a Intel optou pelo uso da tecnologia de virtualização Hyper-Threading, que simula núcleos lógicos aos físicos – aumentando assim a performance em tarefas multi-threads, a AMD foi em outra direção, focando no aumento físico do número de instruções por clock (IPC) através de uma maior unidade interna de processamento. Em outras palavras, os engenheiros da companhia optaram por integrar dois núcleos para formar um bloco de construção fundamental, a famosa estrutura “modular do Bulldozer".

Conforme pode ser visto acima, tal módulo compartilha porções de um núcleo de processamento tradicional - incluindo a instrução fetch, unidades de ponto flutuante e decode, bem como o cache L2 - entre os dois núcleos de processamento. A AMD optou por compartilhar apenas os recursos que nem sempre são totalmente utilizados por um único núcleo. Desta forma, ao não duplicar tais recursos, a companhia ganhou em várias frentes, como é o caso de otimização dos recursos e de seu gerenciamento, bem como na otimização da área do chip.

A parte principal de cada módulo Bulldozer é composta de canais de predição (prediction pipeline) - que preveem quais serão as próximas instruções a serem utilizadas. O canal de busca (fetch pipeline) separado em seguida, preenche as duas filas de instruções - uma para cada thread - com essas instruções. Os decodificadores convertem instruções x86 complexas para as instruções internas mais simples da CPU. Vale ressaltar que os processadores da geração Bulldozer tem quatro destes.

Cada módulo tem um trio de catalogadores, um para cada núcleo inteiro e um para a FPU (Unidade de Ponto Flutuante). Cada núcleo inteiro tem ainda duas unidades de execução e duas unidades de geração de endereço, além de quatro ALUs.

Embora cada módulo tenha apenas uma única unidade de ponto flutuante, a FPU do Bulldozer é consideravelmente mais capaz que as FPUs dos processadores das gerações passadas. É possível observar no diagrama acima duas unidades de inteiros MMX e duas unidades FMAC (Fused multiply-accumulate) de 128 bits. Em um arranjo semelhante ao SMT (simultaneous multi-threading) - tecnologia HyperThreading implementada pela Intel - o FPU pode lidar com duas threads de hardware, um para cada núcleo no módulo.

O FPU do Bulldozer tem uma vantagem em outra área, graças a presença duas unidades de FMAC de 128 bits. O termo FMAC é a abreviação para "fusão de multiplicação-acumulação", também conhecido como FMA, para designar "fusão de multiplicação-adição". Ou seja, trata-se de uma estrutura que em uma única operação, une multiplicação com adição, algo novo para os processadores x86. Assim, as operações de FMA alimentam o resultado da multiplicação diretamente no somador sem arredondamento, aumentando assim a precisão matemática do resultado. É por esta razão que as GPUs da geração DirectX 11 passaram a adotar o recurso FMA como seu novo padrão.

A Unidade de Ponto Flutuante suporta quase todas as extensões do padrão x86, incluindo SSSE3, SSE 4.1, 4.2, e o novo recurso AVX (Extensões de Vetor Avançado) da Intel. O AVX permite maior capacidade de processamento de gráficos, mídia e outros processamentos paralelos, além de cargas de trabalho intensivas de pontos flutuantes, duplicando a largura de vetores SIMD de 128 bits para 256 bits. Assim as unidades FMAC do Bulldozer trabalham juntas formando um único vetor de 256 bits por ciclo.

SMT x Arquitetura modular
A implementação do SMT por parte da Intel duplicou os estados arquitetônicos (parte de uma CPU responsável pela condição de um processo), mas não a execução como um todo da engine. Isto permitiu que seus processadores maximizassem os recursos de execução pelos silícios ativos que, de outra maneira, estariam ociosos, ou pela injeção de threads dentro do pipeline da ocorrência do processo.

Como resultado, a Intel utiliza o SMT para garantir que seu processador esteja sempre ocupado “triturando” os dados, uma vez que, cada vez mais, os sistemas estão aumentando sua “inteligência” no sentido de despachar threads para esta finalidade.

O "problema" com esta implementação de SMT (um recurso de execução/ registros duplicados) é que uma janela de instrução rastreia o despacho, a execução e a retirada de ambos os threads, ou seja, eventualmente pode sobrecarregar o processador, causando eventuais gargalos/falhas.

Já no Bulldozer, o recurso de virtualização recebeu uma janela de instrução dedicada a ambos os threads emitidos ao processador pelo sistema operacional.

O diagrama acima ilustra isso perfeitamente: Uma interface comum (fetch / decode) pode receber e despachar dois threads a um par de catalogadores de inteiros independentes.

Os catalogadores de inteiros estão associados com seu próprio conjunto de pipelines de execução. O consenso geral é que eles são eventualmente divididos entre operações de ALU e armazenamento, mas que poderiam, na verdade, reduzir a performance de execuções single thread.

Estes recursos de execução gravam os dados em seus próprios pedaços de memórias cache L1, enquanto o SMT atual habilita núcleos a gravarem os resultados de ambos os threads em um mesmo cache de dados L1.

Modelos do Bulldozer:
Quadcore: FX4100
SixCore: FX6100
Octacore: FX8120 e FX8150

Modelos do Piledriver:
Quadcore:FX4300
Sixcore: FX6300 e FX6350
Octacore: FX8320,FX8350,FX9590

Tabela dos Processadores Vishera(piledriver)

Uploaded with ImageShack.com

Em construção...

Por Dentro Da Arquitetura Piledriver

Por dentro do núcleo Piledriver

Conforme mencionado na seção anterior, o AMD FX-8350 tem como grande destaque o fato de ser baseado na arquitetura Piledriver. Apesar da “novidade”, a macro arquitetura é uma evolução da Bulldozer, com os mesmos princípios básicos de organização dos núcleos, formados por módulos. Há, inclusive, as mesmas estruturas funcionais compartilhadas entre os núcleos, como é o caso da memória cache L2, da unidade de ponto flutuante, do buscador de instrução e do decodificador de instrução.

Além disso, o semicondutor do Vishera compartilha algumas características em relação ao Zambezi, como é o caso da litografia (em 32nm), quantidade de transistores (1,2 bilhão), área de die (315 mm2) e quantidade de núcleos e de memória cache L2/L3.

Apesar da aparente semelhança com os antigos processadores da linha FX, os engenheiros da AMD fizeram duas importantes modificações que culminaram em um melhor desempenho.

A primeira mudança foi na estrutura interna do núcleo (conforme é possível verificar na imagem abaixo).

Somente com a alteração das estruturas internas contidas no die do Vishera, a AMD conseguiu atingir uma maior freqüência nos núcleos Piledriver sem aumentar a dissipação térmica máxima, mesmo mantendo o processo de fabricação em 32nm.

Outra mudança foi na condução da fila de execução do processamento, resultando em núcleos mais eficientes (e consequentemente mais desempenho). A interface principal de controle dos dados possui um previsor de ramificação (branch predictor) mais preciso e com maior janela de instrução. As unidades de execução adquiriram um agendador avançado que “aprendeu” a processar instruções individuais de forma mais rápida, como é o caso da divisão de número inteiro e ponto flutuante.

Além disso, os engenheiros da AMD afirmam ter aumentado o tamanho TLB L1 (Translation Lookaside Buffer – dispositivo que visa facilitar a tradução de endereços lineares em endereços físicos, evitando a consulta à tabela de páginas localizada na memória) aumentando assim a velocidade do processamento dos dados, além de aprimorar a pré-busca dos dados e os algoritmos de arbitragem na memória cache L2.

DemonbrsX · 03/10/2013

Roadmap atual da AMD

Servidores e Possivelmente Desktops

Desktops e outros Segmentos

DemonbrsX · 03/10/2013

A linha Kaveri e os Processadores de núcleo Streamroller

Os Processadores da linha KAVERI são os últimos e mais avançados da AMD eles possuem dois módulos contendo cada um modulo 2 núcleos e possui uma GPU GCN com 8 unidades computacionais totalizando 512Stream processors totalmente compatível com Direct X11.2,Mantle,True Audio e o OpenCL,além de dissipar em seu modelo mais topo de linha 95Wats....
as novas APU's da linha Kaveri contam com a tecnologia HSA que nada mais é que uma linguagem de programação que faz os softwares usarem tento os núcleos x86 streamroller como a GPU GCN assim melhorando o desempenho de vários aplicativos que exijam muitos processadores.

a Arquitetura Streamroller por sua vez é a 3ª geração da arquitetura modular com enfase na computação paralela e melhorando a eficiência dos núcleos.

outro dado da AMD é que mutos usuários do Steam utilizam gráficos inferiores ao de suas APU's e isso seria um meArcado que a AMD quer atingir

________________________________________________________________________________________________________________________________________________________

melhores placas mãe para AM3+ de acordo com o Preço

Até 190R$ temos a GA78LMt-S2P
ela tem o basico que uma mobo pode oferecer tem todos seus capacitores solidos na rev 5.0 e suporta processadores de até 95W tem 6 portas SATA II uma saida D-SUB,uma DVI e chip onboard ATi Radeon HD3000

http://br.gigabyte.com/products/product-page.aspx?pid=4125#ov

Até 290R$ temos a evolução da placa acima é a GA78LMT-S2 USB3 é exatamente a mesma placa mãe com outra cor 4 slots para memoria,e USB 3.0 e HDMI uma detalhe interessante é que na ultima REV 6.0 ela ganhou um circuito de áudio isolado coisa que antes so placas topo de linha tinham,não sei se quem compra uma mobo deste valor pensa nisso mas a da gigabyte tem... que bom né,também suporta processadores de 125W (FX8350,8370etc)

http://br.gigabyte.com/products/product-page.aspx?pid=5195#ov

Já até 400R$ temos a GA 970 UD3P o foco desta placa além de usar um Chipset mais atual o 970 ela suporta crossfire (16X/4X) recursos avançados de cpu como o APM core unlocker entre outros,possui uma BIOS UEFI e todo o tipo de configuração para Overclock do processador a memoria,tem um VRM muito bom de 8+2 Fases e possui USB 3.0 SATA 3 e saída digital de áudio, não possui video onboard, suporta também o TPM

http://br.gigabyte.com/products/product-page.aspx?pid=4717#ov

ja até 650R$ temos a queridinha de muitos a 990FXA UD3 essa placa é uma das mais completas para AM3+,usa o melhor chipset da plataforma o 990FXA,possui USB 3.0 Fireware,e muitas outras entradas de alta performance tem um VRM potente como o modelo anterior e sua maior vantagem é o Crossfire que aqui é total (16X/16X) além de ela ser mais bonita hehe

http://br.gigabyte.com/products/product-page.aspx?pid=4672#ov

ja nas placas até 1100R$ (sim existe placa nesse preço para AMD) temos a Crosshair V Formula Z uma das placas mais completas se não a mais completa placa para AMD,é uma placa da Linha ROG ou seja destinada a gamers e entusiastas tem todo o tipo de conexão,recursos exclusivos ROG da Asus e suporte ao crossfire X e SLI de acordo com a ASUS ela suporta os FX de 220W

http://www.asus.com/br/Motherboards/CROSSHAIR_V_FORMULAZ/

e por fim a ASRock Extreme 9 é simplesmente eleita por muitos sites a melhor placa mãe para AMD,possui um VRM de mais de 10 fases,todos os capacitores do tipo militar e ainda banhados a Ouro e é certificada pela propia AMD para os FX 9000 de 220W,

http://www.asrock.com/mb/AMD/990FX Extreme9/index.br.asp

Hewllet · 03/10/2013

Quem dera essa união, ninguém ia perder dinheiro, Hoje possuo um FX 8350 AM3+ e um A8 5600K FM2

DemonbrsX · 03/10/2013

Hewllet disse:
Quem dera essa união, ninguém ia perder dinheiro, Hoje possuo um FX 8350 AM3+ e um A8 5600K FM2

mas é o que da a entender né amigo,a AMD com certeza vai unificar os sockets

onurb666 · 03/10/2013

BrunoWRX disse:
....

Perfeito!

Fixei o tópico, obrigado! :awesome:

Dalai Brahma · 03/10/2013

Já sinto falta dos fanboys... :lol2:

Valeu, "Brunos"! pela iniciativa do novo tópico.
Tentarei deixar minha contribuição: FX-6350 + GTX650Ti Boost. Pra mim, CxB em 2 classes:
1) gastando 'pouco': FX-6 + (Ti Boost ou 660)
2) (1) e forçando: FX-6 + (760 ou SLI Ti Boost).

.

Barr3l rid3r · 03/10/2013

Sim, existirão Steamrollers 8 cores sem vídeo on-board, mas serão FM2+

darktag · 03/10/2013

Seguindo...

DemonbrsX · 03/10/2013

Barr3l rid3r disse:
Sim, existirão Steamrollers 8 cores sem vídeo on-board, mas serão FM2+

wow da onde essa news?

Hewllet · 03/10/2013

De qualquer forma se vier FM2 a mobo eu ja tenho, apenas desfaço da minha APU, só não pode vir um socket novo AM4 -.- :feelbad:

rlopes · 03/10/2013

Barr3l rid3r disse:
Sim, existirão Steamrollers 8 cores sem vídeo on-board, mas serão FM2+

BrunoWRX disse:
wow da onde essa news?

Interessante, também quero saber!

Boechat · 03/10/2013

O que acham do A10 6800K para jogos?

DemonbrsX · 03/10/2013

Boechat disse:
O que acham do A10 6800K para jogos?

como um quebra galho de boa qualidade é excelente,é um quad core com uma excelente GPU embutida para quem precisa economizar eu acho que vale a pena

Barr3l rid3r · 03/10/2013

Hewllet disse:
De qualquer forma se vier FM2 a mobo eu ja tenho, apenas desfaço da minha APU, só não pode vir um socket novo AM4 -.-

Eu disse FM2+, nao sei se FM2 tb vai suportar.

Hewllet · 03/10/2013

Barr3l rid3r disse:
Eu disse FM2+, nao sei se FM2 tb vai suportar.

Cara de qualquer forma se unir os socketts vai ficar bom pra todo mundo.. Será que essas mobos vão suportar os AM3+ atuais?

sid_brain · 03/10/2013

legal Bruno!!!

pauloCES4R · 03/10/2013

Galera qual compensa mais? pegar um i5 4570+b85 ou Fx-8350+990x obg

DemonbrsX · 03/10/2013

Obrigado a todos e o tópico esta em construção
vou detalhar a APU nos próximos topicos

Chencko · 03/10/2013

Bons tempos meus com o Phenom II X6 1090T que com um OC "básico" de 4,5 colocava os i7-9xx no bolso. AM3+ chegam ao máximo possível com os Piledriver

sid_brain · 03/10/2013

BrunoWRX disse:
Obrigado a todos e o tópico esta em construção
vou detalhar a APU nos próximos topicos

só não te qualifiquei pq deu aquela mensagem la de vc precisa acrescentar... bla bla bla

Chencko disse:
Bons tempos meus com o Phenom II X6 1090T que com um OC "básico" de 4,5 colocava os i7-9xx no bolso. AM3+ chegam ao máximo possível com os Piledriver

4.5 no 1090?!?!?!?!Gold heim!

rlopes · 03/10/2013

pauloCES4R disse:
Galera qual compensa mais? pegar um i5 4570+b85 ou Fx-8350+990x obg

Depende muito da finalidade, mas em 80% delas será o FX.

Immortal Horg · 03/10/2013

Quem estiver considerando uma plataforma AMD, sugiro esperar até novembro quando acontece a AMD developers conference. Pessoal do Overclocker.net e com conexão na AMD estão esperando notícias e a confirmação final ou não da morte do AM3+ e se o Steamroller será só APU (conforme muitas pistas tem demonstrado). Minha opinião é que 2014 a AMD entra "agarrada" nas APU's e então próxima CPU seria o Excavator em 2015.

DemonbrsX · 03/10/2013

Immortal Horg disse:
Quem estiver considerando uma plataforma AMD, sugiro esperar até novembro quando acontece a AMD developers conference. Pessoal do Overclocker.net e com conexão na AMD estão esperando notícias e a confirmação final ou não da morte do AM3+ e se o Steamroller será só APU (conforme muitas pistas tem demonstrado). Minha opinião é que 2014 a AMD entra "agarrada" nas APU's e então próxima CPU seria o Excavator em 2015.

meu deus AMD deve estar muito segura no mercado de VGA e consoles para segurar o excavator até 2015 ta louco

Barr3l rid3r · 04/10/2013

Hewllet disse:
Cara de qualquer forma se unir os socketts vai ficar bom pra todo mundo.. Será que essas mobos vão suportar os AM3+ atuais?

Não, o socket FM@+ já existe no mercado e e completamente diferente.

Immortal Horg disse:
Quem estiver considerando uma plataforma AMD, sugiro esperar até novembro quando acontece a AMD developers conference. Pessoal do Overclocker.net e com conexão na AMD estão esperando notícias e a confirmação final ou não da morte do AM3+ e se o Steamroller será só APU (conforme muitas pistas tem demonstrado). Minha opinião é que 2014 a AMD entra "agarrada" nas APU's e então próxima CPU seria o Excavator em 2015.

BrunoWRX disse:
meu deus AMD deve estar muito segura no mercado de VGA e consoles para segurar o excavator até 2015 ta louco

Nada impede a AMD de lancar Steamrollers puros sem APU para socket FM2+ Como ela faz hoje em dia com o socket FM2

[TÓPICO DEDICADO] AMD Bulldozer, Piledriver, Steamroller[Socket AM3+ FM2 & FM2+]

know-it-all Member

know-it-all Member

know-it-all Member

SOU FANBOY DO MEU $$

know-it-all Member

Bruno

os astros q regem os sabidos tbm regem os otários

Banido

PC Gamer

know-it-all Member

SOU FANBOY DO MEU $$

know-it-all Member

check|pass

know-it-all Member

Banido

SOU FANBOY DO MEU $$

Hey ho, Let's go!

Well-Known Member

know-it-all Member

Hungry Member

Hey ho, Let's go!

know-it-all Member

know-it-all Member

know-it-all Member

Banido

Users who are viewing this thread