AMD FX Otimização & Curiosidades

Putz 4.5 GHz com vcore normal é muito bom.

Deixar essa sua cpu em stock é um pecado. Ainda mais usando uma GTX 970. rsrs
hahah pois é, tenho jogado em 4,5GHz agora no inverno... qdo esquentar de novo, deixo em stock ou compro outro cooler :p
 
Só achei a comparação de um Core Phenom II @ 3600 MHz equivale a um Core do FX Vishera @ 4200 MHz exagerada.

Aqui na minha CPU por exemplo @ 4200 MHz faz 101 cb no Cinebench R15, enquanto um Phenom II @ 4 GHz faz 104 e por hora ás vezes o FX bate 102 cb.

No mais excelente estudo de campo e conclusão.
Falo por resultados bem disponíveis online. Tive um Phenom II também com over pra 3600-3700MHz e ele me dava 1.12p. Resultado bem equivalente ao FX. Contudo essa equivalência deve mudar dependendo de cada aplicação
e otimzação de instruções. Phenom II não tem AVX nem SSE4 e acredito que aplicações que usem as instruções mais modernas tenham uma real vantagem. A comparação é só pra fazer uma analogia de como a perda de performance no pior cenário é acentuada.
 
Falo por resultados bem disponíveis online. Tive um Phenom II também com over pra 3600-3700MHz e ele me dava 1.12p. Resultado bem equivalente ao FX. Contudo essa equivalência deve mudar dependendo de cada aplicação
e otimzação de instruções. Phenom II não tem AVX nem SSE4 e acredito que aplicações que usem as instruções mais modernas tenham uma real vantagem. A comparação é só pra fazer uma analogia de como a perda de performance no pior cenário é acentuada.

Pois é...

O que já reparei é que o Cinebench 11.5 os FX vão muito mal. Diferente do Cinebench R10 e R15, onde no R10 o FX fica com a mesma pontuação single core do Phenom no mesmo clock e no R15 perde por pouco. Deve ser justamente isto que vc falou, uso de instruções novas do FX.
 
Pois é...

O que já reparei é que o Cinebench 11.5 os FX vão muito mal. Diferente do Cinebench R10 e R15, onde no R10 o FX fica com a mesma pontuação single core do Phenom no mesmo clock e no R15 perde por pouco. Deve ser justamente isto que vc falou, uso de instruções novas do FX.

Em um antigo Review da anandtech, http://www.anandtech.com/show/4955/the-bulldozer-review-amd-fx8150-tested/2
eles explicam que, o ganho de clock do FX é praticamente perdido com o alongamento do Pipeline que acabou reduzindo o IPC, e que em SSE2, SSE3, MMX basicamente o FX neste cenário
tem desempenho muito semelhante aos Phenom II nas relativas proporções de clock.
No entanto com o uso de AVX e o correto escalonamento de Threads no módulo podemos ter reais ganhos comparados clock a clock com o Phenom II. Por isso que jogos antigos ou que usem SS2 e SS3 não apresentam ganhos interessantes. No entanto jogos antigos tendem a rodar, mesmo com o fraco IPC do FX em taxas de FPS já altas. O problema são os jogos mais novos que ainda insistem em usar instruções antigas.

"The problem is AMD had to increase the functionality of its FPU with the move to Bulldozer. The Phenom II architecture lacks SSE4 and AVX support, both of which were added in Bulldozer. Furthermore, AMD chose Bulldozer as the architecture to include support for fused multiply-add instructions (FMA). Enabling FMA support also increases the relative die area of the FPU. So while the throughput of Bulldozer's FPU hasn't increased over K8, its capabilities have. Unfortunately this means that peak FP throughput running x87/SSE2/3 workloads remains unchanged compared to the previous generation. Bulldozer will only be faster if newer SSE, AVX or FMA instructions are used, or if its clock speed is significantly higher than Phenom II.
 
Em um antigo Review da anandtech, http://www.anandtech.com/show/4955/the-bulldozer-review-amd-fx8150-tested/2
eles explicam que, o ganho de clock do FX é praticamente perdido com o alongamento do Pipeline que acabou reduzindo o IPC, e que em SSE2, SSE3, MMX basicamente o FX neste cenário
tem desempenho muito semelhante aos Phenom II nas relativas proporções de clock.
No entanto com o uso de AVX e o correto escalonamento de Threads no módulo podemos ter reais ganhos comparados clock a clock com o Phenom II. Por isso que jogos antigos ou que usem SS2 e SS3 não apresentam ganhos interessantes. No entanto jogos antigos tendem a rodar, mesmo com o fraco IPC do FX em taxas de FPS já altas. O problema são os jogos mais novos que ainda insistem em usar instruções antigas.

"The problem is AMD had to increase the functionality of its FPU with the move to Bulldozer. The Phenom II architecture lacks SSE4 and AVX support, both of which were added in Bulldozer. Furthermore, AMD chose Bulldozer as the architecture to include support for fused multiply-add instructions (FMA). Enabling FMA support also increases the relative die area of the FPU. So while the throughput of Bulldozer's FPU hasn't increased over K8, its capabilities have. Unfortunately this means that peak FP throughput running x87/SSE2/3 workloads remains unchanged compared to the previous generation. Bulldozer will only be faster if newer SSE, AVX or FMA instructions are used, or if its clock speed is significantly higher than Phenom II.

Eu venho falando aqui no Adrena há pelo menos 2 anos.

AMD FX não é uma cpu ruim. Ruim é como os software e jogos são programados.

O FX-8350 tem mais performance que qualquer I5 em multithreading. Sou apedrejado diversas vezes por esse meu argumento. Mas os fatos demonstram.

Um FX-8350 @ 4 GHz faz 669 cb no Cinebench R15 e o I5 4690 K @ 4 GHz faz 603 cb.

10093881424_8aa4ef57ef_b.jpg



7173d1422019623-post-your-cinebench-r15-scores-cinebench-3.jpg
 
Eu venho falando aqui no Adrena há pelo menos 2 anos.

AMD FX não é uma cpu ruim. Ruim é como os software e jogos são programados.

O FX-8350 tem mais performance que qualquer I5 em multithreading. Sou apedrejado diversas vezes por esse meu argumento. Mas os fatos demonstram.

Um FX-8350 @ 4 GHz faz 669 cb no Cinebench R15 e o I5 4690 K @ 4 GHz faz 603 cb.

Nas curiosidades falo sobre dados que explicam isso, de fato você tem razão, mas essa potência útil dos FX é completamente inútil no cenário atual. Jogos com 6 e 8 thread fariam os FX de fato brilharem e incomodarem muitos I7.
No entanto em termos de performance prática ele é ainda pior que um Core I5 Comum. Isto porque os Core I5 apenas não tem a função HT ativada, mas possuem 4 Cores Reais funcionando. Perdendo a função HT de cara o core perde 19,7% de eficiência em Multi-Thread para os cenário Penta, Hexa, Hepta e Octa-Thread, só que esses cenários são inexistentes no mercado Gamer até então, logo o HT para Games é completamente inútil.

Uma vez que os jogos utilizam até 4 Thread intensivamente valerá a melhor performance no cenário Quad-Thread. Neste caso um Core I5 com 4 threads e 4 núcleos tem grandes vantagens vamos ver porque:

1 - Os núcleos Intel tem altíssimo IPC garantindo execução de Threads monolíticas com muita rapidez.
2 - Com pouco Overclock você garante um bom aumento útil no IPC dos Intel.
3 - O cenário Quad-thread terá melhor resultado conforme melhor for o somatório do trabalho conjunto dos 4 núcleos.
4 - Ele não faz Parking por ter baixo número de Threads.
5 - Os modelos FX apesar de poderem somar 4 Threads tem baixo IPC relativo aos Intel, apresentando apenas 59,9% de sua capacidade total no melhor cenário.
6 - Os FX tem muitos problemas de otimização necessários para o alcance do melhor cenário, que caso não sejam respeitados, reduzem ainda mais o aproveitamento da capacidade total, para valores de apenas 50%.
7 - Úm Core i5 de apenas 4 núcleos/threads apresenta 80,3% da capacidade total da arquitetura, o que demonstra uma alta utilização de recursos disponíveis mesmo que com apenas 4 Threads.
8 - No melhor cenário Quad-Thread o FX apresenta 431p enquanto que um Core I5 603b e no R11.5 um Skylake 6600K(3,6Ghz) faz uns 654p, e isso não é nada mais que 50% de poder útil Bruto de vantagem, contra o melhor cenário possível de um FX, mesmo operando com clock inferior. No clock a clock o IPC intel chega a ser quase 100% em relação ao FX.
9 - Mesmo com o uso de instruções otimizadas para FPU do AMD FX não é de se esperar um aumento grande de IPC para alcançar o forte IPC de um Skylake, 20% já seria muito bom.

Infelizmente os FX não tem como competir em IPC com Intel e dependem fortemente de otimziação multi-thread.
 
Última edição:
Nas curiosidades falo sobre dados que explicam isso, de fato você tem razão, mas essa potência útil dos FX é completamente inútil no cenário atual. Jogos com 6 e 8 thread fariam os FX de fato brilharem e incomodarem muitos I7.
No entanto em termos de performance prática ele é ainda pior que um Core I5 Comum. Isto porque os Core I5 apenas não tem a função HT ativada, mas possuem 4 Cores Reais funcionando. Perdendo a função HT de cara o core perde 19,7% de eficiência em Multi-Thread para os cenário Penta, Hexa, Hepta e Octa-Thread, só que esses cenários são inexistentes no mercado Gamer até então, logo o HT para Games é completamente inútil.

Uma vez que os jogos utilizam até 4 Thread intensivamente valerá a melhor performance no cenário Quad-Thread. Neste caso um Core I5 com 4 threads e 4 núcleos tem grandes vantagens vamos ver porque:

1 - Os núcleos Intel tem altíssimo IPC garantindo execução de Threads monolíticas com muita rapidez.
2 - Com pouco Overclock você garante um bom aumento útil no IPC dos Intel.
3 - O cenário Quad-thread terá melhor resultado conforme melhor for o somatório do trabalho conjunto dos 4 núcleos.
4 - Ele não faz Parking por ter baixo número de Threads.
5 - Os modelos FX apesar de poderem somar 4 Threads tem baixo IPC relativo aos Intel, apresentando apenas 59,9% de sua capacidade total no melhor cenário.
6 - Os FX tem muitos problemas de otimização necessários para o alcance do melhor cenário, que caso não sejam respeitados, reduzem ainda mais o aproveitamento da capacidade total, para valores de apenas 50%.
7 - Úm Core i5 de apenas 4 núcleos/threads apresenta 80,3% da capacidade total da arquitetura, o que demonstra uma alta utilização de recursos disponíveis mesmo que com apenas 4 Threads.
8 - No melhor cenário Quad-Thread o FX apresenta 431p enquanto que um Core I5 603b e no R11.5 um Skylake 6600K(3,6Ghz) faz uns 654p, e isso não é nada mais que 50% de poder útil Bruto de vantagem, contra o melhor cenário possível de um FX, mesmo operando com clock inferior. No clock a clock o IPC intel chega a ser quase 100% em relação ao FX.
9 - Mesmo com o uso de instruções otimizadas para FPU do AMD FX não é de se esperar um aumento grande de IPC para alcançar o forte IPC de um Skylake, 20% já seria muito bom.

Infelizmente os FX não tem como competir em IPC com Intel e dependem fortemente de otimziação multi-thread.

Já tem alguns jogos que o FX-8350 brilha e incomoda o I7. Que inclusive um FX-9370 empata com o I7.

Um exemplo abaixo:

as_proz.jpg


as_amd.jpg


Mas vc tem roda razão ao dizer que o FX é dependente de multitheading.

A AMD quando lançou a arquitetura achou que o mercado iria explorar essa área.

Eu tenho certeza que essa exploração demorou por causa dos Consoles.

Agora como Xone e PS4 usam a arquitetura modular de 8 cores, os games estão vindo otimizados pra multitheading e está acontecendo isto que postei no gráfico.
 
  • Curtir
Reações: wmh
Já tem alguns jogos que o FX-8350 brilha e incomoda o I7. Que inclusive um FX-9370 empata com o I7.

Um exemplo abaixo:

Mas vc tem roda razão ao dizer que o FX é dependente de multitheading.

A AMD quando lançou a arquitetura achou que o mercado iria explorar essa área.

Eu tenho certeza que essa exploração demorou por causa dos Consoles.

Agora como Xone e PS4 usam a arquitetura modular de 8 cores, os games estão vindo otimizados pra multitheading e está acontecendo isto que postei no gráfico.

Exato

Nos consoles a própria arquitetura deles desde a época do Ps3 e 360 já prezava pela divisão de tarefas. O Mantle da AMD trouxe isso pro PC e provocou a Microsoft, graças a isso temos o Vulkan e o Dx12 que prometem fazer
esse trabalho, e fazer tão bem que serão as APIs usadas nos próximos consoles.
Outro fato é que não foi só isso que fez a AMD lançar o FX do jeito que ele é, ela estava tecnologicamente atrasada em relação a 32nm vs 22nm intel e precisava de uma arquitetura que aproximasse ao máximo dos Core I7 em desempenho bruto. O que acredito é que ela subestimou a importância do IPC no mercado de jogos, mercado que ela sempre fez sucesso.
A relação de desempenho do FX é complexa e muitos benchmarks não expõe a real utilização do processador 24/7. Acredito que o Fx tem uma arquitetura muito complexa d ser avaliar através dos benchmarks corriqueiros.
Pelas minhas observações aqui ele tem uma curva de desempenho de acordo com a utilização de núcleos muito incomum. Estou fazendo as contas aqui pra postar os resultados.
Com o uso de todas as threads temos o melhor uso dele absoluto, mas determinar o melhor uso em Triple, Quad, Penta e Hexa-Thread é uma tarefa pra matemático. Ele é totalmente diferente do que se ve classicamente em termos de desempenho de CPU. Até então pelas minhas contas a execução ótima estaciona na utilização de 1,6 núcleos por módulo. Ou seja, a cada 1,6 núcleos usados, passe pra outro módulo. Quando chegar nos 4 módulos 4 x 1,6
ai o programa completa com 04 + 04 + 04 + 04 até a utilização completa. No entanto o sistema operacional não tem esse controle no escalonamento de processos até onde sei (eu acho que não tem) e deve ficar por conta dos programadores fazer essa otimização, inclusive a otimização de instruções. Parece que esse valor de 1,6 é o nível máximo de execução paralela que não provoca queda no IPC do núcleo mais rápido e preserva as característas do uso da Cache, fazendo as duas Threads operarem na máxima velocidade.
 
Já tem alguns jogos que o FX-8350 brilha e incomoda o I7. Que inclusive um FX-9370 empata com o I7.

Um exemplo abaixo:

as_proz.jpg


as_amd.jpg


Mas vc tem roda razão ao dizer que o FX é dependente de multitheading.

A AMD quando lançou a arquitetura achou que o mercado iria explorar essa área.

Eu tenho certeza que essa exploração demorou por causa dos Consoles.

Agora como Xone e PS4 usam a arquitetura modular de 8 cores, os games estão vindo otimizados pra multitheading e está acontecendo isto que postei no gráfico.

O que eu acho mais estranho desse gráfico é o I3 4330 ganhando de um FX 6300, enquanto um FX 8350 ganhando de um I5 4690K, I5 2500K ganhando de um FX 8150 é algo para se pensar...

PS: FX 8350 realmente deveria ganhar do 4690K.
 
Última edição:
Muito bacana o tópico, parabéns!

Me surgiu uma dúvida para uma situação hipotética:

Visando o uso APENAS em games, dx11, aliado a placas de entrada/mid atuais (950 960... não mais que isso), e sem levar em conta preço, apenas performance, o que seria melhor:
FX de 4 núcleos a 4.5GHz ou um de 6 núcleos nos mesmos 4.5GHz?

Nesse cenário, a opção acima feita se equipara a um core I3 skylake? novamente, usando placas de video e.games iguais...
 
Muito bacana o tópico, parabéns!

Me surgiu uma dúvida para uma situação hipotética:

Visando o uso APENAS em games, dx11, aliado a placas de entrada/mid atuais (950 960... não mais que isso), e sem levar em conta preço, apenas performance, o que seria melhor:
FX de 4 núcleos a 4.5GHz ou um de 6 núcleos nos mesmos 4.5GHz?

Nesse cenário, a opção acima feita se equipara a um core I3 skylake? novamente, usando placas de video e.games iguais...

6 núcleos a 4.5 GHZ, maior future-proof, melhor multi-thread, melhor render, aguenta maior carga, por mais que o DX11 seja ruim é sempre bom estar a frente dos demais.

Se o DX12 agir como deveria, o de 6 núcleos a 4.5ghz vai matar o i3 skylake, e o de 4 núcleos 4.5 deve ficar atrás mas não tanto.
 
Muito bacana o tópico, parabéns!

Me surgiu uma dúvida para uma situação hipotética:

Visando o uso APENAS em games, dx11, aliado a placas de entrada/mid atuais (950 960... não mais que isso), e sem levar em conta preço, apenas performance, o que seria melhor:
FX de 4 núcleos a 4.5GHz ou um de 6 núcleos nos mesmos 4.5GHz?

Nesse cenário, a opção acima feita se equipara a um core I3 skylake? novamente, usando placas de video e.games iguais...
Os Fx 4000 tem apenas 2 módulos então seu desempenho fica limitado ao pior cenário Quad-Thread.
Os FX apresentam uma boa simbiose com placas dessa categoria. No entanto um I3 tem alto poder IPC, mas só seria grande vantagem em jogos bem antigos Single ou Dual-Thread como Crysis 1.
Acredito que o FX 6300 oferece o melhor custo benefício se você fizer uma otimização completa, desativando o Parking.
Poucos games usam mais que 4 threads hoje em dia, nesse caso, verá terá um cenário de 2 módulos livre e um totalmente ocupado, totalizando as 4 threads.
Com uma boa otimização ele pode até superar o I3 Skylake em Quad-thread, e já estará preparado pro Penta e Hexa-Thread.

A vantagem do I3 é só se ele puder fazer Overclock, nesse caso ele provavelmente superará o FX 6300 em Quad-Thread.
 
Última edição:
Eu venho falando aqui no Adrena há pelo menos 2 anos.
AMD FX não é uma cpu ruim. Ruim é como os software e jogos são programados.

Pô, curti bastante as informações do tópico, e reconheço que grande parte é verdade, mas uma coisa que me deixa de cabelo em pé é ouvir que o problema nos FX é como o software foi escrito, ou que nenhum programa usa direito um FX, essas coisas. Ora, estamos desde o Win7 batendo nessas mesmas teclas, já lançaram mais 2 versões de sistema operacional, inúmeros jogos, e ainda assim até hoje não "aprenderam a usar a arquitetura do FX"? Ou será que essa arquitetura que é o problema e pronto? :hmm:

E outra, se ninguém sabe ou sabia escrever software pra utilizar direito a arquitetura, por que carvalhos AMD decidiu usar essa joça em primeiro lugar? :chan:


De qualquer forma, aguardo ansiosamente a chegada dos Zen pra quebrar esse tabu de uma vez :money::money:
 
Pô, curti bastante as informações do tópico, e reconheço que grande parte é verdade, mas uma coisa que me deixa de cabelo em pé é ouvir que o problema nos FX é como o software foi escrito, ou que nenhum programa usa direito um FX, essas coisas. Ora, estamos desde o Win7 batendo nessas mesmas teclas, já lançaram mais 2 versões de sistema operacional, inúmeros jogos, e ainda assim até hoje não "aprenderam a usar a arquitetura do FX"? Ou será que essa arquitetura que é o problema e pronto? :hmm:

E outra, se ninguém sabe ou sabia escrever software pra utilizar direito a arquitetura, por que carvalhos AMD decidiu usar essa joça em primeiro lugar? :chan:


De qualquer forma, aguardo ansiosamente a chegada dos Zen pra quebrar esse tabu de uma vez :money::money:
A AMD fez isso por que estava tecnologicamente atrasada, presa a Globalfoundry com 32nm quando a Intel já tinha engatilhado CPUs de 22nm. Eles não podiam lançar um Phenom III x8, precisavam de um CPU que aproximasse ao máximo da vazão da arquitetura Core mas esqueceram de observar da importância do IPC no mercado. Se hoje sabemos o que isso significa foi por causa dessa historia do FX.

O FX é um processador bem forte diga-se de passagem, mas só em aplicações Multi-Thread, nelas ele brilha como fogo de tanto poder. No entanto tem um péssimo IPC relativo o que limita muito jogos que são programados com uma ou poucas Threads. Quando dizem isso falam algumas verdades, pois hoje em dia muitos jogos podem ser paralelizados em até 4 Threads com o DX11 e depende exclusivamente da produtora fazer isso( não duvide que é uma programação mais complexa e consequentemente mais cara). Outro detalhe é o uso de instruções FPU modernas como FMA, SSE4 e AVX. Poucos jogos eu vejo utilizando essas novidade já não tão novidades assim, as produtoras ficam em sua zona de conforto no bom e velho SSE2 e SSE3. Por final e esse eu estou provando com esse tópico é o escalonamento de threads do CPU. Mostrei que com as devidas otimizações temos um ganho bruto de IPC de 9,25%
no cenário Quad-Thread. Por que isso já não é feito automaticamente é uma boa pergunta, talvês a microsoft simplesmente entregue esse trabalho na mão dos programadores esperando que cada um desenvolva sua otimização
mas testei e é isso mesmo.
Considerando tudo, incluindo a otimização de instruções FPU eu diria que o Fx pode ter em cima desses resultados apresentados um ganho de até 20% o que é insignificante diante do atual IPC da Intel.

O Zen diz vim com 40% a mais de IPC em relação ao Excavator, em relação ao FX, a conta é a seguinte 1,15x,1,15x,140 = 1,85.
Considerando que ele deve vim com Clocks bem alto (14nm) e TurboCore 3.0, os novos FX devem prometer um gigantesco salto de desempenho nesse quesito bruto.
 
Pô, curti bastante as informações do tópico, e reconheço que grande parte é verdade, mas uma coisa que me deixa de cabelo em pé é ouvir que o problema nos FX é como o software foi escrito, ou que nenhum programa usa direito um FX, essas coisas. Ora, estamos desde o Win7 batendo nessas mesmas teclas, já lançaram mais 2 versões de sistema operacional, inúmeros jogos, e ainda assim até hoje não "aprenderam a usar a arquitetura do FX"? Ou será que essa arquitetura que é o problema e pronto? :hmm:

E outra, se ninguém sabe ou sabia escrever software pra utilizar direito a arquitetura, por que carvalhos AMD decidiu usar essa joça em primeiro lugar? :chan:


De qualquer forma, aguardo ansiosamente a chegada dos Zen pra quebrar esse tabu de uma vez :money::money:

Na verdade os programadores não sabiam ou não queriam escrever nem para o FX é nem para o I7 no passado. Isso em jogos, por que pra uso profissional o FX arrebenta, andando junto ou perdendo por pouco para um I7 2600k ou 3770K.

O negócio era tão bizarro, que o I7 com HT perdia desempenho e quando desligava o HT a performance subia.

A arquitetura do FX não é ruim, a AMD só apostou em uma tecnologia futurística, onde o uso de muito núcleos é mais importante que poucos núcleos fortes.

Historicamente quando começou aparecer CPU de 2 núcleos, foi justamente que Intel e AMD perceberam que seria mais eficiente dobrar a quantidade de núcleos, ao invés de aumentar a frequência.

A Intel por exemplo tinha planos de lançar um Pentium 4 de 10 GHz rsrs.
 
Exato

Nos consoles a própria arquitetura deles desde a época do Ps3 e 360 já prezava pela divisão de tarefas. O Mantle da AMD trouxe isso pro PC e provocou a Microsoft, graças a isso temos o Vulkan e o Dx12 que prometem fazer
esse trabalho, e fazer tão bem que serão as APIs usadas nos próximos consoles.
Outro fato é que não foi só isso que fez a AMD lançar o FX do jeito que ele é, ela estava tecnologicamente atrasada em relação a 32nm vs 22nm intel e precisava de uma arquitetura que aproximasse ao máximo dos Core I7 em desempenho bruto. O que acredito é que ela subestimou a importância do IPC no mercado de jogos, mercado que ela sempre fez sucesso.
A relação de desempenho do FX é complexa e muitos benchmarks não expõe a real utilização do processador 24/7. Acredito que o Fx tem uma arquitetura muito complexa d ser avaliar através dos benchmarks corriqueiros.
Pelas minhas observações aqui ele tem uma curva de desempenho de acordo com a utilização de núcleos muito incomum. Estou fazendo as contas aqui pra postar os resultados.
Com o uso de todas as threads temos o melhor uso dele absoluto, mas determinar o melhor uso em Triple, Quad, Penta e Hexa-Thread é uma tarefa pra matemático. Ele é totalmente diferente do que se ve classicamente em termos de desempenho de CPU. Até então pelas minhas contas a execução ótima estaciona na utilização de 1,6 núcleos por módulo. Ou seja, a cada 1,6 núcleos usados, passe pra outro módulo. Quando chegar nos 4 módulos 4 x 1,6
ai o programa completa com 04 + 04 + 04 + 04 até a utilização completa. No entanto o sistema operacional não tem esse controle no escalonamento de processos até onde sei (eu acho que não tem) e deve ficar por conta dos programadores fazer essa otimização, inclusive a otimização de instruções. Parece que esse valor de 1,6 é o nível máximo de execução paralela que não provoca queda no IPC do núcleo mais rápido e preserva as característas do uso da Cache, fazendo as duas Threads operarem na máxima velocidade.

Até onde eu li o Win 10 está fazendo bem o uso da arquitetura modular.

Segundo o artigo Win 10 distribui sempre as tarefas para o Core 1, 3, 5 e 7, pois assim permite que cada núcleo use exclusivamente o decoder e a FPU fazendo a performance não ter gargalo dos 2 núcleos dentro do módulo que compartilham o decoder e a FPU.
 
Última edição:
Na verdade os programadores não sabiam ou não queriam escrever nem para o FX é nem para o I7 no passado.

O negócio era tão bizarro, que o I7 com HT perdia desempenho e quando desligava o HT a performance subia.

A arquitetura do FX não é ruim, a AMD só apostou em uma tecnologia futurística, onde o uso de muito núcleos é mais importante que poucos núcleos fortes.

Historicamente quando começou aparecer CPU de 2 núcleos, foi justamente que Intel e AMD perceberam que seria mais eficiente dobrar a quantidade de núcleos, ao invés de aumentar a frequência.

A Intel por exemplo tinha planos de lançar um Pentium 4 de 10 GHz rsrs.
 


Até onde eu li o Win 10 está fazendo bem o uso da arquitetura modular.

Segundo o artigo Win 10 distribui sempre as tarefas para o Core 1, 3, 5 e 7, pois assim permiti que cada núcleo use exclusivamente o decoder e a FPU fazendo a performance não ter gargalo 2 núcleos dentro do módulo compartilha o decoder e a FPU.
Deve estar melhor que o Windows 7, porque no Windows 7 a execução é sequencial (1,2,3,4,5,6,7,8). No Windows 10 sei que há otimização, mas meus testes mostraram que ainda há perda de 9,25% em Quad-Thread.
 
O que eu acho mais estranho desse gráfico é o I3 4330 ganhando de um FX 6300, enquanto um FX 8350 ganhando de um I5 4690K, I5 2500K ganhando de um FX 8150 é algo para se pensar...

PS: FX 8350 realmente deveria ganhar do 4690K.

O I3 está ganhando por 1 fps no fps mínimo, enquanto o FX-6300 está na frente 2 fps no fps máximo.

Mas vale ressaltar que os dois estão no mesmo clock. E o FX-8350 vs I5, o FX tem 500 MHz de mais clock.
 
O I3 está ganhando por 1 fps no fps mínimo, enquanto o FX-6300 está na frente 2 fps no fps máximo.

Mas vale ressaltar que os dois estão no mesmo clock. E o FX-8350 vs I5, o FX tem 500 MHz de mais clock.
Eu não confio muito nestes testes como demonstração real da situação.

No cenário de uso de instruções SSE2 e SSE3 o CineBench r11.5 me parece bastante confiável pra verificar os poderes.
 
Deve estar melhor que o Windows 7, porque no Windows 7 a execução é sequencial (1,2,3,4,5,6,7,8). No Windows 10 sei que há otimização, mas meus testes mostraram que ainda há perda de 9,25% em Quad-Thread.

Creio que essa perda é normal.

Uma vez que o HT ou a banda de memória pode ser o gargalo.
 
Creio que essa perda é normal.

Uma vez que o HT ou a banda de memória pode ser o gargalo.
Não é cara. Ganhei 5 fps entre 30 e 40 em The Crew só com essa brincadeira de desativar o Parking da CPU.
Em Crysis 1 ganhei 3 fps entre 30 e 40 e estabilidade do frame rate. Faz diferença, acredite.
Acredito que essa otimização a Microsoft entregou na mão dos desenvolvedores, pra cada um fazer do jeito que achasse mais conveniente. Em The Crew por exemplo a afinidade não funciona, provavelmente já há uma implementação interna no jogo. Mas o parking do CPU come 10% do frame rate. No Windows 10 parece que eles deixaram o usuário configurar de acordo com o perfil de energia, mas e a galera do Windows 7? acabam dependendo de armengues.
 
Não me esquecendo excelente iniciativa desse tópico.

É ótimo debater com um usuário com conhecimento avançado nas arquiteturas das CPUs. Como isso enriquece o fórum.

Viu dar uma olhada no meu Win 10 pra ver se está em economia de energia ou alto desempenho.
 
  • Curtir
Reações: wmh
O I3 está ganhando por 1 fps no fps mínimo, enquanto o FX-6300 está na frente 2 fps no fps máximo.

Mas vale ressaltar que os dois estão no mesmo clock. E o FX-8350 vs I5, o FX tem 500 MHz de mais clock.

Concordo, apesar de achar que o FX 6300 e FX 8150 deveria ficar a cima, o gráfico dá uma boa impressão do que veremos no DX12.

FX 6300 na frente de I3.
FX 8150 na frente do I5 2500K.
 

Users who are viewing this thread

Voltar
Topo