1 :
Socket774 :
2014/06/14(土) 17:16:18.46 ID:WCLw60kT 劇的に性能をあげてきたx64の先駆者 AMDのギジツリキを語ろう
2 :
Socket774 :2014/06/14(土) 19:55:13.16 ID:cfhu0Rlu
語るネタなし
3 :
Socket774 :2014/06/14(土) 19:56:57.06 ID:nzAl1f1W
10年遅れのスレ
4 :
Socket774 :2014/06/15(日) 18:53:01.19 ID:4G8Rb7Gq
Excavatorを良く見せるために、今までのAPUは性能を落としていた説
5 :
Socket774 :2014/06/16(月) 07:22:54.47 ID:gx10avu/
TDP65W化する関係で動作クロックが下がって CPU性能自体はRichland/Kaveri/Carizzoで変わらない予感
6 :
Socket774 :2014/06/16(月) 07:33:24.53 ID:W5kg1MVn
kaveri改良版に期待。 kじゃなくなる&クロック少し落ちる程度でTDP大きく下がるならよし。 あとは価格も大きく下がれば…… 約1万3000円での提供ならコスパはi5越えるか?
7 :
Socket774 :2014/06/17(火) 01:32:24.82 ID:xo07mNYt
PhenomUの栄光はもうこない
8 :
Socket774 :2014/06/17(火) 20:57:43.62 ID:92L+odcX
2000年 デュアルコアPOWER4 ↓ 2005年はデュアルコア元年!世界初デュアルコアAthlon64 X2! 2003年 クアッドコアPOWER5、1コア2スレッドSMT ↓ 2007年、ついにクアッドコアCPUが登場!Phenom X4! 2010年2月 TurboCoreモードを備えたPOWER7 ↓ 同年 Turbo CORE実装したPhenom II X6 2007年 オーバー5GHz POWER6、1コア4スレッド ↓ 2013年 世界初の5GHz、FX-9590! 2014年 12コア96スレッドPOWER8 ↓ 2016年(AMD時空) 世界初!SMT搭載CPU!なんと!1コアあたり2スレッド処理してしまう!
9 :
,,・´∀`・,,)っ-○○○ :2014/06/17(火) 21:02:33.63 ID:KDLX4szS
2016年はSMT実装によって、AMDも2003年のIBMに追いつくのか、やったね
11 :
,,・´∀`・,,)っ-○○○ :2014/06/19(木) 22:49:32.27 ID:ZTyIw3UP
x86に限定しても2002年のPentium 4(Northwood)が初? 実はWillametteで実装されてたが有効にしてなかっただけという事実も後で判明してるけど
12 :
Socket774 :2014/06/20(金) 17:40:39.17 ID:aJ01syMh
▼cinebenchR11.5 シングルCPU インテル(7年で60%向上) 2013 Haswell 1.76/3.9=0.451 2012 Ivy 1.66/3.9=0.425 2011 Sandy 1.55/3.8=0.407 2010 Arrandale 0.8/2.39=0.334 2009 Lynn 1/2.94=0.340 2008 Penryn 0.93/3=0.310 2006 Conroe 0.86/3=0.286 アムド(7年間で20%しか向上せず笑) 2013 FX 1.1/4=0.275 2006 939 Opteron 0.68/3=0.226
14 :
Socket774 :2014/06/20(金) 23:31:01.10 ID:Tvs5ohAw
>>13 3年ごとに5倍のペースで電力効率を上げれば理論上は可能だね。
可能か不可能かの判断材料として、AMDの過去3年間の性能向上の実績を見ることだ。
AMDがしっかりしないからintelがオリンピック周期で性能10%アップでもシェアを取り続ける
>>15 むしろ伸びしろがあると考えるべきだろう。
……まあそれでもいつもの「HSAコミ」ってやつだと思うが。
18 :
Socket774 :2014/06/21(土) 10:11:33.77 ID:15yzK1hp
8350の登場によって、8150がもっさりした
____________ ヾミ || || || || || || || ,l,,l,,l 川〃彡| V~~''-山┴''''""~ ヾニニ彡| 25倍の電力効率を実現する・・・・・・! / 二ー―''二 ヾニニ┤ 実現するが・・・ <'-.,  ̄ ̄ _,,,..-‐、 〉ニニ| 今回 まだ ベースとなるプロセッサの /"''-ニ,‐l l`__ニ-‐'''""` /ニ二| 指定まではしていない | ===、! `=====、 l =lべ=| . | `ー゚‐'/ `ー‐゚―' l.=lへ|~| そのことを |`ー‐/ `ー―― H<,〉|=| どうか諸君らも | / 、 l|__ノー| 思い出していただきたい . | /`ー ~ ′ \ .|ヾ.ニ|ヽ |l 下王l王l王l王lヲ| | ヾ_,| \ つまり・・・・ . | ≡ | `l \__ 我々がその気になれば !、 _,,..-'′ /l | ~''' FX-9590(TDP220W)の単精度300GFLOPSを ‐''" ̄| `iー-..,,,_,,,,,....-‐'''" / | | 9WのAPUで実現するということも -―| |\ / | | 可能だろう・・・・・・・・・・ということ・・・・! | | \ / | |
21 :
Socket774 :2014/06/25(水) 00:47:40.43 ID:Sy84P8Xh
>>8 FXは定格5GHzじゃないから、まだ追いついていない
消費電力そのままに発熱を抑える超技術! AMDハジマッタ!
なにこの消費電力詐欺w
35 :
Socket774 :2014/07/31(木) 09:32:48.02 ID:PIUkKNu9
A10-7850K vs セレロン まとめ 【PSO2 1080p 設定5】 A10-7850K → 1,218 G1840 + GTX750 → 17,111 【MHF 720p】 A10-7850K → 4,907 G1840 + GTX750 → 17,175 【BF4 射撃場 1080p 最高設定】 A10-7850K → 16fps G1820 + GTX750 → 56fps 【FF14 1080p 最高】 A10-7850K → 1,996 G1840 + GTX750 → 7,223 【消費電力】 A10-7850K → 143W G1840 + GTX750 → 97W 【価格】 A10-7850K → 19,086円 G1840 + GTX750 → 16,526円 / ̄ ̄ ̄\ | | おー、セレロンにボロ負けじゃー | | _ おそろしやー、おそろしやー | ^ ^ ) ///ト、 ( >ノ(_)Y ////)| 南無アムド無駄物 ∧丶 i-=ニ=|| || /\\\  ̄ノ.| ノノ / \\ ̄ ./ / |
G1820 VS Athlon5150(おまけ7850K) 【Hyperパイ】 G1820 → 14.150秒 Athlon5150 → 39.627秒 A10-7850K → 18.829秒 【CINEBENCH R11.5】 G1820 → 2.30 Athlon5150 → 1.48 A10-7850K → 3.53 【大討伐】 G1820 → 2,523 Athlon5150 → 1,605 A10-7850K → 4,438 【新生FFXIV】 G1820 → 4,044 Athlon5150 → 2,264 A10-7850K → 5,687 【消費電力アイドル】 G1820 → 18.3W Athlon5150 → 24W A10-7850K → 49W 【消費電力高負荷】 G1820 → 65.2W Athlon5150 → 50W A10-7850K → 143W 【価格】 G1820 → 4,480円 Athlon5150 → 5,250円 A10-7850K → 21,280円 _____ / ̄.....//.... θ ̄> ∠|::::::::::::::U:: τ ::::::< ⊂二|::::::::::::::::::::::::::θ_>  ̄∠/ ̄ ̄ 新athlonダメポ
A10-7850K vs セレロン まとめ 【PSO2 1080p 設定5】 A10-7850K → 1,218 G1820 + GTX750 → 16,610 【MHF 720p】 A10-7850K → 4,907 G1840 + GTX750 → 17,175 【BF4 射撃場 1080p 最高設定】 A10-7850K → 16fps G1820 + GTX750 → 56fps 【FF14 1080p 最高】 A10-7850K → 1,996 G1820 + GTX750 → 7,032 【消費電力】 A10-7850K → 143W G1840 + GTX750 → 97W 【価格】 A10-7850K → 19,086円 G1840 + GTX750 → 16,526円 ____ / \ / / \\ これはひどいw / ⌒ ⌒ \ | ,ノ(、_, )ヽ | \ トェェェイ / / _ ヽニソ, く
>>38 読みにくいデザインだな
読ませる気あるんかよ?
>>43 ある意味古臭いデザインだが、結構わかりやすく、
この人の自説ではあるが踏み込んだ内容もある。
更新終了するまで良サイトとされていた。
まあウェブデザインも進歩するから。
文字主体のコンテンツなのに 透過でザラザラ背景とか 古臭いのレベルでないだろ
47 :
Socket774 :2014/08/15(金) 17:46:15.26 ID:/F/ERFNn
スタックドDRAM付きAPUさえ出ればL3キャッシュがなくL2キャッシュが4MBクラスのAPUでもかつる!
A10-7850K vs セレロン まとめ 【PSO2 1080p 設定5】 A10-7850K → 1,218 G1840 + GTX750 → 17,111 【MHF 720p】 A10-7850K → 4,907 G1840 + GTX750 → 17,175 【BF4 射撃場 1080p 最高設定】 A10-7850K → 16fps G1820 + GTX750 → 56fps 【FF14 1080p 最高】 A10-7850K → 1,996 G1840 + GTX750 → 7,223 【消費電力】 A10-7850K → 143W G1840 + GTX750 → 97W 【価格】 A10-7850K → 19,086円 G1840 + GTX750 → 16,526円 / ̄ ̄ ̄\ | | おー、セレロンにボロ負けじゃー | | _ おそろしやー、おそろしやー | ^ ^ ) ///ト、 ( >ノ(_)Y ////)| 南無アムド無駄物 ∧丶 i-=ニ=|| || /\\\  ̄ノ.| ノノ / \\ ̄ ./ / |
28nm -> 14nmで倍のトランジスタを使えるようになると仮定するするなら (Jaguarを)3way化と高クロック化(3GHz以上)にしても今のJaguarと同じ大きさになるだろうし Jaguarと同じということはKaveriと同じ大きさで8コア+1024spを搭載することも可能。 性能はIPCも上がるし、今(Kaveri)の仮想4コアからリアル8コアへと増えることにより (ベンチとエンコは)今の4コアi7に並ぶことも可能だと考える。 *6/8コアXenonには>46のFXで対抗
つまりバラ色である。
>>49 ふと思ったんだが、14nmができる2016年にはIntelは10nm行ってるんじゃね?
8コアBroadwellどころじゃないでしょ。もっとリッチで高IPCなコアを
8コア積める。
まあ新コアに期待するしかないね。
高IPCコアも多コア化してる今、さらなる多コア化が正解か疑問が残る。
だからこそリッチコアvsミドルコアは楽しみではある
アーキテクチャ末期のモデルナンバーのフカシ数字が心配 数字が足らなくなりそう
Phenomも(デスク向け)FXも9000番台までいっちゃったしね。
◎ モデルナンバー限界突破スフィア
☆ 社内のリソースを全てFXへスフィア
RadeonはHD8000までだったね FXは8550とかになるのかな...?それともFXIIみたいな感じかな たのしみじゃ
FX-Black 8390FX Black Edition XE
Mobile向けのCarrizoはオンダイの積層メモリは搭載せず、対応するメインメモリもDDR3までにとどまる
2015年のデスクトップ向けAPUはKaveri Refresh
AMD Kaveri Refresh Coming 2015 and Carrizo APU to be Mobile Only For Now
http://wccftech.com/amd-kaveri-refresh-coming-2015-carrizo-apu-mobile/ ・AMD's FM3+ Socket in 2016.
・New Post Bulldozer/SMT Architecture in 2016.
・No DDR4 Support in Desktop Processors till 2016.
・Kaveri Refresh in 2015 (Better Revision and Higher Clocks)
・Carrizo Notebook in 2015
ダメだコリア
2015年はノートがついにDDR3採用! デスクトップもKaveriだからDDR3 Intelは2015年に入っても、まだDDR4のまま これからはDDR3の時代! 2015年はDDR3元年!
63 :
Socket774 :2014/08/27(水) 23:12:40.43 ID:RRtz8d1N
>>62 DDR3が高いのはまだ発売されたばかりだからなんだな!
しかし今、ジム・ケラーはARMアーキテクチャは効率がよいとお気に入り。
AVXの拡張とかで、他社の仕様にすり合わせなくてラクとか。
<特上> 4wayデコーダー&4実行パイプのSMTビックコア <ななめ上> steamrollerの整数部分を4実行化してSMTで共有 <上> Jaguar世代を3wayに拡張 <中> 思いつかん。2wayのまま統合RS化とか?
ARMのA57ってなにげに3wayデコーダーなんか。
HSA環境だと高品質で10倍速みたいなグラフィックスライブラリとか無いかな? JPEGとPNGの圧縮・展開、補完付きリサイズあたりが速くなるとうれしいな もちろんマルチスレッド対応
なんでやねん
76 :
Socket774 :2014/09/07(日) 17:13:49.97 ID:rAZHaApK
ID:dC/+eXPO
誤爆しただけなのになぜ・・
ぽっくんもID:dC/+eXPOの真似をして、誤爆したふりしてアフィサイト貼るね!
バレてたか・・。 外付けHDDでトラブったとき、唯一マトモに動いたアプリだからメモ替わりに書いたんだ。 窓の社もアフィサイトなのは知らなかったから、次からは公式も併記しとく。
16コア5GHz Opteronでも勝てんな
爆熱は芸風だから良いんだよ IPCが上がらんのがいかん
> 1,920×1,080ドット時にはCore i7-4790Kのスコアを上回っている。このようにマルチスレッドへの最適化が進んでいるゲームであれば、 > Intel最速の4コア8スレッドCPUを逆転できる可能性はあるようだ。
1920x1080の時には
FX-8370Eが25.518で4790Kが25.220だから
1.1%勝ってるように見える
2560x1440の時には
FX-8370Eは16.757で4790Kが16.985だから
1.4%負けてることになる
こういうのを
>>85 みたいにいうのはどうなんだろうな
AMDから金でも積まれてるんだろうか
性能がでるのか、売れるかは知らんが、 日本のジサカー界隈ではZenでXenを使うというネタが出てくると予言しておく。
>>89 なぜかXsanスレ思い出したわ
チャオズ「て、Xsan!ボクの超能力が効かないっ!」ってスレタイの
91 :
Socket774 :2014/09/16(火) 15:25:12.62 ID:FC2FqTA6
保守
93 :
Socket774 :2014/09/16(火) 19:39:30.16 ID:0Doymbqc
ブルのAVXはPen4時代のSSE2と同じ
Bullは2スレッド実行できる1コアだと思い込むことにしてるから無問題。 問題はIntelの方でSSEから演算器を倍加してるにも関わらず1.2msしか短縮できていない。 それってリターンとしてどう?って話。
95 :
Socket774 :2014/09/16(火) 22:08:38.70 ID:0Doymbqc
まず拡張してからの最適化だろ Core2の1サイクルSSE2と同じ AVX-512についてこれるかな
>>94 256bit SIMDによって高速化される部分が全体の処理のどれぐらいの割合を占めているか
という単純なお話
マルチコア化の際のアムダールの法則と同じだ
むしろ心配すべきはSIMDなし->あり(SSE2)という全く同じ条件において
>4770KはSIMD化によって高い効果が得られるものの(x2.7倍速)、7850Kのほうはいまいち(x1.5倍速)。
じゃないの?128bit命令のスループットは両者とも同じで、ここで差が付いているということは
AMDのコアはかなり効率が悪いということ。
AVXデッカチのINTELと、GPUデッカチのAMD 実は方向性は一緒
>>96 FPUのレイテンシが一回り大きくなってるって団子にイジられてたと思う。
ま、今のBulldozer familyはね・・
>>96 Haswellがコアあたり2×256bitで4コア、
7850kがモジュールあたり2×128ビットで2モジュール、
128bitSIMDのクロックあたりスループットが同じだとすると
それぞれクロックどのくらいなんだ?
間違えた。クロックあたりじゃないな。 128bitSIMDのスループットが同じだとすると それぞれクロックどのくらいなんだ?
同じ4.4GHz揃えだけど、そういう話じゃない?
>>101 同じクロックだったらクロックあたり128bitSIMDを
Haswellが8、Kaveriが4でスループットが同じになるわけがないと思うのだが。
どうも
>>96 とは考え方が違うのかね?
>Haswellが8、Kaveriが4 どういう計算だ? SIMD fp add/mulを発行できるパイプはどっちも2本 256bitの演算器になったからといって 1つの演算器で128bit命令が2個同時に処理できるわけじゃないからね?
>>103 じゃあSIMD演算器の本数をコアごとに計算してみようか。
Kaveriはモジュールあたり128bitが2本なので1コアあたり1本だよな?
Haswellは1コアあたり何本の256bitSIMDがあるんだ?
>>104 いやだから絶対性能の話をしてるんじゃなくて
SIMD(SSE2)を使わない時->使う時の向上率の話をしてるんだけど。
Haswellは2オペレーション/クロック/コア->8オペレーション/クロック/コア
Kaveriは2オペレーション/クロック/モジュール->8オペレーション/クロック/モジュール
どちらもSSE2使用によるスループットの向上率は4倍だが性能向上率はHaswellの方が遥かに高い
オペレーションてのは単精度のFLOPと読み替えてくれて構わない
>>105 SIMD使ったらSIMD演算器が2倍(256bitも使えば4倍)あるIntelの方が
向上率高くて当然だと思うのだが。
何を持ってAMDの方が不利な条件で非効率だと言ってるのか教えて欲しいね。
>>107 だからー
SSE2命令だけしか使わなければ256bitの演算器は動かないでしょ
算数の授業が必要か? もともと 4こ (2こ x 2モジュール) の演算器が使えた7850Kくんは SSE2によって 16こ (2こ x 4並列 x 2モジュール) の演算器がつかえるようになりました もともと 8こ (2こ x 4コア) の演算器が使えた4770Kくんは SSE2によって 32こ (2こ x 4並列 x 4コア) の演算器がつかえるようになりました どちらのほうがもともとの性能からの向上率が高そうですか?
>>108 256bitの演算器が動かなければHaswellで128bitSIMDが動かせるわけなかろう。
256bitの演算器が半分の128bitとして動作するんだよ。
もうめんどくさいので
>>92 のリンク先をみてくれ。
Haswellは1コアあたり2つの256bit演算器があるって書いてあるだろ。
で、4コア×2で8個の256bit演算器だからKaveriよりスループットは上。
>>110 だからSSE2命令しか使わなければ256bitのうち128bit分しか使われないで半分は遊ぶんだよ
スループットの絶対値じゃなくてスループットの向上率の話をしてると言ってるのに何度言えば分かるの?
っていうか
>>109 の計算みてわかったが、ハイパースレッディングを計算に入れてるのか。
動画処理のベンチでそんな計算する奴初めて見た。
それじゃあそもそもHaswellのOriginalの数字が悪すぎるだろ。8コアなのに。
仮想コアで分母が低くでてるんだよ。
何を言ってるのかさっぱり分からん 2こ x 4コア てのはコアあたり浮動小数点演算命令を受け付けるパイプが2つという意味であって SMTとか全く関係ない
>>113 性能向上率って言ったらSMTですべて処理する場合の性能が分母、
CPUから物理SIMD演算器に処理を投げる場合の性能が分子になるので、
SMTが関係ないわけがない。分子よりも分母を低下させている。
関係ないとしたらHaswellのSIMD演算器はキックするCPUの性能が足りずに遊んでいる。
SMTの性能向上率の話なんてしてない (SMTを使って)SSE2を使わずに全コア動かした場合 (SMTを使って)SSE2を使って全コア動かした場合 の比較だ そもそもSMTで理論性能のピークは変わらん
何か自分勝手な前提をどんどん付け足して妄想を膨らませてる感じなんだけど 日本語が通じない人なのかなあ...
>>115 ,116
じゃあいいよ。AMDの効率低いってことにしておけばいいじゃん。
SMTによる性能向上なんて一言も言ってないが、一応こちらの主張は説明しておく。
SMTは仮想2コアなので物理2コアに比べて性能低下が起こる。
SIMD演算器は物理的に実装されてるので、SMTによる性能低下の影響は、
CPUによる処理時>SIMD使用時
になる。これは性能向上率の分母と分子の関係なので、SIMDによる性能向上率は
Haswellの方が高くなる。
朝までに再度書き込むかもしれないけど、やんなきゃいけないことあるんで一時的に落ちる。
何というかものすごいトンデモ理解ですね HaswellもKaveriもスカラFPUとSIMDは2スレッドで共有されているので SMTの影響は同じように受ける 117の脳内ではスカラ演算器は4コア分しか無いがSIMD演算器は8スレッド分用意されている という設定なのだろうか?
>>118 ちょっとwwww
やっぱ君
>>92 読みなおしてきなよ。HaswellのSIMD演算器は
256bitがコアあたり2個(都合8個)だってちゃんと書いてあるよ。
(Intel公式の情報がちとみつからなかったが、ベンチなどから正しいと思う。)
そもそもSMTとモジュール構造とじゃ性能に与える影響も違うし。
>>119 だから117で言う「CPUによる処理」をするための演算器も同じように
コアあたり2個(都合8個)あるんだけど?
SIMDなしでもありでも8個が4コア分だよ
>>122 そりゃFPUの事しか考えてないだろ。FPUが処理してる間ALUはあそんでるのかよ。
というかHaswellが9.4秒かかる処理をKaveriが15秒でできてるのなら
論理コア数に対して性能がスケールしてないって確証みたいなもんだ。
何が言いたいのか分からんが SIMDを使おうが使うまいが浮動小数点演算を行うユニットはコアあたり2個(都合8個) コア数に対する性能のスケールの話じゃなくて SIMDオフ/オンでの性能のスケールの話をしてるんだけど?
SIMDオフ、オンでのスケールならHaswellのOriginalの処理が異常に遅いのがなおさら問題なんじゃね? 8コアなのに。 都合の悪い事には目をつぶりますかね。
8コアじゃなくて4コア8スレッド 何をもって異様に遅いとしているのかが分からんが 当たり前だがアムダールの法則でコア数が増えるほど性能向上は緩やかになるからね
まともなバイナリで動画処理する場合は4コア以上でもかなりスケールする。
古いバイナリは3〜4で頭打ちだったが。
>>92 を改めて見なおしてみると、グラフのグレーの部分が
HaswellのOriginalのものだけ比率的に大きい。
ブログ主の説明だと整数部と浮動小数点部が両方必要なようなので、
整数ユニット共有によってスケールしていないというのが
一つの説明としてありえそうだ。
よく読むと書いてあるもんだね。
逆でしょ Kaveriは整数演算はスカラだとコアごとに演算器があるけど SIMD化すると浮動小数点/SIMDクラスタに移って2コアで演算器を共有するようになるから HaswellほどSIMD化の恩恵を受けない
>>128 それはHaswellが8コア(
>>109 あたりを参照に論理コア数で行く)であるにもかかわらず、
Kaveriに対してコア数なりのアドバンテージを持ててない事の説明にはならないよね。
単に、以前からのAMDのコアは不利だという説明を繰り返しただけだよね。
だから誰もコア数なりのアドバンテージなんて主張してないんだけど SIMDオンオフでどれだけ性能が向上するかという話しかしてない でもって未だ109がSMTでx2されてると勘違いしてるわけ?
>>130 じゃあアドバンテージが得られない事には目をつぶろう。
それでKaveriがSIMD使った場合には1.5倍にしかならないけど
Haswellなら2.7倍になるっていうのは意味がない数字になるけど。
意味が無い主張のために意味がない議論をしましたね、と。
132 :
Socket774 :2014/09/17(水) 08:13:11.56 ID:Ow3mPcoS
なお、AMDユーザーによれば、HTTとSMTは別物である AMDの次世代アーキテクチャCPUは世界初のSMT搭載CPUになる予定である
▼cinebenchR11.5 シングルCPU インテル(7年で60%向上) 2013 Haswell 1.76/3.9=0.451 2012 Ivy 1.66/3.9=0.425 2011 Sandy 1.55/3.8=0.407 2010 Arrandale 0.8/2.39=0.334 2009 Lynn 1/2.94=0.340 2008 Penryn 0.93/3=0.310 2006 Conroe 0.86/3=0.286 アムド(7年間で20%しか向上せず笑) 2013 FX 1.1/4=0.275 2006 939 Opteron 0.68/3=0.226 ( ゚д゚)
う〜ん、よく分からん。 結論としては「i7の非SIMD処理は遅すぎ」でおk?
オリジナル版はSIMDは一切行われていない事となんか関係ありそう?
>>134 AMDと比べりゃむしろ速いけど、SIMD使ったら2.7倍って数字には疑問が残る。
それを元にコアの効率云々は言えない。
というか、Original版ってSIMD使われてないのかね?
ほとんど浮動小数点演算だという事だが、一部MMXとかいうことはないのかね。
まあMMX専用ユニットなくなったはずなのでこれはKaveriもHaswellも同じ条件。
散々無知を晒した挙句に疑問が残るって...
>>137 今日の自分みたいな生活サイクルで生活してる奴他にいないと思ってたわ。
というか、違うと思うなら分母云々に関しても反論してくれ。
モダンなCPUコアには他にも性能に影響する要素があると思うが、
性能向上率の差がAMDのコアの低効率に由来する事を証明してくれ。
さんざん説明してるのに変な妄想を持ち込んで理解しようとしないだけでしょ Kaveri,Haswellそれぞれについて SIMDを使わない場合の理論FLOPS値を分母、SIMDを(SSE2まで)使った場合の理論FLOPS値を分子として 自分で理論上の性能向上限界値を計算してみな SMTは実効値を理論値に近づける効果はあっても、理論値を上げる効果はないからな
>>139 単精度浮動小数点だけならそれぞれ理論向上率は4倍だね。
Originalの処理内容はどうかしらないが。
>>141 大本の話とは関係ないが、AMDは256bit化へのモチベーション薄そうな気がするね。
K12とZENが姉妹コアだとすると、NEONの方が256bit化しないと。
さりとて128bit×4とか……
とりあえず4770Kは8コアとか言ってるID:Kc8yNRh7は 脳みそが熱で溶けて腐ってるってことでおk?
このレベルのAMDキチだと相手にしちゃいけないレベル
信者「SIMDをHaswell Core i7と同じだけ持ってるKaveriの処理速度は理論上イコール!」 一般アムダー「信者理論マジパネェっす」 こういうこと?
▼cinebenchR11.5 シングルCPU インテル(7年で60%向上) 2013 Haswell 1.76/3.9=0.451 2012 Ivy 1.66/3.9=0.425 2011 Sandy 1.55/3.8=0.407 2010 Arrandale 0.8/2.39=0.334 2009 Lynn 1/2.94=0.340 2008 Penryn 0.93/3=0.310 2006 Conroe 0.86/3=0.286 アムド(7年間で20%しか向上せず笑) 2013 FX 1.1/4=0.275 2006 939 Opteron 0.68/3=0.226 ((((;゚Д゚)))))))
149 :
Socket774 :2014/09/18(木) 08:33:50.51 ID:k77d135V
>>147 SIMDは性能も数もHaswell i7の方が上だからそんな事言うのは信者でもなくただの馬鹿。
※ただし、ノート用の2コアのi7を除く
AMD『SIMDとGPUの演算性能の合計はKaveriとHaswell i7で同じくらい。だからKaveriはi7並!』
そうか、それはスマンかった。 エンコの話なのにSIMD無しって想像できなかったから
書くとこ間違えた
29 :,,・´∀`・,,)っ-○○○:2011/04/14(木) 12:15:12.08 Pentium4でHTを使うとトータルスループットが落ちる原因ってL1キャッシュミスでそ。 8KBとか16KBの小さいキャッシュを更に共有するとか、おかしいこと山の如し。 BulldozerはL1独立なのでL1容量がネックになるコードは性能が落ちるというより 最初から遅いと思う。1スレッドだけ走らせたからってL1Dが32KBとしてして使えるわけじゃ無しに 最初から16KB固定割り当てだしね。 ただし、2コア同時にキャッシュミス or prefetchしたらL2の帯域大丈夫かしら?ってのはある。 HPC版と銘打ったNehalem-EXの6コア・2.66GHz版は最初からHTは無効にしてある。 一方BulldozerのSIMD命令はレイテンシが大きすぎるので2スレッド使わないと埋まらない気がする。
10Socket774 [sage] 2013/01/18(金) 01:19:18.38 ID:C3wIcvo9
ささやかな燃料投下。?
AMD社員の「Bulldozerは悪くないもんソフトが悪いんだもん」?
という言い訳に説得力を与えてみようとするテスト。?
ttp://www1.axfc.net/uploader/so/2758887.png? 図中の「4C8T」はIntel 4コア(HT)、「8C8T」は8コアBulldozer。?
1〜8個のスレッドを目一杯ぶん回した時に、?
CPU全体のピーク性能のうち何%使いきれるかをグラフにしてみた。?
4スレッドまでは凄い勢いで離されて、8スレッドで追いつく。?
仮にピーク性能が同じだったとして、BulldozerはFPが弱かったりとか?
特性の違いもあるし、この通りの結果にはならないかも知れないけど、?
「Ivy Bridgeの半分しか性能出ないよ」みたいな話は、?
そもそも8スレッドにちゃんと最適化されてるのか疑問。?
ちゃんとマルチスレッドに最適化したソフトならIntelに負けず劣らず速いBulldozer、?
何も考えないで適当に作ったソフトでも性能が出るIntelという印象。
22Socket774 [sage] 2013/01/18(金) 19:40:50.78 ID:C3wIcvo9
>>17 ?
むしろ
>>10 の話になるけど、同じ事書いてる奴いた?
http://scalibq.wordpress.com/2012/02/14/the-myth-of-cmt-cluster-based-multithreading/? ベンチマークも(この場合対照のIntelは6コアだけど)まさにその通りの傾向を示してるっぽい?
http://openbenchmarking.org/result/1110201-AR-BULLSCALI82? CMTとSMTどっちがいいとか、CMTをやめてSMTにすべきという話じゃなくてさ、?
・SMTとCMTを同格で対比するならSMTの性能上の対照はCMT2コア(=1モジュール)じゃん?
・でもCMTって要はFPUを共有する性能削った2コアを並べる事と等価だよね?
・じゃあ8コアCMTってシングルスレッド性能が低い4コアSMTとほぼ同義じゃん?
・どうせならCMTの1コアをSMT化すればピーク性能稼げるのに?
・要は「K10をSMT化してFPU半分こ」みたいな構成のもの作ったほうがよかったんじゃね??
っていう話。うざかったらすまん。どうでもいい与太話ってことで。
29 名前:,,・´∀`・,,)っ-○○○[] 投稿日:2014/05/14(水) 23:28:04.67 ID:/Flgj8qu 性能は単純な演算ユニットの数で決まるわけじゃないから 一概にはいえない。 ただいえることは プログラムは同じ調子で休みなく演算ユニットを動かせるわけではなく キャッシュミスや依存関係でしょっちゅう止まったり詰まったりを 繰り返してるので、ピークのみにフォーカスしたアーキは必ずしも 効率がよくないということ。 Phenomは最大3つのALUを同時に使えるけど、必ずいつも 使えるわけじゃない。 Bulldozerは1スレッドあたりが使える整数演算ユニットを2つに制限した。 もちろん2個に削った分は、ピーク時の性能が制限される。 これが正しいのかは、結局はベストケースとワーストケースの バランス加減なんだよね。 ワーストケースではそれこそキャッシュミスなどで完全に止まる。 じゃあ止まったときって演算ユニット空いてるけど、 その間にほかのスレッド実行できたら効率いいよね? Intelはそれをやってて、Bulldozerはやってない。 常に各スレッド専用に2つのALUを割り当てている。 Bulldozerはベストケース(=1スレッド内で3命令同時に動かせる)を 捨ててるように見えて実は別のベストケースに依存している。 それは、全スレッドが停止せずに動くという、かなり厳しい前提だ。
なぜこういうレスを貼ったかというと CMTをやめる次期コアでは大幅な性能向上がはたせそうってこと。
AMDの次世代アーキテクチャは世界初のSMT搭載CPUらしいな
断言しますが違います。 世界初のSMT搭載APUです。
■AMD製品の欠陥内蔵温度計問題まとめ ・計測が不正確で狂っており実態からかけ離れた30度以上低い値となる為熱暴走になりやすい。 ・温度計がたったのひとつしか無い為コア毎の温度がまったく判らず信頼性が皆無。 ・AMD製CPU(x2/x3/x4/x6/4m8t)の全てに問題が有る。 ・がっかりブル土下座、室温28度でコア温度13.4度w 室温以下の低温を実現! ・温度監視ソフトを複数起動していると0℃に ・特定1コアにスレッド指定して負荷かけても1箇所しか計測できないので全コアが同じ温度を示す(時間差で割振りして複数に見せかけてるだけ笑) ←new ( ゚д゚)
Core is Back 2014!に期待
なんだかんだで性能は実行パイプに依存するみたいだから(実行パイプがスレッドあたり2本のBullとBobのIPCがほぼ同じ) だから実行パイプを3本か4本ぐらいに増やすだけでIntelと互角でやりあえるは
そう簡単に増やせるならとっくにやってる
簡単でしょ zenではクラスタード・アーキテクチャを止めるし
実行パイプラインを増やしただけでは性能は上がらないんだが。 インテルと同じ4本に増やした所で2倍の差が1.4倍になるのがせいぜいだね。
>>173 それは当然だけど、bob系よりリッチな機構を積んでいるのにbobのIPCと同程度。
つまり実行パイプが足を引っ張ってると考えたほうが自然じゃない?
一応i5/i7対抗はFXなんだから倍も差はないし
というか、スケジュールとか分岐予測の問題なら3パイプまでは旧Stars系の時にやってる。 リニアに3パイプで1.5倍とかはならないだろうけど、どのみち今のBobcat系は頭打ち。
手前で作ったx64の命令デコードがネックになって後段をリッチにしても性能が出ないというのが現状だろう。 Intelはデコードした命令をトレースキャッシュに入れて対策しているけどトランジスタ効率が悪くなるからAMDとしてはやりたくない。 ILP向上が壁にぶち当たっているからこそマルチコアさらにヘテロジニアスマルチコアとしてのAPUをやっているのがここ数年なのだが、それを使いこなすためのソフトウェア開発ができなくて宝の持ち腐れというか潜在能力を発揮できない状態が続いている。 IntelもAtomやXeon phiでやってることは同じだが利益度外視で処分するしかない程に成果が出せないからCore MAが主力の状態から抜け出せない。
>>175 k10のときは分散RSでBullは統合RSらしい。
だからBullはAGUが減ってもパフォーマンスは下がってないかも・・って盛り上がった時もあったんだけどな。
amazonで一部ゲームのサントラが特価販売されてるよ。 ICOとかワンダの巨像とかが390円から。 静穏Athlonで堪能すべし
お このスレにコピペしてくれたんか ありがとう!
188 :
Socket774 :2015/01/21(水) 15:24:06.33 ID:M8iJJHNs
2000年 デュアルコアPOWER4 ↓ 2005年はデュアルコア元年!世界初デュアルコアAthlon64 X2! 2003年 クアッドコアPOWER5、1コア2スレッドSMT ↓ 2007年、ついにクアッドコアCPUが登場!Phenom X4! 2010年2月 TurboCoreモードを備えたPOWER7、1コアあたり4スレッドSMT ↓ 同年 Turbo CORE実装したPhenom II X6 2007年 オーバー5GHz POWER6 ↓ 2013年 世界初の5GHz、FX-9590!(本当は4.7GHz) 2014年 12コア96スレッドSMT、POWER8 ↓ 2016年(AMD時空) 世界初!SMT搭載CPU!なんと!1コアあたり2スレッド処理してしまう!これからはSMTの時代!Intelも後を追ってくるかな?
人質の二倍の赤字かよ終わってるな
なにそれ怖い
>>193 なんで向こうのスレでほぼスルーなのか疑問だな。
8コア以上との事だが、Broadwellもデスクトップ向け8コアが出ているので
この記事だけではまだどの程度のリッチコアなのかよくわからんな。
>>196 そのダイは2コアだからでしょ。8コア版はGPUなくダイを使いきれている。
むしろZenとラデでそのIntelと同じような構成を作るのがAMDの最前手で
Haswell並の高IPC志向にするべきだが、猫系改良とする説もまだ根強い。
次世代据置ゲーム機の技術デモを兼ねるつもりなら猫系改良は正しいんじゃね
検索しても4コア以上のダイ写真が出てこなかったお。 でも6割以上GPUに割り振らなきゃいけないのは、確かにAPUのアキレス腱だね(8コア載せるとしたら)。 もっともx265に関しては今のフル4Mでも意外と対抗できてるから、熱以外は心配してなかったりする。 さすがに14nmでも2コアSMT+GPUだったら耐えられないけど。
>>198 むしろ疑問なんだが、なんでゲームは8コア8スレを使い切ってるのか。
性能を出すために8スレ使うようにプログラミングしているという事なら、
逆にSMT対応に最適化してくれればリッチコア路線でも性能が出せればいい。
逆にスレッド数多ければ多いほどいいなら猫系継続が正しいともなりそうだが。
>>199 Broadwellは2コアが標準で、8コアはHaswell-Eっぽいね。
となると14nm8コアはGPU載せる余裕あるんだろうか。
202 :
,,・´∀`・,,)っ-○○○ :2015/01/27(火) 21:52:38.21 ID:bt23XFwe
Broadwellは最初の製品がCore Mだからでしょ 4コアは後から出るよ
>>200 据置はインストールベースの多さとフラットなハードウェア構成であるということ
ソフトがCPUをどれだけ使ってもコア数課金はないってトコロでしょうな
PCゲームはてんでバラバラのハードウェア構成とドライバにOSにメモリサイズに
ほとんど海賊版ともうメチャクチャでしょ
ゲームソフトでコア数課金やってるタイトルなんてないだろ まさかSQLServerやOracleがゲームタイトルだと思ってたか?
コイツは本当に頭悪いな 何コア使っても課金はないからソフトでマシンの最大性能を引き出そうとするインセンティブが働くって書いたんだよ いちいち説明したくないからあっちいけよ
> 何コア使っても課金はないから 頭悪いね君 逆にPCゲームにはコア課金があるとでも思ってるの? なに?使うコア数によってMicrosoftから徴収されちゃうの?なにそれ怖い
コテハン気取りのザコがしつこく絡んでくるねえ いい?ゲームの開発会社は店子つまりある意味ゲーム会社にとってお客さんなんだよ その連中にとってはゲーム機の性能をどれだけ使い倒そうが なんらのロイヤリティの上乗せはないの だからあるものは遠慮せずすべて使いましょうということになる 8コアに最適化するのはそういう論理 PC業界でGPGPUに対応したアプリの受けが良いのも同じこと CPUコア数による廃課金を回避してよい性能のアプリを安価に入手できるチャンスがあるということだ どの分野のソフトでもその機会があるワケじゃねえけどな つぅか何コアあろうが海賊版しかないPCゲーム()にビジネスチャンスなんてねえよ ソフト会社にお情けで出してもらってるだけ
PCゲームにコア課金があってコンシューマ機には無いっていうならてめえの言う通りだが そもそもWindowsのゲームにはコア課金どころかMSへのロイヤリティの支払い自体が 存在しないのだが?(Windowsストアアプリを除く) 知ったかぶりは恥をかきますよ
そもPCゲーム()に全力投球したソフトハウスは傾いてるだろ 現実見ろよ 汎用PC上のゲームの悲惨なところは割ろうが何しようが正規品じゃないゲームが動いちまうこと こういうカスい仕様は据置では一掃されている
いかにPCがハードのパワーを誇ったところで遊びたいゲームがなければ意味がない それすらムーアの法則の行き詰まりで暗雲漂う昨今だがw
手癖の悪いPCユーザーが多いから自業自得ではある そもそもPCゲーマーの多くは害人だしな LoLみたいにイベントやスポンサードで儲ければいいんじゃね? 日本みたいに引きこもってシコシコとゲームをやるキモヲタばかりだと望み薄だがw
>>203-209 同じ事を天丼よろしく重ねて主張して議論になるとかお前ら基地外かと。
まあきっかけ作った俺がいう事じゃないが。
そもそもスーパーバイザが1コア予約してるはずなのにどうして8コア全部使えるんですか?
知らんよそんなもん 自作PC板では板違いだろ
8コア全部ってのがお前の妄想だから 「ユーザーランドで使えるコア全部」なら正解
14.細かい部分のミスを指摘し相手を無知と認識させる これか まぁゲスコテのお前らしい反論だな
基本無料のオンラインゲーム・ブラウザゲームはほぼPC専用ですし SteamではWorkshopでユーザーがMODを共有する文化が育っていますな インディーズタイトルもたくさんあるし、これはコンシューマ機では見られない現象。
>>200 SMTはSMTでスレッドの管理がSMTなしより大変らしいけど
流れたプランではsteamrollerを考えてたらしいから特にこだわりはないと思う。
ゲーム・ソフト開発元は「ゲーム機」だから必死に最適化を進めるだけじゃなかろうか
で、最適化するならリッチなコアのほうがよさそうだけど。
ネトゲで死亡は韓国が起源ニダ 折角パチョコン自慢できるPCゲーなのにブラゲならAPUでも十分な性能しか要求されねえのにな
グラボ無しのi3ノートで余裕です
>>210 steam知らないのかお前
よほど昔のゲームならともかく、steamゲーは認証しないと出来ないし、出来たとしてもばれたらアカウントBANされるぞ
225 :
自分のレス :2015/02/14(土) 21:53:59.45 ID:WzPTaq3i
新Opteronの情報が来た
http://www.geocities.jp/andosprocinfo/wadai15/20150221.htm 2015年2月20日に大阪で開催されたPC Cluster Consortiumのワークショップにおいて
2.AMDがHPC向けのAPUの開発について発表
ハイエンドのGPUを集積した,200〜300Wの消費電力のHPC向けのAPUを開発
3.AMDは32コア,64スレッドのARMとx86プロセサを製品化する計画
K12と同世代のx86プロセサとはピン互換となるとのことです。また,これらのプロセサは32コアを集積し,
これまでAMDでは採用していなかったマルチスレッドをサポートするとのことで,64スレッドを並列実行するプロセサとなるとのことです。
2は、多分16コア32スレッド+4096sp位 + HBM 8GB + DDR4 64GBくらいの性能
3は、32コア64スレッドのハイエンドCPUでx86とARMがpin互換
こいつらが自作に降りてくる可能性は微レ存
やべぇ
32コアOpteronとハイエンドAPUならインテルヌビも流石に死ぬな
Carrizoの劇的なサイズの縮小が設計技術によってもたらされたものでないのは残念。 デスク向けCarrizoだと縮小分大きくなるのかな。
今日のandoさんの記事によると、電圧を下げた時にエラーが出ないように(電圧に)余裕を持たせるんじゃなく クロックのほうを下げるのはデスク向けプロセスでも使えそう。