AMDの次世代CPUについて語ろう 第34世代

このエントリーをはてなブックマークに追加
1Socket774
____
\._  | 荒らし・煽り・厨房は放置が一番。
/|_| | 釣られずにスルーしましょう。
|_/\! sage進行でマターリいきましょう。

■前スレ
AMDの次世代CPUについて語ろう 第33世代
http://pc11.2ch.net/test/read.cgi/jisaku/1265866982/

自作板AMD系スレッド過去ログ保存サイト様
http://amd.jisakuita.net/

■関連スレ
Intelの次世代CPUについて語ろう 42
http://pc11.2ch.net/test/read.cgi/jisaku/1262241441/

CPUアーキテクチャについて語れ 16
http://pc11.2ch.net/test/read.cgi/jisaku/1253517890/
2Socket774:2010/03/05(金) 22:41:42 ID:DVw6HnxY
■過去スレ一覧
32 ttp://pc11.2ch.net/test/read.cgi/jisaku/1263352294/
31 ttp://pc11.2ch.net/test/read.cgi/jisaku/1258895864/
30 ttp://pc11.2ch.net/test/read.cgi/jisaku/1252750795/
29 ttp://pc11.2ch.net/test/read.cgi/jisaku/1247396388/
28 ttp://pc11.2ch.net/test/read.cgi/jisaku/1240713914/
27 ttp://pc11.2ch.net/test/read.cgi/jisaku/1236773340/
26 ttp://pc11.2ch.net/test/read.cgi/jisaku/1231688064/
25 ttp://pc11.2ch.net/test/read.cgi/jisaku/1228783643/
24 ttp://pc11.2ch.net/test/read.cgi/jisaku/1226628399/
23 ttp://pc11.2ch.net/test/read.cgi/jisaku/1219751351/
22 ttp://pc11.2ch.net/test/read.cgi/jisaku/1214276833/
21 ttp://pc11.2ch.net/test/read.cgi/jisaku/1209908499/
20 ttp://pc11.2ch.net/test/read.cgi/jisaku/1203947286/
19 ttp://pc11.2ch.net/test/read.cgi/jisaku/1199338832/
18 ttp://pc11.2ch.net/test/read.cgi/jisaku/1197562571/
17 ttp://pc11.2ch.net/test/read.cgi/jisaku/1195270082/
16 ttp://pc11.2ch.net/test/read.cgi/jisaku/1192923006/
15 ttp://pc11.2ch.net/test/read.cgi/jisaku/1190954072/
14 ttp://pc11.2ch.net/test/read.cgi/jisaku/1189440665/
13 ttp://pc11.2ch.net/test/read.cgi/jisaku/1187934610/
12 ttp://pc11.2ch.net/test/read.cgi/jisaku/1183558273/
11 ttp://pc11.2ch.net/test/read.cgi/jisaku/1181563841/
10 ttp://pc11.2ch.net/test/read.cgi/jisaku/1177368830/
09 ttp://pc11.2ch.net/test/read.cgi/jisaku/1172183431/
08 ttp://pc9.2ch.net/test/read.cgi/jisaku/1167003467/
07 ttp://pc7.2ch.net/test/read.cgi/jisaku/1161618220/
06 ttp://pc7.2ch.net/test/read.cgi/jisaku/1157327883/
05 ttp://pc7.2ch.net/test/read.cgi/jisaku/1150393478/
04 ttp://pc7.2ch.net/test/read.cgi/jisaku/1145187468/
03 ttp://pc7.2ch.net/test/read.cgi/jisaku/1138983969/
02 ttp://pc7.2ch.net/test/read.cgi/jisaku/1133374045/
01 ttp://pc7.2ch.net/test/read.cgi/jisaku/1124542812/
3Socket774:2010/03/05(金) 22:43:28 ID:2aQrRVSp
>>1 乙
4Socket774:2010/03/05(金) 23:35:16 ID:s5Y+j5gZ
>>1 乙
2011年 AMD 新アーキテクチャ

◇Bulldozer (Zambezi 4〜8コア)
・32nmSOIプロセス High-K/メタルゲート採用
・3GHzを超えるクロック?
・1つのモジュールに2コアを内蔵 コア毎に独立した整数スケジューラとL1キャッシュ
・1つのモジュールに共有L2キャッシュ、L3キャッシュ、ノースブリッジ、128-bitのSIMD積和算ユニットを2基搭載
・浮動小数点演算ユニットや命令デコーダなどのリソースを2つのコア/スレッドで共有
※今後、増えていく浮動小数点演算のニーズをGPUで行うこと(ヘテロジニアス化)を見据えている
・クラスタードアーキテクチャ(HTよりマルチスレッド性能が高い) ※従来よりコア数を増やしやすい設計
・AMD独自のXOP、FMA4、CVT16に加え新命令のAVXサポート
・2ch DDR3-1866まで対応
・ソケット AM3(もしくはAM3r2) (チップセット890FX, 890GX、SB850が使用可能?)

http://pc.watch.impress.co.jp/img/pcw/docs/328/392/kaigai6.jpg
http://pc.watch.impress.co.jp/img/pcw/docs/328/384/amd-08.jpg
http://pc.watch.impress.co.jp/img/pcw/docs/328/379/02.jpg
http://pc.watch.impress.co.jp/img/pcw/docs/330/076/kaigai2.jpg



(・∀・)(・∀・)(・∀・)(・∀・)(・∀・)(・∀・) 従来の6コア
 ↓
(・∀・∀・)(・∀・∀・)(・∀・∀・)(・∀・∀・) Bulldozerの8コア
5Socket774:2010/03/05(金) 23:37:00 ID:s5Y+j5gZ
Llanoについて
Llanoのプロセス
  ・32nm SOI / High-K + Metal gateプロセス。
第 2世代の液浸露光技術が用いられる。
Llanoの概要
  ・4つのCPUコア
  ・DirectX 11対応GPU
  ・DDR3対応メモリコントローラ
  ・最初のサンプルは2010年上半期予定。
LlanoのCPUコア
  ・L2キャッシュを除いたコアのサイズは9.69mm2
  ・1コアあたりのトランジスタ数は3500万以上
  ・(1コアあたり?)2.5〜25Wの消費電力
  ・3GHz以上の周波数
  ・駆動電圧は0.8〜1.3V

Bulldozerについて
Bulldozer (Zambezi 4〜8コア)
 ・32nmSOIプロセス High-K/メタルゲート採用
 ・3GHzを超えるクロック?
 ・1つのモジュールに2コアを内蔵 コア毎に独立した整数スケジューラとL1キャッシュ
 ・1つのモジュールに共有L2キャッシュ、L3キャッシュ、ノースブリッジ、128-bitのSIMD積和算ユニットを2基搭載
 ・浮動小数点演算ユニットや命令デコーダなどのリソースを2つのコア/スレッドで共有
 ※今後、増えていく浮動小数点演算のニーズをGPUで行うこと(ヘテロジニアス化)を見据えている
 ・クラスタードアーキテクチャ(HTよりマルチスレッド性能が高い) ※従来よりコア数を増やしやすい設計
 ・AMD独自のXOP、FMA4、CVT16に加え新命令のAVXサポート
 ・2ch DDR3-1866まで対応
 ・ソケット AM3(もしくはAM3r2) (チップセット890FX, 890GX、SB850が使用可能?)
6Socket774:2010/03/05(金) 23:41:01 ID:s5Y+j5gZ
Ontarioについて
 ・32nmSOIプロセス High-K/メタルゲート採用 (40nmという話はどうなった?)
 ・Dual-Core CPUとGPUを搭載し、DDR3, DDR3Lに対応
 ・パッケージはBGA、“Brazos”プラットフォーム
 ・GPUはDX11対応 (Cedarコア?)
 ・CPUコアはBobcatで非K10、Bulldozerとも違う (Bulldozerのサブセットっぽい)

Bobcatコア
 ・Int Pipe*2 + Lord pipe+Store pipe (2way?)
 ・x86-64、SSE1-3対応(SSSE3/4/4.1/4.2は非対応)
 ・コアの消費電力は1w以下

Llanoコア
AMD finally outs the 32nm Llano core
http://www.semiaccurate.com/2010/02/10/amd-finally-outs-32nm-llano-core/

http://pc.watch.impress.co.jp/img/pcw/docs/328/392/html/kaigai1_1.jpg.html

AMDがGPU統合CPU「Llano」のCPUコアの技術を発表
http://pc.watch.impress.co.jp/docs/column/kaigai/20100215_348705.html
7Socket774:2010/03/05(金) 23:46:40 ID:3P7Iv3iu
Ontarioってバルクじゃないの?
8Socket774:2010/03/06(土) 00:02:07 ID:8OGtZW5g
団子はとっととGPUの鳥ソフトより性能高いの作れよ
口ばっかりで何も出来てねーじゃん ダセー

出来るまでここに書き込み禁止な
9Socket774:2010/03/06(土) 03:00:42 ID:DwDxHAVE
Bulldozer開発を中止して、LLanoのK10改コアで代替するプランを
6月ころに発表すると妄想
10Socket774:2010/03/06(土) 03:24:36 ID:cBsQCIxU
昔    1156(笑)  1366こそが最強!




今    1156\(^o^)/1366



intelのソケット変更ラッシュワロタ
11Socket774:2010/03/06(土) 08:50:44 ID:YmnqTJ4T
K10は6コア版で多分、シングルチップでのコア数の限界に達してる
12Socket774:2010/03/06(土) 14:07:40 ID:Tk2F2Qhg
コア自体にコア数の限界なんぞない。
トランジスタ数と電力、インターコネクト次第。
キャッシュは手入れる必要あるか。
13Socket774:2010/03/06(土) 14:31:50 ID:zMHzSyWW
Nehalem-EXはQPIらしいけど
8コアのこれ程度でもリングバスの噂が立つくらいなんだよな
バス込みのアーキにコア数限界はあるんだろう
14Socket774:2010/03/06(土) 15:04:29 ID:YmnqTJ4T
Intelの研究用48コアチップでもPentium2個で1モジュールとして設計されてる

48個のコア全てをバスに繋ぐよりも、多少のレイテンシが生じてでも2個1のモジュールに
してバスへの接続点を半分の24箇所にした方が現実的って事だろう

アプローチがBulldozerに近いと思うね
15Socket774:2010/03/06(土) 16:11:01 ID:Siu+13XF
>>14
AMDはもう結論出したけどintelはまだ出してないじゃん。
SCCとLarrabeeが並行してる時点でまだ総当りの途中。
16Socket774:2010/03/06(土) 16:14:46 ID:7KHPbXyE
AMDは結論出したというか諦めたというか難しいところだな・・・
17Socket774:2010/03/06(土) 16:41:37 ID:Wg9RcNdJ
>>12
ルネサスがSH-2の1000コアとかやってたな。
セガサターン500台分か。
18Socket774:2010/03/06(土) 17:56:10 ID:7+c5odN+
別にbulldozerアーキテクチャがAMDのマルチコア化の結論じゃないだろう
とりあえず10コア程度がハイエンドになる今後5年くらいを戦える物として製品化していそう
その先のSCCのようなメニーコア向けにはまた別のアプローチをしてくるだろうね
19Socket774:2010/03/06(土) 20:16:32 ID:oMd47+c/
>>5
そうやって並べられると
何だかLlanoの方がよさげに見えるな
20Socket774:2010/03/06(土) 20:23:53 ID:wu0sRtWd
21Socket774:2010/03/06(土) 20:38:18 ID:zMHzSyWW
>>20
どこに書いてあるんだか判らん・・・

しかし以前出てたソース(ってか誰かの英文コメ)では単にレイテンシ5ってあっただけ(のはず)だけど
整数で3維持なら朗報だ
way2倍容量1/4がどう転ぶか判らんけど

Intelは涅槃でレイテンシ4だったのにまた増えるのか?
何やらかしたんだか
22,,・´∀`・,,)っ-○○○@CR-Z:2010/03/06(土) 22:00:27 ID:LFUwQxdd
>>21
だからシミュレータで実際のレイテンシ・スループット書いてあるの
表いる?


#ところでmixiのあれって倍率だけ増えていってるけど当選確率は変わってない(むしろ下がっていってる)気がするんだが
23Socket774:2010/03/06(土) 22:08:38 ID:vK8Qmtrt
>>22
>>8

口先ばっかりで能書きたれてないでとっととやれよ
24,,・´∀`・,,)っ-○○○@CR-Z:2010/03/06(土) 22:36:37 ID:LFUwQxdd
言い出しっぺがやれ
25,,・´∀`・,,)っ-○○○@CR-Z:2010/03/06(土) 22:45:07 ID:LFUwQxdd
>>21
LSU-L1の間のバッファが深くなってるっぽいのよね。
ストアフォワーディングの機能で同じアドレスに対するストア→ロードのレイテンシはシミュレータの値より
小さくなると思われるので、性能への影響は軽微かと。

更に、ロードユニットが2本に増えてるぶんロードを先行実行できるから、コードシーケンスレベルでみれば
Nehalemよりトータル性能は上がってる印象。
26Socket774:2010/03/07(日) 00:50:09 ID:ONd5+S4y
また雑魚が来てるのか。鬱陶しいな。
27Socket774:2010/03/07(日) 02:13:57 ID:sELd3hH6
最上位はいくらくらいかな?競合の価格次第?
28Socket774:2010/03/07(日) 08:00:10 ID:EDfmg+1e
ちょ団子さん。ここでCRZやってもw
29Socket774:2010/03/07(日) 08:45:24 ID:2moEEfAj
CRZ・・・ホンダ製のコピペ&電波ハイブリッド?
30Socket774:2010/03/07(日) 10:36:13 ID:F8DqU0lx
効率的なAMD Bulldozerの内部構造
ttp://pc.nikkeibp.co.jp/article/trend/20100217/1022999/
31えるえる:2010/03/07(日) 11:02:33 ID:hWGQNgmr
>>5
LlanoはK10改でOOO強化だからなあ。
わずかとはいえ同クロックでK10よりも速いはずだ。
それでTurbo付き。
32Socket774:2010/03/07(日) 11:05:25 ID:6PT1Qt+Z
>>31
問題はソケットなんぼになるか。。かな?
33えるえる:2010/03/07(日) 11:08:39 ID:hWGQNgmr
なにげにOOO関係のバッファ類の増加とTurbo/PGの導入とGPUとの融合ってあたりで
K10→Llanoの改良はCore 2→Nehalemの改良トレンドに近い。
むしろAMDが対Intelとして後から用意した回答がLlanoであり、
Bullはやはりトレンドをやや見誤ったのでサーバ向けだろう。
34えるえる:2010/03/07(日) 11:10:20 ID:hWGQNgmr
ソケットソケットいってるやついるけど、
ソケットはIntelもAMDもがんがんかわるよ、これからは。
いまどきソケット形状が同じで何がうれしいのか自分には理解できんけど。
35Socket774:2010/03/07(日) 11:12:01 ID:+HMJD2a1
LGAはやめてほしいな
AMDがLGAにしたら自作やめるレベルできらいだわ
36Socket774:2010/03/07(日) 11:14:01 ID:6PT1Qt+Z
気になるのは一気に移行させるか
徐々に移行させるかだよ
37えるえる:2010/03/07(日) 11:14:44 ID:hWGQNgmr
LGAはそれまでのソケットとちがって板ばねみたいな構造でCPUのピンをはさむのではなくて、
CPUとマザーボード側が面で接触するようになっている。
だから寄生インダクタンスの影響をうけにくい。
ほんとうはBGAのほうがいいが、BGAは接触面が球面なのでソケット化できない。
IntelもAMDも自作er向けにパッケージングやソケットを考えているんじゃないんであしからず。
38Socket774:2010/03/07(日) 11:17:25 ID:6PT1Qt+Z
>>37
ここて自作板だよな?w
39えるえる:2010/03/07(日) 11:17:47 ID:hWGQNgmr
いやBGAも球面で接触してるわけじゃねーな。
BGAにしたかったけど無理があったからLGAのソケットになったってのは
話にあった。
40えるえる:2010/03/07(日) 11:19:30 ID:hWGQNgmr
>>38
自作人にもいろんな価値観があるだろう。
自分の場合は無理なピンアサインとソケットの構造で
新しい世代の電気的な仕様を押し込むという路線はすきでない。
同じソケットでCPU交換するなんていまどきまったくやらないしな。
マザーがこれだけやすくなったのにWin95時代の価値観のやつが多くて困るわ。
41Socket774:2010/03/07(日) 11:21:41 ID:6PT1Qt+Z
>>40

>自作人にもいろんな価値観があるだろう。
だから良いじゃんwソケット気にしてもw
42えるえる:2010/03/07(日) 11:23:51 ID:hWGQNgmr
>>41
気にするのはかってだが、
ソケット厨みたいなのがいて
ソケットをかえるのはユーザ無視だとか、
被害妄想で切れ始める厨房がいるんでね。
まあそういうやつは不安定大好きの真性マゾだろうから
下駄でも自作して使ってればいいんだが。
43Socket774:2010/03/07(日) 11:24:27 ID:6PT1Qt+Z
>>42
ああそう言うことかw
44Socket774:2010/03/07(日) 11:30:55 ID:+HMJD2a1
>>37
AMDがZIFソケット使ってる理由ってのは
なんなの?メリットあるの?
45えるえる:2010/03/07(日) 11:30:56 ID:hWGQNgmr
デスクトップは934pinのFM1、
ノートは722pinのFS1だな。
GPUを統合しているせいで、これからはGPUの世代にあわせて
ソケットが変わる、形状がおなじでもマイナーチェンジで互換性がなくなる
ということは普通に多くなるだろう。
46Socket774:2010/03/07(日) 11:32:43 ID:+HMJD2a1
AMDも鯖向けのやつはLGA使ってたが
47Socket774:2010/03/07(日) 11:33:24 ID:MFhEyMoU
メーカーはメーカーの損得勘定があるだろうし
ユーザーにもそれぞれそんなのがあるでしょ
48Socket774:2010/03/07(日) 11:48:38 ID:rQBcgSA3
>>45
> デスクトップは934pinのFM1、
> ノートは722pinのFS1だな。
> GPUを統合しているせいで、これからはGPUの世代にあわせて
> ソケットが変わる、形状がおなじでもマイナーチェンジで互換性がなくなる
> ということは普通に多くなるだろう。

IntelはそうだがAMDでそれはないな
外部バスは今まではHTとメモリバスだけだったけど、今後はGPU内蔵でディスプレイ出力が増えるだけだからね

Fusion世代ということで映像出力バスを追加、HTバスもより高クロック対応など、
現行より多少強化したもので作っておけばメモリ規格の変更がない限りソケット変更は必要無くなる
FM1がまさしくそれじゃないかな
恐らくBulldozer世代も想定しているはずだから互換性はあるだろう
49Socket774:2010/03/07(日) 11:55:01 ID:DdhKsthy
LlanoはPCIeBridgeは統合しないの?
今まで出ているダイ写真だと統合してないようだけど、
後藤記事には統合するのが本当のLlanoみたいなこと書いてるんだけど。
50えるえる:2010/03/07(日) 11:57:35 ID:hWGQNgmr
まあソケットが変わらないのが良いと雑誌の読みすぎで信じ込んでいるやつのセンスは
わからんな。
あとGPUを内蔵したことだけではなく、今後はTurboのような電力管理技術の進歩にともなって
電源の要求がかわってくるし、GPUの電源分もあるから信号だけ同じでも互換性があるものをだすのは
難しくなっている。
51えるえる:2010/03/07(日) 12:03:34 ID:hWGQNgmr
ソケットをかえないということは、新しい世代では電源やGNDの数をケチったり
無理なレイアウトでの引き回しを許容してるわけで、なんでもかんでも古い世代をそのまま流用できるのがいいってのは間違い。
というかマザー1万前後の時代に実際CPUの交換してよろこんでるやつってどんだけいるんだろうなあ。
もちろんソケット同じで電気的な仕様が変わる場合も、電源などの要求仕様が新しいものにあわせてリファインされている
わけでもありこれを安心と感じるか、ユーザ無視の仕様変更と感じるかは意見のわかれるところだろうな。
52Socket774:2010/03/07(日) 12:06:05 ID:+HMJD2a1
>>49
Pcie統合したらHTの役割って低くなるよなw
インテルはVGA専用の線ひいてたが
53Socket774:2010/03/07(日) 12:10:24 ID:2moEEfAj
>>30
ああ、「小数点は削減するけどモノ自体は良くする」ってちらっと見たことあったけど
積和のことだったのか
SSEみたく「Intelが対応するからうちも」「しかし独自にやらせてもらう(扱う変数が1つ多い)」てことで
たしかレイテンシも大幅増だったしやはり手抜きだろうなあ
54Socket774:2010/03/07(日) 12:15:37 ID:5niZHRNR
L1D Latency

Bulldozer
int 3
fp 5

Sandy Bridge
int 5
fp 6
fp256 8
55Socket774:2010/03/07(日) 12:22:47 ID:gdefSEH1
レイテンシや帯域だけでは性能を図る事は出来ないので
物が出てきてからでも良いじゃないですか
56,,・´∀`・,,)っ-○○○@CR-Z:2010/03/07(日) 13:33:37 ID:Y5JV1Fly
そうだね(笑)

Bulldozer
(v)addps 6
(v)mulps 6

Sandy Bridge
(v)addps 3
(v)mulps 4
57Socket774:2010/03/07(日) 13:36:07 ID:hYrPtw3F
>>49
順当に考えたら、公開されているダイ写真がノート向けなんじゃね
一応スペック的には外付けGPU並みの性能がある訳だし
大多数のノートPCでは必要性がないって判断したのでは?
58Socket774:2010/03/07(日) 13:46:54 ID:2moEEfAj
>>56のように知的障害者が騒ぐ分には一向に構わないとしても
Intelだってそこを突いてくるだろうし
GPGPUが勝勢になる前からFPU/SSEを手抜きするってのは結構な冒険だよなあ
59,,・´∀`・,,)っ-○○○@CR-Z:2010/03/07(日) 13:52:52 ID:Y5JV1Fly
「手抜き」って言っちゃうから半可通は困るな

レイテンシ増大の理屈は適っている
60Socket774:2010/03/07(日) 14:22:26 ID:8CmjyeBd
Bulldozerは2コアでデコーダを共有しているけど
本来は1コアだったものを、コア数を多く見せかけるために
コアをモジュール、整数ユニットをコアと呼ぶことにしたのか?
61,,・´∀`・,,)っ-○○○@CR-Z:2010/03/07(日) 14:26:44 ID:Y5JV1Fly
積和融合演算器が単体の乗算器、加算器より深い演算パイプラインになること
そしてパイプラインが深くなればその分命令のレイテンシが増えるのは明らかじゃないか
そんなことも理解せずに手抜きといってしまうのはAMDの技術者に対する冒涜だな

逆に言うとマイクロアーキテクチャが変わらない限りレイテンシは改善されないね。
そもそも手など抜いてないから。
62Socket774:2010/03/07(日) 14:33:20 ID:EzEMmrzp
>>60
L1が二つだし、本来から2コアだよ
回路節約のため、共有できるものをくっつけた
63Socket774:2010/03/07(日) 14:36:37 ID:2moEEfAj
GPUが糞なのでx86SIMDに賭けるIntel
GPGPUで小数点・ベクタを賄いたいがx86SIMDの保険も忘れることができないAMD
そしてあらゆるところに電波を潜り込ませようとする雑音
64,,・´∀`・,,)っ-○○○@CR-Z:2010/03/07(日) 14:38:46 ID:Y5JV1Fly
GPUなんて使ったらますますレイテンシが大きくなりますがwww
65Socket774:2010/03/07(日) 14:41:41 ID:DdhKsthy
クラスタ構造を提案したAndyGlewによると、元はWillametteのHTTが遅くなるのを
改善するために二重化した部分をクラスタ、デコーダとか共有部分まで含めた全体をコアと
していたらしい。
AndyGlewからすると、マーケティング上コア数を倍にするために呼び方変えたことになるらしい。
66,,・´∀`・,,)っ-○○○@CR-Z:2010/03/07(日) 14:48:41 ID:Y5JV1Fly
Bulldozerはそもそも2009年末の予定なのでSIMDユニットの構成がSandy Bridgeと比べて
見劣りしても致し方ない面もありそれを手抜きなどとは言う気は毛頭無いが

万年β版のStream SDKは明らかに手抜きだよな
1.0を完成させないまま2.0のβ(実質α)とかプロの仕事じゃない
67Socket774:2010/03/07(日) 14:48:44 ID:hv7LpgY+
というかBulldozerがダメなのは128bitSSEを共有にしたところだろうな。
まぁ、共有するしか無かったわけだが・・・
68Socket774:2010/03/07(日) 14:52:20 ID:2moEEfAj
>レイテンシや帯域だけでは性能を図る事は出来ないので

>そうだね(笑)
と同意した直後からの雑音のこのレイテンシへのこだわりようは一体何だろう?
x86SIMDやキャッシュの低テイレンシ構成だけでこの先生き残ろうとしているIntel信者らしくはあるのだが
反面、用途次第でGPUに100倍性能差をつけられてる事実や
AMDがコアあたりのFPUを減らして手抜いている事実が全く見えなくなっている
69Socket774:2010/03/07(日) 14:53:10 ID:Vk23YMV8
128bitSSE、2パイプの共有じゃなかったっけ
違ったらすまん
70,,・´∀`・,,)っ-○○○@CR-Z:2010/03/07(日) 14:57:21 ID:Y5JV1Fly
>>67
だからコア数じゃなくてモジュール数で見れ。別に少なくないから。
元々はNehalem/Westmereの4C8TとBulldozerの4M8Cで対等以上に戦う予定だったんだから
十分妥当な数字だろう。

問題はSandy BridgeのSIMD性能を見誤ったこと。
71Socket774:2010/03/07(日) 15:09:33 ID:2moEEfAj
いくらIntelのコアが無駄にデカいからって
「同じくらいの大きさになりそうなモジュール単位で比べろ」ってのもなあ
HTで1コア2スレッドつっても
無駄に並列化して余ったリソースをバグなど気にせずがめつく使おうってだけのものだし
72,,・´∀`・,,)っ-○○○@CR-Z:2010/03/07(日) 15:13:26 ID:Y5JV1Fly
今日のプリプリフェフェフェッチくんは ID:2moEEfAj
73,,・´∀`・,,)っ-○○○@CR-Z:2010/03/07(日) 15:33:56 ID:Y5JV1Fly
2つの整数クラスタが物理的に独立した物でReverse-HT(笑)が理屈的に無理だと悟って
「コア」の新たな定義をすんなり受け入れてるのは笑うところだが
その「コア」あたりの整数ALUが減った分はどうやって性能賄うのかな。

ただでさえSPECintでダブルスコアで負けてるのに、整数ユニットやL1Dキャッシュを減らしてる
余裕はないと思うんだが。

FPが少ないとか無茶言うなよ、
FP演算のアドレス算出にだって整数ユニット使うんだぜ
1「コア」あたりのデコーダも整数ユニットも減ってるのにFPUを増やすなんて現実的にありえない。
FMAで1ユニット当たりの理論性能2倍なんだからそれを受け入れた方が素直だろ
74Socket774:2010/03/07(日) 15:46:26 ID:2moEEfAj
一時期「2コア1スレはどうしたー!」と名無しで散々喚いていたのはやはり雑音でした

それについての特許やら
ヨナからコンロでデコーダと実行パイプが増えたのにも関わらず整数スカラ性能が伸びなかったことやら
何度かスレで出てきたのに全部わすれで電波で穴埋め

>FP演算のアドレス算出にだって整数ユニット使うんだぜ
雑音のレスを真に受けるのもアレだけど
K7系がAGU3つもあるのはもしかしてこのためか
75Socket774:2010/03/07(日) 16:01:52 ID:x5Miag6e
CPUから直接GPU出力するのかな?
インテルみたいにFDIみたいにするのか。
どっちなんだろうか。
76Socket774:2010/03/07(日) 16:07:51 ID:Y79HYgGe
>>19
同一の製造プロセスでバクチ要素皆無のLlanoが
良く見えるという話は分からなくもない。
77,,・´∀`・,,)っ-○○○@CR-Z:2010/03/07(日) 16:19:16 ID:Y5JV1Fly
FPの演算ユニットがモジュール当たり2つしかないことがネックだとするならば
従来のFMISC/FSTOREが見あたらないことのほうがよっぽど実効性能上問題だよ
もしこれらが積和ユニットに組み込まれてるとすれば、同時発行ができない。
行列積演算で必要なブロードキャストができないってこと。

その点でSandy Bridgeのfadd256, fmul256, fperm256の3ユニット構成は理に適っている。
vbroadcastss → vmulps → vaddps で8並列の行列積の1イテレーションが1サイクルで完結するからね。

ちなみに、同じコードならBulldozerは机上計算上3サイクルかかる(笑)かもね
いや、単に図に書かれてないだけかもしれないので断定はしないけども
78Socket774:2010/03/07(日) 16:35:35 ID:8CmjyeBd
FSTOREは型変換とストア(とK10ではレジスタコピー)だけだった
シャッフルはFADDとFMULに発行する
79Socket774:2010/03/07(日) 16:45:37 ID:gmLIGZ/w
> vbroadcastss → vmulps → vaddps で8並列の行列積の1イテレーションが1サイクルで完結するからね。

あれ? それってレジスタ数多くないと意味なくね?
SandyのSSEハードウェアレジスタ数何個か知らないけど、論理16本で足りるの?
80Socket774:2010/03/07(日) 16:46:31 ID:WeLLq+++
IBMはPowerPCで、AltiVecでAppleやMotorolaと対立してたな

IBMは「消費電力ではAltiVec有り300MHz(CPU)とAltiVec無し500MHzが同等、普段使いで考えると後者が良い」と言ったが
当時はマルチメディア全盛だったから結局押し切られた

結果PowerPC MACはPCに引き離され始めて敗退
当時の製造技術ではまだ128bitのSIMDは荷が重すぎた
81,,・´∀`・,,)っ-○○○@CR-Z:2010/03/07(日) 16:55:38 ID:Y5JV1Fly
中の人の情報だとレジスタコピーはスケジューラレベルで後続オペレーションと融合されるようなので専用ユニット不要
Storeも回路の最適化すれば要らなくなる気がする

2つの積和ユニット以外にvpermil2psをシングルサイクルで発行できるユニットがある場合
vfmaddps(128b)×2とvpermil2ps(128b)×1で16SP/cycleは維持できる。
勿論これにもAMD専用のコードを書いてやらないといけない。
CellのSPEと同じく転置行列積を使う方法になるので、Intelのデータのパッキング方法そのものが変わる。
(単純にmul+addをfmaに置き換えただけでは性能は出ない)

同じ方法で2ユニットなら10.6SP/clk、broadcast+FMAだと8SP/clkしか出ない。



ちなみにコア数で割るとその半分ね。
82,,・´∀`・,,)っ-○○○@CR-Z:2010/03/07(日) 17:10:49 ID:Y5JV1Fly
>>79
C = A×Bとすると、8本で8x8行列を構成Cに割り当てる。
残りの8本ににAとBを部分的に読み込ませる。
vbroadcastssでのロードは128bit分しか使わないので、2サイクルに1回はvmovaps (256) を同時発行出来る。

レイテンシはfmul+faddでも7なので何とか足りる。
83Socket774:2010/03/07(日) 17:28:38 ID:gmLIGZ/w
いやそれめっちゃギリギリに聞こえるが……

みんなのレジスタを団子にちょっとずつ分けてやってくれ。
84Socket774:2010/03/07(日) 17:33:08 ID:MFhEyMoU
離れた場所のレジスタとかほんと無意味だよな
85,,・´∀`・,,)っ-○○○@CR-Z:2010/03/07(日) 17:33:58 ID:Y5JV1Fly
ぶっちゃけレジスタリネームあるんだからbroadcastss用のレジスタは1本あれば十分だよ。
残り7本はBに割り当てて、1列分はスワップすればいい。
86Socket774:2010/03/07(日) 17:36:25 ID:a5GZfKdd
87,,・´∀`・,,)っ-○○○@CR-Z:2010/03/07(日) 17:58:07 ID:Y5JV1Fly
【構成】
Bulldozer : 16KB, 4-way set associative
Sandy Bridge : 32KB, 8-way set associative

【帯域】
Bulldozer : 32 byte?
Sandy Bridge : 48 byte(32B Load + 16B Store)

88Socket774:2010/03/07(日) 18:29:21 ID:evGgpv4X
>>80
IBMはSCEIにもCellの設計に関して忠告してたんだぜ
ローカルストアは使い勝手が悪すぎるからキャッシュにするべきと。
久夛良木氏と山崎氏によって結局押し切られたけど

CPUの設計に関してIBMはけっこう適切な助言をしてるんだな
89Socket774:2010/03/07(日) 18:38:19 ID:+EwHhoBL
相変わらずAMDの連想度は・・
90Socket774:2010/03/07(日) 19:32:27 ID:1VaWPvwz
次次期intel cpu は必ずBulldozerの設計思想をパクってくるな
91Socket774:2010/03/07(日) 19:35:20 ID:1VaWPvwz
http://kakaku.com/pc/cpu/ranking_0510/rating/

CPU 満足度ランキング
92Socket774:2010/03/07(日) 19:52:28 ID:gmLIGZ/w
SPEのローカルストアの得失はさておき、
> ローカルストアは使い勝手が悪すぎるからキャッシュにするべきと。
こんなのは「雨が降るから傘持って行きましょう」レベルの凡庸な「助言」だろ。
93,,・´∀`・,,)っ-○○○@CR-Z:2010/03/07(日) 21:10:43 ID:Y5JV1Fly
>>91
ユーザー減少率No.1の携帯キャリアの売り文句だもんな、満足度って
94MACオタ>80 さん:2010/03/07(日) 21:15:30 ID:+7BaEbQg
>>80
  ------------------
  当時はマルチメディア全盛だったから結局押し切られた
  ------------------
押し切られた?当時IBMはAltivecを実装したPowerPCを販売しませんでした。
そして、コード資産がたっぷり溜まったころに実装して、ゲーム機や自社のサーバー向け
で大儲けしています。
PPC970以来、POWER6, POWER7, PX (xbox360 CPU), PPE (Cell)、全てAltivecとその
後継ベクトル命令セットを実装しているという…

IBMと手を組むのは、悪魔と取引するのと変わらないですな(笑)
95,,・´∀`・,,)っ-○○○@CR-Z:2010/03/07(日) 21:22:26 ID:Y5JV1Fly
高クロック実装が困難になるくらいに1ステージに演算を詰め込みすぎたのは事実でしょ。
事実G5のVMXは命令のレイテンシがG4の2倍程度に伸びてる(が、それでもx86のクロックに及ばなかった)
96Socket774:2010/03/07(日) 21:22:28 ID:C6fbRGcj
だから、製造技術と集積度が上がった今ならやれるってことだろ。
97MACオタ>団子 さん:2010/03/07(日) 21:46:30 ID:+7BaEbQg
>>95
  -----------------
  それでもx86のクロックに及ばなかった
  -----------------
もしやPentium4と比べていませんか(笑)
98Socket774:2010/03/07(日) 21:54:10 ID:bcpigRW5
NGワード推奨:レイテンシ
   理由:パフォーマンスを追うりょせず、この言葉のみを使う人が大杉
99,,・´∀`・,,)っ-○○○@CR-Z:2010/03/07(日) 21:54:19 ID:Y5JV1Fly
Pentium 4と比べたら問題か?
まさかAthlon 64に実効性能で勝ってたとでも?
100Socket774:2010/03/07(日) 22:04:56 ID:ONd5+S4y
キチガイの溜まり場と化してるな。
101,,・´∀`・,,)っ-○○○@CR-Z:2010/03/07(日) 22:07:01 ID:Y5JV1Fly
G5(PPC970)はx86でいうAGU相当のアドレス演算操作を汎用ALUでやらないといけないのに、
それが2本しかないから、一般的なワークロードでは同クロックのx86よりも実効性能は低めなのですよ。

SIMD使った場合はその限りじゃないけど、そもそもSIMDユニットのスループットを支えきれるほど
足回りが強くないので(以下略
102MACオタ>団子 さん:2010/03/07(日) 22:27:37 ID:+7BaEbQg
>>101
  -----------------
  AGU相当のアドレス演算操作を汎用ALUでやらないといけない
  -----------------
MMUとか、論理/物理アドレスとか知っていますか?
103Socket774:2010/03/07(日) 22:46:59 ID:Sl8oF7ko
>>100
34スレ目にしてそれは今更過ぎるw

今夜はオタと団子が大暴れか
104,,・´∀`・,,)っ-○○○@CR-Z:2010/03/07(日) 22:48:27 ID:Y5JV1Fly
無理言うなよ
PowerISAに簡単なベースアドレス+オフセット(レジスタor16ビットまでの即値)みたいな貧弱なアドレッシングモードしかないのはみんな知ってるから

SIB + DISPみたいな指定は出来ないだろ
105Socket774:2010/03/07(日) 23:24:35 ID:gmLIGZ/w
それが1命令で出来るのがはたして嬉しいのかどうかは
長い長い終わらない話になると思うんだが……
106,,・´∀`・,,)っ-○○○@CR-Z:2010/03/07(日) 23:33:52 ID:Y5JV1Fly
どの陣営もクロック向上に行き詰まりオペレーション密度を引き上げるために命令拡張を繰り返してるのを考えれば
利用頻度の高いメモリ操作の命令密度が最初から高いのはx86の強み
いくらレジスタを増やそうともコンピュータとはメモリを読み書きするものだからね

POWER7なんて一種の「内部CISC化」までやってるくらいだし
107Socket774:2010/03/07(日) 23:36:51 ID:CQ9maLqP
コテの隔離スレでも出来ないもんかねー
108Socket774:2010/03/07(日) 23:38:50 ID:MFhEyMoU
ここがそれです
109MACオタ>団子 さん:2010/03/08(月) 01:26:24 ID:/G1wwpzL
>>104
  -------------------
  SIB + DISPみたいな指定は出来ないだろ
  -------------------
RISC的にはどうせシンプル整数演算を行うなら、その分整数演算ユニットを増やせば良い
ということになります。3つの単純IUと1つの複雑IUを持つG4+は、そういった例ですね。
そういった点でIBMのアーキテクチャが良いかどうかは別の話かと。

むしろ>>102で書きたかったのは、メモリアクセスに当たっては「論理アドレス」を計算
すれば終わりというモノでは無いという話だったのですが…
110Socket774:2010/03/08(月) 02:10:07 ID:5urt0+ws
糞コテども、せめてx86やAVXで騒げ
Altivecなんかどうでもいい
111,,・´∀`・,,)っ-○○○@CR-Z:2010/03/08(月) 02:19:41 ID:YJZf8+Ym
> RISC的にはどうせシンプル整数演算を行うなら、その分整数演算ユニットを増やせば良い
> ということになります。3つの単純IUと1つの複雑IUを持つG4+は、そういった例ですね。

んで、そんな馬鹿げた思想から脱却できないから全部を同時実行できないから
結局デコーダのスループットに縛られてx86に水をあけられるわけですよ。
32bitの即値をロードするのに2命令かかるとか馬鹿馬鹿しいにも程がある。

下手すると同クロックのAtom以下の性能ですね。
112Socket774:2010/03/08(月) 02:45:12 ID:JGO3XhP9
とはいえ可変長命令のデコードもまた無駄が多くてバカバカしいものの
一つだからねえ。そこは決着つかないよ。
113Socket774:2010/03/08(月) 03:10:29 ID:5faggxze
おすすめの64bit即値を1命令でロードできるVLIWアーキテクチャがあるんだが
114,,・´∀`・,,)っ-○○○@CR-Z:2010/03/08(月) 03:46:07 ID:YJZf8+Ym
いやさ、そもそもG4+って3命令しかデコードできないんだからALUの個数増やそうが性能あがんねーわけで。
そもそも同クロックのPentium IIIの整数演算性能に全く勝ててなかったので解決策になってません。

> 良いということになります。

(笑)

ジョブズのPhotoshopプラグインでのベンチ1項目で2CPU駆使して勝っただのと浮かれてた時代の
マカーには常識は通じないのかね。


そもそも最大6μOPsを同時発行できるCore MAなんかと同等のクロック当たり性能を実現するには
単純に考えればRISC型のISAなら6命令かそれ以上を同時デコードしないといけないわけで、
仮にデコード出来たとして、依存関係をチェックしてスケジューリングするコストは命令数の2乗に比例して
大きくなるから結局破綻する。
んで高IPC路線では勝ち目がないからIBMはPPC970の後継製品を凍結して苦し紛れの高クロック路線と。
115Socket774:2010/03/08(月) 06:42:48 ID:cfWPDfGl
「AGUが2本のCore2は糞」とか言い出してるな
116,,・´∀`・,,)っ-○○○@CR-Z:2010/03/08(月) 06:48:19 ID:YJZf8+Ym
Load/Storeユニットの本数分だけあれば十分だよ

まさかあるわけないと思うけど
3本あってもLSUが2基しかないから1本は必ず休むような
マヌケ仕様なら3つある意味ないじゃん。
117Socket774:2010/03/08(月) 07:24:38 ID:28zY9htA
> まさかあるわけないと思うけど
そのまさかと思われるようなマヌケ仕様があるらしい・・・
確かスケジューラが糞だからこうなったとか言ってたなぁ・・・
ところが信者そのように理解しておらずリッチだと騒いでるらしい・・・
118,,・´∀`・,,)っ-○○○@CR-Z:2010/03/08(月) 07:41:13 ID:YJZf8+Ym
まさか、あるわけないじゃん
「デコード前にスケジューリングしてるからスケジューラが強力(キリッ」だとか?
それって要するにμOPsレベルでの細粒度のスケジューリングはできてませんってことですよね
んで、3本のALU毎にリザベーションステーションが独立とか?
そりゃALU(+AGU)を冗長構成にしてやらないと性能を発揮できないわなwww

噂には聞くけど、そんな夏休みの工作レベルのポンコツCPUなんて本当に実在するの?
都市伝説のレベルだろ
119Socket774:2010/03/08(月) 08:10:26 ID:28zY9htA
>>118
都市伝説だと思うのだが世の中にはいろんな人がいてね。
こんな記事を書くひとも居たりするから・・・

セカンド・オピニオン
184 Core MicroArchitectureをもうすこし(8)
http://journal.mycom.co.jp/column/sopinion/184/index.html
> ただK8については、上の特集でも説明したとおり、依存関係の解消を一度早い時期に行っている(Fetch→Pick→Decode 1 / Decode 2→Packの段階で、
> 一度依存関係の解消を行った上でMicroOpを生成しなおしている)から、ALUの直前のスケジューラのエントリ数が少なくてもそれほど不思議ではない。
> むしろこうした凝った構造をもつK8のパイプラインを見てしまうと、Core MicroarchitectureのスケジューラやROBが「こんなに単純で大丈夫なのか?」と思えてしまう。
120,,・´∀`・,,)っ-○○○@CR-Z:2010/03/08(月) 08:13:52 ID:YJZf8+Ym
大原www
馬鹿すぎて笑うしかねぇwww

121Socket774:2010/03/08(月) 08:14:51 ID:cfWPDfGl
122Socket774:2010/03/08(月) 08:43:39 ID:cfWPDfGl
「フェッチ=プリフェッチ」「データ並列=タスク並列」
なんて電波を四六時中発してる奴と
普通の人間で色々と情報に通じてる記者
どっちを信じるかと言ったら断然後者だな
推測ならともかく情報ならまず正しいだろうし

K8では早い段階で依存関係を調べられるということは
「K8のスケジューラはろくに依存調べずにパイプに流す」とかいうのは電波で
↑の代わりに「パイプを雑にというか無駄に使う」要因となるのはキャッシュ性能の悪さってことになるのかな
2wayでは局所性の高い鯖ですらスラッシングが発生するらしいし
123Socket774:2010/03/08(月) 09:32:33 ID:ymof0U9i
そうだね四六時中プリフェッチな君はバカすぎるから帰っていいよ
124Socket774:2010/03/08(月) 10:42:04 ID:MuUFgHmS
960T詳細まだ〜
125Socket774:2010/03/08(月) 14:31:38 ID:YNMS3JTs
大原君はSandraベンチみて「PhenomはL3が遅い。コア間の転送速度も遅い(キリッ」とか書いちゃう人だから
CPUアーキについてはド素人
126Socket774:2010/03/08(月) 15:02:46 ID:5faggxze
ん? PhenomのL3は遅いだろ? もちろんIntelと比較しての話だが。
127Socket774:2010/03/08(月) 15:08:59 ID:28zY9htA
キャッシュの影響を殆ど受けないソフトでも遅いんだよなぁ・・・
やっぱり大原は馬鹿だろ?
128Socket774:2010/03/08(月) 17:04:29 ID:cfWPDfGl
雑音の習性からすると>>127 1行目の主語は「L3キャッシュ」
129Socket774:2010/03/08(月) 19:38:26 ID:49bLNB70
>125
L3遅いのは事実だし
130Socket774:2010/03/08(月) 19:48:40 ID:0ldCA59k
遅いとか速いとかどうでもいいんだよ
ここで注意する点は「雑音」
131Socket774:2010/03/08(月) 22:19:24 ID:B+rZ7m21
雑音とはAMDに不利な事実を語る人やニートに現実を語る人のこと

複数の人物を同一人物と思い込んだりする病気もちが連呼する言葉
132Socket774:2010/03/08(月) 22:23:12 ID:0ldCA59k
雑音乙
133Socket774:2010/03/08(月) 22:27:27 ID:B+rZ7m21
134Socket774:2010/03/08(月) 23:02:44 ID:egJtNxlN
>>131
え? マジで言っているの?
135Socket774:2010/03/09(火) 17:32:07 ID:nBm8iv93
136Socket774:2010/03/09(火) 17:41:07 ID:dmmHuRxS
>>135
PPUがPowerPC 970互換だったのは覚えてるが、
970はPOWER4ベースだ
もともと、POWER4はデュアルコアだったしね
もうPOWERがデュアルコア化して、10年経つのか〜
137Socket774:2010/03/10(水) 00:22:31 ID:ipWvmfYD
POWER4->PowerPC 970->よーしパパin-orderに簡素化して高クロック化しちゃうぞー->PPE
なので、「POWER4をカットアウトした」とは言わん気がするが、
そもそも後藤さんが自分で書いた記事だった。
http://pc.watch.impress.co.jp/docs/2005/0209/kaigai154.htm
Cellからもう5年っすか早いっすね
138Socket774:2010/03/12(金) 01:51:05 ID:+IZIggEs
>>122
でもデコード段階で依存関係を調べられるとは思えないんだよな
K8のリザベーションステーションにはCoreと違って分解前のμopsが入ってる
最大でCoreの3倍のμopsが1エントリに詰め込まれている可能性がある
だからK8の8エントリが32エントリのCoreより著しく少ないとは言えないと思う
実際にK8のダイに占める3本のスケジューラの面積は大きい
139Socket774:2010/03/12(金) 12:00:47 ID:dTM9mt33
机上で考えるだけならどれだけでも良いのが考えられる
でも製品として出すには色んな制約があるわけで
そこら辺を考えずに実際の製品を非難しても厨二思考でしかない
ましてや後からなら何とでも言えるからな

団子うま
140Socket774:2010/03/12(金) 12:44:52 ID:hOvqkDlw
>>139
> ましてや後からなら何とでも言えるからな
全くその通りでベンチ結果を無視して適当に騒いでいるのが大原氏だよ。>119参照
141Socket774:2010/03/12(金) 14:12:49 ID:FWOvRClq
現実的な物の見方をしてれば
厳密に言う「何とでも言える」というのは有り得ない
本当に「何とでも」言ってるのは雑音だけ
そして常に笑われる
142Socket774:2010/03/12(金) 15:50:50 ID:W9ce1KL2
>>138
Coreのリザベーションステーションも分解前のμopsが入ってるはずだよ。

http://download.intel.com/jp/developer/jpdoc/vol7iss2_art03_j.pdf
Page 8
> この融合したマイクロ
> Op に対してアロケーションとリネームが行われ、1エ
> ントリとしてリオーダ・バッファとリザベーション・
> ステーションに送られます。融合されたマイクロ Op
> を扱えるようにするため、リザベーション・ステー
> ションの各エントリは最大3つのソース・オペランド
> に対応できるようになっています。
143Socket774:2010/03/14(日) 12:06:09 ID:mcQhq8zA
http://www.pcmag.com/article2/0,2817,2361273,00.asp
> OTOY, AMD To Ship Remote-Gaming Servers in Q2

Radeon並べてレンダリングサーバはわかるが、ゲームはないだろうと思うんだが。
レイテンシどんだけだよっていう。
144Socket774:2010/03/14(日) 13:07:35 ID:0BFkcrKp
>>143
…レイテンシ? 何を言っているのだ?
145Socket774:2010/03/14(日) 13:20:27 ID:mcQhq8zA
> to allow games to be remotely played via PCs, without
> the need for enthusiasts to constantly reinvest in new hardware.
最新のGPUを持たないPCでリモートプレイ
146Socket774:2010/03/14(日) 13:28:50 ID:h4jJ+M1R
無いよりは遠くにでもあるほうがマシだろう
147Socket774:2010/03/14(日) 13:34:59 ID:tKVvlKO+
ノートやネットブック利用者層をユーザーに加えられるなら美味しい仕組みになるな
148Socket774:2010/03/14(日) 13:56:59 ID:x8BLZ13o
1Gb/sで接続してもPCIeの速度の40分の1だがな。
USB3.0を振るスピードで接続しても8分の1。
現状じゃ廃エンドGPUが初代ゲフォ程度の性能に化けるってことだな。
それって誰得
149Socket774:2010/03/14(日) 13:57:41 ID:Bt2auVlN
NVIDIAの"Optimus"と同じ方向性だろ。
150Socket774:2010/03/14(日) 14:02:05 ID:Bt2auVlN
>>148
簡単じゃん。「1Gb/s」なんて低速で接続しなければいい。
外付けPCIe規格もあるし、なんでそんな低速を前提とするのか理由もわからん。
151えるえる:2010/03/14(日) 14:07:18 ID:yTI07Xf+
は?
このスレ大丈夫か?
152えるえる:2010/03/14(日) 14:08:17 ID:yTI07Xf+
最新の動画圧縮技術を使用しているため、
最新のGPUでデコードしてくらはい。
153Socket774:2010/03/14(日) 14:16:54 ID:h4jJ+M1R
こいつが居て大丈夫なわけがない
154Socket774:2010/03/14(日) 14:18:38 ID:Bt2auVlN
つか。>>143の記事を読んでみてわかったw
オレが全く見当違いのこと言ってるなw
155えるえる:2010/03/14(日) 14:20:36 ID:yTI07Xf+
しかし、時間方向に圧縮しているはずなのに
プレイヤーの入力でリアルタイムに生成される映像を
どうやって遅延なしでエンコードして配信できるんだろうな。
この技術いつも疑問だ。
156Socket774:2010/03/14(日) 14:22:49 ID:x8BLZ13o
>>150
ほとんど密着に近いような外部接続PCIeじゃメリットがなくなるだろ
だったら最初から内臓でいいわけでは?

そもそも、これってあわよくばGPU能力を遠方からシェアできればって目的なんだろ?
まだ転送速度のボトルネックが大きすぎてリモートGPUをするには課題が多すぎるって話。
157えるえる:2010/03/14(日) 14:23:20 ID:yTI07Xf+
むしろ売りは実際のサービス業者のサイトで宣伝されているように、
プラットフォームに依存しないことだろうね。
たとえばPCと携帯電話で同じゲームができてもおかしくない。
携帯側は解像度さげればいいだけ。
158Socket774:2010/03/14(日) 14:31:15 ID:Bt2auVlN
>>156
記事を読む限り、「GPUを遠方からシェア」ではなくて、
ゲームクライアントや何やらは全部遠方にあって、
その結果だけが帰ってくる感じだろ。
ぶっちゃけた話で、将来的にはPCではなくTVであっても、
ネットに接続できればそのままゲームができるような技術だろ。
その為のサーバーじゃね? 読み間違えてなければ。
159Socket774:2010/03/14(日) 14:33:40 ID:0NykeN/F
>>157
それは理想であって、実際は操作性を
考えなきゃいけないからできないだろう>PCと携帯で同じゲーム

たとえば、PSPは「PSのゲームをそのまま移植できる!=ソフト資産が豊富」なのが
売りだったが、LRボタンが足りないせいか、Playstation archieveのソフトの
数はちょっとずつしか増えない。

PS2のゲーム至っては、LRだけではなくて、スティックの数も足りないから、
そもそも移植すら出ないことが多い。FF10とか、バイオ4あたりは
出てもおかしくないはずなのに。

ゲーム機でこれだから、携帯電話とPCで同じゲームなんて夢物語だろう(もちろん、ものによるだろうけど)
160えるえる:2010/03/14(日) 14:34:01 ID:yTI07Xf+
クライアント側はプレイヤーの入力をサーバに伝えるのと、
サーバからストリームでくる動画データをデコードして表示する
ってだけ。だからサーバ側でつくりこみがしっかりしていれば、
クライアント側の環境にはほとんど依存しない。
Webカメラでゲーム画面配信して、コントローラからの入力を
インターネットにのっけっているだけってイメージ。
161えるえる:2010/03/14(日) 14:35:14 ID:yTI07Xf+
>>159
ライトなゲームなら可能だろ。
なにもハードなFPSを携帯とPCで対戦しようなどとはいってない。
クライアント側のソフトの開発費は格段におさえられたうえで、
利用者をふやすことができる。
162Socket774:2010/03/14(日) 14:35:56 ID:x8BLZ13o
そうなのか(´・ω・`)
Java以上に普及に困難を極めそうな話しだの
163えるえる:2010/03/14(日) 14:36:14 ID:yTI07Xf+
まあでもエンコや通信遅延の問題があるから、この技術には限界があるだろうな。
ヘビーユーザの間ではやはりはやらないんじゃね?
164Socket774:2010/03/14(日) 14:40:50 ID:Bt2auVlN
あ。既知外えるえるがいるのか。相手にして楽しいのか? >>159
消える宣言したくせに、消えていないのはキチの典型例だし。

>>162
確かにそれはあるな。まぁ。でもネットワークが発展すれば、
さほど困難でもなさそうな気がするが…。
あるいは、インターネット仲介ではなくて、
ネットカフェやらで考えるならば、
半端に良いクラスのPCを買わなくてもいいとかなw
165えるえる:2010/03/14(日) 14:42:55 ID:yTI07Xf+
しばらく消えるといっただけで永遠にきえるなんていってないぞ、
低脳くんよ。君のオツムでは理解できないから無理にこの件について議論しなくてOK。
166Socket774:2010/03/14(日) 14:44:00 ID:mcQhq8zA
ネットワークを通す場合、帯域はまだ増やせるけど、レイテンシを減らすのは困難なんですよ。
167Socket774:2010/03/14(日) 14:47:27 ID:Bt2auVlN
>>166
「レイテンシ」が「何のレイテンシ」を指しているかわからんが…。
アレか? ネトゲの"遅延"や"ラグ"みたいなものを言っているのか?

それはネットワークの"質"の問題では?
168Socket774:2010/03/14(日) 14:52:01 ID:0NykeN/F
>>166
そうそう。物理的な距離の壁がどうしても
埋められないんだよね。

>>167
例えば、一度に遅れるデータを
1Mbitから100Mbitにするのは簡単だけど、
要求→応答までの時間を100msから10msにするのは
非常に困難。なぜなら物理的に距離が
離れてるから。クラウド時代になってから、
特に重要視されてる。
169Socket774:2010/03/14(日) 14:58:03 ID:Bt2auVlN
>>168
それならば"OTOY"みたいなゲームサーバーを、
地域ごとに複数台建てるしか解決法がないのでは?

でも、いまのネトゲだって、鯖が日本国内に複数台。
地域ごとにあるとは聞かないから大丈夫じゃない?
170えるえる:2010/03/14(日) 15:01:46 ID:yTI07Xf+
レイテンシといっても
電気信号や光を用いて伝達することによる回線の遅延
ルーターなりハブなりの回路やファーム処理を通過する通信回路上の遅延
サーバ上でのソフト処理
と3種類くらいあるの混じっていってるのだが。
今回の方式の場合は、ストリームで提供されるから帯域が増える(レイテンシは直接関係ない)ってのと、
高い圧縮率でエンコードをするためには何フレームかデータをためる
必要があるのでそこでエンコードの遅延がある。

インターネット上のレイテンシの巨大さを考えれば、
クラウド(笑)なんていうのはコンピュータが情報処理の時間コストを死に物狂いで削減してきた歴史を
まっこうから否定するような一過性の電波思想にすぎないので、あてにしてはいけないということだ。
171Socket774:2010/03/14(日) 15:09:22 ID:x8BLZ13o
話しの脱線に拍車をかけてしまった立場で言うのもアレだけど
そろそろ脱線やめないか?
172Socket774:2010/03/14(日) 15:42:47 ID:tKVvlKO+
集金体系を考えるとクラウドに向かうのは必然だろう
173Socket774:2010/03/14(日) 15:49:21 ID:oqhPc0eW
あーはいはい、つまり割れの根絶の第一歩ってことね
174Socket774:2010/03/14(日) 15:53:25 ID:x8BLZ13o
That'sONかw
175Socket774:2010/03/14(日) 16:54:31 ID:aI6Lahvg
国内なら各県毎にゲームサーバーを持つとかすればいいんじゃないかな
あるいは無駄にハイエンドなGPUを持ってる人が有償でマシンパワーを提供するとか
176Socket774:2010/03/14(日) 16:59:28 ID:RHFA9zam
結局東京と大阪あたりにサーバ置いておしまい
177Socket774:2010/03/14(日) 17:06:23 ID:1v6vmRbE
なんとiPhoneでCrysisが!?ゲームストリーミングサービスにAMD勢の「OTOY」が参戦
http://beeep.jp/2009/092580.html

去年既にデモしてるし
178Socket774:2010/03/14(日) 17:17:33 ID:5Ch/VAb8
1コア辺の性能比較するなら
SpecIntの値見るのがいいんだっけ?

4CPUとか合計じゃなくて、1CPUの性能値
見たいんだけどどこかに無いかなぁ
179Socket774:2010/03/14(日) 18:09:17 ID:mcQhq8zA
>>177
すごく・・・詐欺っぽいです・・・
180Socket774:2010/03/14(日) 19:04:59 ID:tKVvlKO+
AMDのOTOYの他にもゲームストリーミングサービスは何社かが始める予定だね

これらはゲームソフト自体もサーバー側にあるから、お試し版なんかだとソフトのダウンロードすら無しに
ホームページ開いてボタン1クリックでいきなりゲームを始められるらしい

正式版は認証ソフトぐらいは要るかもしれんけどね
181Socket774:2010/03/14(日) 20:20:54 ID:mcQhq8zA
OnLive見たけど、やはりレイテンシについては何も言及してないね。
サービスインの延期を繰り返すか、ごく僅かなユーザ数で既成事実を作り、
最後はトンズラかますに100void。

レイテンシが許容されるSLGとかRPGとかなら、UIはローカルで実行して、
レンダリングだけオフロードなんてのがありうるけど、アクション全部
ストリーミング化は無理。
182Socket774:2010/03/14(日) 20:25:30 ID:1v6vmRbE
レイテンシ云々言ってるアホは
ネットでFPSの対戦出来ないって言ってるのと同じ事になるんだがなw
183Socket774:2010/03/14(日) 20:33:00 ID:mcQhq8zA
対戦ゲームは、パケットがすぐに届かなくても見た目不自然にならないように、
レイテンシやジッタを隠蔽する仕組みをゲームシステムの中に作りこんであるのですよ。

でもコントローラ操作→画面表示は隠蔽のしようがない。
184Socket774:2010/03/14(日) 20:36:49 ID:4SAWVRcE
>>178
イマドキのコンパイラは自動並列化で勝手にマルチスレッドコードを吐いたりするから、
SPECIntもシングルスレッド性能を表すとは限らないよ
185Socket774:2010/03/14(日) 20:37:39 ID:1m46xORX
>>183
はいはい。「レイテンシ」って言葉を使いたがっているのは理解した。

自分の発言を上と下で否定しあって何か楽しいのか?
186Socket774:2010/03/14(日) 20:41:15 ID:h4jJ+M1R
これはきっと「画面表示は隠蔽しない」というお花畑だ
187Socket774:2010/03/14(日) 20:42:54 ID:1m46xORX
もしそうならば>>182の発言がせいかいだったな。
188Socket774:2010/03/14(日) 20:48:37 ID:h4jJ+M1R
いやID:mcQhq8zAが言いたいのは
「レイテンシはプログラムで隠蔽出来るが画面表示は隠蔽しない
 だからアクション(全般)は×だが(対戦)アクションは○だ」
ってことだろ

それが雑音てもんだ
189Socket774:2010/03/14(日) 20:48:46 ID:tKVvlKO+
動作に遅延が生じるのは確かだろうね
だからこそゲームストリーミングサービス系の会社はどこも拠点を全国展開してる
でも、遅延がある反面、対戦などでは『よけたはずなのに攻撃を喰らった???』という事は生じなくなるから良い点もある

何はともあれ、PCや家庭用ゲーム機などネット端末ユーザー全てに販売機会が生じるのは美味しい
ネット関連企業やサーバーメーカーがあちこちにサービス拠点を建てる日が来るかもしれない
市場規模は5.5兆円で巨大な産業な訳だしね
190Socket774:2010/03/14(日) 20:48:47 ID:7G2W/SRP
>>178
SPECintで"Auto Parallel: No"と書かれている結果を
見るとよろし。
191Socket774:2010/03/14(日) 21:57:06 ID:aI6Lahvg
現状DX11レベルののグラフィックを処理できるハードは実質HD5000シリーズしかないからな、
何がどう転んでもAMDの独壇場になるんじゃないかな
192Socket774:2010/03/14(日) 22:00:43 ID:C/M54JF2
GTX4系の発表までまだ二週間以上あるしな
193Socket774:2010/03/14(日) 23:39:17 ID:CqhadHln
>>183
こういうこと?

・絵作りをクライアントで行う
通信にラグがあっても、過去に受け取った情報と自キャラに対する操作情報だけを
基に嘘の表示を続けることができる。
敵や他プレイヤーの動きがラグることがあっても自キャラはラグらない。

・絵作りをサーバで行う
自キャラに対する操作をクライアント内で即時反映させることができないので
自キャラまでラグる。
194Socket774:2010/03/15(月) 00:17:06 ID:39uJvQOz
>>193
横からだけど、それで合ってるんじゃないかな。
そのラグの度合いもサーバで絵作り→エンコ→配信だから、今より酷くなると思う。
操作もクライアントでデコードされたモノに対してだから、こっちも酷くなるんじゃないかな。
サーバが混むとラグくなるだけじゃなくて、紙芝居→バッファリング中…とかになる可能性が。

サーバ側も普通のストリーミングと違って各ユーザ毎に全て異なる絵を送る必要があるから
フロンとバックエンドの帯域も凄い事になるし、サーバの消費電力とラックスペースが
従来のタイプに比べて恐ろしい事になりそう。これまでと同じ値段では無理かと。
195Socket774:2010/03/15(月) 06:37:05 ID:s4nBDACi
将棋とか花札なら問題ない(かもw)
196Socket774:2010/03/15(月) 06:53:57 ID:tJO+HzZP
>>193
描画機能の場所での区別の件なんて>183に書いてないだろ
197Socket774:2010/03/15(月) 09:34:47 ID:IjRghQpW
30fps基本で、帯域によって解像度も個人個人で変わってくるんじゃないかな。
ゲーム開始時に環境調査で回線速度測って、プレイ可能な解像度やFPSを設定してから開始とかね
殆どのユーザーがVGA(640*480)で30fpsの設定になるんじゃないかな
将来動画圧縮技術が進歩していけばより高設定に出来そうだけど
198Socket774:2010/03/15(月) 09:51:41 ID:7XoXTHm8
圧縮自体は親機側のハードウェアでやればいいだけだし
199sage:2010/03/15(月) 12:51:06 ID:0+CQ7iuY
>197
今更VGAで客は呼べないよ……
携帯でならともかく。携帯専用にしてもいいけど、それじゃせっかくのプラットフォーム非依存のウリを捨てることになる。
かといって環境に余裕のある人は高解像度だったりすると、一方的に狩れるからゲームバランスが崩壊。
そのために解像度や視界制限したりすると、糞ゲ確定
200Socket774:2010/03/15(月) 12:58:54 ID:tJO+HzZP
環境設定出来るとゲームバランス崩壊・・・
201Socket774:2010/03/15(月) 13:16:24 ID:4RdCVCEp
帯域に見合ったオブジェクトを送ってやればいいだけじゃないかい
ジオメトリだけ送って後は任せてしまうとかでもいいし
サーバーでユーザーが関与できない範囲の物理演算を済ましてしまうとかも面白い
202Socket774:2010/03/15(月) 13:18:22 ID:+gHAVQnn
プラットホームフリーが形無しだな
203Socket774:2010/03/15(月) 13:22:04 ID:4RdCVCEp
ああリモートGPUの話なのか
サーバーサイドレンタリングと勘違いした
ゴメン忘れてくれ
204Socket774:2010/03/15(月) 14:00:34 ID:+gHAVQnn
レンダリングサーバーとか当の昔に普及しちゃって市場も出来上がってるじゃん。
205Socket774:2010/03/15(月) 15:00:16 ID:IjRghQpW
>>199
> 今更VGAで客は呼べないよ……
別にVGAオンリーとか最高がVGAとかじゃないだが
全員が光でHD余裕とかなわけじゃなし、サーバー側のリソースや一般的な回線速度を考えるとってだけだ

> 携帯でならともかく。携帯専用にしてもいいけど、それじゃせっかくのプラットフォーム非依存のウリを捨てることになる。
何が非依存なんだ?
プラットフォームの違いなんか、解像度とデコード能力の差しかない

> かといって環境に余裕のある人は高解像度だったりすると、一方的に狩れるからゲームバランスが崩壊。
意味不明だな
高解像度になってもデテールが詳細になるだけでオブジェクトの数や位置関係が変わるわけじゃないよ
少なくともゲーム性に影響は全くない

> そのために解像度や視界制限したりすると、糞ゲ確定
世の中糞ゲしか存在しないのか
206Socket774:2010/03/15(月) 15:05:06 ID:+gHAVQnn
ID:IjRghQpWがゲームに対する見識が浅いことがよくわかった
207えるえる:2010/03/15(月) 20:34:48 ID:BdHa7b/f
ワラタ。まだこのネタの議論やってんのか。
208Socket774:2010/03/15(月) 21:47:00 ID:+gHAVQnn
たぶんZの仕業
209Socket774:2010/03/15(月) 21:47:14 ID:shLwjaQO
>>196
うん。

> でもコントローラ操作→画面表示は隠蔽のしようがない。
↑このあたりからなんとなく読み取った。

安藤さんのでも触れられてるね。
ttp://www.geocities.jp/andosprocinfo/wadai10/20100313.htm
210えるえる:2010/03/15(月) 21:59:50 ID:BdHa7b/f
いまのところはアクション性の高いゲームではやはり遅延がでかすぎてゲームにならないらしいな。
ライトなゲームはそれなりに遊べるようだ。

ゲーミングクラウドサービス「OnLive」、ベータテストの様子はどうか?
http://beeep.jp/2010/017738.html
OnLiveとはここが違う。設立者であるデビッド・ペリー氏が語る,Gaikai流レイテンシ解決の方法
http://www.4gamer.net/games/000/G000000/20090714033/
OnLive Game Service Preview - Is this the future of PC gaming?
http://www.pcper.com/article.php?aid=859&type=expert&pid=6
211Socket774:2010/03/15(月) 22:41:32 ID:zUy0XIGw
「今ここにある」6コア AMD Opteron(TM)プロセッサプラットフォーム
http://ad.impress.co.jp/special/amd1003/enterprise/
212Socket774:2010/03/15(月) 23:19:08 ID:IjRghQpW
AMDさんの技術力は世界一っぽい

なんとiPhoneでCrysisが!?ゲームストリーミングサービスにAMD勢の「OTOY」が参戦
ttp://beeep.jp/2009/092580.html

・iPhoneにCrysisをストリーミングさせて動作
・BioshockやGrand Theft Auto IV、World of Warcraft等がすでに動作しており、
・OTOYは1080pの60fpsでストリーミングが行われており、
快適なプレイが楽しめるネットワーク帯域幅として20Mビット前後が閾値になる

課金システムを構築できれば運用出来そうなレベルに仕上がってるみたいだw
213Socket774:2010/03/15(月) 23:31:44 ID:b/OM+m29
世界中に拠点を作るのなら、夜や休日はストリーミングサービスをやって
昼は処理能力の何割かを企業にレンタルしたりとかも面白いかもね
214Socket774:2010/03/15(月) 23:31:46 ID:jAoa5PZl
予言…次レスに
Fusionイラネって書き込まれる
215Socket774:2010/03/15(月) 23:34:14 ID:+gHAVQnn
雑豚はいつまでグダグダくだらねぇネタ引っ張ってんだウザイから消えろクズ
216Socket774:2010/03/16(火) 00:15:15 ID:EyaCDgqv
将来のゲーム業界のハードウェアはAMD(OTOY)が支配しそうだな

ネットワークレンダリングのサーバーはRADEON+OpteronのOTOY
コンシューマ機のGPUはRadeonの派生(DX11やOGL4世代)
携帯機の中身はSnapdragon(Radeonのサブセット)
PCのディスクリートもRadeon

DX11策定はAMD主導、それを真似たOGL4もAMDが先行
DX11ゲーム開発のほぼ全てに機材貸与などで関与
XBX360とWiiはRadeonのサブセット
サーバー用のOpteronとATI Streamの総合プラットフォーム所持
217Socket774:2010/03/16(火) 01:33:57 ID:nEhyh+NC
盛り上がってまいりました!!!
218Socket774:2010/03/16(火) 02:12:58 ID:RVyERg9N
なにげに、開発で分散レンダは重要だよな。
219Socket774:2010/03/16(火) 06:23:36 ID:EyaCDgqv
Super Micro to launch AMD render cloud
ttp://www.theregister.co.uk/2010/03/11/supermicro_otoy_render_cloud/

スーパーマイクロとOTOYと共同開発でリリース予定です。
スペックは 2way 12core Opteron 2.2G 125set 及び HD5970 が500枚で、倍精度が約500TFlops。
効率半分でも250TFlops、単精度なら2.3P位。
220Socket774:2010/03/16(火) 09:12:32 ID:nEhyh+NC
デュアル12コアOpteronに5970を4枚載せたサーバを125台ラックに納めて、
お値段$2Mだから、サーバ一台あたりは144万円。そんなもんかねえ。
221Socket774:2010/03/16(火) 09:16:33 ID:pImm+kO9
異分野から利益を奪え。(高性能から低消費電力へ。)
http://www.ne.jp/asahi/comp/tarusan/main223.htm
222Socket774:2010/03/16(火) 09:48:09 ID:1saA2Z5E
>>221
わざわざ規制前の旧車買ったりする人には、面白くない未来予想だなぁ・・・
今の車に魅力を感じないように、PCにも魅力感じなくなっていくんだろうな・・・
223Socket774:2010/03/16(火) 09:51:19 ID:nEhyh+NC
たるさんは適当なことを都合のいい部分だけつなぎ合わせて
もっともらしい(つもりの)言い回しで書き流してるだけですよ。
224Socket774:2010/03/16(火) 09:56:20 ID:z3wlijM2
とりあえず誰かまとめて
225Socket774:2010/03/16(火) 10:19:19 ID:ZL58oBSk
何これ?有名な人なの?

自分のサイトで垂れ流してる分には勝手だが、
掲示板に書こうものならフルボッコ必至な斜め上の妄想。
ニュースやワイドショーのコメンテーター(wを彷彿とさせる。
訳知り顔で語り入ってるのが余計に痛々しい。
226Socket774:2010/03/16(火) 10:40:30 ID:pImm+kO9
Ballmer氏の賭け−クラウドに全面シフトするMicrosoft
http://enterprise.watch.impress.co.jp/docs/series/infostand/20100315_354806.html

団子が言ったことを思い出して読むとよりいっそう楽しめます
227Socket774:2010/03/16(火) 11:02:24 ID:z3wlijM2
ウンコの発言なんて思い出すだけで多大な人生の浪費
そんなデメリットを覆い隠せるほど価値ある発言なのか?
228Socket774:2010/03/16(火) 11:27:07 ID:Nan1+DOB
>>221
オタクコアって言い得て妙だなあと思ってみてたら
オクタコアだった
229,,・´∀`・,,)っ-○○○@CR-Z:2010/03/16(火) 12:45:57 ID:jkEkPe8f
>>138-139
RSのエントリ「数」は大した問題じゃないと思うんだけどね。

むしろK7整数パイプラインの弱点は、ディスパッチされたμOPがレーン変更できないこと。
独立した車線3つ(分散型RS)と、流れに応じて車線変更できる4車線(集中型RS)と、
どっちが渋滞しやすいかは明らかだね。
付け加えると、車とは違って命令の流れにはクリティカルパスがあるから、依存関係によって連鎖的にストールする。

メモリ操作1つとってもレイテンシは不定なのにデコード前段階で充填率高めるスケジューリングができるわけがないじゃん。
まあ、そもそもL1Dが2-Way Set Associativeだったり、スループットが上がらない理由は複数ありそうだけどね。
Bulldozerが構成を大きく変えてきたのはそのへんの反省点が伺えるけどな。

>>226
えーと、何言ったっけ?

XMLHttpRequestの活用方法すら新参のGoogleに負けてるようじゃさすが万年赤字だわなMSN部門。
これでいいかな?
230Socket774:2010/03/16(火) 12:51:02 ID:OwI7VSM7
口だけ番長キタ━━━━(゜∀゜)━━━━ッ!!
231Socket774:2010/03/16(火) 15:30:22 ID:8G/hSTa0
6コア発売はいつ?
232Socket774:2010/03/16(火) 18:18:26 ID:sJTpOiD9
4月末ローンチで5月中発売予定
233えるえる:2010/03/16(火) 18:35:22 ID:uKI1c8qj
>>226
クラウド厨は有害です。
234えるえる:2010/03/16(火) 20:25:16 ID:uKI1c8qj
RSがOOOのスケジューリングのためにある肝心の大リソースなのに
デコードの段階で依存解決なんてO原電波にはワラタ。
235Socket774:2010/03/17(水) 00:24:43 ID:9rFS/780
236Socket774:2010/03/17(水) 00:35:18 ID:I86Lh/Tz
>>235
よう、おっさん
237Socket774:2010/03/17(水) 00:35:22 ID:dIVS6OBw
ちまちまパーツ変えるのが好きなので、ソケット互換はありがたい。
238Socket774:2010/03/17(水) 00:46:03 ID:9rFS/780
>>236
まぁ確かに枯れてるけどな。今もAtomぐらいしか興味ないし。
239Socket774:2010/03/17(水) 00:58:55 ID:KTWDxoo+
>>229
>デコード前段階で充填率高めるスケジューリングができるわけがない
K8のパックバッファでは依存解消をできるわけがないから、空いてるレーンを詰めて充填率を高めてるだけじゃねって話では
240,,・´∀`・,,)っ-○○○@CR-Z:2010/03/17(水) 03:06:06 ID:WLpABbW8
Pentium 4があったんで忘れがちだけど、Athlonの整数演算性能って
コアのサイズ半分以下のPentium III(ALU 2本)とどっこいだったろ。
その当時から3Wayの分散型RSにALU+AGUがぶら下がる構造だったよ。

FPクラスタ側は36エントリの集中型スケジューラで再度スケジューリングしてる。
(同クロックのIntelプロセッサよりもFP(x87)性能で優れていた理由はここにあると思われる)

いずれにせよレイテンシ・スループット可変の命令が多い中で空いた演算ユニットに
臨機応変にμOPを振り分けるには集中型RSの方が都合がいいでそ。
241Socket774:2010/03/17(水) 17:19:38 ID:CL+9JydK
パッド入力→サーバー→反応戻し(グラフィック返し)が、16msのローカル環境と、
それが10倍で足りるかも判らない反応速度のネットワークレンダリングでは、
遊べるゲームジャンルに隔たりがあるよねー。

シューティングとかアクションは無理でしょう。
242Socket774:2010/03/17(水) 17:41:49 ID:6PBi5ACd
ネットワークレンダリングの話は出てきてないぞ
243Socket774:2010/03/17(水) 21:05:56 ID:q5c5Gi5D
デュアルコアPOWER4はAthlon64 X2が起源ニダ
244Socket774:2010/03/17(水) 21:36:30 ID:MYhkhJfl
>>234,240,243
雑音に特徴的な突発的電波
245Socket774:2010/03/17(水) 22:21:26 ID:P507XM0j
とりあえず大手町のIX(インターネットエクスチェンジ)近辺に住もうぜ!

C:\>ping pc11.2ch.net (カリフォルニア州サンフランシスコ)
Pinging pc11.2ch.net [207.29.253.145] with 32 bytes of data:
Reply from 207.29.253.145: bytes=32 time=129ms TTL=51
Reply from 207.29.253.145: bytes=32 time=108ms TTL=51
Reply from 207.29.253.145: bytes=32 time=132ms TTL=51
Reply from 207.29.253.145: bytes=32 time=108ms TTL=51
Ping statistics for 207.29.253.145:
Packets: Sent = 4, Received = 4, Lost = 0 (0% loss),
Approximate round trip times in milli-seconds:
Minimum = 108ms, Maximum = 132ms, Average = 119ms

C:\>ping clock.nc.fukuoka-u.ac.jp (福岡県福岡市)
Pinging clock.nc.fukuoka-u.ac.jp [133.100.9.2] with 32 bytes of data:
Reply from 133.100.9.2: bytes=32 time=32ms TTL=49
Reply from 133.100.9.2: bytes=32 time=31ms TTL=49
Reply from 133.100.9.2: bytes=32 time=31ms TTL=49
Reply from 133.100.9.2: bytes=32 time=30ms TTL=49
Ping statistics for 133.100.9.2:
Packets: Sent = 4, Received = 4, Lost = 0 (0% loss),
Approximate round trip times in milli-seconds:
Minimum = 30ms, Maximum = 32ms, Average = 31ms

C:\>ping www.jpix.ad.jp (東京都千代田区)
Pinging www1.jpix.ad.jp [202.90.10.90] with 32 bytes of data:
Reply from 202.90.10.90: bytes=32 time=6ms TTL=56
Reply from 202.90.10.90: bytes=32 time=5ms TTL=56
Reply from 202.90.10.90: bytes=32 time=5ms TTL=56
Reply from 202.90.10.90: bytes=32 time=5ms TTL=56
Ping statistics for 202.90.10.90:
Packets: Sent = 4, Received = 4, Lost = 0 (0% loss),
Approximate round trip times in milli-seconds:
Minimum = 5ms, Maximum = 6ms, Average = 5ms
246Socket774:2010/03/17(水) 23:02:16 ID:fMfGJZ4e
このスレの雑音レッテル厨 == うんこ
何もかけないくせにうざいから雑音スレにすっこんでろw
247,,・´∀`・,,)っ-○○○@CR-Z:2010/03/17(水) 23:38:19 ID:WLpABbW8
たまにPentium 4にはL1Dが無いとかプリフェッチとか珍説を書くじゃないですか
248Socket774:2010/03/18(木) 00:35:54 ID:gpAIjyYy
>>240
>いずれにせよレイテンシ・スループット可変の命令が多い中で空いた演算ユニットに
>臨機応変にμOPを振り分けるには集中型RSの方が都合がいいでそ。
演算ユニットはパイプライン化されてるんだし、詰まるのは演算ユニットでなくRSのほうだろ
大規模共有RSから実行可能な3〜4μopsを1サイクルで選び出すなんて芸当はどれだけの資源を遣うんだろう
249Socket774:2010/03/18(木) 00:54:27 ID:Q5skJSwd
馬鹿の相手するなよ
250,,・´∀`・,,)っ-○○○@CR-Z:2010/03/18(木) 01:59:30 ID:+1oFHTk6
LSUはデータハザードで詰まるしそれに伴って後続の命令発行も滞る。
んで、相対的に汎用ALUに空きができるから、依存関係のない命令を探してきて
発行することで臨機応変にパイプラインを立て直すことが出来る。

一般的に集中型RSの大規模化は困難といわれてるけど
現に3つのALUに同時発行な4 issueの実装をCore MAがやってるわけだから
3-Wayの分散型実装じゃ敵うわけがない。

これは前提として、Bulldozerは2〜3issue(?)の集中型RSを整数クラスタ毎に持つ構造に
なってるように思えるんだが。


一方FPクラスタのほうは、こんな(電波な)説まで流れてるけど
http://aceshardware.freeforums.org/server-cpus-in-2010-and-2011-an-overview-t934-30.html
251,,・´∀`・,,)っ-○○○@CR-Z:2010/03/18(木) 02:12:24 ID:+1oFHTk6
どうやら元ネタはこれらしい

Bridged Floating-Point Fused Multiply-Add Design
http://users.ece.utexas.edu/~quinnell/Research/Bridged%20Floating-Point%20Fused%20Multiply-Add%20Design.pdf

FMUL×2, FADD×4としても使える




SSE性能はSandy Bridge
252,,・´∀`・,,)っ-○○○@CR-Z:2010/03/18(木) 02:15:38 ID:+1oFHTk6
失礼、途中で投稿してしまった

これがBulldozerに実装されればFMUL×2, FADD×2の4ユニットとしても使える可能性がある。
結果、レガシーSSE性能は8コアでSandy Bridgeの6コアを越えうる・・・かもしれない。
253Socket774:2010/03/18(木) 02:19:47 ID:MRFLwcUL
透明あぼーんが日課になりつつあるなぁ。
コテをNG登録すれば最初から表示しなくなるんだっけ?
254Socket774:2010/03/18(木) 05:39:46 ID:ZLDP1CO5
ああ、そうだね
電波系のコテはあぼ〜ん推奨
255Socket774:2010/03/18(木) 05:48:20 ID:ewgG+yd2
>>247
・たまにPentium 4にはL1Dが無い
・たまにPentium 4にはプリフェッチ
なんか本気出してきたな
256Socket774:2010/03/18(木) 06:06:05 ID:JtDqZw1D
>>251
>Bridged Floating-Point Fused Multiply-Add Design

通常のFMA演算器は(独立した演算器と比べて)加算や乗算の性能が低下するが
BFMA演算器は加算器と乗算器をブリッジするので
加算と乗算の性能は落ちない(FMAの性能は落ちる?)

というのが主な内容ではないのだろうか?
257,,・´∀`・,,)っ-○○○@CR-Z:2010/03/18(木) 06:16:36 ID:+1oFHTk6
いや、従来FMAと同等の性能は出るのでは
むしろFMA+FAddでいい気がしてるんだが
258,,・´∀`・,,)っ-○○○@CR-Z:2010/03/18(木) 06:27:35 ID:+1oFHTk6
>>255
落ち着けよプリフェッチフェチ
259Socket774:2010/03/18(木) 08:13:28 ID:ewgG+yd2
Pentium 4のL1Dやプリフェッチの話題自体ここんところのスレで出なかったはずだから
ちょっと解読のしようがない
まさに突然電波
260,,・´∀`・,,)っ-○○○@CR-Z:2010/03/18(木) 08:53:34 ID:+1oFHTk6
プリフェッチくんはとぼけるのがうまいねワロス
261Socket774:2010/03/18(木) 10:36:57 ID:q+Vy/Ln2
やっぱ団子のCR-Zって本田△にかけてるの?アンチ茸なの?
262Socket774:2010/03/18(木) 10:37:06 ID:XeHK4JNA
bulldozerってどのくらいの性能になるのかなぁ…。
神CPUになると期待してるんだけど、100GFlops超になるかな。
263Socket774:2010/03/18(木) 10:55:47 ID:ewgG+yd2
小数点をCPUに計算させたいんならせめてK10にしとけ
264262:2010/03/18(木) 12:00:00 ID:XeHK4JNA
>>263
Bulldozerは整数を犠牲にして性能をあげるんじゃなかったっけか??
265Socket774:2010/03/18(木) 12:05:26 ID:I1mXtTAt
Bulldozerは整数を犠牲にしてコア数を増やす。128bit前提で考えればコアあたりの
Float演算器は変わらないから、コアが増えた分だけ浮動小数点演算性能は上がる、
という目論見、願望(あるいは妄想)。
266Socket774:2010/03/18(木) 12:20:47 ID:ewgG+yd2
無駄を省いて整数性能を上げるのがBull
細かいことは知らんけど既出の図なんかを見る限り128bitSSEは2基→1基
レイテンシもFP辺りは大幅に増えた
267Socket774:2010/03/18(木) 12:52:34 ID:3BXS81QU
SSEは1モジュールで2基じゃねぇの?
268Socket774:2010/03/18(木) 13:01:02 ID:SsEuThqA
1スレッドあたりの性能落とすなら
モジュール化に+してHT実装くらいしないと戦う前から負けてね?
269Socket774:2010/03/18(木) 13:10:15 ID:3BXS81QU
>>268
「1スレッドあたりの性能落とす」といっても、「理論値」を落としただけだしなぁ。
同クロックで比較した場合、CPUの機能をフルで使えるような、
「理想的なプログラム」を動かした場合は確かにK10の方が優れているが、
現実にはそんな「理想・妄想」プログラムが合致する時なんて、
ほとんど皆無に等しいから、効率優先をとったのはいい事だろ。

あと、"戦う前"から"何に負けているか"が疑問。
270Socket774:2010/03/18(木) 13:12:25 ID:58lBd8I6
Bulldozerは1モジュールあたり128bitSSE×2基
片方のコアがSSEユニットを使用していないときは2基とも占用できるし、256bitSSEとしても使える
271Socket774:2010/03/18(木) 13:35:54 ID:58lBd8I6
Bulldozerは物理的には、例えば4モジュール8コアなら128bitSSE×8基
でも使用状況によって振る舞いは異なる

@4モジュール8コアが128bitSSEをフルロードで使う場合
 →4モジュール8コアなら128bitSSE×8基
  →コア当たり128bitSSE×1基

@4モジュール8コアが256bitSSEユニットを低頻度で使う場合
 →4モジュール8コアなら256bitSSE×4基
  →コア当たり256bitSSE×0.5基

B4モジュール8コアが128bitSSEユニットを低頻度で使う場合
 →4モジュール8コアなら128bitSSE×16基
  →コア当たり256bitSSE×2基

C4モジュール8コアが256bitSSEユニットを低頻度で使う場合
 →4モジュール8コアなら256bitSSE×8基
  →コア当たり256bitSSE×1基

D各モジュールが1コアしか使わない場合
→4モジュール8コアなら128bitSSE×16基
  →コア当たり256bitSSE×2基
 →4モジュール8コアなら256bitSSE×8基
  →コア当たり256bitSSE×1基

特にSSEの充填率に空きがあるB・Cのようなケースでは恐ろしい処理能力になる
272Socket774:2010/03/18(木) 13:43:17 ID:58lBd8I6
あうあう
長いの書いたらミスが・・・

@が2度出てくるが、2度目の@は正しくは↓

A4モジュール8コアが256bitSSEユニットをフルロードで使う場合
 →4モジュール8コアなら256bitSSE×4基
  →コア当たり256bitSSE×0.5基

あと当然ながら、BやCは物理的なコアの数を超越して1クロックあたりの処理能力が倍になるという意味ではない
273Socket774:2010/03/18(木) 15:06:11 ID:5m679vs7
どうせなら4モジュール8コアって言いかたやめて
普通に4コア8スレッドって言っとけばいいのにな
274Socket774:2010/03/18(木) 15:13:37 ID:3BXS81QU
マーケティングの問題でしょ? あとは性能が伴うかどうか。
275えるえる:2010/03/18(木) 19:11:55 ID:uW1Bs5L7
>Pentium 4があったんで忘れがちだけど、Athlonの整数演算性能って
>コアのサイズ半分以下のPentium III(ALU 2本)とどっこいだったろ。
いや、むしコアの性能はAthlonのほうが上だが、
キャッシュの性能差で互角レベルまでなんとかもちこたえていたのがPenIIIだよ。
実アプリ全体がIntel系に最適化されているという現実考慮にいれると、
どう考えてもPentium IIIよりは格上です。
276Socket774:2010/03/18(木) 19:35:00 ID:dNYCeeGk
>>273
ttp://pc.watch.impress.co.jp/docs/column/tawada/20100311_353995.html
> 他方、PassMarkの浮動小数点演算テストのように演算ユニットを
> フルに使っていることが原因と見られるHT有効/無効の差がない結果や、
> 同じく PassMarkのFind Prime Numbersのように
> オーバーヘッドが原因と見られるHT無効時のほうが
> 良好なスコアを出す結果が見られることも気に留めておきたい。

ttp://www.4gamer.net/games/084/G008477/20100310068/
> ゲームにおいては,HTTを無効化したほうがいい場面もしばしば見られる

無効と有効で大差ないHyper-Threadingを使ったIntelのNコア2Nスレッドと
仮にデコーダを常に2スレッドで共有するベタな構成だとしても
1スレッドごとにあたりK6-IIIを上回る(K6系はプリフェッチなどがないし、分岐予測などもチープ)
であろうBullのNコア2Nスレッドを同列に並べて売るほどAMDのCPU部門に余裕はないでしょ
(ある意味、低いIPCのNetBurstの高クロックにモデルナンバーをぶつけたのと同じ状況)

余裕があれば、同列にした上で
「IntelのNコア2NスレッドはNコアNスレッドと大差ない」
というネガキャンを打って戦う手もあるけど
277Socket774:2010/03/18(木) 19:37:20 ID:YKGHAjRB
いや、むしコアの性能はAthlon64のほうが上だが、
キャッシュの性能差で互角以上レベルでなんとかもちこたえていたのがCore2だよ。
実アプリ全体がIntel系に最適化されているという現実考慮にいれると、
どう考えてもCore2よりは格上です。
278えるえる:2010/03/18(木) 19:41:22 ID:uW1Bs5L7
>>277
なにがいいたいのかよくわらかんな。
Core 2はもちこたえてるんじゃなくて、Athlon64に余裕でかってたからな。
Intelにキャッシュ周辺の性能差でまけたといっても半分以上は正解だよ。
279えるえる:2010/03/18(木) 20:11:55 ID:uW1Bs5L7
AMD敗北の歴史は、
・Intelに製造プロセスで遅れをとっている
・上と関連しているがIntelの高速/大容量のキャッシュにまけている
・そのくせアーキテクチャ的にメモリオーダリングが弱いまま
が大部分の原因を占めているな。
あとは、実アプリにはIntel向けに最適化されてものが多いというのかオマケとしてある。
280えるえる:2010/03/18(木) 21:04:42 ID:uW1Bs5L7
というのは軽いウソだ。

AthlonはALUが3つもあるのに、
Pentium IIIは2つしかない。
コアのトランジスタ数でみてもAthlonの方が多かったはず。
つまりコアはAthlonの方が気合が入っている。
281Socket774:2010/03/18(木) 21:18:18 ID:Xi+2txqf
低脳過ぎくそわろた
282えるえる:2010/03/18(木) 21:27:47 ID:uW1Bs5L7
具体的にどこが低脳なのでしょうか?
高脳様>>281先生のAthlon vs Pentium III論
が聞きたいねぇ。
283Socket774:2010/03/18(木) 21:36:44 ID:Xi+2txqf
えるえるのレス数でみてもえるえるの方が多かったはず。
つまりレス内容はえるえるの方が気合が入っている。
284Socket774:2010/03/18(木) 21:37:05 ID:ufL7v/OU
285えるえる:2010/03/18(木) 21:39:49 ID:uW1Bs5L7
なるほどそのとおりだな。
ゆえにAhtlonのほうが気合が入っている。

自信がないのか
もっと具体的に体系的に説明してほしいね。
286えるえる:2010/03/18(木) 21:45:23 ID:uW1Bs5L7
Katmai vs AthlonのときはAthlonがかっていたか
Thunderbirdでは互角。
ThunderbirdのL2は64bit/clockの帯域だが、
CoppermineのL2は当時から256bit/clockだったんです。
つまりcacheの差でCoppermineが持ちこたえているという状況。
287Socket774:2010/03/18(木) 22:50:45 ID:lqLMQw1I
どうしてコテをつけるやつはこうもアレなんだ
288Socket774:2010/03/18(木) 23:27:53 ID:CMwPYB3D
テヘこないね
128bit品掴まされたから傷心旅行でも行って旅先で氏んだのかな
289,,・´∀`・,,)っ-○○○@CR-Z:2010/03/19(金) 01:19:14 ID:ltH+oqt5
Pentium IIIはレジスタ-メモリ間オペレーションをComplex Decoderでしか捌けなかったから遅かった。
μOPs Fusionを実装したPentium Mでは同クロックのK7, K8と互角以上にやり合ってる。

要するにALUの数ではないということだ
290Socket774:2010/03/19(金) 01:26:22 ID:wCZ3b7JZ
http://pc.watch.impress.co.jp/docs/2009/0318/kaigai495.htm
>おそらく、将来、AMDのCPUはここからがIBMの流れを汲むアーキテクチャだと指摘できるようになるだろう。

BulldozerってどのへんがIBMっぽいの?
291,,・´∀`・,,)っ-○○○@CR-Z:2010/03/19(金) 01:32:36 ID:ltH+oqt5
実はSSSE3を使えばpmaddubsw→pmaddwd→pshufbだけでできるんだな。

pmaddubswの第2引数
__m128i vGSMultipler1 = _mm_set_epi8(
ScaleR, ScaleG, ScaleB, 0,
ScaleR, ScaleG, ScaleB, 0,
ScaleR, ScaleG, ScaleB, 0,
ScaleR, ScaleG, ScaleB, 0
);

pmaddwdの第2引数
__m128i vGSMultipler2 = _mm_set_epi16(1, 1, 1, 1, 1, 1, 1, 1);

pshufbの第2引数
__m128i vSplat = _mm_set_epi8(
0xff, 15, 15, 15,
0xff, 11, 11, 11,
0xff, 7, 7, 7,
0xff, 3, 3, 3);
292,,・´∀`・,,)っ-○○○@CR-Z:2010/03/19(金) 01:36:48 ID:ltH+oqt5
誤爆した



>>290
SSE5(現XOP)の仕様見たときものすごいAltivecぽいって思ったが・・・
たしかMACヲタ(笑)が言うにはAltivec/VMX(XOPでいうvpperm)vpermは
AIM連合が実装の特許を持ってるだとか云々
293Socket774:2010/03/19(金) 05:57:31 ID:rOG24ZCr
既にK6とK7の比較が散々されてきたのに
知的障害者が無意味にPen3持ち出したの図
294,,・´∀`・,,)っ-○○○@CR-Z:2010/03/19(金) 07:33:05 ID:ltH+oqt5
と、わけのわからないことをわめきちらすプリフェッチであった
295Socket774:2010/03/19(金) 08:08:56 ID:rOG24ZCr
知的障害者が>293を理解出来ないのは
K6が整数パイプ2本な件を散々言われてたことを瞬時にして忘れさっているからか
それともやはり知能が最重度の障害を負っているためか
296,,・´∀`・,,)っ-○○○@CR-Z:2010/03/19(金) 08:09:54 ID:ltH+oqt5
何を言ってもプリフェッチはプリフェッチ
頭は良くなりませんよ
297えるえる:2010/03/19(金) 18:30:03 ID:6xAmJmLq
最近の馬鹿はスーパーパイプラインもしらんのか。
K6はP6/K7以降のスーパーパイプラインx86とは設計思想がかけ離れているから比較にならんよ。
298えるえる:2010/03/19(金) 18:31:03 ID:6xAmJmLq
過去を忘れてしまった後藤はBobやBullとK6が似ているなどという怪電波をとばしているが、
Bob/Bullはスーパーパイプラインだろうね。
299Socket774:2010/03/19(金) 18:42:29 ID:rOG24ZCr
コピペしか能が無いと
24時間検索で新しい単語が見つかると途端にそれを崇め奉ってしまうんだろうけど
ttp://www.daw-pc.info/hard/cpu/cpu2.htm
特別な技術とかでなく段数の多少で
無印・スーパー・ハイパーと言い分けてるのが現実世界
勿論押入れのお花畑のことは存じ上げませんが
300,,・´∀`・,,)っ-○○○@CR-Z:2010/03/19(金) 20:12:58 ID:ltH+oqt5
臭いぞプリフェッチ
301Socket774:2010/03/19(金) 20:32:12 ID:vui+b9/7
もう3年ぐらいになるのか?この糞コテが芽生えてから
302Socket774:2010/03/19(金) 20:49:56 ID:rOG24ZCr
↓この電波発言(ようするにフェッチ=プリフェッチ)でも3年半前だからさらに前からコテ出してんなら4年はいくんじゃないの?

116 名前:・∀・)っ-○◎●創聖のダンゴリオン ◆DanGorION6 :2006/11/12(日) 22:49:24 ID:QMJBB7zy
データロードの投機実行のことだからプリフェッチ以外ありえんよ、池沼の負け惜しみ乙
303えるえる:2010/03/19(金) 21:01:36 ID:6xAmJmLq
>>299
パイプラインとスーパーパイプライン登場した時期と意図が異なるのだが、
そんなのも理解できないやつが増えたんだな。
ハイパーはIntel用語の域をでていないからまた別だが。
304Socket774:2010/03/19(金) 21:18:16 ID:wCZ3b7JZ
命令のレイテンシからしてBulldozerは高クロック指向が予想されるわけでしょ
長い段数を持ったパイプラインになりそうなもんだけど
305えるえる:2010/03/19(金) 21:34:03 ID:6xAmJmLq
いや、NetBurst, POWER6, Cell
のようなクロックで性能を稼ぐというアプローチは取らないと思うよ。
しかし、後藤のようにBull/BobのコアはK6と似ているというのはあまりにもナンセンスだな。

パイプライン処理っていうのはCPU内のリソースを時間方向にオーバーラップして実行するという考え
(スループットを1命令1サイクルに近づける)という発想だが、
スーパーパイプラインっていうのは回路設計的な性格もはいって
高クロック目的でパイプラインピッチをさらに等分、最適化、多ステージ化した世代といえる。
これは今では当たり前の最適化であって、LRBのような例外をのぞきいまさら汎用CPUで
6ステージとかありえないね。
306Socket774:2010/03/19(金) 21:45:04 ID:rOG24ZCr
>>304
Power6は5とパイプライン段数一緒でクロック大幅増
その理由はインオーダ化のためとも言われたり
技術者はワットパフォーマンスのためのインオーダだと言ってたり(クロックに言及してないってことは上記は無いと)
真相は闇だけど

丁度>299リンク先の最後にスーパースカラとクロックの関係が載っている
コア全体のクロックなんてどこがボトルネックになっても上がらないもんだろうと思うから
パイプライン本数減らしたからって必ずクロック上がるもんじゃないだろうけど
しかし無駄を省いた設計は高クロックのためだろうね
「シングルスレッド性能で妥協しない」ってのは未だに重要だし
307えるえる:2010/03/19(金) 22:00:33 ID:6xAmJmLq
>Power6は5とパイプライン段数一緒でクロック大幅増
IBM信者か?
Power6はパイプラインステージ数はほとんど変わってないのに特殊な技術で高速化したという
大げさなふれこみだったが実際には増えていたのと、OOO→IOの変更で普通は同じ遅延でもステージ数減るから
トータルとしてはかなり細分化されていたっておちだったはずだ。
Power6は5とパイプライン段数一緒でクロック大幅増
http://home.dei.polimi.it/silvano/FilePDF/ARC-MULTIMEDIA/Presentation_IBM_Power6.pdf
まあここのパイプラインの図みてプリコードから数えてすくないといえるやつがいたら
すげーセンスだと思う。
308えるえる:2010/03/19(金) 22:01:57 ID:6xAmJmLq
POWER6は低消費電力ともいいがたく、Bullの思想にはあってない。
POWER7のほうがOOOでありながら多数マルチコア向けになったといえる。
309Socket774:2010/03/19(金) 22:02:11 ID:Yu24s30L
Bulldozerにもターボブーストを乗せてくると思うが
CPU内部のクロックの区画はどのレベルで設けてくるんだろうね
310えるえる:2010/03/19(金) 22:04:04 ID:6xAmJmLq
まあPOWER7の電力もでかいことはでかいが。
311えるえる:2010/03/19(金) 22:06:59 ID:6xAmJmLq
>>306
まあ夢をぶちこわすようなマジレスは控えていたけど、
本当にシングルスレッドでも高性能なら、はっきり
「シングルスレッドでも従来のCPUよりも高性能だ」
といっているはずなんだよ。今言っといたほうがマーケティング得だからさ。
このあたりは、むしろこれからはGPUを統合するからどうのみたいなお茶を濁す発言でごまかされている。
312えるえる:2010/03/19(金) 22:12:42 ID:6xAmJmLq
L1Dのサイズが小さくなったのは、
設計チームがリセットされて排他キャッシュの伝統をやめたと考えれば
半分以上は説明できるんじゃないか?
レイテンシに関してはその分やりやすくなったと思う。
313Socket774:2010/03/19(金) 22:13:14 ID:wCZ3b7JZ
トレースキャッシュもどきは2コアで共用になるのかな
それともコアごとに持つのかな
314えるえる:2010/03/19(金) 22:14:57 ID:6xAmJmLq
もつとしたらコア毎だろうな。
315Socket774:2010/03/19(金) 22:15:25 ID:rOG24ZCr
・「パイプラインとスーパーパイプラインってのはそりゃもう根本的に違うんです
 具体的にどう違うかってーと段数が違う」(反論してるようで同意している)
・「パイプラインは増えている!」Power6の図しか出さない

ほんとコピペしか能が無い
316えるえる:2010/03/19(金) 22:18:14 ID:6xAmJmLq
コテのときは25%までしか力をだしてはいけないのが
えるえるルールなんです。
317えるえる:2010/03/19(金) 22:20:01 ID:6xAmJmLq
まあコテたたきに余念がない連中も、
コテのスリルの中毒性にはまったら抜け出せないのは、
一度なのればかわるよ。
318Socket774:2010/03/19(金) 22:32:01 ID:R7MQ9tvP
( ´д)ヒソ(´д`)ヒソ(д` )ヒソ
319えるえる:2010/03/19(金) 22:48:54 ID:6xAmJmLq
>>306
POWER5,6のパイプラインの図くらいネットでちょいと検索すればこのようにすぐみつつかるんだから
すこしは確認してから書けという意図でしか貼ってない。
こぴぺしかできないとかなんとかいってるけど、何も証拠もしめさずにだらだら自分の妄想を書いているほうが
読んでいる側からすると不快なんだよ。まあ、自分の場合はわざと張ってないんだけどね。

>しかし無駄を省いた設計は高クロックのためだろうね
Bullはコアをややコンパクトにして電力性能比とスループットを稼ぐ
という考えでふつうに理解可能。無駄を省いたのはそのため。
電力をおさえられればクロックはあげられるが、
NetBurst, POWER6, Cellなどとはクロックの追求に対するスタンスは異なるだろうって話。
320Socket774:2010/03/19(金) 23:07:26 ID:NabtLUaw
Bulldozerのコンセプトはコアあたりの性能を落とさないで軽量化だろ
それにK6に似てるってだけで、K6そのものってわけじゃないだろ
K10から3way→2wayのように過剰ユニット数を削って、スーパースカラやOOOとかの方式的なものは改良して、
トータルで性能維持、ダイサイズ小型化を目指していると思う
その結果K10.5の軽量版、あるいはK6の現代風リニューアル版みたいなもんになっているんじゃないかと
この現代版K6って意味合いで言ってるだけだろう

ちなみに、BobcatはBulldozerの性能微減(-10%程度)でダイの小型化
BulldozerとはK10とK8みたいな関係かね
321Socket774:2010/03/19(金) 23:14:58 ID:Yu24s30L
K10コア(L2まで含む)の中で整数演算器が占める面積って2〜3%で、ここからパイプラインを1本減らしても1%減るかどうか
322Socket774:2010/03/19(金) 23:31:51 ID:zvNzYD73
スケジューラの方が面積取られるんでしょ。
323,,・´∀`・,,)っ-○○○@CR-Z:2010/03/20(土) 01:59:00 ID:lZIalqH7
K6-2のブロックダイアグラム
http://www.pctechguide.com/images/25K6-2.gif

これむしろPentium IIに似てるけどなオイ

BulldozerはAthlonの特徴であるInt.とFP/SIMDでクラスタが別れた構成を踏襲してる
それを「K6」だって言ってる奴は半可通以外のなんでもない。
324Socket774:2010/03/20(土) 02:49:45 ID:CluEyavh
この話の流れは、円柱を平面で切り取って
「真円だからAと似てる」
「楕円だしBでしょ」
「いや四角だからCだろ」
と言い合ってるようにしか思えん
325Socket774:2010/03/20(土) 07:31:27 ID:Nw/yq/VA
いいや違う。

「K6-2とPen2はそっくりだけど
Pen2とPen3は大違い
だからAthlonと比べるならK6じゃなくPen3!Pen3に清き一票をおぉぉぉ!!」

などとSIMMSIMM泣いてる奴が独り居るわけだね♪
326,,・´∀`・,,)っ-○○○@CR-Z:2010/03/20(土) 09:43:11 ID:lZIalqH7
>>324
いや結局整数ALUの本数だけを見てK6世代だって言ってるアフォがいるから話が拗れるわけで。

K6アーキテクチャの特徴を見ると
・SIMD演算ユニットと汎用ALUが同一ポートにぶら下がっている
・24エントリの集中型リザベーションステーション

んで、ベースになってるNx586ではFPUは外部コプロセッサだったのでK6でもその名残で
x87ユニットは独立ポートになっていると。

一方K7以降はFPおよびSIMDユニットは別のクラスタに分けて汎用整数とは別個にスケジューリングされている。
http://www.thg.ru/cpu/19990809/images/k7-architecture.jpg

この辺はAlphaAXP由来の設計思想であって、Bulldozerにも引き継がれている要素。
整数クラスタの構成が変わっただけで、基本設計はディスクリートパイプラインを特徴とする
K7の系譜は引き継いでいる。
(=汎用レジスタ-XMMレジスタ間のデータ移動はボトルネックであり続けるということ)
327,,・´∀`・,,)っ-○○○@CR-Z:2010/03/20(土) 10:18:32 ID:lZIalqH7
Bridge-FMAがBulldozerに採用されるとすれば相当強力だよ。
逆にこのタイミングしかないと思うよ。
主要アプリがAVX(特に256bitデータ長版)に移行した後だと旨味がない技術だし。
328Socket774:2010/03/20(土) 10:30:06 ID:Nw/yq/VA
ALU 2→3 の比較はヨナ→コンロでも散々出たのに
「Pen2とは違うのだよPen2とは」とまで主張し必死にPen3を推す知的障害者
「Pem3!Pen3に清き一票を!
票が無ければウンコでも構いません!」」
329,,・´∀`・,,)っ-○○○@CR-Z:2010/03/20(土) 10:40:13 ID:lZIalqH7
プリフェッチ→Pentium III

被害妄想きわまれり
330Socket774:2010/03/20(土) 11:05:04 ID:t61ANN/F
箱をあけるまで正しい解の出ない物を
さもこれが正しいと言わんばかりに高説ぶってるアホウと
そのアホウに粘着してるキチガイとでスレを幾つ消費してるんだね?
331,,・´∀`・,,)っ-○○○@CR-Z:2010/03/20(土) 11:10:42 ID:lZIalqH7
その指摘は的確すぎる
332MACオタ>330 さん:2010/03/20(土) 11:14:23 ID:2FaaqQLO
>>330
  -------------------
  箱をあけるまで正しい解の出ない物
  -------------------
本気でそんな戯言を信じているなら、このスレッドに来ても腐れルーマーに騙されるだけで
無益ですよ。一般向けに販売されるような製品は、所謂"Rocket Science"とは訳が違うの
です。
333,,・´∀`・,,)っ-○○○@CR-Z:2010/03/20(土) 11:18:49 ID:lZIalqH7
Reverse-HTなんて影も形もない物が信じられてきたお花畑スレッドだもんな
334Socket774:2010/03/20(土) 11:22:54 ID:SwslMdoB
>>331,332
何気ない反応の差で、そのアホウの中でも雲泥の差が有ることが判るな。
ヲタがマジで自分の無謬性を信じてる真性という事が判る。
335MACオタ>団子 さん:2010/03/20(土) 11:24:07 ID:2FaaqQLO
>>333
こののヒト達は誰も引っかからなくて落胆した覚えがありますが、
当時のログでも探しましょうか?

団子さんもそろそろ若くないのですから、思い込みで根拠の無い話ばかり書い
ているとダメですよ。LarrabeeとかAVX 128-bit説とか、後ろ暗いことも多いでしょうに。
336Socket774:2010/03/20(土) 11:27:40 ID:t61ANN/F
俺にはこの二人のうちの片方は雑豚なんだろうなくらいの判断はできたよ
337,,・´∀`・,,)っ-○○○@CR-Z:2010/03/20(土) 11:29:49 ID:lZIalqH7
>AVX 128-bit説

Sandy Bridgeも例外なく128ビットだよ
上下で別々のユニットだもの
上位と下位が同じポートにぶら下がってるだけで
338,,・´∀`・,,)っ-○○○@CR-Z:2010/03/20(土) 11:34:20 ID:lZIalqH7
「Super Shuffle EngineはIntelとAppleのクロスライセンスだ」と唱えた人もいましたね
339Socket774:2010/03/20(土) 11:36:10 ID:t61ANN/F
両者のどっちでもいいから提案なんだが、スルースキルっていうものを実につけてはどうだね?
340Socket774:2010/03/20(土) 11:39:24 ID:9/bUphw/
俺はsuicideスキルを推すよ
341Socket774:2010/03/20(土) 11:40:45 ID:Nw/yq/VA
「他人に強烈に笑われるよりは自分同士でやんわりいがみ合って場を流す」
ってことで同一人物だろ
MADオタはソース貼り付けばかりで電波飛ばす(自分の考えを書く)こと自体少ないが

4 名前:MACオタ[] 投稿日:2008/01/03(木) 15:36:18 ID:0OGEg5J1
この一連のスレッドの初期にわ「AMDに次世代なんて無い」と書き続けたモノすけど、(会社の先行き
の不透明感わ別にすると)AMDの次世代の方向性もやっと明らかになってきたす。
年頭に当たってちょうど良い機会なので、簡単にまとめておくす。
■Starsコア(Barcelona/Phenom/K10/K8L)について
いまさら言うまでも無くK8Lわ単なるK8の延長す。K8パイプラインの限界わ、そのままK8Lの限界
すから、errataが修正されようが、多少プロセスの改善があろうが今後大きく動作クロックが向上する
ことも無いし、キャッシュの増量以外にIPC向上の要因も無いす。
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
>K8パイプラインの限界わ、そのままK8Lの限界
K8は90nmで3.2G、K10は65nmで2.6G(だっけ?)
とちょっと考えただけで有り得ないことを平気で言う
他にも
>今後大きく動作クロックが向上することも無い
K10は現在3.4G
>キャッシュの増量以外にIPC向上の要因も無い
ttp://pc.watch.impress.co.jp/docs/column/kaigai/20100215_348705.html
(◎32nm版でのアーキテクチャ上の拡張)


そして三連ウンコは見ての通りMADに輪をかけて酷い
342Socket774:2010/03/20(土) 11:41:31 ID:v/gan1Xr
我慢が出来ない幼稚な性格なんだからスルーなんて大人の対応は無理だろ
343Socket774:2010/03/20(土) 11:44:30 ID:t61ANN/F
コピペで自己紹介する奴はじめてみたわw
344Socket774:2010/03/20(土) 11:44:42 ID:Nw/yq/VA
些細な訂正だけど、エラッタ修正前は2.4Gだっけか・・・
345,,・´∀`・,,)っ-○○○@CR-Z:2010/03/20(土) 11:45:25 ID:lZIalqH7
プリフェッチフェチの済む「あっちの世界」にはPen4にL1Iがないもんな
346Socket774:2010/03/20(土) 11:51:05 ID:Nw/yq/VA
Pen4はL1Iの代わりにトレースキャッシュが載っていて
あまりに機能が違うためにこれをL1Iだと認めてない人が
ネットで検索すれば多数出て来ることがわかる
これは現実世界の話

>247で突然出て来た「Pentium 4にはL1Dが無い」は
流石に現実世界の常識では考えられないと思われ
347,,・´∀`・,,)っ-○○○@CR-Z:2010/03/20(土) 11:56:19 ID:lZIalqH7
その理屈でいくとK7もプリデコードキャッシュだからL1Iじゃないんだな
348,,・´∀`・,,)っ-○○○@CR-Z:2010/03/20(土) 12:04:04 ID:lZIalqH7
正しい日本語に添削します

Pen4のL1Iは事前に命令をデコードしμOPsに変換した状態で記憶するトレースキャッシュで構成されていて
機能は従来のL1IそのものなのにこれをL1Iだと認めてない約1固体がAMDの次世代CPUに巣食っていて
ネットで検索すればその珍発言が引っかかる
349MACオタ>団子 さん:2010/03/20(土) 12:08:18 ID:2FaaqQLO
>>338
本当にVector PermuteはAIMの特許なんですっては。
http://www.patentstorm.us/patents/5996057/claims.html
Intelもこの分野での基本特許として認めていることは、Intel自身の特許で引用している
ことからも判るかと。
http://www.patentstorm.us/patents/7047393/fulltext.html
http://www.patentstorm.us/patents/7120781/fulltext.html

で、ちゃんとソースのある反論は(笑)
350Socket774:2010/03/20(土) 12:14:27 ID:Nw/yq/VA
ttp://www.ne.jp/asahi/comp/tarusan/main89.htm
>わかりやすく言うと、「ここが命令の境目ですよ。」と あらかじめミシン目を入れておくようなやり方である。
>これにより、1つ目の命令デコード完了を待たずに、併行して2つ目、3つ目のデコードを行えるわけだ。
この理屈でいくと

・・・っていこうとしたら>348に「トレースキャッシュはL1Iそのもの」
μOPsキャッシュ=x86キャッシュとか書いてある
相変わらずやべえ
351,,・´∀`・,,)っ-○○○@CR-Z:2010/03/20(土) 12:15:22 ID:lZIalqH7
いやその特許は知ってるってww

さて何度目かなこれ
pshufbはSSSE3から実装されてるんだがなぜPenryn世代の実装でApple(笑)と交渉しなきゃならないの?

そもそもpshufbのソースオペランドは2つであって特許のそれとは異なるね。
AMD XOPのvppermが酷似してるのは気になるし、IntelがAVXの仕様からvpermil2psを削除したのも興味深いです。
352,,・´∀`・,,)っ-○○○@CR-Z:2010/03/20(土) 12:19:32 ID:lZIalqH7
たるさん(笑)ってこの前俺が論破して記事修正させた相手なんだけど

> Execution Trace Cache:
> Advanced L1 instruction cache removes decoder pipeline latency, and
 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
> caches "decoded" instructions, thus improving efficiency and hit rate to
> cached instructions. The 12 Kμop portion of the L1 cache supplies decoded
> instructions into the processor pipeline. There is also an 8 KB data portion of
> L1 cache.

http://www.intel.com/support/processors/pentium4/sb/CS-007988.htm
       ~~~~~~
353Socket774:2010/03/20(土) 12:29:17 ID:Nw/yq/VA
IntelがトレースキャッシュをL1I呼ばわりしてるからって
「μOPsキャッシュ=x86キャッシュ」が証明されたとか言っても
現実世界ではまず通用しない

それにデータ並列=タスク並列とかいう電波で普通の人間を論破出来るのか?有り得ない
354MACオタ>団子 さん:2010/03/20(土) 12:29:53 ID:2FaaqQLO
>>351
  -----------------
  pshufbはSSSE3から実装されてるんだがなぜPenryn世代の実装でApple(笑)と
  交渉しなきゃならないの?
  -----------------
自身で書いているようにpshufbはAltivecのvpermとは違いますよ。
  -----------------
  そもそもpshufbのソースオペランドは2つであって特許のそれとは異なるね。
  -----------------
元の話題は、削除される前のAVXのvperm命令の話。削除後に書いたように話をすり替え
られても困るのですが…
355,,・´∀`・,,)っ-○○○@CR-Z:2010/03/20(土) 12:33:11 ID:lZIalqH7
お前がIntelがPenrynでSuper Shuffle Engineを実装したタイミングでその話題を持ち出したからだよ
当然PenrynにはAVXは搭載されていない
356,,・´∀`・,,)っ-○○○@CR-Z:2010/03/20(土) 12:35:08 ID:lZIalqH7
357MACオタ@訂正:2010/03/20(土) 12:36:56 ID:2FaaqQLO
>>354はちょっと別の記憶と混乱してました。団子さんが>>338で指摘したのは
Super Shuffle実装の頃の話題の方ですね…

ちょっと当時のログを漁って来ます。
358,,・´∀`・,,)っ-○○○@CR-Z:2010/03/20(土) 12:38:59 ID:lZIalqH7
先日の話題わAltiVec特許(群)の中でVPERMを扱う一つを挙げたすけど、一般に知的所有権わ 基本特許を膨大な周辺特許で固めているモノすから、Appleが持つAltiVecに関する権利がどの ようなものであるかを知らない限り、全てわ憶測に過ぎないす。 ...
359Socket774:2010/03/20(土) 12:47:55 ID:C2ho+nS7
なんで団子屋がMACオタの口調になってんの?
360,,・´∀`・,,)っ-○○○@CR-Z:2010/03/20(土) 12:53:09 ID:lZIalqH7
レスそのまんま引用した
361Socket774:2010/03/20(土) 13:05:58 ID:3sBC1PUr
IntelCPUの話はあっちのスレでやれボンクラ共
ここはAMD CPUスレだマヌケ共
362Socket774:2010/03/20(土) 13:14:36 ID:s5JRky63
[GDC 2010]Larrabee計画の延期が影を落とす,Intelの“グラフィックス最適化”セッション
http://www.4gamer.net/games/107/G010710/20100317030/

> しかし蓋を開けてみれば,その内容は「デュアルコアCore i7・i5・i3プロセッサに搭載された
>『Intel HD Graphics』と,同グラフィックス機能に向けた最適化の話題のみ」という,お寒い内容。

>ただでさえ閑散としたセッション会場を,早々に立ち去る参加者も目立ち,聴講者は筆者を含めて数える程度だった。
363Socket774:2010/03/20(土) 13:26:00 ID:Nw/yq/VA
  ヽ、.三 ミニ、_ ___ _,. ‐'´//-─=====-、ヾ       /ヽ
        ,.‐'´ `''‐- 、._ヽ   /.i ∠,. -─;==:- 、ゝ‐;----// ヾ.、
       [ |、!  /' ̄r'bゝ}二. {`´ '´__ (_Y_),. |.r-'‐┬‐l l⌒ | }
        ゙l |`} ..:ヽ--゙‐´リ ̄ヽd、 ''''   ̄ ̄  |l   !ニ! !⌒ //
.         i.! l .:::::     ソ;;:..  ヽ、._     _,ノ'     ゞ)ノ./
         ` ー==--‐'´(__,.   ..、  ̄ ̄ ̄      i/‐'/
          i       .:::ト、  ̄ ´            l、_/::|
          !                           |:    |
             ヽ     ー‐==:ニニニ⊃          !::   ト、
おれたちはとんでもない思い違いをしていたようだ。これを見てみろ。
991 名前:ヽ・´∀`・,,)っ━━━━━━┓[sage] 投稿日:2008/02/25(月) 21:53:07 ID:YxY/EGHv
>>983
同じじゃん

pre = 事前
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
これによって「プリフェッチ=事前にフェッチしておく」
「プリデコード=すでにデコードは済ませた」
となり「フェッチ=プリフェッチ」「デコード=プリデコード」「μOPsキャッシュ=x86キャッシュ」が成立する

しかし地球の辞書を引いて欲しい
pre-[ pr-, pri- ] 「…以前の」「…の前部にある」
とあり「フェッチの前に行うこと」「デコードの前に行うこと」と訳すのが日本語だろう
(yahoo辞書には「あらかじめ」の意味も出ているが
これを例語に当てはめてみるとおかしいので割愛する
pre-quake あらかじめ揺れる?
pre-birth あらかじめ生まれる?)


プリデコードといえばこれを済ませたものをAMDはK5からL1Iに入れてたらしいね
Intelのほうはよく判らんけどCore2がプリデコード済みのx86命令をループ専用キャッシュに
i7でデコード済みのμOPsをループ専用トレースキャッシュに入れるようにしたことは判っている
364,,・´∀`・,,)っ-○○○@CR-Z:2010/03/20(土) 13:34:16 ID:lZIalqH7
今日もプリプリ
365Socket774:2010/03/20(土) 13:37:06 ID:1DV8azMB
デコード前のx86命令をキャッシュするのが普通のL1命令キャッシュ
x86をデコード後のμopの状態でキャッシュするのがトレースキャッシュ
(ヒットしたときは、デコーダーをスキップ)

デコーダーの前か後か(x86命令か内部命令)の違いだけで
機能的にはまったく同じなんじゃないの?
366,,・´∀`・,,)っ-○○○@CR-Z:2010/03/20(土) 13:41:37 ID:lZIalqH7
言葉尻にやたら執着する自閉症の方には違う物に見えるらしいですよ
367Socket774:2010/03/20(土) 13:43:39 ID:Myw+pP+R
ふたりはプリフェッチ
368Socket774:2010/03/20(土) 13:47:36 ID:Nw/yq/VA
>>365
んな大雑把に分けたらRAM全部一緒って言ってもおかしくなくなる

命令キャッシュにどうやってコードを詰め込むかを憶測交じりで考えると
普通のL1はway数に分けて塊で載せられる
L2以下のキャッシュやメモリのレイテンシと帯域がネック

トレースキャッシュはデコードしないと載らないからデコーダの数で塊が出来、ネックにもなる
L2以下からデコーダに命令フェッチするたびにレイテンシ掛かるとしたらかなり酷いことになりそう
369,,・´∀`・,,)っ-○○○@CR-Z:2010/03/20(土) 14:27:14 ID:lZIalqH7
>トレースキャッシュはデコードしないと載らないからデコーダの数で塊が出来、ネックにもなる
>L2以下からデコーダに命令フェッチするたびにレイテンシ掛かるとしたらかなり酷いことになりそう

アホすぎて腹いてぇwwwwwww





これってどこの会社のCPUのことだろうね?

> プリデコード・ビット
> x86命令のデコーディングは特に難しいが、その理由は命令が可変長であり、1
> バイトから15バイトまでの命令長をとり得るからである。プリデコード・ロジック
> は各命令バイトに対応するプリデコード・ビットを供給する。プリデコード・ビット
> は次のx86命令の開始点までのバイト数を表示する。プリデコード・ビットは、図
> 2に示す通り、各x86命令バイトの傍らの拡張命令キャッシュ内に格納される。プ
> リデコード・ビットは命令バイトと共に、それらが並列x86命令デコーディングを
> アシストするデコーダに引き渡される。
http://www17.tok2.com/home/taro/j20695h.pdf
370Socket774:2010/03/20(土) 14:49:31 ID:A7MgdCVS
もちろん〇〇〇社のCPUです♪
それ格納するのにパリティビットを利用してます。
371Socket774:2010/03/20(土) 15:55:56 ID:Di0dZLhU
ダンゴ学校休みなん?
372Socket774:2010/03/20(土) 16:34:10 ID:Nw/yq/VA
>>369
「デコード=プリデコードだからAMDのもデコード済ませないとL1Iに載せられない」
って言いたいだけならもういいから
373,,・´∀`・,,)っ-○○○@CR-Z:2010/03/20(土) 17:13:03 ID:lZIalqH7
ヴァカは文章も読めないんだな
命令長検出はx86のデコードにおける最もコストの高い処理だ

374Socket774:2010/03/20(土) 17:23:12 ID:Y6dpMjDo
そこで固定長命令っすよw
375,,・´∀`・,,)っ-○○○@CR-Z:2010/03/20(土) 17:24:46 ID:lZIalqH7
ちなみにK7以降は「IntかFP/SIMDどちらのクラスタに振り分けるか」の情報も格納している
つまり命令の種類まで判定している。
オペランド以外のほぼ全ての情報はL1Iにフェッチする段階で事前デコードしてることになる。

プリフェッチくんの言うように「プリデコード=デコード」は半分正解。賢いねwwww

もっとも、プリデコードタグに保持してるのは長さ情報とクラスタの区別くらいだから、デコーダを通すときに
再度プリフィクスバイトを読み直すことになるけどね。
376Socket774:2010/03/20(土) 17:38:39 ID:Nw/yq/VA
>ちなみにK7以降は「IntかFP/SIMDどちらのクラスタに振り分けるか」の情報も格納している
intかfloatか変数(オペランド)の型が判っている

>つまり命令の種類まで判定している。
>オペランド以外のほぼ全ての情報はL1Iにフェッチする段階で事前デコードしてることになる。

オペランドが判る

オペランド以外が判る

意味不明
詳しい人解説して
377,,・´∀`・,,)っ-○○○@CR-Z:2010/03/20(土) 17:54:35 ID:lZIalqH7
本当にドがつく素人だな

>intかfloatか変数(オペランド)の型が判っている

Operandなんてのはただの数字だが。
たとえばModRM.regフィールドに0が入っていたとして、それがXMM0かST(0)なのかAXなのかは
それより前のopcodeによって決まる。

ただ命令長検出の段階では必要のない情報だ。

長さ情報を得るのにModRMはスキャンするがSIB, DISPの有無(長さ)情報だけを検出して
後の情報は読み捨てている。

ほぼ完全なdecode(解読)は行っているが、μOPsを生成しない代わりに
378,,・´∀`・,,)っ-○○○@CR-Z:2010/03/20(土) 17:58:49 ID:lZIalqH7
(続き)
本デコードで並列に処理しやすいようにタグを吐き出して格納している。

L1Iミスヒット時のペナルティならNetBurstと大差ねーよ。
x86は容量効率がいいから、64KBもあったら滅多にミスヒットしないけどな。
379Socket774:2010/03/20(土) 18:15:46 ID:Nw/yq/VA
詳しい人ってのは知識をちゃんと理解してる人のことで
ゲフォがCPUみたいにスーパースカラ処理(SMT&アウトオブオーダ)してるソース持って来て
「だから全てがSIMDでスカラなんて無い」とか言ってるやべえ奴のことじゃないんだが

202 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2009/07/22(水) 06:59:49 ID:3rqpGJeJ
ここでも読んでおきな
http://www.4gamer.net/games/050/G005004/20080614003/

「SIMT」はCUDAのプログラミングモデルを詠ったマーキテクチャでしかなく
1つの関数の中身を書くときはベクトルじゃなくて、各要素に対する演算を定義するだけ。


GeForceのハード的には

・1つの命令ユニット(デコーダ)に対して、8つの連動して動く整数/単精度実行ユニットがある→それSIMD以外のなんでもないです
・スキャタ・ギャザーをサポートするロード・ストアユニット →LarrabeeのLSUは更に高機能
・プレディケートレジスタによる実行・不実行の選択ができる→Larrabeeはマスク値同士のビット論理演算もサポート

NVIDIAもマーケティング用語そろそろ変えてくる頃だと思うのだけど・・・
380Socket774:2010/03/20(土) 18:20:43 ID:Nw/yq/VA
アウトオブオーダは違うか
381Socket774:2010/03/20(土) 19:28:11 ID:NF7r1tNI
メモコン2つあるんだからスロット2倍にしてくれよ
382,,・´∀`・,,)っ-○○○@CR-Z:2010/03/20(土) 19:41:54 ID:lZIalqH7
アウトオブオーダwwww

用語も正しく使えない奴に情報の真贋の判断を任せるほど無駄なことはない
383Socket774:2010/03/20(土) 19:54:41 ID:hUf3nqhZ
>>375
K7以降は「IntかFP/SIMDどちらのクラスタに振り分けるか」の情報も格納している

これ本当?
384Socket774:2010/03/20(土) 20:18:04 ID:Nw/yq/VA
ソースがある場合は頼まれずとも勝手に出すし
出さない時は2chがソースなうえにコピペ改変で内容グチャグチャ
それによって「フェッチ=プリフェッチ」「データ並列=タスク並列」「μOPsキャッシュ=x86キャッシュ」
という素晴らしい法則の数々が生まれる
てのがパターンだけどねえ
385,,・´∀`・,,)っ-○○○@CR-Z:2010/03/20(土) 20:45:18 ID:lZIalqH7
>>383
誤答か大原あたりが実装の概要を紹介してた気がしたが忘れた。

K7-K8の実装では1命令あたり5ビットであることが知られてる。
命令長に4ビット(x86の1命令長は規格上1〜15バイト)、更に1ビットでINTパイプかFPパイプかの情報を格納すれば
5ビットですむね。
x87命令の場合最初の1バイトを見ればFP命令だとわかるが、0Fで始まる2バイト命令は
スカラ命令もSIMD命令もマッピングされてるから結局最後のOpcodeまでみて判定しないといけない。

ちなみにこのタグ、K10から【1バイトあたり3ビット】になってるらしいけど詳細は不明。

んで実装の詳細は
http://www.patentstorm.us/patents/5819059/claims.html

Intelがデコード段が高コストと知りつつCore MAで逐次デコードの方式を採ってるのは
AMDがこの特許持ってるからと思ってるが。
386Socket774:2010/03/20(土) 21:04:33 ID:DsZu8dt7
話が無茶苦茶過ぎて付いていけない。
387,,・´∀`・,,)っ-○○○@CR-Z:2010/03/20(土) 21:10:06 ID:lZIalqH7
アウトオブオーダ君をNGID登録すれば多少まともな技術論になるかもよ
388Socket774:2010/03/20(土) 21:11:39 ID:hUf3nqhZ
>>385
キャッシュの端っこに入れるやつは、K7から1バイト当たり3ビットになってるらしい
情報量的にはINTパイプかFPパイプかも入れられるかもしれないが、>>385や↓を読むと
ttp://www.freepatentsonline.com/6460132.pdf
プリフィクスバイトか否か、ModRMの場所でSIBバイトの有無、ぐらいしか分からんな
389Socket774:2010/03/20(土) 21:11:49 ID:DsZu8dt7
駄目だコイツ
390Socket774:2010/03/20(土) 21:36:32 ID:hUf3nqhZ
>>385
「5ビットのタグ」というのがどこの段階の何を指しているのか分からないorz
391,,・´∀`・,,)っ-○○○@CR-Z:2010/03/20(土) 21:41:34 ID:lZIalqH7
>>388
最初の3ビットのうち1ビットを「1バイト命令か、多バイト命令か」のフラグに割り当てて
残りを2バイト目以降を長さ情報に使うとかやれば足りるね。

誤答がいうには条件分岐命令か通常命令かのフラグビットも存在するらしいが
過去記事あさるのもメンドイ
392,,・´∀`・,,)っ-○○○@CR-Z:2010/03/20(土) 21:44:54 ID:lZIalqH7
現状のプリデコードタグのデータ構造は正味わからん
K10アーキは256bit-命令ストリーム+160-bitのプリデコード情報なんて怪しい情報もあって
(つまり1バイト当たり5ビット)
393Socket774:2010/03/21(日) 01:49:43 ID:32oZ3PBQ
L1キャッシュに余計なビットつけたら、
x86のバイナリ効率の良さが殺されるんじゃないの。
394,,・´∀`・,,)っ-○○○@CR-Z:2010/03/21(日) 07:56:55 ID:NRePceAu
それどころか命令専用キャッシュは読込専用だからパージ時にライトバック制御が必要がないというメリットまで
排他キャッシュ機構によって殺している
395Socket774:2010/03/21(日) 08:11:28 ID:40gGJGX4
まだ居る
396Socket774:2010/03/21(日) 08:30:34 ID:32oZ3PBQ
L1命令キャッシュまで排他……だと……?

その発想はなかった。本当? AMDはんぱねえな。
397,,・´∀`・,,)っ-○○○@CR-Z:2010/03/21(日) 08:33:48 ID:NRePceAu
初代Duron:
L1I 64KB
L1D 64KB
L2 64KB

排他化するしかないでしょ。
398Socket774:2010/03/21(日) 08:44:29 ID:32oZ3PBQ
逆に、そんなちょっぴりしかないなら、
L2はデータ専用って割り切ったってペナルティはごく僅かじゃん。
キャッシュに収まるコード量が64KBか64KB+αになるかだけの違いでしょ?
αの分だけデータキャッシュ増えるんだから無駄じゃないし。
399Socket774:2010/03/21(日) 09:33:00 ID:40gGJGX4
包含キャッシュのL2は下位だが
K7の頃のAMD排他はサブ・予備扱い
ttp://www.killernotebooks.com/core_duo_specs.aspx
K8のデータだけどL2@1MBで16way
1way辺りのサイズがL1の倍程度?
これはL1とL2でデータ入れ替えるのに都合が良いのではないか

昔からキャッシュの面積的に不利だったから
>データ専用って割り切ったって っていうより
予備で割り切ってたのがAMDだろうね
400MACオタ>団子 さん:2010/03/21(日) 11:42:04 ID:tQ2m2qMB
>>358
遅くなって失礼しました。当時の論点ってむしろその前に行った議論のコレでは?
http://pc11.2ch.net/test/read.cgi/jisaku/1172923824/475
  -----------------------
  475 名前:MACオタ>団子 さん 投稿日:2007/04/07(土) 10:48:04 ID:BW1UDr9K
    >>470
    -----------------
    シャッフル単位が128ビットになったことで、1μOPsで処理できるようになったことで
    -----------------
  クロスバースイッチって知ってるすか?AltiVec特許での請求範囲わ、こうなっているす。
  http://patft.uspto.gov/netacgi/nph-Parser?Sect1=PTO2&Sect2=HITOFF&u=%2Fnetahtml%2FPTO%2Fsearch-adv.htm&r=1&p=1&f=G&l=50&d=PTXT&S1=5,996,057.PN.&OS=PN/5,996,057&RS=PN/5,996,057
    =================
    8. The apparatus of claim 7 wherein the vector elements of said first and second vector
    registers comprise a set of 2.sup.n input vector elements, and wherein, in response to each
    of said vector elements of said control vector, the combination network selects one of said
    2.sup.n input vector elements.
    =================
  -----------------------
401MACオタ@続き:2010/03/21(日) 11:47:28 ID:tQ2m2qMB
で、いまさらながら特許の請求事項を読み直してみましたけれど、特許用件としては
vector permute 用クロスバースイッチ自体に特許性は無いようで、むしろ>>351にある
ように3入力(入力2 + 位置指定)であることが入っています。

Super Shuffle Engine 自体には特にVPERM特許を侵害するモノでは無さそうでした。
402Socket774:2010/03/21(日) 11:51:45 ID:yISXELGC
かつては工場は全部日本にあって、労働者は全部正社員で、年功序列で給料もどんどんあがって
法人税も今より全然高かくて規制だって厳しくて、企業は株の持ち合いやっていて
社会党や共産党が強くて左翼ばっかりだったのに
株価も高くて日本はアメリカに次ぐナンバー2の地位にあった
ところが、コストを削減して工場をどんどん海外に移転させて正社員を切って派遣にしまくって
法人税減税しまくって規制緩和しまくって企業の持ち合い株も売却しまくって
社会党や共産党は消滅しかかっててネット右翼ばかりになったのに
日経平均は暴落して先進国の地位から転落
狐につままれたような話だよな
403,,・´∀`・,,)っ-○○○@CR-Z:2010/03/21(日) 12:02:01 ID:NRePceAu
>>401
んで、XOPのVPPERMは?
面白いことに引数フォーマットそのまんまAltiVec/VMXのVPPERM互換だよ。
(エンディアンの違いはあるけど)

あれこそまさにIBMのクロスライセンスの成果じゃないの?
404MACオタ>団子 さん:2010/03/21(日) 12:04:39 ID:tQ2m2qMB
>>403
  -----------------
  あれこそまさにIBMのクロスライセンスの成果じゃないの?
  -----------------
製造プロセス以外でそんなニュースは聞いたことがないのですが?
405Socket774:2010/03/21(日) 12:10:59 ID:rzKc/3zR
日経平均なんて2004年頃の水準に戻ってるが
406,,・´∀`・,,)っ-○○○@CR-Z:2010/03/21(日) 12:12:50 ID:NRePceAu
・VPERMと引数互換のVPPERM
・VSELそのものなVPCMOV
・要素毎に変量可変のビットシフト命令
・同、ビットローテート命令

旧来SSEにはなくてAltiVecにある要素ばかりだな


いつぞの電波説を当てはめるならこうなるのかな
AppleがAMDにAltiVecの関連特許をライセンスした
407,,・´∀`・,,)っ-○○○@CR-Z:2010/03/21(日) 12:17:29 ID:NRePceAu
Super Shuffle Engineが出てきたときはIntelとAppleの繋がり(笑)を説いたと思ったら
AMDがAltiVecに酷似した命令拡張をしたら無視するんだな
どんだけ歪んだApple愛だよ
408MACオタ>団子 さん:2010/03/21(日) 12:22:24 ID:tQ2m2qMB
>>406-407
  ------------------
  どんだけ歪んだApple愛だよ
  ------------------
Altivec特許はAIM三社に権利がありますから、 Appleの問題ではありませんよ。
409Socket774:2010/03/21(日) 12:25:22 ID:Lsj44aS7
>>405
年収150万以下の人口激増中じゃなかったけ?
410,,・´∀`・,,)っ-○○○@CR-Z:2010/03/21(日) 13:28:23 ID:NRePceAu
>>408
んで、AMD XOPとAltiVec特許の関連性はどうなの?

質問変えようか?

仮にAMDがIBMらのライセンスを得ずにVPERMそのものなシャッフルユニット及び命令を実装したら
特許問題になるよな?
それはつまりどういうことだかわかるよな?
411Socket774:2010/03/21(日) 13:29:54 ID:WcVg6itj
次世代CPUスレとなんの関係があるの?
412Socket774:2010/03/21(日) 13:58:34 ID:YUTcnmBj
XOPのルーツを話してるみたいだからいいんじゃない?
413,,・´∀`・,,)っ-○○○@CR-Z:2010/03/21(日) 14:07:47 ID:NRePceAu
Bulldozerの話題です。

・BulldozerにAltivecの引数互換の命令(XOP)を追加
・POWER7にSSEライクな命令(VSX)を追加

これらの結果として、BulldozerとPOWER7とで、SIMD Intrinsicsレベルで記述されたコードの
相互移植が比較的容易になるんだよね。

まあ、POWER7について聞かれてもないのに嬉々と語ってたMACオタとしても
思考停止せざるを得ない罠。

「AppleがIntelにSuper Shuffle Engineをライセンスした」なんてトンデモ論は出てきても、
今回のMACオタは逃げ続けてるけど

認めるのが相当苦痛らしいな。
414MACオタ>団子 さん:2010/03/21(日) 14:53:46 ID:tQ2m2qMB
>>410
  ---------------------
  仮にAMDがIBMらのライセンスを得ずにVPERMそのものなシャッフル
  ユニット及び命令を実装したら特許問題になるよな?
  ---------------------
なります。
しかし、それ以前にプロセッサ製造・販売事業でIBMの特許をひとつも使わないで商売が
出来る訳は無いのですが(笑)

そんな知識以前のことばかり強弁するから子ども扱いされるんですよ。
415MACオタ@補足:2010/03/21(日) 14:55:34 ID:tQ2m2qMB
416Socket774:2010/03/21(日) 15:08:18 ID:32oZ3PBQ
POWER7のVSXってSSEライクなんだ?
417,,・´∀`・,,)っ-○○○@CR-Z:2010/03/21(日) 15:22:33 ID:NRePceAu
逃げずに認めたか。良い子良い子
というか、>>401で自分で言ってるから逃げられる訳がないよね。

ついでに
> Altivec特許はAIM三社に権利がありますから、 Appleの問題ではありませんよ。

AIM連合なんてのはとうの昔(Intel移行段階)に解消してるわけなんだが
Appleが未だに持ってる権利って一体なんだね
418,,・´∀`・,,)っ-○○○@CR-Z:2010/03/21(日) 15:28:36 ID:NRePceAu
>>416
AltiVecはシャッフルなどのパターン指定に即値オペランドを取るような命令がなかった。
すなわちシャッフルパターンをソースレジスタにロードしてやらないといけなかった。
一方VSXではSSEのように即値フィールドでパターン指定出来る命令が追加された。
あとはスカラ-ベクタ間のデータをダイレクトに交換する命令とか
419MACオタ>団子 さん:2010/03/21(日) 16:48:16 ID:tQ2m2qMB
>>417
  -----------------
  AIM連合なんてのはとうの昔(Intel移行段階)に解消してるわけなんだが
  -----------------
AIM連合という企業名は無いのですが…
Apple, IBM, Motorolaの三社が共に所有しているという意味が理解できないってのは『文字をあるがままにしか理解できない』という脳の構造の問題なんでしょうか?
>>349でリンクした特許も"Asignee"の項目にAppleとIBMの名前がありますよ。

>>418
  -----------------
  AltiVecはシャッフルなどのパターン指定に即値オペランドを取るような命令がなかった。
  -----------------
これは違いますね。VSXで汎用Permute命令を止めて、このようなやり方にしたのはレジスタ数を16個にすると、パターン指定用レジスタを用いる4引数の命令フォーマットが不可能になるというだけの話しです。
420Socket774:2010/03/21(日) 17:30:34 ID:XTWqMgZp
>レジスタ数を16個にすると
421Socket774:2010/03/21(日) 18:10:38 ID:56dTvnd9
ここのコテハンの人はトリップつけないポリシーでもあるんだろうか。
まあ、3者の間では話の内容だけで相手の区別がつくのかもしれない。

雑音と呼ばれてた人=えるえる であってる?
422Socket774:2010/03/21(日) 18:13:55 ID:hSPVBjhv
オタとかはここに10年くらいいるだろ。 途中で別の人に変わってる可能性もあるが。
古参同士はトリップがなくてもお互いが認識できるんじゃね?
423Socket774:2010/03/21(日) 18:17:12 ID:73qW6H6X
認識できる訳がない、トリップ付けて責任もちたくないんだろ
424MACオタ>420 さん:2010/03/21(日) 18:19:36 ID:tQ2m2qMB
>>420
ご指摘感謝します。64個の間違いですね。
425MACオタ>423 さん:2010/03/21(日) 18:22:15 ID:tQ2m2qMB
>>423
今回のSuper Shuffle Engineの件でも判る様に、昔のカキコミにも責任は持ちますよ。
そのために固定ハンドルで10年も書き込んでいる訳です。
426Socket774:2010/03/21(日) 18:39:08 ID:73qW6H6X
>>425
ならトリップも付けた方がいいですね
427えるえる:2010/03/21(日) 18:42:39 ID:HqEC309A
2ちゃんねるは名無しが主役だと思うけど、
CPU論をやるには全員にラベルが貼ってあったほうがやりやすいんだよな。
どっかにちょうどいい掲示板ははないのものか。
名無しは実力もなにもないのにえらそーなだけの馬鹿が9割りだからな。
428Socket774:2010/03/21(日) 18:45:24 ID:EB/uwj1x
実力?お
429Socket774:2010/03/21(日) 18:45:50 ID:jmRsixm6
でもMACオタの偽者出たことナクネ?
430えるえる:2010/03/21(日) 18:48:31 ID:HqEC309A
IDが一日で切り替えるのがね。名無し優遇すぎてやりにくい。
ラベルはデフォルトで個々に割り当ててほしいな。
なおかつ表や図が簡単に貼れて、匿名性の高い掲示板がベスト。
あればそっちに移行してた。
431Socket774:2010/03/21(日) 18:49:27 ID:EB/uwj1x
研究者になれ
432Socket774:2010/03/21(日) 18:51:05 ID:ZvEtNSJ2
トリ付ければいいじゃん
433Socket774:2010/03/21(日) 19:00:08 ID:40gGJGX4
いくら笑われても瞬時に無かったことにして平然と暴れる痴呆には誰も敵わない
434えるえる:2010/03/21(日) 19:05:07 ID:HqEC309A
まあコテに暴れてられいるだけ閑古鳥よりはましだろう。
後藤マンセースレなんか寒い話題で話が続かなくなったぞ。
435Socket774:2010/03/21(日) 19:06:10 ID:MX1t2JIc
>>425
> 今回のSuper Shuffle Engineの件でも判る様に、昔のカキコミにも責任は持ちますよ。
メールの到達性で寝言を言ってた気がするが、アレは訂正したのかね。

> そのために固定ハンドルで10年も書き込んでいる訳です。
Appleは愛してくれたかい?
436Socket774:2010/03/21(日) 19:21:56 ID:Pkl+3GEy
appleいいよapple
まだPC8001やMZ80Bのユーザーで対立してた頃、appleUユーザーは高見の見物状態だった。
CPUも6502で色は4色だったけどドットは細かかったし、ソフトも色々出てた。
その後ずっと関わる事は無かったけど、
ここ最近になってiphoneなるものを使っている。慣れると使い勝手もいいし、いい感じ。
437えるえる:2010/03/21(日) 20:02:58 ID:HqEC309A
2ちゃんねるの固定ハンドルの機能は
身元を証明したり、肩書きを照合できるようなものではなくて、
単なるラベル機能にしかすぎないのだ。
だからいちいちムキになるようなことではない。

コテは同一人物が継続して書き込みする場合の目印程度の意味合いでしかないのに、
2ちゃんねるでは名無しがデォフルト設定でふつうはコテは名乗らないという文化なために、
コテというラベル機能を使っただけで異常人物と認められることになる(半分以上は正解だがw)。

しかし、同じネタを対象にして継続的に複数回、複数日にわたって書き込みを行う場合には、
ラベルがないと相手方から自分が継続して書いているということが伝わらないため、
実際のところ不便なことが多いのが現実。
というわけで複数日にわたって同ネタを続けるためには荒らしに都合がいいデメリットがあるわりに
デフォルトが名無しという設定は不便さが付きまとうだけで、2ちゃんねるの名無し中心主義の文化は
不便さに対する信仰ともいえるだろう。

自動的にラベルを割り振り(継続するかどうかは各人の自由)、名前欄にハンドルがあるのがふつう
という文化であれば議論はよほどやりやすいのに残念なことだ。
438MACオタ>435 さん:2010/03/21(日) 20:27:14 ID:hb18Li8q
>>435
  ------------------
  メールの到達性で寝言
  ------------------
具体的な引用をお願いします。
439Socket774:2010/03/21(日) 20:51:51 ID:XfNoyBQM
MACオタや団子、近頃産まれた新種のえるえる辺りは、
このスレで電波飛ばしてまくっているみたいだが、
その自覚があるのかコテを付けている事は評価できる。

まぁ。トリ付けようと付けまいと、電波の強さに上下はしないが、
邪魔になる・ならないという観点からすると邪魔ににならなくできていい。

>>436
キモイ。
440Socket774:2010/03/21(日) 20:56:56 ID:Pkl+3GEy
>>439
正直済まんかった。
441Socket774:2010/03/21(日) 21:09:36 ID:40gGJGX4
いいよ別に
てかマシなレスなほう
442Socket774:2010/03/21(日) 21:15:19 ID:EB/uwj1x
次次世代あたりでCPUに統合されるのかな?
443Socket774:2010/03/22(月) 02:56:06 ID:CfQeBiMT
いろいろポリシーはあるのかもしれないけど、
本物と偽物の区別がつかないからトリップをつけてほしい。
初期の2chのログにトリップがないのは仕方がないけど。
444Socket774:2010/03/22(月) 02:59:31 ID:L0eA78kL
MACオタが昔からここにいると自称してるけど、
途中で別の人に変わってるかもしれないしな。

まあ、発言内容からして、ずっと同じ人だろうけどw
445,,・´∀`・,,)っ-○○○@CR-Z:2010/03/22(月) 03:45:59 ID:oQigsKs+
>>419
そんなこと知ってるが
AppleがIBMとの提携関係を解消したのはYahooにも載ったニュースでもあるが

んで、君の大好きなAppleが未だに特許権を保持してるとして、
IBMだけでなくAppleもAMDにAltiVec特許の使用を認めたことになるわけなんだがその点どうですか?
(てかAltiVecとの関連性云々に関しては「SSE5」の仕様のときから指摘してるよ)
446,,・´∀`・,,)っ-○○○@CR-Z:2010/03/22(月) 05:35:07 ID:oQigsKs+
トリップ付けろと名無しに言われるとはおもわなんだ
447,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/03/22(月) 06:01:26 ID:oQigsKs+
#CR-Z
448●テヘ権田● ◆OhjIkO1O8o :2010/03/22(月) 06:03:12 ID:miHSbTxS
#CR-Z
449Socket774:2010/03/22(月) 06:20:08 ID:707uNx9o
きもい行動を自身でフォローしてんの見るのはもっとキモい
450Socket774:2010/03/22(月) 08:07:23 ID:KbHPQkqK
半分なんかじゃないな。2ch見始めてもう長いが例外が全くない。
実名や実名に準ずる名乗りを使った人以外では
該当しない人を見たことがない
451Socket774:2010/03/22(月) 08:28:05 ID:aRPuqwyd
>>447 448

mixi だろそれwwwwwwwwwwwwww
452,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/03/22(月) 09:03:52 ID:oQigsKs+
そうそうORE ORE詐欺
453えるえる:2010/03/22(月) 12:03:20 ID:RM75LeZN
名無しならではの妄言だな。
たぶんここでコテ論を展開している名無しがコテを名乗ったら
すぐに炎上して自身の異常さをさらけ出す結果になるだろうね。

2ちゃんねるのコテは所詮ラベル機能。
いつでも名無しに戻ることができる安易な自己申告のシステムだぞ。
偽者被害でコテ自身が困っているなら話は別だが、
中の人が同一人物であるかどうかに読み手側が異常執着するのは、
名無しは一日で同一人物であるか判別できなくなるがそれを容認している、
かつコテがいつでも名無しでまた書き込みできる、
という2ちゃんねるの仕組みからいって無意味なんだよ。
名無しで延々荒らし工作している人間の方が見えにくいだけで実際のところ数が多いだろ。
454Socket774:2010/03/22(月) 12:41:30 ID:O2cdO/y6
凡庸なのにMACオタと団子のキャッキャウフフに混ざろうと必死な勘違いが一匹いるな。
455Socket774:2010/03/22(月) 12:45:34 ID:nUbZH01h
だな。
ケツ穴仲間であるオタと団子に混ざろうなんぞ3年早いわ。
456Socket774:2010/03/22(月) 13:05:15 ID:E9+LBL+h
何年続くか見物だなw
457えるえる:2010/03/22(月) 13:31:09 ID:RM75LeZN
MACオタや-○○○は、
もともとmac板やム板かどっかから伸び盛りの自作PC板へわざわざ主張してきて
その後住み着いた移民なわけで昔からずっと亜流にすぎないんだよ。
自身の板でCPUの話題を確立できなかったから自作PC板にやってきたんだが。
主流派の力を理解して無い名無し低能さんたちもコテのウォッチなんてしてないで、
もっとまともな書き込みできるようになりましょうね。
458MACオタ>団子 さん:2010/03/22(月) 13:47:03 ID:nu4n+fPH
>>445
  --------------------
  AppleがIBMとの提携関係を解消したのはYahooにも載ったニュースでもあるが
  --------------------
法的文書とニュース記事を同列に並べて、知的所有権の所在について知ったか振るから子ども扱いされるんだと思うのですが…
  --------------------
  IBMだけでなくAppleもAMDにAltiVec特許の使用を認めたことになるわけなんだが
  その点どうですか?
  --------------------
特許を含む開発成果に関して参加企業がそれぞれどのような権利を行使できるかは、契約文書に事細かに記されています。
契約書の内容を舐めてかかると、場合によっては参画企業の共同相手に売られてしますことすらあります。SCEI社員がSTIデザインセンターで行ったPPE開発の成果が、MSに売られてしまったのはその一例ではないでしょうか?
459Socket774:2010/03/22(月) 13:47:52 ID:YWNPFqGV
ひらがな四文字の人は真性のアレっぽいな
460,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/03/22(月) 14:44:57 ID:oQigsKs+
なかなかうまい具合に逃げたな
これは頭が下がる、いやレイテンシも下がるわ
461Socket774:2010/03/22(月) 17:17:05 ID:kDEAgp+t
礼典示威は零点思惟ってか。
462Socket774:2010/03/22(月) 21:17:42 ID:OcgywSYX
GLOBALFOUNDRIES、2010年中に25億米ドルを設備投資に費やす計画
http://www.eetimes.jp/news/3784

なんというオイルマネーの力
分離して正解だな
AMDは何だかんだ言ってもATI買収、GF分離と正しい判断を下してる気がする
463Socket774:2010/03/22(月) 21:27:58 ID:xGjckHvP
えっ
464Socket774:2010/03/22(月) 23:19:00 ID:1mdKjjt5
りこ
465Socket774:2010/03/23(火) 02:09:35 ID:k1TAggjF
次世代もIBMの後追いですか?
466Socket774:2010/03/23(火) 03:12:28 ID:KM/Rg9wu
は?頭大丈夫?>>465
467Socket774:2010/03/23(火) 07:33:56 ID:1obWQXwJ
ttp://alienbabeltech.com/main/?p=16214
>Phenom II X6 Six Core
>1090T Black Edition: 125(W), AM3 Socket, 9MB Cache, 3.2 GHz Freq @ 295 USD
>1055T: 125(W), AM3 Socket, 9MB Cache, 2.8 GHz Freq @ 199 USD

DステッピングだかEステッピングだか知らんけど結構頑張った感じだなぁ
468Socket774:2010/03/23(火) 13:44:28 ID:ls/A3Lxp
X6 3.2GHzを125Wでだせるなら、X4 も3.0GHzより上で95Wに下がったのをだしてくれ
469Socket774:2010/03/23(火) 14:25:07 ID:1DGIAHX4
X6とi5どっちにすべきか
470Socket774:2010/03/23(火) 14:35:59 ID:/gJv5UN6
X6 1090Tが$300てことは、ラインナップを馬鹿みたいに増やさないと利益にならないってことだから、
100MHz間隔やX5やX4も細かく出てくるんだろうな。
471Socket774:2010/03/23(火) 15:02:52 ID:6zaOA0lf
馬鹿です
472Socket774:2010/03/23(火) 18:09:04 ID:4hix301C
バカみたいにラインナップが増える前にバカが沸いた。
473Socket774:2010/03/23(火) 18:17:49 ID:CFloWmOf
95w95wってよく見るが、どうせ石同じだし下げればいいだけじゃね
それともデフォのゴミのような省電力機能が大好きなのか?
474Socket774:2010/03/23(火) 18:18:54 ID:6zaOA0lf
馬鹿です
475Socket774:2010/03/23(火) 18:23:19 ID:4hix301C
>>473
個人的には125Wでも95Wでもどうせ"K10stat"辺りを使うが、
"K10stat"のようなソフトが永遠に使えるとは限らないし、
"Thuban"では使えないかもしれない。

そんなわけで、公式でうたっているかどうかを気にする人は多い。
それについては理解できるし、皮肉を言う気にもなれない。
むしろ気にしない奴の方が理解できない。
そんなにまで「ソフトウェアの万能性」を期待できるお花畑に。
476Socket774:2010/03/23(火) 18:38:43 ID:nsOsNKAY
絶望的観測しかできない人生を送ってる負け組に。
477Socket774:2010/03/23(火) 18:54:43 ID:6zaOA0lf
ああ、例の絶望的知能の串使いか・・・
478Socket774:2010/03/23(火) 19:05:45 ID:CbE6zl+L
X5をまとまって出せるほど生産すんのかね
X6に使えないダイは全部X4に回るんじゃないのか
運が良ければアンロックしてX5やX6で使えるかもしらんな
479●テヘ権田● ◆OhjIkO1O8o :2010/03/23(火) 19:23:12 ID:Og4Bl1OF
>>478
> X6に使えないダイは全部X4に回るんじゃないのか
それもダメならX2に回るかも知れない
運が良ければアンロックしてX5やX6で使えるかもしらんな

でも俺は要らないw
480Socket774:2010/03/23(火) 19:27:51 ID:CbE6zl+L
雑音は自分のスレに帰れ
481●テヘ権田● ◆OhjIkO1O8o :2010/03/23(火) 19:39:57 ID:Og4Bl1OF
ちゃんとトリップ付けてるお
482Socket774:2010/03/23(火) 20:16:37 ID:6zaOA0lf
>>480
そんな可哀想なこと言うなよ・・・塵にでも還ってくれればそれでいいんだから
483Socket774:2010/03/23(火) 20:31:31 ID:+5gJ0yNn
SOI基板を不要に、米Innovative Silicon社がキャパシタ・レスDRAM技術を改良
http://eetimes.jp/news/3790
484Socket774:2010/03/23(火) 20:39:34 ID:CYd0JOJX
>>475は結構正論だと思うんだが…。
485Socket774:2010/03/23(火) 20:49:39 ID:CbE6zl+L
とっくにK10statは6コア対応してるし
上を伸ばすだけならAODでもBIOSでも使えるからな
486Socket774:2010/03/23(火) 21:55:20 ID:9mwgCIwq
>>484
漏れもそう思う。

OSに関係なく、MBのBIOS設定項目有無に関係なく、
元から低消費電力なのはメリット大きいと思う。
487Socket774:2010/03/23(火) 21:57:46 ID:i4C59joZ
電気代で差額分の元を取れる値段なら欲しいな。

フルタワーケースなので熱はあまり気にしない。
488Socket774:2010/03/23(火) 22:11:56 ID:ls/A3Lxp
単に95WまでしかサポートしないMBも
使いまわしたいだけなんだけどね。
起動からK10statなどの制御下になるまでに超えなければ問題は
ないはずだが、精神衛生上よろしくない
489Socket774:2010/03/23(火) 23:35:47 ID:yoK0yonF
PhenomII XVI
490Socket774:2010/03/24(水) 00:03:55 ID:ddtQV6lB
MACオタはトリップつけてほしいと思う(時がある)けど、他の人はどうでもいいな。
491Socket774:2010/03/24(水) 00:08:03 ID:uxHZsOKG
>>489
X68K思い出したじゃねーか。
492Socket774:2010/03/24(水) 01:57:29 ID:ReYs84k0
68000 XVI持ってたw
24Mhzにして遊んだなあ・・・。
493Socket774:2010/03/24(水) 18:52:18 ID:jw1ldZbR
>>475は「いわゆる正論」だな
言ってることは別に間違いじゃないが的を射てもいないという

ソフト云々以前にまず石の個体差があるのに
494Socket774:2010/03/24(水) 22:29:06 ID:VOpgnVsg
       _ ____        ミ川川川川川川川川川彡
     /;;;;;;;;_,;;;;;;;;;,;;;;;;;__;;ヽ    ミ
    /;;;;;/  __ \ ̄ /__\;;)  三 とーちゃんとかーちゃんが
    |;;;;;'ゞ_/__ヽノノ ゞ∠_ヽノ/   三 オラたちの名義で借金して
   ,⊥、;;|  くO 〉  〈.0 } {    三 パチンコに行ってるだけ・・
  /   ゞ    ̄     ̄   ⌒ヽ 三 これが子供手当て・・!?
  |    U         /二二ヽ } 三
  \__          |'⌒'⌒V /. 彡川川川川川川川川川ミ
      ̄ヽ__     ゝ ニニノ/

【国民の名義で税収以上の借金して大量バラマキへ】
"新規国債、過去最大の44兆円" 2010年度予算が成立。総額過去最大92兆円
http://tsushima.2ch.net/test/read.cgi/newsplus/1269420683/l50
495Socket774:2010/03/25(木) 07:17:18 ID:JG9tru2y
>Phenom Iのときは、ぼくもすごくつらかったです。「これで何を話せってんだよ」って(笑)。
>すごくつらかったです。「これで何を話せってんだよ」って(笑)。
>「これで何を話せってんだよ」

http://plusd.itmedia.co.jp/pcuser/articles/1002/12/news034_2.html
496Socket774:2010/03/25(木) 09:47:47 ID:TUOwREzR
土居 そうですね。今とだいぶ違います。Phenom Iのときは、ぼくもすごくつらかったです。「これで何を話せってんだよ」って(笑)。


でもそこからPhenom IIががんばってくれて。
497Socket774:2010/03/25(木) 12:57:11 ID:iRH+XBvZ
それでもcore2に追いつけませんでしたがw
498Socket774:2010/03/25(木) 13:38:55 ID:3GS3IUCd
>497
おまえPhenom II使ってないだろう?
雑誌レビューに踊らされているクチだな
i7 > Phenom II > core2 こんな感じでしょ
499Socket774:2010/03/25(木) 14:04:15 ID:bgkCqY6v
PhenomIIvsCore2はAthlon64X2vsPenDの再現
500Socket774:2010/03/25(木) 14:39:27 ID:TUOwREzR
>>497
情弱乙

ゲームするならレスポンスでPhenom II一択なんだが
501Socket774:2010/03/25(木) 15:13:57 ID:iRH+XBvZ
へー(笑)
502Socket774:2010/03/25(木) 15:17:02 ID:97EEAloh
>500
おちつけww

愚か者相手にしても仕方なかろう、まともな親に育てられなかった奴を哀れむくらいの
余裕を持とうぜ。ありゃ家族揃ってみのもんたを信じてる口だw
503●テヘ権田● ◆OhjIkO1O8o :2010/03/25(木) 15:29:20 ID:HeNjiRoS
2-Way Set AssociativeのL1キャッシュでスラッシング上等なPhenomUでレスポンスを言われてもなぁ・・・
504Socket774:2010/03/25(木) 15:40:36 ID:TUOwREzR
i7も人づての話を聞く限りではかなりヤバイみたいだぞ
リテールクーラーのままだとゲームをやる程度のCPU負荷かけたら80度超えて
勝手に再起動になるとか。
自作板のインテル関連スレッドではi7で温度30度(笑)とか平気で書き込んでるレスがいっぱいあるけど、
あれって明らかにリテールクーラー使ってないのに何を使ってるかは伏せてるんだよね。
もしかしたらそもそもi7そのものを使ってなくて、適当に書いてるだけかもしれないと邪推してしまう。
505Socket774:2010/03/25(木) 15:59:57 ID:TUOwREzR
・nVidia rename technology
・Intel Socket change technolog
506Socket774:2010/03/25(木) 17:12:55 ID:bgkCqY6v
Intelはヤクザ
Nvidiaは詐欺師
507Socket774:2010/03/25(木) 17:22:13 ID:iRH+XBvZ
508Socket774:2010/03/25(木) 17:59:04 ID:mTQqmFnU
テヘ雑豚があちこちにガセ記事を書き込んでるって言うことは
フェルミの悲惨さとX6の有望性が高いって事だな
509Socket774:2010/03/25(木) 19:10:28 ID:JG9tru2y
AMD信者のニート脳の120%は妄想でできています
510Socket774:2010/03/25(木) 19:52:49 ID:lkY0mVwv
屁ルミの記事楽しみだな
NVが公式に提灯ライターを選んで書かせるらしいし
511Socket774:2010/03/25(木) 21:58:39 ID:mTQqmFnU
くやしいのうwwwwwテヘ雑豚くやしいのうwwwwww
512Socket774:2010/03/27(土) 11:53:27 ID:8/d72eP4
Fermiスレ見てるとワットパフォーマンスの重要さがね・・・

Bulldozerにも無難にワットパフォーマンスを改善してくる事を期待しとく
513Socket774:2010/03/27(土) 12:10:01 ID:im8e3M1t
32nm SOIでHKMG採用でまあ悪くは無いだろう
514Socket774:2010/03/27(土) 16:46:18 ID:Mf4ZvMNk
Fermi…次が怖いな
515Socket774:2010/03/27(土) 16:51:20 ID:DXYWK1Ye
NVはFermiの改良で、AMDのHD6xxxは新アーキテクチャ
まったく逆の立場もあり得るから、好調なうちに稼いでおきたいよね
516Socket774:2010/03/28(日) 03:26:59 ID:ONDJMyQr
ATIも2900HTで壮絶に爆死した後にHD3870で反撃の狼煙をあげたからな
驕りは禁物だな
517Socket774:2010/03/28(日) 04:23:46 ID:/LwbdP8y
過去にもATIが何度か天下を取った事があるけど、いつも三日天下だったからねえ。

今回は天下が長すぎて不安になるw
518Socket774:2010/03/28(日) 04:26:19 ID:o06I9DX2
ATiの天下っていつも短いよなw
ブランドがAMDになって呪いが解けたか?


ずっと昔から競争に脱落せずに生き残ってきたのは凄いと思う。
他のメーカーは転換期にどんどん脱落してるのに。
519Socket774:2010/03/28(日) 05:04:28 ID:yHkoXziQ
Intelに対抗できるのがAMDしかいないからね
intelの独裁を少しでも抑えるために、俺らに見えないところで色んな企業や機関の助けが入っているんだろう
520Socket774:2010/03/28(日) 06:31:52 ID:kOnl4e3j
見えるよ
521Socket774:2010/03/28(日) 08:22:28 ID:/LwbdP8y
Intel独裁を抑えるためだけに応援していたつもりが、
だんだん情が移ってしまい、いつのまにかAMD贔屓に。
522Socket774:2010/03/28(日) 09:00:32 ID:hZLQbBK4
AMDの最大の魅力は今にも消えそうなのにけなげに頑張ってるところだ

ちょっと古いが、2005年(Intel-Core系が出る前)の時価総額でIntelは18位、AMDは900番台
額にすると1/20以下
523Socket774:2010/03/28(日) 10:32:45 ID:ZECiLOjF
>>519
こういう妄想ができる陰厨は素晴らしいと思うw
524,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/03/28(日) 11:03:45 ID:nvnx7jQ0
AMDって実質IBMのx86部門だろ
525Socket774:2010/03/28(日) 11:08:21 ID:iEiroHTJ
屁ルミは数出るのかね?
526Socket774:2010/03/28(日) 11:28:30 ID:f1Xb2rdn
葬式スレいけよ
527Socket774:2010/03/28(日) 11:57:44 ID:CQ5SJIg5
汚名挽回
名誉返上
528Socket774:2010/03/28(日) 12:01:28 ID:kOnl4e3j
>>527
何だいきなり・・・
雑音の押入れは「汚物積上」だろ
529Socket774:2010/03/28(日) 12:26:48 ID:tWtzVsUe
>>524
なんでそう思うのかな?
530,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/03/28(日) 12:48:53 ID:nvnx7jQ0
油資本が入った時点で状況は多少変わってるものの

・プロセス開発はIBM主導
・役員はIBM出身が多い
・SSE5(現XOP)は(以下略
531Socket774:2010/03/28(日) 12:50:35 ID:kOnl4e3j
・たまにPentium 4にはL1Dが無い(何だこりゃ)
532Socket774:2010/03/28(日) 12:51:08 ID:hxCdHi1o
AMDの人ってどれだけいるのかな
上の連中ってみんな他所から来たやつらだろ
533MACオタ>団子 さん:2010/03/28(日) 14:42:35 ID:Xy1m3rTn
>>530
  ----------------
  ・役員はIBM出身が多い
  ----------------
ソースはいくらでもあるのですから、ちゃんと調べた方が…
http://www.amd.com/us/aboutamd/corporate-information/executives/Pages/amd-executives.aspx
Dirk Meyer: DEC -> AMD (1995)
Chekib Akrout: IBM -> Freescale -> AMD (2008)
Rick Bergman: IBM(平社員) -> TI -> Exponetial -> S3 -> ATI (2001) -> AMD
Nigel Dessau: IBM -> StorageTek -> Sun -> AMD (2008)
Emilio Ghilardi: HP -> AMD (2008)
Ahmed Mahmoud: Kodak -> Dell -> AMD (2008)
Thomas M. McCoy: 法律事務所 -> AMD (1995)
Robert J. Rivet: Motorola SPS -> AMD (2000)
Thomas Seifert: Siemens -> Infineon/Quimonda -> AMD (2009)
Marty Seyer: NCR -> Penguin Computing -> AMD (2002)
Allen Sockwell: IBM(平社員) -> Compaq -> Crossroads Systems -> AMD(2002)

IBMでちゃんとしたキャリアを積んでいるのは、Akrout氏と Dessau氏くらいかと…
534,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/03/28(日) 14:56:58 ID:nvnx7jQ0
取締役権限を持たないレベルではもっと多いんじゃない?
事業部門の縦割り自体が、退任前にHester(IBMに23年勤務)の作り上げた体制じゃん。
535,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/03/28(日) 15:18:41 ID:nvnx7jQ0
FACオタ君はHesterがAMDに連れてきた元POWERのアーキテクトがどんな役職に就いているか
調べてみると良いよ
536Socket774:2010/03/28(日) 15:36:30 ID:A1Vt2cob
つうか人材的なIBM化であっても資本的なIBM化ではないだろw
537Socket774:2010/03/28(日) 15:39:08 ID:A1Vt2cob
団子解釈で言えばINTELはまるっきりフェアチャイルドってことにもなるぜw
538Socket774:2010/03/28(日) 15:52:06 ID:gI9uuCEY
>>529
そう思い込まないと、精神の安定が保てない。
539Socket774:2010/03/28(日) 16:01:15 ID:yHkoXziQ
何処の誰が役員や開発やっているかはどうでもいい
IntelとNvidia以外の現実的な選択肢として存在することが重要
540Socket774:2010/03/28(日) 16:07:00 ID:vhMtmS0t
ぶっちゃけそうだな。IBMの手先だろうが、元Alphaの残党だろうがなんだろうが、
対抗勢力そして存在していることの方が、消費者にとっては遙かに重要。
541MACオタ>団子 さん:2010/03/28(日) 16:18:32 ID:Xy1m3rTn
>>535
  --------------
  HesterがAMDに連れてきた元POWERのアーキテクト
  --------------
またソースを出せない適当な話を(笑)
そもそもPOWERのアーキテクトを引っ張って来る立場というなら、何故Akroutじゃ無いんですか?
542MACオタ@補足:2010/03/28(日) 16:23:16 ID:Xy1m3rTn
Chkib Akrout氏の丁度良い紹介はこの記事とか。
http://techon.nikkeibp.co.jp/article/NEWS/20060426/116637/?ST=edaonline
  ----------------
  IBM時代にはCellやXbox 360用プロセサなど,PowerPCベースのSoC開発などに携わった。
  ----------------
543Socket774:2010/03/28(日) 16:23:30 ID:hxCdHi1o
資本はアブダビで人は寄せ集めが正解
544Socket774:2010/03/28(日) 16:33:03 ID:A1Vt2cob
企業解説スレなのかCPUのアーキテクトを語るスレなのかの閾が滅茶苦茶になってるな
545Socket774:2010/03/28(日) 16:36:41 ID:hxCdHi1o
アーキテクトならあってるジャン
546Socket774:2010/03/28(日) 16:38:30 ID:kOnl4e3j
脳味噌が滅茶苦茶なコテの庭なスレというのが正解
547Socket774:2010/03/28(日) 17:37:54 ID:vhMtmS0t
脳みそがお花畑なコテと電波陰厨が嵐スレだろ?
その合間を縫って次世代CPU話をしている感じ。
548,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/03/28(日) 17:43:03 ID:nvnx7jQ0
>>541
お前「FACオタ」だったのか!衝撃の事実!
549Socket774:2010/03/28(日) 18:00:24 ID:k7YCO29N
IBMが関係深いんなら
将来、AMDは中国資本の会社になる可能性もけっこう高いっちゅうこっちゃね
550Socket774:2010/03/28(日) 18:03:56 ID:hxCdHi1o
アブダビだろ
産油国は油枯渇後の金儲け手段を探してるんよ
だから工場だけ買ったわけ
551Socket774:2010/03/28(日) 18:11:36 ID:A1Vt2cob
アブダビの投資家が投資活動したんだろ?
工場の運営権と投資をごちゃ混ぜにする人って・・・
552Socket774:2010/03/28(日) 18:19:42 ID:hxCdHi1o
投資家じゃなくて政府系投資会社だけどね
両方とも
553Socket774:2010/03/28(日) 18:23:57 ID:hxCdHi1o
ATICは別かすまんね
AMD(Advanced Mubadala Development)
とかいわれてたな
554Socket774:2010/03/28(日) 18:25:20 ID:hxCdHi1o
Abu dhabi Mubadala Developmentだったかな
555Socket774:2010/03/28(日) 20:03:09 ID:l7TxfbrL
ま。AMD本体はアメリカが売却許可を出さないだろうな。
556MACオタ:2010/03/28(日) 21:00:11 ID:Xy1m3rTn
AMD版ターボブーストの仕様が出てきたようです。
http://lkml.org/lkml/2010/3/22/336
  -------------------
  Starting with F10h, revE, AMD processors add support for a dynamic
  core boosting feature called Core Performance Boost. When a specific
  condition is present, a subset of the cores on a system are boosted
  beyond their P0 operating frequency to speed up the performance of
  single-threaded applications.
  -------------------
詳細はリンク先に書いてある powernow-k8 のパッチをどうぞ。
557Socket774:2010/03/28(日) 22:04:05 ID:2Obs/XnV
それCPB有無判別と有効無効を切り替えフラグに関するパッチ
ソースみてもCPBの動作は全くわからんよ

実際の動作はUS20100058078に基くと思うけどさ
558Socket774:2010/03/28(日) 23:35:25 ID:K/+0gpLq
>>536
K8以降は製品自体、技術や機能がIBM化してますが…
559MACオタ>558 さん:2010/03/28(日) 23:50:48 ID:Xy1m3rTn
>>558
  ------------------
  K8以降は製品自体、技術や機能がIBM化してますが…
  ------------------
具体的にどの辺でしょうか?
560Socket774:2010/03/29(月) 00:35:12 ID:r88MONsI
>>548
SEX依存症みたいなもんか?
561Socket774:2010/03/29(月) 12:45:47 ID:FvzwRBzE
>>558
で? それの何が悪いんだ?
562Socket774:2010/03/29(月) 13:38:35 ID:05PmXDtv
AMD、最大12コアを内蔵したMagny-CoursことOpteron 6100シリーズ
http://pc.watch.impress.co.jp/docs/news/20100329_357660.html

>Opteron 6100がIntelが発表したばかりのWestmereコアのXeonに比べて
性能が同等以上で、消費電力が低く、かつ価格も安いということを強調した。
563Socket774:2010/03/29(月) 14:45:30 ID:/fPhUb70
実性能はいいとしてもベンチでも勝てるの?
564Socket774:2010/03/29(月) 16:15:36 ID:oA2sS1qr
スライド見たら予想通りショボくてわろた
565Socket774:2010/03/29(月) 16:39:29 ID:CHRMkyrQ
まーた煽り煽られの繰り返しが始まるのかよ
566●テヘ権田● ◆OhjIkO1O8o :2010/03/29(月) 17:24:07 ID:lLYIWZPL
>>563
> 実性能はいいとしてもベンチでも勝てるの?
どうなんだろうね、これまでは同コア数の対決でダブルスコアで負けていたAMD
負けを取り返すぞと12コアとコア数を倍にしメモリの4チャネル化・他ソケットへの1ホップ接続に強化
そして得意のACP表記で105W、動作クロックは2.3GHzと大幅に抑えたけど価格も$1,386と安さ爆発の設定。

さて、Intelは対抗品を出して来ますかね?
私の想像だと無視して粛々とSandy Bridgeへのリリースを進めていくのだと思われます。
567Socket774:2010/03/29(月) 17:29:01 ID:E0sodd1Y
最初のsandyまで何ヶ月あると思ってんだよアホが
568Socket774:2010/03/29(月) 17:39:28 ID:k2LnMbbx
Sandy Bridge待たなくてもNehalem-EXに追い抜かれそうな予感がする
SPECfp_rateは抜かれないかも知れないけど
569,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/03/29(月) 17:39:30 ID:DmuxX2gp
Westmere 6コアの1.4倍もの巨大ダイで、更にクロック・電圧抑えてMCM化したものを
出血価格で売りますって話だからな。

それでもし真に優位が得られるとして、Westmereでも全く同じことが可能だろ?
(むしろMCM実装に関してはIntelのほうが実績有り)

当然のことながらクロック落とした分だけシングルスレッド性能は落ちるし
既にNehalemで組んだシステムはWestmereへの移行コストがあまりかからない
故に価格・性能共に故に大した脅威にはならず、Intelが手を出す可能性は低い罠。

逆に言うと、Intelにとって採算性悪く馬鹿馬鹿しくてやらないことを、
AMDが敢えてやることで隙間の需要を狙うだけの話ですがな。


と、当たり前のことを言ってみた
570Socket774:2010/03/29(月) 17:54:03 ID:N4u3dnB+
おやおや
どっかのGPUみたいですね
571Socket774:2010/03/29(月) 17:54:25 ID:/fPhUb70
いいから「たまにPentium 4にはL1Dが無い」を解説しろ
572Socket774:2010/03/29(月) 17:54:31 ID:4R6XFGoy
Nehalem-EXはメモリ周りお化けやん
そもそも鯖向けならfpよりintだし
メモコン統合してない時代でもWoodcrest以降はまた食い荒らされてきたのにまだわかってないのかな
573Socket774:2010/03/29(月) 17:56:31 ID:xnOQJb/g
Magny-Coursの価格は衝撃的だが、Intelは焦土作戦に引き込まれたくは無いだろうね
放置するんじゃない?
574Socket774:2010/03/29(月) 17:57:37 ID:hvzai7CE
>Opteron 6100がIntelが発表したばかりのWestmereコアのXeonに比べて
性能が同等以上で、消費電力が低く、かつ価格も安いということを強調した。
>Opteron 6100がIntelが発表したばかりのWestmereコアのXeonに比べて
性能が同等以上で、消費電力が低く、かつ価格も安いということを強調した。
>Opteron 6100がIntelが発表したばかりのWestmereコアのXeonに比べて
性能が同等以上で、消費電力が低く、かつ価格も安いということを強調した。
575●テヘ権田● ◆OhjIkO1O8o :2010/03/29(月) 18:22:49 ID:lLYIWZPL
>>574
WestmereコアのXeonは最上位だと・・
X5680 6コア 3.33GHz 130W 6.4GT/秒 1663ドル

となるわけで、確かに価格は12コアの6176SEの方が安い($1,386)
としてACP vs TDPという歪ながら105W(ACP) vs 130W(TDP)対決でも6176SEの方が小さい値ではある。
問題は「性能が同等以上」ということだろうね。
シングルスレッド性能はX5680の圧勝なのは言うまでもないがマルチスレッド性能だとどうなんだろう?
私的には微妙な感じがする。
部分的に6176SEがX5680より上回るベンチは存在すると思うのだが・・・
全体的に比べるとどうなんだろう?
576Socket774:2010/03/29(月) 18:58:39 ID:WtVmhbws
シングルコア性能が一気に落ちる時代の到来か。
577MACオタ:2010/03/29(月) 19:09:31 ID:lGKVl247
早速AnandtechのJohan de Gelas氏より Magny Coursのレビューが。
http://it.anandtech.com/IT/showdoc.aspx?i=3784
2倍の物量を投入してWestmere-EPに勝ち切れないということのようで…
578●テヘ権田● ◆OhjIkO1O8o :2010/03/29(月) 19:26:24 ID:lLYIWZPL
>>577
Cinebench 11.5でX5670に負けてるのは凄いなぁとおもう
http://it.anandtech.com/IT/showdoc.aspx?i=3784&p=6
579Socket774:2010/03/29(月) 20:02:30 ID:WtVmhbws
なんだ、1パッケージあたり
>12 cores, 692 mm2 die, 19.6MB of cache on-die
MCMだから当然か。
580Socket774:2010/03/29(月) 20:27:58 ID:ih8+Eh8o
146 名前:Socket774[sage] 投稿日:2007/09/23(日) 02:16:45 ID:uqQtZWII
雑音あいかわらずいい味出してんなー。

148 名前:●テヘ権田●[sage] 投稿日:2007/09/23(日) 02:41:12 ID:/aojbA/5
>>146
> 雑音あいかわらずいい味出してんなー。
まぁな、バカは直ぐに低俗へと逃げて騒ぐから相手にしたくねぇんだけどまぁ偶には良いだろw
581Socket774:2010/03/29(月) 20:28:14 ID:xnOQJb/g
ぶっちゃけMagny-Coursは仮想化環境用だろう

仮想化環境では論理コアのHTが使えないから、物理コア数勝負になるが
この分野ではMagny-Coursは最強だろう
4ソケット版の価格はXeonより段違いに安いから、この種のサーバーのハード面のコストを強烈に引き下げられる・・・かも
582Socket774:2010/03/29(月) 20:32:30 ID:/fPhUb70
エラッタ30台のAMDCPUは鯖実用
エラッタ3桁のIntelCPUはベンチ(&暗蟻)用
583,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/03/29(月) 20:34:37 ID:DmuxX2gp
> 仮想化環境では論理コアのHTが使えないから、物理コア数勝負になるが

 一 体 ど こ の 仮 想 化 ソ フ ト の 話 で す か ?
584●テヘ権田● ◆OhjIkO1O8o :2010/03/29(月) 20:36:58 ID:lLYIWZPL
>>583
もしかしたらAMD社製の非公開ソフトなのかもw
585えるえる:2010/03/29(月) 20:37:00 ID:jmMLJ2Vr
586,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/03/29(月) 20:38:59 ID:DmuxX2gp
X5570機ならHyper-Vで普通に16論理CPU使えてますよ。
587Socket774:2010/03/29(月) 20:41:32 ID:N4u3dnB+
XPもーどトカジャネ
588えるえる:2010/03/29(月) 20:57:46 ID:jmMLJ2Vr
http://it.anandtech.com/printarticle.aspx?i=3784
冷静にみると、Magny-Coourが速いのと、Istanbulが速いのと、Intelが速いのと
結構割れてるな。サーバも適材適所ということか。
589Socket774:2010/03/29(月) 20:59:27 ID:cOIpmz7u
これまでより大分戦えるモノ出してきたな
bulldozerも楽しみだわ
590えるえる:2010/03/29(月) 21:01:21 ID:jmMLJ2Vr
まあこういうアーキテクチャが通用するのは、
あくまでもサーバの話でデスクトップでは無論へろへろなわけだが。
591Socket774:2010/03/29(月) 21:04:38 ID:dQxJl/RB
最近はエンコ用途でもクアッドコアで間に合っちゃうしなあ
592Socket774:2010/03/29(月) 21:19:59 ID:CHRMkyrQ
2.2GHzつよすぎわろた
593Socket774:2010/03/29(月) 21:24:29 ID:CHRMkyrQ
消費電力のってね〜
594Socket774:2010/03/29(月) 21:27:12 ID:N4u3dnB+
??
12core対24core??
595●テヘ権田● ◆OhjIkO1O8o :2010/03/29(月) 21:28:08 ID:lLYIWZPL
>>588
> 冷静にみると、Magny-Coourが速いのと、Istanbulが速いのと、Intelが速いのと
> 結構割れてるな。サーバも適材適所ということか。
どうかなぁ、実質24コア vs 12コア対決でその状態だし少し呆れてます。
596Socket774:2010/03/29(月) 21:29:12 ID:WtVmhbws
1コアだけ最強いれて、のこり11コアをチープにすれば良かったのに。
597えるえる:2010/03/29(月) 21:33:06 ID:jmMLJ2Vr
Intel Xeon W5680 6 130W 3.3GHz $1663 vs AMD Opteron 6176 SE 12 105/137W 2.3 GHz $1386
Intel Xeon X5670 6 95W 2.93GHz $1440

Magny-Coursの最上位であるOpteron 6176SEの位置づけが、
W5680の対抗馬だからな。コア数は問題ではない。AMDは身を削って安く売る方針だからなあ。
IntelのX5670はAMD的には格下の位置づけであるが、実性能はさておき、Opteron 6176SEのほうが安いようだね。
598Socket774:2010/03/29(月) 21:34:27 ID:N4u3dnB+
>>596
それだ
2coreをリッチにして他をシンプルにすりゃ
シングルもマルチも満たせるにゃ

ってIntelの目論見じゃねこれって
599えるえる:2010/03/29(月) 21:34:29 ID:jmMLJ2Vr
Anandのベンチでレビューされているのは格下の6174だからさらに安いね。
価格的には完全に格上との比較になってるな。
600●テヘ権田● ◆OhjIkO1O8o :2010/03/29(月) 21:39:00 ID:lLYIWZPL
>>596
> 1コアだけ最強いれて、のこり11コアをチープにすれば良かったのに。
さてOSはシングルスレッド動作時にその最強なコアを使用してくれるでしょうかw
601Socket774:2010/03/29(月) 21:41:29 ID:dzLC2B3F
システム単位で性能・価格・消費電力が良ければそれで良い
602Socket774:2010/03/29(月) 21:42:10 ID:N4u3dnB+
消費電力はきつそうですが
603●テヘ権田● ◆OhjIkO1O8o :2010/03/29(月) 21:44:04 ID:lLYIWZPL
>>599
> Anandのベンチでレビューされているのは格下の6174だ
X5670も格下だから丁度よいのでは?

> 価格的には完全に格上との比較になってるな。
値段はAMD安いね。多分その価格でないで売れないと見越したうえでの値付けなんだと思われます。
604Socket774:2010/03/29(月) 21:45:17 ID:nS7+thtW
通常で使う分にはOpteron 6164HEとシングルソケットのH8SGL-Fとの組み合わせがコストパフォーマンス的にはよさげだね
605Socket774:2010/03/29(月) 21:45:55 ID:CHRMkyrQ
Nehalem-EXとの比較はないのか?
606Socket774:2010/03/29(月) 21:48:29 ID:/fPhUb70
うわ
いつもの知的障害者の集中豪雨的な串使いが凄ぇ
607Socket774:2010/03/29(月) 22:01:24 ID:CHRMkyrQ
>Do remember that this is a completely synthetic benchmark. A 100% encryption performance advantage might translate in a very small performance advantage in a real world application

え〜
608●テヘ権田● ◆OhjIkO1O8o :2010/03/29(月) 22:38:19 ID:lLYIWZPL
>>604
1.7GHzだとちょっとまったりしてるけど12コアということでサーバーとしては良い選択肢なのかも知れませんな。
使う側からすれば、急激な速度低下は減ったけど最新のサーバーなのになんかまったりしてるよなぁ〜って感じか?
609,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/03/30(火) 02:34:13 ID:SOh+hHxU
ボラクルを使うなら性能的にも価格的にもWestmere-DPがよさげだな。
24スレッドだろうが物理コア数12でカウントされるからコア係数0.5をかけて6CPU分。
Magny-Coursは特に係数が小さくなる特例がなければ12CPU分のライセンス料がかかる。
610Socket774:2010/03/30(火) 03:07:24 ID:JYMTqf1C
マニクールの存在意義はWestmereに勝つことじゃなく、
シェアの低下を抑えるために、コストやTDP無視で性能だけでも食らいつくだからな。
来年後半のBulldozer16コアまでなんとか戦えれば御の字
営業も、Bulldozerへのアップグレード込でマーケティングを行っているだろう。
まあ、結構健闘しているようで、これなら1年くらいはなんとかなるんじゃね?

しかしWindows完敗→Linux圧勝は笑えるw
ttp://it.anandtech.com/IT/showdoc.aspx?i=3784&p=7
           win  Lin
Op 6174(2.2G)  32s→18s
Op 2435(2.6G)  41s→27s
Xeon 5670(2.9G) 26s→32s
Xeon 5570(2.9G) 35s→33s
611Socket774:2010/03/30(火) 03:12:01 ID:JYMTqf1C
HD5870vsGTX480を見た後じゃ余裕w

TDPや消費電力は普通のハイエンド、歩留まりもそれなり、ライバルと同時期
ダイサイズは3倍だけど、それ以外が常識の範囲に収まっているから普通に売れるだろう。
612Socket774:2010/03/30(火) 05:19:25 ID:iUik/FGG
>HD5870vsGTX480

余裕でまけてんじゃん
613Socket774:2010/03/30(火) 06:06:59 ID:JYMTqf1C
>>612
GTX480お買い上げオメデトウw
あれはどう見てもGTx480の惨敗だろw
DX11は5割くらい速いけど+130Wって馬鹿すぎるだろw
614Socket774:2010/03/30(火) 06:35:27 ID:0cbIDex0
>HD5870vsGTX480
ミドルとハイエンドを比べるな
615Socket774:2010/03/30(火) 06:39:16 ID:0cbIDex0
RADEONの値下げないようだしFermiに競争力は無いんだろうなぁ
616Socket774:2010/03/30(火) 07:09:06 ID:oyTWMNKK
むしろHD58xx、HD5970があちこちで売れ始めてるな。
Fermi待ちしてた人たちが諦めてRADEONに走ったか
617Socket774:2010/03/30(火) 07:12:29 ID:JYMTqf1C
競争出来るだけの物量が全く無いからね
今や月間数十万個出荷していて尚品不足のHD5870に対し、
出荷数万のGTX4xxじゃ何の圧力にもならない。
618Socket774:2010/03/30(火) 07:27:21 ID:MC5U0mO2
アーキテクチャを別にしてダイサイズだけで話すとしても
ある程度肥大化したらニコイチにするのが賢いね
500~600muでもまだワンチップに拘るとか小さいダイなのにニコイチにするとか
また証拠書類改竄発覚でもしたのか?ってくらい意味不明
619Socket774:2010/03/30(火) 08:21:33 ID:yrbSdKtU
PCの出荷台数は年間3億〜台
サーバーは年間1千万〜台
PC用のチップを流用してサーバー専用チップ開発のコストを浮かせられることがメリットなんだろうね

あと、MCMなら高品質品は高品質品と、低品質品は低品質品とペアにすることが出来るから、良品を作りやすいのかも
620Socket774:2010/03/30(火) 08:30:27 ID:oyTWMNKK
作るのは6コアCPUだけでいいわけか。

一般向けにはPhenomII X6として売って
鯖向けにはOpteron6コアか、2個MCMして12コアで売る。

2コア欠陥があったらPhenomII X4か
Opeteron4コアか2個MCMして8コアで売る

そういえばOpteronは全ラインナップで機能の差異がないことも売りにしてたな。
これも生産ライン1本化の知恵か。
621Socket774:2010/03/30(火) 09:56:36 ID:Q3p6xHRE
MCMのコストが高いんだけどな
622622>621 さん:2010/03/30(火) 10:08:24 ID:ZCQx/oQw
>>621
またソースを出せない適当な話を(笑)
623Socket774:2010/03/30(火) 10:15:52 ID:oyTWMNKK
12コアの1ダイが出来上がるコストよりは安いんでしょ
624Socket774:2010/03/30(火) 10:19:33 ID:ja+q9c6W
これMACオタ?
625Socket774:2010/03/30(火) 10:20:25 ID:JTq9RNuQ
新コテ誕生の瞬間
626Socket774:2010/03/30(火) 10:48:05 ID:MC5U0mO2
誰かが一瞬早く書き込んで数字ズレたらどうするつもりなんだろう
627Socket774:2010/03/30(火) 12:11:20 ID:8d+cFSkb
笑えばいいと思うよ
628,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/03/30(火) 12:23:36 ID:SOh+hHxU
>>623
Westmere-EX(Beckton)のことだろうけど
XeonMPは巨大ダイに舵を切って以降、歩留まり向上のために全コア動くのは最上位だけに留めている。
出荷量が多いのは大概2コア殺し版だよ。

それでなくとも製造技術がこなれてから作るから大きいダイでもある程度高い歩留まりが保てる。
単価自体も高いしね。

件のNehalem-EXに関してはHPC向けに投入されるのはあくまで6コア版
629Socket774:2010/03/30(火) 12:57:12 ID:MC5U0mO2
じゃあこいつのどうしようもない脳味噌はどうすんだろ
630Socket774:2010/03/30(火) 13:41:00 ID:IvJG9z+k
BecktonってNehalem-EXのことじゃなかったっけか?
631Socket774:2010/03/30(火) 13:49:04 ID:JYMTqf1C
あえて釣り針に引っかかってみよう
>>623はマニクールのことだろ
ベクトンなんかどうでもいい
632,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/03/30(火) 14:55:10 ID:SOh+hHxU
うい
まあこの分だとMPサーバ向けはしばらくNehalem-Westmereが無敵状態だろうし
DPサーバ向けに限ればこんなもんでは

      Opteron-DP          Xeon-DP
2010Q1 Magny-Cours 12C(MCM) Westmere 6C
2010Q2 |               |
2010Q3 |               |
2010Q4 |               Sandy Bridge 6C
2011Q1 Bulldozer 8C         |
2011Q2 |               |
2011Q3 Bulldozer 16C(MCM)    |
2011Q4 |               Ivy Bridge 8C          ※DDR4ローンチ?
2012Q1 |               |
2012Q2 ?               |
2012Q3 ?               Haswell 8C + Larrabee3 ?
2012Q4 ?               |

ちなみにAMDの資料から察するにBulldozer 16コアは推定3GHz前後だぞ、と。
633Socket774:2010/03/30(火) 15:08:28 ID:F9PSQe4c
あれでしょ
コアあたりのパフォーマンスで競っても・・・なんで
数で勝負っていう

サーバーはそれでも良いんだろうけど
クライアントはどうすんのかね
今後
634634>632 さん:2010/03/30(火) 15:11:25 ID:ZCQx/oQw
>>632
またソースを出せない適当な話を(笑)
635Socket774:2010/03/30(火) 15:20:54 ID:JYMTqf1C
>>632
SandyBridge6C/8Cは早くても2011Q2以降だろ、流石に2010Q4はない。
それじゃWestmereの寿命が短すぎて買うなって言ってるようなもの

それに、マニクールのように今後のサーバー向けはシングルとMCMを同時リリースになるだろうから
Bulldozer 8C/16Cは同時期だよ。

2012以降は正直予想不可能だろ

AMDはBull+HD6xxxのFusion
IntelはHaswell+Larrabee

どちらも両社の技術力を考慮しても困難さでは同等と見ていいからね
登場時期も互いの様子見で時期を結局あわせてくると思う
636Socket774:2010/03/30(火) 15:30:34 ID:ja+q9c6W
>>635
Dempsey「お前の優しさに全俺が泣いた」
637Socket774:2010/03/30(火) 16:25:47 ID:yrbSdKtU
Intelは8コアじゃ仮想化鯖でBulldozer 16C(MCM)に対抗できんだろ
IntelもMCMやってくるんだろう
638Socket774:2010/03/30(火) 16:33:08 ID:KiLYsiR3
639Socket774:2010/03/30(火) 16:35:43 ID:ZCQx/oQw
>>637
提灯記事がよめるならそうなってほしい
640Socket774:2010/03/30(火) 17:24:36 ID:MC5U0mO2
Bullは前世代プロセスK10のクロック+1GHzくらいかね?
641えるえる:2010/03/30(火) 18:50:26 ID:+OLvBtq6
>マニクールの存在意義はWestmereに勝つことじゃなく、
>シェアの低下を抑えるために、コストやTDP無視で性能だけでも食らいつくだからな。
BulldozerのSandy Bridgeに対するポジションも現実的には同じ様な感じになりそうだよな。
Mangy-CoursはIstanbulとBulldozerのつなぎといういみでは、
スループット寄りになったわけでまあうまいところに収まってるな。

>>609
AMDのマーケティング部門はアフォなことに、
1モジュール1コアとしてアピールしていれば、ボラクルをはじめとするライセンス料が安く済んで、
身を削らなくてもすんだかもしれないのに、何を思ったか16コア-!!!とかいってるからなあ。
さき考えて無さ杉。
642えるえる:2010/03/30(火) 18:52:41 ID:+OLvBtq6
今やサーバは本体価格よりも電気代のほうが高いというくらいの安物が主流だというのに、
今後はコアの数が多い=良いこと
のようなマーケティングはサーバ用CPUとしてはライセンスのことを考えれば自殺行為なので廃れていくかも知れんな。
643えるえる:2010/03/30(火) 19:05:53 ID:+OLvBtq6
というのは嘘。
今はソケット数のライセンスになっていたのだった。
644えるえる:2010/03/30(火) 19:08:07 ID:+OLvBtq6
マルチコアプロセッサ利用時の必要ライセンス例
http://www.oracle.com/lang/jp/corporate/pricing/mcpu.html
645えるえる:2010/03/30(火) 19:09:57 ID:+OLvBtq6
なんだこれ。一貫性なさすが。
ボラクル糞だな。
646Socket774:2010/03/30(火) 19:13:49 ID:yrbSdKtU
仮想化鯖使うときに、仮想コア数が物理コア数を超えるとシステム全体の性能が落ちる
だから物理コア数の多さは大きなアドバンテージ

あとライセンスは今はどうなの?
647,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/03/30(火) 19:14:22 ID:SOh+hHxU
ソケット単位課金なのはStandard EditionとStandard Edition Oneだろ。
一番上のEnterprise EditionのProcessorライセンスは相変わらず物理コア数×コア係数だよ。
http://www.oracle.com/lang/jp/corporate/pricing/dbee.html

EEは1CPUライセンス(x86の場合2コア相当)あたり500万だから馬鹿にならん
648えるえる:2010/03/30(火) 19:16:03 ID:+OLvBtq6
MCM高いと思ってるやつがいるようだが、
IntelはSmithfieldのPen DからわざわざPreslerだかなんだかっていうXeonだすときには、
わざわざMCMの設備に投資してまで、MCMにしてきたんだが。Clarkdaleみてもやすいのわかるだろ。
製造コストはダイサイズに対して指数関数的に増えるという基本を覚えているのならば、
数百平方mmいったら分けたほうが断然いいって想像つくだろうな。
649えるえる:2010/03/30(火) 19:20:20 ID:+OLvBtq6
AMDはサーバ用ソフトベンダーにBullのライセンスを
有利に働かせるよう政治力が問われるわけか…。
個人的にはデコーダ共有しているのに、物理コア2つという計数は胡散臭いと思うが。
650Socket774:2010/03/30(火) 19:23:07 ID:MC5U0mO2
きもすぎる
651えるえる:2010/03/30(火) 19:36:04 ID:+OLvBtq6
>>385
いまさらながら、
Pentium II〜IIIくらいの時代にK6系がそれなりにクロックあがって戦えたてのって
今思えばかなり善戦だな。
K6はOOO付で6ステージしかないのに10数ステージあるP6にくらいついていたのは、
プリデコード〜デコードの仕組みがかなり貢献してるのかもな。
FPUが残念設計だったから、まあ結局は勝てなかったわけだが。
652,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/03/30(火) 20:31:02 ID:SOh+hHxU
>製造コストはダイサイズに対して指数関数的に増えるという基本を覚えているのならば、

ダイサイズが倍以上になっても冗長化して不良ブロックを殺すことを許すならばむしろ歩留まりは向上可能。
同様のことはCellが実際やってるしね。


んで、結合自体のコストだけどさ。。。
そもそもモノリシックダイなら内部結合ですむものを外部接続インターフェイスを使って結合しないといけないわけで。
L3間の調停にせよ、ダイを跨ぐ際に電気信号をパラレルからシリアル(実際には狭幅パラレル)に変換しないといけないしね。
単一のL3キャッシュにぶら下がってコヒーレンシを保ってるモノリシックダイと比べても圧倒的に調停コストは大きいぜ。

HTにせよ、Istanbulにはダイごとに合計4ウェイあるが、2ウェイずつをダイ間結合に使ってるので
外部結合に使えるのは結局パッケージあたり4ウェイ。

653えるえる:2010/03/30(火) 21:15:08 ID:+OLvBtq6
冗長化っていうてもあるけど、
むしろサーバ用はMCM化を容易にできるようにI/Fを設計にして、
MCMでコア数を差別化したほうが開発費を考えたらいいかもな。
ぶっちゃけ数量ベースでみればあきらかにPCよりもすくないのに、
個別にダイを用意するのがばかげているよ。
654えるえる:2010/03/30(火) 21:16:40 ID:+OLvBtq6
個別に専用ダイを用意しているのはIntelにしかできないような
超絶的力技なんでそれが当たり前だなんて思わないでね。
IBM, AMDクラスはMCMが現実的。
655Socket774:2010/03/30(火) 21:42:06 ID:yrbSdKtU
歩留まりと言うか良品率じゃないかな

単なる机上の計算だが・・・
例えば10億トランジスタのチップを例えばクロックでA、B、C...Jまで10ランクに区分する

同じ製造技術で20億トランジスタの1チップを作ると
Aランク:1/100、Bランク:3/100、Cランク:5/100....Jランク:19/100となる

でも10億のチップ2個のMCMなら
Aランク:10/100、Bランク:10/100、Cランク:10/100...Jランク:10/100となる
656えるえる:2010/03/30(火) 21:46:10 ID:+OLvBtq6
まあデカダイがそんなにコストメリットがあるのならば、
Bulldozerも最初から16コアでつくってるよな。
たぶんCellのようにリングじゃないだろうし、冗長コア化が容易ではないのかもしれない。
MCMは基本的には基板にICをのっける実装技術の延長だから、
一度ラインができてしまえば機械がやるさぎょうで11個のせるか複数のせるかの差なので、
そこまで高くならんはずだよ。最初の実装装置の設備投資だけだな。
657Socket774:2010/03/30(火) 21:48:22 ID:iUik/FGG
リングじゃないのと冗長性に何の関係が
658Socket774:2010/03/30(火) 22:16:53 ID:giARxfye
AMD、サーバ向け12コアプロセッサ「AMD Opteron 6100シリーズ」を発表
http://journal.mycom.co.jp/news/2010/03/29/035/index.html

仮想化道場−2〜4ソケットサーバーで使える低価格・12コアの「Opteron 6100」
http://enterprise.watch.impress.co.jp/docs/series/virtual/20100330_357638.html
659Socket774:2010/03/30(火) 22:23:12 ID:7wYjy6pa
>「経済が低迷する中、エンドユーザーはサーバの価値を見極め、低い投資で
>最大限の効果を出したいと考えている。そうすることにより浮いたコストを、
>より優秀な人材の引止めや拡充などへ回すことが可能となるからだ。
>我々は、そうしたことが真に可能となるように、2ソケット向けCPUと4ソケット
>向けCPUを同じ価格にし、より高い性能を低コストで実現できるようにした」
>と、4ソケット向けCPUのあり方そのものを見直したことを強調する。
>また、4ソケットサーバの市場シェアは10年前には10%あったが現在は
>4%に減少、このまま行けば消えてしまう可能性があるとの見方もあるが、
>「こうした状況を抜本的に見直す必要があった。結果として、2ソケット
>向けと同じコストで4ソケット向けを出せれば、市場に4ソケット向けの
>パフォーマンスを生かそうと思う動きが出てくるはずと考えた」


・・・・、要約すると
MP向けをダンピング価格で提供しないとXeon DPと戦えません(><)
ってことなんだよね?
660えるえる:2010/03/30(火) 22:27:58 ID:+OLvBtq6
PhenomのX3の無効コアは、テストしてるのかそもそもなぞだな。
661Socket774:2010/03/30(火) 22:37:51 ID:oyTWMNKK
>>659
何ビビってんの?
662Socket774:2010/03/30(火) 22:40:19 ID:yrbSdKtU
MP向けのCPUは高すぎて、4ソケットで組むぐらいならブレードサーバーで数を束ねる方が効率的だった
663えるえる:2010/03/30(火) 22:43:33 ID:+OLvBtq6
AMDはリーマン・ブラザーズ見てからMagny-Cours開発はじめたんだっけか…。
まああまり気にするほど度も無い文章だけど。
664えるえる:2010/03/30(火) 22:51:40 ID:+OLvBtq6
世の中はクラウドいってるようだが、
実態はサーバCPUも性能があがりすぎて、4S以下のローエンドサーバで
ほとんどのニーズまかなえるようになってしまって、一部のニッチネタ以外は、
もはや人件費やら電気代やらのランニングコストでしか差別化できるネタがなくなってしまったってのが
本当のところなんだろうなあ。
クラウドはその辺の事情をうまく隠蔽してくれる魔法の言葉。
本当は安いサーバばっかにつないでるんだけどばれたらかっこわるいから、
顧客はサーバの種類や中身なんて考えなくていいからだまって委託しろみたいな。
665えるえる:2010/03/30(火) 22:59:04 ID:+OLvBtq6
つーか、4S超のミドル以上のサーバがどんどん需要なくなってるのが事実だってのに、
クラウドで中央集権が復活するわけねーじゃん。クラウド厨糞杉。
Googleとかのスーパーニッチなんて参考にならねぇしな。
統合化のながれだってサーバの性能があがって、1つにまとめたほうが
維持費やすくなるのがわかったってだけだわ。むしろどう考えてもサーバは衰退にむかってるな。
666Socket774:2010/03/30(火) 23:14:44 ID:JYMTqf1C
利益は出るんだろうが、シェアの拡大に繋がるかどうかは厳しいかもしれんね
667Socket774:2010/03/30(火) 23:27:57 ID:4DTk6Tt4
>>659
その文で要約がそれとか。頼むから日本語学校へ逝ってくれ。
668Socket774:2010/03/30(火) 23:47:03 ID:oyTWMNKK
Opteron 4100シリーズのラインナップと価格
ttp://northwood.blog60.fc2.com/blog-entry-3687.html

2P以下で十分というならなおさら価格が重要ですなぁ
669Socket774:2010/03/31(水) 00:03:17 ID:USikYGiF
>>659
MPのプレミア分をなくした価格設定は事実上サーバー屋に対する補助金
670Socket774:2010/03/31(水) 00:40:11 ID:1AMrqLuc
それにしてもこのところAMDの手を繰り出すペースが凄まじいな
671Socket774:2010/03/31(水) 00:47:29 ID:EGNa1DRs
つーか鯖需要ってまだあるの?
金融鯖はアレだし、CG用?
672Socket774:2010/03/31(水) 09:09:18 ID:BnuXNmBK
673Socket774:2010/03/31(水) 09:25:30 ID:8Dipx4kp
>>672
あとはベンチマークだな
674Socket774:2010/03/31(水) 09:31:05 ID:8Dipx4kp
というかNehalem-EXとWestmereって登場時期同じくらいなのか
intelはどっちメインで売りたいんだ?
675Socket774:2010/03/31(水) 09:34:19 ID:8Dipx4kp
SemiAccurate :: ATI's next generation plans outed
http://www.semiaccurate.com/2010/03/30/atis-next-generation-outed/

あらら、容赦ないね
676Socket774:2010/03/31(水) 11:01:33 ID:1AMrqLuc
>>674
Westmere-EPは2ソケットまで用でNehalem-EXは4ソケット以上用じゃないかな

Nehalem-EXは>>672を見る限りWestmere-EPより大分クロックが低いから、2ソケットまでなら演算能力ではWestmere-EPには及ばなそう
677Socket774:2010/03/31(水) 13:55:05 ID:fxaW/zhO
あとはなにより価格じゃね?
ピークパフォーマンスではどうみても戦えないけど
CPUのコストパフォーマンスで見れば
明らかにAMDに分がある
678,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/03/31(水) 14:09:47 ID:swjCQpSQ
CPUの単価が製品の単価を大きく左右するのは「パソコン」まで。

ミッドレンジ以上のサーバーはCPU以上に高い部品なんてザラにあるし
ソフトウェアのライセンスやサポート、その他人件費込み込みで考えると
CPUだけの価格差なんて本質じゃなくなる。
679Socket774:2010/03/31(水) 14:20:19 ID:z1eENm0J
AMDのメリットは、プラットフォームの息の長さだと思う。
と、うちのソケF鯖が申しておりますw
680Socket774:2010/03/31(水) 14:35:30 ID:jK9p3Bze
>>678
いい加減にしろ知的障害者
681,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/03/31(水) 14:39:34 ID:swjCQpSQ
たとえばMagny-CoursはDDR3 4chだけど
3chに留めてるWestmere-EPよりマザボの単価安く済むでしょうか?

このへんは常識で考えてね
682Socket774:2010/03/31(水) 14:45:24 ID:8Dipx4kp
つまりWestmere-EPは貧乏企業相手に売れるということだよね
683Socket774:2010/03/31(水) 14:53:33 ID:jK9p3Bze
知的障害者の発言はそれまでの流れと無関係なものを持ってくるうえに
>CPU以上に高い部品なんてザラにある

CPUより安いマザボの話
とそいつの中だけでも流れが無いうえに
コピペすら現実と違えるようにしばしば変えてきたりとどうしようもない
684,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/03/31(水) 14:56:19 ID:swjCQpSQ
WestmereはDDR3 1600MHzまで公式対応してるから十分でしょう。
Magny-Coursはなぜか1066/1333のみ対応にしてるけど(非公式には1600もいけるとか)

ちなみに最大メモリ搭載量
Nehalem/Westmere-EP: 384GB
Magny-Cours: 128GB
685Socket774:2010/03/31(水) 15:03:57 ID:8Dipx4kp
http://pc.watch.impress.co.jp/docs/news/20100331_357926.html
>対応メモリはDDR3-1066/978/800

http://ad.impress.co.jp/special/amd1003/pc2/
>2P構成なら192GB、4P構成ならば384GB
686Socket774:2010/03/31(水) 15:04:49 ID:AJtGs/N8
>681 名前:,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o [sage] 投稿日:2010/03/31(水) 14:39:34 ID:swjCQpSQ [2/3]
>たとえばMagny-CoursはDDR3 4chだけど
>3chに留めてるWestmere-EPよりマザボの単価安く済むでしょうか?
>
>このへんは常識で考えてね

こんなこと言った直後に、Nehalem/Westmere-EPの最大メモリ搭載量を自慢。

鳩山総理かよお前は。
687,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/03/31(水) 15:15:09 ID:swjCQpSQ
>>685
> http://pc.watch.impress.co.jp/docs/news/20100331_357926.html
> >対応メモリはDDR3-1066/978/800

それのどこがWestmereなんですか?


> http://ad.impress.co.jp/special/amd1003/pc2/
> >2P構成なら192GB、4P構成ならば384GB


製品レベルの話だよ。
http://pc.watch.impress.co.jp/docs/news/20100330_357892.html
>  一例として、H8SGL-FとH8SGLは、シングルソケットのATXフォームファクタを採用するのが特徴。
> メモリはDDR3-1333/1066 /800に対応し、Registered ECCでは最大128GB、Unbuffered ECC/non-ECCでは最大32GBまでをサポートする。


Nehalem EPで既に384GBまで
https://www.cisco.com/web/JP/product/hs/ucs/ucs_b/prodlit/pdf/at_a_glance_c45-531022.pdf

> Cisco UCS B-250 M1 には、シスコが特許を取得した拡張メモリ
> テクノロジーが採用されています。このテクノロジーは従来の
> 2 ソケット サーバの 2 倍以上の容量の業界標準メモリ(384 GB)
> を提供し、仮想マシンを沢山収容する場合や、大容量データ セッ
> トを扱うシステムに最適です。あるいは、それほど多くメモリの容
> 量を必要としない場合にも、メモリを多く設置できることを利用し
> てコスト効果の高いメモリ ソリューションとしても使えます。
688,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/03/31(水) 15:18:55 ID:swjCQpSQ
>>686
CPUの安さに妥協しては最大限のパフォーマンスは得られないってことですよ
689,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/03/31(水) 15:25:22 ID:swjCQpSQ
690Socket774:2010/03/31(水) 15:30:32 ID:1AMrqLuc
鯖用のWestmereってDDR3 1600MHzまで対応してるんだっけ? 
691,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/03/31(水) 15:51:33 ID:swjCQpSQ
ECC付きの1600MHzモジュールはまだまだ供給量少ないし、数の問題でしょ
692Socket774:2010/03/31(水) 16:10:26 ID:1AMrqLuc
AMDもIntelもメモコンはライセンスの関係でRumbus供与の同じコントローラーモジュールを積んでそうだが
693Socket774:2010/03/31(水) 18:13:30 ID:hWrGT4q+
高いよりは安い方が良いに決まってる

ところでNehalem-EXが8コアで2.26GHzなことを考えると
12コアで2.3GHzなMagny-Coursって結構がんばってる気がする
まあトランジスタ数は5億ほど違うけど
694Socket774:2010/03/31(水) 18:32:38 ID:z1eENm0J
なんかレス番飛んでるけど気狂い湧いてる?
695Socket774:2010/03/31(水) 18:32:40 ID:1AMrqLuc
Nehalem-EXは600mm2級らしいからクロック上げるのは大変かもしれんね
696,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/03/31(水) 19:07:55 ID:swjCQpSQ
>>693
どう頑張ってるのかkwsk
697Socket774:2010/03/31(水) 19:12:56 ID:I9Wfg8LM
6coreで240mm2なのに
8coreで600mm2なのかよって
45nmかい
698,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/03/31(水) 19:16:07 ID:swjCQpSQ
そりゃNehalem-EXは45nmだが何か
Xeon MPが1年遅れなのは昔からだろう
699Socket774:2010/03/31(水) 19:21:31 ID:I9Wfg8LM
いや、単に意外だっただけさ
700,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/03/31(水) 19:23:49 ID:swjCQpSQ
Magny-Coursは過熱すると自動クロックダウンする機構を付けることで2.3GHzのクロックを実現する。
要するに逆Turbo-Boostだな

ちなみにNehalem-EX最上位のX7560はTBで2.66GHzまでブーストするが
それを「2.66GHz」としては売らない。

姿勢の違いが出てて面白いな
701Socket774:2010/03/31(水) 19:31:13 ID:I9Wfg8LM
ま、VIAだってnano U2250は自動クロックアップで1.6GHzで常時稼動してるけど1.3+GHzってしてる
702Socket774:2010/03/31(水) 19:40:00 ID:jK9p3Bze
TDP内で全コアフルロード出来る定格クロックの
2.26Gと2.3Gの差に
いつもの知的障害でいちゃもんをつけるいつもの知的障害者
703,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/03/31(水) 20:34:54 ID:swjCQpSQ
行列積みたいな全演算ユニットフルバーンなプログラム動かしたとき
クロックダウンする可能性があるんだろ。
704えるえる:2010/03/31(水) 20:51:49 ID:WK5FKTeA
まあMagny-Coursは2S向け主眼で、
対RISCサーバ色の強いNehalem-EXとは実際のところ狙いが違う製品なので、
そんなに競合しないわけであるが。
705Socket774:2010/03/31(水) 20:58:48 ID:jK9p3Bze
たまにL1Dが無いPentium 4の話は要らないです
現実世界ではTDPと冷却能力は別問題

ttp://pc.watch.impress.co.jp/docs/news/20100329_357660.html
ヒートシンクが外れたりファンが壊れたりエアフローが詰まったりなどで発熱が限界を超えた時
今までは焼損防止で強制停止にでもなってたのかな?
それがクロック落とすだけで済むようになるんならいいことだ
706Socket774:2010/03/31(水) 21:36:54 ID:PnwgpS+Z
>>705
IntelがTDPの値を鯖読みすぎてて、そのままバカ正直に作った鯖は負荷がかかると
サーマルスロットリングやサーマルシャットダウンが動くCPUがあるよ。
もちろん、キチンとラッキングしてDCに置いててそうなる。

勤務先にそのモデルが残ってるw
707,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/03/31(水) 21:57:18 ID:swjCQpSQ
発表資料を読む限りTDP通りに組むとMagny-Coursでもそうなるぞ
708Socket774:2010/03/31(水) 22:23:46 ID:H9vLxLPk
昔PentiumDあたりであったような話だな。
709Socket774:2010/03/31(水) 23:35:09 ID:EaXkGOtE
>>700
Magny-Coursって本当にAMD版のSmithfieldだよなあw
Smithfieldもライバル(Athlon64X2)に置いてかれないためのMCMだった
Clovertownみたいなライバルを突き放すためのMCMではなく
710Socket774:2010/03/31(水) 23:36:52 ID:aK/VuXcX
>>709
お前は"Smithfield"を全くわかっていない。
それは"Smithfield"を余りに擁護しすぎている。
711,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/03/31(水) 23:43:53 ID:swjCQpSQ
http://pc.watch.impress.co.jp/docs/news/20100329_357660.html

> 「AMD Cool Speed Technology」と呼ばれる省電力機能が実装されており、
> 温度センサーで温度が限界を迎えたと判断したとき、プロセッサのPステートをより
> 低い段階へと強制的に移行させる機能だ。
> これらの機能により、プロセッサの電力効率を前世代に比べて高めている。

まあ詳細はPDFでも読めばいいとして
数字通りの熱設計だと、強い負荷がかかるたびに「AMD Cool Speed Technology」(笑)が発動するわな。
712Socket774:2010/03/31(水) 23:54:33 ID:EaXkGOtE
>>710
はいはい
713Socket774:2010/03/31(水) 23:57:46 ID:6d3Ju6YO
>712
はいはい じゃなくて。
炭と一緒にされちゃMagny-Coursがかわいそうだ。
あれよりはずっと洗練されているでしょ。
714Socket774:2010/03/31(水) 23:57:59 ID:5fD0Q6Aq
>>700
それって単にファンが壊れたり、室内やケース内の温度が高くなって冷却能力を超えた場合に、
クロックを抑えて破損や停止を防止するってだけだろ。
環境が安定した状況での定格動作でも異常発熱する問題があるみたいな意味じゃあない。

まあ、Magni-Coursをバカにして貶めたいようだけど、
元から性能の真っ向勝負で勝てるとは誰も思ってないから意味が無いよ。
6コアだけじゃジリ貧だから、くっつけた12コアを取り敢えず作ってみましたってだけ。
715Socket774:2010/03/31(水) 23:59:24 ID:5fD0Q6Aq
取り敢えず、Westmere6cのスペックは分かったし、同じ32nmのSandybridge8Cのスペックも大体予想出来るな。
恐らく8C/16T 2.8G〜3Gが130Wだろう。(2コア増えてクロック一割引)

対するAMDは、Bulldozerが全く不明だから32nm Llano 4C 3G=60Wを元に適当に予想してみよう。
取り敢えず単コア性能はk10=Bull、TDPはK10 2C=bull 3Cだと仮定する。
K10 4コアが40Wとすると2コア 20Wだから、
Bull 3コア 20W→16コア 110Wになる。

キャッシュ他が20WとしてBull 16コア 3G 130Wでいけそうだね。
つまり8コア 3Gが65Wになるのかw

時期的にもBull 16C 3G vs Sandy 8C/16T 3Gが直接ぶつかるね。

来年後半はAMDvsIntelでガチの防御無視の殴り合いになり非常に面白そうだw
716Socket774:2010/04/01(木) 00:01:37 ID:AJtGs/N8
Smithfieldは2個のダイの間に全く通信路がなく、
チップセットを経由しないといけない、本物のニコイチ。

Magny-Coursは二つのダイがHTリンク二つでちゃんと繋がってる
717Socket774:2010/04/01(木) 00:21:35 ID:bAgBjejL
350mm2のMCMと500MM2の製造コストはどっちが高いんだろうな。
サイズ比がHD5970 vs GTX480っぽいけど。

適当に計算してみた。
歩留まりは350mm2が60%、500mm2が40%位かね。
それぞれウェハから150個、100個のコアが採れるとして計算すると、
150*0.6で90個、100*0.3で30個採れることになるな。
MCMだから半分の45個分になるとすると、

1ウェハからマニクールが45個、X7000が30個ということか。
SOIの分コストが上がってもだいたい同程度のコストだな。

コスト一緒で多く採れる場合のメリットはなんだろう。
718Socket774:2010/04/01(木) 00:23:41 ID:3Mmyu1GV
>>716
にわか乙
719Socket774:2010/04/01(木) 00:25:42 ID:9o0COHxI
>>718
オマエガナー。
720Socket774:2010/04/01(木) 01:02:37 ID:aw4wu8HI
しかし、なんでここで淫照こと必死に書いてるのかなー?w
専用スレあるだろ?そっちでやれよ。
721Socket774:2010/04/01(木) 02:25:08 ID:zkNO60iu
Magny-Coursは当初なんだそれと思ったが出てきた物を見るとそれなりにいい
722,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/04/01(木) 03:13:33 ID:SFrIv+ox
>>714
違います。TDP枠に収めるための「省電力技術」として使ってます。
723,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/04/01(木) 03:49:11 ID:SFrIv+ox
ちゃんとAMDの中の人が消費電力を抑える技術だって説明してるから認めようね

> Some of the AMD-P 2.0 power savings features include AMD CoolSpeed Technology,
> which reduces p-states when a temperature limit is reached, and C1E, a sleep state
> invoked when all processor cores in a system are idle. These have significant end-user
> benefits, discussed in the next section.
http://developer.amd.com/documentation/articles/pages/Magny-Cours-Direct-Connect-Architecture-2.0.aspx
724Socket774:2010/04/01(木) 03:49:52 ID:EdqY9U37
>>720
Windowsでパソコンどれがいいなんて話しをしていると
無理やり割り込んできてMac薦めてくる全く空気を読めないマカーと一緒なんじゃね?

MacをWinに、マカーをドザーにしてもいいw
725Socket774:2010/04/01(木) 04:13:28 ID:bAgBjejL
>>722
意味不明だろ
定格が最高2.3GHz、異常温度時のクロック制限機能付き
まともな筐体や冷却機構、室温なら起こりえない非常事態に備えた機能だろ。

昔intelがPen4で実演した、ヒートシンクを外してもクロックや電圧を大幅に下げて動き続けるって奴。
あれのAMD版ってだけ。

まさか定格の2.3GHzじゃ熱暴走おこすとでも言いたいのか?w
726Socket774:2010/04/01(木) 04:16:54 ID:o4Jwnf6A
C1Eが消費電力を抑える技術とは言ってるけどCoolSpeedは温度に関しての言及しか無いな
従来なら温度上限に達すると動作を停止してたのが、クロックと電圧を落として動作を継続するようになった
結果として性能/電力の効率が上がっている
そういう意味で省電力機能(AMD-P 2.0)として一括りにされてるんだと思うけど
727,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/04/01(木) 04:25:01 ID:SFrIv+ox
>>725
リンク先も嫁よ

http://blogs.amd.com/developer/2010/03/29/you-down-with-amd-p/

> AMD CoolSpeed technology is a capability that enables the processor(s) to automatically drop into a
> lower power mode if the processor thermal specifications are exceeded. Once the processor thermals
> return within specification the processor can automatically return to full performance.

要約:温度が下がったら自動的に元の電圧・クロックに戻ってフルパフォーマンス発揮できるようになりますよ


> まともな筐体や冷却機構、室温なら起こりえない非常事態に備えた機能
というのはどう考えても妄想の域を出ませんでしたとさ
728,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/04/01(木) 04:27:39 ID:SFrIv+ox
何度も言うがこれは「逆TurboBoost」な
729,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/04/01(木) 04:32:38 ID:SFrIv+ox
まさかTDP通りに組まれてればどんな負荷かけても2.3GHzで全コア動かし続けられるとでも思ったのか?
ゆとりは資料を読む力もないんだな
730Socket774:2010/04/01(木) 04:57:05 ID:KhjlrTns
まるで車のブレーキは停車するためにあるのか減速するためにあるのかと議論してるようで滑稽だな。
頭の悪いコテに話を合わせると馬鹿がうつるぞ。
731,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/04/01(木) 05:04:53 ID:SFrIv+ox
「どんな負荷かけても全コア動かし続けられるクロック」を定格にしたら2GHz止まりの製品しか出せないと思われ。

低負荷に限って2.3GHzで動く技術と考えれば確かに
(CPUを異常発熱から保護する技術ではなく)電力効率を改善する技術とカテゴライズされても
違和感はないさね
732Socket774:2010/04/01(木) 05:16:54 ID:bAgBjejL
そりゃファンが止まったり、窒息ケースだったり、室温がサハラ砂漠並に熱かったら定格も糞もないだろうさ。
定格ってのはどんな負荷を与えても、適正な冷却がされてれば問題なく動くってことだろ。

団子はセレロン用の貧弱なクーラーをつけてフルドライブみたいなアホな状況でも想定しているのか?w

異常発熱なんて天災か人災でしか起こらないだろうし、サーバーの管理者以外は気にすることでもないだろう。
733,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/04/01(木) 05:19:42 ID:SFrIv+ox
だから屁理屈は「CoolSpeed」(笑)の本質を正しく理解してからにしてくれ

AMDのイベントで中の人に質問してくればいいよ。
俺と同じ答えしか返ってこないから
734Socket774:2010/04/01(木) 06:01:14 ID:zkFo1rdJ
Intelが「TDP内に収めるために省電力技術を使っている」からといって
AMDもそれに当てはまるとは限らない
TDPを正しく理解しているところはその「最大放熱量」という意味通りに定格を定め
省電力技術は通常運用での電力を省くために用いる

そして三連ウンコの知能は相変わらず昆虫未満
735,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/04/01(木) 06:04:32 ID:SFrIv+ox
また脱糞入りました


736,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/04/01(木) 06:18:10 ID:SFrIv+ox
いや、そもそもShanghaiの3倍のコア数積んでなお2GHz台で動くことになんの疑問も持たなかったのかと。
高負荷がかかればCoolSpeed(笑)で電圧・クロック落ちるんだからTDP(熱設計消費電力≠最大消費電力)に収まるんですよ(笑)

と、ミスリードはこのへんにしておいて
まあ、AMDやメディアが「省電力機能」といってるのには、俺があげた物よりかなりもっともらしい理由があるんだが。

ヒント:低負荷のときでもCoolSpeedは発動するケースがある(むしろ低負荷だからこそ)
737Socket774:2010/04/01(木) 06:25:01 ID:o4Jwnf6A
団子が何でTDPと絡めたがるかが分からないんだよなあ
だいたいIntelだってThermal Monitor 2という同様の機能があるでしょ
そっちも低負荷時のみ定格で動く機能と言い張るわけかね
738,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/04/01(木) 06:30:15 ID:SFrIv+ox
真相はAMDのサイトにも載ってるとおりだよ。
もう少し(・´∀`・)スンスンしたいので敢えて場所は示さない。
739Socket774:2010/04/01(木) 06:37:09 ID:zkFo1rdJ
「たまにPentium 4にはL1Dが無い」とかそんな無駄で高等な技術
いくら超巨大企業Intelでも有り得るわけ無いし
740Socket774:2010/04/01(木) 06:40:40 ID:HryzcX+/
団子食べたい
741Socket774:2010/04/01(木) 06:44:04 ID:8agVv/qV
昔は煽ればソース出してきたが団子も意地悪になってきたなw
742,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/04/01(木) 06:52:13 ID:SFrIv+ox
>>740
はらこわすぜ?

>>737
今日はワタヌキの日だけどマジレスでヒント
たしかにIntelのTMと同様に熱ダイオードを使ってコア温度を計測しその閾値を越えるとクロックダウンする。
その基盤技術には変わりはないけど、主目的が違う。
(実際問題IntelがTMを「省電力機能」とうたったことは一度もない)
743Socket774:2010/04/01(木) 06:55:07 ID:zkFo1rdJ
AthlonII X4 605eは4コア2.3GHzでTDP45W
単純に3倍すると12コア2.3GHzでTDP135W

PhenomII X4 910eは4コア2.6GHzL3@6MBでTDP65W
単純に3倍すると12コア2.6GHzL3@18MBでTDP195W

>いや、そもそもShanghaiの3倍のコア数積んでなお2GHz台で動くことになんの疑問も持たなかったのかと。
いつも通りで当たり前のことだが譫妄が激しい
744Socket774:2010/04/01(木) 06:58:17 ID:JjMpHpTc
なにその算数
745Socket774:2010/04/01(木) 07:09:04 ID:mFfN5Xh5
みんな今日は4/1だ
いままで団子がイチャモンつけてたけど今日は4/1だ
あとはわかるよな
746,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/04/01(木) 07:35:58 ID:SFrIv+ox
>>745
ほほう、だんだん本質に近づいてきたかもね♪


【最大のヒント】
ヒートシンクが外れたりファンが故障した場合確かにCPUの温度を下げる必要あるけどさ。
そんなことを解説するのに、なんでわざわざ「冷めたら自動的にフルスピードで動く」なんて
書く必要あるよ?

つまり、システムの障害ではなく平常動作時ですら閾値を越えてしまうケースを想定したもので
それがふにゃふにゃな理由で結果的に電力効率を向上させることになるわけ。

まあ定格よりも電圧・クロックが落ちればその分だけ消費電力減るのは確定的に明らかだが
TBのように忙しいコアのクロックをあげるならともかく、クロック落とすことで電力効率が改善するとは
とうてい考えにくいよね。クロック落とせば処理時間伸びるんだからさ。

つまり、逆に考えろと。
なんでわざわざ「冷めたら自動的にフルスピードで動く」と書いてあったのか。
747Socket774:2010/04/01(木) 07:50:18 ID:zkFo1rdJ
現実世界の4/1は1年のうち1日だけで
年中エイプリルフールだなんてこの重度知的障害者以外誰もしない
748Socket774:2010/04/01(木) 07:54:24 ID:7GjYAgGB
また,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8oが捏造したのか
749,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/04/01(木) 08:04:04 ID:SFrIv+ox
http://akiba.kakaku.com/pc/1003/31/235500.php

> 省電力機能「AMD CoolSpeed technology」の搭載、

どうやら>>748によるとこれは俺の捏造記事らしいな
750,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/04/01(木) 08:05:34 ID:SFrIv+ox
このスレに英語が読める奴がいないことはわかった
751Socket774:2010/04/01(木) 08:11:28 ID:v+0VAPZZ
いや、冷却さえしっかりしてればいいだけの話だろ
752,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/04/01(木) 08:12:41 ID:SFrIv+ox
うん
753Socket774:2010/04/01(木) 08:32:06 ID:7GjYAgGB
記事は正しいが:,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8oは捏造
754Socket774:2010/04/01(木) 08:56:09 ID:o4Jwnf6A
冷却面が厳しくて上限温度に達しやすいのと、
CoolSpeedの効能は分けて考えた方が良いと思うけどな
CoolSpeedの有無と冷却性能不足で上限温度に達しやすいかどうかは関係無いからね

団子はAMDのマーケティングに踊らされてる気がする
今は何でも省電力って声高に叫べば良い時代だし
755Socket774:2010/04/01(木) 09:00:18 ID:aw4wu8HI
C32マザーの情報ない?
次はこれ組みたいんだが。
756Socket774:2010/04/01(木) 09:04:24 ID:7nYkycqv
アム虫がんばるなwww
757Socket774:2010/04/01(木) 09:22:50 ID:ZRzzF/Be
>AMD CoolSpeed technology

日本AMDに問い合わせればはっきりするんじゃねーの

つーか、そのうち2.3GHzおpを買った人が出てくるだろうから
長時間フルロードでクロックが最高のまま維持されるか試してもらうのもアリィィィ
758Socket774:2010/04/01(木) 09:40:21 ID:zkFo1rdJ
・2.3GHzでACP105W、2.2GHzでACP80WがTDP詐欺になるかどうか
・現状の冷却装置でACP105Wを冷やし切れるかどうか
これだけ考えれば何でもない
ダイサイズでかくなれば同TDP・ACPでも更に冷却は楽になるし
759Socket774:2010/04/01(木) 10:23:16 ID:v+0VAPZZ
http://up3.viploader.net/news/src/vlnews012539.jpg

Pen4/D時代にもこういうことあったんだよなぁ
760Socket774:2010/04/01(木) 10:25:36 ID:1hxwEbLC
>>759
!?
761Socket774:2010/04/01(木) 10:30:23 ID:SnxFrAP4
日本はこれを大真面目にやってたからなぁ
762Socket774:2010/04/01(木) 10:37:43 ID:kIsj1Gg9
どこでもやってるだろ
日本は、とかキムチ臭すぎる
763Socket774:2010/04/01(木) 10:40:58 ID:SnxFrAP4
事実だしw
764Socket774:2010/04/01(木) 10:49:44 ID:n2a2uijT
>>717
12Coreと8Coreのラインナップ(ダイサイズ・トランジスタ数同一)
してある辺りMCM&死にコアの方がコストダウンは出来るでしょ

>歩留まりは350mm2が60%、500mm2が40%位かね。

全てのトランジスタエラーが0と言うことはない
例でいくと
(こなれた45nmプロセスだから70%は無いと思うけどね)

0.6^9=4.6%(6Core全部完動)
0.6^5+0.1*6=68%(5Core)
0.6^4+0.1*6=73%(4Core)
0.6^3+0.1*6=82%(3Core)
2Coreなら100%(理論値)
12Coreだけのラインナップなら歩留まりは5%に満たないけど
8Coreも含めると歩留まりは70%を超える
765Socket774:2010/04/01(木) 10:54:30 ID:n2a2uijT
【訂正】

0.6^6=4.6%(6Core全部完動)
766Socket774:2010/04/01(木) 11:09:25 ID:vhMa1u8Y
Magny-CoursとWestmereの消費電力比較
http://www.bit-tech.net/hardware/cpus/2010/03/31/amd-opteron-6174-vs-intel-xeon-x5650-review/10

6174(12コア/2.2GHz)がX5650(6コア/2.66GHz)と互角
それから2380(4コア/2.6GHz)と同程度ってのが衝撃だわw
767Socket774:2010/04/01(木) 11:37:11 ID:v+0VAPZZ
32nmと比べるなんて・・・
768Socket774:2010/04/01(木) 11:40:10 ID:v+0VAPZZ
AMDはできることからやってるってかんじだな
45nmをちょっとずつ改良していってるんだろうか
769Socket774:2010/04/01(木) 12:06:26 ID:n2a2uijT
>>768
intelがチックタックやってるみたいに
製造キャパがない分慎重にやってるね
確実なプロセスで新回路設計するし
新たなプロセスではこなれた回路で製品実現してるからね
770Socket774:2010/04/01(木) 12:23:47 ID:vHlTTJ99
>>766
とはいえ前のページで6174がX5650にコテンパンにやられてるところを見ると、
消費電力が同程度じゃ全然魅力的に見えんだろ。価格も6174のほうが高いし。
まあ使ったベンチマークがあまりスケールがよろしくないソフトってのもあるんだろうけどね。
771Socket774:2010/04/01(木) 12:36:40 ID:MsI22/2k
>>766
こういう結果を見ると
HTTによる論理コアも「あり」なんだよな。

物理的に12コア用意するのは
消費電力的に分が悪すぎる。
772Socket774:2010/04/01(木) 12:56:37 ID:KULMZiIO
LightWaveとかまったくコア数が生かされてないな
もっとマシなベンチを用意できなかったのかw
773Socket774:2010/04/01(木) 13:08:16 ID:zkNO60iu
>>771
そこら辺を最適化するためのBulldozerなんじゃない
774Socket774:2010/04/01(木) 13:09:10 ID:WqlmRPf4
世にあるソフトがマルチスレッドへの最適化が進んだ物ばかりではない以上仕方ないじゃろ。
Lightwaveはメジャーなタイトルだし。
775Socket774:2010/04/01(木) 14:19:37 ID:7GjYAgGB
ブルドーザーはシングルスレッド性能を落とす代わりに、
それ以上にダイサイズも削減することで、ワットパフォーマンスとダイサイズパフォーマンスを
追求するんだっけ。

楽しみだなぁ

776Socket774:2010/04/01(木) 14:24:34 ID:Lm9XE/EK
CoolSpeedが働くのが前提だとベンチの結果がもっとばらつきそうだな
777Socket774:2010/04/01(木) 14:56:42 ID:bAgBjejL
AthlonII X4 605eが 2.3G 4コアで45W
3倍の12コアで135W。
コアの改良とか考えればなんとかなりそうだね

L3キャッシュの差?
AthlonIIX2 250(3GHz) 65WとPhenomII X4 945(3GHz) 95Wのように、
L3+コア倍増でも大した差が生じないことを考えるとどうでもよさげ。
778Socket774:2010/04/01(木) 15:02:37 ID:bAgBjejL
>>735
適当に検証したら12コア 2.3G は全力でもなんとかなりそうです
779Socket774:2010/04/01(木) 15:09:40 ID:bAgBjejL
>>775
> ブルドーザーはシングルスレッド性能を落とす代わりに、
> それ以上にダイサイズも削減することで、ワットパフォーマンスとダイサイズパフォーマンスを
> 追求するんだっけ。
>
> 楽しみだなぁ

ちょっと違う
シングルスレッド性能を向上しない代わりにダイサイズ削減して電力性能やサイズ性能を追求。
同等性能で最適化して小型化と言った方がいいかな。
780Socket774:2010/04/01(木) 15:16:23 ID:bAgBjejL
団子のいうことが正しい場合
2.3G動作→熱暴走→クロック低下→冷却→2.3G動作→熱暴走→の無限ループ

普通にありえない動作だと思うが
高負荷で頻繁にクロックが上下して性能の変動が激しいですとか、
一般PCとしてすら願い下げなのに高負荷当たり前なサーバーやHPCでこんなのをベンダーが認める訳ない。
正常に動くクロックで作って供給しろと言われるだけ。
781Socket774:2010/04/01(木) 15:33:21 ID:7GjYAgGB
>>779
後藤タンの記事しか読んでないけど、
同時実行可能命令数を2/3に削減するから、平均IPCは2/3よりはいいだろう
けど確実に下がるんでは。

そのかわり2コアを1モジュールに融合させてトランジスタ効率と電力効率を向上。
モジュールを複数搭載してマルチスレッド性能向上。
ダイサイズ50%増でパフォーマンス80%増というのはこのあたりを指してるんではないかと。

落ちたシングルスレッド性能はX6で導入したようなターボブーストで一部モジュール
のクロックあげることで対応するんじゃないのかな。
782Socket774:2010/04/01(木) 15:39:33 ID:zkFo1rdJ
ウンコのいうことが正しい場合
たまにPentium 4にはL1Dが無い→たまにPentium 4にはL1Dが有る→たまにPentium 4にはL1Dが無い→の無限ループ

シングルスレッド性能なんて整数スカラはとうの昔に寸詰まりで
小数点というかベクタで伸ばしてるだけというのが大方の見方
ウンコが>Bulldozer 16コアは推定3GHz前後 とか言ってたが
これがもし万が一本当だとするとBullは並列度を下げる代わりにクロックを上げて
シングルスレッド(整数スカラ)性能を上げる目論見だろう
ただしマルチスレッドベクタ性能は激減しそうだけど
783Socket774:2010/04/01(木) 15:44:08 ID:AV7qMzo/
>>742
買った人が計測すればいいだけの話だろ。
784Socket774:2010/04/01(木) 15:49:47 ID:iwiAp3UV
ありえないと思うことがありえない
785,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/04/01(木) 15:51:49 ID:SFrIv+ox
【だんごやさん用しおり】
ここまで(・´∀`・)スンスンした
--------------------------------------------

786Socket774:2010/04/01(木) 15:55:22 ID:OiObWP5V
団子暇なの?
787Socket774:2010/04/01(木) 16:20:16 ID:bAgBjejL
>>781
> >>779
> 後藤タンの記事しか読んでないけど、
> 同時実行可能命令数を2/3に削減するから、平均IPCは2/3よりはいいだろう
> けど確実に下がるんでは。
ほとんどの処理は2wayで十分、極稀に3wayなときもある程度
そんな時は2clk使って処理すればいいだけ。あるいは2コア使って処理するとか。
だから、下がる場合もたまにあるかもねって程度だよ

> そのかわり2コアを1モジュールに融合させてトランジスタ効率と電力効率を向上。
> モジュールを複数搭載してマルチスレッド性能向上。
> ダイサイズ50%増でパフォーマンス80%増というのはこのあたりを指してるんではないかと。
世の中にはHTTで性能低下するプログラムと言うのが少なからずある。
それは論理コアが実コアよりも低性能なところから来ている。
だったら物理コアだけでいいじゃんというのがBulldozerのコンセプト。

ちなみにk10コアはk8から継ぎ足しで拡張しまくって効率が悪い。
だから新設計をして同性能で小型化したと考えたほうがいい。
788Socket774:2010/04/01(木) 16:42:42 ID:ivQQp5/j
AMDのスライドの性能予定はコアあたりの性能も上がってないと達成できないんだがな
シングルスレッド性能も上がるって事だ
789Socket774:2010/04/01(木) 16:45:44 ID:n2a2uijT
>>787
>ちなみにk10コアはk8から継ぎ足しで拡張しまくって効率が悪い。
>だから新設計をして同性能で小型化したと考えたほうがいい。

実際はK7から脈々続く拡張だからね
元々K7 DEC技術者からの思想からすると全然間逆になってるしね

>>788
その辺は、「回路をシンプルにする分クロック上げやすくなる」
って事だろうと思いますよ
790Socket774:2010/04/01(木) 17:10:29 ID:7GjYAgGB
単純に計算しても、ブルは今と同じ45nmプロセスでも20%くらいダイサイズ
小さく出来るよね
更に32nmで作ったら相当小さくなりそうだ。
791,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/04/01(木) 17:14:41 ID:SFrIv+ox
結論言うと、まーだ誰も解ってない
平常動作時もクロックダウンしうるってのは中の人も認めてる動作になるけど
クロックダウンそのものが省電力機能じゃないからね♪
>>751-752あたりが実は最大のヒントかも)

でBulldozer(笑)だけど・・・

整数演算性能が2/3になるなんてのはALUが3つ同時に稼働できる場合に限った話で、
現実には、単純にポラックの逆法則を適用すると、クロックあたり平均整数演算性能は
√(2/3)≒81%程度ってことになる
これもコードシーケンスが常にALUに作用する命令ばかりという前提だけどね。

そもそもK7〜K10のALU稼働率を過大評価しすぎなんだよ
特に、SPECintでNehalemにダブルスコアで負ける現状少なくとも半分も使い切れてない
ことは明らかだろう。
Load/Store単独命令をはじめALUを使わない命令の比率を考えれば、ALUの利用率なんて
ベストケースでも7割もいかない。極端な話、たとえば
 mov eax, [esi]
 mov [edi], edx
 sub ecx, 2
みたいなシーケンスだと、(L1にヒットする前提で)3命令同時発行できるがALUは1個しか稼働しないし
それっでなくとも分散型RSは動的なリソースアロケーションに弱い。
RSが集中型になるならむしろALUの実効稼働率は改善するだろう。
てなわけで現実には整数コアあたりのクロックあたり整数演算性能は、K10比でトントン〜
多くとも1割落ち程度と予想。
どっちかというとキャッシュ容量心配した方がいい鴨ね



> 世の中にはHTTで性能低下するプログラムと言うのが少なからずある。
> それは論理コアが実コアよりも低性能なところから来ている。

またソースも出せないテキトーなことをwwww
VTuneでパフォーマンス分析してみれば理由はわかるよ。

大概、HT無効時よりもL1キャッシュミスが増加してることがわかる。
1スレッドあたりのキャッシュ容量が少なくなるから当然だね
792Socket774:2010/04/01(木) 17:16:02 ID:CUc/04V/
>>610
衝撃的だな

オソレスースマソ
793Socket774:2010/04/01(木) 17:23:32 ID:CUc/04V/
>>643
恥ずかしいなw
794Socket774:2010/04/01(木) 17:36:51 ID:CUc/04V/
しかし、サーバ用のCPUでこんなにコメントが付くとは、相当注目されてるんだな。
2010/04/01(木) 11:40 | URL | LGA774 #-[ 編集]



本来は自作とは関係ないカテゴリーだから少しコメントが付くくらいなんけど、自作出来そうなくらい安いから興味が出た人が多いんだろう。
2wayマザーが5万くらいなら、4180(2.6G 6コア $188)2個と組合せて10万円で買えるんだぜ?
2.6G 12コアが一式10万円とか本気出しすぎだろw



97コメント乙
795Socket774:2010/04/01(木) 17:41:15 ID:zkFo1rdJ
>ポラックの法則(ぽらっくのほうそく)とは、『プロセッサの性能はそのダイサイズの平方根に比例する』という経験則(ウィキペ)

ALUユニット数=ダイサイズ
いつも通りの特濃電波キタ
796Socket774:2010/04/01(木) 17:45:08 ID:5Mq+Khry
797MACオタ>796 さん:2010/04/01(木) 17:50:08 ID:Xb5zlDzT
>>796
先に書かれてしましましたか…伝言ゲームの顛末が楽しみということで(笑)
798Socket774:2010/04/01(木) 17:54:26 ID:CUc/04V/
>>759
799Socket774:2010/04/01(木) 17:55:31 ID:mFfN5Xh5
テープアウトしたの?
800Socket774:2010/04/01(木) 17:56:57 ID:zkFo1rdJ
>>796
これは・・・・・・どのくらい本気にしていいの?
801Socket774:2010/04/01(木) 17:58:21 ID:zkNO60iu
とりあえずごく初期のサンプルチップぐらいは仕上がってるんじゃない
802Socket774:2010/04/01(木) 17:58:59 ID:mFfN5Xh5
携帯なのでみれね
>>759級の記事がでることを願うよ
803Socket774:2010/04/01(木) 18:03:06 ID:5Mq+Khry
コードネームだけの比較だから、コア数教えてくれないとな・・・w
804Socket774:2010/04/01(木) 18:07:58 ID:zkFo1rdJ
あれだけ前フリ文がありゃどっかに書いてあると思うけど
たしかinterlagosは古いロードマップによれば鯖用ネームで8コアとそのニコイチ
zambeziはDT用8コア
実コア数はIntelとAMDで倍違うけどコアサイズも倍くらい違いそうだから以下略
805,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/04/01(木) 18:08:33 ID:SFrIv+ox
http://www.amdzone.com/joomla/images/cpus/bulldozeraf/BulldozerArchitectureUpdatev03.png

さて、4×(ALU+AGU)の図が出てまいりました
806Socket774:2010/04/01(木) 18:10:46 ID:zkNO60iu
Interlagosが16コアでZambeziが8コアじゃね
InterlagosのPower Consumptionいいな
807,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/04/01(木) 18:11:42 ID:SFrIv+ox
4KBトレースキャッシュ・・・
808Socket774:2010/04/01(木) 18:16:55 ID:5Mq+Khry
これが同一コア数であるならマルチスレッドもシングルスレッドもNehalemを超えることになるな。
809Socket774:2010/04/01(木) 18:23:55 ID:7GjYAgGB
メモリバンド幅が凄い広がってるけど、なんかバンド幅広がる変更ってあったっけ?
810Socket774:2010/04/01(木) 18:27:40 ID:CUc/04V/
ネトウヨ「糞民主のせいで失われた10年が20年になる」




現実
日本株、東証1部騰落レシオが過去10年で最高

株価暴騰
811えるえる:2010/04/01(木) 18:28:10 ID:jQuibCAl
Bullすげーな。正直予想外。
2ALUのショボではなかったか。
812Socket774:2010/04/01(木) 18:35:03 ID:iwiAp3UV
外人参政権と郵貯限度額引き上げの時点で既にクソ
ミンスに入れる奴は低脳認定
813MACオタ:2010/04/01(木) 18:35:21 ID:Xb5zlDzT
結局のところ、世の中に『情報弱者』とか『情報強者』とかいうのが存在するわけでは無く、自分に都合の良い、うまい話に飛びついちゃうヒトってのがいるだけなんですね…
 
814Socket774:2010/04/01(木) 18:35:36 ID:OqKxlchv
予想外すぎて信じられませんな
815,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/04/01(木) 18:37:10 ID:SFrIv+ox
FPのパフォーマンスがNehalemと差がついてないところを見ると
Bridge-FMA(2 FADD + 2 FMULとしても使える)は見送られたのかな。

んでもってSSE整数の性能が劇的に挙がってる理由はこれか。

> The integer execution units - arithmetic logic units (ALUs) and address generation units (AGUs)
> - are organized in four pairs - one per instruction pipeline. They can execute both x86 integer code,
> memory ops (also for FP/SIMD ops) and, which is the biggest change, can be combined to execute
> SSE or AVX integer code. This increases throughput significantly and frees the FP units somewhat.
> The general purpose register file (GPRF) has been widened to 128 bit to allow for such a feature.
> The registers will be copied between GPRF and the floating point register file (FPRF) if an architectural
> SIMD register (the registers specified by the ISA) is used for integer first and floating point later or vice versa.
> Since this doesn't happen often, it has practically no impact on performance. Instead the option to use the
> integer units for integer SIMD code (SSE, XOP and AVX) the overall throughput of SIMD code increases dramatically.

まあこれだとSIMD整数演算命令使用後に同じレジスタでFP演算命令を発行する場合に性能低下すると思うけどね
816Socket774:2010/04/01(木) 18:48:57 ID:zkNO60iu
>>813
じゃあ全部疑ってかかれってか
つまんねー人生だな
817Socket774:2010/04/01(木) 18:52:47 ID:JHfEmH5V
エイプリルフールネタでしょ?
818Socket774:2010/04/01(木) 18:53:16 ID:6gvqjgP6
以下ループ
819Socket774:2010/04/01(木) 18:53:54 ID:zkNO60iu
エイプリルフールの企画でも喜んで騙される方が楽しい
820Socket774:2010/04/01(木) 18:54:11 ID:CUc/04V/
●【自民党】は完全な売国政党である。


■自民党「移民1000万人受け入れ」の実現性
http://www.nikkeibp.co.jp/news/biz08q2/575417/
■自民党は朝銀に血税1兆4,000億円を投入。
  http://q.hatena.ne.jp/1062123112
■在日にも定額給付金支給
  http://news.livedoor.com/article/detail/3994761/
■中国人、韓国人留学生に年間500万円もタダであげている自民党。
  http://bbs.jpcanada.com/log/6/2504.html
■韓国人へのビザ免除を恒久化した自民党
  http://www.nikkansports.com/ns/general/f-so-tp0-060206-0020.html
■自民党留学生30万人計画
  http://www.relay.co.jp/news/718/

■人権擁護法案の成立を目指す自民党
  http://ja.wikipedia.org/wiki/%E4%BA%BA%E6%A8%A9%E6%93%81%E8%AD%B7%E6%B3%95%E6%A1%88
■外国人の空港指紋採取、在日を免除した自民党(2007年11月30日)
  http://news18.2ch.net/test/read.cgi/news2/1148755375/1-100
■特別永住者等の国籍取得特例法案 自民党、提出に意欲(届け出だけで国政参政権)
  http://cotodama-6000.iza.ne.jp/blog/entry/502594/
■自民党の福田が朝鮮総連系企業から違法献金発覚!
  http://society6.2ch.net/test/read.cgi/soc/1192439698/l50
■麻生太郎が統一協会が作る日韓トンネル研究会の顧問に
  http://www.asyura2.com/07/senkyo29/msg/846.html
■統一教会関連団体に安倍官房長官が「祝電」
  http://www.news.janjan.jp/government/0606/0606206368/1.php
■森喜朗が北朝鮮金総書記に親書
  http://www.toyo-keizai.co.jp/news/digest/2000/post_3447.php

821Socket774:2010/04/01(木) 18:54:26 ID:mFfN5Xh5
今日は4/1
Bulldozerの記事も疑ってかかったほう気が楽かもな
822えるえる:2010/04/01(木) 18:55:14 ID:jQuibCAl
>>817
氏ね
823Socket774:2010/04/01(木) 19:00:46 ID:7GjYAgGB
でもモジュール内のコア毎にクロック変更があるというのは
ほんとだとしたらまさに2コアと胸を晴れる夢のある話だよなぁ
824Socket774:2010/04/01(木) 19:01:03 ID:zkFo1rdJ
ttp://www.amdzone.com/joomla/images/cpus/bulldozeraf/buldozeraflogo2.png
これがアレだよなあ
BulldozerX8とかにするのかと
825Socket774:2010/04/01(木) 19:01:52 ID:ztNpJLu6
>>820
はいはい外国人基本法ワロスワロスw
826えるえる:2010/04/01(木) 19:02:36 ID:jQuibCAl
つか書くのが5時間くらいはやいよお前ら。
ノリ悪すぎ。
827Socket774:2010/04/01(木) 19:07:47 ID:JjMpHpTc
はいはい
わたぬき
わたぬき
828Socket774:2010/04/01(木) 19:08:17 ID:Lm9XE/EK
Barcelonaの時も数字を1.5倍しただけの情報に釣られたのを思い出した。
829Socket774:2010/04/01(木) 19:35:07 ID:bAgBjejL
アメリカにもエイプリールフールってあるのか?
830Socket774:2010/04/01(木) 19:38:42 ID:r7XRzt60
えげれすにしかないと思ってたか?

エイプリールヵゎぃぃ
831,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/04/01(木) 19:45:54 ID:SFrIv+ox
むしろアメリカの方が悪乗り盛んだぞ
インターネットの世界だとジョークRFCがあがったりするのが今日
かなり前のだと、伝書鳩を使った通信プロトコルとかなwww
832Socket774:2010/04/01(木) 20:06:07 ID:ZhLXlELd
> Thursday, 01 April 2010 01:01

これは酷い
833Socket774:2010/04/01(木) 20:30:18 ID:qyUfcwWe
BulldozerX6(2GHz)が3万円ぐらいだと思う。
834Socket774:2010/04/01(木) 20:34:44 ID:b4NRdEnX
ネタっぽいな
835,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/04/01(木) 20:37:05 ID:SFrIv+ox
こっちですら信用されてないのに
http://www.amdzone.com/phpbb3/viewtopic.php?f=52&t=137560
836MACオタ>団子 さん:2010/04/01(木) 20:41:17 ID:Xb5zlDzT
>>835
いまさら取り繕っても…ね(笑)
837,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/04/01(木) 20:43:01 ID:SFrIv+ox
ネタとしては完成度高いと思う
838Socket774:2010/04/01(木) 20:46:41 ID:ZhLXlELd
くそわろた
839Socket774:2010/04/01(木) 20:47:17 ID:b4NRdEnX
>>837
世界中からアクセスされることを考えれば、話題集めやアクセス数稼ぎに
必死な商用ニュースサイトなら、これぐらいの手のこんだネタを作っても
おかしくはないよ
840えるえる:2010/04/01(木) 20:47:43 ID:jQuibCAl
MACオタが一番みなの演技にだまされたということで終了ですね。
841えるえる:2010/04/01(木) 20:51:01 ID:jQuibCAl
まあIntelがばりばり特許をとりまくっているTrace Cacheを
AMDがまんま同じ名前と実装で使ってくるわけ無いのだが、
ブロック図も減点だな。
842Socket774:2010/04/01(木) 20:59:22 ID:v+0VAPZZ
Nice ApriI
843Socket774:2010/04/01(木) 21:06:42 ID:q/pR5Va/
ま。4/1だし。
844Socket774:2010/04/01(木) 21:08:41 ID:JjMpHpTc
Bullすげーな。正直予想外。
2ALUのショボではなかったか。
845Socket774:2010/04/01(木) 21:08:49 ID:zkFo1rdJ
不本意にも雑音の気持ち悪さを再認識してしまった
846Socket774:2010/04/01(木) 21:18:01 ID:bAgBjejL
>>794
ゴメンそれ俺のコメントなんだ
847Socket774:2010/04/01(木) 21:30:19 ID:bAgBjejL
どこまでがホントでどこからがネタなんだろうか
グラフはネタでも、団子も騙されて納得するほどリアルな嘘だったのは驚嘆するな
ネタだと理解した今でも実際もこのくらいなんじゃないかと見る度に思うw
SSEやゲームなんか多少の性能アップでリアルだし、
コア数が倍になるマルチスレッドでもコア数位の差になってる。
消費電力も45nm SOI→32nm SOI HKMGだから8コアでも大分低くなる。
848♪リファレンス♪:2010/04/01(木) 21:38:45 ID:jQuibCAl
録音テープとテヘは同じ人物なの?
849MACオタ:2010/04/01(木) 21:40:29 ID:Xb5zlDzT
(準)公式の回答が来ましたので、参考までに。
http://www.xtremesystems.org/forums/showpost.php?p=4318190&postcount=40

さて、これから楽しいのは国内の腐れルーマーサイトがどう引っ掛かるかなのですが…
850Socket774:2010/04/01(木) 21:41:35 ID:JjMpHpTc
>どこまでがホントでどこからがネタなんだろうか

このていど
http://www.watch.impress.co.jp/headline/uocchi10/
851♪リファレンス♪:2010/04/01(木) 21:45:24 ID:jQuibCAl
オタの期待とは裏腹に
普段から海外記事よんでてエイプリルフールネタ楽しんでる
連中がだまされるわけねなかた。
852Socket774:2010/04/01(木) 21:46:59 ID:JjMpHpTc
さてどっかで見たことある絵だな

米Inteli、Pentiam 8正式発表
〜MetBurst以来5年ぶりの新アーキテクチャ
ttp://pc.watch.impress.co.jp/docs/2005/0401/uocchi/inteli.htm
ttp://pc.watch.impress.co.jp/docs/2005/0401/uocchi/inteli01.gif
853Socket774:2010/04/01(木) 21:52:07 ID:B2KF5uL+
>>796
これが本当だったらPentium4→CoreMAの衝撃なんて笑い話にしかならん…
854Socket774:2010/04/01(木) 21:52:58 ID:v+0VAPZZ
>>849
もう引っかかってる患者さんがいるよ

http://kishinkan.jugem.jp/
855Socket774:2010/04/01(木) 22:41:15 ID:Lm9XE/EK
実はベンチは本物で、エイプリルフールだよーんという情報が嘘。
856,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/04/01(木) 23:06:02 ID:SFrIv+ox
Sandraによる演算ユニットのスループットの整合がちゃんと取れてるから面白いんだよな。
この記者ただ者じゃねーわ。明らかにプロの犯行すぐる。
ちなみにInteragosが3.2GHzってのはおいらのスペック予想値と大体当たってる。
(AMD発表資料の推定スループットから逆算)

逆にIntegerのスループットが高すぎたあたりでこれはないと気づいた。

そもそも今更SIMD整数をIntegerパイプでの実行に戻すわけがないよ。
3ソースオペランドに対応した命令スケジューラをFMAだけに使うのは勿体ないので
IMACやPCMOV, PPERMなどのオペレーションも並行して実装する意味が生まれる。

隠し球があるとして例の「ブリッジFMA」じゃね?
Bulldozerで実装してくるのならFPクラスタは潜在的にクロック毎に2ソースオペランドの
4オペレーションを同時発行可能ってことになる。


857Socket774:2010/04/01(木) 23:37:43 ID:GsGHi/AE
>>853
世代的に実質"K9"と"K10"がキャンセルされているので、あり得ない話ではない。
だけどなぁ。まぁ。エイプリールフールだろ…さすがに。
858Socket774:2010/04/01(木) 23:40:00 ID:bEqeIUwI
K10はPhenomだろ
859Socket774:2010/04/02(金) 00:20:29 ID:+y3BUebf
>>858
結果的にそうなった"だけ"だけどな。
860Socket774:2010/04/02(金) 00:32:59 ID:qRZqlH/c
はやくX6のベンチ結果出ないかなー
噂のように4月末頃発売なら、もうベンチ出てきてもいいはずなんだが
861Socket774:2010/04/02(金) 00:44:37 ID:2Y2TYXEt
既出の内容だが一応張っておく。

性能の効率を追求したBulldozerのアーキテクチャー
http://pc.nikkeibp.co.jp/article/trend/20100323/1023810/
862Socket774:2010/04/02(金) 02:35:37 ID:q+uYhvNA
昨日のBulldozerのページがデリートされているね
863Socket774:2010/04/02(金) 02:35:52 ID:8MtUucEr
864,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/04/02(金) 04:26:06 ID:VnW/HhAl
脱糞って言われるの気にしてたんだな
コンプレックス刺激しちゃったんだな
865Socket774:2010/04/02(金) 05:16:51 ID:8MtUucEr
【NOD32】雑音犬畜生Part43【アスベル】
http://mamono.2ch.net/test/read.cgi/tubo/1253431254/
866Socket774:2010/04/02(金) 06:34:52 ID:lz4Oc/wn
ID:SFrIv+ox
3連ウンコの24連電波
「単純にポラックの逆法則」で逆算すると1ウンコにつき8電波
zambeziに対抗してるようで気持ち悪い
867Socket774:2010/04/02(金) 08:44:39 ID:EuEtrSUd
868Socket774:2010/04/02(金) 10:21:31 ID:NAWd1Z7E
しかしWindows完敗→Linux圧勝は笑えるw
ttp://it.anandtech.com/IT/showdoc.aspx?i=3784&p=7
           win  Lin
Op 6174(2.2G)  32s→18s
Op 2435(2.6G)  41s→27s
Xeon 5670(2.9G) 26s→32s
Xeon 5570(2.9G) 35s→33s
869Socket774:2010/04/02(金) 10:31:35 ID:Tcp8tAIQ
>>868
各モジュールのカーネルからの独立度が
linuxのほうが高いから
当たり前と言えば当たり前
870Socket774:2010/04/02(金) 10:42:05 ID:lz4Oc/wn
独立度が高いと何でバグプロセッサはゴミ顕在化するの?
871Socket774:2010/04/02(金) 10:43:54 ID:nq3MF3Vu
日本語でおk
872Socket774:2010/04/02(金) 11:18:50 ID:8otcjVAw
>>869
Linuxだからで説明できるのは上の二つだけでは?
873Socket774:2010/04/02(金) 11:47:20 ID:NAWd1Z7E
>>872
なるほど
874,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/04/02(金) 14:13:38 ID:VnW/HhAl
コンパイラが違うから
Win64版がVisual Studio 2008でLinux版がGCC
875,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/04/02(金) 14:15:16 ID:VnW/HhAl
ついでに言うとGCC x86-64のデフォルト最適化オプションが-march=opteronじゃなかったっけ
-march=core2とか-march=noconaあたりで再ビルドしてみると面白いことになると思う
876●テヘ権田● ◆OhjIkO1O8o :2010/04/02(金) 21:16:57 ID:yJA1Gm6U
団子が指摘するまでもなく、>868の結果はWin→Linuxで性能が大きく劣化しているXeonの結果が異常であることは明白ですな
877えるえる:2010/04/02(金) 23:21:19 ID:HT+CHtp7
そろそろAMD系の有力(?)なコテでてこないかなあ。
878えるえる:2010/04/02(金) 23:50:00 ID:HT+CHtp7
戦闘能力

団子 20
MACオタ 20
AMD次世代CPUスレ住人平均 5
アム厨 1

くらいでFA?
879えるえる:2010/04/02(金) 23:51:14 ID:HT+CHtp7
団子 20
MACオタ 20
テヘ 10
AMD次世代CPUスレ住人平均 5
アム厨 1
880えるえる:2010/04/03(土) 00:06:08 ID:HT+CHtp7
>>876
Intelの手があまり及んでいないLinuxの領域では
AMDのコアが有利ということですね。
881,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/04/03(土) 00:29:49 ID:uQbVaWoM
GCC自体AMD贔屓というか、x86-64で先鞭をつけたAMDに利があるのは前から言われてたこと

つか、ソース見る限りだと素のC/C++だから、コンパイラの差がもろに出る。
特にsource/kernel/gen_system/GEN_Matrix4x4.cppあたりとか、SSE Intrinsics使ったら
いくらか性能改善できそうだな。
882えるえる:2010/04/03(土) 00:31:39 ID:LOba9y8y
まあIntelがAMD64で先をこされたときのその後のEM64Tの完成度の経過をみるかぎり、
命令セットで他社にさきをこされるというのはかなりの打撃のようだね。
そういう中で長年いきのこってきたAMDの実力はシェア2割りのメーカーとしては奇跡に近いな。
883えるえる:2010/04/03(土) 00:33:19 ID:LOba9y8y
>>881
コンパイラの差というのは予想の域をでてないけどね。
というか団子さんは計測なり検証したのならちゃんと結果を貼るべきですよ。
884えるえる:2010/04/03(土) 00:47:02 ID:LOba9y8y
Magny-Coursでの低クロック動作をみてもわかるとおり、
Bulldozerの小コア化の由来は電力が厳しい中で低クロックにしないための方策
というのがひとつ示されたといってもいいかもしれない。
885Socket774:2010/04/03(土) 01:05:31 ID:EM05RPqe
団子がしったか連発してて笑える
886Socket774:2010/04/03(土) 02:08:40 ID:54c7Cglz
>>880
> >>876
> Intelの手があまり及んでいないLinuxの領域では
そんな領域x86採用してない分野くらいしか無い
携帯電話とか組込みとか
887Socket774:2010/04/03(土) 02:17:00 ID:54c7Cglz
Xeon 5570/5670ってAMD64に最適化したコアってIntelが言ってたよ
マクロ何とかが64bitに対応して劇的に性能アップ!!って誇らしげにね。

GCCは変な最適化とかしない素直なコンパイラってイメージがあって、Xeonのこの劣化っぷりは、
アーキテクチャや設計が歪で、カリカリに最適化しないとロクでもないって事を示してるんじゃないかな。

コア、キャシュ、バスのどれをとってもOpteronより優れているXeonのダメっぷりを見るとそう思う。
888Socket774:2010/04/03(土) 02:28:51 ID:9xcmbr0U
団子 20
MACオタ 20
AMD次世代CPUスレ住人平均 5
アム厨 1 (・´ω`・)
テヘ 0(捏造工作員の為価値無し)
889,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/04/03(土) 02:28:56 ID:uQbVaWoM
じゃあOpenMPライブラリの差か?
890,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/04/03(土) 02:32:11 ID:uQbVaWoM
>>883
いや、実際吐き出すコードシーケンスに差が出るんだから仕方ない。
891,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/04/03(土) 02:33:05 ID:uQbVaWoM
>>887
> GCCは変な最適化とかしない素直なコンパイラってイメージがあって、
お前の思い込みなんて参考にする価値は微塵もない

そもそも12コアが6コアに負けることが恥ずかしいんだが。
892Socket774:2010/04/03(土) 02:39:39 ID:9xcmbr0U
高クロックデュアル(Core2)と
低クロッククアッド(Phenom)が良い勝負だった話を思い出すな
値段も2コアと4コアが同じぐらい

電力?触っちゃいかん
893Socket774:2010/04/03(土) 02:49:15 ID:54c7Cglz
ライブラリでAMDがIntelに勝てる訳ないだろw
というか、環境、サポート、ソフトウェアのどれをとってもIntelは遙か上をいってる
この辺が明らかに弱いからさんざん叩かれているのがAMDなんだが
894Socket774:2010/04/03(土) 02:56:38 ID:54c7Cglz
>>891
> >>887
> > GCCは変な最適化とかしない素直なコンパイラってイメージがあって、
> お前の思い込みなんて参考にする価値は微塵もない
>
> そもそも12コアが6コアに負けることが恥ずかしいんだが。
Opteronに負ける以前に、4コアと6コアで性能差が1秒しかないのは明らかにおかしいだろ

それに、コアの性能差とクロック差が大分あるから、
論理コア数が同じならHTTの効率の悪さを差し引いてもOpteronとは互角以上にはなるはず。
895,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/04/03(土) 02:59:12 ID:uQbVaWoM
>えるえる

あとこれは余談だが
たとえばさ、最適化をしすぎるとHTの効果を得にくいわけだけど、逆に
HT環境下で最適化を強めにすることで、緩い最適化よりかえって性能が落ちる
ケース(-O3で-O1や-O2より遅くなるとか)があるんだわ。

たとえば、1スレッドだけで1コアのリソースを専有する場合、3基のALUを同時可動させるために、
3命令かかる操作を5命令くらいに展開したりするような最適化がよく行われる。

しかし、HT環境下では2スレッドで演算リソースをシェアするので、見た目の命令の
レイテンシ・スループットは約半分になる。
んで、むしろ命令数の増える最適化はかえって逆効果になる。

んで、Intelコンパイラには「HT用の最適化」のスイッチが存在する。
他のコンパイラなら、簡易的には、コードサイズが増える最適化を抑止する
-Os オプションが有効かもしれないね。
896,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/04/03(土) 03:30:53 ID:uQbVaWoM
>>883
それっぽいデータあるぞ。Harpertownの頃のベンチだが
http://www.univ2000.com/intel/index.html

このグラフをIntelコンパイラを基準に正規化してみると面白いよ。Xeonでは
Intel C++>Visual C++>GCC>Apple版GCC
になってるからww
#つか、俺もMacで確認したことあるけどAppleビルド版GCCって何故か自前でビルドした本家GCCより性能悪い。

まあLinuxのGCCがAMD有利ってのは実情そうなんだから仕方ない。
社内業務でパッチ書いてるくらいだし。
中の人名義のコミット数見てみ。AMDが圧倒的に多いから。

もちろんIntelにも最適化ノウハウをGNUに提供する権利はあるが、
自社製コンパイラの市場も守らないといけない。
プロプライエタリ契約ができるMSにはVCに最適化情報を提供しても
オープンソースであるGCCには最低限度の情報しか出せないんじゃね?

実際問題Intel陣営(?)でまともにコミット活動してるのってH.J.Luくらいだし
897●テヘ権田● ◆OhjIkO1O8o :2010/04/03(土) 05:16:30 ID:brVGgCBl
>>887
> GCCは変な最適化とかしない素直なコンパイラ
それで性能が大きく劣化しているのなら糞コンパイラでしか無いわけだがw
常識的に考えて存在価値はほとんど無い。
898Socket774:2010/04/03(土) 06:30:40 ID:kH86Rf14
互いに性能を引き出せる方を使えば良いというだけの話

Opteron 6174 18s(Linux)
Xeon 5670   26s(windows)
899Socket774:2010/04/03(土) 06:32:12 ID:54c7Cglz
GCCが糞での存在意義が無いとかww
900Socket774:2010/04/03(土) 06:55:08 ID:TtlR4k+V
ギミック使った特殊演算強いので、それを多用しないと強さが発揮できないのかねえ。
サーバ用途というよりは、ゲームマシンでカリコリと最適化しているイメージに近いのかも。
901,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/04/03(土) 06:59:17 ID:uQbVaWoM
qn24bだが、一応コンパイルオプションの変更でこの程度は性能変わる

【-march=opteron】
$ ./qn24b_openmp 16
qn24b OpenMP version 1.0.0 2004-04-21
There are 9844 tasks
=============================================
qn24b OpenMP version 1.0.0 2004-04-21
problem size n : 16
total solutions : 14772512
correct solutions : 14772512
million solutions/sec : 4.627
elapsed time (sec) : 3.193
=============================================

【-march=core2】
$ ./qn24b_openmp 16
qn24b OpenMP version 1.0.0 2004-04-21
There are 9844 tasks
=============================================
qn24b OpenMP version 1.0.0 2004-04-21
problem size n : 16
total solutions : 14772512
correct solutions : 14772512
million solutions/sec : 4.801
elapsed time (sec) : 3.077
=============================================
902●テヘ権田● ◆OhjIkO1O8o :2010/04/03(土) 08:26:29 ID:brVGgCBl
>>900
> GCCが糞での存在意義が無いとか
ほとんど無いと思うぞ。
実行速度が極端に低下するようなバイナリーを生成するコンパイラは糞と呼ぶにふさわしいのではないかな?
万能なCPUは作れないのが実情であり、その為に色々と制約が課せられているのが実情だ。
その制約に従いつつ、出来るだけ高速に処理をする実行コードを生成するのがコンパイラの役割であって
性能が極端に低下するような実行コードを生成するコンパイラはゴミでしかない、害悪だなw
903Socket774:2010/04/03(土) 08:31:18 ID:59XhA88S
コンパイラの役目は高級言語で記述したソースから動くバイナリを生成することでしょ。
速度は優先順位2番目。
904Socket774:2010/04/03(土) 08:37:08 ID:GFV5eyB4
優先順位高いなw
905えるえる:2010/04/03(土) 08:52:31 ID:LOba9y8y
まあどれも想像の範疇を出ていない意見だな。
当のAnandの説明では、
Intel系ではベンチの後半はCPU負荷が数割までさがったけど、
Opteronでは100%が持続したって書いてあるな。
そもそもAlpha版だし、まともに動いているかどうかすらよくわからんというオチ。
906えるえる:2010/04/03(土) 08:54:14 ID:LOba9y8y
あと、Win版はよりもLinuxのほうが速い結果がでているのに、
これでGCCがわるいとかいったら、MS Cはいったいなんなんだよと。
907Socket774:2010/04/03(土) 09:29:58 ID:TtlR4k+V
>906
対抗する相手のパフォーマンスを下げるのに必死で、
自分のとこのが少々下がっても仕方ないというオチだったりして。w
908Socket774:2010/04/03(土) 09:36:24 ID:eY7BW8k1
6コアって言っても12スレッド処理できるわけだし
団子それちょっと苦しくないか
909Socket774:2010/04/03(土) 10:22:47 ID:EM05RPqe
下らない話は次世代コンパイラスレでも立ててやってくれ
910Socket774:2010/04/03(土) 11:55:47 ID:AgaFtfzq
みんなアセンブラで作ればいいのに
911Socket774:2010/04/03(土) 15:18:12 ID:54c7Cglz
GCCてlinuxで一番有名でユーザーが多いコンパイラだろ?
それ使って性能出ないような糞CPU作る方が問題だろうw
912Socket774:2010/04/03(土) 15:25:11 ID:xrQPJxsa
ICCもLinux版は無料だから結構利用者いるだろ
913,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/04/03(土) 17:19:38 ID:uQbVaWoM
>>908
SMTの性能向上率なんてせいぜい2〜3割あれば御の字ですが?
914,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/04/03(土) 17:47:19 ID:uQbVaWoM
>>907
なんでMicrosoftがAMDと対抗する必要があるんだ?www

Intelと勘違いしてるようだが現状SPECintのスコアみてもICCがAMDにとっても最速のコンパイラなくらいだし
要するにAMDとMSの連携不足なんじゃね?w


まあ、コア規模は同等だし、

Opteron: 2.3[GHz] * 12[core] = 27.6
Xeon:   3.2[GHz] * 6[core] * 1.3[HT] = 24.6

トランジスタ数倍注ぎ込んで、むしろ勝てるほうが当然なんだが。
915,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/04/03(土) 17:54:38 ID:uQbVaWoM
ごめんX5680は3.33GHzだったね
3.33 * 6 * 1.3 = 25.974
916Socket774:2010/04/03(土) 18:12:34 ID:54c7Cglz
Sandyって1コア辺り30mm2位だから、8コアで240mm2、アンコア含めて300mm2位かな?
45nmのK10がL3付き6コアで約300mm2、シュリンクしたら6がけで180mm2。
K10 6コアと Bull 8コアが同じくらいなら、Bull 8コアも180mm2、せいぜい200mm2。
Sandy 8C/16T は 3GHzで130Wだろうな。
Bull 8Cは3Ghzで65W程度で、Bull 16Cは130Wかな。
Bull 3Gを1、コアの性能比1.3倍、HTT効率1.3として130W時の性能を適当に比較(
Sandy 8C/16T 3G =1.3*8*1.3=13.52
Bull 16C 3G = 16
Sandy 8C 300mm2とBull 16C 200*2=400mm2
300mm2と200mm2 2個ならコストは同じくらいだろう。
団子の言うとおりなら、AVX使わない限り価格帯でかぶるBulldozerには数割レベルで負けることになるな。
917,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/04/03(土) 18:15:22 ID:uQbVaWoM
L1キャッシュが小さくなったことで性能低下するアプリを考慮に入れなければそうなるかもね
918Socket774:2010/04/03(土) 18:15:47 ID:54c7Cglz
>>914
IntelとMSの最適化技術の差だろ
自社で最適化と他社のを最適化と言う違いでもある
919,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/04/03(土) 18:22:13 ID:uQbVaWoM
そしてその数ヶ月後に出るIvyBridge 8コアに撃沈ですね。わかります。

920Socket774:2010/04/03(土) 18:24:01 ID:eY7BW8k1
で、Bulldozer+HD7xxxにry
921Socket774:2010/04/03(土) 18:26:51 ID:54c7Cglz
>>914
X5680は32nmだろ、45nm換算で450〜500mm2相当になる。
Op 6174 は700mm2だから、差としてはせいぜい5割程度だろう。
シュリンクによる低電力化も加味すれば、
マニクールとWestmere-EPに性質的な差は無いに等しいよ。
マニクールを32nmにシュリンクすれば350mm2/3GHz位になるだろうしね。
922,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/04/03(土) 18:43:36 ID:uQbVaWoM
>>918
日本語でおkww
923,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/04/03(土) 18:48:07 ID:uQbVaWoM
> マニクールを32nmにシュリンクすれば350mm2/3GHz位になるだろうしね。

ぷはwww
1ノードのシュリンクでダイサイズ半分になってたのって一体いつの時代の話だよwwww
高クロックプロセスで素直に半分に縮小できるのは熱密度の小さいSRAMほか
アンコア部のアクセス頻度の小さいブロックくらいですよ

ダイサイズの大半がSRAM/アンコアで構成されるIntelプロセッサなら兎も角
Magny-CoursはもともとSRAM面積比小さいからガッカリしますよ。

てか君は数字の予想はしないほうがいいよ。
924Socket774:2010/04/03(土) 18:56:28 ID:54c7Cglz
>>919
その数カ月後にBull 8C + HD6750に撃沈か、短い生涯だったね。

AMDのハイエンドロードマップはこんなもんか?
CPU
2011/下 32nm Bull 8C(200mm2)/16C
2012/上 32nm Bull 8C + HD6xxx (300mm2)
2012/下 22nm Bull 16C(200mm2)/32C
2013/上 22nm Bull 16C + HD7xxx (300mm2)
2013/下 22nm 想像つかんww

Intelはこんなもん
2011/下 32nm Sandy 8C (300mm2)
2012/上 22nm Ivy ミドル以下
2012/下 22nm Ivy 16C (300mm2)
2013/上 22nm Has 8C + Larra (300mm2)
2013/下 22nm Has 16C (300mm2)

なんというか、内蔵GPGPUを手に入れた今プロセス世代の差は意味がなくなったっぽい
925Socket774:2010/04/03(土) 19:28:51 ID:54c7Cglz
>>923
それっぽい係数使った適当な予想だから気にすんなw
Larrabeeで盛大に自爆したお前に言われたくないよw

それにマニクールはLisbon 350mm2のMCMで約700mm2だけど、
今は約300mm2のThubanがあるから、それ使って32nm 12コア 350mm2は可能だろう。
926Socket774:2010/04/03(土) 19:35:09 ID:54c7Cglz
>>922
たしかに日本語が少し変だなw

細部まで理解している自分で作ったハードのソフトを自分で作るのと、
よく分らん他人が作ったハードのソフトを説明されながら作るのじゃ、
最終的なソフトの性能に差ができるのは当然だろうってこった。
927Socket774:2010/04/03(土) 19:57:46 ID:TtlR4k+V
CELL作った時のプロセスが腐っているという話もあるが、シュリンク時のゲート高速化を織り込んで
高消費電力のゲートを低消費電力のゲートに置き換えたら、高消費電力のゲート数が1/3がか1/4になって
チップサイズ、消費電力共に予定以上に小さくなったといっていたな。

まあ、同一クロックが満足できればおkの世界という裏もあるが…。
928,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/04/03(土) 20:07:06 ID:uQbVaWoM
たかだか2-issueのシンプルRISCだしな。
プロセッサの動作限界は消費電力よりも熱密度に支配される
929,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/04/03(土) 20:11:16 ID:uQbVaWoM
>>926
ほう、GCCが事実上のAMD純正コンパイラのポジションを兼ねてる事実を踏まえて聞くと面白い意見だ
(前ならPathScaleがあったけどNVIDIA陣営に行ったし)
930Socket774:2010/04/03(土) 20:17:47 ID:++m6yBxN
GC2にはまたATIのシールが貼られるのか
931Socket774:2010/04/03(土) 20:49:24 ID:54c7Cglz
とりあえず適当に作っても性能がそれなりに出るのがOpteron、
気合入れてカリカリにチューニングしないとろくに性能もでないXeon
932,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/04/03(土) 20:50:41 ID:uQbVaWoM
実情は>>905
933Socket774:2010/04/03(土) 21:45:10 ID:vSggtOuV
>>905
>Intel系ではベンチの後半はCPU負荷が数割までさがったけど、
>Opteronでは100%が持続したって書いてあるな。

俺の読み間違いかな.
"Intel系"ではなくてOpteron 6174をWindowsで使った場合
と書いてあると思うんだけど.
934,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/04/03(土) 22:10:30 ID:uQbVaWoM
>>933
その訳であってると思うよ
つかMSVCがIntelに荷担してるとか笑うしかねぇwww
935,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/04/03(土) 22:28:02 ID:uQbVaWoM
Anandの分析どおりなら、単純にVCのOMPLIBがタスク分割の粒度粗いだけかもしれんがね

Xeonはスレッド数が少ない場合に演算リソースを1スレッドで専有できるし
Turbo Boostで一部のコアのクロックをブーストできる。
したがって、ワーカースレッド数が減っても性能が低下しにくい。

Magny-Coursは24スレッド均等に処理を分割してやらないとフルに性能を発揮できない。
936●テヘ権田● ◆OhjIkO1O8o :2010/04/03(土) 22:58:11 ID:brVGgCBl
> Magny-Coursは24スレッド均等に処理を分割してやらないとフルに性能を発揮できない
非常に大きな弱点だな。用途によってはゴミになる。
937Socket774:2010/04/03(土) 23:06:11 ID:eY7BW8k1
INTELがコア数を生かせられないだけでは?
938えるえる:2010/04/03(土) 23:09:43 ID:LOba9y8y
>>936->>937
団子の説明はわかりにくいが簡単な話。ようするにAMDはコアが多いので、
たとえば12スレッドが早々仕事おわっちゃって、ほかの12スレッドの仕事がおわるのをまってるような状況が発生する。
今回のBlenderのベンチマークではWin/Linux間でベンチの後半で顕著に違いとして出てきたという感じ。
コンパイラとかライブラリとかの処理系だけじゃなくてBlenderで何をレンダリングしてるかでも変わりそうだよ。
これはスループット志向/多数コア志向の設計で共通の問題だからな。
コア数が少ないほうが全コアが休み無く動き、性能を発揮しやすいというのは当たり前。
939えるえる:2010/04/03(土) 23:29:09 ID:LOba9y8y
あと熱密度(笑)は物理用語風誤答語なのであまりつかうのはおすすめしないよ。
Power Densityで十分。

796+1 :えるえる [↓] :2009/06/20(土) 19:15:15 ID:KQ8pkTrR (9/17)
Quadの話はあくまでもLynnfieldとの比較で言ってるだけだが。
あと、熱密度なんて後藤only用語を未だにつかっているやつがいるが、
当の後藤記事を読めば、
http://www.watch.impress.co.jp/pc/docs/article/20010206/kaigai01.htm
http://www.watch.impress.co.jp/pc/docs/article/20010206/kaigai01.jpg
熱密度(笑)はCore 2以降、殆ど上がっていないことが理解できるだろう。


798+1 :[Fn]+[名無しさん] [↓] :2009/06/20(土) 19:18:27 ID:xt/N5PGQ (7/10)
>>796
熱密度がCore2以降上がってないというのではなく、
熱密度が限界になってクロックが抑えられてしまってる
ってのが本当のところ


799+1 :えるえる [↓] :2009/06/20(土) 19:19:58 ID:KQ8pkTrR (10/17)
>>797
>BloomFieldやLynnfieldのリーク情報見てる限り、パフォーマンスワット(特にアイドル)が芳しくないのが問題だといってる
Gainestown vs Harpertown
Core 2 Quad vs Lynnfield
双方の計測において、ロード時は同等、アイドル時は、Nehalem系が勝っているよ。
Bloomfieldはあれは、Xeonなんだよ、プラットフォームの設計が。
その経緯をしらないやつがNehalemは特別電力消費が大きいと勘違いして正確ではない情報を蔓延させてきたのだ。

802 :えるえる [↓] :2009/06/20(土) 19:22:52 ID:KQ8pkTrR (12/17)
>>798
ちゃんと人のレスと、リンク先の後藤記事よんだか?
後藤が勝手に熱密度(笑)と呼んでいるのはPower Densityであって、
電力値をダイ面積で割ったモノだよ。
熱密度(笑)が本当に大きくなっているかどうかは、
Nehalemの消費電力をダイサイズで割って、Pentium 4やCore 2と比較してみればいい。

804 :えるえる [↓] :2009/06/20(土) 19:25:15 ID:KQ8pkTrR (13/17)
>>801
改めて検索するとトップの方に後藤記事が来るな。
よい子は熱密度なんてえせ物理用語は使わないように注意しましょう。

>熱密度?
940,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/04/03(土) 23:34:48 ID:uQbVaWoM
941えるえる:2010/04/03(土) 23:39:40 ID:LOba9y8y
>>940
それはたまたま使ってしまったレベルだね。熱密度なんていう言葉は一般にはない。
Power Densityならぐぐればいくらでもでてくるがね。
942えるえる:2010/04/03(土) 23:41:27 ID:LOba9y8y
http://ja.wikipedia.org/wiki/%E9%9B%BB%E5%8A%9B%E5%AF%86%E5%BA%A6
高出力の半導体において体積あたりの取り出せる電力を表す。
放出される単位時間あたりの熱量をさすこともある。単位はワット毎立方センチメートル (W/cm3)。
943Socket774:2010/04/04(日) 00:01:22 ID:54c7Cglz
>>935>>936>>938
CnQ(OpteronはPowerNowだっけ?)知らないの?
負荷が低いコアはクロック落として省エネになるんだよ?
それにターボって少スレッド時に数百Mhzアップするだけだし、
2割以下しか性能は上がらんよ、いわば気休めってだけw
そもそも何Wayも使って数十スレッド処理がメインのXeonやOpteronで、
シングルや少スレッド性能競っても仕方ないだろw

>コア数が少ないほうが全コアが休み無く動き、性能を発揮しやすいというのは当たり前。
その結果Blenderでは性能が低いですじゃ意味がないw
944,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/04/04(日) 00:21:47 ID:w2IUsqCK
WindowsでCoolSpeed Technology(笑) が発動している説
945●テヘ権田● ◆OhjIkO1O8o :2010/04/04(日) 00:23:22 ID:7XU6kjpZ
>>943
> そもそも何Wayも使って数十スレッド処理がメインのXeonやOpteronで、
> シングルや少スレッド性能競っても仕方ないだろw
いやシングルスレッド性能も重要だろ。

社員A「AMDの最新CPU搭載サーバーに変わってから空いている時間帯でももっさりするようになったね、なんか何時も反応が鈍いよ」
社員B「そうだね、だけどさピークの時間帯での激重は解消されたんだし・・・」
社員A「おれピーク時間帯は使わないから無関係」
・・・
946,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/04/04(日) 00:26:22 ID:w2IUsqCK
一般エンプラ用途にせよHPCじゃないんだから常に忙しいわけじゃないし
むしろタスクは質量ともにばらつく
少ないスレッドを高速に捌けるソリューションも必要だよ。

現にSunなんて見向きもされない
947えるえる:2010/04/04(日) 00:35:46 ID:+AxBO11k
サーバでシングルスレッド性能が必要ないってのはCPU屋のいいわけだよな。
サーバがコア数しか増えないならもうサーバにはなんの未来も無いよ。
ひたすら安くなって、それでも台数いらなくなっていく運命。
シングルスレッド性能がないとあたらしいことってほとんどできないからなあ。
948Socket774:2010/04/04(日) 00:41:08 ID:WhguDjYA
TBって大半のコアをアイドル如何にして少数のコアをちょっとOCする機能だろ?
12コア中10コアとかがアイドル以下になるとか普通ありえない
バラつくっていっても、マルチスレッドが基本なんだから全部にそれなりの負荷はかかる
そもそも少スレッドの性能が欲しけりゃ4コアや6コアの高クロック品を使えばいい。

それにTBの向上率はせいぜい2割以下なんだから、大して高速には捌けないよ。
949,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/04/04(日) 00:45:41 ID:w2IUsqCK
バカジャネーノ?
2GHz台よりは3GHz台のほうが確実に速いだろ
950●テヘ権田● ◆OhjIkO1O8o :2010/04/04(日) 00:47:51 ID:7XU6kjpZ
>>948
いやシングルスレッド性能そのものが大きく差がある、ダフルスコアで負けているのは看過できないw
951えるえる:2010/04/04(日) 01:01:54 ID:+AxBO11k
まあ今のロードマップ上の持ち駒からいくと
AMDが勝つためにはなにかの拍子でeDRAMをIntelよりも一足先に導入してしまうとか
突飛なことがおきないかぎりは難しいな。
やはり結局、Llanoの後継がどうなるかがいちばん気になるところである。
952,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/04/04(日) 01:03:07 ID:w2IUsqCK
まあ選ぶのは消費者だからな















Turbo Boost VS CoolSpeed(笑)


953●テヘ権田● ◆OhjIkO1O8o :2010/04/04(日) 01:14:43 ID:7XU6kjpZ
まぁ、AMDの今の技術力だと正面対決してIntelに勝てる要素は殆ど無いから隙間だけでも優位にしておこうとすると
シングルスレッド性能を捨てて多コア化に進むのは寧ろ自然だろ。
954,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/04/04(日) 01:20:40 ID:w2IUsqCK
もし本当に全コア常に忙しいなら
ACP(笑)なんていう消費電力の二重の目安なんて必要ないし
CoolSpeed(笑)も必要ない(それ相応の熱設計・クロック数に最初から収まってれば本質的に不要な機能)
955Socket774:2010/04/04(日) 01:23:58 ID:oems6CJn
>>952
CoolSpeedってOSの対応が必要なのか.
そうだとしても対応はまだなのでは.

Turbo Boostの発動条件を解説しているところってある?
そんなに敏感には変化しないと思うんだけど.
956Socket774:2010/04/04(日) 01:28:46 ID:NS+SUC9k
ID:w2IUsqCK

よくわからんが、必死杉www
957Socket774:2010/04/04(日) 01:32:21 ID:WhguDjYA
そりゃ速いけどさ、ターボで1GHzとか倍に向上とかするわけじゃないだろ?
6コア最上位 X5680 定格 3.3G/Max Turbo 3.6G 差は1割弱の300MHz
6コア最下位 X5650 定格 2.6G/Max Turbo 3G 差は1割強の400MHz
1/2コアのみで他コアをアイドルにするMax時ですらこの程度、どうみても気休めでしかない…

そもそもの発端のBlenderは全コア使うタイプのソフトだろ?
なんでシングルや少スレッドの性能がちょっと上がるだけのTurboにそんなに持ち上げるのか

シングルスレッドじゃクロックも効率も違いすぎてハナから相手にならないのはわかってるよw
マルチスレッドで性能出ないのがおかしいだろって言ってんのよ、こっちは
958●テヘ権田● ◆OhjIkO1O8o :2010/04/04(日) 01:33:13 ID:7XU6kjpZ
リテールクーラー装着だと団子のTripcode Explorerを走らせたらCoolSpeed Technologyによってクロックダウンする可能性大だな…
という懸念から団子は必死なんだよ
959,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/04/04(日) 01:33:47 ID:w2IUsqCK
>>955
自動で発動するよ
960,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/04/04(日) 01:35:49 ID:w2IUsqCK
>>958
あー、思い出した
アフィニティ固定モードはNehalem対策な(HTで2スレッド同じコアで走らせると性能が落ちる)
961,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/04/04(日) 01:40:55 ID:w2IUsqCK
というかBudweizerとやらはスレッド少ないときにシングルスレッド性能あがるんかね
962Socket774:2010/04/04(日) 01:48:28 ID:oems6CJn
Opteron 6100シリーズはMCMの片方を休ませてもう片方をブーストという程度でいいから
Turbo機能入れて欲しかったな.

>>961
Budweizer ?
963,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/04/04(日) 01:52:19 ID:w2IUsqCK
ちょうどF1みてたからちょいボケてみた
964えるえる:2010/04/04(日) 01:54:45 ID:+AxBO11k
http://pc.watch.impress.co.jp/img/pcw/docs/348/705/html/1.jpg.html
Llano共々APM Boostかいてあるからあがるだろうな。
少なくとも今の計画上では。
965Socket774:2010/04/04(日) 02:06:07 ID:WhguDjYA
平常時にリテールクーラー使って性能落ちるとかAMDが企んでもIBMやHPが許さんだろw
966Socket774:2010/04/04(日) 02:08:29 ID:WhguDjYA
>>961
大きな釣りだなw
Thubanとllanoに付いててバドワイザーに付かない理由が思いつかないw
967えるえる:2010/04/04(日) 02:09:02 ID:+AxBO11k
AMDはL1IもDも32B幅なのに
Intelはいまだに16B幅だったのだ。
Blenderはそういうことかねぇ。
968Socket774:2010/04/04(日) 02:18:10 ID:WhguDjYA
>>967
Xeon同士でも同一クロックで4コアと6コアの性能差が1秒しか無いのは、そんなもんが原因じゃないだろ
969えるえる:2010/04/04(日) 02:18:59 ID:+AxBO11k
>>966
Thubanのはコアを半数(3コア)殺して残りをBoostみたいなやつなんだね。
Power 7みたいだな。
970えるえる:2010/04/04(日) 02:21:14 ID:+AxBO11k
まあThubanはAPMないから柔軟性はなさそうだし、Power Gatingもないだろうから、
本格的にはLlano以降かもなあ。
971Socket774:2010/04/04(日) 02:28:57 ID:WhguDjYA
本格的じゃないけど400〜500MHz向上するんだぜ。
本格的になったらどれだけ向上するんだか。
972えるえる:2010/04/04(日) 02:29:21 ID:+AxBO11k
殺してという表現は誤解されそうだな。
半分が名前のとおりIdle(C-state)でクロックアップかな。
973Socket774:2010/04/04(日) 02:31:41 ID:RlUBjGUE
なんで1人3役やってんの?
974えるえる:2010/04/04(日) 02:32:21 ID:+AxBO11k
>>971
クロックの幅だけじゃなくて、
コア数の刻みとか、変化するクロックの刻み、時間的粒度(反応速度)、透過性
などの完成度があるので。IntelだってIDAのときはほとんどはたらかなくて糞だったろう。
975 ◆////////HQ :2010/04/04(日) 02:41:54 ID:6z9Y4H3d
なぁ団子はTripcode ExplorerのGPGPU版作らんの?
HD5870CF環境だけどGPUにやらせると300Mtrips/sと馬鹿速なんだわ
これからは使い分けないといかんね
976Socket774:2010/04/04(日) 03:04:42 ID:WhguDjYA
>>974
デュアルコアしか使わないようなゲームとかだと有効だろう
Intelのターボは知らんが、AMDのは3コア単位だから結構使いどころは多いだろう。
クロックの刻みは500MHzアップするかしないかの二択だけ。
条件は3コア以上Idle、3コア以下高負荷。
977●テヘ権田● ◆OhjIkO1O8o :2010/04/04(日) 03:12:16 ID:7XU6kjpZ
>>975
> HD5870CF環境だけどGPUにやらせると300Mtrips/sと馬鹿速なんだわ
そんなソフト既にあるのか?、URL張ってくれ。
978 ◆////////HQ :2010/04/04(日) 03:22:38 ID:6z9Y4H3d
http://sourceforge.jp/projects/naniya/releases/36697/note

AMDCALRT.DLL, AMDCALCL.DLLがないとCPU動作になってしまうが
現在はATI*****.DLLに名前が変わっているのでAMD*****.DLLにリネームして使う
実行ファイルと同じディレクトリにコピーして放り込んでやればOK
979,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/04/04(日) 03:41:29 ID:w2IUsqCK
一人3万だせ。話はそれからだ。
乞食は要らん。
980 ◆////////HQ :2010/04/04(日) 03:48:11 ID:6z9Y4H3d
すっかり金の亡者か
偉そうにしてるがお前のやつ遅いじゃん
前述のソフトにおまけで付いているCPU動作にさえ追い付けないぞ
981,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/04/04(日) 03:51:04 ID:w2IUsqCK
それがどうかしたか?
982●テヘ権田● ◆OhjIkO1O8o :2010/04/04(日) 03:52:53 ID:7XU6kjpZ
>>979
つーかさ、>978があるなら不要じゃん?
983,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/04/04(日) 03:54:16 ID:w2IUsqCK
てか俺がそんなことに時間使うこと自体が不要
984 ◆////////HQ :2010/04/04(日) 03:59:42 ID:6z9Y4H3d
>>981
残念ながらトリップの桁数の関係で完全動作しないのだよ
指定できるのは8桁まで14桁トリップなんてのにも対応しない
とりあえず作ってみました程度のものらしい
985,,・´∀`・,,)っ-○○○@ ◆OhjIkO1O8o :2010/04/04(日) 04:01:52 ID:w2IUsqCK
いつから14桁トリップなんてできたんだ?
興味ないから知らなかった。
986 ◆////////HQ :2010/04/04(日) 04:03:11 ID:6z9Y4H3d
>14桁トリップなんてのにも対応しない

この部分削除
987 ◆////////HQ :2010/04/04(日) 04:03:48 ID:6z9Y4H3d
>>985
すまん、勘違いだ
988,,・´∀`・,,)っ-○○○@:2010/04/04(日) 04:18:09 ID:w2IUsqCK
Be付ければいいじゃん
トリップ必要なくね?
989 ◆////////HQ :2010/04/04(日) 04:30:17 ID:6z9Y4H3d BE:4214743698-PLT(65754)
Beもあるけどトリップの方が見た目がよろしいので
990,,・´∀`・,,)っ-○○○:2010/04/04(日) 04:31:37 ID:w2IUsqCK
要らんな
991 ◆////////HQ :2010/04/04(日) 04:35:27 ID:6z9Y4H3d
件のソフトが8桁までしか検索出来ないのは
酉バレを防ぐためなのかもしれないね
10桁程度ならそれほど時間をかけなくても検索出来そうだもの
992,,・´∀`・,,)っ-○○○:2010/04/04(日) 04:46:49 ID:w2IUsqCK
もともとトリップなんて無価値だろ
993 ◆////////HQ :2010/04/04(日) 04:52:39 ID:6z9Y4H3d
匿名掲示板で同一性を確認できる道具
文章で確認させてしまう人もいるが使い方による
994,,・´∀`・,,)っ-○○○:2010/04/04(日) 04:55:59 ID:w2IUsqCK
それこそBeで十分じゃねーか
コテ名乗る度胸もない奴がトリップとか烏滸がましいな
995 ◆////////HQ :2010/04/04(日) 05:07:08 ID:6z9Y4H3d
まぁ私は常時コテハンでもないですし、書き込み数が多い方でもないですけどね

一人用キャップ→トリップ

GPGPU絡みならそれほどスレチじゃないと思って話題を振ってみただけですよ
996Socket774:2010/04/04(日) 06:05:43 ID:EwZH82sl
test
997Socket774:2010/04/04(日) 06:07:22 ID:EwZH82sl
hoge
998Socket774:2010/04/04(日) 06:08:46 ID:EwZH82sl
998
999Socket774:2010/04/04(日) 06:11:06 ID:EwZH82sl
999
1000Socket774:2010/04/04(日) 06:12:20 ID:EwZH82sl
1000ならAMD倒産
10011001
1台のマシンが組み上がりました。。。
新しい筐体を用意してくださいです。。。。

         自作PC板@2ch http://pc11.2ch.net/jisaku/