1 :
Socket774 :
2006/04/16(日) 20:37:48 ID:MsI4BOX2
2 :
Socket774 :2006/04/16(日) 20:39:22 ID:MsI4BOX2
3 :
MACオタ :2006/04/16(日) 20:46:49 ID:H5VvUIzb
立てちゃったすか。半年くらい様子を見る気持ちの余裕ってのがあっても良いと思うすけど。。。 今立てると、秋まで火病ったアム虫のヲチスレと化すような気がするす。 でもAMDの次世代ネタわ、これからが面白くなるすからCoreアーキテクチャを見てがっかりせずに 技術ヲチを続けると良い筈す。
macオタニュースの読者です 今後も今までように定期的に貼ってください 関連スレが古くてごめんなさい 前スレのまま貼っちゃった
5 :
MACオタ :2006/04/16(日) 21:05:49 ID:H5VvUIzb
華麗に2GET
させるかぁぁぁぁ!!
火病ってるのは雑音ぐらいでほかは割と冷静だったと思うけどな。 まあAMDは半年ネタないから話すこともないわけだが。
9 :
Socket774 :2006/04/16(日) 22:51:25 ID:qN6SQIFE
∩∩ 値上げも歓迎僕らが自作板で有名なAMD信者 ∩ (7ヌ) (/ / / / ∧_∧ || / / ∧_∧ ∧_∧ _(´∀` ) ∧_∧ || \ \( ´∀`)―--( ´∀` ) ̄ ⌒ヽ(´∀` ) // \ /⌒ ⌒ ̄ヽ、嫌韓中/~⌒ ⌒ / | |ー、 アニメ / ̄| //`i まほろ命/ |軍オタ | |エロゲ / (ミ ミ) | | | | |大好き | / \ | | | | ) / /\ \| ヽ / ノ | / ヽ ヽ、_/) (\ ) ゝ | | | | / /| / レ \`ー ' | | /
>>3 お前馬鹿だろう。明るい話題限定じゃないといけないっていうルールでもあるのか?
11 :
MACオタ :2006/04/16(日) 23:23:37 ID:H5VvUIzb
>>8 ----------------------
火病ってるのは雑音ぐらいでほかは割と冷静だったと思うけどな。
----------------------
これって山ほどあるイタい書き込みのコピペを誘導してスレ潰しを狙う釣りの一種なんすかね。。。
12 :
Socket774 :2006/04/17(月) 00:52:36 ID:s62oervo
とりあえず、アホオタは 半年ぐらいこのスレにカキコせずに ヲチだけで済ませられる余裕ができてから そういう与太を言えとw
>>3 前スレはいいところで1000到達して命拾いしたようで
無様でしたね
テンプレ貼り忘れてるす(笑) Aという技術がプロセッサ業界等で採用され始める(業界のトレンド) →視野が狭いので知りもしない オタ「Aという技術が他で採用されてるす。AMDもいずれ採用するんじゃないすかね」 →うざい。そんなわけないだろ インテルがA技術の採用を発表する(インテル儲にとってトレンド) →これだからインテルはw AMDがA技術の採用を検討し始める →これからはAの時代だ!(ここがAMD儲のいうトレンド) もっと広い世界に目を向けるべきだと思うす
つうか早く技術的な話題ネタで盛り上がれや 社 員 も 暇 人 も 社 会 人 も ど ん ど ん 働 け !!
そんなこと言ったって、ネタ無しですw AMDに未来はあるのだろうか? 取り敢えず、65nmになってクロック上がってからだな。 ショボン。
トレンドねえ。 デュアルコアとか、x86_64 とか、性能電力比重視とか、メモリコントローラ 内蔵とか、P2P プロセッサリンクとか、最近のトレンドは AMD が先行して Intel の方が後追いしてることも多いわけだが。 メモリコントローラ内蔵と、P2P プロセッサリンクは、Intel はまだ計画段階 で実現にさえ至ってないしね。
>>17 もっと広い世界に目を向けるべきだと思うす(笑)
19 :
Socket774 :2006/04/18(火) 18:58:13 ID:qM+4WrUW
>>17 前スレで出てきたような気がするが、カエルAカエルBのレベルだな。
>>14 のインテルとAMDの順を入れ換えるだけで終わりだ
>17 先進的なアーキテクチャならPC用以外のほうが面白い 対Intelだと、ハードウェアよりも命令セットの主導権を握ったことのほうが大きい それもK8の成功があったればこそだが
> ハードウェアよりも命令セットの主導権を握ったことのほうが大きい 主導権を握ったのかはもの凄く怪しい。 一部命令の違いにより動作が異なる部位がある。 OSを含め、多くのソフトがどちらの動作を選択するのかで主導権は変化する。 SSE、SSE2、SSE3に追随するAMD社が主導権を握っているとは到底思えませんよ。
>>17 >最近のトレンドは AMD が先行して
>Intel の方が後追いしてることも多いわけだが。
マルチコアもメモコン内蔵もP2Pバスも、別に珍しいもんじゃないす(笑)
イーサコントローラとかも内蔵してるものもあるしねぇ
>21 マイクロソフトがIA64を切ってAMD64とかPacificaを支持したことを言ってるんだが 絶対的なアドバンテージではないけど、イメージ上の利益ははかり知れない
MSはPacificaだけでなくVanderpoolももちろんサポートするよ
広い世界=Arm
18=22は、同じレスに二度もほぼ同じツッコミをしてるが 真性のアホか?
本来のAMDerのあるべき姿 インテルがA技術の採用を発表する →ふーん AMDがA技術の採用を発表する →ふーん 結論 さーて今回はどっち買おうかな、と
>>27 インテルがA技術の採用を発表する
→ふーん
AMDがB技術の採用を発表する
→ふーん
結論
さーて今回はどっち買おうかな、と
こっちの方があっている気がする。
>>29 IntelerはIntelCPUばっかり買う人が多いけど、AMDerはどっちも買う人多いからなぁ。
Inteler:デスクトップ=Pentium4/D ノート=PentiumM
AMDer:デスクトップ=Athlon64/FX/X2 ノート=PentiumM/Turion64
AMDerはチップセットがAMD製じゃないものを使ってるせいか
『なんもかんも絶対にAMD製じゃなきゃイヤダ!』って人は少ない。
IntelerはチップセットがIntel製のものを使ってるせいか
『何がなんでもIntel製じゃなきゃイヤダ!』って人が多い。
>>30 どっちでも良い方買うならAMDerじゃなくね?
そりゃ穿った見解だなw 淫厨しかいないと言ってる様なもんだ。 INTELの製品とAMDの製品。 同じような性能なときに御贔屓のメーカーを選ぶのがお得意様というもの。 片方の性能が突出していた時は、御贔屓メーカーに関わらず選択肢を広げる。 それに対して、信者はそれ等を全て無視して常に特定メーカー品のみを購入。 信者の行動や思考は、一般人には理解不能であり背景として宗教を挙げるケースが多い。
ペニす
俺はインテルは買わねえ 仕事でPen, Cele, Xeonは使い飽きてる Coreもそのうち、イヤでも使う SPARC, POWERですら使うのに AMD, Trameta, VIAには仕事で縁がない 仕方がないから自分で買う しかし、実はXeon以外ネットバーストは 仕事で使ったことが何故かない もっとも、自分で買ってダメさは知ってるが
> 俺はインテルは買わねえ > もっとも、自分で買ってダメさは知ってるが 矛盾だらけ、真実はどっち?
>>37 これからは買わねえって意味じゃないのか?
そうかな? > 仕事でPen, Cele, Xeonは使い飽きてる > しかし、実はXeon以外ネットバーストは > 仕事で使ったことが何故かない ネットバーストのXeonは仕事で使い飽きてると翻訳すると、 そんな人が何故ダメなネットバーストを買うかなぁ? これも矛盾だ。
SIerなら当然Xeon漬けでつよ。 ちゃんとパフォーマンス分かってるお客さんはAMD選んでくるけどそう多くは無い(´・ω・`)
>>38 そういうこと
あと、仕事でXeonマシン独占してベンチ走らせたりしたことはないんで
どのくらいダメかは、自分で買ってつかった経験によって知ったわけ
Pen4マシンを個人で使わされたりすれば、イヤでも分かったろうが
以下はプレスコ除く(プレスコはINTEL自身が失敗作だと認めている) P4使ってて、ダメなCPUと判断人って少数派なんだよなぁ。 しかも、もっさりもっさりと騒いでいた奴も少数派。 HTテクノロジーにより、高画質動画の再生とCD焼きが同時に出来たのもP4。 これホントの話。
>>42 そりゃあ、Athlon64がPentium4と同等か少し上の性能しか出せていなかったからな。
これはAMDが性能を上げなかったのか、上げられなかったのかは知ったこっちゃないが、事実はそう。
いくらAthlon速ーーい!と言ったって、P4の少し上程度なんだから説得力がないわけで。
逆に、Athlonが速いことを認めると、P4もけっこう速いじゃんって話になる。
TDP120W超が出ると、100WのAthlon64は発熱が低いと言われてたのと一緒。
相対的なもんだ。
いや、Athlon64は良くできたCPUだろ? AMD社でダメなのはAthlonXPまで。 逆にINTELでダメなのはプレスコ以降のネットバースト。
45 :
MACオタ :2006/04/19(水) 22:19:26 ID:y6k4lGWX
>>44 ---------------------
AMD社でダメなのはAthlonXPまで。
--------------------
K5, K6わ値段相応に、K7, K8わ性能的にも十分良いプロセッサだと思うす。
はあ、個人的にはNorthwoodなんて糞は 二度と触りたくないんだが あんまり体感遅いんで、なんか俺がミスってて性能出てないんじゃないかと ベンチマーク走らせまくった記憶がある、しかし、ベンチだけは速かった (ちなみに当時64は出てないが、Pen4はHTT有り)
>>47 まあそうだが、俺のレスとわ全然関係ないす(笑)
Athlon64 3000+なんかは値段変わらず居座り続けたしねぇ
何時も全力疾走で高発熱なK7が良いCPUだとは思えなかったなぁ。 確かにそれ以外はそれなりに良かったが。
えらそうに言ってるが K7使ったことないだろ
AthlonXP 3000+持ってる、今も使っているよ。 熱いけどなw もうそろそろファンもヘタリ出して喧しい。
けなすわりには、いまだに使ってるのか 俺はNorthwood、速攻叩き売った もう見るのもイヤだったから
ダメというのはP4を糞と呼ぶ人と同じく誇大表現。 比べればの話であり、十分に使える。 でも熱いw
>>51 >>43 とわ全然関係ないす(笑)
発熱が限界近い64 X2が2.4-2.6GHz止まりだったせいで、安いシングルが出なくて64 3000+から移行できなかったす
>>53 中古で13000で買ったP4 2.53GHzは1年後に12000円で売れて、そのお金でAthlon買えたから感謝してる
競合製品が無い、競合製品の方が高い、 こんな状況で値下げするわけねーじゃん。 ただ安くして欲しいという願望垂れ流してるアホなわけだね。
インテルのCPUの中古価格は異常 そういや、転売目的でDellの中古Pen4鯖買ったことがあるが クーラーすらないCPUがほとんど定価に近い値段で売れた マザーも64bitPCIのおかげか妙に高く売れたし
次世代スレで中古の話か
温故知新
ネットバーストのゴミさ加減はシングルタスクしか使わない人には わからんよ。複数窓切り替えるときのいらだちといったらもう。
両方使っているが、殆ど差はないな。 誇大表現も過ぎると醜いだけだぞw
>競合製品が無い、競合製品の方が高い Celeronの価格は異常 適正価格の3倍くらいぼったくり
>>44 >AMD社でダメなのはAthlonXPまで。
ふざけんな、俺のとこでは十分今でも活躍してる
65 :
孟宗 :2006/04/20(木) 21:15:58 ID:/hhFmeU0
K7は傑作。 K8はその改良。 K6も其れなりに優秀だったと思う。 3dnow!(K6-2)やら2次キャッシュ統合(K6-3)やら。 お世話になりました。 PC-9801DAにCPUアクセラレータ(EUD-HP0M)をつけて、 Windows95を使っていたのは良い思い出です。 実はCyrix版が欲しかったのは、秘密です・・・
ペニす
68 :
孟宗 :2006/04/21(金) 18:23:06 ID:VrzaayCf
>>67 AMDなら
Athlon 64 x2 4400+ : ???
Athlon 64 3200+(754) : 仕事(汎用CAD)
Turion 64 (MT-34) : proxy&ud
使用頻度はVIA C3,C7が圧倒的に多いけど・・・
C3ではudが延々と終わらないのでTurionに変更。
>>68 ということは
intelならと書き始めればさらに2〜3台か
1台くれっ
70 :
孟宗 :2006/04/21(金) 18:34:46 ID:VrzaayCf
残念ながらIntelはmmx Pentium 266と120なlibrettoしかないっす・・・
あーー金欲しい
銀なら5枚
>Rev. Gは設計が変わるものの、各ユニットのセルブロックの比率はそれほど変化していない。 >そのため、実行ユニットを増やすといった抜本的な改革が行なわれた可能性は少ない。 >あくまでマイナーチェンジだが、Rev. Fまでのコアより刷新されたK8、それがRev. Gということになる。
>>74 つまりインテルと戦うにはAthlon64 X2 3.2GHz(TDP140W)が必要というわけか
後藤は根拠も無しに隠しだま云々書くような奴じゃないと思うから なんらかのそれっぽい情報は聞いてるけど、今はまだ書けないってことなんだろうな
ワクテカ
>75 は日本語も満足に読めないのか。 > 第3世代の歪みシリコン(Strained Silicon)トランジスタで、通常のトランジスタより > 42%増(同リーク電流の場合)のパフォーマンスを達成するという。トランジスタの > スイッチングが42%速くなり、その分、CPUの高クロック化が可能になる。あるいは、 > 同パフォーマンスなら消費電力を下げることが可能になる。
>>78 性能が上がらないならクロックを上げないと負ける、
クロックを上げると消費電力があがる。
で、Rev.Gは同クロックのFより少し消費電力が下がる。
という意味も読みとれませんか、そうですか。
Athlon64 X2 3.2GHz(TDP160W)よりは140Wの方がマシだろ
というか、「通常のトランジスタより42%増」というのがそもそも分り辛い。 今X2に使われているトランジスタは通常のトランジスタよりずっと高速なのだから、 それとの比較で表現するとどうなるのだろう?
Athlon64 X2 3.2GHz(TDP65W)
>>79 やっぱ読めないらしい。
わざわざ恥の上塗りに来なくても良いよw
現行AMDのトランジスタと普通のトランジスタとの差について資料を探すのが面倒だから MACオタを償還していいですか?
>>82 つまり、Rev.GはConroeと同等性能で同程度の消費電力を達成できるってことですね^^
こうですか?わかりません
>>83 教えて貰う以上、ちったあ敬意を持って接してもいいんじゃないか?
文体への文句は、また別の話じゃろ。
87 :
MACオタ :2006/04/24(月) 21:50:29 ID:QijDjXM+
HyperTransport 3.0の宣伝文書す。
http://www.hypertransport.org/docs/tech/ht30pres.pdf ・ACモード接続でシステム間インタコネクトをサポート
・HTX規格で拡張ボードをサポート
・最大2.6GHzのクロック, バス幅わ最大32-bitに拡張。最大バンド幅わ41.6GB/s (双方向合計)
コアでの勝負わ棚上げにして、インタコネクトで勝負をかけるつもりと見えるす。
技術革新の常として、クロック上昇が苦しくなったシリアルバスから、シリアル -> パラレルの揺り戻しが
来るのかどうかわ注目す。
トランジスタのスイッチング速度向上>>>クロック向上だよ 速いトランジスタ使っても、配線遅延とかクロック分配とか その他設計上の難しさなんかで、トランジスタの速度向上分ほどは 速くならない トランジスタ遅延とクロックが比例するんだったら ガリウム砒素CPUとか出来てるだろ
エンベンデッドクロックとか位相調整してないから クロックあげられないんだろ 富士通のPRIMEPOWERのバスだと、シングルエンド配線長60cmで 1.3Ghzも出てるから、あげようと思えば まだまだいくらでも、バスのクロックはあげられる いくらでもっつっても、5〜10Ghz程度だけど
ところで、純CMOS&ポリシリコンの終わりっていつ頃かな? ニッケルフルシリサイドとか、インジウムアンチモンって コストや集積度はどうなんだろう? まったく知りませんです
>>86 はなっから見下すのが目的で人を虫呼ばわりするような奴に敬意を示すようなバカがいるか。
クアッドコアx4個で16コアとなると、HT3.0でも足りなくなりそうだ メモリも厳しいけど それでもIntelよりは圧倒的に速いから、今後もOpteronはXeonを食い続けるだろうな
何を持って純というか知らないけど、純なCMOSなんて最初の10年くらいで終わったと思う。
FPGA設計を得意とするCeloxica社とコプロセッサ開発の米DRC Computer社が、
ハイエンド・ワークステーションに向けたAMD Opteronプロセッサを高性能化する
コプロセッサ・モジュールの提供で提携した。
両社は、「従来のソフトウエア・アクセラレーション技術に比べて、Opteronプロセッサの
性能を300倍高められる」と主張している。
両社が開発したコプロセッサ・モジュールは、Opteron用に開発されたHyperTransport
技術を搭載したインターフェースに直接接続される。これによって、低遅延での動作と
AMD OpteronプロセッサとDRCコプロセッサ間での資源の共有を可能にする。
両社によると、「目標は、並列処理やプログラマブル・ハードウエア・アーキテクチャに
よってプロセッサの負荷の軽減を試みた際に足かせとなったデータ転送のボトルネック
を解決することだ」という。
http://www.ednjapan.com/content/l_news/2006/04/26_01.html
95 :
孟宗 :2006/04/26(水) 17:11:31 ID:X9mF8FIy
>>94 既存の940でいけるなら、AM2を無視して
2xxなOpteronに転向しても良いかもしれない。
ソフトがどれほど対応するかが問題だが・・・
> プログラマーは、Celoxica社が提供する使い易いプログラミング環境を利用することで、ハードウエア・アクセラレーションの経済的および技術的な優位性をいやでも実感することになる つまりソフトの対応が不可避。 一般的じゃないな。
リコンフィギュアラブルプロセッサって クロックが低いから、汎用CPUに勝てる分野と 勝てない分野が出てくる
コプロを見越してのHyperTransport 3.0化か…
>>98 帯域の問題から、コプロなしでもHT3.0の移行は必須だろ
ただ、CPU以外にもCCを開放して
コプロが装着できるようにした、と
このコプロ後々でいいから5マソ〜10マソ位で出てくれないかな・・ エンコやらレンダやら何かと役に立ちそう。ってかコレ積んだらPC1台でなんでも 出来そうなキガス
対応アプリケーションが、メモ帳だけだったりしてな!
メモ帳が300倍に加速するのか!?スゲェな!!
106 :
孟宗 :2006/04/28(金) 19:20:20 ID:u8zq2+tA
940でOKのようですな・・・ 自作市場には出回らんだろうけど。 OSはlinuxか。 やはり技術者向けね。
●●●●●●●●●●●●●●●●●●●●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● __( "''''''::::. ● ● ● ● ____,,,,,,---'''''''"""" ヽ ゛゛:ヽ ● ● ● ●:"""" ・ ・ . \::. 丿エ〜デルワ〜イス エ〜デルワ〜イス ● ● ● ●::: ・......::::::::::::彡''ヘ::::....ノ ● ● ::::::::::;;;;;,,---""" ●●●●●
conroeにかてるんかなー
65nmになれば多少はやり合えるっしょ それまで待機
65nmになっても全然無理。 ちょっと悲しくなる事実・・・
やっぱ増産で値段が下がるのかね。 しばらく買い控えしようかな
コンローが出る前にfabが完成していれば良かったのに
113 :
MACオタ :2006/05/03(水) 14:16:25 ID:nA89gB59
後藤氏のAMD次世代ネタす。
http://pc.watch.impress.co.jp/docs/2006/0503/kaigai267.htm 正直、この辺わ3ヶ月古いネタだと思うすけど、技術的内容を理解していない文系ライターさんとしてわ
仕方が無いことなのかもしれないす。
------------------------------
そして、おそらくはCPU開発の方向性もかなり変えている。AMDの最近のCPUアーキテクチャ関係の
プレゼンテーションでは、強調されるポイントがCPUコアのマイクロアーキテクチャの拡張から、それ
以外の部分へと広がっている。下のスライドがそれを象徴している。
[中略]
そして、AMDはこのところ、コプロセッサや特定用途向けのアクセラレータの可能性について言及する
ことが多くなっている。下は、2005年11月のMicro-38カンファレンスでAMDのChuck Moore氏
(AMD Senior Fellow)が行なったプレゼンテーションの一部だ。こうした動きを見ると、AMDが特定用途
向けのコプロセッサやアクセラレータとその統合を真剣に考えていることがよくわかる。
将来のAMD CPUのアーキテクチャはかなり今とは違った姿になる可能性がある。
------------------------------
お得意のリークネタ系でわ、デスクトップへの4-coreの投入が2008年になるということで、Kentsfiledから1年
遅れす。アム虫の「Kentsfieldわくっつけただけ!」ってFUDに一年間悩まされることになりそうす。。。
------------------------------
2008年にはデスクトップ向けのクアッドコア「Greyhound(グレイハウンド=Athlon 64 X4?)」も投入する見込みだ。
------------------------------
114 :
MACオタ :2006/05/03(水) 14:39:37 ID:nA89gB59
今の時期に比較対象としてNetBurstを出してくるのは正直アレよな。 逆HyperThreadingには興味あるけど、その話題ねーし
116 :
孟宗 :2006/05/03(水) 19:07:25 ID:h8NmpQqf
コプロがキーとなるなAMD。
技術的内容を理解していない文系=MACオタ
118 :
MACオタ :2006/05/04(木) 11:38:21 ID:C0eJjBUs
後藤氏の見たロードマップ図のソースをhkepcが出してきたす。つーか後藤氏も推測まじりの記事わ止めて
どこまでがソースの情報か判るように、ソースがある話わ、プレゼンをそのままアップして欲しいものす。
http://www.hkepc.com/bbs/news.php?tid=593736 阿呆なのわ、共有L2世代の後に「共有L3」なんて書いていることす。共有L2の下の階層に非共有
L3を置く理由わ皆無すから。。。
まあプレゼンに付いてわ宣伝文書すから許容するとして、卑しくも技術分野のライターを名乗るヒトが、内容を
そのまま引き写しで記事にするのわ呆れるばかりす。
後藤氏が記事を書くと推測で hkepcが出所不明のロードマップを載せるとソースですか?
> 共有L2の下の階層に非共有L3を置く理由わ皆無すから だわなw
>>118 >ZamoraではL3キャッシュを共有すると言われている。そのため、おそらくL2はコア毎に
>独立して備え、L3だけを共有するアーキテクチャになると推定される。
これの事か?
>>121 > 興味深いことに、AMDはDeerhoundではL3だけが共有になるとは言っていないらしい。
> そのため、DeerhoundではL2キャッシュも共有にして、全体のキャッシュ量を節約した可能性もある。
このことだろ?
バカな発言でしかない。
またMACオタとその小判鮫が現れたか。 一行で済むところを執拗に叩くあたりがIntel信者の下劣さをよく現している。
L2共有が前提条件の場合、L3が共有か否かを議論したら確かに アホだが、後藤氏の記事の方は、そうじゃないだろ。 L3共有が前提条件で、L2が共有になるかもという話の流れなん だから、別にどこもおかしくない。 Intel次世代スレで、無知をさんざん指摘されたから、こっちの スレでアイデンティティの回復を図ってるのかな。そのあげくに 勝手に誤読して勝手に馬鹿にするって、本物の馬鹿ですなあ。
MACオタのカキコをコピペするのやめてくれ。透明連鎖あぼんしてる意味がないじゃないか。
(後藤) 07推測1 L2非共有 L3非共有 07可能性 L2共有 L3非共有 08推測 L2非共有 L3共有 07可能性から08推測に移行する可能性を許容している のは、おかしいと言えばおかしい。 (HKEPC) 07 L2共有 L3記載がないから非搭載と思ってるはず 08 L2記載はないが共有と思っているはず L3共有
訂正 07は両方ともL3共有でした。
> 訂正 > 07は両方ともL3共有でした。 だろ。だから、全然おかしくない。 どうやったら、そういうMacヲタみたいな誤読ができるんだ? Macヲタは、自身の偏見と矛盾する記述は、誤読するか間違いと 決めつけるかしかできない可哀想な奴だから、まあ仕方ないが。
>>128 L2共有をL2非共有に1年で戻す可能性があるとしているところが
おかしくない?
それはMacヲタの指摘とは別の話だな。 共有と非共有のどちらが優れているかは、アプリケーションの 種類に依存していて、必ずしもどちらがよいとは言えない筈。 各コアで同じアプリケーションが走るならもちろん共有キャッシュ の方が良いが、全く異なるアプリケーションが走る場合、特に あるのアプリケーションのワーキングセットが大きく、キャッシュ をひどく占有してしまう場合など、非共有の方が良いこともある。 だから、必ずしもおかしいとは言えないと思うがどう?
>>126 結局のところ、どこまでが情報でどこからが(怪しい)推測なのか明確になっていないのが問題す。
参考までに(あまり編者の推測が入ってないと思われる)HKEPC記事の翻訳を書いておくす。
-------------------------
台湾の流通筋のソースは、最近AMDがプロセッサロードマップを更新したことを伝えている。情報に
よれば、AMDはOpteronラインに数種の4コアプロセッサのリリースを計画している。
まず、2007年第2四半期にコードネーム"Deerhound"と呼ばれる65nm、Socket F (LGA 1207パッケージ)
のチップがリリース予定である。Deerfieldはデュアルチャンネル・レジスタードDDR2メモリをサポートする
メモリコントローラを内蔵し、AMDとしては初の共有L2キャッシュを実装する。
一方デスクトップ用の4コアプロセッサは2008年第1四半期以降になる。デスクトップ版4コアはコード
ネーム"Greyhound"と呼ばれ、マイクロアーキテクチャの改良と共にDDR2およびDDR3メモリをサポート
したSocket AM3対応となる。GreyhoundはDeerhound同様に共有L2を実装し、インタコネクトはHyper-
Transport 3に移行する。
2008年中期には第2世代の4コアOpteronのリリースが計画されている。"Zamora"というコードネーム
の新コアを搭載したこのプロセッサは、FB-DIMM、Hyper Transport 3と共に、AMD初の共有L3を採用すると
伝えられる。
-------------------------
俺はそんなことより、人の文章を誤読しておいて、その誤読を根拠に 人を馬鹿にする姿勢の方が問題だと思うよ。まあ、昨日も今日もそう いう間違いを続けてるわけで、一生直らないんだろうけどさ。
>>130 だね
+大容量キャッシュはレイテンシ大きくなる方向
>>132 引くに引けなくなったあがきを生温かく見守らない?
見守らない。ぶっちゃけマジ自作板から消えて欲しい。 ペニスの書き込み増えてから無駄レスばっか。
>>134 お前は自分の家の玄関先に野糞をされても生暖かく見守るのか
あっちこち見てるけんど ここまで普通に嫌われてるコテハンも珍しいな
なぁ 暖かく見守ると言わず 生暖かく見守ると言ってるんだから そんなに責めなくてもいいじゃない
コテハンな時点で自己顕著の強い構ってチャンだから仕方ないだろ ν即とかvipじゃねーんだからコテる意味がわからん
それ言ったらどこの板でもコテハンいらね
以前排他だと共有に出来ないとか言ってるのがあったけど 共有L2にするということは排他もやめるって事になるのか?
>>130 ,133
AMDの共有キャッシュにはスマートキャッシュに該当するような
機能は付けてないというか、思いつきもしなかったので当分付かないってこと?
MACオタは一時期PCゲー板に居た、にょんさん並の精神異常者
144 :
MACオタ :2006/05/04(木) 23:15:10 ID:C0eJjBUs
>>113 や
>>118 の記事のように、AMDが4-coreのデスクトップ版をリリースするのわIntelから1年遅れになる
と見られているすけど、この理由として一般向けレビューサイトで取り上げられるゲームベンチ等でデュアル
コア製品と差が出ないという話が出ているす。
一例として、AnandTechのライター、Johan de GelasのAcesHardware掲示板の投稿を引用す。
http://www.aceshardware.com/forums/read_post.jsp?id=115163394&forumid=1 ------------------------
And what are the uses of third and fourth core of Kentsfield on the desktop? Right now, even
the most advanced game engines in development make only use of two CPUs. (If there is an
exception, tell me)
------------------------
新技術の牽引役わIntelにまかせて、おいしい所だけいただこうというのわ、いかにもAMDらしいやり方すけど。。。
>>140 まあそうとも言う
業物タンとか無臭コテならいいんだけど悪臭するのが大杉なんだよ^^;;;
>>144 > 新技術の牽引役わIntelにまかせて、おいしい所だけいただこうというのわ、いかにもAMDらしいやり方すけど
Microsoftのサポートが欲しいためにEM64TなどというAMD64互換の命令を搭載したIntelと大差ないね。
ニュースソースを貼り付けてくれるのは有り難いが、去りぎわに小便をまき散らすのはいい加減やめて
欲しいな。臭うんで。
そんなにintelを持ち上げたいんだったら、Intelスレでやってきたら?
>>142 Smart Cache も万能じゃない。
その証拠に、Intel も Montecito では分離キャッシュにしてるよ。
>>118 > つーか後藤氏も推測まじりの記事わ止めて
> どこまでがソースの情報か判るように、ソースがある話わ、プレゼンをそのままアップして欲しいものす。
推測があるから記事としての意味があるのでは?
だから後藤さんの記事には当たりもあるけど外れもある。
それが彼の記事の魅力でしょ。単なるコピペライターではない証拠かと。
非公開情報に関しては、公開されていない限りソースは普通書けないでしょう。
hkepcも情報元がハッキリしていないし同じレベルでしょ。
というか、後藤氏がバカなだけなのだが・・・ どうも彼は、AMDを無意味に擁護する立場を取っているようで論客としては失格。
強引にintel擁護するやつらよりマシ。
マシではなく同類が正しい。 そろそろ認識を改めたら如何だ?
>>151 どのあたりがバカで、どのあたりが擁護?
後藤さんの興味は擁護とかではく、ただ半導体的に
おもろければOK!というところかと。だからアグレッシブな
戦略を採るところの記事が多くなり擁護と見えるのでは。
今回の記事が擁護に見えるのは、それだけAMDが興味深い
戦略を採ってきているからかと思います。
>>153 かなり違う。独占寡占の防止、競争促進からも2番手以降を応援するのは別におかしくない。
intelユーザーもAMDのがんばりのおかげでかなりのメリット得てるわけで、感謝すべき。
K8の何処が面白いのだ? あんな古ぼけた設計等普通に興味は沸かないだろ? マルチコアになったときも非共有キャッシュであるデメリットには一切触れず何が真のマルチコア? 笑わすなと言いたい。 AMDも今頃になって共有キャッシュ化を必死に模索しているのが良い証拠だろう。
> 独占寡占の防止、競争促進からも2番手以降を応援するのは別におかしくない。 アホか? 市場を故意にコントロールしょうとするのは共産党だけでいい、計画経済が失敗したのは管理出来ると思っていた傲慢さが原因。 良いものはよく、悪いものはわるいと素直に反応するのが一番であることを知れ。
なら共有FSB使ってMCM化したintelはもっと笑えるな。
>>158 そうそう、それは笑っていいところ。
INTELだからとかで擁護する必要は何処にもない。
>>157 はい、そのようにご自分でどうぞ。
いいかげんintelスレで同類となめあってろ。
独占寡占の防止、競争促進の為に2番手を応援するのは当たり前と思っている奴の思考。 2番手を擁護し応援することで、競争が促進され・・・・ これ真っ赤な嘘。 実力を伴わぬものを応援すると、そいつは胡坐を掻いて怠けるだけ。 そこには真っ当な競争原理は働かず、歪んだ結果にしかならない。 自然淘汰されるのも結構、2番手以降が実力でシェアを伸ばすのも結構。 国はその状況を監視し、競争原理が働かず長期に停滞している業種にのみ促進政策を施工すればよい。 短期的な独占は放置が基本だ。
この場合現実にメリット多い。 今度はIntelがいいもの用意してるようだから、AMDがんばらないとねって至極普通な話。
ID:ct2TUeWd=MACオタも普通の言葉が書けるんだなと素直に感心した
AMDがガンバレば良いのであって、それを応援する必要は何処にもない。 AMDから良いものが出れば、それを公正に評価しシェアに拘らず買えばよいだけ。 それは応援とは言わない。 AMDが好きだから応援する・・・これは問題ない。 AMDの品物が気に入ったから購入する・・・これも問題ない。 AMDの品物は良いから買う・・・これもまた無問題。 AMDが2番手でINTELの独占に対抗する為に応援する・・・これが問題・・・大きなお世話であるw
>>164 > AMDが2番手でINTELの独占に対抗する為に応援する・・・これが問題・・・大きなお世話であるw
藻前の言ってる事も大きなお世話だな。
他人がどう思って何を応援しようが勝手だろw
いいや違う。 自由経済を脅かす思想を放置するのは良くない。 そいつ等が個人で勝手に間違った思考をしているのは構わぬが、広報され煽動されるのは困る。 もちろん、そいつ等はバカだから自身の思考が間違っていることにすら気付かず正しい行為だと思っているから余計に始末が悪い。 ちゃんと、間違っていることを諭してやるのは俺様のような真っ当な大人の義務だよw
>>166 ちょwwww深夜から爆笑させんなwwww
ノーパソにコーヒー吹っ掛けるところだったぞ、コノヤロウwww
168 :
Socket774 :2006/05/05(金) 04:21:50 ID:xyqEl9+0
>>166 独占禁止法がなぜあるか考えた事あるか?
だいたい、その点INTELは前科ものだしな
自由経済を驚かす思想?
笑止千万
カナシイくらいに、お前、頭悪すぎるよ
ID:ct2TUeWd=雑音
>>168 監督権は国に存在する。
お前等個人が幼稚な思考と判断でそれを真似る必要は何処にもない。
独占状況であることが即悪ということではない、独占化で競争原理が働かず衰退することが問題なのであり、
その観点を見失わず管理監督のが国の仕事だ。
よって、その発動は慎重であるべきで、独占化で競争原理が働かず衰退することを見極める必要がある。
自由経済での独占はありえるのであり、それだけ独占した企業こそが真っ当に強者であっただけのことだ。
もちろん、その結果自由経済に悪影響を及ぼすと判断されれば、独占状況を緩和する政策が取られ分社化される。
これ等は権力を持たぬものが権力に嫉妬し反発するというような、愚かな思考で為されるものではないことも知っておいてくれ。
>>169 __,. -─-- 、_
, - ' _,´ --──‐- )
,イ´__-___,. -‐ '__,. - '´
`ー----, - ' ´ ̄ `` 、__
__,ィ ヽ. `ヽ.
, '⌒Y / 、ヽ ヽ ヽ.
/ / i /l/|_ハ li l i li ハ
. // 〃 /l i|j_,.//‐'/ lTト l、l j N i |
{イ l / l li //___ リ_lノ lル' lハ. ソ ___◎_r‐ロユ
i| /レ/l l l v'´ ̄ , ´ ̄`イ !| ll,ハ └─‐┐ナ┐┌┘ _ ヘ____
ハ| ll∧ハヽ ト、 '''' r==┐ '''' /l jハ| ll ll /./┌┘└┬┘└┼────┘ロコ┌i
〃 ‖ レ'¨´ヽiへ. _ 、__,ノ ,.イ/|/ ノ ll l| </  ̄L.l ̄ ̄L.lL.! ┌┘|
ll ll { ⌒ヽ_/ } ー‐<.__ ′ l| ‖
‖ ‖ ヽ, /、 〈 |:::::::| `ヽ ‖
‖ {. ハ ヽ Y`‐┴、::::v l ‖
‖ |iヽ{ ヽ_ゾノ‐一’::::ヽ. | ‖
‖ |i:::::`¨´-- :::......:...:.:.::.}| ‖
‖ |i::::::ヽ._:::_:::::::::::::::::::_ノ | ‖
‖ |i::::::::::::i___:::::::::::/ |
jj::::::::r┴-- `ー‐ '⌒ |
〃:::::::マ二 _,ノ
//::::::::::::i ー 一 '´ ̄::.
,','::::::::::::::i::::::::::::::::::::::i::::::ヽ
172 :
Socket774 :2006/05/05(金) 04:54:24 ID:xyqEl9+0
>>170 監督うんぬんは、国民の代わりに国が行うだけの話だろ
実際に不利益を被るのは消費者だ
消費者がどんな理由であれメーカの選択を行うのが悪いことか?
INTELは日本だけじゃなく各国で問題を起こしているよな?
第一、権力を持つ持たないなんて、CPU買うのに考えるわけないだろ
お前の思考の方が、権力に嫉妬し、媚びを売っているように見えるがね?私には
知識ひけらかしたいのはわかったから、痛すぎるお前の存在をなんとかしてくれ
>>172 まるで魔女狩りだなw
暴動を起こし国や地域を混乱させる奴の言い分と良く似ている。
ルールなんて不要で、俺の言っていることは絶対ですか?
お前の状況分析や情報収集能力がどれほどのものなのかと・・・
そこ等に転がっている、誰でもが知ってる本当か嘘かさせ分らぬ情報で
そこまで言い切れる奴って見てて怖いよ。
まず、冷静さに欠け、知的でもない、思い込みが激しく、煽動され易い。
>>173 そっくりそのまま自分への批判になってないか・・・?
後藤氏の情報が遅いのは、常に複数のソースで裏付けを取るから。 情報の入手自体はそれほど遅くないでしょ。 記事に推測が多いってのも、本当に後藤氏の推測もあれば、情報は 入手してるけど情報提供者がわからないようにあえて自分の推測と 記事に書いてる場合もある。 ここら辺はケチをつけるようなとこじゃない。
ID:ct2TUeWdよ。これ以上はVSスレででもやってくれ。
>>173 まず、冷静さに欠け、知的でもない、思い込みが激しく、火病り易い。
まで読んだ
ま ん ま 雑 音 じ ゃ ん
178 :
Socket774 :2006/05/05(金) 08:53:56 ID:5rVkvke8
なぁ、K8のどこらへんが古い設計なの?L2非共有でもコア内で超高速接続されてる K8なら古めかしいFSB通らなくても済むからある特定のベンチ以外はそんなに足を引 っ張る事無いと思うんだが。それに分岐命令予測はコンロなんか比べ物にならない程 いい物が付いてるよ。 前にも書いたが、K8は最悪下の条件で遅くなりにくい設計だと思う。コンロとみたく ベンチが早いCPUとは設計思想自体全く違うんだけどな。 (デスクトップやノートで使う場合はコンロの様な設計思想の方がいいけどねw)
まあ、いいまでアム虫はほかのIntelスレに出張してまで、
AthlonやOpteronの過剰な宣伝を行って迷惑かけてきたわけだから、
責任もって一生AMD製品を買い続けるべきだよな。発言に責任なさ過ぎ。
よいと思ったものがよいとかわざわざいってるやつの大半は元アム虫なんだろ?
>>179 のような思いこみが肝心。
181 :
Socket774 :2006/05/05(金) 13:15:38 ID:l8RGFuIy
まあ現状のメニイコアの流れを作ったAMDはさすがいいとこ見てる。 64ビットチップもそうだがAMDの時代の流れの先を見ぬく力は今のところ鋭い。 インテルはその流れに後から乗っていいものを作ろうとしてる感があるが、 別にそれでもいいものが出来るならそれはそれで構わないと思う。 今のAMDは少しいいもの(Opteron/Athlon64系)を作りすぎた現在、ここからどう進むか、 まだ公表してないところを見ると、これから少しの間は大きな流れの変化はないのかな。
漏れが元気のないアム虫のために、今後の妄想の指針を整理してやったぞ。 ・コア性能で圧倒的大差で負けていても、共有FSB < HyperTransportだからAMDの方がよい ・デスクトップ、ノートでは負けても自作では使えないMP錆ではOpteronの方が有利 ・例え殆ど全てのベンチマークで負けていても、数字では直接ユーザーに見えないところで実は勝っている ・CPU開発は所詮いたちごっこ。AMDの次世代マイクロアーキは当分先のはずだが、 AMDならK8の改良でCoreを一年ですぐに抜いてくれる ・マルチコアに先に目をつけたのはAMD。たとえIntelがメニィコアを実現してもそれはAMDのおかげだ。 ・EM64Tは所詮AMDの技術。いくらIntelが性能で勝っても、パクりなのだからAMDの勝利だ。
>>180 んじゃ売り言葉に買い言葉って奴でw
K6時代 ヒートスプレッダってアフォじゃね?あんないらんもん付けるなよ!熱こもるだけじゃん
K7時代 ヒートスプレッダも付いてないCPUって不良品だよな!コア欠けするぞ〜!
K8時代 不安定!不安定!
K8-X2時代 (インテルデヴェロッパフォーラムのベンチ見て)X2熱いし遅いし最悪!
あとさ、HTT実装でAMD死亡とかプレスコでAMD死亡とかヨナでAMD死亡って言ってた 香具師らどこいった?どこが死んでるのか説明してくれ! んでなんだっけ?コンロ?アレ出れば今度こそ死亡するの?(pgr
>>182 MMX P5, K6とかの時代のヒートスプレッダ(単なる板)と
Pen4, K8時代のヒートスプレッダではまるでちがうよ。
ヒートスプレッダの構造も奥が深いから、よくしらべてね。
あと、コア欠けうんぬんさわいでるのば自作erだけなわけで、
IntelやAMDが自作房の都合でパッケージング選択してる訳じゃないから。
>>185 まるで違うって・・・w
殻割りすればそんなどっかのサイトに書いてある事鵜呑みにしないぞw
若干違うがそれ程違わない。
殻割りじゃヒートスプレッダの構造はわからんだろ…。
http://www.ipros.jp/products/142588007/ ヒートスプレッダにもグレードがあってCPU熱量に応じてパッケージングもきちんと計算されて
選定されているわけ。
単に板はさめりゃ熱が拡散してコアかけしないよね、いやいやフリップチップの方がコア欠けしても放熱には
有利だろなどという自作厨房レベルの一元的な選択をやってるわけじゃないだろが。
>>175 --------------------
情報の入手自体はそれほど遅くないでしょ。
--------------------
ほぼ同時にHKEPCから同じネタが出てきちゃったってことから、同じソースを見て喜び勇んで記事書いちゃった
という推測のほうが自然かと思うす。長いこと情報を検討していたとも思えないすね。。。
スレと関係なさそうな話題が多い上に リポートしてるやつの評論まで入って さらに評論してるやつの評論まで入って 何このスレ・・・・・
取り合えずMACオタのと論議する気無いから消えろ!
>>187 んじゃK8や北森のスプレッダがどんなグレードなの?
K6のスプレッダじゃ駄目な理由は?
実際北森にでもK6のスプレッダ付けて試してみ?
>
http://pc7.2ch.net/test/read.cgi/jisaku/1146411194/4 > Conroe E6500 2.40GHz dual 2MB FSB1066MHz TDP 65W '06Q4 $269 (Athlon64 X2 2.88GHz相当)
> Conroe E6100 1.33GHz dual 2MB FSB1066MHz TDP 35W '07Q1 $149 (Athlon64 X2 1.60GHz相当)
Conroeが発売されるとAMDのFXやX2は一部新製品を除き$269〜$149のレンジに押し込められてしまうだけど・・・
どうするの?
このままだと商売が立ち行かなくなるだろう?
k8は、メモリのプリフェチが弱かったり、投機ロードに対応してないのが 弱点だろ コアを拡張して、対応するのは難しくないと思うのだが
>>194 もし受け売りなら原典を示すのが礼儀というモノす。
http://www.anandtech.com/cpuchipsets/showdoc.aspx?i=2748&p=6 ---------------------------
Finally, there is also a lot of headroom for increasing integer performance. The fact that Loads
can hardly be reordered has been a known weak point since the early K7 days. In fact, we know
that engineers at AMD were well aware of it then, and it is surprising that AMD didn't really fix
this in the K8 architecture. Allowing a much more flexible reordering of Loads - even without
memory disambiguation - would give a very healthy boost to IPC (5% and more). It is one of the
main reasons why the P-M can beat the Athlon 64 clock-for-clock in certain applications.
Those are just a few examples that are well known. It is very likely that there are numerous
other possible improvements that could take the K8 architecture much further.
---------------------------
197 :
MACオタ :2006/05/05(金) 18:19:20 ID:eXdYaDf3
>>196 (この日本語訳とやらが機械翻訳だったら大笑いすね。。。)
>>196 概観語るだけのページはあんま意味ないす
>>182 は雑音論理をまんまAMDにすりかえただけじゃんな。
ほんと雑音乙だ。
いいものが安く買えればそれで十分な話なのに。
実際に物が流通してくればまた状況は変わってくるんだろうけどな。
>>200 これ、"audio broadcast"だけなんすかね?
明日朝の報道を読んだ方がプレゼン画面とかの資料が見られて効率が良いかも。。。
>>189 記事の初出日時は、後藤>Hkepc。表の詳しさは後藤>Hkepc。
なので、台湾の流通筋とはMr.Gの可能性もある(笑)
ま、お互い推測にすぎませんが。
>>202 ブロックダイアグラムレベルでは、ConroeとYonahに差はないでつね。
無茶苦茶マッシヴになってるけど基本は同じだな
128bitSSEを搭載していないのは物足りないが、素性のよさは伺えるな > Yonah
age
AMDの成分解析結果 : AMDの47%は見栄で出来ています。 AMDの41%は赤い何かで出来ています。 AMDの11%は罠で出来ています。 AMDの1%は着色料で出来ています。 >AMDの47%は見栄で出来ています。 >AMDの47%は見栄で出来ています。 >AMDの47%は見栄で出来ています。 >AMDの47%は見栄で出来ています。 >AMDの47%は見栄で出来ています。 >AMDの47%は見栄で出来ています。 >AMDの47%は見栄で出来ています。 >AMDの47%は見栄で出来ています。
HPCでコプロが流行の兆し
特定用途向けのエンコード/レンダリングアクセラレータみたいなのも確かに面白いかな。
統合化の流れの真逆を行く発想だしな 本当にごく一部でしか需要はないと思う
汎用機を作るより、専門機を作った方がいいっていうのが 自作板のスタンスな気がするから、自作板では需要があると思う。 満遍なくそれなりに出来るヤツも必要だが→メインPC それしか出来なくても、最強ならそいつも欲しいってことだな。→専用PC
俺もコプロ賛成派だぬ。 充実したライブラリ付きで5マソ位ならマジ欲しい。
自宅でスパコンもどきw
Opteron with AltiVec.
パーソナルエンタープライズってすげぇなっ!
来年あたりまたAMDの株の買い時がくるかな〜ワクワク
コンロ出てAMD押されると株下がるから そのとき買って、大復活するまで取っておけば大もうけできると思う 大復活すれば、だけど・・・
Opteron with Cell co-processor.
>>217 欲しいけど、どう見てもCore 2 with AltiVecの方が速い
ここは淫儲の宣伝スレですから(FUD含む)
AltiVecもSSEもほとんど変わんないよ
性能では AltiVec>>>>SSE それぞれの進化を発揮できる開発者の数 SSE>>>>>>>>>AltiVec 特に使える人間の数が全然違う。 ところで65nmのK8ってクロックどの程度まで上げる予定なんだ?
228 :
MACオタ :2006/05/12(金) 06:51:37 ID:V/MW2ORI
TheInquirerの怪しげな情報す。
http://www.theinquirer.net/?article=31649 ・3Q07予定の"Deerhound" Opteron (K8L, 4-core)の共有L3わ、たったの2MB (L2わ、相変わらず1MB)。
・2008年半ばに予定されている"Cerberus" Opteron 8xxのL3わ6MBに増量。2.4GHzのHT 3.0リンクと
DDR3メモリコントローラ内蔵。同時期の2xxモデルの"Wolfhound"わ、あいかわらず2MB L3。
HTについてわ、19.2GB/s/linkとのことなので16-bit幅のまますか。。。
TheINQわ、この異常に少ないL3の理由を、
1. コア間のコヒレンシ維持用のクロスバーを簡略化して、L3に書き戻してコヒレンシを保つ
2. またexclusiveキャッシュ。。。
と推測しているす。
可能性を付け加えれば、8-socketを越える超MP構成のためのディレクトリ格納用として使用して、本格的
なccNuma化するという可能性もあるかと思うす。
また排他キャッシュか CCのディレクトリに使われるのは間違いないだろうな やっとK8 32wayとかの登場か?
SUNの要望は反映されているのか?
Newisys
SUNはccNUMAじゃ最高性能が延びないからCOMAにしたんだっけ?今はどうなってる?
Cellプロセッサ=高性能 と盲目的に信じ込んでいる馬鹿が多くて萎え萎えなわけだが。 Cellは特定用途「専用」に使うには高性能だが、汎用性は皆無 といっていぞ。
何故AMDスレで突然力説し始めたのかわかる人は挙手
ノシ POWERみたいな糞をベースにしたばっかりにCellもPS3もSonyもオワタw AMDもあぁはなりたくないものだな、というねらー深夜の主張。
>>235 ノ
CPUを語るスレ(正式名称忘れた)に誤爆したと見た
>>234 今年はデュアルコアの時代になる!とワクテカしてたAMD(Intel)ファンが8コアにびびってしまったのは確定的にあきらか。
発表の時点でCellがどんなものかわかってたはずなのになw
GKきたー
Gates Killer
AMD 65nm Processors in December 2006
http://www.vr-zone.com/?i=3643 Rev.GはRev.Fと同じモデルナンバという事で性能は同じ、
全般的な設計変更というのは省電力化と高クロック化?のみっぽい。
FX64-3Gデュアルが90nmでTDP125W。
現行FX60の2.6GがTDP110WなのがRev.Fでは2.6G-1MBx2、2.8-512x2までTDP89W。
Rev.Fでは2〜3割程度省電力になってる模様。
>>236 RISCの得手不得手を理解しとらんな。
CellのようなRISCの方がコアを増やす恩恵を受けやすい。
要はコンパイラ、及び分散処理に適した言語。
ただし、AMDは、別口の方向に行くだろう。
キミ達がナニを話しているのかサッパリだよ ようはCELL最高ってことでしょ?
「Rev.G」が何をさすか、またその党y常時来はいつか、ソースによってまだばらばらな印象があるな。
後藤氏の記事では2007年前半に出てくる65nmのK8改良版として扱っていたが、
>>241 では何か違うような気がしなくもない。
このVRの記事のRev.G=65nm K8改良Ver.なのか、
あるいは後藤氏の言う65nm K8改良Ver.の前にRev,Fの単純シュリンクVer.がRev.Gとして出てくるのか・・・。
×党y常時来→○登場時期
>>244 モデルナンバー変更なしだから、単純シュリンクバージョンだとしか思えない
Rev.Gにもいろいろあるんじゃねーの
こりゃRev.Hまで様子見かな…
249 :
Socket774 :2006/05/17(水) 03:08:14 ID:9yWiKZy8
ところでいつになったら9800円時代くるの? 俺3年も待ってるんだがいつまで待てばいいの? 豚2500+から乗り換えられないどうしよう
250 :
Socket774 :2006/05/17(水) 03:40:09 ID:43Dnojr/
まあ僕はIBMの位置にAMDがいたならCellをマンセーしてるがな。 AMDとSCEとSONYとTOSHIBAは最高ってさ。 まあ現実にそんな事はないんだが。
SPEはプログラムをローカルストアに格納するんで、MPEGデコーダ とか、専用の用途に1個ずつSPEを割り当てるような使い方をすれば 多少は性能上がるかもしれんがな。 SPEリソースの奪い合いが発生するような使い方をすると、それほど 性能は出ない。Cellに夢みすぎだ。
世のプログラマーの8割は頭悪いんで そういう人たちでも性能出るようにしないと絶対普及しません
たちが悪いのは、頭の悪いプログラマーに限って自分は頭が良いと思っている事です
全然プログラマーに限った話じゃないじゃん
雑音とか503の話かと思った。
CELLをSocket940に挿して使える様にすれば、共存共栄でマンセーでわ?
263 :
MACオタ :2006/05/17(水) 19:14:51 ID:re/vyxri
今日わ朝からSPFの話題でもちきりかと思いきや、昼過ぎまで煽り合いの挙句(
>>249-256 )、講演者の
インタビューと最も良質のプレゼン画像が掲載されたTechONの記事を蔑ろにしてCNETの記事を
もてはやす輩(
>>258 )、仕舞にはHammer-Info(
>>262 )すか。。。
虫の馬鹿っぷりに改めて脱力したすけど、もう少し元気が出たら今日の話について少し書くす。
↓以下、いつもの展開が楽しみす。
Q.「うってかわって」を使って、短文を作りなさい A. ∩ | | | | ∧_∧ | | / ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ( ´Д`)// < MACオタは麻薬をうってかわってしまった / / \____________ / /| / __| | .| | \  ̄ ̄ ̄ ̄ ̄ ̄ ̄\ ||\ \ ||\|| ̄ ̄ ̄ ̄ ̄ ̄ ̄|| ̄ || || ̄ ̄ ̄ ̄ ̄ ̄ ̄|| .|| ||
266 :
MACオタ :2006/05/17(水) 22:05:32 ID:re/vyxri
さて、PenD805をデュアルコアCeleronと呼んでいた連中が、QuadCore Sermpronをなんと評価するか。
普通にQuadCore-K8なんでね? NetBurstほどL2の影響でかくないし
上の書き込み,次のように読み替えて欲しいす。 更に高密度を実現→更に高密度「のSRAM」を実現 さて, ご自慢の「FPU2倍」の件も,結局, ------------------- Up to 4DP FLOPS/cycle ------------------- 程度としょせんSIMDレベルの話だったことが明らかになったす。周知の通り,Intel Core アーキテクチャわ既にSSE2浮動小数点演算ユニットを2つ備え,同様に4DP FLOPS/cycleが 可能す。
次世代型競合回避手法として Transactional Memory データベース技術の応用としてTransactional Memoryを研究中 トランザクションを持つことで、競合を回避する手法。 共有部の更新を逐次ロックを行わずに行うと、ロック解除待ち時間を短縮できる。 この場合、同一メモリを同時更新した場合の競合の回避策としてトランザクション(更新履歴)が使われ 該当部に付いてはロールバックされトランザクションより再更新される仕組みだ。 INTEL > 複数のCPUコアがメモリ空間を共有する際に起こるデータの競合はどのように回避するつもりか。 > Intel社はマルチスレッドのプログラムなどを開発するときに,スレッド間で共有するメモリ空間を逐一ロックしなくて済む, > Transactional Memoryの採用を想定しているようだが。 AMD > Moore氏 Transactional Memoryはとても興味深いと思っている。我々も研究中だ。ロックの問題は, > プログラマにとって深刻だと認識しているからね。
TechOnのプレゼンを良く見れば判るように,公開されたダイのレイアウトも写真じゃなくて レイアウト「図」のレベルす。つまり現時点で完成したチップわ存在していないことも明らかす。 結局, ・L2わ1/4-1/2 ・FPUもIntel Coreアーキテクチャと比較して特に大きなメリットわ無し ・命令スロットの増加も無し という訳で,シングルスレッド性能がCoreと比較して上がる見込みが見えてこないす。 この状況で, -------------------------------- 単に簡素化すればいいわけではない。単純にしすぎて既存のアプリケーション・ソフト ウエアの処理性能が犠牲になれば,ユーザーにそっぽを向かれてしまう。 -------------------------------- なんてことを言い切るAMDのアーキテクトにわ,何か隠し球があるすかね?
> 単に簡素化すればいいわけではない。単純にしすぎて既存のアプリケーション・ソフト > ウエアの処理性能が犠牲になれば,ユーザーにそっぽを向かれてしまう。 これ単なる言い訳だよ。 L1/L2排他キャッシュ構造を捨て、INTELのような高性能共有キャッシュを開発する能力がない結果の言い訳だ。 L2を小さくしL3共有キャッシュへ全てを賭けるというか、それしかないと言うべきか・・・ L3共有キャッシュのINTELのL2共有キャッシュとは異なり、異なるラインプロック毎に同時アクセスを許す方式にかならんだろう。 つまり、IOストリームの一元化は出来ず、個別に持つことになるから性能は比べるまでもなし・・・ とはいえ、4コアともなれば仕方の無いことだけどな。
とわ言え、Intel非互換の1GBページサイズのサポートやら、新命令の追加やらに挑戦していることについて、 少なくとも私わ注目しているす。
AMDがINTELと違う道を模索するのは賢い選択だと思う。
>>270 を見ても分るように、研究開発費が全く異なることが伺えてしまい、同じ手法だと
INTELには勝てないだろう。
MACオタの書き込みは、Hammer-Infoを見ればすでに書かれていることばかりす。
>>275 以前の、
オタの書き込み→ウソつけ→実は本当だった→前から言われてたよ
のような書き込みとわ違って、素直になったすね。
IntelもAMDもつかってるからどちらも嫌いではないが、 MACオタの書き込みはほんとにイライラする。 二度と書き込まないでくれ。市ね
なんかだんだん、
>>277 みたいな発言がMACオタの自作自演に思えてきた。
自演本スレはここれすね
オタって雑音のリアル知り合いなんだろ。 え?違うの?
285 :
MACオタ :2006/05/19(金) 08:12:18 ID:OOUe8biG
周知の通り、Dellが今年第1四半期の会計報告の中で年末からOpteron搭載サーバーを発売することを
発表したす。
http://www.dell.com/content/topics/global.aspx/corp/pressoffice/en/2006/2006_05_18_rr_000?c=us&l=en&s=corp ------------------------------
In the enterprise, we will launch new ninth generation servers featuring Intel's Woodcrest
microprocessors. Dell will also introduce new AMD Opteron processors in our multi-processor
servers by the end of the year offering a great new technology to our customers at the high-end
of our server line.
------------------------------
一見AMDの先が見えたかとも思われるこの時期に、こういう判断をしたということわ、
・よほど魅力的なロードマップを示された
・株価対策 & 大企業的フルラインナップ戦略
のどちらなんすかね。。。
Appleと違って、技術で物事を判断しているというタイプの会社じゃないすから解釈わ難しいす。
この発表を受けてAMDの株価わ結構上がったようで、Core 2登場までに次世代の開発費を稼いでおきたい
AMDとしてわ有り難い話す。
何でも分かってる風なMACオタくんでも、予見できなかったのかい?
株価が上がっただけでは、AMDには1円も金は入らない。 株価が上がった状態で新株発行して初めてAMDに金が入る。 また、転換社債を発行している状態で株価が転換価格を上回れば、 転換が進んで将来の償還負担が減るという可能性はある。
multiprocessor server のみ、highend server がターゲットって 書いてあるから、CPUコアの能力よりも、Intel 式共有バスの方が ネックになるような領域の話じゃねえ?
でも次からはインテルの競争力はあがるから問題なくなるんじゃないか?w 現状でも3コアを投入すれば勝てるんじゃないか?
ネットバーストによりサーバー分野で(特にDPサーバー)で完全に劣性に立たされていたDellが、 AMDのOpteronを採用する一番良いタイミングじゃないかな? Woodcrestが市場に出せる状況となる6月を睨んでの発表であり、 WoodcrestはDPサーバー(2Way)までのOpteronより競争力が遥かに強い為、 AMD社のCPUによるMPサーバーを採用してもIntelとの協業路線に悪影響を及ぼさず、 MPサーバー(4Way)にOpteronを採用することで、x86サーバーとしては最高性能のCPU群を揃える事が可能となる。 MPサーバーは元々非常に小さい市場だから売上げには殆ど寄与しないが、 ラインナップとして他社に見劣りしない品群構成を揃えることでの競争力強化の狙いがあるのだろうな。
AMD社の主張する排他リベートは単なる言い掛かりであるのは市場動向をみれば明らか。 INTELより魅力あるCPUを出せば、市場は機敏に反応している状況で主張しているのが笑える。 馬鹿としか言いようが無いなw
Celeron搭載PC専業メーカのDELLに拾われてもしょうがない気がする。
今回のDellの決定で、4way市場でのAMDのシェアは50%超えるかもね。
正:AMD社の主張する排他リベートは単なる言い掛かりではないのは市場動向をみれば明らか。
だったら何で2005年-2006年と驚異的なシェア拡大が出来たんだ? そもそも、生産能力を結構下回る程度しかシェア有してなかったじゃんw
訴訟のおかげでIntelが動きにくくなったとか。 メーカー: うちもAMDを採用するけど、Intelから買う数は変えないから同じ値引き率でいいよね。 Intel: 駄目駄目、そんなことしたら、値引き率を抑えちゃうよん。 メーカー: そんなこと言ったら裁判所にチクっちゃうぞ。 Intel: うっ
っていうかそれがAMDの狙いでしょ。 まあ今のところ見事に狙いが決まってるわけだ。
Opteron採用の発表はWoodcrestを安く売れということで、安く買えるとなったらAMDや〜めたとか言わないだろうか。
で、Quad Core K8LのL3ってVictim Cache?
それはまだ分からないんじゃないの。 L3がZ-RAM使ってて実は8MBくらいあったら面白いんだが。 そうなるとL2も実は1MBずつくらいありましたってオチが…。 まあ信頼性を考えると無理だろうけど。
victim cache と exclusive cache って同じ意味の言葉だよね? L3 が L2 と同程度のサイズだったら exclusive cache で決定じゃない?
>>304 まぁL3が2MBとか言ってたから薄々そんな気がした
victim cacheだと共有キャッシュとして機能が制限されるから効率悪いだろうに・・・ それでなくてもL2が独立型なのでどうにもならんだろう? L2をL1並に小さくして高速アクセス型にしたとしても、L3を経由せずにL2へのロードともなれば L2の劣化は激しいからL3は素直にInclusion Cacheにすべきだし、L2をある程度大きく取るなら L3での共有化の有利性が激減する。 というか、なんでL1,L2をExclusionのままにしておくかねぇ・・・・ 想像しただけでも良いキャッシュ環境とは思えんなぁ。
> L2をL1並に小さくして高速アクセス型にしたとしても、L3を経由せずにL2へのロー > ドともなればL2の劣化は激しいからL3は素直にInclusion Cacheにすべきだし、 まあ L2 を小さくする場合には、確かにL3を Inclusive にする意味は あると思う。でも、 > L2をある程度大きく取るならL3での共有化の有利性が激減する。 こっちの意味が分からないなあ。 L2 がある程度大きく、L3 が比較的小さくて L2 と同じくらいのサイズの 場合、排他キャッシュにするのは当然では? Inclusive だとほとんど L3 の意味がないじゃん。 Exclusive なら意味があるけど。
自己レス > 実用的に Victim Cache じゃない Exclusive Cache って、なんかあるのかな? L2独立/L3共有なら、Victim Cache だけど他のコアのL2に入っているエントリって のがありますな。というわけで、そういう場合は Exclusive Cache という言い方 は不適当で、Victim Cache という言い方にしないとまずいと。 だから Victim Cache と Exclusive Cache という言葉は分けて考えた方がいいと。 L2独立/L3独立や、L2共有/L3共有の場合には実質的には同じと考えて良い?
>>285 >Appleと違って、技術で物事を判断しているというタイプの会社じゃない
気でも触れたのか?
>311 Macヲタの相手をするな
な… 〉(、、、 〉
なんであぼ〜んなんですか? ,;;、 ( ヽー /
何か喋ってくださぁ〜い! ゞ-vルぅ / イ
、、,,._=σ'σ l~ / /l
/ ̄ ̄`ヽ : (ヾ(下う' 三ヽ ゝ  ̄/
/. i /ヘ\ヽ\: _,r.、 ヾーゝ、,,.ノ` ヽ) / /イ
;| ! |/__.xト、L,_ ト}: 「 二{ ! , --ト、ゝ-' _ヽノフ  ̄l
; |!ヘ cモリ lモ!oV 〈 つ lー'ヽ/l `ー'ー'' ̄〉' ̄ _/
;| !|.ト" rっ ツ|.|、: ノヽ /ゝ i \,,.. -''" , /
,',ノ 斗ャ fて`Y トミヽ l、 l /!ヽ
>>285 l_,,.イ
/ {トミトv|'´ゝ } ノノ:l }: ゝ--ー' lT ゝ、_/
:/イ { ゝィVr-ヘト、 ! ハ lフ 、/_/ ,,;;;;;:-、
. | !|Y⌒'ミ{ヾ=' | /イ| ,rーーv-、 l l /ソ ,;;,,r'⌒ヽ;;;!
ヽ人 |! /\ l 、 リヽヽ_ノ l-;;;'_ノ )j
-r''ユ`'┬' トー'´ <アニユ ヽ ヽ l ̄ じ
<-''"-'' ̄~l :,/{、 || ,.|='´ lヽー‐| ======-、、 l
个Y´Kelloggl上__l__ll_/__l l 3.6 l_______lj_/__
lΞl コーン l ,;;===;;::、 l;;l 牛 l \
l l フロスト l ヾー---‐'ツ. l l 乳 l 「二 ̄ ̄ヽ \
./ l l / `ーー‐' ヽL_j ヽ二三__j \
すべてAMDのせい
Thunderbirdの時はTLBが排他的になっていなかった。 Palominoでハードウェア プリフェッチと合わせて、 排他的(エクスクルーシブ)&投機的TLBに変った。
>>315 というか、ハードプリフェッチの強化出来ないしょ?
L2やL3へのプレロード不可能だし、実装したとしても意味が無い。
>>317 それは排他やVictimと反する事ではないが?
ヒント・・・L1から漏れる。
排他キャッシュって、ストリーミング処理に弱いし プリフェチに都合の悪いところあるな 今まで気づかなかった AMDはintelほど大容量キャッシュを積めないから 排他キャッシュを止めにくいのがこんなとこころでマイナスとは
>>320 > 排他キャッシュって、ストリーミング処理に弱いし
これは、キャッシュするかしないかの判定に何がしかのペナルティがあるという意味?
ストリーミングは垂れ流しの使い捨てデータが主。(一部差分参照するけど) ので、排他キャッシュだとパージ処理でのペナルティばかり食らう羽目になる。
>>322 再参照されないものはそもそもキャッシュに取り込まないから。
>>323 プレロードがある。
Inclusiveの場合、先行アドレス分をL2にロードすることで効率が上がる。(L1無関係)
Exclusiveの場合、先行アドレス分をL1にロードすることでL1から追い出すラインが発生しL2へ吐き出される。
これ等は、効率を低下さす要因だ。
STREAM ベンチマークによる実効メモリバンド幅 2.2Ghz/DDR400 Opteron |3.6Ghz/800FSB Intel Xeon EM64T Function PGI 5.2-4 PGI 6.0 | PGI 5.2-4 PGI 6.0 Copy 3773.6 4874.2 3797.3 3780.2 Scale 3787.5 4838.2 3775.8 3732.2 Add 4055.4 4584.0 3579.7 3594.9 Triad 4131.9 4584.9 3600.3 3705.6 プレロードが最適化されていれば、こんなんらしいが
>>315 Athlonは排他であって、Victim Cacheではないでしょ?
>他にアクセスレイテンシの短縮も期待できる。
排他処理が重いのでK7のスループットは酷かった。
そのせいでレイテンシで見ても遅くなっていた。
>>320 ,322
prefetchntaを使用して無いソフトウェアがクソなだけ。
今問題視しているのはハードプレフェッチ性能だろ?
へ? その問題って、ソフトウェアがヒント与えるだけでいい事じゃないのか?
ヒント与えていないソフトでの性能差は大きいし、そもそもソフトウェアでの対処はムラが大きいのと効率も悪い。 特定分野での効率以外は無力に近いしな。
>そもそもソフトウェアでの対処はムラが大きいのと効率も悪い。 >特定分野での効率以外は無力に近いしな。 んなこたーない。 ハードウェア側で一時的データかそうでないかは判断する事が出来ない。 ゆえに、ソフトウェアがヒントを与える。
それだとConroeのキャッシュシステムが高性能である理由が説明出来ないんだよ。 なんか知らんが全てを否定しているような発言は控えて欲しいなw
>Conroeのキャッシュシステムが高性能である理由 初耳だ。
へー初耳なんだw キャッシュ性能が悪く、メモリーレイテンシもAthlon64より圧倒的に悪いCPUのクロックあたりの性能がAthlon64より 遥かに高性能なのは何故だ? 理屈としてなりたたないことは、お前にも理解できるよな?
根拠は物理で十分。 命令とデータの供給がスムーズに行えなければ、どんな高性能なCPUでも性能は上がらない。 これ常識。
(゚Д゚)ハァ?
あらら、お前は論理的に物事を思考できない人のようだなw
データも無いのに、高性能と決めつけてる君に乾杯
Conroeのキャッシュシステムが強力で高性能なのは、大きなL2(4MB)と共有キャッシュであること、 2つのコアからの多重アクセスを1つのストリームで受け取りバス幅を倍にすることで性能劣化を抑え、 ラインあたりのキャッシュ保持能力が高い(4MB)ことを背景としてハードプリフェッチ機能の強化で、 命令とデータの供給性能を高めていることがFXよりクロックあたりの性能が20%〜30%オーバーもの高性能に 繋がっているのは常識なんだけどね。 それ分りませんか?
どこからのコピペですか?
Conroeが大きなL2を持ってるのはすでに知ってる、 で、それがストリーミング処理とどう関係するんだ?
順次アクセスだと、キャッシュ無関係とでも思っているのか?
へ?誰がそんな事を? 俺はストリーミング処理(垂れ流しの使い捨てデータ)が、キャッシュを汚染するだけと言ってるのだ。 だから、ソフトウェアでヒントを与えればいいじゃんって事だ。
本日の雑音ID:Glgl+3AV
> 俺はストリーミング処理(垂れ流しの使い捨てデータ)が、キャッシュを汚染するだけと言ってるのだ。 > だから、ソフトウェアでヒントを与えればいいじゃんって事だ。 汚染なんてしないよ。 そもそも、キャッシュラインの大きさを無視している。 メモリからの実ロードが1回でキャッシュからのロードも1回とでも思っているのか?
>>346 おお、久しぶりにGoodニュース。
Rev.Hが本当なら、Rev.Hの次の次ぐらいでなんとか使えるCPUになりそう。
鍵は、高性能キャッシュなのだがなんとかなるかも知れないな。
曰く「そんな事も知らないのか、○○だな」 こういう言い方しかできない人は優秀な人じゃない、ましてや人の上に立って利益を上げている人ではない断言できますね
L2に格納されるのはデータだけじゃないだろ・・・
命令フェッチやデコーダが強化されてる分、従来よりL2に取り込まなきゃならん命令も増えるだろうが。
ttp://pc.watch.impress.co.jp/docs/2006/0311/kaigai249.htm これを見る限りではキャッシュについては何も触れてないから、それほど重要じゃないって感じだな。
容量増加と共有キャッシュである程度の効果はもちろんあるんだろうが。
>>346 そのクアッドコアのレイアウト、微妙に違和感があると思ったらHTパッドらしい部分が小さいな・・・
これだと、HTLinkの数が足りんような気がするが・・・チップ形状を正方形に制限した状態でのテストレイアウトかね?
> これを見る限りではキャッシュについては何も触れてない 後藤氏が無知なだけだろ?
>>352 つーか、お前ばかだろ?
intelはな、FXをベースに改良してConroeを作ったんじゃないんだぜ?
アーキテクチャの強化点がどれだけの効果を表すかを語るなら、ベースになったアーキテクチャ比で語らなきゃ無意味だろうが。
ついでに言うが"Conroeの話がしたけりゃintel次世代スレに逝け"。
ストリーミングデータは普通にキャッシュを押し流すわけだが。 容量数百キロバイトのアニメストリーミングしか見ないやつには わからんだろうなぁ。
ストリーミングとπ焼きを同時に実行してみてはどうだろう? もちろん共有キャッシュのYonahかConroeでの話だけど・・・
後藤はそれっぽい文章(推測・妄想たっぷり含む)書くのは上手いが 大原(ハイアマチュア)や安藤(セミプロ)と比べると素人
大原はロードマップに関してはハズレが多いのが欠点だな。
>>356 安藤氏がセミプロて……
>>358 yes
procinfoを掘り返せばpcwebで記事を書くことになった、と出てきます
ハイアマチュアってのは褒めてんのか貶してんのかよく分からん表現だな
>>356 -------------------
大原(ハイアマチュア)や安藤(セミプロ)と比べると素人
-------------------
安藤氏わSPARC64のアーキテクトでプロ中のプロなんすけど。。。
http://www.cs.clemson.edu/~mark/architects.html ===================
# HaL SPARC64, 1995 - Hisashige Ando (design manager), Winfried Wilcke, and Mike Shebanow
===================
安藤氏によるプロセッサ設計の記事が読めるあなたがたわ幸せだと思うすけど、虫にとってわ後藤記事と
区別がつかない。。。ってのわ残念な話す。
RISCやメインフレームに元気がないんで IA-32の話が多く、分量もすくないのが残念 最近のando's microprocessor それにしても、sparc64のデザインマネージャーってすげぇな
放置しておけば ID:Cn+8jETg の奇跡のカキコが もっと沢山見れたかもしれないのに… もう恥ずかしくて出てこれないだろうな。
>>363 そこを敢えて出てきて、第二の雑音やMACヲタを目指して欲しいなw
あれ、MACオタって安藤氏のページ読んでんだ。 MACオタの書き込み直後に、MACオタと反対の見解が安藤氏のページに 書いてあって藁タんだが、言った本人としては恥ずかしくならないのかな?
>>365 ---------------------
言った本人としては恥ずかしくならないのかな?
---------------------
コトがSPARC64の話じゃ無い限り、「安藤氏の言=真実」というわけじゃ無いというだけの話す。
なるほど、MACオタは、安藤氏の見解を読んだ後でも、自分の見解の方が 正しいと思ってると。さすがMACオタだ。大笑い。
>>367 工学において問題の解決法が一つじゃ無い以上、安藤氏の意見どころか予想が当たるかどうかすら特に
気にするべき話でわ無いす。
問題は、話の前提や論理展開におかしな所が無いかどうかって所ということになるす。
>365,367 頼むから相手をするな
どうにかAMDはこの難所をしのげないかな?
所で素朴な疑問なんだけど、共有キャッシュのQuad CPUとかの クロックキューってどうなってるの?
372 :
Socket774 :2006/05/25(木) 01:12:09 ID:753bPSJZ
〜503ってこんな人物〜 Ver.060524b 祖父の総資産が30億で、その後継者(養子) 妹は教授に推薦されて東大医学部へ 親戚には教師と医者多数 叔父は東証?一部の現職社長 本人はがんばると総理大臣も狙える器 今は公務員をしているが現職は腰掛で弁護士を目指している 顔はスターウォーズ3に出演していたアナキンにそっくりなナイスガイ ↑ここまで自称 ↓ここから現実 毎夜PCのバックグラウンドで「著作権フリーのアニメ」や「家族のホームビデオ」をRAR圧縮しつつP2Pで何かをダウソ。 表はオタアニメDVDを見ながら2chでハッスル デジカメ用USBケーブルを買う金すら自由にはならないが使用しているPCのHDDは200GBが5台(2004/10時点) 煽るのは得意中の得意だが「〜せざる『お』えない」 「つくりつ『ず』けなければならない」 実家を出て大学に通っていたはずなのだがなぜか母親が常時韓流ドラマを見ている為テレビを見れなかった 高級アクティブスピーカーのほとんどは標準フォーンジャックを採用しているがググってもまともな物は1つも見つからなかった 音にこだわる人間にはクリエィティブのスピーカーが最高だがスピーカー専門スレで評判聞いたら完全にスルーされた JBLとharman/kardonは同じグループに属しているので同じ会社。つまりトヨタとダイハツも同じ会社 液晶モニタの輝度430カンデラはさほど眩しくない。0まで落とせば問題なし。(輝度0って...) 阪大大学院卒だが自身の受けた講義は死んでも言わない・言えない・言わせない 液晶スレで好評のFP93GXは黒は潰れてるし残像出まくりで最悪だった。価格相応の商品でお勧めできない リアル女性に興味は無いと言っているが、あっちも興味無いだろう ソース出せと言われて出すのは必ずネットで拾ってきた物。不利なソースが出てきたら「それは捏造・測定ミス」 反論できないと思ったら「無職・低学歴・貧乏人・論破完了」のどれかが出てくる。 ブランド大好き。CPUはIntel、マザーはASUS、モニタはNANAO、スピーカーはCreative。それ以外は認めない いきなり流れに関係ないレスが出てきたら「完全な躁」でホルホルまたは完全な鬱」でファビョーンしてる証拠 修正・追加シマスタ
>>371 -----------------------
クロックキューってどうなってるの?
-----------------------
もしかしてクロック「ス」キューって言いたかったすかね。。。
>>373 MACオタは重箱の隅をつつくのだけは得意か。
以前Intelスレでスレ違いの内容でしかも大間違いのことを延々と力説していたのを
思い出す。すぐ直下のレスで間違いを指摘していたのにそれも無視。
しかもその指摘はやんわりとした優しいレスであるにもかかわらず。
MACオタは自身に向けられる優しさを残酷にも無下に切り捨て、
しかしその一方で極めて些細なことを針小棒大に書き立て、
鬼の首でも取ったかのごとくに喜ぶ。
実に卑しいねぇ。
お互い様だな。 お前らがオタを認めないから、オタの煽りがエスカレート。 端からみてると、ほんとおもしろい。 議論するならまだしも、オタの情報が正しかったときや予想が当たった場合のお前らの負け惜しみが楽しくてたまらん
373 名前: MACオタ ID:X4jb4AMD←MACオタの予言の例だな。QuadコアはX4jb。
380 :
MACオタ :2006/05/26(金) 00:20:06 ID:uei6kv7p
さて、WoodcrestとOpteronの各種ベンチ結果が出揃っているようだ。 ソケット数が2つまでなら2コアであろうが4コアだろうがWoodcrestがOpteronより高性能になっている模様だ。 ソケット数が4つになると共有バスがネックとなりINTEL側は少し不利な状況。
実際に4 issueのスーパースケーラが使いきれてるアプリがあるのか疑問視してみるテスト
鯖用アプリならいくらでもあるんじゃねーの?
NOD32を使っている利用者で不満な人って居るのか? 殆どの人は満足していると思っているのだが。
「ようだ」に「模様だ」か 本家同様FUD大好きっ子だな
何故ここでNOD32なんだ?誤爆か?
クロックレスプロセッサなんてモノが有るんだな…
>>382 スレ違いだが…
クロックあたりの SPECint の結果を見る限り、Pentium Mに比べて
25%増くらいになってるので、4 issue の効果はそれなりに出てる
気がする。4/3=1.33倍まではいってないが、それは当然なので…
いまの K8 の整数コアの性能で Woodcrest を越えようとすると、
クロック 4GHz くらいにならないと無理なので、2ソケットまでは
>>381 のいうとおりなかなか厳しい気がする。
クロックあたりの SPECint は、Pentium M でも K8 より良かった
んだけど、Pentium M はクロックが低かったから…
AMDが4 issueを選択しないのは、費用対効果があまり期待できないからだと思っていたんだが..
ちなみに以下を読むと、4 issueって言ってるのはx86命令ではなくてMicroOpsの事のようだな。
http://journal.mycom.co.jp/articles/2005/08/31/idf1/002.html > Q: ところでそのissueですが、ここで言っているのはMicroOpsを4 issueで実行できるという意味でしょうか?
> それともx86命令を4 issueで実行できるという意味でしょうか?
>
> A: これ以上の詳細は話すことができないが、ただ前の世代のアーキテクチャでは条件がよければ3つのx86命令
> をMicroOpsに変換して同時に実行する事ができた。私に言えるのはここまでだ(笑)。
昔Athlonが4issueになるかもって話題が挙がったとき「んなもんなっても意味ねーじゃん!」 て淫厨言ってたのになw 多分過去ログ漁れば出てくる。
で4イシュにすればいいのに、なぜしないんだろ? やっぱりAMDはアーキテクチャの性能向上では弱いかも
ちんこ臭、わき臭、口臭、屁 4異臭
>やっぱりAMDはアーキテクチャの性能向上では弱いかも 何打この発言。 まるでAMDのCPUは安さ以外、ずーっととりえがなかったみたいな言い方だなw 2年前にも同じ発言してた頭悪い人かw
圧倒的性能と圧倒的低価格、それがConroe 上から速い順に Conroe X6800 2.93GHz dual 4MB FSB1066MHz TDP 80W '06Q3 $999 Conroe E6700 2.67GHz dual 4MB FSB1066MHz TDP 65W '06Q3 $530 Conroe E6600 2.40GHz dual 4MB FSB1066MHz TDP 65W '06Q3 $316 Athlon FX-62 2.80GHz dual 1MBx2 TDP 125W '06Q2 $1031 Conroe E6400 2.13GHz dual 2MB FSB1066MHz TDP 65W '06Q3 $224 Conroe E6300 1.86GHz dual 2MB FSB1066MHz TDP 65W '06Q3 $183
>>390 ----------------------
4 issueって言ってるのはx86命令ではなくてMicroOpsの事のようだな。
----------------------
少なからざるx86命令が1-uOpsに変換される上、Macro-Fusionも考慮に入れるとx86命令で最大
5命令同時実行ということになるすけど?
>>391 平均IPCを上げるにわ、実行ユニットだけ増やしてもバランスが悪くて効果が上がらないす。
・大容量キャッシュ
・分岐予測の向上
・データプリフェッチ
等の、命令やデータフローの改善と組み合わせることで、やっとIPCの向上に繋がるす。
>>396 現実には、真のデータ依存性があることもお忘れなく。
400 :
MACオタ :2006/05/27(土) 20:32:59 ID:4tEIfxwj
>>398 金わ、株が高いうちに借りられるときに借りておくというのわ、悪くない考え方なのかもしれないす。
>>399 xx-issueとかxx命令同時実行とか言うのわ、通常「最大値」すからそんな所に突っ込まれても(笑)
>>400 だから、俺は
>>382 と同じ疑問を持ってるのさ。
4-issueの費用対効果がどれくらいあるのかと。
もちろん、それ以外にも
> ・大容量キャッシュ
> ・分岐予測の向上
> ・データプリフェッチ
の効果が少なからずあるから、ベンチではそれらを含めて結果が出てるのだと思うが..
402 :
MACオタ :2006/05/27(土) 21:04:35 ID:4tEIfxwj
Pen4があったから、実質性能が下がった状態で販売開始ってのはありえないとは言わんけどもw
SPECベンチのコードが実際のアプリのコードが元になっていることを知らない馬鹿発見。 gcc, bzipとかベンチ結果の詳細リンク貼られてるんだから、みりゃわかるだろ。
> 少なからずIntelもIPC=4を夢見て作ってたと思うが。 そう思っているのはお前だけだよ。 普通はIPCの向上を目指し、具体的には3.5程度の効率を目標にしている。
>普通はIPCの向上を目指し、具体的には3.5程度の効率を目標にしている。 しかし以前のIntelはそうでは無かったが。
なんか変な流れになってんな。 4 issue の OoO コアの平均 IPC は 1.2〜1.5 程度だそうだよ。 (ando さんのページ 2005年9月24日より) いくら Woodcrest が高性能でも、平均では 2 IPC もいってないでしょ。 それでも、3 issue の Pentium M に比べて 25% 向上って話なの。
>>408 過去と現在では環境が違う。
トランジスタ性能も上がり、搭載可能な回路もずっと多くなっているから、回路効率の悪さを理由にキャンセルしていた過去と単純比較しても意味が無い。
まして、デュアルコア化を前提に動作クロックを下げ各回路の省電力化技術を進め大量のキャッシュを積める様になった現在だと4issueは妥当だろう。
もちろんAMDの設計思想では3issueのままだろうけども・・・
411 :
MACオタ :2006/05/27(土) 22:03:18 ID:4tEIfxwj
>>410 >過去と現在では環境が違う。
>トランジスタ性能も上がり、搭載可能な回路もずっと多くなっているから、回路効率の悪さを理由にキャンセルしていた過去と単純比較しても意味が無い。
いやいやいや、これはクロック重視だったIntelの思想が変わったとしか思えないなぁ。
>もちろんAMDの設計思想では3issueのままだろうけども・・・
これは、AMDが4issueについてどう考えてるかによるね。
> いやいやいや、これはクロック重視だったIntelの思想が変わったとしか思えないなぁ。 INTELはクロック重視じゃないよ。 ネットバーストはクロック重視、PenMは省電力重視、IA-64はIPC重視です。 そして、Conroeはバランス型ですな。
えーと、俺は別にMACオタの示した資料を見て返事を書いた わけじゃないんだがなあ。 ちょっと見てみたが、MACオタ、今回は、それほどはずした 資料を示したわけでもないようだが、CISCの場合、IPCは AlphaのようなRISCよりもさらに低めの値になることが多い ことをお忘れなく。 RISCはロードストアアーキテクチャだからね。 > もちろんAMDの設計思想では3issueのままだろうけども・・・ 設計思想というよりは、K7/K8 コアの設計時期の問題では? Pentium III/M 系に比べ、K7/K8 コアの方が演算器の対称性が 高く、あの時期では、もっともリッチな部類でしょ。 一応、理論的にはコアあたりの演算器をリッチにするよりも、 コア数を増やした方がサーバ系の性能電力比では有利な筈なので、 Opteron 系は今後も 3issue のままかもしれんけど、デスクトップ の方は AMD も 4issue に向かうかもね。 Woodcrest/Conroe が 4issue にできたのは、Pentium M 系で こつこつ積み上げてきた省電力技術のおかげだと思う。 K7/K8 コアも NetBurst と違い筋は悪くないので、あとは地道な 努力の問題でしょ。 > IA-64はIPC重視です。 クロックあたりの SPECint 値を見ると、IA64 は Woodcrest で、 とうとう x86 に抜かれたっぽいよ。
415 :
♪ :2006/05/27(土) 22:23:18 ID:mv2R8GUE
特別解説だ。 ある瞬間における実行プログラムの並列度(わかりやすいイメージあくまでもイメージだよ) 6issue ■ ■■■ ■■■■■ ■■■■■■■■ ■■■■■■■■■■■■■ ■■■■■■■■■■■■■■■■■■■■ 3issue ■■■■■■■■ ■■■■■■■■■■■■■ ■■■■■■■■■■■■■■■■■■■■ 山の全面積に対するカットされた山の頂上の面積比は? 命令帯域をむやみにふやしてもプログラムの並列性自体に限界があるため、 思ったように平均IPCはあがらない。 投機実行、キャッシュ技術など現在も進歩している技術で可能な限り並列性をみつけだす =山自体を大きくするでもしないとトータルな帯域を増やしても効果は薄い。
>>411 GS1280 (Alpha21364/1.15GHz)ですら、
IPC for SPECfp2000で、IPC=2.1
IPC for SPECint2000で、IPC=1.5
こういう結果だったか。
むぅ..
でも、AMD、Intelの現在のCPUでIPCの実測値を見てみたい物だが..
417 :
MACオタ :2006/05/27(土) 23:00:23 ID:4tEIfxwj
電波系のヒト除けにIPCの話わ、きちんと数字を出して書いておくす。
>>402 にリンクしたAlphaServer GS1280の性能に関する文書のFig. 8よりSPECint2000の各サブベンチの
IPCの値を読み取って、Alpha 21634/1.15GHzとWoodcrest/3GHzのクロック差を加味してWoodcrestのIPCを
試算してみたす。
仮定として、IntelのuopsわAlphaのISAと比較して特に命令の機能わ低くなく、SIMD最適化も特に行われて
いないものとするす。ちなみにこの試算で命令機能が低い場合にわIPCわ実際より低めに、SIMD命令が
使われている場合にわ、実際より高めに評価されることになるす。
Alpha21364 Core2 164.gzip 1.5 1.78 175.vpr 0.82 0.81 176.gcc 1.24 1.94 181.mcf 0.32 0.47 186.crafty 1.41 1.49 197.parser 1.19 1.73 252.eon 1.21 1.91 253.perlbmk 1.28 2.24 254.gap 1.44 2.31 255.vortex 1.32 2.11 256.bzip2 1.42 1.47 300.twolf 0.9 1.15 ---------------------------- total 1.10 1.47 ご覧の通り、Core2わクロックとIPCの両方で大きな性能向上を果たしていることが判るす。 それでもIPC=3わ大きな壁であることも判るかと思うす。
419 :
Socket774 :2006/05/27(土) 23:22:41 ID:JWxziMYM
4issue化による性能向上って5% よくても10%程度だろ かつてalpha21464という、8issueプロセッサが 開発されてたが、IPCは21364の20〜30%アップ程度だった intelの試算でも、8issue化による性能向上は18%ぽっち
クロック当たりの性能でもalphaを抜いたってのは 感慨深いものがあるよな
>>419 クロック当たりの性能向上率 25% のうち、4 issue 化の寄与は
その一部に過ぎない筈だから、25% 未満なのは間違いところだね。
>>421 だ・か・ら
4issueの効果とMacroFusion, MemDesambiとかAdvPrefetchとかの効果
は別個に計上しちゃだめなの!!
ユーザーからみれば個別だろうがなんだろうが 前のより性能が上がってるって事実だけあればいいと思う
3issueのままでも、プリフェッチなどの効果が大きいのは事実だろ マクロフュージョンは微妙だけどね 3issueのままでも、分岐実行のレイテンシがさがるけど 同時実効命令数は増えない
>>423 そうそう。最近のCPU系のスレは細部の技術にこだわりすぎて、
昔よりは断然レベルが上がってる気がするし、
まあ、それはそれで自己満足の世界だからいいんだけど、全体が見えてない気がする。
それで実際の将来の製品の予測がちゃんとたてられかというとそうではいし。
と愚痴っても意味ないけどなw
まぁ、AMDには関係ないことだ・・・ AMDはプリフェッチ機能を強化する気が無いというべきか技量ない?
どっかのスレに、AMDは排他キャッシュだから メモリ‐キャッシュ間のプリフェチは、あんま効かないんじゃないか? ってのがあった
というか、一体何時まで排他キャッシュに拘り続け、ダイサイズを小さくする為に小キャッシュを続けるのかなぁ? 別の道を模索するのも結構だが、キャッシュぐらいはINTELと同じ方向に戻さないと袋小路で前に進めなくなるぞ。 というか、既に進めなくなっている・・・・
これが本物の雑音だとすればえらくしょーもない奴になったもんだな。 トリ公開されてるし偽物だろうけど。
>>429 こんな雑音らしくない雑音がいるかよw 偽々
値段も安いししばらくはIntelの流れに。
>>432 このスレ的にAnandtechのそのページを引用するなら、こちらの一節かと思うす。
---------------------
AMD does have one last trick up its sleeve before the end of the year, and you will hear about
it in June. It's not K8L and it's not going to affect the majority of people, but it is an interesting
stop gap solution for the high end in 2006...
---------------------
「6月に詳細が公表される"K8Lより先に実装され、一部のヒトだけに影響する新機能"」とやらわ何すかね。。。
435 :
MACオタ :2006/05/28(日) 08:30:45 ID:26X60QWa
参考までに
>>418 のIPC比較にSingleCore Hammer/3GHz (Opteron 256)とItanium2/1GHz (3MB L3)
も追加す。HammerのIPCわ
>>418 と同じ手法で試算。Itaniumわ、この文献を参照したす。
http://www.crhc.uiuc.edu/Impact/presentations/sias-isca31.pdf Alpha21364 Core2 Hammer Mckinley
164.gzip 1.5 1.78 1.75 2.05
175.vpr 0.82 0.81 0.55 1.0
176.gcc 1.24 1.94 1.00 1.5
181.mcf 0.32 0.47 0.14 0.15
186.crafty 1.41 1.49 1.49 1.35
197.parser 1.19 1.73 1.20 1.05
252.eon 1.21 1.91 1.74 1.1
253.perlbmk 1.28 2.24 1.38 1.75
254.gap 1.44 2.31 1.48 1.35
255.vortex 1.32 2.11 1.34 1.35
256.bzip2 1.42 1.47 1.03 1.4
300.twolf 0.9 1.15 0.69 1.0
------------------------------------------------
total(幾何平均) 1.10 1.47 0.98 1.10
MACオタの貼ってるのってどっちかっていうとIntelの次世代向けのレスばかりだな。 AMDの次世代スレに居る時はこのスレにあったレスをしようぜ? Core2の情報→Intel次世代向け K8L,K10なんかの情報→AMD次世代向け
>参考までに
>>418 のIPC比較にSingleCore Hammer/3GHz
>SingleCore Hammer/3GHz
>SingleCore
さすがだな!提灯やらせたら右に出るものいない!
440 :
439 :2006/05/28(日) 13:38:30 ID:wnEByhWs
439です。すいませんでした…あまりにも悔しくて;; つけいるスキがなかったのですが、無理矢理シングルのところを理由にしてしま いました;; ほんとすいませんでした;;;
>>435 どう見ても、4 coresと1 coreでIPCの計算をしています。
本当にありがとうございました。
新具瑠巣列土
443 :
Socket774 :2006/05/28(日) 16:31:45 ID:qWzvBx4h
444 :
MACオタ :2006/05/28(日) 19:25:16 ID:26X60QWa
>>436 さん紹介のTheInquirerの「AMDの次の一手」の話題す。
http://www.theinquirer.net/?article=31994 要するに、AMDが当座の間に合わせとして取る手段わ
1. くっつけただけ版(笑) クアッドコア
2. 爆熱高クロック版
しか無いってことで、正に「因果わ巡る」としか言えない展開す。
プロセッサ間インタコネクトがP2P型のHammerで「くっつけただけ」が可能かどうか疑うヒトもある
かと思うすけど、元々Hammerわ4本のHTリンクを備えているすから、必要なだけ有効にして
パッケージ内で接続すれば特に大きな技術開発要素わ無いす。
本文の中にもあるように、所詮「ゲーマー向けのハイエンド」程度の製品すから。。。
爆熱版の方も、低消費電力化のために行ったプロセスの改良を高クロック化にふりむけて、
薄いゲート絶縁膜、短いチャンネル長、電源電圧の上昇等で実現するんだと思われるす。ただ
こんなことやるとチップ間の消費電力のばらつき(特にリーク電流)が極端に大きくなる筈すから、
歩留まりが悪いとか、熱暴走するロットが出るとか色々ヤバ目の副作用がありそうす。
信仰深いレビューサイトどもにわ、例によって選別品を配るんでネットで叩かれる心配も無いと
思うす(笑)
445 :
MACオタ :2006/05/28(日) 19:26:26 ID:26X60QWa
それにしても
>>439-441 ,
>>443 さんのような鉄砲玉を諌めるヒトがいないのがAMDファンが総じて
虫呼ばわりされる所以なんすけどね。。。
ipc cpu date ------------------- 0.11 i386DX 1988 0.24 i486DX4 1994 0.25 i486DX 1989 0.26 i486DX2 1992 0.51 P54CS 1996 0.51 P5 1993 0.56 P54CQS 1995 0.56 P54VRT 1994 0.56 P55C 1997 0.58 P54C 1994 0.62 PPC604 1995 0.67 Deschutes 1998 0.67 Willamette 2000 0.70 Katmai 1999 0.70 Mendocino 1998 0.71 Klamath 1997 0.72 Northwood 2002 0.74 PPC604e 1997 0.77 K75 2000 0.77 K7 1999 0.77 P6 1996 0.81 Prescott 2003 0.82 Merced 2000 0.85 Coppermine 1999 0.94 PA-7200 1994 0.94 Cedar Mill 2006 1.19 Opteron280 2005 1.24 PA-8200 1997 1.26 Opteron154 2005 1.40 PA-8700+ 2002 1.48 POWER5 2005 1.54 Yonah 2006 1.55 McKinley 2001 1.55 Dothan 2005 1.90 Madison 9M 2004 1.92 Woodcrest 2006 SPECintの歴代スコアから計算したクロックあたり性能表。 値は、IPFのIA64のIPC(平均)が基準。
ID:ScP2ioFFの投稿意図は明らかにINTEL褒め殺し、淫厨を装ってのスレ潰しだ。 アム厨愚派の行動か? 邪魔だから消えろ!
>>444 くっついてない方よりはよほどマシで。 遥か昔から4コアまではメドつけてた訳で
これからでる物が事前に準備してたものを新しくないと評価してどうする。
>>452 論点はそこじゃないだろ?
INTELより先行してクアッドコアを世に出すことだけが焦点だろ?
どうせ、INTELのクアッドコアより性能は悪い品でしかないから隙間を狙ってのゲリラ戦でしかない。
ああ、もっと昔から存在してなきゃダメなのね。どうでもいいっちゃどうでもいいけどw
2001年時点で2コアまで見えてただけでも立派なもんだと思うがな。 当時の製造プロセスと今とで何世代違うか考えれば、4コアまで読みきるのは無理だろ、普通。 2001年当時の計画で言うなら、intelは未だにNetburst路線まっしぐらでなきゃいかん訳だが。
K8の出たては130nmだしなー(´A`) 遥か昔っていうのがネックだけどな。 まぁ、デュアルコアを想定してたのは偉いよ。 お陰でPenDがヘボかった。 で、次世代って言ったらK10じゃないのか。 K8Lとかは同世代最終形態みたいなもんだろ?
6月1日のアナリスト・ミーティングでSpring Processor Forumの時より もうちょっとK8Lの詳細を話すとか言ってた希ガス
>>454 某糞虫やテープとは違って技術的な話も十分に出来ると思えるのに、
最後のヒトコトは余分じゃ無いか?
そんなだといつまでたっても何を言っても彼らと同レベルにしか見えんわな。
pen4新コアで10Ghz!とか叫んでたintel崇拝者を馬鹿にしてるのとなんら変わらない。
目くそ鼻くそを笑うってレベルだよ。
ゲテモノ好きとしては、Conroe対抗で爆熱高クロックAthlon64が出るなら… 欲しいぞ!!
http://en.wikipedia.org/wiki/K8L >Large Level-3 cache, initially expected to be a minimum of 4MB shared cache
>between processing cores on a single die (each with independent second-level cache).
4MのL3 Cacheにしてくるとなると、
4-issueへの拡張を含めた、Fetch-Decoder-Exec Units機能の強化か?
リコンフィグュラブルプロセッサって SONYォークマンのあれ?
どうせなら各コアを2issue位で3GHzで10w位にしてL1を共有でも別々でも使える ようにフレシキブルにしてコア数増やしてAnti-HTで並列に処理した方が早いコード のみ6issueなんかで動かせてしかもそれをWin上で切り替えられて別のDSPコアで SSE*命令を処理出来るCPUになるといいな。 うーん、読みニクス
>>463 後から後から出てくる出てくる、その場しのぎのまねっ子ちゃん?
そんなんでまともに動くのかね・・・と心配したりする。
>>465 凝りすぎて回路規模爆発して結局クロック上げの邪魔で脂肪パターンになると思われ
つよきすキャスト発表か・・・
>>463 それよりも、そこのwikiに書かれてる
・Memory mirroring support
・HyperTransport retry support
↑この2つがよくわからん。何だろう?
メモリの冗長化して、メモリを電源ONのまま入れ替える機能と HTの通信が失敗した場合に、再送して通信をやり直す機能じゃねえの? ハードウェアトラブルに強くなるやん リンク先、読んでないけど
>・Memory mirroring support うーむなるほど。メモリホットスワップか..
てことはデュアルチャンネルx2のメモリインターフェースを備え 且つマスタ・スレーブ間の整合確認もオンタイムで行っちまうってのかい? スゲーなおい 何層基板になるんだ・・・
自作板に居る人の大半には意味が無い機能だな
>>469 メモリ・ミラーリングわ普通にデータを2セット多重化して持つというモノす。
>>471 さんが
書いているようなホットスワップわ、chip-killといった、また別の技術す。
"Hyper Transport retry"の方は手短に説明すると、元々転送エラーの発生をハードウェア的に
わ全く考慮していなかった(その分、高速で実装も簡単)なHyper Transportに、PCI Expressや
RapidIOのような競合テクノロジ並のエラーに対するハードウェア的なサポートを加えるという
話す。
476 :
Socket774 :2006/05/31(水) 23:06:56 ID:hQVmMXEN
来年の末ごろにはAMD大量象さんだし、INTELも生産量減らさんだろうから CPU暴落祭りだな。
ここ一年Athlon64の値段ほとんど変化無しだからな。 最近また値段一年ぶりに確認したらびっくりしたよ。
478 :
Socket774 :2006/06/01(木) 00:11:57 ID:298+KRIU
>>479 技術力の高さの違いor開発力の違いってところだろうな。
AMDの構想は安易だけに実現は容易だ、しかしその分だけ汎用性はなくなる。
INTELの構想は茨の道で実現は容易ではない、しかし実現されると新分野発見の功績が待っている。
はあ?どっちもどっち
>>480 「我々は、人々がコプロセッサを開発できるようにしようとしている。それに対して、
Intelは彼ら自身で(サブプロセッサ開発を)やろうとしている。我々は、
Coherent HyperTransportバスで、他の人々がコプロセッサを接続できるように
しようとしている。しかし、Intelは彼らのFSB(Front Side Bus)に、
他の人々が(コプロセッサを)接続するのは好まないだろう。フィロソフィが異なる」
とHester氏は言う。
フィロソフィが異なる
>>482 簡単に言ってしまうと、
AMDは所詮シェア10%程度の会社であり、汎用性に欠けても特徴のある製品へ育てるには都合がよい。
万人には向かないがコプロセッサ内包の特徴あるCPUへの進化が目標。
INTELはシェアが高いので万人向けの進化を目指すという感じだろう。
他人の読み方に干渉はしない。一々フィルタ提供せんでもソース読むよ。
>しかし実現されると新分野発見の功績が待っている。 まぁ、実現した事ないんだけどねw
INTELのメニィコア進化への方策としてPARROTと投機スレッドがある。 PARROTはコードの“局所性”に的を絞ったコードの高度な最適化技術で実効命令数を減らし高速化する。 この最適化に必要な処理とそれに伴う作業空間(内部専用キャッシュ)を内包する方向だろう。 投機スレッドは実行中のスレッドよりメモリロード部位のみを抽出し投機スレッド専用コアで実行。 メモリロード部位のみの抽出最適化処理とその実行とメインスレッド監視を投機スレッド専用コアが行う方向だろう。 どちらも魅力ある方策だ。
メモリロードの効率が上がって演算速度が上がるほど、演算結果の書き戻しの帯域が メモリロードに喰われて帯域の奪い合いになるという罠。
>>487 現実的に処理速度が上がる(クロック上昇なしで)のだから、それに伴いバス帯域を必要とするのは当たり前のことだろ?
CSIへの方向で問題ない。
だが、投機スレッド専用コアはメモリロードをやるだけでそれ自体は有意義な処理は何もしない。 実質、処理可能なコアは一つ減るな。 何も実行しないから実行ユニットが不要な分は小さくなるだろうが。 あと、既に別の実行コアのデコーダに投入された命令を投機的に実行してもメモリのレイテンシから見て 間に合わないだろうから、L1/L2キャッシュにあるデコーダ投入前の命令を先読みしなきゃならん。 となれば、通常より簡素ではあるがデコーダは必要だし、なによりキャッシュを常に先読みするから キャッシュの帯域も上げないと厳しいな。
そうですね、投機スレッドはPARROTよりも実現は難しいと思います。 45nm以降でデスクトップ分野のCPUはダイサイズが余ってくることへの有効利用方策です。 一般的なデスクトップでの用途は利用者が限られる為サーバーと異なり多くのコアを必要としません。 もちろん、アプリケーションが進化し多くのスレッドを消費するようになれば別なのですが・・・
492 :
MACオタ :2006/06/01(木) 08:16:27 ID:zPBXdtNd
余ったダイサイズの有効利用ね・・・ 現状でも既にハードプリフェッチでそこそこの効果が出てるから、どの程度の効果があるかは疑問だな。 どちらも基本的にロスを減らすための技術であって、基礎能力拡大のための技術じゃないから 理論値に近づくほど効果は薄くなっていくからな。
エンコ用プロセッサが出ればぜひ入れたいなぁ でもソフトウェア側の対応がないと意味がないぽ
MACオタの後藤に対する強烈なライバル意識が2ちゃんで燃え上がるのであった。 つづく
> エンコ用プロセッサが出ればぜひ入れたいなぁ > でもソフトウェア側の対応がないと意味がないぽ これ意味ないでしょ? エンコ用プロセッサに搭載したコプロセッサと対応ソフトが必要だから、結局はハードエンコードするボードを買ってるに等しい。 専用ボードならば、新しいエンコードに対応したいときは専用ボードを買い替えるだけでいい。 エンコ用プロセッサだと、新しいエンコードに対応したいときはエンコ用プロセッサと対応ソフトの2つを導入しないとダメ。 これって非常に具合悪いよなw コプロセッサが錆びれた理由がこれなんだよ。 AMDの言ってることは空論に近く殆ど無意味なんだよな。
>>495 それって、一方的なライバル意識w
そのうち愛憎に発展するね
エンコードの原理や意義について知らないわけではないが何故こんなに需要が増えたのかがわからん TV録画なら価格や扱いやすさや的にもPC買う必要は無いし100歩譲ってPCが必要だとしてもハードエンコできるキャプボ買って終了の希ガス そもそもCPUに浮動小数点のピーク演算性能を上げる意義はあっても特定用途に最適化する意義は全く無いよ 本末転倒って感じ
NECのチップなら3DYCS・デジタイザ・MPEG2エンコーダを統合して消費電力3W以下
>>496 ボードだって変更する場合はドライバ更新が必要ジャマイカ。不要な程度の
変更なら、コプロの場合だって同じだろ。
ボードよりもコプロの方が、明らかに接続速度は高いのだし、専用ドライバ
についてはコプロのハードで利益を出すつもりなら、ドライバは無料のオー
プンソースにすれば済む。
コプロが不利なのは、ソケット規格の変更がAMDの思惑で行われてしまう点
だろうな。ボードなら当面PCI-Eで変更不要だろうし。
>>499 その機能で3W以下って、けっこう電気食うほうじゃね?
>>500 何をほざいているのかさっぱり不明だ。
するっていと何かい?
お前さんは、新規格のエンコードが発表される度にAMD社は新規格のエンコードに対応したコプロセッサ内包のCPUをリリースするとでも言いたいのか?
そして、コプロセッサ内包のCPUを使っているひとはその度にコプロセッサ内包のCPUを買い替えろとでも?
普通じゃねぇぞ(笑
ボードなら、新規格のエンコードに対応したボードが発売されれば、それに買い替えるだけで済むわなw
>>502 500じゃないがヒント必要か?wwwww
ヒントやる前にちょい時間あげるから自分で考えてみ?wwwwwwwww
結局どっちも買い換えるじゃねーかw まあもうちょい汎用的なコプロセサの方が良さそうだけど。
>>汎用的なコプロセサ これを世間ではCPUというんジャマイカw
>>504 君の珍説を思考するのは難しいから白旗 (^_~)/~
珍説発表待ってますよw
>>506 エンコでよく使用する演算だけを強化したような奴だったら色んな形式に対応できるでしょ。
ソフトウェアの対応は当然必要になるが。
AMDもベクトル演算がどうのって言ってるから考えてはいるだろうけど。
Intelが考えてるManyCoreはより汎用的だろうけどね。
全てのコアで一応同じ演算が出来るみたいだから。
>>508 > エンコでよく使用する演算だけを強化したような奴
来年の暮頃に出てくるRev.Hはまさにそれ・・・・
ちっと悲しいよ > AMD
>>508 を見て、Anti-HTTって日立のSR8000みたいな擬似ベクトルによるエンコ系特化機能なのかなーと妄想
それならパフォーマンスが劇的に向上するというAMDの主張も理解できる
「ごく一部の処理において」という言葉が必要不可欠だと思うが
>来年の暮頃に出てくるRev.Hはまさにそれ・・・・ 笑いどころですか?
おまいら、静かに Tech Analyst Day を待つんだ
後藤の別人格がMACオタw
エンコードってベクトル化できないのかな? できたらすげー速くできそうなんだが
? 動画圧縮技術の中にベクトル予測はあるけど、nフレームとn+1フレームの誤差を判定してその結果を n+mフレームにも当てはめてみよういうだけで、実質はスカラの計算なんじゃないかなあ
非同期クロック批判わろす
科学技術演算に特化って、物理計算エンジンと同じ方向向いてるのかね ますますGPUとCPUの垣根が低くなるな…
522 :
CPU :2006/06/02(金) 14:06:53 ID:A4jL8GyD
記念カキコ
もうさ、ペグ4とMP3だけでいいよな。 自分で作る奴は全部Xvid(CBR)+MP3で統一してる。
多様性と競争が生まれないからだめぽw
多様性より互換性、競争より共同(オープンソースで)の方がユーザには利点あるっぽ
というか、普通にダメだろ?
>
ttp://pc.watch.impress.co.jp/docs/2006/0602/hot431.htm > 過去のWeitekなどを引き合いに出して、このようなコプロセッサは、一時的には成功しても、歴史的には成功していない、
> との質問が出された。もちろんこれは、成功するほどのコプロセッサなら、ムーアの法則によりその機能がプロセッサ内部に取り込まれてしまうことを意味している。
> HTXスロットと汎用の拡張スロット、特に高性能スロットであるPCI Express x16やx8のスロットとHTXスロットが競合する可能性を秘めていることに気づく。
> もしAMDのいうようにHTXスロットが高性能なのであれば、グラフィックスカードをPCI Express x16よりHTXスロットに使った方が良いのではないか、という意見が当然出てくるハズだ。
>>523 将来性で云えばH.264の実装だと思う。
うちのしょぼPCだとH264で15分くらいの動画エンコするのに3時間くらいかかるお・・・
このコプロをリコンフィギュアブルで作るってのはどうよ。 トランジスタ効率はやや悪くなるが、汎用性と処理能力が両立出来そうだが。
それなんてDSP? MSが温度取って、すごいCPUをやってくれればいいのにw
http://pc.watch.impress.co.jp/docs/2005/0506/gyokai122.htm ソニーが開発したVMEは、「リコンフィギュアブル(再構成)技術」を採用。これによって、双方の問題点を解決したのである。
VMEでは、複数の回路ユニットの接続構成と、動作設定を、それぞれソフトウェアによって変更することを可能とし、専用
ハードウェアで問題となっていた、機能ごとに回路を設計するという点を不要としたほか、VMEとCPUを1チップ化することで、
VMEが、リコンフィギュアブル技術によって最適専用回路に変身しながら、電力を食う重い制御部分を効率的に担当し、その
一方で、電力を食わないような軽い制御部分をCPUが担当することで、全体的な低消費電力化に成功している。
>>533 CoreArchitectureで言うMemory Disambiguationみたいなもんらしい。
成功したコプロセッサが内部に取り込まれると言うことは、GPUも将来的にはCPUに取り込むということ?
>>535 どうやら Memory Disambiguation とは違うみたい。
http://www.aceshardware.com/forums/read_post.jsp?id=115164546&forumid=1 Johan wrote:
> We have to see whether or not AMD's OOO loads is limited to loads being able to pass other loads,
> or this is full OOO loads + mem disamb. If it is the latter, 5-10% will be even conservative.
According to C't, AMD implemented the former, and not memory disambiguation as Intel did in Core 2.
>>533 投機ロードだろう、Conroeのを猿まねした感じだがどこまで模写出来たかは微妙だ。
>520 BluRay, HD-DVD に VC1 採用されたんだから今後は ハードエンコーダチップがビシバシ登場するでそ > WMV
541 :
u :2006/06/03(土) 01:31:39 ID:a3NKn8ne
やるじゃん
>>518 --そのようなスピード(−4,5GHz−)を(パイプラインを維持したまま)どうやって実現するのでしょうか。
> それこそ、Brian Curran(ISSCCで発表したIBMの4GHzチップに関する論文の主著者)が
> 明らかにしたことです。パイプラインのステージ数を維持するならば、各ステージの論理
> 回路数を半分にする必要があります。われわれは結局、回路に2倍、3倍の仕事を処理さ
> せ、一連のトランジスタに複数の機能を割り当てなければなりませんでした。これによって
> ラッチ間のゲート遅延を半分にできたものの、さらに回路に改良を加える必要がありました。
http://www.anandtech.com/cpuchipsets/showdoc.aspx?i=2748&p=6 > Finally, there is also a lot of headroom for increasing integer performance.
> The fact that Loads can hardly be reordered has been a known weak point
> since the early K7 days. In fact, we know that engineers at AMD were well
> aware of it then, and it is surprising that AMD didn't really fix this in the K8 architecture.
> Allowing a much more flexible reordering of Loads - even without memory disambiguation
> - would give a very healthy boost to IPC (5% and more). It is one of the main
> reasons why the P-M can beat the Athlon 64 clock-for-clock in certain applications.
むむむ...
コプロセッサ開発計画だそうです。 リアルタイムウイルススキャンとか負荷を引き受けてくれると楽だな。 www.itmedia.co.jp/news/articles/0606/02/news023.html
コプロの方に目がいくけど、メインはHT普及なんだろうな
547 :
545 :2006/06/03(土) 09:21:47 ID:sftTJTTQ
ごめん既出もいいとこだった。
インテルと同じことしてたら負けなのは分かりきってるから こういう挑戦的なのはいいと思うんだが。外野は現実的な事情を よく知りもせずにダメだしするのはいつものことだしな。
>>532 何故かその現940ソケット直挿しの構成については、AMDの発表に入って無いんだよなあ。
まあ既存のがそのまま使えて、AMDのCPUとして直接開発に関与する余地が無いせいもある
のだろうが。
いずれにしても、構成変更にかかる時間と消費電力、及び動作速度がどうなるかが肝だな。
恐らくマルチタスク対応で素早くダイナミックに構成変更はムリポだろうから、デスクトップ
向けには難しいだろう。
しかも「Java、XML、ベクタ、セキュリティ」のいずれの用途に構成設定するか、負荷判定を
しないと駄目だから、これらの処理を何処かで一括管理する様に、OS又はミドルウエアあた
りで処理しないと駄目だから、サーバー用途限定で一般ユーザーには無縁だろうし。
まあ、「Java、XML、ベクタ、セキュリティ」のいずれかの拡張カードが、標準で装備されてる
と考えれば、OSの設定でどれかをユーザーに選ばせるってのは有るかもしれんけど。
>>550 ハードウエア回路を書き換えして、別々の用途に使うって事。下記参照。
>>532 |XilinxのFPGA(Field Programmable Gate Aray)「Virtex4」を使用し、半導体回路を再構成できるため、
|さまざまな用途に応用できる。
FPGAの分かり易い事例なら、これを嫁。
http://plusd.itmedia.co.jp/mobile/articles/0505/09/news052.html |PLDとは、ソフトウエアで回路を設計することが可能なプロセッサ全般を指す。FPGAはPLDの1種でSRAM上に
|回路を展開し、電源起動時に毎回回路データをロードする仕組みとなっている。Cycloneでは、VHDL
|(Very High-speed integrated circuit Hard-ware Description Language)というハードウェア記述言語
|を用いて内部を書き換えることで、ハードウェアのエミュレーションを行うことが可能なもので、今回の
|1チップMSXでは、MSX規格の初期モデルとなる「MSX1」相当のハードウエアをエミュレーションで再現する。
AMD次世代CPUのFree Lunchに期待してみるテスト
コアごとのC'n'Q来るのか。楽しみだ
PLD→Programmable Logic Device FPGA→Field Programmable Gate Array ロジック回路を書き換え可能なデバイスのこと。
>>558 そりゃシングルコア・シングルCPUじゃつらいだろ。
chips cores
2 4 3000 Xeon 51xx 3057
1 1 2800 Opteron 1837
2 4 3000 Xeon 51xx 3057 1 1 2800 Opteron 1837 倍にして換算すればいいんだよ 2 4 3000 Xeon 51xx 3057 2 2 2800 Opteron 3674 そんなふうに考えていた時期が 俺にもありました
>>538 > > We have to see whether or not AMD's OOO loads is limited to loads being able to pass other loads,
> > or this is full OOO loads + mem disamb. If it is the latter, 5-10% will be even conservative.
>
> According to C't, AMD implemented the former, and not memory disambiguation as Intel did in Core 2.
やっぱりそうなんだ。K7,K8は各AGUがload,store共用なためか、store-loadのアドレス解決問題と同じ事が
load-loadでも起こるんだよね。新コアでやっとP6コア並みのOOOになる訳ね。
>>563 シングルスレッドベンチ?
10 2 4 2000 Pentium 4 Xeon LV 1663
14 1 2 3200 Pentium 4 1492
やべえSPEC CPUの公式登録スコアに間違い発見しちまったかも…(;´Д`) それどうみてもSossamanだよ。まちがってPentium 4 XeonでTrace Cacheで判定されたまま公式登録通ってるみたい…(;´Д`) 共有キャッシュのPen4 LV Xeonなんて存在しねえ…(;´Д`) IBMとSPECの中の人大丈夫か…。
別のページ見ればすぐわかるな 鯖分野ではたんなる価格競争になりそ しかし、Itanium2って整数演算へっぽこなのね 知らんかった
と思ったら見間違いだった 厳しそうだね
なんか急にこのスレが静かになったな。 AMDのTech Analyst Dayの衝撃的発表に放心状態なのか?
AMD側に何一つ好材料が無いのだから静かになるのは当たり前だと思うぞ。
ダーク・メイヤータンをなめんな、この本物め!
嘗めてないけど、4x4も全く反響なしw
そもそも今のAMDのチーム体制ってどうなってるんだろうか? 2チーム体制?
>>573 HTTみたいな2チームじゃないか?
余裕があるときは開発するーミタイナ。
それともプロセスルールのハンデキャップがあるんだろうか?
AMD側はメモコン対応にも忙しいから2チームじゃINTELに追従無理だろ?
おいおまえちょっと辞書で追従を引いてこい
「追随」も使えないのか。さすがだな。
ネトバでインテルがやらかす前は隙間産業みたいな仔細な技術的優位で生き残ってたわけだから 元の木阿弥な雰囲気が漂ってるんだよね。
>>579 この場合追随だろけど
追従にも追随の意味はあるね
INTELのマネっこしているんだよ。 だから追従で正解♪
真似をするなんて意味は無いが。 墓穴掘らんでいいよw
墓穴掘ってるのはお前らアム厨じゃないのか? Rev.Hで投機ロードらしき項目を見て喜んでいたら、それが実は・・・・ププ やっとP6レベルになるだけのこと? 笑わせるなよなw
Intelは、AMDが率先してx86の64bit化の研究開発してくれたんで、 x86-64の研究開発費が浮いたね。 本当によかったね。
そうだね♪
>>585 それは違うよ。
インテルはAMDに対抗して独自に64の開発を進めていたけどマイクロソフトからAMDと互換にしないなら
もうインテルはサポートしないと宣告された。
マイクロソフトにしてみれば違う仕様の二つのCPU用に二つのwindowsを開発するなんてありえない。
itaniumの情けなさにwindows打ち切ったりと結構ドライな関係なのよね。
>>588 実際の流れはそうだけど、結局Intelもそれを言い訳にして計画を実行せずに済んだという風に思えなくもない。
その辺の逸話は後々本になりそうだよね MSのとあるプログラマーがまた闘っちゃったようだし
>>590 >MSのとあるプログラマーがまた闘っちゃったようだし
くあしく!
>>591 こういう話があるすよ。
http://itpro.nikkeibp.co.jp/free/NT/WinInterview/20040621/1/ ------------------------------
[Muglia]いやあ,私はそうは思いません。でも私がどうしてそう思ったか分かりますか?
Daveのせいです。
――――Windows NTを開発したDavid Cutler(デビッド・カトラー)氏ですね。
[Muglia]ええ,DaveはまさにAMD64にかかわるあらゆる所にいました。Daveはそのチップの
設計と,非常に密接して仕事をしました。彼は本当に互換性があるものを作ろうとしていました。
そして,われわれが抱えている問題は,自分が持つアプリケーションをすべて総合的にサポー
トしたいということです。これらのチップはそういう目的のためには,まさに打って付けです。
------------------------------
ちなみに件の記事、"Local Memory"をLSのことだと煽ってるヒトがいるみたいすけど、 明らかにVRAMのことす。 ------------------------ The next slide goes on to say "Don't read from local memory, but write to main memory with RSX(tm) and read it from there instead", ------------------------ 要するに、CellからVRAMを読むとエラいことになるんで、RSXをつかってメインメモリ (XDR)へ 一旦書き出させたヤツを読み込め。。。という解説からもVRAMであることが判るす。
594 :
MACオタ :2006/06/05(月) 22:44:25 ID:+yg8ADA4
上のわ、ちょっとした誤爆す(笑) さて、Analyst Dayの話題すけど、結局のところK8Lわ ・L2わ減量。 ・FPU増強もCore2と同程度 ってことで、性能的に大きな期待を持てないことだけが明らかになったす。ただ「4x4」の方は x86プロセッサベンダのビジネスモデルを揺るがすかもしれないすね。。。 そもそも、x86プロセッサ市場の異常なのわ「n-wayでプロセッサ数が増えるほど単価が上がる」 という点す。仮に皆さんが乾電池でも買いに行くとして、8個パックで買うと単価が高いなんて納得 できるすか?本来部品であるプロセッサわ、沢山買うほど単価が安くなって、n-wayをサポートする マザーボードなりシステムわ、それなりに高価になるというのが自然なありかたす。
それでもXeonわ、基本設計わシングルソケット品と同じとわ言え、パッケージやキャッシュ構成等を 変えて、それなりの説得力を持たせていたすけど、AMDに至ってわ同じダイ、同じパッケージで8-socket サポート品で暴利を貪っていたす。 ところが性能に差をつけられた結果、尻に火がついたAMDわMPサポートのデスクトップ製品の リリースを計画している訳す。 これわPentium Pro以降にIntelが営々として築いてきたビジネスモデルを叩き壊し, Dual Celeronの 混乱期にまで戻そうかという勢いになりかねないすけど、ユーザーにとっては中々面白いことになり そうすね。 願わくばAMDが墓穴を掘ったなんてことにならずに、プロセッサ市場が健全化するという方向に向く ことを願っているす。
要約: Intel様バンザーイ
>>594 >そもそも、x86プロセッサ市場の異常なのわ「n-wayでプロセッサ数が増えるほど単価が上がる」 という点す。
ヒント:歩留まり
付加価値を値段に転嫁することは悪になるのか。 変な話だな。
>>597 --------------------
ヒント:歩留まり
--------------------
マルチコアの話でわ無く、こういうことを問題にしているす。
http://www.amd.com/us-en/Corporate/VirtualPressRoom/0,,51_104_609,00.html ・Athlon 64 x2 4800+, 2.6GHz, 1MBx2 L2: $645-
・Opteron 280, 2.4GHz, 1MBx2 L2: $851-
・Opteron 880, 2.4GHz, 1MBx2 L2: $1,514-
>>598 ------------------------
付加価値を値段に転嫁することは悪になるのか。
------------------------
n-socketの付加価値わシステムベンダのモノす。Intelだと設計まで代行してるので、
ちと意味合いが違うすけど。。。
>>601 -------------------
ヒント:需要と供給のバランス
-------------------
元々グレードを分ける必要が無い商品に、バランスも何も無いす。
あなたわ車のタイヤわ前左・前右・後左・後右でそれぞれ型が違って互換性が無いと嬉しいすか?
>>602 >元々グレードを分ける必要が無い商品
何故?
>あなたわ車のタイヤわ前左・前右・後左・後右でそれぞれ型が違って互換性が無いと嬉しいすか?
型では無いけど、タイヤの質だとレーシングタイヤ等では
前タイヤがハードで後タイヤがソフトとか組み合わせるでしょ。
あとコストに関して言うなら、Opteron 880にかけてるテスト工程にさらにコストがかかってるとか考えられるけど。
乾電池だってCPUだって大量購入すると割引があるのに何言ってんだろうねこの馬鹿は。 そしてよりパフォーマンスの高いシステムを組むためのCPUに高い値段を付けるのは悪。 どういう考え方をしてるのか理解不能です。
そりゃOpteron 880を大量購入すれば、さすがにAMDも割引いてくれるんじゃないかなw よく知らんけど
>>603 -----------------------
Opteron 880にかけてるテスト工程
-----------------------
本来、システムベンダが負うべきコストす。つーか、システムベンダでもチェックしてるので、
ある意味2重取り。。。
http://www.eweek.com/article2/0,1895,1955267,00.asp (例のOpteronリコール記事)
======================
The chip maker has been working with OEMs and other partners to identify the chips,
======================
>>602 高い値段でも欲しがる消費者がいるんだろ。
競争が緩いのが問題でintelがx86タダにすれば
競争が激化すんじゃね
今日のオタはおかしい。あまりにもアホすぎる。
デスクも鯖もモバイルも全部Opteron1構成だけにすればいいのに
Conroeの登場間近だからって、八つ当たりはよくないす
>>606 AMDはOpteron 880のテスト工程にコストかけて、
システムベンダは、Opteron 880を含めたシステム全体を含めたテスト工程にコストをかけると思っているのだが。
違うのか。
>AMDに至ってわ同じダイ、同じパッケージで8-socketサポート品で暴利を貪っていたす。 つまり8xxを4個じゃなくて、1xxを4個でも動いたという事?
614 :
・∀・)っ-○◎● ◆toBASh.... :2006/06/06(火) 01:28:22 ID:fZn03p89
それを言ったらXeonとPentiumの関係は(ry かつてはCeleronでも非公式ながらSMPできたんだぜ
300AのSMPは大層美味しかったで御座います
>AMDに至ってわ同じダイ、同じパッケージで8-socketサポート品で暴利を貪っていたす。 これはアレだ、ほとんどのCPUは1GHzだろうが3GHzだろうが同じダイ同じパッケージなんだから 同じ価格で売れという主張だな。Core DuoもCore Soloの価格で売れと。ははは。 こんな狂度の高いのは久々だ。
618 :
・∀・)っ-○◎● ◆toBASh.... :2006/06/06(火) 02:00:46 ID:fZn03p89
>>615 AMDのほうだけオーバークロックしてるのはCore2のすごさを誇張するためですか
いや、K8コアでもうまくすればここまで肉薄できるという話 (T_T)
620 :
tom :2006/06/06(火) 02:10:11 ID:JJ8G9Yy3
いいえ違いまぁ〜す。 あまりにも〜、差が〜つきすぎて〜みじめだったので〜OC〜して〜みまし〜た。 でも〜、OCは〜全然〜足りなかった〜ようでーす。 今度は〜4GHzまで〜OCして〜AMDの〜勝利を〜是非〜発表〜してみたいでーす。
tomの日本語がわりと上手だな。
無理しなくてもいいから、そっとしておいて下さい。
せっかくネトバチームAMDに引き抜いたんだから ここはTDP250W5.5Ghzとかでぶっちぎりで勝てばいいじゃん
624 :
tom :2006/06/06(火) 02:15:09 ID:JJ8G9Yy3
おー、私も〜そう思いま〜す。 ネトバはー、廻してこそ〜ナンボ〜。 AMDを〜爆熱の〜世界へ連れて行って〜くれまーす。
FPUが強化されてる点以外はそれほど大差でもないような。
626 :
tom :2006/06/06(火) 02:17:29 ID:JJ8G9Yy3
強化は〜ユニット単位でしか〜しませんから〜 SSEユニットは〜FPU共有の〜2つだけで〜す。
Woodcrestよ、かかってきなさい。
628 :
tom :2006/06/06(火) 02:19:44 ID:JJ8G9Yy3
>>627 この間〜、3GHzで〜2000以上を計測したので〜調子に乗って〜かかってきなさいと言ったら〜
3000以上を叩き出されて〜ちょっと〜ブルーに〜なりま〜した。
629 :
AMD :2006/06/06(火) 02:21:07 ID:ytY1szlw
Intelよ、かかってきなさい。
630 :
tom :2006/06/06(火) 02:27:24 ID:JJ8G9Yy3
AMDは〜いいま〜した。 なりふり〜かまって〜られないから〜4x4の〜ようにー、隠していた腕を〜無償で〜提供〜いたし〜まーす。 でも〜なぜだか〜見向きも〜されていませーん。 皆さん〜4x4は〜魔法の〜箱でーす。 だから〜、いっぱい〜買って〜くださーい。 そうでないと〜在庫が〜増えて〜しまい〜まーす。 今度〜調子こいて〜工場を〜借金してまで〜広げたから〜。 在庫〜増えるの〜ちょっと良くありません。
ネトバ使えば、簡単にFXなら3.99Ghz越えるよね? そうすれば絶対勝てるじゃんwなぜそうしない?
633 :
tom :2006/06/06(火) 02:33:00 ID:JJ8G9Yy3
AMDは〜いいま〜した。 いまのところ〜AMDでは〜ネトバを作れるほど〜技術力ない〜でーす。 Rev.Hの〜バージョンで〜やっと〜まともな〜oooらしき〜状態まで〜持って行ける〜程度で〜す。 つまり〜やっと〜P6の〜技術水準へと〜達することが〜出来そうだと〜言うことでーす。
tomにIntel入ってるとは思いませんでした。 本当にありがとうございました。
635 :
tom :2006/06/06(火) 02:42:39 ID:JJ8G9Yy3
AMDは〜いいま〜した。 ホントのところ〜、AMDに〜INTELと〜戦えるだけの〜技術力は〜ありませーん。 でも〜、我々は〜頑張り〜まーした。 L1を〜無理して64k+64kにすることで〜性能を〜ブースト〜し続けていたわけ〜ですけども〜。 更には〜メモコンを〜組み込んで〜相対的な〜遅さを〜カバーしてた〜わけですけども〜。 INTELを挑発してたら〜本気に〜なったよう〜で、Conroeという〜凄い刺客が〜やってきまーした。 今は危機的状況に〜なりつつありまーすがー、IBM等に〜助勢をお願い〜したところでーす。
636 :
・∀・)っ-○◎● ◆toBASh.... :2006/06/06(火) 02:48:03 ID:fZn03p89
AMDのL/Sを頻発するほどレジスタリネームが促進されるって仕様もある意味すごいけどな
>それでもXeonわ、基本設計わシングルソケット品と同じとわ言え、パッケージやキャッシュ構成等を >変えて、それなりの説得力を持たせていたすけど、AMDに至ってわ同じダイ、同じパッケージで8-socket >サポート品で暴利を貪っていたす。 Pentium2XeonやPentium3Xeon(Tanner)はキャッシュがコア等速で大容量ではあったな。 だが、それもキャッシュがオフダイだったから出来た訳でコアはPentium2/3と全く同じだった訳だが。 CoppermineではSlot1/Socket370でも1-2Wayまでサポートになったが、Slot2のPentium3Xeonも初期の CascadesコアはCoppermineと全く同じ仕様だったが。(後に1M/2Mキャッシュのも出たが。) Tualatinではキャッシュ256KByte版はシングル専用、512KByte版がDP対応ではあったが、256KByte版 は単にキャッシュを半分潰しただけだったが。 Netburstからはシングルソケット版とDP対応は完全に同じコアでパッケージ(ソケット)が違うだけだしな。 intelのDP/MPでもこれだけ色々方針が変わってるのに、いまさらいちゃもん付けるかね? Opteronは確かに1xx/2xx/8xxで全く同じ設計・ダイだが、逆に言えば1xxでも8xxでも開発費としては 8xx相当の金が必要なんだから、1xx/2xxは市場に応じた価格で安くしてあると考えるべきじゃないのか? (実際、8xx相当の価格のままじゃ誰も買ってくれんし。) XeonはキャッシュがオンダイになってからはDPと同等のMPプロセッサリリースまで1年〜2年ほど遅れる ようになって、性能に飢えたMP市場は大して必要とは思えないデスクトップの最速プロセッサを横目で 眺めながらお預けを食らってた訳だが、Opteronではほとんどのケースで8xx/2xxから最速プロセッサが リリースされるから、それだけでも十分金を取る価値はあると思うがな。 >ところが性能に差をつけられた結果、尻に火がついたAMDわMPサポートのデスクトップ製品の >リリースを計画している訳す。 これは日本市場向けだろうな・・・ TYAN曰く「日本には個人向けエンタープライズ市場という奇妙な市場が確かに存在する」ってことだし。 Registeredメモリは価格もさることながら、入手性も良くないからUnbufferedメモリが使えるというのは助かる。
俺はいやがる妹のパンツを、まで読んだ
一箇所訂正。 Tualatin-512Kは別ダイだな。同じダイを使ってるのはTualatin-256KとTualatin-Celeron。 Tualatin-512Kも生産縮小とNetburst優先の販売戦略で価格が下がらんかったな・・・ まあ、サーバー向けとしては同時期のXeonDPよりよっぽど良かったから、ある意味妥当な価格設定とも言えるが。 Opteron8xxの価格設定にケチつけるんなら、まずはintelにこう言って来い。 「Pentium4とCeleronは同じダイ・同じパッケージなんだから全部Celeronの値段で売れ!」とな。
>>637 -----------------------
intelのDP/MPでもこれだけ色々方針が変わってるのに、いまさらいちゃもん付けるかね?
-----------------------
部品業界の常識から考えて、Intelが考案した2つ(あるいわ4つ、あるいわ8つ。。。)買うと「単価」が
高くなるって商売わ、明らかに異常す。AMDがこのビジネスモデルに「タダ乗り」してるのわ事実
すけど、批判の対象わ商売のやり方自体にあることに注意して欲しいす。
そして、本来わn-wayシステムの付加価値とそれに伴う利益わ、システムベンダが提供/享受す
べきモノだということす。
,,―‐. r-、 _,--,、 ,―-、 .| ./''i、│ r-,,,,,,,,,,,,,,,,,,,,,,,,―ー. ゙l, `"゙゙゙゙゙ ̄^ \ / \ ヽ,゙'゙_,/ .゙l、 `i、 \ _,,―ー'''/ .,r'" .,,,、.,,i´ .,/^'i、 `'i、`` `--‐'''''''''''''''"'''''''''''゙ `゛ .丿 .,/ { "" ,/` ヽ、 `'i、 丿 .,/` .ヽ、 丿 \ .\ ,/′ 、ヽ,,、 ゙'ー'" ゙'i、 ‘i、.r-、 __,,,,,,,,--、 / .,/\ `'-,、 ヽ .]゙l `゙゙゙゙"゙゙゙゙ ̄ ̄ `'i、 ,/ .,,/ .ヽ \ ゙ヽ_/ .ヽ_.,,,,--―――――ー-ノ_,/゙,,/′ ゙l ," ` ゙‐''"` ゙'ー'"
あー・・・アホはほっとけ。 大量に出るものは安く、少ししか出ないものは高い。 こんな簡単な市場原理もわからんのだから。
>>640 物の値段なんて企業が自由に付ける権利があるんじゃないのかね。
独占企業だったらお前の言いたいことも分かるが、AMDっていう
建前上でも一応競合する企業があるわけだし。なんの権利があって
そんなこといってるんだw
俺はいやがるMACオタのペニスを、まで読んだ
×4 の L2 サイズ、MACオタの予想(
>>266 ) と ando さんの予想が
食い違っていたが、結局 ando さんの方が正しかったですな。
まあ、当たり前だが。
例の4コアのダイレイアウトで気になるのはL3がどこに接続されるかだな・・・ 従来のコアとSRIの間に入るなら、あのレイアウトでは厳しいような気がするんだが。 それにただHT-Linkで繋いだだけの4コアなら共有L3という表現もおかしい気がする。 本当にただ繋ぐだけなのかね? あと、レイアウトからするとメモリコントローラもう一個載せられそうに見えるが。 Socket940は結局リザーブされたピンを使うことなくデュアルコアにすんなり移行したが Socket-Fでは更に260ピン以上増えるのは本当に電力供給の強化だけなのか? いざとなったら、もう一組メモリバス引っ張り出すためだったら面白いんだが・・・ DDR3では1chあたり1スロットになることを考えると2組出せれば4スロット確保出来るしな。
>それにただHT-Linkで繋いだだけの4コアなら共有L3という表現もおかしい気がする。 コアの中はHTリンクはしってないぽ
648 :
tom :2006/06/06(火) 16:22:18 ID:JJ8G9Yy3
L3がL1L2との排他キャッシュ扱いならL3に引っ張られて酷く遅くなりそう。 どう考えても効率悪くなるな。 なんで共有キャッシュなんだ?
今後メモリアクセスがCPU性能のボトルネックになりそうだから?
non-inclusive なのは間違いないけど、L3 は共有キャッシュなので、完全排他にはならんだろう。ってゆうのを、このスレのちょっと前で話してなかった?だったら L3 にひっぱられて遅いってことにはならないかもよ。
651 :
tom :2006/06/06(火) 17:21:22 ID:AHE1ApWD
完全排他にしとかないと整合性取れないだろう?
>>648 >どう考えても効率悪くなるな。
なぜ効率悪くなるのか聞きたい。
653 :
tom :2006/06/06(火) 18:25:53 ID:M+oliV7u
L1L2まではコア毎に独立したキャッシュを持つ。 ここまでは今まで通り、 1)新たにL1へメモリよりデータをロードする。 2)L1へロードする為保持していたキャッシュを追い出す必要が生じる。 3)L2がL1より追い出されたキャッシュを受け入れる為にL2の保持キャッシュを追い出す必要が生じる。 ----------ここまでは現状どおり------------ 4)L3がL2より追い出されたキャッシュを受け入れる為にL3の保持キャッシュを追い出す必要が生じる。 5)L3から追い出す保持キャッシュが更新状態ならメモリーへの書き戻しが発生。 ここで、L3は共有キャッシュであるから4つのコアから同様な要求が多発する。 そして1)〜5)まで完結しないとL1のロードは完了しない。
詳細は知らないけど、L3はwritebackになるんじゃないかな。
655 :
tom :2006/06/06(火) 18:46:29 ID:M+oliV7u
L3を排他キャッシュで保持するのなら(というかL1L2が排他構造ならそれしかない)共有しない方がよさそうに思う。 共有したところでコヒーレンシはL1L2で発生するし、L3はものすごく遅そうだし
>>645 OpteronX4のキャッシュが256KBではないか?
というオタの予想に対して、「AMDがキャッシュ256KBでも性能は問題ないと判断したんだろうね」という意見もあったが、
256KBでは示しがつかなかった(故に生産に問題あり?)のか、それとも256KBでは性能に問題が生じるということなんだろうか?
>>653 君が考えてることぐらい、AMDも考えているとなぜ思わないのか?
そんなカス発想しかカキコできないのなら、半年romってろよ。
658 :
・∀・)っ-○◎● ◆toBASh.... :2006/06/06(火) 19:49:01 ID:fZn03p89
共有のL3まで持ってそれがたかだか2MBしかないのと、4MBの共有キャッシュ型デュアルコアをニコイチにするのと どっちが性能的に有利かなんて判断しようが無い希ガス。 L3積むならたとえ半速以下でも16MBくらい積んでやらないと。
660 :
・∀・)っ-○◎● ◆toBASh.... :2006/06/06(火) 20:11:53 ID:fZn03p89
少しだけOpteronの擁護に回らせてもらうけど L1=64K+64K, L2=512KBの排他キャッシュの4コアだとすれば共有2MBのL3キャッシュなんて 下手すりゃL1+L2の総和(3.2MB)のほうが大きくなって意味ないんですわ。むしろメモリレイテンシ大きくなるだけ無駄。 キャッシュの容量を設計段階から敢えて押さえ込めば、エントリ数が少なくなるためレイテンシを小さくできるっしょ。 512kや1MB前提の設計で選別漏れをキャッシュを一部殺して256kにしてるのと、最初からパフォーマンス狙って 256kにしてるのとでは明らかに性能が違うと思うのです。 Macオタのミスリードに乗せられてはいかんよ。 かのTulsaだってL2を1MBに敢えて落とした上で16MBの共有キャッシュ搭載ですぜ。
661 :
・∀・)っ-○◎● ◆toBASh.... :2006/06/06(火) 20:15:48 ID:fZn03p89
×3.2M ○2.56M
2+BM
×2+BM ○2+MB
L2が512KB×4でL3が2MBだと、メモリへライトバックする為だけのバッファだな かえって足かせになるからリードキャッシュとしては役に立たん
666 :
tom :2006/06/06(火) 20:39:07 ID:M+oliV7u
>>664 Victim Cacheは無理。
だって、L1L2が排他キャッシュであるからメモリロードは必ずL1だ。
Victim Cacheは、キャッシュミスでL2へロード。
>>660 それ擁護じゃなく叩きと思う。
667 :
tom :2006/06/06(火) 20:46:36 ID:M+oliV7u
L2を共有キャッシュにすると、コヒーレンシ処理で有利となる。
これは、L1のみ処理すれば良くL1はL2よりずっと速度が速いからだ。
OpteronのL3共有キャッシュ増設の意図は良く分からない。
L1L2が排他であれば、どうしてもL1L2ともにコヒーレンシ制御が必要で、L2はL1よりずっと遅い。
その状況を放置したままL3キャッシュのみを共有にしてなんのメリットがあるのやらだ。
下手に保持するとかえってL1ロード時に
>>653 の理由からタイムロスを生じてしまい良いことはないように思う。
とりあえず、Victim CacheはキャッシュミスでL1へロードすると思います。
マルチソケット前提のOpteronでL2共有って意味あるんかね?
670 :
・∀・)っ-○◎● ◆toBASh.... :2006/06/06(火) 20:55:59 ID:fZn03p89
たったの2MB程度しかない4コア共有のL3キャッシュを有効活用するのに L2を512kにするとか1MBにするとかいうほうが間違いでそ そもそも排他キャッシュはL2の容量が少ないときが最も効果を発揮する筈なので まぁ、アリじゃないかな。 IntelはL2の大容量化・共有化でレイテンシを犠牲にしてるけどAMDは逆にL2を小さくして低レイテンシ路線を狙ってみるのも ありだと思うのです。
いずれにせよ「くっつけただけ」の4コアでは共有L3キャッシュは有り得んことは確実だな。
いずれにせよ〜ない 有り得ない 確実 …どれか一つにしろよ、くどい
>>670 > IntelはL2の大容量化・共有化でレイテンシを犠牲にしてるけど
INTELのL2共有キャッシュは滅茶苦茶高性能なんですれど・・・
>
ttp://www.2cpu.com/review.php?id=112&page=4 > そもそも排他キャッシュはL2の容量が少ないときが最も効果を発揮する筈なので
実際はL2大きいほうが高速(256Kと512Kと1Mまでの対比でそれぞれ5%程度性能向上する)
もちろん、1M以上だと疑問ではある。
> AMDは逆にL2を小さくして低レイテンシ路線を狙ってみるのもありだと思うのです。
L3積んだから仕方なく小さくしたとしか思えない。
低レイテンシになったとしてもヒット率減るから相殺されるよ。
実はL3はZ-RAMで12MBもあった。
>実際はL2大きいほうが高速 そりゃ当たり前だ。L2が大きいと排他にする意味がないって話でそ。
676 :
・∀・)っ-○◎● ◆toBASh.... :2006/06/06(火) 21:23:05 ID:fZn03p89
>>673 > INTELのL2共有キャッシュは滅茶苦茶高性能なんですれど・・・
日本語でおk
たしかにHWプリフェッチのおかげでシーケンシャルなロードは強くなってる印象があるけど
ランダムテーブル参照には弱いですよ。
まぁ排他キャッシュは連続でのロードに弱いんでまぁアレですが
>たしかにHWプリフェッチのおかげでシーケンシャルなロードは強くなってる印象があるけど >ランダムテーブル参照には弱いですよ。 L2キャッシュに何を言ってるのかと小一時間(ry
>>676 ランダムと言っても規則性があるケースが多いから応用ソフトだとINTELのプリフェッチ機能は役に立っている。
そして全く不規則ならば、キャッシュそのもののヒット率は大きく低下する。
そんなソフトは元々から高速CPUを使うメリットはない。
P2-450程度で十分だ。
680 :
・∀・)っ-○◎● ◆toBASh.... :2006/06/06(火) 21:30:31 ID:fZn03p89
ん? BLASTに使われてるSuffixTreeとかACとかってランダムテーブル参照に近いと思うけどな。アレがPen2程度で十分?www
キャッシュが効かないと言ってるだけだ。 SuffixTreeとかACも結構キャッシュ効いているよ、何ならL2切って確かめてみろ。 ついでに、規則性がありINTELのプリフェッチ機能が最も効率よく機能しているソフトの代表例がπ焼きだ。
AMD Efficeon
683 :
・∀・)っ-○◎● ◆toBASh.... :2006/06/06(火) 21:36:40 ID:fZn03p89
キャッシュが利いてるってのはわかるが、レイテンシ短いに越したことは無いっしょ。 キャッシュにヒットしないのは問題外としても。
πってFFTだからランダムライトかランダムリードがあるはずだけど。 L2のランダムアクセスに関しては、依存性のあるランダムなら レイテンシをもろに食らって遅くなるけど(トリップ検索など)、 各ロードに依存性がなければ並列実行できるからランダムでも Intelの共有L2はけっこう速い。
685 :
・∀・)っ-○◎● ◆toBASh.... :2006/06/06(火) 21:44:41 ID:fZn03p89
「明示的並列化マンドクセー」が本音
>>683 それはそうだが、L2を小さくしてってのが疑問。
それとAMD社の場合、L1L2排他構造だからハードプリフェッチ機構の強化は難しい。
INTELは要所要所でL2へのプリフェッチ、L1L2へのプリフェッチを上手く使い分けている。
L2キャッシュも大きくラインあたりのキャッシュ保持能力も高いからより効果的だ。
ここではハード目線でキャッシュの性能を論じている。 プログラマはどう書けばキャッシュの性能をフルに引き出せるかを論じている。 面白いね。
HoudがL2:512KB、L3:2MBだとすると L1L2はInclusionでL3がVictimキャッシュというのが一番理想?
689 :
・∀・)っ-○◎● ◆toBASh.... :2006/06/06(火) 21:53:27 ID:fZn03p89
つか、Intelって昔からレイテンシ重視でL1(もしくはL2まで)のキャッシュをわざと小さくするチューニングするでしょ (まさにItaniumやNetBurstがそう) それでベンチにはめっぽう強いんだ。
ハードウエアプリフェッチがやりにくいってのも排他キャッシュのデメリットなのか。 仮に排他をやめる場合、どのくらい設計変更の手間がかかるんだろう。 俺は512KB*4+2MBってバランスいいと思うけどな。
>>688 AMDが本気でキャッシュ構造を変えるのならそれが理想でしょう。
>>689 INTELはdual portだからL1が3クロックでも十分速い。
>>690 アクセスの仕組みが根本から変わる。
排他構造であることからAMDの場合、L1L2へ同時に発令している。
Inclusionだと、L1ミスでL2へ発令。
InclusionでもL1L2へ同時に発令してL2レイテンシ隠蔽とかしてそうじゃない? あとK8のL1はロード*2やロードストア同時やストア*2ができて IntelのL1より速いと思う。容量もでかいし。 ただし、2wayというのが弱みやね。
>Inclusionだと、L1ミスでL2へ発令。 意味不明。 Inclusionと関係ないじゃん。
>>692 > InclusionでもL1L2へ同時に発令してL2レイテンシ隠蔽とかしてそうじゃない?
両方にヒットするからそれは不味い。
> IntelのL1より速いと思う。
>>673 の表で32KBまでを確認しる。
>>693 L2への発令は、ヒットした場合L1へのロードでもある。
同時に発令すると、L1が更新されていた場合、L2発令によりL2保持値に置き変わってしまうから無理。
排他構造だとそのような問題を生じないからOK。
AMDはそのことを強調しているよ。
>両方にヒットするからそれは不味い。
もちろん、両方にヒットしたらL1から読むようなロジックを追加するのさ。
>
>>673 の表で32KBまでを確認しる。
このベンチでは、ということでしょ。
Opteronの数字は理想状態よりかなり低い。
まあ、これもL1性能の一面なのは確かだけど。
(絶対クロックが低いといのもある)
正直、こういう数字を見るとわからなくなるが、
単にベンチ結果を見てIntelのL1が速いと思っているなら
反論したいと思ったまで。
698 :
Socket774 :2006/06/06(火) 23:53:48 ID:dppsqkgh
>>212 > 特定用途向けのエンコード/レンダリングアクセラレータみたいなのも確かに面白いかな。
CPUごとマルチメディアに特化してしまったのがネットバーストなんじゃないの?
と、聞きかじりの知識でレスしてみる。
それにしてもお前ら詳しいな。
電気系の学科出身なのか?
数学科卒の俺にはついていけん。
699 :
Socket774 :2006/06/06(火) 23:55:04 ID:dppsqkgh
所で、共有L3はZ-RAM?
一般的には、小さなcacheは高速だがヒット率が低くなる
INTEL万歳! 万々歳! INTEL万歳! 万々歳! INTEL万歳! 万々歳! INTEL万歳! 万々歳! INTEL万歳! 万々歳! INTEL万歳! 万々歳!
RAM領域なんて後付で如何とでもなるだろうからZを持ってくる可能性有るかもね。 DDR3って早いねぇ K8このまま順調に生き残れば良いけど 帯域確保に動いたAMDって ちと時代を先取りしすぎたか?
>>700 Z-RAMは製品になるまでに2年は掛ると言ってたから早くて2008年以降
過去の例では2年ってだけだからなあ。 Houndが出てくる頃には提携発表してから1年半は経ってるし、Innovative Silicon側にも ノウハウがたまってて早くインプリメント出来るかもよ。
そしてZ-ramを使用した、 Ζ-Opteron が登場
んじゃ、その次はインタリーブして ZZ で・・・
Z-RAMは本来、次世代のメモリとして使うのが正しい用法。 キャッシュとして使用するのは無理がある。
>>708 ということは将来AMD専用メモリみたいになるということ?
RDRAMみたいな悪夢になりそう。
L3キャッシュって、キャッシュをキャッシュするん? あほや。 排他キャッシュなら、芯に近い側を大きくして、トロい外側を無しにする方が 速いんと地がうん?
一般的に速度と大きさは反比例
712 :
Socket774 :2006/06/07(水) 11:10:53 ID:JHoWzvxa
713 :
Socket774 :2006/06/07(水) 13:23:25 ID:53zcTtoa
>>667 L2共有がコヒーレンシ制御で有利なのは確かだが・・・実際にどの程度の頻度で
コヒーレンシ制御によるペナルティが発生するか疑問だな。
複数のスレッドが共有するアドレスにアクセスする場合でも、それぞれのアクセス
タイミングがコヒーレンシ制御のタイミングとずれていればペナルティはない。
共有アドレスへのreadが多く、writeが少ない場合もペナルティは少ない。
4コアともなれば全てのスレッドが共有アドレスを参照し、尚且つ、read/writeが
混在するアクセスが同時に集中する確率は極めて少ないと思うがな。
しかも、マルチソケット環境下ではL2共有によるコヒーレンシ制御の利点は消える。
リスクの割には大した利点じゃないな。
>L3キャッシュ 遠い昔を思い出して感傷に浸った。
個人的にはL3キャッシュ云々の話が出てくると、CPUの本質的な進化がドン詰まってきてるなぁと感じる
CPUというよりメインメモリがドン詰まってるから キャッシュなんて話をしなきゃならなくなるわけで・・・ なんとかならんもんかね
改革が必要なのはCPUとかハード面よりも、ソフト面の方がでかいような気がしないでもない OSとか特に 業界全体を一度リセットできたら、たぶんユーザーには幸せな結果になると思う クビくくるヤツもそれなりに多そうだが だけどその先を考えればそっちの方がいいね 業界の連中は一丸となって後に続く者たちの礎となるのだ!
ソフト面の進化ってないよね。 ハード面の進化を食いつぶすような仕様しかない。
ソフトも進化してるとこではしてるよ。 食いつぶすようなソフトのが多いのは確かだけど。。 あと、非常に大規模なソフトを作るのは、 CPUパワーを食っても開発効率を優先するしかない。 でもWindows重すぎだよ何とかしろよHDDも食いすぎだよ。
>>713 pen4のHTやpenDはそれで極端にパフォーマンスが落ちるトラブルが発生したからインテルとしては。
コヒーレンシの応酬でデッドロック状態になる稀なケースが有名なソフトで発生してしまった。
サーバーだったかデーターベースだったか。
>>713 コヒーレンシ制御の負荷は共有アドレス以外でも当然のように発生する。
競合しなくても、他のコアが認識するL1,L2内に有効なキャッシュを保有しているかの確認を行う必要があるからだ。
つまり1つのコアからロード要求が出て自L1,L2内に有効なキャッシュがない場合、
他のコアに該当アドレスの有効キャッシュの有無を確認する必要が生じる。
これを受けて、他のコアは一斉にL1,L2内を検査することとなる。
L2が共有化されておれば、共有代表コアにのみL2内検査を行えばよく遥かに負荷は軽くなる。
>>722 >共有代表コア
まず、この単語について説明してくれ。
検索して見たが見つからんので意味不明だ。
貴方方に判り易く伝える為にそう表現した。 L2のコヒーレンシ制御は共有化されているキャッシュ単位で良いということだ。
725 :
Socket774 :2006/06/07(水) 19:05:54 ID:+PzfC7Ru
>>724 自分語使ったら他人には解り難くなるだけだろw
>>726 勝手に専門用語と思い込み非難されたら堪らんな。
メインメモリレイテンシはPC9801時代より悪化してる
そらあんた、あの時代はメモリノーウェイト、なんぞという 売り文句があった時代だし。
仮に1T-SRAM対応になったらどんくらい速くなるんだろ。
第14回 PCのエンジン「プロセッサ」の歴史(8)〜Intelに挑戦し続けるAMD
2. NexGenの買収でAMDはIntelのライバルに
http://www.atmarkit.co.jp/fsys/pcencyclopedia/014procs_hist08/procs_hist16.html >ベンチマーク・テストを基準にモデルナンバーを設定することには、
>以下のような問題があると、筆者は思っている。
>
>1. ベンチマーク・テストの大半はシステム・レベルの性能を計測するものであり、
>プロセッサ単体での性能と必ずしも一致しない
>2. ベンチマーク・テスト自体が、PCの利用環境の変化などにともない、
>毎年のように更新されるものなので、過去の製品に対する相対性能さえ計測することが困難である
>3. ベンチマーク・テストは、ときに極めて政治的なものであり、
>プロセッサあるいはコンピュータ・システムが持つ性能のある側面を計測するものでしかない
>>722 ・・・キャッシュ間で共有しているデータの同期を取る制御をコヒーレンシ制御というんだがな。
まあ、それは置いとくとしてもその例をConroeに当てはめてみたのか?
Conroeでは「1つのコアからロード要求が出て自L1,L2内に有効なキャッシュがない場合」は
問答無用でメモリを読みに行くしかないんだがな。
なにせ、2つのコアがL2を共有してるんだから、もう一方のコアに問い合わせたところでデータが
あるはずないんだから。
更にConroeの場合、L1/L2はInclusiveだからL2にないものはL1にもあり得ないんだが?
Woodcrestでマルチソケット環境なら、FSB経由で別ソケットのコアに問い合わせることになるがな。
接続しているチップセットがBlackfordなら、結構大変だな。
別ソケットに問い合わせるのにFSB→Blackford→FSBと2回もFSBを経由しなきゃならんし、問い合わせの
結果も同じルートを辿るからな。
メモリはBlackfordに接続される訳だから、いっそ普通にメモリを読みに行った方が速いかも知れん。
議論の本筋からそれて申し訳ないが、Inclusiveって本当? 少なくともprefetchnta命令を使ったときはL2を汚染せずL1にロードするはず。 他にも、何らかの理由でL2が汚染されたときにL1のデータも「消さない」という 手もあって、ヒット率だけならこっちのがいい。
>>734 そのパターンがあるのか・・・ただ、キャッシュに格納された値はL1/L2で違うかも知れんけどアドレスは一緒じゃない?
ロード要求が出る場合、指定するのは値じゃなくアドレスだから結局引っかからないはずだけど。
アドレス一緒で値が違うってのこそ嫌なんじゃないの? あまり詳しくはわからんけど。 L1L2のタグを引くくらいはキャッシュレイテンシで 隠蔽できそうな手間にも思える。
・・・んー、どうなんだろ? 従来のintelCPUならL1はwrite through/inclusiveのはずだからL1にあるアドレスはL2にもあると思うんだけど。 値については確かに違うのは気持ち悪いが、write throughでもL1とL2ではレイテンシが違うから、瞬間的には そういう場面があるんじゃないかと思うが・・・ とりあえず、本題のコヒーレンシ制御とは全く違う話だな。
P6/PenMはライトバック式です。 ていうか今のx86でライトスルーはP4くらいのもの。
>>738 Thanks!
俺も今検索してて見つけた。
つーことはL1にあってL2にないデータが一時的に発生する場面はある訳か・・・
一応、L1に問い合わせることはあるんだな。
・・・ただ、
>>722 の言うように共有/非共有関係なしに問い合わせてまわってたら、マルチソケット環境じゃ
たまらんな・・・4MByteものキャッシュの内容をいちいちバスを通してたらバスがすぐに飽和する。
単純にタグで管理してるんじゃないの?
あー・・・書いてから気がついたが4Mも通す必要はないか。 欲しいアドレスの情報だけ通せば済むな。 だが、K8の方もSRIとキャッシュ間は双方向独立バスだからそれほど遅くないはずだがな。 むしろ、一旦SRIに要求出したらSRIから別コアへの問い合わせと同時に外部コアやメモリコントローラに 要求アドレスのパケット投げて一番最初に帰ってきた奴を返すだけだから、ベストケースでは若干劣るが ワーストケースの落ち込みは少ないはずだがな。
>>734 > 少なくともprefetchnta命令を使ったときはL2を汚染せずL1にロードするはず。
> 他にも、何らかの理由でL2が汚染されたときにL1のデータも「消さない」という
> 手もあって、ヒット率だけならこっちのがいい。
不可能だよ。
Inclusiveの場合・・命令の種類として、L2だけへのロードとL1L2へのロード、L2からL1へのロードの3種類しかない。
743 :
722 :2006/06/08(木) 01:41:51 ID:GSiP5Bo4
> ・・・ただ、
>>722 の言うように共有/非共有関係なしに問い合わせてまわってたら、マルチソケット環境じゃ
> たまらんな・・・4MByteものキャッシュの内容をいちいちバスを通してたらバスがすぐに飽和する。
自環境のL1L2に有効データが存在しない時、メモリよりロードする前に他のコアに必ず問い合わす。
これ常識であり、それしないと論理的にコヒーレンシ制御できない。
当然のことだが、Opteronも同じ。
問い合わせが不要なケースは、自環境のL1L2に有効データが存在し、そのデータが非共有データであった場合だけだ。
>733
> ・・・キャッシュ間で共有しているデータの同期を取る制御をコヒーレンシ制御というんだがな。
共有非共有の判断をする為にも問い合わせするしかないんだよ。
> Conroeでは「1つのコアからロード要求が出て自L1,L2内に有効なキャッシュがない場合」は
> 問答無用でメモリを読みに行くしかないんだがな。
Conroeの場合は、他コア(外部ソケットのみ)が存在しないから問い合わせは発生しない。
Woodcrestを想定して発言しているだけだよ。
> 接続しているチップセットがBlackfordなら、結構大変だな。
全然たいしたことないよ、それより必ず他コア全てにL2の問い合わせを行うOpteronよりましだ。
744 :
・∀・)っ-○◎● ◆toBASh.... :2006/06/08(木) 02:06:36 ID:qiLuZGZt
NetBurstと同じく上り下り計256bit/clockのL1帯域を誇るPPC G5もライトスルーだから Core2もライトスルーの可能性高いんじゃね?
745 :
722 :2006/06/08(木) 02:20:20 ID:GSiP5Bo4
> 別ソケットに問い合わせるのにFSB→Blackford→FSBと2回もFSBを経由しなきゃならんし、問い合わせの > 結果も同じルートを辿るからな。 > メモリはBlackfordに接続される訳だから、いっそ普通にメモリを読みに行った方が速いかも知れん。 実際の速度計算してから言ってくれ。 この書き方は、故意にFSB経由だと物凄く速度が低下するかのように表現している。 メモリからの読みだしがどれほど大きな時間を要するか知っていてこのように書くのは悪意しか感じられない。 L1L2の走査時間、コアtoコア間(FSB経由)の送信時間に分けて正しい物言いをしてくれ。
746 :
・∀・)っ-○◎● ◆toBASh.... :2006/06/08(木) 03:51:09 ID:qiLuZGZt
>>745 実際の速度を計算するのは無理だな。
問い合わせの間、2本のFSBをロックして、他のコアからのアクセスを全部ブロックすると言うなら話は別だが。
SCSIと同じように、一旦問い合わせを投げ終えたらバスを解放してやらんと、バスの使用効率が悪すぎる。
解放されてる間、他のコアがどの程度FSBを利用して、どの程度待たせることになるかなんか単純には計算できん。
まあ、理想状態で他のコアは何もしてないってことならある程度は計算できるだろうが・・・何もしてないコアが
要求するデータを持ってるとも思えんから、ナンセンスだな。
マルチドロップのパケット通信で開けてやるも糞もないが。
>>742 いや、不可能と言われても、できるんですが。。
>Inclusiveの場合・・
だから(P4はそうかもしれないけど)P6もPenMもCoreも
Not Inclusiveなんだってば。
>>749 それを可能にしてしまうと、
自L1→他コアへの照会(L1)→自L2→メモリロードになる。
効率悪いと思うけどな。
俺がCore DuoやCore2 Duoを作ったらメモリから直接L1へのプリロード命令はuOPに変換するときに L1,L2へのプリロード命令に置き換えてしまう。 そのほうがずっと効率がいい。
ついでに言うと、
>>751 ではロードデータをL1キャッシュへの転送の完了までが同期していればよく、L2への転送は完了するまで、
ロード待ちストリームに保持しておくだけで良いから効率は全く悪化しない。
俺が知ってるのはprefetchnta命令を使った、ストアを含むアクセスの場合。 この命令はP6/PenMでL2を汚染しない(俺はCore2もそうだと思う)。 L2が使われないため、L1の変更をL2にライトバックしなくて済む。 L1L2両方へプリロードする命令を使うときよりもずっと効きがいい。
すまん、今素でIntel次世代スレと勘違いしてた。 昨日はスレ違いの自覚があったんだけど、何この流れ。移動しようか?
>>753 >>751 ,752で効率変わらんし、
L2へのライトバックはL1より追い出すときで良い。
デュアルコアでL2を共有キャッシュ化しているのだからそうする。
このスレレベル高杉・・・ 自作板の中では際立ってるな
preftchntaって高速化に重要な命令だと思うんだが。 この命令を使っているコードが1割遅くなってもいいの? もちろんライトバックはL1から追い出すときだが、 連続的にアクセスするとどんどん追い出される。 実際にL2を通すとハッキリ遅くなる。
>>757 遅くならないよ。
同期しているのはL1への転送までだし、次にライトバックだって
L2へのロード待ちストリームへ追加するだけだから遅くならない。
L1はロード待ちストリームへ追加後に直ぐにつかえる。
そしてL2への転送はラインが空いておれば直ぐだし、開いてなくてもメモリへの吐き出し後直ぐに転送してしまえる。
L1に付いては全く速度低下しないよ。
それと、L2を経由することでメモリへの吐き出しと同期を取らなくて良くなるから逆に速くなる。
>>758 ゴメン、俺は実測して言っているのだ。
単純にストア帯域をはかると、prefetcht0よりprefetchntaが速い。
確かにその理屈は納得できる。なんでこうなるのかな。
あと、別にNot InclusiveでもL1タグを変更したら知らせる
共有タグをL2タグの横に置けば問題なくね?
(素人考えスマソ)
>>759 いやだから、prefetcht0よりprefetchntaでは全然違うでしょ?
prefetcht0だと751,752にはならずL2への転送が完了するまで待ちが発生する。
だろ?
スレ違いな気もするけど面白いから続けて下さい。
>>760 prefetcht0だと、ロードだけなら高速なんだよね。
751,752とprefetcht0の違いがわからんす。
> 別にNot InclusiveでもL1タグを変更したら知らせる > 共有タグをL2タグの横に置けば問題なくね? いや、置く場所ないでしょ、排他キャッシュだよ。
ええと、Core2の話をしているんだよね?違うの? 排他って何。
>>764 いや、Not Inclusiveって書かれてたからAthlon64のことを言ってると思ったよ。
で話をCoreに戻すと・・・
L2タグに置く位ならL2へのロード待ちストリームへ追加するほうが速いでしょ。
空き見つけるの時間かかるよ。
>>765 そういうことは大体知っている。
prefetcht0は751,752とはどう違う動作なの?同じだと思うけど。
>>766 Not Inclusiveってのは完全なInclusiveではないって意味ね。
例えばPenMはprefetchntaでL2を汚染せずにL1へロードするから
Not Inclusiveになる。
>>767 いや、
>>766 で分からないかな?
prefetchntaが
>>751-752 だとするとL2への転送がかなり遅れちゃうでしょ?
だって、ロード待ちストリームの最後にロード済みflgとL1転送済みflgをONでL2転送済みflgがFFな状態で追加される(報告不要)。
>>765 の書かれている通りの仕様じゃん。
Not Inclusiveで、L2が共有のデュアルコアとする。 すると、コアAでL1L2ミスしたときに、コアBのL1を調べないといけない。 で、それは面倒だから、L2にないデータをコアBのL1で変更したときに 共有L2のタグ(の横)に記録しておけばいいんじゃないかなあと思った。 >L2へのロード待ちストリームへ追加する すまん、意味がわからんかった。どこからどこへ?
もし、L2の保持キャッシュを破壊したくない命令だとすると、それは共有キャッシュ化することでコヒーレンシ制御の効率を優先し
>>751 ,752に置き換えると俺は言ってる。
つまり、L2の保持キャッシュは洗い流されることになる。
でも、俺ならそうする。
>>771 なるほど。つまり、完全なInclusiveにすることを選ぶということか。
じゃあprefetcht0がストアで遅いのはなんでなんだろうなあ。。
>>772 ストアが遅いのかL1への転送が遅いのか不明だよ。
俺だったら、
>>769 みたいなNot Inclusiveにしたい。
>>773 不明だね。気になるけど、とりあえずわからないなら仕方ない。
>>773 ストアが遅いのかL2への転送が遅いのか不明だよ。に変更。
まあ、プリフェッチの謎は残ったけど、 771案か769案か、どちらもアリでOK?
ノンテンポラルなストア命令の場合、L2へのロード待ちストリーム上にあるケースだと L2への転送を打ち切りメモリ書き出しストリームに追加するだけで良いからね。 これは速い。 もちろん、ロード待ちストリームも大きさに限りがあるから処理が進むとL2で保持されることになり その場合はそこからの吐き出しとなる。 共有キャッシュの特性を考えたらこうなる。
>L2へのロード待ちストリーム上にあるケース どういうケースですか。誰が何を待ってるのかわからない。
そろそろ整理
基本形は
>>751-752 で良く、prefetchnta命令の場合L2保持不要flgをONにしておけば良い。(ロード待ちストリーム)
L2保持不要flgがONのストリームはストア命令によりロード待ちストリームに存在するときはL2への転送を打ち切り
そのままメモリ書き出しストリームに追加する。
L2保持不要flgがOFF(prefetcht0)のものは、L2で保持する必要がある為、ストア命令が発令されてもL2への転送完了を
待つ必要が生じる。(遅くなる理由)
これで疑問は全て解消かな?
>>778 アドレスマッチングに決まっているさな。
ストアはntaとt0で1.5倍くらいの勢いで違うのでちょい保留。 あと、ロード待ちストリームという用語が意味不明なんですが。。
>>779 の推測を検証するには・・・・
prefetchntaをライン違いで大量に発行した後に、まとめてストア命令を発行する。
推測通りなら、遅くなる。
ごめん、更新してなかった。
>>780 タグを引くってこと??具体的に書いてくれ。
じゃまくさいから却下。 というか、ロード待ちストリーム=メモリロード命令を発行しロードされてくるまでのバッファの総称。 ロードされたデータをL1やL2に転送するまで保持されるバッファのことな。 高速化する場合、そうなる。 そして、それ等をストリームと呼びコヒーレンシ制御での照会はそれらも含めて走査することとなる。
>ロード待ちストリーム=メモリロード命令を発行しロードされてくるまでのバッファの総称 それを先に言ってくれないとわからんて。一般的な用語じゃないよね? このバッファってのはキャッシュ側じゃなくロードユニットに12個とかあるやつのことか。 メモリ書き出しストリームに追加するってのは何だ? そもそも、「それらも含めて走査することとなる」そこまでやるのか?
>>785 そこまでしないとコヒーレンシ制御は不可能ですぜ。
それよりテストしてみろよ。
いや、テスト環境があったらとっくにやってるよ。 ストアバッファまで見ても意味ないと思うけど。 同期は1クロック遅れたらダメってもんでもないし、 同期がとれてることを確認できればいいんだから。
>>787 ストアバッファを見るか否かは回路構成によるだろ?
ストアバッファから消えるまでキャッシュを消さずに残すならみる必要なし。
逆にストアバッファへ転送と同時にキャッシュを無効にしストア完了とするなら見にゃならんよ。
回路構成とかじゃなくて、 遅くなってもいいなら後で同期確認すればいいじゃん、ってこと。 遅くなると言ってもL2レイテンシ程度だし、 相手がL2に書き終わってから参照すれば待つ必要もないし。 そのために実行ユニットに近いところに見に行くっていうのは CPUの高速化の妨げになると思う。 ていうかお互いわかってない希ガス。。
他コアから照会の多くが、キャッシュ保持なしを返すのに、その返信を遅らせるのですか? 照会元は返信があるまで身動きできないのに?
>>790 は判にくそうなので、分かりやすく。
Opteron「俺様はハイパーだぜ、他のコアとは直結に等しい程に照会パケットを超高速で送受信出来るんだぜ凄いだろ!がはは」
Opteron「では、今から俺様の凄いとこお見せするぜ、とおーそれそれロード要求来たぜ♪」
Opteron「L1キャッシュなし→L2キャッシュなし→よしそれじゃ他コアへキャッシュ照会パケット発信!!!!!」
他コア「おお、スゲー速さで照会パケット到着だぜ♪」
他コア「ほんじゃちょっくら調べてみるかな・・・・」
他コア「あやや、照会パケット到着前に10個もロード要求来てるな、しゃないからそれが済むまで待つとするか・・・」
他コア「1つ目、L1なし、L2なし、よしロード前に他コアへキャッシュ照会パケット発信!!!!」
Opteron「おろろ、返信パケット待ってたら照会パケットが来たぜ、しゃないからちょっくら調べてみるかな・・・・」
Opteron「おろろ、照会パケット到着前にロード要求待ちがあるな、それじゃ暫く待つとするか・・・」
あー永久に終わらない・・・・・
>>791 おそらく違うと思う。
ふつ〜に、FIFOするんじゃないかな。
そこで原則が出来た。 他コアからの照会は、何があっても真っ先に返信すること、それまでは自コア進行停止する! そうなると、どうしても処理途上分を検査する必要が生じてしまうとさ・・・ちゃんちゃん。
>他コアからの照会は、何があっても真っ先に返信すること、それまでは自コア進行停止する! それが言いたかったわけだが..
>>795 それならOKピー。
でもFIFO(先入れ先出し)ではないよ、飛び越えるのだからね。
ついでだからもう少し深く入ってみようか? コア1とコア2が同時に全く同じアドレスをロードするケースがそれ。 コア1:L1なし→L2なし→他コアへ照会パケット発信 コア2:L1なし→L2なし→他コアへ照会パケット発信 この場合の処理は、自コアが既に照会パケットを送っていて、そこに他コアからの照会パケットが到着したケース。 到着した照会パケットの要求アドレスと自身が発信した照会パケットの要求アドレスが等しい場合はコア番号の若いものを優先する。 自身が2番で送られてきた照会元が1番だったら、1番を優先するから1番からの返信をひたすら待ち続けることになる。 コア1は、優先されているのでロード要求をメモリー送ると供にロード待ちストリームに書き置く、このときコア2からの照会を受け取っているので 共有flgもONにし照会パケットをロード待ち領域に移す。 その後、実際にメモリからデータがロードされたとき共有flgがONであるからロード待ち領域に移しておいた照会パケットの送信先へデータを返信する。 コア2はコア1よりの返信がデータ付なのでメモリロード済みflgを立ててロード待ちストリームに書き置く、このときの共有flgもONのままだ。 ロード待ちストリームのメモリロード済みflgに変化があったので、共有flgがONであるからロード待ち領域に移しておいた照会パケットを走査するが未ヒットなので そのままL1L2へ転送する。 こんな感じですな。
>>789 俺も普通のライトキャッシュであれば、纏ったタイミングで
ダディビットのリフィルを行うと思うな
それを言うのならダーティビットだろ? でも、それ全然関係ない話だ。
800 :
Socket774 :2006/06/08(木) 22:01:51 ID:8iLPMaHG
800なら女子高生にレイプされる
>>712 L1とL2の関係は、K8とは違うみたい。
Dedicated L2
Dedicated to eliminate conflicts common in shared caches
特定目的L2
共有キャッシュに通常存在する衝突、葛藤を解消するために専ら用いられる。
(PhilHesterAMDAnalystDay.pdf)
L3を共有キャッシュにするのは、4-coreだと
これまでのx-bar(srq)経由方式では無理があるというのも理由の1つだと思う。
したがって、
K8のL1-L2の関係は、L1-L3の関係になった可能性がある。
(なお、K8ではL2アクセスと並行してメインメモリにアクセスしていたが、
K8Lでは、これと同じように、L3アクセスとメインメモリ・アクセスが並行すると言っている)
だとすると、
L1 total 512KB(128x4)でL3 2MB (512 per core)だから、
排他でない可能性もある。
排他であった場合、
2つ以上のL1に同一ラインがキャッシュされた状態から、
あるL1がそのラインをL3に追いだした場合、
他のコアのL1と追いだされたラインがダブって、排他が維持できなくなるという問題がある。
排他でない場合にはこの問題は生じないが、共有キャッシュである以上は、
コア間で使うラインが全然違っている場合、L3を取りあう(競合)が生じる。
L2がどういう問題に対処するものなのかは、
もう少し情報が明らかにされないと分からない。
802 :
801 :2006/06/09(金) 13:06:09 ID:2FsBKjtO
排他でないとした場合、 ほかのコアによってL3から追いだされたキャッシュラインを そのラインを呼びだしたコアのL2に入れる といった使い方が1つの案として考えられる。 この場合は、 L2とL3が排他の関係、 L1とL2, L3は排他でないことになる。 こうすると、 各コアは、最小限512KB、平均1MB、最大2.5MBのキャッシュ を持つことになる。
というか、完全な排他は物理的に無理
あと、L3とメインメモリを同時アクセスしてるとしたらちょっと怖い。
L1やL2からロードするときに、メインメモリから先読みするっていうのはどうよ? L3に問い合わせにいくときはロードされてるとかだったらいいなぁと思うw メモリアクセスはいいけど、マイクロアーキテクチャのほうがんがってほしい。 どっちがいいのやら・・・DDR3まで待ったほうがいいの???
>>805 プレフェッチ専用共有コアにするとそれなりに良いかも
L3にはダーティキャッシュは含まない扱いにすればOK
共有キャッシュの間違い・・・鬱
Memory Disambiguationの強化は、かなり有効なんじゃないか?
これまでのまとめ。
K8LのL3はL1L2と完全な排他構造となる。
排他構造とする理由はL1L2が排他構造で各コア毎に独立したキャッシュを持つから、L3を積んでもL1L2を走査した後に、
他コアへのL1L2の照会(コヒーレンシ制御の為)を必要とするから、L3は出来るだけL1L2と排他なキャッシュである方が効率が良くなるからだ。
不完全な排他構造の疑惑が
>>801 に書かれているが、上記のようにL1L2の走査後に必ず他コアへの照会がある為、L3は完全排他構造を維持できる。
次に、L3はダーティキャッシュ(破棄時にメモリへの書き込みが必要なキャッシュ)を含まない。
ダーティキャッシュの書き込みはL2より破棄されるときに行われる。
これにより、L3はメモリが保持するデータの写しでありヒットすればそれなりにレイテンシが向上するという性質を持つ。
他スロットのL3とのコヒーレンシ制御は厳密である必要がなく(ダーティキャッシュを含まないし、共有制御はL1L2のみで良い)照会パケットは送らない構造だと思われる。
この為、L3と実メモリは同時にアクセス可能となる。
ふーやっと解析終了・・・長かったぜ。
K8Lのキャッシュ構造解析後の考察
一言でいうと、なんちゃって拡張であり、それなりに性能向上の期待は出来るが一般的に想像するレベルには達していない。
拡張は
>>809 にある通り非常に簡単であり、再設計云々のレベルではない。
K8LでL2の大きさをどれだけにするのかは難しい。
俺的には最低でもL2を512KBぐらいにしとかないとキャッシュ性能は落ちそうである。
もちろん、L2を小さくすることでレイテンシが劇的に小さくなるのならまた評価も変わるだろうが、L2が小さいとやはり効率は悪くなりそうだ。
AMDとしては、これまでの無策を露呈しているかのような結果だ。
長期に渡って検討され熟慮の結果出てきた拡張案とはとても思えない、それこそその場しのぎに何かやれることはないか?を集めた結果のように思う。
AMD社の次世代CPU(Hound)の正体
AMDがINTELの次世代CPU(Conroe)に対抗して2007/07以降に投入される次世代CPUの俗称は「なんちゃって64」で決まりだ。
>
ttp://pc.watch.impress.co.jp/docs/2006/0522/kaigai_1.jpg (なんちゃって64 真のクアッドコア)
Rev.HやK8Lと呼ばれる次世代CPUはINTELが発表したConroeの回路拡張の一部分のみを真似て作った紛い物になりそうだ。
その一番の目玉は「SIMD浮動小数点演算性能を2倍」であり、FPUユニットを128bit化し2基搭載する。
これでユニット性能自体はConroeと同等となる。
しかし、Conroeは128bitのSSEユニットが3基あり、SSE性能でなんちゃって64はConroeの2/3のピーク性能しかない。(ユニット性能のみ)
その次の目玉はL3共有キャッシュの搭載だ。
当初言われていた、コヒーレンシ悪化の回避というのは
>>809 で完全に否定され、結局は少しでもメモリレイテンシを相対的に減らしたいだけのもので、
「なんちゃって拡張キャッシュ」であった。
その他の拡張に大きなものはなく、とてもじゃないがクロックあたり性能が全般的に大きく向上するものではないことがはっきりした。
これでConroeやWoodcrestやKentsfield(くっつけただけのクアッドコア)と戦おうとするのは無謀だ。
2007/07以降という遅い時期の投入であるにも関わらず、こんな調子であり・・・
その先に控えているのは「コプロセッサ内包」とか「ハイパートランスポート拡張によるlink数拡張」とか・・・
ふー、AMDは終わったようだ・・・・
早くて2008年中旬までどんなに頑張ってもINTELより優秀なCPUは作れなさそうですよ、遅いと・・・・・・・無理っぽ?
INTELの次世代CPU(Conroe、Woodcrest、Merom)が超高性能な理由
これは簡単明瞭、高速な演算性能とそれを支える高速なデータ供給。
演算ユニットだけを幾ら高速化しても速いCPUにはならない、ピーク性能がどれだけ高いユニットを搭載してもムダなのだ。
超高性能ユニットが威力を発揮するには、超高速なデータ供給が不可欠であり、その両方をINTELの次世代CPUは実現している。
L1L2のキャッシュ性能を比較すれば歴然とする程大きな差を知ることとなる。
見よ、この超強力なキャッシュスピード
>
ttp://www.2cpu.com/review.php?id=112&page=4 Opteronに対して2倍処の騒ぎではなくそれ以上、L2に至っては3倍以上高速な供給能力を有している。
これこそがINTELの次世代CPUが超高性能な秘密だ。
AMDの次世代CPUである「なんちゃって64」は、そこが全く改善される気配はなく残念だ。
メモコン内臓による、メモリレイテンシの削減とバス帯域幅、ハンパートランスポートによる超高速Link この2つはINTELの次世代CPUを凌駕している。 すなわち、複雑な演算処理等をせず、単にメモリー転送速度こそ命なソフトでこそ、活躍の場所が残されている。 デスクトップ分野ではファイル転送等はAMDの次世代CPUがINTELより優れているのではないだろうか? 次にサーバー分野、大量のコアを疎結合した環境だとメモリー帯域こそがネックになりやすい。 4ソケット以上のハイレベルなサーバーではAMDの次世代CPUがINTELより優れているだろう。 このことから、AMDはシェアを過去のレベル以下程度(15%?)まで下げるだろうが生き残ることは可能だろう。 目指せ!、エンタープライズ!!! 目指せ!エンタープライズ分野で世界一のCPU! これこそがAMDのこれからの合言葉として相応しい。
Kentsfieldって、Conroe版PenDじゃねーか・・・共有L2のメリットとやらはほぼ消滅するから、 コヒーレンシ制御は相当悪化するはずだがな。
>>814 どんな論理的解釈をすれば、そのような無茶な妄想に至るのか不思議だ。
コヒーレンシ制御を具体的に書き出してみれば妄想であることに気付けるかもよ。
あと、共有L2のメリットの消失ってなんだろう?
((1 2)(3 4))となってるとして、 1と3,4 、または2と3,4のときに当然L2が共有できないと言いたいんジャマイカ
ああ、OSが糞でコアの割り当てが適切ではない場合のことか・・・ そこは、OS側の改善を待つしかないね。
>>816 そういうこと。
Woodcrest2ソケットとはパッケージ内で接続しているか、パッケージ外で接続しているかの違いでしかない。
ほとんどのベンチマークではキャッシュやメモリの性能を測定する際、コヒーレンシ制御が必要になる
共有データを使ってるかどうか明示してないから、実際にそれでどの程度の性能低下があるかは
判らんが。
しかしそんなのはWoodcrest×2ソケットと大差無いぞ。
無理やりな論でかき回すのは見苦しいからやめておけ。
というか、AMD社のいうところの真のクアッドコア(なんちゃって64)だと
>>809 に書いたように必ず他コアに対してL1L2の照会パケットが必要。
これもっとも照会パケットが多い回路設計であることを露呈している。
そんなのと競合するのなら、くっつけただけのKentsfieldで十分だろうよ。
なんちゃって64のクアッドコア=シングルコアを4つくっつけただけと変わらないL1L2へメモリからホンの2MB程のコピーをL3に配置しているだけ。 これよりは、まともな共有キャッシュを搭載したデュアルコアを2つくっつけただけのほうがマシだろ? 異論でもあるのか?
Q:2つのキャッシュをIntelバスでつなぐのと4つのキャッシュをAMDバスつかって単段クロスバでつなぐの どっちが速い? A:どっちも糞! 4コアで共有L2作れボケwww
>>821 > 4コアで共有L2作れボケ
尤もな意見だが、これは意外と難しい、というかINTELならもしかするとやってくるかも知れないが、キャッシュへのバス幅を4倍にする?
これ実現できたら超スゲー・・・・けどいくら何でも厳しいだろうな。
バス幅は2倍のままで、ラインブロックが異なる場合だけ同時アクセスを許す一般的な方式になると予測される。
この場合、ピーク性能は良くても実働値がどれぐらいになるかはラインブロックの大きさ次第である。(ブロックサイズを小さくする程難しい)
さてと、なんちゃって64のL3はどれだけ役に立つのか?
一度読み込んだデータがL1L2(128k+512k)が小さい為、L3に追いやられたとする。
それを再度読み込むには・・・
自コアのL1→L2→全ての他コアへ照会パケット送出→全ての他コアでL1,L2が走査され返信が全て揃うまで待つ→L3走査/メモリロード
こんなんで良いのか?
WoodcrestでもKentsfiledでもL1,L2は64kと4096k(2コア共通)のキャッシュをそれぞれのコアが有している。
キャッシュ保持力から言えば、なんちゃって64がL2から追い出されL3で保持するケースは、INTELの次世代CPUだと共有L2で保持出来てしまうから
自コアのL1→L2(ヒット)で完了となり、他コアへの照会パケットは不要となる。
そして忘れてはならないキャッシュ性能の違いが
>>812 L1で2倍を大きく超える高速キャッシュ、L2だと3倍を超える超高速キャッシュ・・・・
ここの部分はなんちゃって64での改善は殆どない・・・これで戦えるのか?
_ ____,..--、 / ヘ`_r―‐、__∠ヘ \ / /´ i | | i ! `、 、ヽ l / , / / | | | | | ! i = = / i | | | | | ! l ニ= 進 そ -= / l ト_ハ //__/.イ! l ニ= 藤 れ =ニ / ∧ /! di ヽ/ i !dヽ ! l ! .=- な. で -= 、、 l | /, ,. 〃 / i Y! |しj | しリ ! l ト、 ニ ら. も ニ .ヽ ´´, l!l ハ イ i !  ̄ 、  ̄ / / イ } ´r : ヽ` .ヽ し き 進 ニ V V l!Vト . ー ,イ!,イ/レ' | ´/小ヽ` = て っ 藤 =ニ /:.:.::ヽ、 ` -- イ | l::::::| l / ニ く. と な -= ヽ、:.:::::::ヽ、._、 _,ノ/.:::::| | /| = れ.何 ら -= ヽ、:::::::::\、__/::.z先.:| |' :| ニ る と =ニ | |:::::::::::::::::::::::::::::::::::.|'夂.:Y′ト、 /, : か ヽ、 | |::::::::::::::::::::::::::::::::::::_土_::| '゙, .\
>822 おれ、徹夜明けなんだ まで読んだ
>ID:OHARZvFL ちゃんとトリップ付けてください。
> Q:2つのキャッシュをIntelバスでつなぐのと4つのキャッシュをAMDバスつかって単段クロスバでつなぐの > どっちが速い? 通信方式のことばかり気にしている人が多そうだが、実際に一番辛いのは、照会を受ける側であり、それを待つ側である。 照会を受ける側は、現在の処理を停止し、L1L2を走査(ヒットすれば更にそのキャッシュを読み出し)し返信しなければいけない。 これがAMDの回路構成だと多発するし、特にL2を512kとかに減らすと余計増えてしまう。 4コア同時に動き出したら、他の3コアから照会が発生するからL1L2を3回走査し返信する割り込みが常にあるってことになる。 そんな状況下で2スロットだと、他のコアは7つとなりもっと凄いことに・・・ クロスバーは決してその負担を減らしてはくれないよ。
828 :
MACオタ :2006/06/10(土) 13:45:03 ID:nTzyhabI
>>827 深深度パイプラインを高いクロック周波数で補うのはあまりにも効率が悪い
まで読んだ
>>827 >これがAMDの回路構成だと多発するし、特にL2を512kとかに減らすと余計増えてしまう。
なにこの妄想。
キャッシュを減らすと、逆に照会する確率が減るだろ。
キャッシュが多ければ多い程、照会が増える。
>>831 全然違う。
L1L2にヒットしない=自コアのキャッシュにないから他コアがキャッシュを保有しているかすら分からぬ状態。
よって、全ての他コアに照会パケットを発信し、返信があるまで待つことになる。
AMDの共有L3が実は大した効果が無いって話だが、例えばこれを例のZ-RAMで 8MBに増量した場合はどうでしょうか? Z-RAMは基本的にDRAMだからレイテンシが大きいが、アクセス速度はSRAM並を 実現出来るらしいので、L3容量を大幅アップした効果が大きければ、Intelに 対して結構な優位になってくれると期待したいのだが。
>>829 p.21でしょ。
CPU Xeon 160W (80x2) Opteron 190 (95x2)
mem Xeon 75W以下 Opteron 36W以下
Chip Xeon 30W Opteron 10W以下
total
4 DIMMでは8W程度
8 DIMMでは26W程度
Xeonのほうが多い。
FBDIMMのAMBは4,5-6.1Wだが、
最大1.2WのR-DIMMのPLLとregisterを使わないから
FBDIMMにすることによる増加は3.3-4.9Wだ。
>>832 (゚Д゚)ハァ?
だから、容量が多い方がそれをする確率が増えると言ってるのだが。大丈夫か?
838 :
・∀・)っ-○◎● ◆toBASh.... :2006/06/10(土) 19:11:25 ID:0FGizYM2
L1共有すればよくね?wwww むしろCell型のヘテロでいいや。 SRAM 1MBくらいのメモリ空間独立のコプロセッサ搭載。
839 :
孟宗 :2006/06/10(土) 19:35:08 ID:VuholFvR
FPGAタイプのコプロだといろいろ楽しそう。 デフォルトはSSE特化で、アプリで対応してれば再構築でアプリに特化。 とか・・・
>>833 Z-RAMの場合だと、5倍の密度だから2MBから一気に10MBに増えるね。
それとともに、L3へのアクセスレイテンシがかなり悪化する。
開発元は、Z-RAMを使ってL3キャッシュを作る場合、25MBを超えてくればZ-RAMのほうが有利になると言ってたと思う。
>>836 > だから、容量が多い方がそれをする確率が増えると言ってるのだが。大丈夫か?
君は逆のことを言ってる。
君は下記の通り、キャッシュを減らすと、ヒット率が減りその結果、他コアへの照会パケットを送出する件数が減ると言ってる。
自コアのL1L2キャッシュにヒットした場合、そのキャッシュが他コアと競合してても、してなくても照会パケットを送出する必要はない。
ヒットしなかったときは、必ず他コアに照会パケットを送出する必要がある。
>> キャッシュを減らすと、逆に照会する確率が減るだろ。
>> キャッシュが多ければ多い程、照会が増える。
>>838 L1を性能悪化することなく共有出来れば凄いけどね、でも現実には共有キャッシュにする場合、ものすごく性能悪化する。
L1はレジスタの次に高速な記憶エリアだから、共有化するような複雑化やそれに伴う大容量化を行うと速度が大きく落ちてしまう。
>>837 そのゴシップは以前にも読んだことがあるが、悪質なゴシップとして読み流すのが正しいようなことを誰かが言ってたように思う。
まともに取り扱うところは無さそうです。
842 :
・∀・)っ-○◎● ◆toBASh.... :2006/06/10(土) 20:24:39 ID:0FGizYM2
個人のブログだしなwww 俺のSSE4の記事は英語のWikipediaとかにリンクされてたりするが。
>>840 25MBだといくらZ-RAMでも、45nmプロセスでないとCPUコアへの登載は無理だろうなあ。
折角のトランジスタあたりの容量アップを、CPU性能アップに結び付けられないのは勿体無い。
でも確かに単独のCPUの場合は有利になる為に25MBが必要かもしれんが、マルチCPUの場合は
CPU間でのデータ転送が一番処理ネックになるだろうから、キャッシュの大容量化の性能への
貢献が、単独CPUに比べれば大きそうな気もするのだが。
> でも確かに単独のCPUの場合は有利になる為に25MBが必要かもしれんが、マルチCPUの場合は
> CPU間でのデータ転送が一番処理ネックになるだろうから、キャッシュの大容量化の性能への
> 貢献が、単独CPUに比べれば大きそうな気もするのだが。
AMD社のなんちゃってL3は、
>>809 にある通り、各コアと同期を取る機能を捨てている(コヒーレンシ制御に関係しない)から
その目的には使用できない。
(L1L2でミスヒットしたら各コアへの照会パケットが送信される)
通常だと、強大な共有L3コアを積み(Inclusiveタイプ)、L3でヒット率を高め、コヒーレンシ制御の負荷が最も大きい
ミスヒット時の照会パケットを減らし、共有キャッシュグループ間での照会パケットを無くす方向で改善する。
L3コア・・・>L3キャッシュ (鬱鬱鬱鬱)
846 :
・∀・)っ-○◎● ◆toBASh.... :2006/06/10(土) 20:46:32 ID:0FGizYM2
Pentium ProはL2だけが載ったコアがパッケージングされてたなww
>>844 の捕捉
ミスヒットによる照会パケットを減らす目的に特化する場合、L3のアクセスレイテンシが悪化することを承知でCPUコアとは別コアにするケースが主流。
この場合、L3への更新は多少の遅延を認めた設計(L3への更新を待たずに次の処理へ・・・)となり、L3には各コアからの更新依頼(走査依頼含む)を
貯めて置くストリームを持つ(FIFO型のそれなりの件数を貯蔵するバッファ)。
このストリームによりL3の遅延更新が可能となる。
>ID:OHARZvFL あまりに粘着質でうざいから この先は1行に纏めるかインテルマンセースレに帰るかどっちかにしてくれ。
だな。 本質の理解はこのスレ住人なら問題ないのだから ゴタゴタ言葉並べて煙に巻く努力は無意味
結論 AMDのCPUはこれから2年間は期待できない かといって2年後にすごいCPUが生まれる可能性もあまりない
>>849 悪い、漏れはOHARZvFLさんの投稿読むまで間違って受け取ってた。
L3共有キャッシュはコヒーレンシ緩和だと信じてた。
でも違った、L3共有キャッシュはコヒーレンシの緩和に何も役立っていないことが分かった。
L3の導入でL2が減れば、逆にコヒーレンシの負荷は多くなることも知った。
理論的にはAMDの8XXシリーズはIntelの70XXシリーズに大差で負けてるはずということか。
せっかく捕まえたサーバメーカが、ギャプラスのサイクロンバグにように一斉に逃げ出す様子が思い浮かばれる。
>>822 >自コアのL1→L2→全ての他コアへ照会パケット送出→全ての他コアでL1,L2が走査され返信が全て揃うまで待つ→L3走査/メモリロード
こんなこと毎回やるならいっそうのことL3に各コアのL2.1に格納されてるデータのアドレス置いておけば良いんでないのって考えてみる。
そうすれば、各コアのキャッシュ状況を把握できて残りをL3キャッシュとしても使えるしね。そもそも
>>809 は推測であって結論じゃないわけだし。
こうしておけば、コヒーレンシ制御もL3調べれば各コアのキャッシュ状況把握が簡単だから書き直しが必要なコアのL1.2だけお願い出すだけで良いし。
さらにソケット増やした場はソケットごとのL3に当たれば良いから、各コアに無駄に参照パケット&書き直しを送る必無くなる。
コア増やした場合これが一番効率が良いとおもうのだけども。
>854 よくは分からないが、L1の排他キャッシュを止めればすむ事じゃないのか? キャッシュは2重構造(L1とL2のみ)にして、複雑な3重構造も止め、L1のキャッシュ量を増やして、非共有にし、 L2のみ共有すればいいじゃないか。単純で、高速化が図れると思うが。3重構造(L123)のまま行かなきゃならないなら、 L12の排他キャッシュを止め、L3のみ共有すると。ついでにDDR2or3のMemoryが高速化するのを待つと。 多少キャッシュメモリは無駄になるかも試練が、高速化しやすいし、コアも増やしやすいと思うが? こんな事がだめなのかどうか、誰か頭の悪い俺に分かるように説明してくれ。
>>856 そんなことは誰でも思いつくし、AMDだって重々承知の上だし、それどころか故K9はインクルーシブだった可能性さえある。
>>856 L1を増やすなんて凄い困難なことは、頭があまり良くない漏れでも分るぞ。
未だ見ぬものに関して断定的に語れる人がかなり多いけど 十分に材料が出揃ってるから余裕で断定できるまでになって るって事なのかな? それとも断定が好きな人が多いのか? あと、このスレ見てると、世の中の一般人が誰でも(は大袈裟か) 思い付くような、よりシンプルで性能も上がる事をAMDは実現で きないって事になると思うんだが、それが信じられんw ってか、ネタをネタと見抜けてない? > 俺
ネタスレにマジレスカコイー
今は妄想が一番楽しい時期 内心ではゲラゲラ笑ってようがそれはおクビに出さず聞いてやるもんだ
862 :
Socket774 :2006/06/11(日) 16:13:17 ID:egItMFiJ
H O U N D (AMD Quad Core CPU) はどうなるやら
863 :
847 :2006/06/11(日) 17:54:11 ID:Yr82Gwcp
>>854 アドレスを全部置いておくという発想は良いけども、独立したキャッシュが合計で8つ(L1はデータと命令に分かれるが1つと考えていい)もある。
これらのアドレスを即座に参照出来るとなると2x4+4x8=40Wayとなりその走査だけで効率が悪いものになる。
>>857 L1L2を排他構造のまま残してL3をInclusiveにするメリットはないのではないか?
それにInclusiveの場合、L1L2L3のように階層レベルを深くするのなら、ひとつ前の階層のキャッシュ容量よりずっと大きなキャッシュ容量を持たないと効率は上がらない。
K8Lで漏れ伝わっている情報でL3キャッシュの構造を推測すると、一番効率が良いのはL3が完全排他構造だろう。
つまり
>>809 だ。
864 :
・∀・)っ-○◎● ◆toBASh.... :2006/06/11(日) 18:11:26 ID:ZPZj2sL2
>>856 2Wayセットアソシエイティブで64KB+64KB, Latency3ってのは物理的に限界なんだがな
キャッシュのエントリ数を増やす→L1のレイテンシ増加
キャッシュラインを倍にする→L2間の転送クロック数の増加
>>840 >自コアのL1L2キャッシュにヒットした場合、そのキャッシュが他コアと競合してても、してなくても照会パケットを送出する必要はない。
writeした場合は、状態によってはパケットが送出されますけど。
次にでるitaniumのL3は超高速だぜヒャホーイ
867 :
847 :2006/06/11(日) 18:38:06 ID:Yr82Gwcp
>>865 はい、共有データは書き込む前に必ず照会する必要があります。
あと、共有データであり更新済み(ダーティキャッシュ)をL2より追い出す(メモリへ書き出す)ときにも照会は必要です。
868 :
Socket774 :2006/06/11(日) 18:42:50 ID:WFmst1cr
∩∩ このスレは俺達ネット右翼の提供でお送りします ∩ (7ヌ) (/ / / / ∧_∧ || / / ∧_∧ ∧_∧ _(´∀` ) ∧_∧ || \ \( ´∀`)―--( ´∀` ) ̄ ⌒ヽ(´∀` ) // \ /⌒ ⌒ ̄ヽ、ニート /~⌒ ⌒ / | 童貞 |ー、 アニメ / ̄|嫌韓中//`i ロリコン / |軍オタ | |エロゲ / (ミ ミ) |まほろ命| | | |大好き | / \ | | | | ) / /\ \| ヽ / ノ | / ヽ ヽ、_/) (\ ) ゝ | | | | / /| / レ \`ー ' | | /
>858,>864 サンクス。少しだけ分かりました。ありがとうございます。L1を増やすにも限界があるんですね。 >866 ね、ね、なぜItaniumのL3は超高速なの?不思議ー?
普通にCleanとDirtyで管理して、後は強制ライトバックすれば良いんじゃ?
>>866 であるなら、
>>836 の
> だから、容量が多い方がそれをする確率が増えると言ってるのだが。
の言ってる事が、(状態によっては)全く的を得ていないとは思わないが。
873 :
872 :2006/06/11(日) 19:19:20 ID:E+wpU5Eb
874 :
847 :2006/06/11(日) 19:36:09 ID:Yr82Gwcp
>>872-873 キャッシュ容量が増えることで、共有数も相対的に増えるというのは同じデータを参照しに行くソフト(マルチスレッド)が動いている場合だけです。
しかも共有データの更新頻度が高い場合に限られますし、そのケースでもキャッシュ保持された結果ですらキャッシュ保持されていないより圧倒的に速いです。
875 :
847 :2006/06/11(日) 19:40:22 ID:Yr82Gwcp
しかも照会パケットが増えるのは共有データの更新頻度が高い場合に限られますし、 そのケースでもキャッシュ保持された結果ですらキャッシュ保持されていないより圧倒的に速いです。
876 :
872 :2006/06/11(日) 19:50:10 ID:E+wpU5Eb
そうなると例えば、共有データの更新頻度が高い大規模なDBサーバだと違いが出るね。
877 :
872 :2006/06/11(日) 19:56:54 ID:E+wpU5Eb
なんかここの話聞いてると、設計技術的にAMDはIntelに決定的に負けそうだね。。 でもプロセス製造技術で逆転できないかな。ワット当たり性能とかで。。 現状は微細化がIntelより遅れてるから打つ手無しに見えるけどね。。
まあここで話されてるようなことはAMDは全部考えてるでしょ。 実際にシミュレーションも走らせてるだろうし。
だね。1人妄想からそれがあたかも結論みたいに言ってる香具師がいるが ちょっと聞きかじりの自分の持論披露したいだけのヒキヲタだから間に受けて 本気にしちゃ駄目だお〜
レベル高いよここ… まぁ、AMDがやヴぁいってことは分かった 新fabでいっぱいいっぱいだったのかな
プロセスルールで遅れとってる場合相手が隙を見せない限り勝てないのは必定なんだが まあおなじ土俵で勝負しなければ負けないかも知れん
性能は二の次だってことはインテル見ればわかると思うが AMDさえうまく立ち回れば十分凌げるでしょ
うむ。俺を含め市場が求めているのは「ワット当たり性能」だと思う。モバイルに限らず。 もちろんシステム消費電力を含めての性能競争であってほしいな。 そこでAGPに回帰。これが簡単だがねぇ・・・
>>884 PCIEx8を普及させるってのでもよさそうだけど。
AGPよりは電力食いそうだけどね。
>>884 ちがうよ。一般市場が求めてるのは
不満の無い性能で加熱し過ぎない安くて安定してるパソコン
役に立たないメーカの市場企画部と無知な店員が消えれば
AMDも普通に売れる。かもしれない
>>886 それ突き詰めていくとx86死亡→AMD死亡
889 :
847 :2006/06/12(月) 01:44:49 ID:I8yRLwyk
>>976 > そうなると例えば、共有データの更新頻度が高い大規模なDBサーバだと違いが出るね。
大規模DBは、WoodcrestやOpteronとは別に考えておく必要がある、
尤も今回のK8LのL3拡張騒ぎは大規模分野を匂わせるものだけどコストを考えればそれは無いだろう。
WoodcrestやOpteronをCPUチップだけで語れるのは、疎結合で精々8〜16コア程度と思っていた方がいい。
これを超えてくるとCPUチップ内に搭載されたキャッシュだけでは照会パケットの爆発的な増加に伴い性能の向上は難しいのが現実だ。
>>879-880 これは、痛烈だな。
俺としては、K8Lを完全排他構造にすることで、各方面から漏れ伝わる条件の中で尤も性能のよいものを紹介した訳だなんだけど・・・
AMDのL3拡張が難しいのはAMDだからということではなく、L1L2が排他構造のまま残り、そこへL3共有キャッシュを導入するということからだ。
制約が多過ぎることから完全なInclusive型は不可能、
>>863 にも書いたが共有するコア数が多く、
しかもL1L2の独立したキャッシュも前段に持つとなると、40Way Set Associativeの構造になる。
Way数が大きくなると該当キャッシュを探し出すにも時間がかかり、現在の方式だと16Wayまでが理想とされている。
40Wayとかになってくると通常構造のSet Associativeでは効率が低下する為、別の方式を導入することとなる。
実際、多数のコアを疎結合した大規模システムは、別チップに大容量のキャッシュシステムを搭載し効率を高めている。
この大容量のキャッシュシステムは、多Way型であり、特殊な構造となっている。
IOストリームはブロックを細かく分けブロック別に並列動作することを前提に、多Way型特有のレイテンシ悪化を隠蔽しつつ、
バス帯域は出来るだけ大きくすることで読出し時間を激減する方式となる。
これ等は、それ専用に開発されたチップとシステムであるからこそコストが高額であってもペイすることが出来るのであって、
WoodcrestやOpteronのようなCPUチップにアドオン出来る品物ではない。
890 :
847 :2006/06/12(月) 01:48:06 ID:I8yRLwyk
尤も性能・・・・>最も性能 鬱々鬱
891 :
847 :2006/06/12(月) 02:14:19 ID:I8yRLwyk
>>884-888 市場が求める性能
一言では語れないが、現在は少し捻れた環境下じゃないかなぁ。
一般的に、PCの買い換え需要は、OSの刷新によることが多い、これは新OSが新たな価値を提供してくれることと引き換えに、
新OSがスムーズに動く閾値を上げる・・・つまり新OSは旧OSよりずっと重たい。
Micro soft社のOSがXPになってからもう随分と経つ、その間CPUの性能はグーンと向上し、
今では少々古いCPUでさえWindowsXPを軽快に動かすことが出来てしまう。
このような環境下だと、CPUの性能向上に魅力を感じない消費者が増えてしまい、CPUは二の次となる。
来年にはVistaが登場するから、現在の捻れた環境は緩和されると思う。
なるほどね。勉強になります。<(_ _)>
>>889 そんな事判りきってる事。過去ログ見てみ?
だるい長文ウザ・・
976、879-880は分かってなさそう。
>>894 そういうなら判りきってない事を書いてホスイが。
L3なんてメインメモリより速ければ御の字だろ 単にHoundのライバルがItaniumのような御大尽なCPUになるからL3でも付けとくかって どうせそれだけの事だ そんなにL3が性能を左右する要素なら、XeonがOpteronに負けるはずないな
釣れますか?
AMD何で共有キャッシュにしないんだろう 排他のメリットって何かあるの?
貧乏根性だから、ダイサイズを大きくしない。
AMDの思考は既にマルチコアに向いてるため2コアにしか役に立たない共有L2キャッシュは デスクトップ&サーバー向けが主体のK8Lでは採用しない。 TDP制限の為しばらく2コアで良くと思われる次期モバイル向けは共有になるかもしれない。 Intelも次の4コア(ケントの次の4コア/1ダイの)では共有キャッシュを止める。 焜炉のL2の倍の容量、帯域、レイテンシで4コアを接続とか無理なので。 焜炉のキャッシュが早いのは共有だからではなく 共有化にあたりキャッシュ自体を早くしたから。
>>901 L2は4コア共有無理でも2コア共有にすればいい、やめるよりは遥かにましだ。
>Intelも次の4コア(ケントの次の4コア/1ダイの)では共有キャッシュを止める。 終にNehalemのアーキテクチャ公開か!? 詳細激しくきぼんぬ!
コアが増えれば増えるほど、 コヒーレンシのトラフィックがシャレにならなくなるから、 共有キャッシュはするっしょ。
KentsFieldの次はBloomFieldかな。1Chip QuadCoreでたぶんNehalem系。 しかしCoreアーキテクチャのままで共有L2の1Chip QuadCoreとして出るという噂もあり この辺はまだわからん。
906 :
Socket774 :2006/06/12(月) 15:23:11 ID:dSqlKUW4
x86の2倍の速度で進化するはずのIPFが半導体プロセスで二周遅れという事実は痛いよな
まぁ仕方ないよな。マルチコアの時代は到来したばかりだし。 これから世界中の研究者がこの難問のブレイクスルーを目指して寝食を惜しむだろう。 あと何年先か、すばらしい製品を手にすることができることを期待したい。
>>908 >マルチコアの時代は到来したばかりだし。
そんな業界全体みたいな言い方するなよw
2005年の時点でマルチコアは珍しいものじゃなかった
911 :
Socket774 :2006/06/12(月) 20:42:38 ID:NZqMCikC
Victim cache にもメリットある罠 折れは単にデザインチョイスの問題と思ってる ちうわけでL3搭載?
なんか、このままメニーコアに突き進んでいってほんとにうまくいくのかと心配してしまう 並列計算がノード数増やすほど頭打ちになったように、そう遠くないうちに壁にぶつかるのでは? そんなこと言ったら何にもできなくなるけどさ… >あと何年先か、すばらしい製品を手にすることができることを期待したい。 禿
>並列計算がノード数増やすほど頭打ちになった 具体的にどんな心配をしてるのか曖昧すぎてよくわからんが多分杞憂
本当に終わってたら、余裕こいて「先延ばし」すると思われ
シェア・価格競争・性能・将来性で 希望が一寸も見えないのが終わっちゃってる要因
intelがConroe発表したとき、確か 「(AMDは)少なくとも後2年は追いつけないだろう」 みたいなこと言ってたよな オイオイこのままじゃ的中するじゃねえか('A`)
この業界は浮き沈みが激しいねほんと
IBMとHT Linkが頼みの綱か
>>918 うむ、正に立場逆転。
キャッシュ回りさえなんとかすればそれだけで十二分に戦えると思うのだけど、
なかなか難しいっぽいね…
>>915 あら?その後Houndは真のクアッドって事になんなかったっけ?
将来にむけてのリビジョンのまとめがほしいなぁ 次スレの季節だしね〜
923 :
847 :2006/06/13(火) 00:59:56 ID:BsCjhg5Q
>>901-905 BloomFieldのキャッシュ構造は不明ですが、最も簡単なのはKentsFieldのキャッシュ構造はそのままに再配置です。
4コア共通キャッシュにするのなら、L1を4WayとしてL2を16Way共有キャッシュにするのが有力かな。
この場合、バス幅は2コア時のままで、L2を4ブロック程度に分けて別ブロックなら当時アクセスを許す仕組みになりそうです。
>>899 > 排他のメリットって何かあるの?
>>911 > Victim cache にもメリットある罠
> 折れは単にデザインチョイスの問題と思ってる
AMDは排他キャッシュを維持している訳ですが、当然メリットはあります。
排他キャッシュはL1にどれだけ多くキャッシュを積めるのかで基本性能が決まる構造であり、L2L3は、良く使われるキャッシュだけを保持する構造です。
だからInclusiveより少ない容量で高性能化できるという特徴を持ちます。
それとL1とL2,L3とメモリを同時アクセスできる利点もあり、キャッシュ性能としては中々のものです。
今回は照会パケットの抑制を論じているから、なんちゃってL3になったけども、コア数が比較的少ないときはあまり深刻に考える必要もないと思われます。
何でキャッシュ共有をそんなに熱く語るのか不明。別スレッド、プロセスを廻す為のマルチコアでしょ? コードと局所データでほぼ埋まるキャッシュにほんの一部のグローバルデータ専用でクロスバー設けるなんて愚か杉
アムダー(ry
AMD耐えろ
今現在発表されてるベンチはほとんど捏造でConroeとは良い勝負、と思ってる人結構いるみたいよ。 あとK8Lで完全に巻き返す、という辺りも妄信しきってる人も。 俺もそうなればいいと思うけどさ…orz
お前だって負けることを妄信しきっている愚者なのだよ?どっちにしろ馬鹿にしか見えない。
勝つことをだろw 淫儲乙
930 :
847 :2006/06/13(火) 07:23:51 ID:BsCjhg5Q
>>924 各社とも、マルチコア化が本格化する中で、共有キャッシュがトレンドになりつつあり、より良いキャッシュシステムを搭載することが
高性能化への一つの答えとなっているからここで議論している。
> コードと局所データでほぼ埋まるキャッシュにほんの一部のグローバルデータ専用でクロスバー設けるなんて愚か杉
確かにそう、本来はキャッシュのうち、共有化され更新されるデータのみの同期を取れば済む話です。
そこで、もっとも単純化した同期手法は、ストア命令を実行するときに照会パケットを送って同期を取る方法があります。
この場合、共有/非共有の情報は最初のストア命令を実行するときには有していませんから必ず照会パケットを送ることになります。
返信パケットの結果により共有/非共有の情報が初めて付加される形式です。
もちろん、非共有が確定すれば同データは次回より照会パケットの送信は不要となります。
この形式の弱点は、他コアでキャッシュしているのにそこからロードせず、ミスキャッシュ時はメモリからのロードとなります。
AMDのK8Lだと、この方式のほうがコア数が多いと効率が良いかもしれません。
931 :
847 :2006/06/13(火) 07:30:44 ID:BsCjhg5Q
ああ、重要なことが漏れてる。 ストア時は必ずメモリへ出力されることになります。 これがこの形式の最大の弱点です。
そんな長々書かなくても、アムダールの法則の一行で終了
933 :
847 :2006/06/13(火) 08:39:03 ID:BsCjhg5Q
分散同期制御なんだけどな・・・
>>915 エセデュアルはダイ自体が分かれてたと思うんだが。
AMDはIBMとどんなことやってるんだろ 教わってるのはプロセスルールだけか?
SOIプロセスの共同開発でしょ。 金は払ってるけど。 IBM側はAMDの高歩留まりのノウハウを手に入れたとAMDの中の人が言ってた。 Fab30は世界最高のFabだしな。
>>929 誰もが皆勝つ事だけを信じて賭けを続けるのさ。
>>936 SOIの優位は渡来ゲートで打ち砕かれMaster。
いや、負けることを妄信しているアホは黙ってろと言っているですけど。
>>937 詳しく調べてないから判らんのだが、Pen4から比べて1000分の1*50分の1の
リーク電流になりそうだということだよな?
Intel優位しつつも競争が行われていた良い時代が戻ってきたということだな。
やはり、ここ数年の停滞はIntelの失策のせいか。
数年前にトライゲートは発表してたと思うんだが・・・ AMD、IBMはデュアルゲートそのころ発表してたな・・・ 45nmから使い始めるよって言ってるだけにしか聞こえないが・・・
>>938 残念ながらAMDもFinFETを開発してるから同じだよ。
っていうかトライゲートって構造的にSOIだし。
2002年頃の記事を漁ればマルチゲートトランジスタの記事は結構出てくる。
>>940 数字を鵜呑みにしない方がいい。
1/50ってのは現行の65nmとの比較だけど、1/1000ってのはどう考えてもCPU向けのプロセスじゃない。
クロックを下げるのと引き換えにVtを上げればリーク電流は桁違いに少なくなっていくし。
単純にK8Lに進化版SOI使った45nmをぶつけてくるってのが脅威だ
AMD苦戦するだろうが、二大ベンダーになったから氏ぬことはないでしょ
945 :
847 :2006/06/13(火) 19:21:25 ID:trHpW/iB
AMDとINTELで新トランジスタの性能向上表記が微妙に違う。 AMDだと、普通のトランジスタに対して今回開発の新トランジスタはXX%性能UPと書かれているケースが多く、現在リリースしている最新のトランジスタの比較ではない。 INTELだと、現在リリースしている最新のトランジスタに対しての向上率が書かれているから体感的に分かりやすい。 どっちでも構わないけどな。
>>942 ゲート長から違う少電力Trで1/300、スリープトランジスタ等の回路技術で1/5-1/10で1/1000以下って話。
なんと比べてかははっきりしないし、スイッチング速度など同じ機能性能でいうわけでもない。