AMDの次世代CPUについて語ろう 5次世代

このエントリーをはてなブックマークに追加
1Socket774
■公式ロードマップ
製品ロードマップ (短期)
ttp://www.amdcompare.com/prodoutlook/
テクノロジ・ロードマップ (3年)
ttp://www.amdcompare.com/techoutlook/
■前スレ
4 http://pc7.2ch.net/test/read.cgi/jisaku/1145187468/
3 http://pc7.2ch.net/test/read.cgi/jisaku/1138983969/
2 http://pc7.2ch.net/test/read.cgi/jisaku/1133374045/
1 http://pc7.2ch.net/test/read.cgi/jisaku/1124542812/
自作板AMD系スレッド過去ログ保存サイト様
http://amd.jisakuita.net/
■関連スレ
【CRISC】CPUアーキテクチャについて語れ【EPIC】3
http://pc7.2ch.net/test/read.cgi/jisaku/1139046363/
Intelの次世代CPUについて語ろう 25
http://pc7.2ch.net/test/read.cgi/jisaku/1147545560/

____
\._  | 荒らし・煽り・厨房は放置が一番。
/|_| | 釣られずにスルーしましょう。
|_/\! sage進行でマターリいきましょう。
2Socket774:2006/06/16(金) 02:49:29 ID:mfJlxT1x
Rev. Fの次の次に来るAMDの次世代コア「Hound」
http://pc.watch.impress.co.jp/docs/2006/0531/kaigai273.htm

拡大が進むAMDのコプロセッサ構想
http://pc.watch.impress.co.jp/docs/2006/0601/kaigai275.htm

設計のモジュラー化で市場に最適化したCPUコアを〜AMDの新戦略(1)
http://pc.watch.impress.co.jp/docs/2006/0616/kaigai282.htm

いちおうそれっぽい記事はっとく。
前スレにアドレス貼れなかったorz
3Socket774:2006/06/16(金) 02:51:46 ID:PRP63Hgx
>>1


すまない…目の前に1000があったからつい取ってしまった。
ROMに戻るお
4・∀・)っ-○◎● ◆toBASh.... :2006/06/16(金) 02:55:00 ID:7kGcJ0Bt

998 名前:Socket774[sage] 投稿日:2006/06/16(金) 02:42:37 ID:15wyeOAX
>>996
uOPsに分解された結果は、同じだよ。
もちろん、それでも速く終わる命令はパイプラインの中で時間が経つのを待ってる。

999 名前:Socket774[sage] 投稿日:2006/06/16(金) 02:43:49 ID:15wyeOAX
>>997
ストア命令が続く場合は依存るすよ。


依存がないようにコードを組むのが命令レベル並列化っていうんですが?



とりあえず「リタイアステージ」の目的を説明してくれ。
GRとFP/MMの実行パイプライン段数の違いがあると並列実行できない理由もな。

というかVTuneやCodeAnalist使ったこと無いだろドシロトが
5Socket774:2006/06/16(金) 03:16:13 ID:qAmRDIaD
>CodeAnalist
アナルの達人ですか?w
6Socket774:2006/06/16(金) 03:16:45 ID:15wyeOAX
依存のないように組むと言われてもなぁ、変な組み方したら間違った結果のでるCPUは要らないしなぁ。
7Socket774:2006/06/16(金) 03:23:37 ID:qAmRDIaD
依存のある組み方したら逐次実行されるだけだろ。
大丈夫か?
8Socket774:2006/06/16(金) 04:07:50 ID:6tKXYBVU
一概にそうとも言えない。
まあ出てないCPUであれこれ言うのもなんだが、、、
プレスコなんかNetburstという重力に縛られた哀れなCPUだったし
K8Lがそうならないことを祈るしかない。
9テンプレ:2006/06/16(金) 04:41:10 ID:syvotB8c
AMD儲のいつもの流れ


Aという技術がプロセッサ業界等で採用され始める(業界のトレンド)
→視野が狭いので知りもしない

オタ「Aという技術が他で採用されてるす。AMDもいずれ採用するんじゃないすかね」
→うざい。そんなわけないだろ

インテルがA技術の採用を発表する(インテル儲にとってトレンド)
→これだからインテルはw

AMDがA技術の採用を検討し始める
→これからはAの時代だ!(ここがAMD儲のいうトレンド)


もっと広い世界に目を向けるべきだと思うす
10Socket774:2006/06/16(金) 05:47:07 ID:Tc2z6tY9
>999 名前:Socket774[sage] 投稿日:2006/06/16(金) 02:43:49 ID:15wyeOAX
>>>997
>ストア命令が続く場合は依存るすよ。

同系統の命令が続くってことは、その続いた命令は、順番に実行されるだけで、
追い越しは無いでしょ

もう無理やりですな
11Socket774:2006/06/16(金) 06:23:21 ID:15wyeOAX
> 設計のモジュラー化で市場に最適化したCPUコア
> ttp://pc.watch.impress.co.jp/docs/2006/0616/kaigai282.htm

各回路のモジュラー化が進んでいる為、AMDは簡単にモジュールの拡張が可能だという内容。
で、その成果がFPUの128bit化・・・
よく見ると・・・64bit x 2・・・・これってプレスコットが32bit x 2で動作しているとか言って騒いでいたのに似てる。
K8Lはどうやらパッチモンのようですよ。
12Socket774:2006/06/16(金) 06:33:01 ID:6tKXYBVU
やっぱりコプロセッサは他社まかせか
もうIntelはAMPの試作と評価を終えてるのに大丈夫なんだろうか
13Socket774:2006/06/16(金) 06:38:45 ID:15wyeOAX
>>11のPhil Hester(フィル・へスター)氏の真の写真(これは似非ではありません)
> http://i-bbs.sijex.net/imageDisp.jsp?id=ups1&file=1150407427793o.jpg
14Socket774:2006/06/16(金) 06:52:58 ID:puLOG4A6
>>11
モノシリックな設計

物知りっく
15・∀・)っ-○◎● ◆toBASh.... :2006/06/16(金) 07:00:51 ID:7kGcJ0Bt
ID:15wyeOAXは録音先生なので
16Socket774:2006/06/16(金) 07:01:50 ID:15wyeOAX
よーし、おじさん(Phil Hester)は、モジュラー化の特徴を生かして頑張るぞ。
K8のFPUモジュールをもうひとつ横にくっつけて・・・・
片方のスケジューラはつぶして、片方のこれとあれをつないで・・・・・
あれれ、上手くいかない・・・・・ああ、もっと簡単に簡単に・・・ダブルで取り込めば・・・・
で、できた128bitFPUユニット完成でーす、これで性能は2倍だぁ(まだ確認してないけど・・)
よーし、これ発表しちゃえ!!!
17Socket774:2006/06/16(金) 07:19:33 ID:hu4M5CSB
http://pc7.2ch.net/test/read.cgi/jisaku/1150010642/

872 名前:Socket774[sage] 投稿日:2006/06/16(金) 00:09:52 ID:15wyeOAX
エンドユーザーにとってみれば、常に競争し、勝ち組みなしで価格が下がり性能だけが向上するのが望ましい。
しかし、それは目先の利だけである、競争が激化しコストだけが上昇し利益が出ないのであれば、企業は競争をやめてしまう。
儲からぬのに多額のコストを投下する理由がなくなるからだな。
つまり、常に競争して欲しければ勝ち組みに十分な利益を提供するしかない。
1年から4年程度はINTELの一人勝ちで良いのだろうよ。



特徴のある文体ですなぁ
彼を見続けてる人にはわかりますよね?
ほくそ笑みながら見守ってあげましょう
18・∀・)っ-○◎● ◆toBASh.... :2006/06/16(金) 07:20:35 ID:7kGcJ0Bt
「INTEL」(笑)
19T.A. ◆Vr3ZLNzp5. :2006/06/16(金) 08:20:41 ID:stT2yzCR
普通、命令の依存関係をチェックして、依存関係のない命令を実行パイプに並列投入するのが
スケジューラの役割だったような・・・これはOut-Of-Orderの基本概念で別にK8独自のものじゃないし。

NetBurstのALUは倍速実行のおかげで、同じ実行パイプに投入される命令ならゆるい依存関係は
許容されるんだったっけ?
まだ、NetBurstの夢から覚めないのかな?
20Socket774:2006/06/16(金) 08:41:20 ID:hnIg7oFO
>>15はマ板でよく見る厨房
お前も録音と同じステージだってことに( ゚Д゚)気づけよ
21Socket774:2006/06/16(金) 10:06:25 ID:sMW4nYqo
マ板じゃなくてム板だろ
22Socket774:2006/06/16(金) 11:07:31 ID:Oi3Zo85s
ム板だけでなくあちこちで
知ったか→集中砲火→逆ギレ→ゴマすり
ネトナン→弄ばれ→しつこくナンパ→放置→逆ギレ
を繰り返し日々有名になっている奴

ノート自慢のために自作をけなしまくっていたのは記憶に古い
そんな奴がここに来るなんて、Mヲとか録とか5の重力に引き寄せられたのか?
23Socket774:2006/06/16(金) 11:45:58 ID:sMW4nYqo
K8Lのダイフォトの解析を見る限りでは、FP系ユニットは全て64bitづつで
左右に分かれてるように見えるんだが。

「SSE1整数」が今まで同様、独立した2個のm64ユニットとしても
2つ合わせて1個のm128iユニットだとしても動くフレキシブル仕様なら
同じように並べられてる浮動小数系ユニットも独立して動かすことが
出来ても不思議じゃない。むしろ簡単に出来そうだ。

つまりSSE*スカラやx87演算において加減算同士・積算同士での並列実行を
可能にすることで、Coreアーキに対する強みになる。
もちろん128bit×2のロード帯域もだが。

ただし命令帯域の縛りがあるから、あくまでピーク性能を出せるのは
128bitFP加減算+積算の並列実行の時と思われ。

SSE*整数ユニットを増強しないとすれば、糞団子の指摘どおり
64bitモードでの汎用整数の活用で十分なスループットは
出せるようにするからと思われ。

そもそも(固定小数として)パックド整数を使うのはここ最近のゲームや
エンコーダでは流行らないし、浮動小数にフォーカスしたほうが
全体としては有利になる筈。

いずれにしてもK8Lが出るまではSSE対応ソフトではCore2のほうが
圧倒的に優勢だろうから、AMD的問題はそれまでどう乗り切るか、だわな。
幸いIntelはCore2の総入れ替えには時間を要し、暫くミッドレンジ以下では
NetBurstの在庫一掃セールだから、低価格帯では十分戦える。
マルチプロセッサ構成の鯖ならOpteronの優位を揺るがすにはまだ至らないはず。
24Socket774:2006/06/16(金) 14:03:43 ID:qAmRDIaD
32B Instruction Fetch
25Socket774:2006/06/16(金) 15:30:28 ID:XpQe0maY
糞団子
だけ呼んだ
26PowerPCオタ:2006/06/16(金) 19:47:14 ID:R7l8o1QE
>>19
>NetBurstのALUは倍速実行のおかげで、同じ実行パイプに投入される命令ならゆるい依存関係は
>許容されるんだったっけ?
普通にレジスタリネーミングしてるんじゃねーの?
27Socket774:2006/06/16(金) 21:08:50 ID:VErJGTFT
インテルのCore2 XEは消費電力が高過ぎ、ワット性能も低いのにくらべて、
AMD社の一部のデュアルコアプロセッサは消費電力もインテルのシングルコアのCore Solo未満となっており、
インテル社のCPUはもう使い物にならない時代が到来しております。
私自身はメーカー名にかかわらず良い物を買う派だったのですが、
もうインテル製品は買えないほど、インテルは堕落してしまいました。
AMDは不安定と言う人もなかにはいますが、それはチップセットメーカの怠慢であり 、
AMDは良いプロセッサのみを作り続ける職人派であるといえます 。AMDは直接的には関係ありません。
そもそも大半の不具合はユーザーが余分に投資すれば解決できるものばかりです。
Intelの推進するIA-64はAMD64にとってかわられ、はっきりいって最早未来はありません。

インテルさようなら
28Socket774:2006/06/16(金) 21:18:54 ID:AeWjj8Do
>>27
なに? このコピペ流行ってるの?
29Socket774:2006/06/16(金) 22:12:50 ID:1k4PVOoo
K8LがK8アーキの拡張、L2はconflictの除去に専念を考慮してキャッシュ構造の仮説を考えてみた。
L1とL3が排他であり、たとえばコア1のL1に読み込まれると共有L3にはデータはなくなる。
だから、その際コア2-4のL2にコア1にデータが読み込まれたことを記録するんじゃないかな。
コア1は、L3にデータを書き込む場合は、自分のL2にそのことを記録する。
実はL2の正体は、流動していくデータのアドレスのみを記録するためのものである。
こう考えると、L1,L2,L3のすべてに対して同時にリクエストかけられるよね?

コア1がL1,L2,L3にリクエストして、L2でヒットもしくはヒットがなかった場合は以下のようになるのかな?
L2にヒット→該当コアにアクセス→そのコアがL1,L2にリクエスト→L1にヒット→コア1にデータを送る
                                      →L2にヒット→コア1にL3のアドレスを送る→コア1がL3にリクエスト
ヒットなし→メインメモリにアクセス→L1に直接読み込み→コア2-4のL2にそのことを記録?
30Socket774:2006/06/17(土) 00:10:46 ID:JtHMldcw
いや、L3無しの構成もとれることから
31Socket774:2006/06/17(土) 12:02:44 ID:KnKMvbWG
>>29
そんなに遅くしてどうする気だ(笑
32Socket774:2006/06/17(土) 13:07:15 ID:uIfxz+HL
相変わらず読み難い長文が平気で垂れ流されてるスレですね。
33別人:2006/06/17(土) 17:20:40 ID:qsfdr5mY
>>26
真の依存性はレジスタリネーミングじゃ解決できない
倍速ALUはそのための工夫ではある

参考:↓の「ハザードとリネーミング」
http://ja.wikipedia.org/wiki/%E3%83%AC%E3%82%B8%E3%82%B9%E3%82%BF%E3%83%BB%E3%83%AA%E3%83%8D%E3%83%BC%E3%83%9F%E3%83%B3%E3%82%B0


漏れはメリットの小ささ(OoO-CPUでRAWひっかかりまくりのプログラムってどんなんだ?)に比べて
デメリット(クロックが倍の部分を作るために電力↑↑)が大き杉だと思うけど
34Socket774:2006/06/17(土) 17:30:28 ID:0EAeImkv
要は、L1とL3の関係は今まで通り。ただ、L3の容量増大と共有によってレイテンシが増加するかも
L1とL3が排他であるから、特定のコアがデータを持って行くと、他のコアが参照した場合に困る
どのコアが持って行ったか記録しとけば、全部のコアに問い合わせなくてもすむからレイテンシが減るし、関係ないコアがじゃまされることもない
これなら、少なくとも性能の低下はないのか
以下、ご批判をどうぞw
35Socket774:2006/06/17(土) 23:08:36 ID:KnKMvbWG
>>34
何度も言わせるな、遅くなるだけだ。
36T.A. ◆Vr3ZLNzp5. :2006/06/18(日) 01:15:39 ID:HkL0ytwq
37Socket774:2006/06/18(日) 09:53:15 ID:luDIo4hc
AMDはコンロー出てくるまでは、自ら価格を落とす必要はなしと判断しているのでしょう。
コンロー前に2.8G売り切って、コンロー出たら、FXを貯めておいた3Gにして、
2.8Gまでは対抗出来る(生産出来るだけの量が売れる)価格まで下げる。

65nm立ち上げまでは生産量増えませんから、今のシェアキープでしょうね。
65nm立ち上がった時点で、クロックUPと低価格で攻勢開始。Houndで追撃ってところでしょうか。

キャッシュ量は、メモリーIFのレイテンシを削減する設計なので、あんまり載せても効果は薄いでしょう。
むしろ、IntelがAMDに対抗するために大量のキャッシュを搭載せざるを得なくなってると見るべき。
38Socket774:2006/06/18(日) 11:38:03 ID:qDIjpG1F
結局CPUコア性能でもキャッシュの容量&性能でも、Intelに対抗する手段が
不透明ってのが現状なのかな。

ハイエンドサーバーは当分大丈夫だとしたら、あとはデスクトップ&モバイル
だが、廉価デスクトップとモバイル用にPCI-Ex4(x2でも可?)直結のCPUなん
てどうかなあ?

GPUを直結出来れば性能(特にUMA時)で有利になるし、確かHTをノース/サウス
接続に使ってるnVidiaのサウスチップがそのまま使えるし。確かAMDの方針とし
てもmobileは別コアにする筈だから、これにだけPCI-Eを載せるなら不都合は無い
訳だし。

問題はローエンドデスクトップが、ミッド&ハイエンドデスクトップと別MBに
なるという、Socket754/939 の問題を再現しかねない点かな?
39Socket774:2006/06/18(日) 11:43:03 ID:qDIjpG1F
↑良く考えると「AMD EfficeonII」だな、コリャ。(汗
40Socket774:2006/06/19(月) 00:57:40 ID:5X9+EbH4
ConroeのOC耐性は凄い、空冷4GHzも可能だ。
AMDが65nmで少々クロックを上げた程度では全く追い付けない。
> ttp://www.xtremesystems.org/forums/showthread.php?t=103381

Conroeの4GHzはAMD社の最新CPUの5GHzに匹敵する。
41Socket774:2006/06/19(月) 01:04:09 ID:UT5GWAgA
情報を鵜呑みにして踊らされる人の典型。
42Socket774:2006/06/19(月) 12:47:04 ID:QD77vVqv
>>38
http://www.atitech.ca/products/mobilityradeonx1800/specs.html
|Native PCI Express x16 bus interface

Mobileでもハイエンドも含めるには、x16が必要って事ですね。

性能の低いGPUだと x8 や x4 でも充分かどうか、何故かスペック頁に載って
なかったですが、フル稼働しない場合の省エネ動作として、x4やx8動作(非動作
部分はスタンバイさせる)は、CPUで必要そうな気がします。
43Socket774:2006/06/19(月) 19:31:28 ID:6D6qEs6O
>>41
まだ売られてないんだし、発売前に踊っても買えないから問題ないお
発売後に期待通りだったらまた踊り続ければいいんだお( ^ω^)
44Socket774:2006/06/19(月) 20:21:15 ID:8qz0KPGi
AMD苦難の時代だな
まぁここ数年苦しみ続けてきたインテルを思えばまだマシか
45Socket774:2006/06/19(月) 23:41:29 ID:as5cLazy
>>44
>>37
全然苦難の時代じゃないしインテルのようにひどい製品を広告力だけで売るようなことは出来ない。
なぜならAMDには性能的に劣るものでも盲信して買うような厨なファンがいないから。
64シリーズは地道に賢い消費者を味方につけて売り上げを伸ばしてきた。
AMDだろうがインテルだろうが、よいものを見抜ける目を持ったものたちなのである。
へたな製品を出すならまったく売れないだろう。
また、AM2とコンローを比べてAMDが終わったというバカがいるがそうではない。
AM2は単にDDR2導入のためのマイナーチェンジでCPU的には何の変化もない。
それでも低電圧や低価格、すでに所持しているものにとってはDDR2が流用できるなど魅力も多い。
コンローは今までも最も優れたCPUではないかと言われていたPentiumMのニコイチの進化形。
インテルは最悪なCPUとなってしまったPentium4をようやく捨て、まったく新しい路線で起死回生を狙ったのである。
つまり、まだ発売すらしていないコンローと現行のAM2を比べるのは間違い。
AMDが次に出してくる65nm製品やHoundと比較すべきものである。
46Socket774:2006/06/20(火) 01:01:01 ID:DLxkUPBc
> なぜならAMDには性能的に劣るものでも盲信して買うような厨なファンがいないから。
2chの自作板に住み着くアム厨がいる。
AM2はConroeよりも圧倒的に性能が悪いのは明白だ、でも買うやつはいるw
47Socket774:2006/06/20(火) 01:34:34 ID:Zb347DbG
CPU単体の性能では完全に今はintelターンだな。
元々、お互い半分ずれた周期でアーキテクチャを更新してるから当然の結果ではあるが。

だが、商業的にはどうだろうな。
Opteronの躍進、AMD64の採用、電力効率&マルチコアへの路線転換etc・・・と企業戦略としては
完全にintelは後手に回ってるし、Fab36の稼動で薄利多売と高利少売を両立できる体制も出来た。
独占禁止法関連でintelへの牽制も少しずつだが効いて来てる。

この状況で投資家がどう動くかが鍵かもしれんが・・・
48Socket774:2006/06/20(火) 01:37:20 ID:DLxkUPBc
> 元々、お互い半分ずれた周期でアーキテクチャを更新してるから当然の結果ではあるが。
AMDはAthlon64発表以来殆ど進化していないのだが・・・
49Socket774:2006/06/20(火) 02:01:31 ID:Zb347DbG
>>48
SSE3対応、HyperTransport2.0、DualCore化、DDR2対応は進化じゃないのか?

だとしたら、NetBurstも2000年11月の発表以来、大きな変化はPrescottだけでそれ以外は
FSBクロック向上とキャッシュ増量という力技で進化とは言えんな。
強いて言うならHyperThreadingくらいだが、あれも最初から組み込まれてた機能をONにしただけで
OFFのままの中途半端なものを買わされた連中がバカを見ただけに過ぎん。
PrescottはSSE3を除けば果たして改良といえるかどうか・・・ある意味、あれがNetBurstにトドメを刺したとも言えるしな。

他の分野では既にあるとはいえ、DualCoreという構造的にも大きな変化がある分、まだ進化と言えると思うがな。

いずれにせよ、基本アーキテクチャの開発→市場への投入→小改良→・・・というサイクルはほぼ半周ずれだから、
しばらくはAMDも今までと同じようにはいかんだろうが・・・K8でバス周りを真っ先に改良しておいたのは正解だろうな。
50Socket774:2006/06/20(火) 03:35:49 ID:DLxkUPBc
>>49
全然というか、全く進化とは言えない。
51Socket774:2006/06/20(火) 05:03:59 ID:TyCkY+aD
4:主観で決め付ける
52Socket774:2006/06/20(火) 08:06:17 ID:Zb347DbG
>>50
ならConroeも全く進化してないと言うべきだな。
ステッピングが示す通り、単なるP6の改良に過ぎん。
バスはクロックこそ上げてるがNetBurstの流用だし、ComplexDecoder+SimpleDecoderという構成や
パイプラインの基本構造もP6そのもの。

改良が進化じゃないなら、P6vsK7は昔から何も変わらないことになる。
一度、NetBurstに進化(個人的には退化だが・・・)しておきながら、P6に舞い戻ってきてるんだから退化かもな。
53Socket774:2006/06/20(火) 08:27:11 ID:TiYIodqW
>パイプラインの基本構造
これは詳細発表されたんですか?
良ければ詳細キボン。
54Socket774:2006/06/20(火) 08:27:42 ID:DLxkUPBc
>>51
客観的事実だ。
設計は何も変わっていない。

>>52
詭弁は聞き飽きた。
55Socket774:2006/06/20(火) 08:57:10 ID:kYGKI5y+
P6とK7は兄弟みたいなもんだと言う人もいるからね。
Conroeの改良点がもたらした効果というのは、そのままK8にも適用できる訳だ。
このあたりは学会なんかでアイデアそのものは昔からあるものがほとんどで、実装には
特許だの権利だのといった制限が付けにくいし。

あとは匙加減の問題だな。
ピーク重視になりがちなintelと平均値や最低値の底上げを重視するAMDではそのあたりは
かなり違うからね。
56Socket774:2006/06/20(火) 10:37:51 ID:DLxkUPBc
> P6とK7は兄弟みたいなもんだと言う人もいるからね。
というか、K7はP6の真似っ子に過ぎないし、K8はK7を拡張したバージョンだ。
この拡張は結構優れていたが、K8Lは急増の産物でしかなさそうで予定している程の成果は難しいだろうな。
57Socket774:2006/06/20(火) 12:17:25 ID:EmWKp8Em
>>54
どっちが詭弁なんだか。
K8のSSE3対応、マルチコア化、DDR2対応などの一連の改良を進化じゃないと言い張るなら、
NetBurstやBanias系の同様の改良も進化じゃないと言うことになるのは当然じゃないか。
58Socket774:2006/06/20(火) 12:19:06 ID:6GrIxX1M
どうでもいい
3年前に遅れに遅れて出した3200+や、P4 3.2GHzを未だに高値で売り続けるAMDとIntelがDQNってことでいいよ

問題はどちらが先にこの状況を脱するか、だ
59Socket774:2006/06/20(火) 12:41:45 ID:OYPKOt+p
AMDとインテル、方向性が違っていて面白い
もともと会社の規模や文化からして違うんだし、いいと思う
AMDのコプロがどこまで普及するかが見物
60Socket774:2006/06/20(火) 12:47:27 ID:bUjCpuAa
L1とL3とでレイテンシの差が有る、L3が共用、L1がコアごとに別という構造なら、
L1とL3とを排他にすることをやめればいい。
排他にしなけりゃ、読んだことで内容が変わることも無いから読んだときのタグ付
は要らなくなる。単純に、書き込んだときに、どのコアが書き換えたかのタグ付を
するだけでよい、読むコアが自分以外のタグを見たら再度読み直すという単純な
動作だけで済む。
61Socket774:2006/06/20(火) 12:55:47 ID:kYGKI5y+
>>56
今のx86系CPU自体が、RISC系プロセッサとかがとっくに通過した技術の流用に過ぎないんだから、
真似がどうのと言うのは無意味。
62Socket774:2006/06/20(火) 12:56:37 ID:6GrIxX1M
>>61
自作板なんて、井の中の蛙の住処なんだから突っ込んじゃかわいそうよ
63Socket774:2006/06/20(火) 13:10:08 ID:b+XD7S4N
シェアが少ないのに俺等がシェア握ってるんだと勘違いする人も居て困る。

1週間前の漏れとか( ゚∀゚)<プップー
64Socket774:2006/06/20(火) 13:39:54 ID:DLxkUPBc
>>57
> K8のSSE3対応、マルチコア化、DDR2対応などの一連の改良を進化じゃないと言い張る

進化ではないな。
SSE3対応は、拡張命令セットへの対応でしかない。
マルチコア化は元々の設計がマルチコア前提だから進化とは言えない。
DDR2対応も、単に新メモリへの対応に過ぎない。

進化の欠片すらない。
65Socket774:2006/06/20(火) 14:00:16 ID:b+XD7S4N
毎回思うんだが「〜に対応しただけ」を進化じゃないと言うなら
何を進化という尺度に入れるんだろう…
66Socket774:2006/06/20(火) 14:03:45 ID:DLxkUPBc
常識的には実回路の増強や新たな設計を進化というのだろうね。
アム厨はは信者が多いから常識が通じなくて困るな。
67Socket774:2006/06/20(火) 14:08:15 ID:b+XD7S4N
ふーん。まあそれで良いんじゃね。
俺は信者同士の対決見てるのが楽しいからもっと適当な話題で盛り上がっててくれ。
68Socket774:2006/06/20(火) 14:18:55 ID:/aIpOQ+M
>>60
それは読み込みに行くときは常にL3まで確認しに行くということか?
69Socket774:2006/06/20(火) 14:26:00 ID:DLxkUPBc
K8LのL3キャッシュについて言えば、現在までの議論を総合すると、
前スレの809以上に高性能なキャッシュになる発言は全く出ていないな。
もっとも、前スレの809もなんちゃってキャッシュでしかないけどな。

> AMDの次世代CPUについて語ろう 4次世代
> http://pc7.2ch.net/test/read.cgi/jisaku/1145187468/809

これまでのまとめ。

K8LのL3はL1L2と完全な排他構造となる。
排他構造とする理由はL1L2が排他構造で各コア毎に独立したキャッシュを持つから、L3を積んでもL1L2を走査した後に、
他コアへのL1L2の照会(コヒーレンシ制御の為)を必要とするから、L3は出来るだけL1L2と排他なキャッシュである方が効率が良くなるからだ。
不完全な排他構造の疑惑が>>801に書かれているが、上記のようにL1L2の走査後に必ず他コアへの照会がある為、L3は完全排他構造を維持できる。
次に、L3はダーティキャッシュ(破棄時にメモリへの書き込みが必要なキャッシュ)を含まない。
ダーティキャッシュの書き込みはL2より破棄されるときに行われる。
これにより、L3はメモリが保持するデータの写しでありヒットすればそれなりにレイテンシが向上するという性質を持つ。
他スロットのL3とのコヒーレンシ制御は厳密である必要がなく(ダーティキャッシュを含まないし、共有制御はL1L2のみで良い)照会パケットは送らない構造だと思われる。
この為、L3と実メモリは同時にアクセス可能となる。

ふーやっと解析終了・・・長かったぜ。

70Socket774:2006/06/20(火) 14:28:52 ID:OYPKOt+p
>>64
>進化の欠片すらない。
よくそういうこと言えるね。君がAMDの幹部だったらそうはしなかった、とでも言うつもり?

つーか、そもそも進化なんて言葉はこのドッグイヤーな業界には大げさすぎるよ。分かりやすく進歩でいいよ。
俺は「〜に対応しただけ」でも十分な進歩だと思うし。
71Socket774:2006/06/20(火) 14:32:30 ID:DLxkUPBc
ああ、俺様がAthlon64の開発チームにいたらとっくの昔に進化しているな。
まずは、デュアルコア化が当たり前になる状況なら排他キャッシュを廃止し高性能なL2共有キャッシュを開発するね。
72Socket774:2006/06/20(火) 16:27:06 ID:OYPKOt+p
>>71=64
じゃ今からでも遅くない、入社してくれ。頼むぜ
73Socket774:2006/06/20(火) 16:53:26 ID:8fyhKXd+
あんな糞な会社にはヘッドハントされても行かないよ。
74Socket774:2006/06/20(火) 17:00:30 ID:uIuxJAnO
君の場合はヘッドじゃなくてテールというか

(トカゲ)テールカット
75Socket774:2006/06/20(火) 17:29:22 ID:ayl3w5VK
>>71
はいはい。>>37>>45を1000回読んで土下座してね。
76Socket774:2006/06/20(火) 17:43:52 ID:8fyhKXd+
>>75
どこで電波拾ったか知らないがFXの3GHzを出したところでE6600にすら勝てないのは明白なんだよ。
77Socket774:2006/06/20(火) 17:54:38 ID:kYGKI5y+
ま、キャッシュをいくら強化してもI/Oには効かないからな・・・

同一チップ内のコヒーレンシ制御で若干有利な程度で、ソケット間のコヒーレンシ制御にはほとんど無効、
ソケット間でしか共有してないデータでもキャッシュが共有になってるおかげで、共有データを参照していない
無関係なコアもコヒーレンシ制御に巻き込まれるというところか。
78Socket774:2006/06/20(火) 18:27:29 ID:8fyhKXd+
K8LのL3共有キャッシュは、コヒーレンシ制御には全く恩恵ないけどな。
自コア内のL1L2でキャッシュエラーのときは他コア全てで照会(L1L2走査)が必要。
もっとも、今始まったことではなく前からずっとだけどな。

で、キャッシュ性能が悪いからL2の走査も時間がかかるっと・・・
79Socket774:2006/06/20(火) 19:28:47 ID:rNn1GNL/
80Socket774:2006/06/20(火) 19:46:43 ID:0856cAL+
>>78
一つ聞いていいか?
毎度毎度「走査」と言ってる様だが、お前の理解している「走査」ってのは、具体的に何をやってるんだ?
キャッシュに対して「走査」するというのがどうもイメージ出来ないんで、説明頼む。
81Socket774:2006/06/20(火) 22:55:37 ID:KaS+EQeO
>>78
L1L2でキャッシュエラーが起きたコアだけキャッシュをフラッシュすりゃいいだけじゃね?
他のコアはそのまま走る。
82Socket774:2006/06/20(火) 23:24:34 ID:gBGTFqjE
83Socket774:2006/06/20(火) 23:43:30 ID:OYPKOt+p
なにこのおやじ
84Socket774:2006/06/21(水) 00:52:54 ID:9DIghp+M
COMPUTEX TAIPEI 2006 - AMDの次世代テクノロジを探る、CTO・Phil Hester氏インタビュー
ttp://journal.mycom.co.jp/articles/2006/06/20/computex01/
大原雄介と後藤弘茂との共同インタビューだそうですよ。
現在の出てる情報の確認ってかんじですねぇ。
85Socket774:2006/06/21(水) 05:18:50 ID:FYZQm2Nx
K8 の L3 の悪口言ってるインテラーは、Itanium (Montecito) の悪口言ってる
ことにもなるんだがなあ。
Montecito も L2 は分離、L3 は共有。もっとも Montecito の場合は L3 は
間違いなく Inclusive だろうけど。
ただし、インテラーが繰り返し言ってる

> 自コア内のL1L2でキャッシュエラーのときは他コア全てで照会(L1L2走査)が必要。

ってゆうのは Montecito でも同じ。
別にこれは排他キャッシュの特徴じゃないよ。

シングルスレッド性能が重要なデスクトップでは、L2 共有は当然の解だけど、
サーバの場合はそうとも言い切れないのねえ。
86Socket774:2006/06/21(水) 05:39:15 ID:qfDm/Dlb
別に悪口は言ってない、事実を喋っているだけだ。
InclusiveなL3共有キャッシュを有している場合、L1L2L3でキャッシュエラーなら同一ソケット内のコアへの照会は不要だ。
87Socket774:2006/06/21(水) 07:40:10 ID:FYZQm2Nx
アホか。

別コアの L1 が dirty なデータを持ってたら、その L1 に
照会するしかなかろう。
Write Thorugh キャッシュしかなかった大昔じゃあるまいし、
Write Back キャッシュが当たり前の現代では、別コアの
L1, L2 に照会する必要があるのは、Montecito だろうが、
Core Duo だろうが同じ。

いつまでも寝言を書き続けてて、恥ずかしくならんのか?
88Socket774:2006/06/21(水) 08:01:42 ID:qfDm/Dlb
>>87
アホはお前w
InclusiveなL3共有キャッシュを有しているのだから、L3キャッシュエラーの時点で同一ソケット上のL1L2の全てがキャッシュ保持されていないことが判明している。
89Socket774:2006/06/21(水) 08:08:10 ID:FYZQm2Nx
で、もし L3 キャッシュにあることが分かったら、それから L1 や L2 に
問い合わせするわけ?
そうすると、L3 ヒット時のレイテンシは、L3 問い合わせ + L1/L2 問い合わせ
になるわけだ。それって遅いじゃん。

レイテンシのことをちゃんと考えて作れば、L3 への問い合わせと L1/L2 への
問い合わせは並列に行なうように作るはず。そうすれば、L3 ミスヒット時も、
L3 ヒット時も効率は変わらん。排他キャッシュだろうが、そうでなかろうが、
速度は変わらん。
それぐらいのことも分からんの?
本当にアホ?
90Socket774:2006/06/21(水) 08:12:22 ID:qfDm/Dlb
>>89
> で、もし L3 キャッシュにあることが分かったら、それから L1 や L2 に
> 問い合わせするわけ?
> そうすると、L3 ヒット時のレイテンシは、L3 問い合わせ + L1/L2 問い合わせ
> になるわけだ。それって遅いじゃん。

ほい、そのとおり。

> レイテンシのことをちゃんと考えて作れば、L3 への問い合わせと L1/L2 への
> 問い合わせは並列に行なうように作るはず。
そんな馬鹿なことはしない、逆に遅くなってしまう。

L3共有キャッシュは便利だが、L1L2より遅いこと前提で設計されている。

> それぐらいのことも分からんの?
> 本当にアホ?
アホはお前だってばw
91Socket774:2006/06/21(水) 08:16:33 ID:FYZQm2Nx
> > レイテンシのことをちゃんと考えて作れば、L3 への問い合わせと L1/L2 への
> > 問い合わせは並列に行なうように作るはず。

> そんな馬鹿なことはしない、逆に遅くなってしまう。
> L3共有キャッシュは便利だが、L1L2より遅いこと前提で設計されている。

はあ?
遅くなるわけないじゃん。
先に結果が分かればその結果だけ利用して、遅れてきた結果は捨てれば
いいんだから。本物のバカですなあ。

実際、Conroe のキャッシュの宣伝項目にある Direct L1 to L1 cache
transfer って、まさにそういう技術だろ。
インテラーって、インテルの技術も知らんのか。
92Socket774:2006/06/21(水) 08:16:41 ID:7ya8Pjgl
話がK8のL2ロードレイテンシが比較的長いことを前提にしてる時点で寝言だよな。

通常、ロードレイテンシはキャッシュに対してアドレスの照会を行い、ヒットしたデータのロード完了まで
の時間だから、アドレス照会まででヒットが無ければ大した時間はかからん。

L2=512KByte/Mem=512MByteを前提条件とした場合なら、キャッシュがメモリ上のデータを保持している
確率は1/1024だから、照会でロードレイテンシと同等の時間が必要になるケースなど極僅かだ。
93Socket774:2006/06/21(水) 08:19:35 ID:qfDm/Dlb
> 話がK8のL2ロードレイテンシが比較的長いことを前提にしてる時点で寝言だよな。
前提になどしていない、その為に敢て走査と書いてある。
これはヒットしない場合が多いこと前提としている。
94Socket774:2006/06/21(水) 08:22:20 ID:qfDm/Dlb
>>91
お前は喋らない方がいい、知能が低すぎる。
そのことは>>87でもわかる。
95Socket774:2006/06/21(水) 08:28:46 ID:dnp8WgFi
>>87 って、どこかおかしい?
L3 にヒットした場合、L1 や L2 に問い合わせて、ダーティなデータを
抱えてるかどうか確認しなきゃいけないのは確かだよね。
96Socket774:2006/06/21(水) 08:29:14 ID:qfDm/Dlb
> 通常、ロードレイテンシはキャッシュに対してアドレスの照会を行い、ヒットしたデータのロード完了まで
> の時間だから、アドレス照会まででヒットが無ければ大した時間はかからん。
> L2=512KByte/Mem=512MByteを前提条件とした場合なら、キャッシュがメモリ上のデータを保持している
> 確率は1/1024だから、照会でロードレイテンシと同等の時間が必要になるケースなど極僅かだ。

見るべき視点が間違っている。
キャッシュエラーによる照会が多発することで、各コアに大きな負担が掛ることを忘れている。
1コアだけのロードレイテンシを見てたらダメだなw
全てのコアが稼働状態にあるときの負荷を気にしてくれよ。
97Socket774:2006/06/21(水) 08:31:17 ID:qfDm/Dlb
>>95
87は86に対しての発言としては不適当だ、それは既に>>88に書いてある。
>>88を失念していた様が見て取れる。
ついでにいうと、>>89>>86の失態をごまかす為に書かれていると見るのが普通だよw
98Socket774:2006/06/21(水) 08:31:33 ID:UkMXQdmD
>>94
そしてお前の知能はさらにその下だ(爆
どのレスを見てもそれは明白(核爆
99Socket774:2006/06/21(水) 08:40:48 ID:FYZQm2Nx
そもそも俺は最初の書き込みで Inclusive って書いてるんだから、
>>88を失念するなんてことが不可能なのは明白だと思うのだが。
L3 への問い合わせと L1/L2 への問い合わせを並列して行なえば、
>>88 のケースでもレイテンシの悪化などは起きないんだが、まだ
分かってないのか。

で、結局 >>91 にはまともな反論を思いつかないから知能が低過ぎると
中傷するしか手がないわけね。かわいそうな奴だなあ。
100Socket774:2006/06/21(水) 08:51:12 ID:qfDm/Dlb
>>99
他コアへの照会数が増えることをお前は無視している。
他コアからの照会が発生すると、自コアの作業を止めて先に照会に対する返信を行わねばいけない。
これが、4コア同時に発生することとなり負荷は大きくなる。
それをお前は失念している。

で、L1L2は各コア独立しており、L1L2でヒットした場合は、共有フラグが立っていなければ他コアへの照会は不要だ。
L3共有キャッシュを搭載する目的としてキャッシュエラー時の照会パケットを減らす目的があることを忘れないでくれ。
各コアの基本キャッシュはL1L2であることもしっかりと理解しておけ。

でだ、K8Lの場合は、L3がL1L2と完全排他構造にするのが都合がいい。
でその場合、L3とメモリーは同時アクセスが可能とな。
このような特性になるが、コヒーレンシの軽減には全く役に立たないものであると言ってるだけだ。
その意味で、なんちゃって共有キャッシュとなる。
101Socket774:2006/06/21(水) 08:55:15 ID:FYZQm2Nx
> 他コアへの照会数が増えることをお前は無視している。
> 他コアからの照会が発生すると、自コアの作業を止めて先に照会に対する返
> 信を行わねばいけない。

それは単純に間違い。
ひょっとしてソフトウェアエンジニアでハードウェアのことを全く知らない人?
ソフトウェアの場合、あるスレッドが作業を行なっている間は、そのスレッドは
他の作業を行なうことができない。
しかし、ハードウェアなら、物理的にトランジスタや配線さえ増やせば、
他の作業を止めることなく、並列に作業を行なうことができる。
ソフトウェアでスレッドを増やすのと同じことだが。
102Socket774:2006/06/21(水) 08:57:06 ID:qfDm/Dlb
> それは単純に間違い。
そりゃ凄いw
おもいっきり笑ってしまったぞ。
で、おまえの妄想を聞かせてくれ。
103Socket774:2006/06/21(水) 09:05:11 ID:FYZQm2Nx
単に配線をするだけの話だよ。
まあ Conroe の宣伝文句を実装しようとすると、L1 のポート数を増やす
必要があるので、それはそれなりに大変な話だが、今回の K8L の話なら、
ttp://journal.mycom.co.jp/articles/2006/06/20/computex01/001.html
の図2を見れば分かる通り、あるコアから、L3 への問い合わせと
別のコアの L1/L2 への問い合わせは、クロスバーに経由で別の経路を
通るので、並列に発行しても何の問題もないことが分かる。
配線はちゃんとあるわけ。

つまり、あんたよりも、AMD の設計陣の方が賢いと。
あたりまえだけどね。
104Socket774:2006/06/21(水) 09:10:12 ID:qfDm/Dlb
さて、アホ君は放置で・・・

>>84
> COMPUTEX TAIPEI 2006 - AMDの次世代テクノロジを探る、CTO・Phil Hester氏インタビュー
> ttp://journal.mycom.co.jp/articles/2006/06/20/computex01/

> --ところでL2キャッシュのサイズが1MBから512KBに減ったわけですが、これは何故でしょう?
> キャッシュシステムのモデリングを行って、各コアがどのくらいのサイズのL2を持ったときに
> 最も良いシステムパフォーマンスを発揮できるかを検討した。その結果、
> L2に1MBを搭載すると(各L2のコヒーレンシ確保のために)L3やクロスバーの負荷が高まるという結論が出ている。

面白いことが書かれている。
L2を小さくした方が、コヒーレンシ制御で有利という趣旨である。
これは下手にL2を大きくして、照会パケットによりヒットするよりは、L2を小さくしてL3へ吐き出し(ダーティ時はメモリへも吐き出すことでクリーン化する)
L2ではヒットせずにL3でのヒットのほうが有利との発言だ。
このようにCTO・Phil Hester氏もまた、コヒーレンシの悪化を気にしているのである。
ここらが、なんちゃってL3共有キャッシュの真髄といえるかもなw
105Socket774:2006/06/21(水) 09:18:27 ID:FYZQm2Nx
> これは下手にL2を大きくして、照会パケットによりヒットするよりは

「各L2のコヒーレンシ確保のために」ってのを、単に照会のコストと読むわけね。
違うんじゃねえ?
L2 で共有しているラインの同期を取るためのコストじゃねえの?

K8L コアはマルチソケットにもそのまま対応したコアで、照会だけなら、
別に今回の話に限らず、HT 経由で頻繁に来てるはず。マルチソケットからの
照会に耐えられる L3 やクロスバーが、たかが他のコアからの照会に
耐えられないわけがない。
106Socket774:2006/06/21(水) 09:19:48 ID:qfDm/Dlb
> あるコアから、L3 への問い合わせと
> 別のコアの L1/L2 への問い合わせは、クロスバーに経由で別の経路を
> 通るので、並列に発行しても何の問題もないことが分かる。

さすがアホ君だけある、他コアL1L2への照会とL3及びメモリのアクセスを同時に可能とのおバカ発言が飛び出しましたよ♪
これは非常に怖い。
他コアでL2解放の為、ダーティキャッシュをメモリへ書き込む動作と、自コアが他コアへのL2照会とメモリロードが同時アクセスするケースを
考えてみよう。
自コアのメモリロードが他コアのメモリストアより先に飛び込んだケース。
このケースのときに他コアからの返信がキャッシュ保持となってる保障はどこにもない。
107Socket774:2006/06/21(水) 09:24:14 ID:qfDm/Dlb
> L2 で共有しているラインの同期を取るためのコストじゃねえの?
同期を取るコストなら大きい方が圧倒的に有利なのだが・・・
108Socket774:2006/06/21(水) 09:29:30 ID:FYZQm2Nx
> さすがアホ君だけある、他コアL1L2への照会とL3及びメモリのアクセスを同時に可能

その記述には、メモリアクセスのことは一言も書いてないわけだが、
どこから空目したの? 気でも狂った?

> 自コアのメモリロードが他コアのメモリストアより先に飛び込んだケース。

当然一貫性制御はするでしょ。
まさか、何もしないと主張してると読んだわけ?
追い詰められると、ここまで空想が激しくなるんですね。

それ以外の記述もいろいろ変だけどね。

> 他コアでL2解放の為、ダーティキャッシュをメモリへ書き込む動作と、

L2 解放したら、メモリじゃなくて、L3 に書き込むでしょ。

> 自コアが他コアへのL2照会とメモリロードが同時アクセスするケース

メモリロードを同時に発行するとは俺は一言も書いてないわけだが。
メモリのバンド幅は限られてるので、そこまではしないんでないの?
メモリの場合、どうせ100クロック近くかかるわけで、キャッシュアクセス
と同時に発行しても、隠蔽できるレイテンシはメモリアクセス全体の
コストに比べて少ないからね。
109Socket774:2006/06/21(水) 09:30:34 ID:qfDm/Dlb
>>108
お前が書いてなくてもAMDはL3とメモリは同時アクセスすると言っている。
110Socket774:2006/06/21(水) 09:31:39 ID:fcZeb4m3
俺メモ:ID:qfDm/Dlb = 録音
111Socket774:2006/06/21(水) 09:35:37 ID:qfDm/Dlb
俺メモ:ID:fcZeb4m3 = 雑音粘着の屑
112Socket774:2006/06/21(水) 09:35:48 ID:FYZQm2Nx
> 同期を取るコストなら大きい方が圧倒的に有利なのだが・・・

実装面積が限られていて、L2 と L3 を同一チップ上に載せることを
考えると、そうとは限らないでしょ。
同期をとろうとするとキャッシュライン全体をまるまる転送する必要が
あるわけで、かなり長時間かかる。それぐらいなら、L3 の容量を大きく
して共有しちまった方が効率いいでしょ。
113Socket774:2006/06/21(水) 09:38:58 ID:qfDm/Dlb
>>112
ん?
L3を非完全排他にするのかな?
そのケースは考えられるが、あまり良い方策とは思えない。
もっとも、一番単純な拡張で済むからその可能性は高いけどな。

L3を非完全排他とするのなら112の理屈もOKだが、そうなるとL3キャッシュのヒット効率は悪化する。
114Socket774:2006/06/21(水) 09:39:00 ID:FYZQm2Nx
> お前が書いてなくてもAMDはL3とメモリは同時アクセスすると言っている。

お、そうなのか?
ポインタきぼん。

まあどっちにしても >>106 がいろいろ変なのは変わらないけどね。
例: 一貫性制御しないと仮定、L2解放→メモリ書き込み
115Socket774:2006/06/21(水) 09:40:48 ID:fcZeb4m3
>>111
俺の認識だと録音はそういうのを書かないはず。 よってハズレだったか。 すまんね。

ということは、おまえ、本物(トリップは忘れた)だろ?

116Socket774:2006/06/21(水) 09:44:53 ID:FYZQm2Nx
> L3を非完全排他にするのかな?

俺はそう思ってるよ。
そもそも、複数のコアから共有するのに、完全排他にするのは
かなり面倒でしょ。

> そうなるとL3キャッシュのヒット効率は悪化する。

そうなるね。
ここはトレードオフだけど、それでも十分L3の効果はあると思うよ。
117Socket774:2006/06/21(水) 09:44:56 ID:qfDm/Dlb
> ポインタきぼん。
自分で探せ。

> まあどっちにしても >>106 がいろいろ変なのは変わらないけどね。
> 例: 一貫性制御しないと仮定、L2解放→メモリ書き込み
思考停止して正当化するのは良くない。
118Socket774:2006/06/21(水) 09:46:37 ID:FYZQm2Nx
> > ポインタきぼん。

> 自分で探せ。

えー。
AMD スレのみんな。オラにポインタを分けてくれ!

# そろそろ会社行こ
119Socket774:2006/06/21(水) 09:48:08 ID:RavqsPjy
亀レスだがMontecitoは非共有L3
共有L3なのはTlusaな
120Socket774:2006/06/21(水) 09:49:30 ID:fcZeb4m3
MACオタ, Come on !

MACオタなら(略
121Socket774:2006/06/21(水) 09:49:51 ID:qfDm/Dlb
>>116
> 俺はそう思ってるよ。
> そもそも、複数のコアから共有するのに、完全排他にするのは
> かなり面倒でしょ。
面倒というか、普通は完全排他にするけどな。
AMD社の発表を聞いていたら、完全排他にするより開発期間が優先されていると思われる。
まぁ、非完全排他だろうなw

> ここはトレードオフだけど、それでも十分L3の効果はあると思うよ。
あんまり無いのではないかな?
もちろん、L3が無いよりはマシだが、クリーンキャッシュしか保持出来ない構造は痛いし、4コア分のL2と共有される確率は高くなるから2MBでは容量が不足だな。
122Socket774:2006/06/21(水) 10:15:20 ID:qfDm/Dlb
K8LのL3共有キャッシュが非完全排他だった場合は、なんちゃってL3共有キャッシュからも脱落し、
ベンチマーク専用L3共有キャッシュになってしまうだろう。

他コアのL1L2に保持されているキャッシュがL3共有キャッシュに存在していてもそれは無意味。
自コアのL1L2でキャッシュミス後に、他コアのL1L2照会がされるのでそこでヒットする。
つまり非完全排他だった場合は使われもしないキャッシュを大量に保持する構造であり意義は小さい。
しかし、ベンチマーク専用と言うのなら、その欠点も表面化することは少ないのでそれなりに良い結果となるだろう。

しかし・・・K8LはとんでもなCPUになりそうな予感がするのは俺だけか?
123Socket774:2006/06/21(水) 10:52:01 ID:RavqsPjy
普通に性能向上を果たすと思うが
まあCoreには及ばないだろうってのはわかりきったことだし
そこら辺は4x4で対抗するということでしょ

価格次第ではハーパータウン買えって話になりそうだけど
124Socket774:2006/06/21(水) 11:27:19 ID:HXX3WmIt
ここで熱く議論してる香具師は、やっぱそれ関係の業界にいるの?
趣味レベルでこういう議論できる人ってあんま見ないんで…
125Socket774:2006/06/21(水) 11:32:26 ID:lrWuSTlE
何故だろう。ID:qfDm/Dlbのが虚言に見える。
全角英数とか使うからだろうか。
それとも内容を理解せずに書いてるように見えるからだろうか。
126Socket774:2006/06/21(水) 11:47:41 ID:qfDm/Dlb
>>125
どのあたりに疑問があるのか言ってみれw

非完全排他にした場合、L2とだけではなくL1とも非完全にするしかないことも理解出来ているよな?
完全排他の場合は、L3への追加も削除も効率を落とすことなく行うポイントがあるが、非完全排他の場合にはそれがない。
結局のところ、L2破棄時にL3へクリーンキャッシュを追加するだけとなる、L3が満杯なら使用率の悪い古いキャッシュと置き換えるだけだ。
もちろん、既にL1へ取り込まれ更新されダーティキャッシュになる前のキャッシュまで整理されずにL3に残り続けているというありさまなんだよ。
この読まれると不味いキャッシュはL3を読む前に他コアへの照会の結果L1L2でヒットするから問題こそないがな。
非効率極まりないものでしかないんだよ。
ベンチマーク専用キャッシュとはよく言ったものだw
127Socket774:2006/06/21(水) 12:04:53 ID:UkMXQdmD
何を隠そう、ID:qfDm/DlbこそがK8Lの設計者だったのだ
128Socket774:2006/06/21(水) 12:16:23 ID:JB2hnNHd
『アホ君はほっといて』とか、『知能が低すぎr(ry』とか言うけど、
世の中には俺のようなバカもいるので、
4gamerの記事の様に、メイドで説明してくれなきゃ困る
129Socket774:2006/06/21(水) 12:26:44 ID:A48POBhC
もっとも悲惨なのがID:qfDm/Dlbが事実を述べているのか、
嘘っぱちを抜かしているのかが分からないことだ。

・・・俺はほとんど理解できないorz
130Socket774:2006/06/21(水) 12:45:55 ID:TeyI4R1v
ttp://journal.mycom.co.jp/articles/2006/06/20/computex01/001.html
|--これにより、L3とMain Memoryに同時にアクセスすることでメモリレイテンシを抑えるわけですね?
|その通りだ。
131Socket774:2006/06/21(水) 12:49:00 ID:4ZRIN1Fr
虚言に見えるのは、相手を蔑む姿勢と、「インテルのやることは素晴らしくて、AMDのやることは
つまらない」って結論以外認めない論理展開だよ。

書き込みの時間を時系列で見てくと、この議論で彼の人生がいかに浪費されているかがわかる。
議論の相手が会社に行ったりしているのと対照的に…
132Socket774:2006/06/21(水) 12:55:08 ID:HtvZEJNP
取り敢えず、ID:qfDm/Dlbの書き込みは独自用語とかが多くて理解不能なのが困る。
グダグダと理解不能な単語を並べず、スパっと論理回路図でも描いてどっかにUPしてくれ。
俺としては、無駄に長文書かれるよりそっちの方が解り易くて助かる。
(当然だが、論理回路にはMIL記号というきちんとした規格があるから、独自記号は無しでな。)

キャッシュの動作を語るくらいだから、それくらいはお安い御用だろ?
133Socket774:2006/06/21(水) 13:05:04 ID:HtvZEJNP
あと一つ気になったんだが、ID:qfDm/Dlbの言うキャッシュの「走査」ってなんだ?
単語から受ける印象だと、C言語のfor文のようにキャッシュを1lineずつ走査しているような感じだが。

K8だとL1/L2は共に64Byte/lineだから、L1で1024line・L2=512KByteでは8192lineもあるんだが?
こんなので「走査」なんかしてたらキャッシュが無い方が速いだろ・・・
134Socket774:2006/06/21(水) 13:10:17 ID:xIH4ghw8
技術を語る事が「目的」じゃなくて「手段」になってるからなあ
どんなに正しい事書こうが詭弁にしか見えない罠
135Socket774:2006/06/21(水) 13:15:51 ID:dnp8WgFi
>>130
それって、図1と違い、図2では、メモリアクセスのパスと
L3 アクセスのパスがクロスバーから見て分離されていて
同時に並列してアクセスできるって言ってるだけでは?

>>109 は、>>108 への返答だから、L3 アクセスする際には
常にメモリにも並列してアクセスすると主張しているような。
それってかなり過激な主張だと思うけど。
L3 はメモリよりもはるかにバンド幅が太いから、同じレートで
アクセスすると、メモリの側のバンド幅が溢れてとても困った
ことになるはずだよ。
136Socket774:2006/06/21(水) 13:26:34 ID:qfDm/Dlb
>>133
お前はスキャンという単語で、総当たりと解釈し全キャッシュラインを全て読むと理解したのか?
凄く理解力だなw
一般人程度の知識と知性があれば、スキャンするキャッシュラインはアドレスによりダイレクトに決まることを理解出来るだろうし、
スキャンはWay分で済むことも理解できるのだか・・お前にそれを要求するのは無理かなw

>>135
電波ってますか?
137Socket774:2006/06/21(水) 13:31:34 ID:lrWuSTlE
>凄く理解力だなw
あぁ、この辺の日本語の不自由さが虚言に見えるのかもしれない。
138Socket774:2006/06/21(水) 13:33:10 ID:dnp8WgFi
L3 と実メモリへのアクセスを、常に同時に行なうって主張の方が
電波だと思うけど。
139Socket774:2006/06/21(水) 13:43:56 ID:qfDm/Dlb
>>137
不自由なのか?
貧弱な発想なんだなw

>>138
ロード時は並行してアクセスだぞ。
もちろん、L3でヒットすればメモリへのアクセスは打ち切られる(又は破棄)けどな。
レイテンシ隠蔽の基本的な手法の一つだよ。
140Socket774:2006/06/21(水) 14:34:46 ID:dnp8WgFi
L3 アクセス時に L2 同時アクセスみたいに、メモリ階層の浅い方に
同時にアクセスするなら、なんとかなるだろうけど…

L3 アクセス時に D-RAM 同時アクセスのように、メモリ階層の深い方に
同時にアクセスしようとすると、バンド幅も狭いし、レイテンシは大きく
なるから、うまくいかないでしょ。
L3 アクセスのリクエストと同じ頻度で D-RAM にアクセスしようとすると、
アクセス要求だけで、メモリバスが飽和するのでは?

それに、cache についてはカスタムロジックだから、処理の中断とかも
自由に定義できるけど、DDR2 に、READ コマンドの一般的なアボート機能って
ないのでは? いくつかの条件が重なった場合には別の READ コマンドに
よる割り込みだけはできるみたいだけど、制約が大きいので、そういう
風に単にメモリアクセスを打ち切るというわけにはいかないのでは?

141Socket774:2006/06/21(水) 14:41:34 ID:qfDm/Dlb
>>140
もう一度言うけど、電波ってます?
それと、打ち切れない場合が多いから破棄と書いてるんだよ。
142Socket774:2006/06/21(水) 14:44:33 ID:fcZeb4m3
>>138
うむ
同時はありえない
143Socket774:2006/06/21(水) 14:47:45 ID:qfDm/Dlb
>>142
へーそうなんだw
じゃそういうことにしておこうか?
L3を積むと、メモリロードはL3の走査後となるからその分遅くなるってことで俺としてはそれでも構わないよ。
K8Lって悪くなる一方だなw
144Socket774:2006/06/21(水) 14:49:59 ID:fcZeb4m3
>>143
論理回路(物理層)の勉強をするべき
145Socket774:2006/06/21(水) 14:52:15 ID:dnp8WgFi
> それと、打ち切れない場合が多いから破棄と書いてるんだよ。

だとすると、まさに >>135>>140 で書いたとおりに、
結果的に L3 にヒットするから無駄になるメモリアクセスだけで、
メモリバスが完全に飽和するわけで、非常にまずいでしょう。

> L3を積むと、メモリロードはL3の走査後となるからその分遅くなるってこと

その理屈だと、L2 を積むとメモリロードは L2 の走査後となるからその分
遅くなるってことになるけど…
メモリ階層が増加した結果費やされるレイテンシよりも、そのメモリ階層に
よるキャッシュ効果の方が大きいから、メモリ階層を増やすわけで…

いくらなんでも、もう少しは考えてから返事を書いた方がいいと思いますよ。
146Socket774:2006/06/21(水) 14:57:08 ID:qfDm/Dlb
>>144
つまらぬ発言だな。
幼稚過ぎるよ。
この場合の同時は、当然のことだけど動作が完了するまで待たないってだけだ。

>>145
全然不味くない、L3は所詮オブザーバーヒットしたらラッキーって程度でしかない。
ちなみにL1L2も同時アクセスだよん。
147Socket774:2006/06/21(水) 15:03:38 ID:qfDm/Dlb
さらについでな説明をしておくと、メモリのロード命令は完了(実ロードされるまで)するまで結構長く待たされる。
それに比べて、キャッシュ走査は速いからメモリロードの要求は貯めておくバッファが用意されている。
連続ロードの場合、メモリロード待ちバッファが一杯になるまで先行できる仕組みだ。
で、このロード待ちバッファに存在している時は、これを破棄または取り消すことが可能になっている。
148Socket774:2006/06/21(水) 15:03:43 ID:dnp8WgFi
> 全然不味くない

バスが飽和している状況では、そもそもリクエストが出せないんですが、
もしかして分かってないですか?

> ちなみにL1L2も同時アクセスだよん。

>>99 で、ID:FYZQm2Nx が、L3 と L1/L2 への問い合わせを並列して行なうって
書いてたときには、>>100 で思いっきり否定していたみたいですが…
>>100 のご自身の発言は誤りだったということでしょうか?
149Socket774:2006/06/21(水) 15:06:42 ID:qfDm/Dlb
>>148
頭悪いなぁ、どうせそんなことしか返信できないと思ったから先に>>147を書いておいてあげたよ。
150Socket774:2006/06/21(水) 15:11:01 ID:dnp8WgFi
いや、それは全然答になってないんですが…

あなたが実は全くハードウェアを理解されてないことが、私には
はっきり分かりましたので、もう引っ込みます。
おつきあいいただき、ありがとうございました。
ではでは。
151Socket774:2006/06/21(水) 15:17:55 ID:qfDm/Dlb
あらら、負け犬が吠えてどっかに行ってしまったようですよ。
どこが、全然答えになっていないのか聞きたいですね。
L3へのアクセス要求とメモリーへのロード要求が同時並行に発せられていることがまだ理解できませんか?
そしてL3がヒットすれば、ロード待ちバッファを破棄すれば良いだけ。
既にメモコンへ指令済みで読み出し状態であっても構わない。
読み込まれて来た段階でロード待ちバッファを確認するたけで破棄出来ますからね。
152Socket774:2006/06/21(水) 15:24:26 ID:UkMXQdmD
>>151
じゃあお前は勝ち犬か。おめでとう。ワンと鳴けやw
153Socket774:2006/06/21(水) 15:25:01 ID:qfDm/Dlb
ワン♪
154Socket774:2006/06/21(水) 17:42:27 ID:M4HvZ58E
> --もう一つ。AMDはK7とK8でL1とL2にVictim Cacheの構成を取ったわけですが、
> 新コアもまたL1とL2はVictim Cacheの構成でしょうか? それとL3はどうなりますか?

> いい質問だが、ここのところは覚えていない。Chuck Moore(AMD Senior Fellow)に確認してから返事をするよ。

さすがに、不完全排他とは即答し辛らかったんだろうな。
覚えていないなんて、そんなのありえねぇ。
155Socket774:2006/06/21(水) 18:02:14 ID:HtvZEJNP
>>136
>大辞林 第二版 (三省堂)
>そうさ 【走査】<
>(名)スル
>テレビジョンやファクシミリなどで、送信の際に、画像を多くの点に分解し、それぞれの点の明暗などを電気信号に変換するために、
>一定の順序で各点をたどること。また、受信の際に、電気信号を点の集合に変換して画像を構成する操作。スキャン。
「一定の順序で各点をたどること」だそうだが?
一般人程度の知識と知性があれば、まず最初に頭に浮かぶのは語源通りの動作だな。
専門知識を持ったエンジニアなら尚更そうだ。

取り敢えず、前言を撤回しておく。
やっぱ、回路図書かなくていいよ。見るまでもないから。

>>154
重要なポイントが隠されてるから即答しなかったんじゃないのか?
インタビューの内容はintelの耳にも入る可能性があるんだから。
156Socket774:2006/06/21(水) 18:29:08 ID:M4HvZ58E
> 「一定の順序で各点をたどること」だそうだが?
Set Associativeだから、タグアレイを順次検索するからスキャンで正しい。
157Socket774:2006/06/21(水) 18:32:09 ID:BzEnv4ew
>>146
>動作が完了するまで待たないってだけだ。

え? 何が何を待たないって?

ちゃんと筋道を立てて書いてくれ。

’待たないこと’と’同時’は別の意味です。
物理層より前に、ちゃんと言葉も勉強しましょう。
158Socket774:2006/06/21(水) 18:34:14 ID:5cfukPNo
>>157
幼稚園にお帰り。
159Socket774:2006/06/21(水) 18:43:26 ID:BzEnv4ew
>>158
もうちょっと、あたまつかえよ
160Socket774:2006/06/21(水) 18:45:50 ID:5cfukPNo
幼児に頭を使ったら通じないよ。
161Socket774:2006/06/21(水) 18:47:21 ID:BzEnv4ew
日本語でおk
162Socket774:2006/06/21(水) 18:57:39 ID:5cfukPNo
日本語をちゃんと使えてない人に言われてもな。
163Socket774:2006/06/21(水) 19:19:51 ID:2hlWQTe4
熱いなぁと思って見てたら痛いだけの人だったのね
頭の悪い俺にはよくわからん話だからどうでもいいが
勝ち犬様って現実世界では確実にうざい人扱いさられてるんだろうなぁ
164Socket774:2006/06/21(水) 20:53:16 ID:EEFErgZ/
AMDの中の人がメモリとL3には同時にアクセスするって言ってるのにイチャモン付けるのは何でなんだ?
ちなみに、このことはCTOのPhil HesterだけでなくSenior FellowのCharles Mooreも言ってる。
165Socket774:2006/06/21(水) 21:19:28 ID:dnp8WgFi
だから、それは L3 とメモリのアクセスパスが独立していて、
同時にアクセスが「できる」という意味では?

ID:qfDm/Dlb が主張しているような、L3 アクセスの際、常に
メモリにもアクセスを試みるっていうのは、それとは全然違うし、
そもそも実現不能でしょう。
この実現不能ってのが分からないのは、発言を全然違う意味に
解釈することになるので、ちょっとヤバいと思う。
166Socket774:2006/06/21(水) 21:21:48 ID:D6eMOV4f
ID:dnp8WgFi = アホ でFA?
167Socket774:2006/06/21(水) 21:28:53 ID:EEFErgZ/
> 我々のマイクロプロセサは主記憶のコントローラ回路を内蔵するので,3次キャッシュ
> にヒットしなかったときのペナルティが少ない。2次キャッシュがヒットしなかった際に,
> 3次キャッシュと主記憶を同時にアクセスして,3次キャッシュがヒットした際に主記憶
> へのアクセスを中止すればいいからだ。
by Charles Moore

だいたい今のK8でもL2とメモリは同時にアクセスしにいけるでしょ。
168Socket774:2006/06/21(水) 21:30:18 ID:4RKt/cgG
同時にアクセスする

ID:dnp8WgFiの頭の中
Start========>L3読み込み完了
Start========>メモリ読み込み完了

一般の人の理解
Start========>L3======>読み込み完了
Start========>メモリ===============================================================================>読み込み完了
169ID:dnp8WgFi:2006/06/21(水) 21:35:15 ID:/X8BiUNN
>>167
だから、それは L3 とメモリのアクセスパスが独立していて、
同時にアクセスが「できる」という意味では?

Charles Moored氏が主張しているような、L3 アクセスの際、常に
メモリにもアクセスを試みるっていうのは、それとは全然違うし、
そもそも実現不能でしょう。
この実現不能ってのが分からないのは、発言を全然違う意味に
解釈することになるので、ちょっとヤバいと思う。
170Socket774:2006/06/21(水) 21:36:16 ID:/l/iz6s9
抽出して読んでみた。
ID:dnp8WgFi = アホ でFA
171Socket774:2006/06/21(水) 21:41:26 ID:dnp8WgFi
これか。
ttp://itpro.nikkeibp.co.jp/article/COLUMN/20060518/238286/

これって少なくとも DDR2 世代では >>140 に書いた理由から、
不可能だと思うけどな。
まあメモリコントローラから D-RAM にコマンドを発行するよりも
前に、中断が間に合えば可能だけど。そういう意味なのかな?

>>168
ここでは、メモリバスが L3 よりもバンド幅が狭いために無理だと
いう話をしているので (>>140 参照)、その図では反論になってない。
というか、レイテンシの図では反論にならないってことが分からない
のはヤバい。

ID で分かると思うけど、>>169 は俺じゃないよ。
172Socket774:2006/06/21(水) 21:42:12 ID:WpiHCcl7
173Socket774:2006/06/21(水) 21:44:53 ID:7K3gWXE4
Charles Moored氏とdnp8WgFiのどちらが正しいの?
Charles Moored氏は嘘吐きですか?
174Socket774:2006/06/21(水) 21:50:42 ID:dnp8WgFi
>>173
>>171 に書いたように、メモリコントローラが、メモリバスに
コマンドを出す前に中断ができるなら、Charles Moore氏の
言葉どおりのことが、DDR2 でも実現できるとは思うよ。

>>147 や、>>168 では、バスが飽和するという指摘に対して
まったく反論になってない、つまり、この発言者はハードウェアを
理解してないことは、既に述べたとおり。
175Socket774:2006/06/21(水) 21:53:24 ID:mr3rexTl
> L3 アクセスのリクエストと同じ頻度で D-RAM にアクセスしようとすると、
> アクセス要求だけで、メモリバスが飽和するのでは?

dnp8WgFiがアホなのは、L3 アクセスのリクエストと同じ頻度でD-RAMにアクセス要求が発令されると思っているところ。
アホ決定ですよ。
176Socket774:2006/06/21(水) 21:59:40 ID:dnp8WgFi
> L3 アクセスのリクエストと同じ頻度でD-RAMにアクセス要求が発令されると思っ
> ているところ。

いや、それは ID:qfDm/Dlb の主張で、俺の主張は「そんなことは実現不能だ」
ってことなんだけど。
読めば分かると思うけどねえ。
177Socket774:2006/06/21(水) 22:03:09 ID:EEFErgZ/
飽和って言ってもL3が無かった今まではL3へのアクセスと同じ頻度でメモコンへの要求があったわけだしなあ。
4コアになってそれなりに強化はされてるんだろうが。
178Socket774:2006/06/21(水) 22:05:02 ID:qDYV3+WQ
qfDm/Dlbは要求が連続する場合>>147に書いてるように、D-RAMへは実際にアクセス要求は発令されないと理解しているようだけど
179Socket774:2006/06/21(水) 22:08:16 ID:dnp8WgFi
>>177
メモリコントローラを通してメモリバスに要求を出す場合、
当然、その要求の回数はメモリバスのバンド幅に制限される。

ID:qfDm/Dlb の主張は、L3 と D-RAM に同じ回数の要求を
発行できるということを意味していて、L3 とメモリバスの
バンド幅に違いがある以上、そんなことは当然不可能なわけ。
180Socket774:2006/06/21(水) 22:15:04 ID:du/OlobK
>>179
おいおい、いい加減なこと言うなよ。
俺はそんなこと一言も言ってないぜ。
なんか、スレが伸びてると思って来てみたら無茶苦茶言いやがって、このボケ。

お前が勝手に、ロード要求とメモコン受付とメモコンからD-RAMへのロード指令が直結していると解釈しているだけだろうが。
そんな単純構造でしか物事を理解できないような知能しか持っていないから俺の発言を誤読してるんじゃねぇのか。

俺、qfDm/Dlbな。
181Socket774:2006/06/21(水) 22:15:25 ID:2Di02Euk
Hammerの資料だが
ttp://www.amd.com/us-en/assets/content_type/DownloadableAssets/MPF_Hammer_Presentation.PDF
18,19ページを参照しる

>151
>L3へのアクセス要求とメモリーへのロード要求が同時並行に発せられていることがまだ理解できませんか?
>そしてL3がヒットすれば、ロード待ちバッファを破棄すれば良いだけ。

ここまではいいが

>既にメモコンへ指令済みで読み出し状態であっても構わない。

ここが問題ってことかな?
182Socket774:2006/06/21(水) 22:16:06 ID:dnp8WgFi
>>178
あ、そうか。>>147 はそういう意味だったのか。読み間違えてた。
すまん。>>150 は取り消す。>>147 はまともな発言だ。

ただし、>>148 の後半で書いたこと、すなわち ID:qfDm/Dlb が、
>>100 から >>148 までの間で、意見を正反対に変えたという
事実は残るが。
183Socket774:2006/06/21(水) 22:23:17 ID:du/OlobK
>>182
何を言ってるのかチンプンカンプン。
俺に言いたいことがあるのなら、整理して要旨をまとめてから問うようにしろ。
184Socket774:2006/06/21(水) 23:04:59 ID:BzEnv4ew
>>146
>この場合の同時は、当然のことだけど動作が完了するまで待たないってだけだ。

この場合の’同時’は、L3アクセスのフェイズとメモリアクセスのフェイズが重なっているという
意味で、同期しているという意味では無いと言うべき。

説明が下手じゃね?
185Socket774:2006/06/21(水) 23:05:19 ID:yo6PpSAw
で結局さ、キャッシュ制御はMOESIかMESIなのかどっちなんだ?
長文が多すぎて一々見るのはめんどい
186Socket774:2006/06/21(水) 23:13:52 ID:EEFErgZ/
俺もそういう話は聞きたいな。
ちなみにPOWER4の2次キャッシュはMESIを拡張した7状態で管理してるらしい。

K8Lの場合、同一ソケット内での共有とか他ソケット間での共有とかの区別がありそうな気がする。
187Socket774:2006/06/21(水) 23:20:29 ID:du/OlobK
>>186
> K8Lの場合、同一ソケット内での共有とか他ソケット間での共有とかの区別がありそうな気がする。
全くないというか、区別する必要がない。
これは、なんちゃってL3共有キャッシュの恩恵とでも言えるのかもしれないけどな。
L3共有キャッシュに付いてはコヒーレンシ制御は全くされていないというかできない。
188Socket774:2006/06/21(水) 23:38:17 ID:du/OlobK
>>185
それどうでもいい話だな。
公開されていれば、それなりに楽しめるだろうがキャッシュ構造の違いから多少のアレンジはあるのが普通だ。

コヒーレンシ制御で言えば、K8Lは何の面白みもない。
Woodcrest等は、L1のコヒーレンシ制御とL2共有キャッシュのコヒーレンシ制御が異なるからそれなりにアレンジしてみると楽しめるだろう。
この場合、L2共有キャッシュのコヒーレンシは他ソケットのL2共有キャッシュ間とで行うのが効率が良いことになる。
つまり、1ソケットだけならL2のコヒーレンシ制御は不要となり常にExclusiveの状態でのキャッシュ保持となる。
189Socket774:2006/06/21(水) 23:41:34 ID:EEFErgZ/
ここで言う共有はMESIでのSharedであって共有キャッシュのことじゃない。
同一ソケットの他コアとだけデータを共有してることが分かればわざわざ他ソケットにInvalid要求を出す必要が無いし。
190Socket774:2006/06/21(水) 23:43:38 ID:du/OlobK
>>189
それを判別するのに都合がいいのが>>188だよ。
191Socket774:2006/06/22(木) 01:12:24 ID:lbDupxAJ
WriteThroughなら分かるけどWriteBackなら他ソケットのL2間でsnoopしても意味ないんじゃ。
L1にDirtyCacheがあるかもしれん。
結局、読み込むときは他ソケットのL1まで照会することにならんか?

っていうかL1はWriteThroughなのかな。
192Socket774:2006/06/22(木) 01:27:59 ID:mC/WJkCQ
一日中スレに張り付いて現実と妄想を区別できず事実事実とブツブツ言ってる引きこもりニートがいるのはここですか?
193Socket774:2006/06/22(木) 01:42:21 ID:w8wOZqY2
で、実際どっちなのよ。
口の汚さや引きこもりニートとかどうでもいいから、真実を知りたい。
そもそも詳細が一般レベルに伝わっているのか、L3キャッシュ機構について。
194Socket774:2006/06/22(木) 08:56:30 ID:vo5salCs
>>185
AMDの資料によればL1-DataCacheはMOESIプロトコルサポートとなってる。
(資料のアドレスは自宅のPCにあるから、夜帰宅後に示す。)

実際の制御の詳細は記載されてないが、個人的にはModified,Owned,Invalidの各bitと
SharedとExclusiveを示す3bitのカウンタによる制御と考えてる。(0がExclusive,1〜7がShared)

これだと、他コアからのロード要求で該当アドレスのデータがあった場合、Sharedカウンタをインクリメントして
データを返し、受信側はSharedカウンタと有効応答数をチェックして簡単なエラーチェックが出来る。

L1/L2から共有データが破棄(またはWriteBack)される場合は、破棄要求を他コアに送信し、受信側は該当アドレスの
Sharedカウンタをデクリメントする。

これだと、単純なカウンタ制御だけでExclusiveとSharedの状態遷移がスムーズに制御できるし、他コアの共有状況も
ある程度だが把握できる。
現行K8がDualCoreでも論理8コアまでしかサポートしないのも、このカウンタが3bitまでしかないと考えれば納得できる。
195Socket774:2006/06/22(木) 10:21:18 ID:lbDupxAJ
8コアまでなのはHTのNode管理が3bitだからじゃないの?
196Socket774:2006/06/22(木) 13:20:55 ID:vo5salCs
>>195
>>84のリンクを読んで見た感じだとHyperTransportそのものの制限ではないはずだ。
ttp://journal.mycom.co.jp/articles/2006/06/20/computex01/002.html

>--別の聞き方をします。HyperTransport V1ではNodeを3bitのカウンタで管理していました。なので、8Nodeが最大でした。HyperTransport V3ではどうでしょう?
>そのカウンタは増やす。現在は8だが、将来のアドレス拡張などに備えて拡張する。
>--どこまで増やすのでしょう?
>それはインプリメントに依存する。HyperTransportではそこまで規定していない。

この「インプリメントに依存する。」と言う部分がヒントになって思いついたんだけどな。
HyperTransportのノード管理だけなら3bitなんて大したサイズじゃないし、将来性を考えて
最初から8bitとかもっとキリのいい所に規定しておいても良かったはずだ。
だが、キャッシュ周りのインプリメントに影響するとなると1bit増やすだけで×ライン数分
サイズが増えるからそういう訳にはいかないからな。
197Socket774:2006/06/22(木) 16:00:24 ID:MWkUqgDR
また、変なのが湧いてきたなw

とりあえず

ID:vo5salCs=アホ?
198Socket774:2006/06/22(木) 16:36:28 ID:LGga7Rqh
内容に対するツッコミ無しで、アホだの日本語で、だの、何も考えて無い様な
レスは止めろよな。見苦しい。
199Socket774:2006/06/22(木) 17:07:58 ID:vAgvrQM0
>>197はオタに知識で対抗できない連中みたいだなw
200Socket774:2006/06/22(木) 17:16:22 ID:oB615eVa
ここにいるのはCPUのアーキテクチャオタ?
201Socket774:2006/06/22(木) 22:50:55 ID:KE9aKoz3
>>196
特定ビットが予約されているみないなことはよくあるし、
ARMのThumb命令みたいな形でコマンドを定義すれば、
バス幅を変える必要もあまりないんじゃない?

それはそうと、非対称性複合コア+モジュール化なんて、ますますどっかのCELLみたい
202vo5salCs:2006/06/22(木) 23:19:23 ID:s6fV3plF
>>185
これのP.255に記載がある。
ttp://www.amd.com/us-en/assets/content_type/white_papers_and_tech_docs/25112.PDF

>>201
なるほど、それも考えられるか・・・

一応、カウンタ方式だと一つメリットが考えられる。
ExclusiveとSharedの2状態だけで管理する場合、破棄要求を受け取ったコアは対象アドレスのデータを
SharedからExclusiveにするか、Sharedのまま残すかを判定しなきゃならなくなるが、そのためには自コア以外に
同じデータを共有しているコアがあるかどうか問い合わせなければならない。
カウンタ方式なら、常に自コア以外のコアがいくつ同じデータを共有しているかわかるから、問い合わせの必要は
なくなる。(単にカウンタをデクリメントして0になったらそれがExclusiveであることを意味する。)

少々、トランジスタを消費する方法だが、HyperTransportを通過するパケット数を減らすには有効だと思う。
203197:2006/06/23(金) 02:55:53 ID:/KTZ60H2
素人が多いな。

>>202
カウンタ方式はお勧めしない。
ムダが多いだけで、効率が悪いからだ。
そもそも、共有状態にあるデータは非常に少ないという前提を失念している。
ほんの僅かばかりの共有データの為に、カウンタの導入はムダだ。
204Socket774:2006/06/23(金) 07:52:14 ID:xhErRs3W
でAMDに隠し球はあるのかね?
性能よりも省電力方向でいって欲しいな
205Socket774:2006/06/23(金) 08:13:32 ID:duW1EuaY
省電力技術はAMDよりIntelのほうが進んでるからなぁ。
206Socket774:2006/06/23(金) 08:34:10 ID:bmDmHEvp
AMDは今までデスクトップはよかったがモバイルが全然ダメだったからツケが回ってきたな
207vo5salCs:2006/06/23(金) 08:55:45 ID:Qnd8ov9O
>>203
そうか?
MOESIプロトコルだとModified,Owned,Exclusive,Shared,Invalidの5状態を管理するのに
最低でも3bit必要だが、カウンタ方式ならExclusiveとSharedの管理に3bit、残り3状態に
2bitだからせいぜい2bitしか違わん。

状態遷移にしても、5状態の組合せになる状態遷移回路を制御するより、3状態の組合せ+
単純カウンタの方がはるかに簡単だと思うが?

2Way程度なら大した効果はなかろうが、K8Lがターゲットとする32Wayや64Wayではパケット量
削減は深刻な問題だと思うがな。
208Socket774:2006/06/23(金) 09:39:39 ID:g30Zo4Wx
> 2bitだからせいぜい2bitしか違わん。
もう、滅茶苦茶な話をされても困るよ。
お前は、カウンターだけしか持たぬつもりか?
それたど、状態を適切に把握することは不可能だ。
それに、これからマルチコア化が進み、4ソケットでも最低4x4=16コア以上になると言うのに自身を除いた共有フラグがたった7bit?
無駄だ、無駄だ。
209Socket774:2006/06/23(金) 09:43:38 ID:lio9BS06
もう生体CPUでいいや
処理能力ならPen4 2.8CGX4級程度余裕で出せるし
210Socket774:2006/06/23(金) 10:15:25 ID:gibFrwTZ
>>207
良いと思ったらここに書かんで、特許申請しておけばいいのに。
211Socket774:2006/06/23(金) 10:35:15 ID:Keev8dnb
210 名前: Socket774 [sage] 投稿日: 2006/06/23(金) 10:15:25 ID:gibFrwTZ
>>207
良いと思ったらここに書かんで、特許申請しておけばいいのに。
212Socket774:2006/06/23(金) 11:12:58 ID:gibFrwTZ
何気に気に障ることを書いたカナ? カナ?
213Socket774:2006/06/23(金) 12:00:04 ID:QsZAaOto
インタビュー中のカウンタって参照カウンタのこと?
IDだとかナンバリングだとかそっちの意味で捉えてた。
214vo5salCs:2006/06/23(金) 12:59:31 ID:Qnd8ov9O
>>208
だからK8Lではbit数を増やすんだろ?
必要なトランジスタ数が増えることがデメリットではあるが、技術的にはなんら困難はないごく簡単な拡張だ。
コヒーレンシ制御のパケットがHyperTransportにかける負荷の問題はK8設計当初から問題点とされてきた部分だからな。
K8Lで更にその負荷を軽減するために、よりトランジスタを必要とする共有L3を追加する位だから、この程度の基本的な
パケット削減手段は最初から実装されていてもおかしくない。
カウンタのインクリメント・デクリメントなんて、論理回路の初級の問題集で真っ先に扱う程度の簡単な回路だし、
動作も1クロックで完了する高速なものだから、速度面でも複雑な状態遷移回路より有利だ。

130nmの初代K8ではダイサイズへの影響が深刻だったから、必要最小限に留めたんだろうが、65nm化とL2減量となる
K8Lなら一気に8bit位まで拡張しても、ダイ上で必要な面積はむしろ減る。

パケット削減のメリットと同時にトランジスタ増量のデメリットがある事位は、こちらでも最初から認識してるんだが、
それ以外に何かデメリットがあれば「具体的」に解説してくれ。

>ほんの僅かばかりの共有データの為に、カウンタの導入はムダだ。
それこそ、共有L2の方が無駄だな。
共有化と引き換えにレイテンシの増加というデメリットとのトレードオフだぞ?
僅かばかりの共有データの為に、大量の非共有データや命令のロードレイテンシを増加させる方がよっぽど無駄。


>>210
いや、俺がボーっと資料眺めながらでも思いつく程度のことだから、もう考えた奴はいるだろ。
215Socket774:2006/06/23(金) 13:02:18 ID:g30Zo4Wx
>>214
お前、これをわざと避けてるだろw

> お前は、カウンターだけしか持たぬつもりか?
> それたど、状態を適切に把握することは不可能だ。
216Socket774:2006/06/23(金) 13:10:04 ID:g30Zo4Wx
> それこそ、共有L2の方が無駄だな。
> 共有化と引き換えにレイテンシの増加というデメリットとのトレードオフだぞ?
> 僅かばかりの共有データの為に、大量の非共有データや命令のロードレイテンシを増加させる方がよっぽど無駄。

お前、何にも判っちゃいねぇな、というか無理やり反論か?
共有キャッシュの効能は、お前が思っているよりずっと強力だ、もちろんConroeのL2キャッシュの話だがな。
共有L2を有することで、新規ロード時に他コアへ照会パケットを送らなくて済む。
さらに、1スレッド時はL2の全てが使える。
マルチスレッド時の照会はL1だけで済む。
このような利点と、本来欠点であるはずのレイテンシの増加はIntelの技術力で抑え込んである凄まじい程に高性能なキャッシュなんだよ。
217vo5salCs:2006/06/23(金) 13:16:19 ID:Qnd8ov9O
>>215
・・・ああ!つまり
>それたど
も突っ込みどころだったのか、気が付かんかった。
とりあえず日本語を習ってから来い。と言っておこう。

>16コア以上になると言うのに自身を除いた共有フラグがたった7bit?
・・・現行K8を想定した上で「3bit」と書いてるはずだが?
どこから「7bit」なんて出てきたんだ?
ま、64コアでも6bitで足りるがな。
2進数もついでだから習って来い。
218Socket774:2006/06/23(金) 13:18:46 ID:WGzhlP1u
横レスで申し訳ないが

>>216
CPUアーキティチャ素人の素朴な疑問なんだけどさ、

>1スレッド時はL2の全てが使える

このあたりは誰が制御するんだろう。CPU内?OS?
219Socket774:2006/06/23(金) 13:20:47 ID:g30Zo4Wx
>>217
へへ、つまりお前は、状態の保持などなしで単にSharedカウンタだけで良いと言っているんだな?
まず、ここをはっきりとしろ。

無能者相手にするのはちっとばかり疲れるから嫌だなぁ。
220Socket774:2006/06/23(金) 13:21:36 ID:g30Zo4Wx
>>218
CPUだよ。
OSの領域ではない。
221Socket774:2006/06/23(金) 13:26:16 ID:WGzhlP1u
>>220
ほう。
そうすると走ってるスレッドの内容によって動的にL2確保するわけ?
222Socket774:2006/06/23(金) 13:27:38 ID:g30Zo4Wx
>>221
基本的にそうなる。
223vo5salCs:2006/06/23(金) 13:28:16 ID:Qnd8ov9O
>>219
最初に書いた通り、MOESIプロトコルの状態制御のみに限定した場合は
Modified,Owned,Invalidの3状態+Exclusive,Sharedの管理カウンタだが?
それ以外の状態保持はMOESIプロトコルには直接関係しないだろうということで無視した上での話だ。

そもそも、アドレス管理からしてK8→K8Lでは40bitから48bitへ拡張されるらしいからな。

で、デメリットの解説はまだか?
224Socket774:2006/06/23(金) 13:29:19 ID:g30Zo4Wx
>>223
それだと>>207の2bitの計算と合わないから、やり直せ。
225Socket774:2006/06/23(金) 13:30:15 ID:WGzhlP1u
>>222
ありがと。
素人考えだけど、そのあたりの確保する予測がハズレた場合とか
同時に走ったスレッドの内容によっては、排他より効率悪くなる場合ない?
それでも十分なL2速度確保してるから実害はないのかもしれないけど。
226Socket774:2006/06/23(金) 13:41:23 ID:g30Zo4Wx
>>225
キャッシュラインによっては、複数のコアで競合(取り合い)するケースが出てくる。
過度な競合はキャッシュ性能を低下させる原因にもなる。
Conroeは、キャッシュラインを過度に取り合わぬようにする機構が組み込まれている。
キャッシュライン毎で一定時間毎に各コアの使用数をカウントし、当初は8Wayずつに分けられていた境界を各コアの実情に応じて0→16Wayまで変化させている。
この機能によって、一定時間内は境界を変更しないことで、過度の競合を押さえているわけだ。
よく考えられた仕組みとなっている。
227Socket774:2006/06/23(金) 13:48:42 ID:WGzhlP1u
>>226
ほうほう。面白いね。ちょっと勉強してくるわ
228vo5salCs:2006/06/23(金) 13:49:12 ID:Qnd8ov9O
おっと、各状態が同時にONになり得る事を想定に入れるのを忘れてたな。
Modified,Owned,Invalidに各1bitで3bit、SharedとExclusiveは同時にONにならないので1bitのON/OFFで
表現すればいいから4bitだな。
カウンタ方式では最初の3bitは同じで、カウンタが0〜7で3bit、合計6bitだな。(現行K8前提での話)

・・・やっぱり2bitしか違わん訳だが?
どういう計算なら2bitがNGになるのか、解説よろしく。
あと、デメリットの解説もな。

これから仕事なんで、次に見る時までに頼むぜ、「本物」さん。w
229Socket774:2006/06/23(金) 13:52:25 ID:g30Zo4Wx
>>228
> カウンタが0〜7で3bit
ここが間違っているところだ。
このカウンターは各コアとのShared状態を保存するのだから、7コアなら7bit必要。
ちゃんと勉強してから投稿しろ。
230Socket774:2006/06/23(金) 14:06:27 ID:gibFrwTZ
>>218
>>1スレッド時はL2の全てが使える

>このあたりは誰が制御するんだろう。CPU内?OS?

頻繁にキャッシュが書き換えられる結果、占有スレッドに関するキャッシュの割合が増えるってことでしょ。
むりやり増やすわけじゃないと思われ。
231Socket774:2006/06/23(金) 15:47:24 ID:b3IsL3NC
いつもの二人か。
232Socket774:2006/06/23(金) 15:49:08 ID:g30Zo4Wx
そうして、いつもの結果w
やめときゃいいのに
233vo5salCs:2006/06/23(金) 17:55:15 ID:Qnd8ov9O
・・・ああ、なるほどね。 自分以外のコアに各bitを対応させてるから7bitなのか。

そんなにいらんよ・・・自分以外のコアがいくつ同じデータを参照しているかだけ保持すれば充分だ。
破棄要求を出すときに、キャッシュラインのアドレスとカウンタの値を一緒に格納するだけでいい。
(1)破棄要求パケットを最寄のどれか1コアに転送。
(2)要求を受信したコアは該当アドレスがあれば、Sharedカウンタをデクリメントすると同時に
受信パケットに格納されたカウンタもデクリメントする。(なければそのまま。)
(3)受信パケットを更に別コアに転送。
(4)以下、(2)・(3)を繰り返し、パケット内のカウンタが0になった時点で転送中止。
これなら、1つの破棄要求パケットを各コアの間で順次転送するだけで済むし、途中でカウンタが0になったら
それ以上の転送も必要ない。
WriteBackの時はWriteBackされるデータもパケットに載せて転送すれば最新のデータも同時に反映できる。
ついでにOwnedフラグも一緒に転送して、カウンタを0にしたコアの共有データが新たなOwnedになるようにすれば、
Ownedの譲渡も完結する。
わかりやすく言えば回覧板みたいなやり方だな。

欠点があるとすれば、順次転送することで処理開始から処理完了まで時間がかかることだが・・・
L1/L2から破棄またはWriteBackされる共有データは参照履歴が一番古いから破棄・WriteBackされる訳だから
多少時間がかかっても問題は極めて少ない。(たまたま同時アクセスがあった場合にちょっと待たせる程度。)

ま、処理時間を優先する場合は破棄・WriteBackパケットを全コアに無条件に送信するという方法もあるが、
この場合はSharedカウンタの値は必要ない代わりにパケット数は増えるがな。

いずれにせよ、数だけ把握してれば用は足りるな。
234Socket774:2006/06/23(金) 18:00:10 ID:g30Zo4Wx
>>233
お前、マジでアホだろ?w
235Socket774:2006/06/23(金) 21:11:44 ID:tnN/CDaU
壊れた録音テープ
236Socket774:2006/06/23(金) 23:51:04 ID:rjb3CVj/
これだけ長く読みづらい書き込みがつづいているが、役に立つ話はゼロ。
やたら用語をつかいまくって難しい話をしているようだが、中学生レベルの間違いばかりで中身もゼロ。
それがこのスレのクオリティ。
237Socket774:2006/06/24(土) 00:06:20 ID:F99PGv+1
いや、煽りや罵倒がいけないんだ。
本来はまともなレベルの人も何人かにたはず。
でも埋もれてしまう。
238Socket774:2006/06/24(土) 00:08:35 ID:MhMXk8qo
このスレをこんなにしたのは全て淫厨です(藁
239MACオタ:2006/06/24(土) 00:43:24 ID:E43Y3/ZJ
またぞろReverse HTの腐れルーマーが浮上してきたすけど、引っかかってるヒトが
皆無でがっかりしたす(笑)
240Socket774:2006/06/24(土) 01:21:04 ID:YztLihOw
AMD Socket AM2 has a secret weapon
http://www.theinquirer.net/?article=32589

Reverse HT(HyperThreading)について。
いわゆる動的マルチスレッド技術で、AM2ソケットのAthlon X2で隠し機能として実装されている。
ソフトウエア側からDual CoreをSingle Coreに見立てる
(=Single Threadを動的にマルチスレッド化しながら実行するともいう)
ことによって、6命令/cycleの高IPCを実現。
241Socket774:2006/06/24(土) 01:22:53 ID:YztLihOw
AMD to Boost Single-Threading Performance on Multi-Core Chips, Say Sources.
http://www.xbitlabs.com/news/cpu/display/20060622143710.html

xbitは更に詳しい。
242Socket774:2006/06/24(土) 01:27:37 ID:YztLihOw
To activate it customers will “only need to update the processor driver and the mainboard BIOS,”
they say. Microsoft Corp. will reportedly even release a corresponding patch for the operating systems
that will allow recognizing two cores of the Athlon 64 X2 as a single one.

Reverse HTことCombined Modeを有効にするには、新しいプロセッサドライバ、新しいBIOSが必要。
MSはDual Coreを単一プロセッサとして認識させるためOSのパッチを用意。
243MACオタ>241 さん:2006/06/24(土) 01:33:05 ID:E43Y3/ZJ
>>241
Reverse HTわハードウェア的な実装としてわ腐れルーマーの領域すけど、引用している
xbotlabsの記事にあるように
  ------------------------
  Microsoft Corp. will reportedly even release a corresponding patch for the
  operating systems that will allow recognizing two cores of the Athlon 64 X2
  as a single one.
  ------------------------
(最近もEfficeon の販売を引き受けたりと)長年の尻舐めの甲斐あって、Microsoft から
OS的デュアルコアサポートを勝ち得た可能性わ、あるかと思われるす。
244Socket774:2006/06/24(土) 02:03:56 ID:YztLihOw
xbit読み直したら全然違ってた。

Combined Modeでは、2コア分のリソース、例えば2セット分のデコーダを1コアのためだけに使える(=6 inst./cycle)
とかそういう話で、動的マルチスレッド技術の類ではないようだ。

Combined Modeと通常のモードは動的に切り替え可能。なかなかおもしろい。
245Socket774:2006/06/24(土) 03:39:12 ID:3cH2uEoJ
Reverse HTでどの程度シングルスレッド性能がアップするんだろう。
246Socket774:2006/06/24(土) 03:46:44 ID:BN++dnam
Intelが独自路線で好き勝手やってるからMSとしてはAMDを押すに決まってるだろう。
MSを慈善団体かなんかだと勘違いしてるのか。
247Socket774:2006/06/24(土) 07:12:11 ID:hEof9TqD
>>244
> 例えば2セット分のデコーダを1コアのためだけに使える(=6 inst./cycle)
これも殆ど嘘みたいなもので、たんなるプラシーボ効果を狙った詭弁だろうな。
実際は、Combined Modeで片方のコアの電源をOFFにすることと、クロックUP(倍率を増やす x9をx10)だけだろうな。
元々デュアルコアはシングルコアと比較して17%程度低いクロックで動作させている。
片側のコアの電源を切り完全停止さすことで原理上17%程度のクロックアップが可能になるってだけの話だ。
MSにしても、片方のコアを停止する程度のことなら、既にマルチソケットでの障害回避機能でCPU切り離し(CPU割り当て変更後に切り離す)等は
実装済みだから簡単なパッチを用意するだけで対応は可能だ。

それにしても、ネタが明かされると陳腐な話で笑う程度のことでしかない。
まぁ、それでもシングルコア動作になるとはいえ17%程度のクロックアップ効果はAMDに取れば非常に有用だろう。
Conroeに絶対的な差を付けられていたことを思えば、17%アップは紛い物であったとしても見かけ上はAMDのCPUを陳腐化から救うことになる。
248Socket774:2006/06/24(土) 10:57:11 ID:M/t6etuj
xbitの推測をもって「ネタが開かされた」とか書いてる痛い人がいます
249Socket774:2006/06/24(土) 11:06:06 ID:MhMXk8qo
何の根拠もないのに〜だろうな。とか言っちゃってる痛い厨がいます
250Socket774:2006/06/24(土) 11:14:48 ID:PMZVLAvY
>>247
んじゃ今まであるデュアルソケットなマシンで
>既にマルチソケットでの障害回避機能でCPU切り離し(CPU割り当て変更後に切り離す)等は
>実装済みだから簡単なパッチを用意するだけで対応は可能だ。
やってみ?簡単なんだろ?wwwww
WindowsでもLinuxでもSolarisでもでもいいから。んでその簡単なパッチうpってみ?
251Socket774:2006/06/24(土) 11:25:21 ID:FsLQAERc
http://pc7.2ch.net/test/read.cgi/jisaku/1150872014/721
721 :Socket774:2006/06/23(金) 22:54:32 ID:0WhA3Ykz
情報が正しいならば、Anti-HTには失望したとしか言えない
ttp://www.intel.co.jp/jp/developer/technology/magazine/research/EPI-throttling-1005.htm
超ガイシュツでした
252Socket774:2006/06/24(土) 11:29:15 ID:hEof9TqD
>>248-250
お前等、何でそんなに必死なんだよw
根拠というか、デュアルコアを仮想的に1コアにする程度でクロックあたりの性能が飛躍的に伸びるようなことは考え難い。
そんなに簡単に性能が上がるなら誰も苦労はしないし、既にずっと高性能になっている。
つまりAMD社の言うことは、とんでもなく疑わしく嘘に充ち溢れていると、ある程度の知識がある人達には思われてしまうわけだ。
まぁ、お前等は無知のようだからAMD社の広報を真に受けてプラシーボ効果とクロックアップ効果で喜んでいればいい。
253Socket774:2006/06/24(土) 11:35:40 ID:HqBwV0Mx
254Socket774:2006/06/24(土) 11:51:13 ID:ME/tvX7x
個人的には興味あるけどな、R-HTT。
まあ、今のAM2に実装されてるとかはともかくとして。


昔、HTTが出たときに、最終的には各実行ユニットを独立させ、
必要に応じてこれらを束ねて論理CPUを構成するような仕組みになる時代が来るのかな、
なんて妄想をしたことがある。

そうすれば、シングルスレッドで駆動できる平均的なユニット数を超える実行ユニットを
実装しても、使い切れない場合は別の論理CPUを構成して使うとか、そんな感じでトータルと
しての性能を向上させられるのかな、とか。

まあ、こんなのはスケジューリングとか出来ないと思うんで、無茶な妄想だとは思うけど、
なんとなく、路線が似たような気もするんで、どうなるか興味アリ。
255Socket774:2006/06/24(土) 11:55:38 ID:FsLQAERc
>昔、HTTが出たときに、最終的には各実行ユニットを独立させ、
>必要に応じてこれらを束ねて論理CPUを構成するような仕組みになる時代が来るのかな、
>なんて妄想をしたことがある。

HTTからそんな妄想ができるなんてすごい勘違…才能ですね
256Socket774:2006/06/24(土) 12:21:45 ID:hEof9TqD
>>254
INTELのHTテクノロジは、比較的軽いプロセスが複数同時実行される場面でのスループット向上が主な目的だ。
Sunのナイアガラとコンセプトは変わらんよ。
257Socket774:2006/06/24(土) 12:36:50 ID:hEof9TqD
>>253
Intelが現在研究中のものとしては、シングルスレッドプロセスを動的にマルチスレッドプロセスに自動変換し実行することでの性能向上だ。
しかし、このような基礎研究においても既に限界は見えている訳でそのプロセス自体のアーキテクチャを改変しない限り並列性を高めるのは難しい。
そこで現在では、高性能な汎用並列化モジュールに絞って研究がされている状況だ。
この汎用並列化モジュールは、コンパイラでの組込と、インタープリタ形式での実装の両面で検討されているが、まだまだ研究の段階でしかない。
汎用性を持たすと並列性の向上率は下がるのがネック(当たり前の話だが)であり、新たな発想の出現を待つと言ったようなものでしかない。
現実は非常に厳しいのよ。
258Socket774:2006/06/24(土) 13:17:20 ID:oISfNkzc
AMDの隠し玉とやらが事実上4×4とHTXバスだけなのはわかった
259Socket774:2006/06/24(土) 16:43:35 ID:bvga8Lcj
x86とかだとIPCはもう上がらないという常識があったので、K8はレイテンシ削減で平均点を上げようとした
でもBaniasはトランジスタを増やさずに、古いバイナリでVLIW並みの高IPCを出してみせた(結果、自らItaniumの首を絞めた)
抜け道はまだあったわけだ
HTTも少ないトランジスタ追加で疑似デュアルコアの効果を出す裏技だった
抜け道、裏技は出尽くしてはいなかった
今でもコアは半分の時間しか働いてないし、コア数はまだ増えていくのだから、
複数コアを使ってシングルスレッド性能を上げる裏技もあるかもしれない
1コアを2コアに見せかけるより、2コアを1コアに見せかけるほうが無理がないと思う
260Socket774:2006/06/24(土) 17:44:43 ID:icJAa6ND
by パワレポ後藤
Gesherはコア間のインターコネクトに特殊な技術を採用しており
コア間は高度に統合される・・・なんちゃらかんちゃら
261Socket774:2006/06/24(土) 18:20:39 ID:tBRxTswv
ID:hEof9TqDは間違いなく雑音だな。よくもまぁ、こう妄想をあたかも真実の
ように語れるもんだ・・・・

1個のコア止めてその分もう1個のコアクロックアップするとかもうバカかとwww
それとな、
>根拠というか、デュアルコアを仮想的に1コアにする程度でクロックあたりの性能が飛躍的に伸びるようなことは考え難い。
>そんなに簡単に性能が上がるなら誰も苦労はしないし、既にずっと高性能になっている。
こんな事言ってるようじゃ数年前の考え方だぞ。全く今のトレンドに乗れてない。
262Socket774:2006/06/24(土) 18:24:55 ID:BN++dnam
>>259
それなんてスーパースカラ?
263Socket774:2006/06/24(土) 19:37:07 ID:Uc7mYgwv
ここで言われている技術とは関係なく、
1個のコア止めてその分もう1個のコアをクロックアップというのは
ありだと思うな。この場合、熱密度が問題になりそうだが。
264Socket774:2006/06/24(土) 20:37:10 ID:oISfNkzc
投機的マルチスレッディングもFoxtonテクノロジももうおなかいっぱいです
265Socket774:2006/06/24(土) 21:20:39 ID:AYXvqaxH
アム厨はAM2に10%以上の性能向上期待していたわけだが、結果はご覧のとおり。
結果が分かるようになってから殆どのアム厨は、最初からそんなの期待してねぇよと言い出したわけで、
今回のAnti-HTについては是非ともアム厨の期待の程を率直に聞きたいというわけだ。

ちなみに、俺としては6命令デコード/サイクルになったところで性能は殆ど上がらす、精々2〜3%程度と予想する。
Anti-HTモード時は多少のクロックアップ(10%)が当時にされるとしてトータルで1.03x1.1=13.3%程度の性能向上と見る。

是非、アム厨もしくはAMD社の広報に期待している人の予想を書いてくれ。
266Socket774:2006/06/24(土) 21:24:51 ID:MhMXk8qo
>>265
お前以上のアム厨はここにはいないよ
267Socket774:2006/06/24(土) 21:30:14 ID:AYXvqaxH
当時ってなんだよ、同時の間違い。

>>266
つうことは、アム厨は全く期待してないってことだな?
それなら良いんだが、やたらに騒ぐバカがウザイので騒ぐならちゃんと予想値を出してみろってことだ。
268Socket774:2006/06/24(土) 21:33:34 ID:VDoa+ldO
ウザイかどうかは主観の相違。
俺から言わせればお前の方がウザイと思うのと同じようにだ。

ガセだろうがなんだろうがネタで遊ぶのは基本だろw
269Socket774:2006/06/24(土) 21:36:54 ID:AYXvqaxH
遊ぶなら、予想値を発表してからにしろってことだな。
騒ぐだけ騒いで、そんなの知らねぇと後で言われてもどう対処していいか困るからな。
まぁ、AM2のときの空騒ぎは爆笑ものだったけどな。
270Socket774:2006/06/24(土) 21:40:03 ID:prpf3Ugl
>>269
>遊ぶなら、予想値を発表してからにしろってことだな。

ありもしないものを妄想して、おまえの仲間になれということか。
やなこった。
271Socket774:2006/06/24(土) 21:40:33 ID:3FHqrkCQ
依存関係(ry
あふぉか>>R-HTT
272Socket774:2006/06/24(土) 21:43:09 ID:VDoa+ldO
>>269
ちょっww対処とかwwはらいたいwww
ネタだったら藁えばいいだけじゃん
そんなに自分中心で話し回してかまって欲しいならVIPにでスレ立てろw
273Socket774:2006/06/24(土) 22:02:35 ID:jUnyEEL2
Reverse-HT、技術的に面白いかどうかだな。
どうせベンチじゃスコア上がらないだろうしそっちで期待はしてない。
むしろ、アプリケーション毎に動作が切り替えられるとか言うんだったら感動。
デュアルコアへの移行に伴うパフォーマンスの低下を最小限にしてくれるだろうし。

っていうかね、IntelならともかくAMDがこんなの開発するなんてマジ信じられん。
あと一ヶ月、ずっと疑い続けるに違いない。
その先にあるのは落胆か、それとも…。
274Socket774:2006/06/24(土) 23:04:19 ID:+HTtaptE
独自性をだしてみたかったんです><
275Socket774:2006/06/25(日) 01:00:16 ID:oJ1G+oNw
まあ、AMD信者も8割方ガセだと思ってるんだろうけどけどね。

ただ、久々の面白ネタだし、盛り上がってもいいんじゃね?
276Socket774:2006/06/25(日) 03:01:48 ID:PUkI2JUJ
分岐命令の投機実行に使うのは?
確か分岐先を各コアに割り当てるような事を
何処かで読んだ記憶があるのですが
277Socket774:2006/06/25(日) 04:27:10 ID:6iHTFovc
方コア停止&クロックアップが一番現実的かなぁ。
ひた隠しにしてきたのも頷けるし。
278Socket774:2006/06/25(日) 06:17:08 ID:NAnfbbxu
分岐結果を両方とも実行するという力技ならItaniumが実装してる
で、プロセッサ名からわかるとおりコンパイラの協力が必要不可欠なんでAMDには期待できない
xbitに記事があったと思うが片肺殺してクロックアップ説の方がまだ現実的だし、理にかなっている
279Socket774:2006/06/25(日) 09:18:28 ID:VCccotti
>>275
馬鹿だなぁ、盛り上がっちゃったら焜炉の買い控えまで発生しちゃうじゃないか。(w
280Socket774:2006/06/25(日) 09:19:31 ID:VCccotti
>>278
>コンパイラの協力が必要不可欠なんでAMDには期待できない

その通り。あのIntelですら出来ないんだから。これで2回目だよ。
281Socket774:2006/06/25(日) 09:30:35 ID:Ay9E9Mu7
>>275
しかし、そのガセをAMD社の広報たる者が真顔でやるんだからAMDは怖い。
普通に信用を大きく損なう行為だ。
282Socket774:2006/06/25(日) 09:33:12 ID:VCccotti
>>281
むしろガセじゃなかったときの方が怖い。
283Socket774:2006/06/25(日) 09:49:00 ID:Ay9E9Mu7
いや、それ怖いというか普通に常識が覆るだろ。
AMDのフェローが冗談半分で「Anti-HT」の話をしてた時は、「AMDも追い詰められているんだなぁ、
無茶を言う」との感想だったけどConroeの発売日1日前にそれを実行する予定だったとは参ったね。
一応は、デコーダ周りを結合して遅延することなくスケジューラにuOPsを供給するようだから、ガセじゃないのだろうけど、
それでの性能向上など殆ど無いにも等しい、実クロックを多少は上げるようだからそのことを隠蔽してしまえるだろうけど、
まともな企業のすることじゃないよ。
あと、気になったのは、その時のフェローの発言の中にFPUユニットも2倍のような説明もされてかと思うが、
これはどうやらK8Lと混同していたようだ。
284Socket774:2006/06/25(日) 10:53:25 ID:VCccotti
>>281
>そのガセをAMD社の広報たる者が真顔でやるんだから

>>283
>ガセじゃないのだろうけど、



どっちなのかね?
285Socket774:2006/06/25(日) 11:17:33 ID:Rk/bC+i+
>>284
きっと二重人格
286Socket774:2006/06/25(日) 11:27:49 ID:3/yswxM1
>283
> まともな企業のすることじゃないよ。

インテルが、P4のパイプライン段数を増やしまくって3GHzのCPUを作ったときに
俺は、そう思った。性能は上がらずに、消費電力だけBurstしたんだから。
287Socket774:2006/06/25(日) 11:49:47 ID:dgpcG3hl
客観的に見ればイカれた会社なのはINTELでFA?
288Socket774:2006/06/25(日) 11:51:28 ID:Ay9E9Mu7
> 性能は上がらずに
P4になり、動画再生能力やエンコード性能は飛躍的に高性能化したよ。
AthlonXPでは最後まで追い付けなかったのは記憶に新しい。
289Socket774:2006/06/25(日) 11:58:06 ID:e90IaQ9l
そもそも熱湯は動画再生能力やエンコード性能向きな石だしな
そう割切れば悪くない
290Socket774:2006/06/25(日) 12:11:40 ID:Ay9E9Mu7
INTEL自身が、P4はそのようなCPUだと最初から断言してたからな。
P4に条件分岐の多いソフトを高速で動かせというほうが無理な注文だ。
ネットバーストを毛嫌いしている奴の殆どが、これ等の前提条件を理解せずに騒いでいただけなのが滑稽だったわけだか、
今はもう昔の話として片付けて良い時期かもな。
291Socket774:2006/06/25(日) 12:17:47 ID:oJ1G+oNw
その前提条件を理解できなかったのではなく、
その前提条件が世間に受け入れられなかった、ってことじゃね?

まあ、今となってはintel自身がそれを理解した、って意味では
片付けても良いとは言えるかもね。
問題は、それで野に放たれたネトバが、
今日も無駄に電力を熱に変えてる、ってコトだけだ。
292Socket774:2006/06/25(日) 12:22:03 ID:Ay9E9Mu7
一般的には受け入れられて爆発的に売れたのだが・・・
INTELがちゃんと市場を把握していた結果だ。
もちろん、プレスコットは失敗作だけな。(これもINTELは最初から認めいてる)
293Socket774:2006/06/25(日) 12:22:19 ID:aorbaUnI
なんで雑音(=ID:Ay9E9Mu7)と普通に会話してんだよ
294Socket774:2006/06/25(日) 12:23:20 ID:dgpcG3hl
P4を必死に正当化するのはなぜ?何の意味があるの?
295Socket774:2006/06/25(日) 12:24:45 ID:aorbaUnI
逆工作員だからな。
Intel儲痛いって思わせることが狙い
296Socket774:2006/06/25(日) 12:28:22 ID:Ay9E9Mu7
必死に正当化って何が?
事実を語っているだけで、P4はどんなものでも超高速に処理しますなんて電波なこと言った覚えはないぞ。
P4の発売で、PC業界は不況から脱し他の業種が軒並み落ち込むなか堅調に推移した事実を忘れてもらっては困る。
P4により、PCで動画を扱うのが一般化し、現在では多くのPCにTVチューナーが搭載され、茶の間で使う形の大画面一体型PC
までラインナップされるようになったと言っても過言とは思わんよ。
297Socket774:2006/06/25(日) 12:31:08 ID:e90IaQ9l
受け入れられなかったというか、Intelが予想したよりも
そっち系の需要が少なすぎたって感じかな。

需要が少なかった
予想以上にクロックあがらなかった
鯖には無理があった
消費電力問題

まあ当時は世間的にクロック至極主義だったから
マーケティング的に高クロック可能なアーキにしたのもあるかもしらんが。

>>293
わかっちゃいるけど日本語通じるうちはおk
298Socket774:2006/06/25(日) 12:36:55 ID:dgpcG3hl
また顔真っ赤にして正当化しとる・・・キモッ
299Socket774:2006/06/25(日) 12:39:56 ID:aZCaGmv9
Pen4のおかげで不況から脱しってどれだけ妄想が激しいんだよw

ドットコムバブルが弾けたり、半導体不況が訪れたことは無視ですかそうですか。
300Socket774:2006/06/25(日) 12:50:09 ID:4z/ju/Be
国産CPU作ろうぜ!
チョンからは金をむしり取られ、米からは肉を買わなければ金を払えと脅される
資源も乏しい日本はそろそろ限界だろ
301Socket774:2006/06/25(日) 13:34:44 ID:O3y7GrC4
こんなときだけ愛国心をみせるようになったら、もう終わりだと思うす(笑)
302Socket774:2006/06/25(日) 13:47:14 ID:nSoC561I
つ[Superエッチ]
303Socket774:2006/06/25(日) 13:47:58 ID:xqWXI5y8
>>300
お買い上げ有り難う御座います。
http://www.nec.co.jp/press/ja/0509/1301.html
304Socket774:2006/06/25(日) 17:59:49 ID:Cc1TSKFb
受け入れられた・・・つーか、他ならぬintelが選択の余地がほとんど無い状況を強引に作り上げただけだがな。
305Socket774:2006/06/25(日) 18:02:46 ID:ctaQy9x5
専用のコプロを乗っけようとしてるくらいだから、ソフトウェア対応が必要だから
ありえないとかは話が違うと思われ。
306Socket774:2006/06/25(日) 18:14:53 ID:px+6i8Kv
株価を下げまいと、必死なんだよ。
たぶん。
307Socket774:2006/06/25(日) 18:18:54 ID:7FEsPMAQ
>>305
日本語でおk
308Socket774:2006/06/26(月) 00:23:57 ID:/kf51cxn
・便所セレや北森セレでそこら中のオフィスが阿鼻叫喚だった
・ニワカユーザーが提灯ベンチで(ry
・Xeonの処理能力がPenIIIベースのと比べ(ry
・電源が(ry
309Socket774:2006/06/26(月) 03:06:18 ID:VC6pR4hf
そもそも条件分岐を嫌うチップがCPUを名乗っちゃいかんね
エンコ専用でAMDのサブソケットに入れて貰うくらい下手に出たらネトバも可愛げがあったかも
熱くて誰も使わんか・・・
310Socket774:2006/06/26(月) 03:29:22 ID:TnNDPkdr
名乗っちゃいけないとは大きく出たね。
ネトバは、5GHzとかの高クロックで回っていれば、
別に悪くないCPUになってたはず。

クロック当たりの性能が悪いのは高クロックに振ったせいだから。
現状のネトバの悪い点は「クロックの低さ」だ。
311Socket774:2006/06/26(月) 03:34:21 ID:K80ek7Tw
普通、CPUってのはコンパイラの吐き出す命令を分析して
アーキティクチャを決めるんだけど、
pentium4はそれをせず(っつーか、intelのチップはたいていそうだが)
クロックが速ければ速いだろう(想像)、将来はpentium4に最適化
されたコンパイラが出る(希望的観測)の元に開発されたってのも
あまり効率的でない原因のひとつだな
312・∀・)っ-○◎●新世紀ダンゴリオン ◆DanGorION6 :2006/06/26(月) 03:38:53 ID:k3w/QMnN
Intelはそんな打算的なことはしてない。自社製コンパイラ持ってるからwww
VC++やGCCにもきちんと技術提供してるし。

むしろPen4向けに最適化されてない古いコードが遅かったわけで
313Socket774:2006/06/26(月) 03:41:06 ID:Ckm6YNLv
キャッシュサイズでも条件分岐でもK8に劣っていたPen4
当然π焼きスコアも振るわないが
限界までOCという条件では逆転してPen4のほうが速いんだよな

回せば速いよ。うん。定格ではダメポだったけどね('A`)
314・∀・)っ-○◎● ◆toBASh.... :2006/06/26(月) 03:43:43 ID:k3w/QMnN
当のIntelが「2004年ごろには600Wに到達」なんて予測をプレゼンしてたから、
冷却さえおいつけば本当に600WのCPUを作るつもりだったんだろう。
315Socket774:2006/06/26(月) 04:16:55 ID:byec7Mxz
パイプラインバブルの大きさこそNetburstの真骨頂だろ
どうせILPは4か5で打ち止めだし
その時TLP(Netburst)の時代が来るのかEPIC(IA-64)が来るのかはわからないけど

と次世代っぽいこと書いてみる
316Socket774:2006/06/26(月) 04:57:22 ID:bKrKwimI
>>313
同感だがそれを許さなかったのは時代だよな
CPUなんざ電気食って当たり前の風潮なら
今頃5G出てただろ
インテルが時代を見誤ったのは間違いないのさ

面白いのはGPUがこの先どうなるかだよな
何故かハイエンドGPUに関しては
電気食って当たり前がまかり通っている
VIAがCPUでもGPUでもやってること一緒なのが素敵だ
317Socket774:2006/06/26(月) 10:48:38 ID:PMEKja70
それこそ >314(600W ほどの数字だったかは覚えていないが)が
言っているようなキチガイ沙汰の数字を当時本気で信じていたのなら
あまりにも抜け作だろう。

省エネ回帰とかそういう次元じゃないよ。

「クロック指標優先・性能はその次(ベンチの内容をいじれば OK)」という
マーケティングの都合を見抜けていないのは消費者として問題あり
318Socket774:2006/06/26(月) 14:27:10 ID:6X5fixfT
でも普通の人には見抜けないよね
319Socket774:2006/06/26(月) 17:21:22 ID:nZuK3M1H
>>68
キャッシュコントローラーが、な。
コアがんなもの観に行くこたぁねぇんよ。
320Socket774:2006/06/26(月) 20:56:44 ID:eodIAi6R
>>314
そう言えば、今度のCOMPUTEXで1000W級の電源がドカドカ出て吃驚したよ
321Socket774:2006/06/26(月) 21:16:32 ID:6X5fixfT
アレが今後デフォになるのだろうか…
322Socket774:2006/06/26(月) 23:37:30 ID:2sIbPdpl
インテル「Core4はAthlon64 X4の140Wに対したったの138Wで、消費電力が少なくてすむ。
1000Wなんて使うのはAMDプラットフォームだけだ」
323Socket774:2006/06/27(火) 01:09:21 ID:3YSOu56H
AMDのAM2やソケットFとは比較にならんな。

Woodcrestの反響は凄い。
> 世界中で、150 社以上のシステム・メーカーから、同製品を搭載した 200 機種以上のサーバーやワークステーションの販売を予定しています。
> また、日本国内においても、主要システム・メーカーおよびチャネル企業各社が、
> 最新のデュアルコア インテルR XeonR プロセッサー 5100 番台を搭載したサーバーとワークステーションを、順次製品化する計画です。

採用企業からのコメントも凄いことに
> ttp://www.intel.co.jp/jp/intel/pr/press2006/060626b.htm
324Socket774:2006/06/27(火) 03:03:12 ID:6JCKj2Ix
マイ糞とIBMの二枚舌わろすwww
325Socket774:2006/06/27(火) 03:42:48 ID:lGCU58Lb
Microsoft-応援→AMD-応援→nVIDIa
 ↑↓  (微妙にケンカ)  ↑↓
 Intel-応援→Linux-応援→ATI
326Socket774:2006/06/27(火) 03:43:21 ID:lGCU58Lb
× Linux-応援→ATI
327Socket774:2006/06/29(木) 23:26:23 ID:jpH0EB8k
ttp://www.itmedia.co.jp/enterprise/articles/0606/29/news068.html
このスレには仮想化機能がセキュリティ上の脅威にならないと
言っていた奴が沢山いたよなぁ。
328Socket774:2006/06/30(金) 00:23:27 ID:niV7MX5M
まったく問題ないよ。それは我々が2年前に発表したものに対する対応でしかない。
329Socket774:2006/06/30(金) 01:01:13 ID:6BiQ3O2T
>>327
この電波まだいたのかw
知能低い粘着ww
330Socket774:2006/06/30(金) 10:46:59 ID:LTXKLRAp
>>329
より知能が低い事を晒して楽しいのか?
331Socket774:2006/06/30(金) 14:09:57 ID:YFMofrlt
外部の端末からの検索ならわかるんじゃない?
332Socket774:2006/06/30(金) 19:15:54 ID:iY2cIpT9
結局Houndのキャッシュはどうなるんだ?
333Socket774:2006/06/30(金) 20:38:32 ID:5xxKZAEP
俺jailとかchroot多用してるが327がなんで脅威なのか判らん・・・
334Socket774:2006/06/30(金) 22:29:49 ID:6BiQ3O2T
池沼だからしょうがなく。
335Socket774:2006/06/30(金) 23:28:57 ID:LTXKLRAp
>>333
jailやchrootは外を隠蔽する事で中で起きる問題を閉じ込める機能。
つまり、外が攻撃されれば無力。
仮想化機能も外の世界を作って中から外を隠蔽できる。
336Socket774:2006/07/01(土) 02:51:43 ID:TOzdZUEX
>>332
現状に排他的な共有L3つけて終わりでしょ。
337Socket774:2006/07/01(土) 20:18:12 ID:kK8wvUYC
>>333
マトリックスって映画観れば理解できるよ。
あのまんまの話がコンピューター内では現実に起こりうる。
338Socket774:2006/07/01(土) 21:28:08 ID:F+3W7j85
>>337
わけわかんねぇ
339Socket774:2006/07/02(日) 23:12:44 ID:AaSwnqE6
仮想化技術、貸そうか?W
340Socket774:2006/07/02(日) 23:16:43 ID:/h3so3of
死罪
341Socket774:2006/07/03(月) 05:21:45 ID:em8+PBU+
ギャグの終了 このギャグは応答していません。
スレに戻ってギャグの状態を確認するには、[キャンセル]をクリックしてください。
ギャグをここで終了した場合は、ツッコミされていないギャグが失われる可能性があります。
ギャグを直ちに終了するには、[すぐに終了]をクリックしてください。

応答していないギャグ 仮想化技術、貸そうか?W.exe を終了することを選択しました。
ギャグが応答しません。
この問題をMaccrosoftに報告してください。
仮想化技術、貸そうか?W.exe のエラー報告が作成されました。
弊社では、この報告を製品の改善に役立てるとともに、匿名の機密情報として扱います。
エラー報告に含まれるデータの詳細: 仮想化技術、貸そうか?W

エラーの報告 この問題を報告していただきありがとうございました。
342Socket774:2006/07/03(月) 07:32:21 ID:guWaYbJC
> http://pc7.2ch.net/test/read.cgi/jisaku/1151802697/172 より

> それから
> >Read担当コアが他コア全てに対してL1L2照会と自L3アクセスと他コアL3照会と同時にメモリアクセス
> はなんか違う気がする。

違わないよ、アクセスアドレスにより担当コアが決められているからこそ照会と同時にメモリアクセスが可能なんだよ。
共有L3はロジック的にはメモリ側として考えて、担当コアが受け持つラインブロック単位で担当コアが同時に管理する。
これだとダーティキャッシュを扱えることになる。

しかし、完全排他は無理だな。
343Socket774:2006/07/03(月) 07:49:32 ID:gur/r31m
Conroeスレからの移動

向こうの>>173
>しかも、その結果はRead受け持ちコアに一旦集めた後に依頼元へ返信される仕組みだ。
資料読もうよ…。Read担当コアには集めずそのまま依頼元に返してるって。

俺の推測はこんな感じ
Houndを想定してるから各CPUは直結で。

CPU1内の自コアL1L2と他コアL1L2をProbe
 ↓
CPU1内の共有L3をProbe
同時にCPU1からCPU3にメモリ読み込み要求を出す
 ↓
CPU3は自キャッシュ全ての照会とメモリの読み出し動作を行う
同時にCPU0,1,2へのProbe要求を出す
 ↓
CPU3は自キャッシュのProbe結果をCPU1に返信
CPU0,2は自キャッシュ全てのProbeを行う
 ↓
CPU0,2はProbe結果をCPU1に返信
メモリのデータがDRAMからCPU3に届く
 ↓
CPU3はCPU0にメモリのデータを送信
 ↓
CPU0はCPU3にSourceDoneを返信

あの資料から推測する限りこれが自然だと思うんだけど。
各CPUはそれぞれが自立してProbeするわけで。
それがさっきの言葉に引っかかった理由。
344Socket774:2006/07/03(月) 08:32:48 ID:guWaYbJC
すまん、時間切れだ。
また、晩にでもレスするよ。
345Socket774:2006/07/04(火) 02:00:58 ID:quQi3lU4
朝からレス無しか
346Socket774:2006/07/04(火) 03:18:52 ID:eN5+fdCE
AMD silently launches Dual-Core Optimiser
http://www.theinquirer.net/default.aspx?article=32790
347Socket774:2006/07/04(火) 08:40:03 ID:VQ1i3D8P
Conroeスレ占拠しすぎ。
IntelのL2より小さい犬っころの共有L3なんぞに価値など見出すわけない罠
348Socket774:2006/07/04(火) 09:04:46 ID:JDS2Wm0N
>>346
AMD Dual Core Optimizer Released
ttp://www.tweakguides.com/

マルチCPU未対応のソフトでの不具合解消みたいなもんだ
349Socket774:2006/07/04(火) 14:07:39 ID:PJkEAzD3
淫厨のL2キャッシュに対する信仰は、常人には理解できん…
まあAMDもモデルナンバーで差別化してたけど
350Socket774:2006/07/04(火) 14:31:06 ID:9ODbRTfo
>>347
占拠って…淫厨ID:guWaYbJCが勝手に喚きだしたろうがw
351Socket774:2006/07/04(火) 16:18:37 ID:J4H6Wyig
システムバランス&コストバランスを考えずに、単にキャッシュが多ければ良いと思っている奴はにわか。
352Socket774:2006/07/04(火) 21:34:58 ID:quQi3lU4
65nmになってクロック上げられんのかなあ。
353Socket774:2006/07/04(火) 21:42:43 ID:/90p1K5p
クラックすればいいじゃん
354Socket774:2006/07/04(火) 21:42:56 ID:7D1yAxWj
プロセスというより第3世代歪みシリコンで上がる予定。
355Socket774:2006/07/04(火) 21:59:51 ID:quQi3lU4
第三世代歪Siはすでに実装されてるという話もある。
356Socket774:2006/07/04(火) 22:14:44 ID:MKvDNIgd
十分リーク電流が抑えられてるなら、微細化でクロックは上がる
逆に抑えられないとネトバのように微細化してもクロック上げられない。

65nm版のラインアップが漏れ聞こえてくる頃にはわかるんじゃないかな
357Socket774:2006/07/04(火) 22:44:02 ID:quQi3lU4
NetBurstは熱の壁でクロックが上げられなかったけど、K8も同じ理由なのかという点が引っかかる。
OCしてもそれほど伸びないしさ。
358Socket774:2006/07/04(火) 23:17:26 ID:ewIaNfU2
65nmの最初のトランジスタは最後の90nmのそれと同じってAMDが言ってたよな。CTIとかいうやつ。
だからクロック耐性向上は配線遅延の分しか期待できないんじゃないかな。
Vtの違うトランジスタをどう使うかでも変わるだろうけど。
359Socket774:2006/07/05(水) 00:13:55 ID:P4CFnaYd
要素としては持っていくんだろうけど、ゲート長や絶縁膜厚とかまで一緒かどうかなんてわからないんでは?
AMDの65nm製品が出てくるのもまだ先だし。
360Socket774:2006/07/05(水) 20:35:07 ID:0Slg5kCl
AMDの65nmは絶縁膜厚1.3nmかな。
361Socket774:2006/07/05(水) 23:19:03 ID:NvjxEyAc
プロセス間のトランジスタ技術共有はSTTって名前でしょ。
65nmでクロックは伸ばせるかもしれないけど、消費電力まで抑えられるかはまだ分からんよね。
プレスラみたいにOC耐性良くても消費電力大きかったら製品の競争力は落ちてしまうので、
最近のAMDは90nmでもCTIでトランジスタを改良しつつ、低漏れ電流なトランジスタの割合を増やして
低消費電力かつクロックそのままの"ENERGY EFFICIENT"を作っているんだと思う。
トランジスタの改良のほとんどを低消費電力化に向けてる感じ?
この歩留まりが良好だと65nmではクロックにも傾けられるだろうから、期待していいと思う。
362・∀・)っ-○◎●新世紀ダンゴリオン ◆DanGorION6 :2006/07/05(水) 23:50:28 ID:J77r0n59
K7/K8はSIMD整数ユニットのレイテンシが2ってのが圧倒的に弱点かと。
ユニットをストールなしに稼動させようと思ったら、4並列になるようにコードをスケジューリングしないといけない。

Core 2のそれはレイテンシ1で済んでてしかもフル128bitなのに。
だから性能の出しやすさに大きな差が出る。

ただ逆にx87やスカラ浮動小数ではいくらか分はあるかと(SIMD浮動小数はまぁK8Lまでは諦めろ)
363Socket774:2006/07/06(木) 00:48:08 ID:BVYLP8JI
今どき整数演算のことで優劣語られてもなあ
364Socket774:2006/07/06(木) 00:58:13 ID:gT8yGds4
もっと強力なFPUをくれ
今の10倍くらい速いやつを
365・∀・)っ-○◎●新世紀ダンゴリオン ◆DanGorION6 :2006/07/06(木) 00:59:01 ID:N4/pv/lW
しかしMPEGエンコーダやゲームでもパックド整数演算は使うし
浮動小数演算ベースでもマスク演算なんかはSIMD整数ユニットでやる

SSE4で整数演算の強化が行われてるから、使う機会は増えると思ふ。
ほぼエンコーダや暗号処理向けだけど。
366Socket774:2006/07/06(木) 01:00:11 ID:tpsdQ1B9
>ユニットをストールなしに稼動させようと思ったら、4並列になるようにコードをスケジューリングしないといけない。
MMXで4並列ってことか? 128bit整数SIMDなら2並列でいいと思うんだが。
367・∀・)っ-○◎●新世紀ダンゴリオン ◆DanGorION6 :2006/07/06(木) 01:10:49 ID:N4/pv/lW
>>366
それもある意味正解だけど、内部的には上半分と下半分に分解して別々に処理するから、依存関係とかで
スケジューラの負担が逆に増えたりして結局伸びなかったり。

同じこと(128ビットSIMDベース)やったら、たとえばCore(Yonah)なら1個のFused-μOPとして扱えるし、
レイテンシ1だから並列処理を気にする必要自体が無くなる罠。
368Socket774:2006/07/06(木) 01:44:08 ID:tpsdQ1B9
スケジューラの負担を減らすために、K8Lで整数SIMDは128bitになるのか?
369Socket774:2006/07/06(木) 01:46:27 ID:2vIoKeFa
>364
一体何に使う気なんですか…
370Socket774:2006/07/06(木) 02:46:06 ID:t8AyoUTg
ダンゴリオン(=団子)は鳥屋を撃沈したと思って
機嫌が良くてたまらんのだろうな。ニヤニヤ
371・∀・)っ-○◎●新世紀ダンゴリオン ◆DanGorION6 :2006/07/06(木) 03:03:52 ID:N4/pv/lW
前々から指摘してたことなのに「刑事告発の用意ならあるぜ」って言うまで聞かなかった池沼が悪い
てか、あの居直りっぷり見てて相当DQNだと思いました。
指摘さえされなきゃそのまま違反してられたのに、見たいな愚痴たれてるっしょ。

まぁアレは自業自得です。
372Socket774:2006/07/06(木) 03:20:09 ID:RKsXpaPo
HoundのL3は完全にメモリのコピーって主張してた人は結局消えたのか。
何でそんな考えになったのか知りたかったのだが。
373Socket774:2006/07/06(木) 09:09:02 ID:RnwBRx+r
かかってこいや
374Socket774:2006/07/06(木) 09:23:47 ID:A5Zsp0Qz
どこかでSIMMとか得意気に連呼してた虫が湧き出しそうな悪寒
375Socket774:2006/07/06(木) 14:02:43 ID:0N9ASwhr
団子の読解力にある種の感動を覚えた!
376Socket774:2006/07/06(木) 16:22:06 ID:iYyoH/cD
Nは痛い新人雇ったな。
377@∀@)っ-------:2006/07/06(木) 18:58:28 ID:NOfk0Izz
>>370 >>375
えっと、正直、逆に何の話をしてるのかサッパリですわ
心当たりがいっぱいあり過ぎて

えっと、そのインスパイ屋2006さんがおまいらの殿様であるうちは、
いくら技術力で圧倒できても、彼やその取り巻きが気に入らなければ
不可だってことくらいは百も承知ですわ。
なおかつ和解などする気はない。
これでいいかな?
378Socket774:2006/07/06(木) 20:31:10 ID:lhGmkmOu
Sun and AMD to share common socket
http://www.theinquirer.net/default.aspx?article=32854

OpteronsとSparcがソケ互換に
379Socket774:2006/07/06(木) 20:42:44 ID:AmvGPAYu
amd
380Socket774:2006/07/06(木) 21:02:52 ID:9ERAQa7y
>>378
よくわからんけど
なんのメリットがどちらに有るの?
381Socket774:2006/07/06(木) 21:06:04 ID:lxXcho+/
2008年の予定だから、おそらくTukwila(CSI)への対抗策
382Socket774:2006/07/06(木) 22:49:34 ID:ZYtcymMf
SparcからOpteronへ行くところはあっても、逆は存在しないだろうな
そう考えるとやっとSparc終わるのかって思う
383Socket774:2006/07/06(木) 22:51:10 ID:gT8yGds4
Sunの解体は着実に進んでいる
384・∀・)っ-○◎●新世紀ダンゴリオン ◆DanGorION6 :2006/07/06(木) 23:15:10 ID:N4/pv/lW
IPFとXeonのプラットフォーム共通化は曲がりなりにもx86互換であるIPFシステムの
低価格化にある罠w

しかし、いまだに130nmプロセスが現役なIPFも大概だよなぁ
385Socket774:2006/07/06(木) 23:35:17 ID:lwY6ONzu
Alpha AXP が Slot B で Athlon と M/B 共通に出来る(なってた)


なんかデジャヴ…
386・∀・)っ-○◎●新世紀ダンゴリオン ◆DanGorION6 :2006/07/07(金) 01:41:24 ID:JqieHhRq
実際問題、Sunの真骨頂たるJavaの実行速度、SolarisよりWindows、SPARCよりOpteronなんかのほうが速いもの
387Socket774:2006/07/07(金) 02:36:14 ID:B+kq9CdY
>K7/K8はSIMD整数ユニットのレイテンシが2ってのが圧倒的に弱点かと。
Conroeのほうが良いのは当たり前だけど、ソフト方面の努力で隠蔽できる程度だろ
そうでなければ、Netburstでベンチが高速に動くなんてありえなかった
388Socket774:2006/07/07(金) 02:48:15 ID:c0Mi1Yew
>>387
Netburstはクロックの高さが長所だから、
K8にしてみればNetburstをクロック当たりの性能で
ある程度大きく上回る必要がある。
389Socket774:2006/07/07(金) 02:55:00 ID:8pjGAW5i
>>385
これか・・・ この後Alphaは・・・・
http://ascii24.com/news/i/hard/article/2003/04/01/642822-000.html
390Socket774:2006/07/07(金) 07:28:44 ID:lY9zkDy4
Transitive Emulator Ports Sparc/Solaris Apps to Linux on Xeon, Itanium
http://www.itjungle.com/breaking/bn062806-story02.html
391Socket774:2006/07/07(金) 10:22:10 ID:p7XNEmG3
>>387-388
NetBurstのSIMDは実際のところ大して速くないんだよな。
整数はユニットがクロックの半速動作で128bitを2クロックもしくは64bitを2クロックで2命令
(下位と上位は1クロックずれるらしい)

PenMやAthlon64は64bitで等速のSIMDユニットが2基。
Pen4は実クロックこそ、これらのおおよそ1.5倍を実現してるが、SIMDユニットレベルではスループットは0.75倍でしかない。
movaps/movapd/movdqaを使ったLoad/Storeの帯域がものすごいから、それをもってトータルのスループットで
上回ることが出来る(場合もある)。いずれにしても苦しいが。

倍速ALUのほうに懸けてたからな。アレがそもそもの間違いだが。
アレだけでどれだけのダイ面積と電力を消費してたと思う?
逆にアレがあったからこそ整数SIMDのスループットがないがしろにされてた面もあると思う。

パックド浮動小数に関しては、同じく128ビットの半速ユニット搭載
こちらはx87やスカラ演算では下半分しか使えないのでAthlon優位。
128ビットフルに使えば実クロック数の強みとL/S帯域でPen4優位。



この点、Coreマイクロアーキテクチャは、MMXやx87でも十分Athlonに対抗できる性能が出せるだけのユニット数を搭載してる。
むろん等速だし、128bitフルに使えばスループットは倍。
SPECintでの圧倒的な数字はICCのオートベクトライズの効果によるものの可能性が高い。
逆に言うと、Intel C++やVector Cなどの自動ベクトル化ツールさえ使えば、あの程度のコードなら明示的にコードを
記述しなくてもSIMD化してくれるくらい、性能を引き出すための開発者の負担は軽い。
392Socket774:2006/07/07(金) 15:10:12 ID:p8Ut8v4P
再来年のHoundになっても大した性能向上は期待できないってのがなぁ
4コアなんて要らんし
393Socket774:2006/07/07(金) 17:24:33 ID:8IZMpz+i
>>392
Conroeに対してよく言われるセリフを言わせていただく。

発売されていない製品の優劣を語っても無駄

安心したか?
394Socket774:2006/07/07(金) 17:31:22 ID:X1XNALvk
本当に来年の今頃でるならデモがあってもいいころだが…
はて?
395Socket774:2006/07/07(金) 17:40:51 ID:tQcdNVk1
>>392
4コアは必要だよ
8コアは今の環境だとわからんが、vista次第だな
かつてDual CPU使ってもいないやつが、「2コアいらねぇww」って言ってたのと同じ
396Socket774:2006/07/07(金) 17:45:46 ID:ZLAvzfoR
俺はひとまず10倍高速なFPUをもった16コアのCPUが欲しいです
用途は3DCGです
397Socket774:2006/07/07(金) 17:52:19 ID:aLfi4G81
デュアルコアOp使ってる俺から言わせれば
いくらコアがあっても足りないような業務用とか、不毛な趣味ならともかく

ごく普通のパソコン用途では2コアでおk
事務作業用のPCなら1コアでイナフ
398Socket774:2006/07/07(金) 18:03:47 ID:GPqmxg+5
>>397
基本的に同意。
結局会社に導入されるPCは、
営業・事務はセロリンあたり、
研究・儀重は、今はおpてろん
になってしまう。

でも個人でも3コアぐらい欲しい。ながら仕事が多いものでw
399Socket774:2006/07/07(金) 19:30:02 ID:6UQEbEuU
エンコとかゲームとかやってみた限りだと、4CPUまでなら使ってくれるソフトは比較的多い
8CPUは完全とは言わないけど、ほぼ無駄だった。
一部のベンチで8CPU 100%になっただけ。
400Socket774:2006/07/07(金) 20:02:39 ID:dGBKfYka
>>396
オプテロンのソケットで使える2コアなCellが出れば実現しそうだな。

でもメモコンがRDRAMだしHTT対応も要るし、ゴッソリ新規作成が必要そうだが。
401Socket774:2006/07/07(金) 20:04:11 ID:dGBKfYka
>>400
どっちかというとHTXカードでの提供の方が早そうだな。
402Socket774:2006/07/07(金) 21:19:38 ID:ve18M8Ql
>>398
3コアといえばXBOX360CPU
403・∀・)っ-○◎●新世紀ダンゴリオン ◆DanGorION6 :2006/07/08(土) 01:45:42 ID:BFG5MP+c
Cellの高い浮動小数のスループットなんて所詮単精度だけですよ。
高い精度を求めないゲーム専用の石
404Socket774:2006/07/08(土) 02:16:40 ID:/v4DpZe+
Cellネタ引っ張るなキチガイ
405・∀・)っ-○◎●新世紀ダンゴリオン ◆DanGorION6 :2006/07/08(土) 02:39:13 ID:BFG5MP+c
じゃあ、HoundのCore2のL2より小さい共有L3ネタ再開
406Socket774:2006/07/08(土) 02:42:40 ID:9cJRlCSD
ロジック回路小さくしてL2を128MBくらい積めばいいんじゃね!?
407Socket774:2006/07/08(土) 02:47:38 ID:9cJRlCSD
今の無かったことにして!
408Socket774:2006/07/08(土) 05:10:39 ID:bTfiNmqZ
デュアルチャンネルddrVは128byte単位でアクセスすることに
なると思うんだけど、キャッシュラインは128byteになるの?
409Socket774:2006/07/08(土) 06:52:29 ID:G8Tmz2pn
AMDは覚えやすい名前のブツを作るべきだ
410Socket774:2006/07/08(土) 08:24:54 ID:2/H90wdM
いやいやAMDは〜ronという命名ルールを貫くべきだ
Athlon、こいつだけ異端児
411Socket774:2006/07/08(土) 09:34:36 ID:47OWOzD3
>>403
どうせ高性能CPUなんて、ゲームくらいにしか使ってないだろうが。
412Socket774:2006/07/08(土) 09:43:23 ID:rybHlvJy
128byte = 1024bit!
413Socket774:2006/07/08(土) 10:03:07 ID:cdm7YRMg
Conroe XE   3.33GHz dual 4MB FSB1333MHz TDP 95W '06Q4  $1199 (Athlon64 X2 4.16GHz相当)
Conroe E6900 3.20GHz dual 4MB FSB1066MHz TDP 65W '06Q4  $969 (Athlon64 X2 4.00GHz相当)
Conroe E6800 2.93GHz dual 4MB FSB1066MHz TDP 65W '06Q4  $749 (Athlon64 X2 3.66GHz相当)
Conroe E6700 2.67GHz dual 4MB FSB1066MHz TDP 65W '06Q3  $529  (Athlon64 X2 3.34GHz相当)
Athlon64 FX-64 3.00GHz dual  1MBx2  TDP ???W AM2 '07Q1
Conroe E6600 2.40GHz dual 4MB FSB1066MHz TDP 65W '06Q3  $309  (Athlon64 X2 3.00GHz相当)
Conroe E6500 2.40GHz dual 2MB FSB1066MHz TDP 65W '06Q4  $269  (Athlon64 X2 2.88GHz相当)
Athlon64 FX-62 2.80GHz dual  1MBx2  TDP 125W AM2 '06/6/6 $1236
Athlon64 5400+ 2.80GHz dual  512KBx2 TDP ???W AM2 '07Q1
Athlon64 FX-60 2.60GHz dual  1MBx2  TDP 110W 939 '06/1   $1031
Athlon64 5200+ 2.60GHz dual  1MBx2  TDP 89W AM2 '06Q3
Athlon64 5000+ 2.60GHz dual  512KBx2 TDP 89W AM2 '06/6/6 $696
Conroe E6400 2.13GHz dual 2MB FSB1066MHz TDP 65W '06Q3  $239  (Athlon64 X2 2.56GHz相当)
Athlon64 4800+ 2.40GHz dual  1MBx2  TDP 89W AM2 '06/6/6 $645
Athlon64 4600+ 2.40GHz dual  512KBx2 TDP 89W AM2 '06/6/6 $558
Conroe E6300 1.86GHz dual 2MB FSB1066MHz TDP 65W '06Q3  $210  (Athlon64 X2 2.23GHz相当)
Athlon64 4400+ 2.20GHz dual  1MBx2  TDP 89W AM2 '06/6/6 $469
Athlon64 4200+ 2.20GHz dual  512KBx2 TDP 89W AM2 '06/6/6 $365
Athlon64 3800+ 2.00GHz dual  512KBx2 TDP 89W AM2 '06/6/6 $303
Conroe E6200 1.60GHz dual 2MB FSB1066MHz TDP 65W '06Q4  $179  (Athlon64 X2 1.92GHz相当)
Conroe E6100 1.33GHz dual 2MB FSB1066MHz TDP 35W '07Q1  $149  (Athlon64 X2 1.60GHz相当)
414Socket774:2006/07/08(土) 11:00:55 ID:/zkMdKlH
>>411
廃スペック=ゲーム というあたりでもうね…
出直してきなさいと小一時間(ry
415Socket774:2006/07/08(土) 11:32:44 ID:weDX+jvX
>>406
俺はロジック回路は今後縮小されると思ってる。超高速で動き、発熱量小さい簡素なコア
でね。んでAnti-HTとHTTが両方実装されるのではないかと。んで、小さいL1,L2とデカイ
L3(数十M)、それで8コア位になるんじゃないかなと思う。勿論OS側でAnti-HT使った処理
能力の高いコアとHTT使った処理能力の低いコアを判別できないといけないが。

多分マルチコア化に行き詰まったらそっちの方向に進むんじゃないかな?
416Socket774:2006/07/08(土) 11:51:45 ID:bTfiNmqZ
8prefetch×8byte×2chで128byte

ttp://www.elpida.com/pdfs/J0876E20.pdf
バースト長4(バーストチョップ)というのを使えば
64byteでアクセスできるの?
名前からすると連続で8つのデータが来るのを
ぶった切ってると思うんだけど、性能は良いの?
417Socket774:2006/07/08(土) 15:49:58 ID:CSGvIwVk
ロジック回路が超小さいItanium2マンセー
418Socket774:2006/07/09(日) 02:25:38 ID:eHK8gzFB
俺は殆ど単精度で済むんだが
倍精度にする程桁数の多い処理って皆何してるの?
419Socket774:2006/07/09(日) 05:01:20 ID:t16fAMzI
真面目な数値計算各種いろいろ?

最終的な有効数字は、たいていの場合単精度でも表せる範囲内だと
思うけど、浮動小数点演算の場合、計算途中で、有効桁数がどっと
減ることがあるから、安全側に振ると倍精度になるんじゃねえ?
気合い入れて真面目に書けば単精度でも済むことが多いと思うけど、
かなり面倒じゃないかなあ。

あと、Cellは倍精度でもけっこう速いらしいよ。
ttp://slashdot.jp/comments.pl?sid=322480&cid=969082
しかしこの結果見るとIA64使う意味ないねえ。
AMD64の方が安い分マシ。
420Socket774:2006/07/09(日) 05:30:01 ID:3KGHu4mN
1.東工大がTSUBAMEを公開
7月4日の@ITに西川特任助教授の談話として,「構築に20億円、電気代やサポートエンジニア費用
などの運営費に年間3億円掛かっている。入札で各社が頑張ってくれたので、本来であればとても
この値段で構築できるシステムではない。」と書かれていますが,一般に値引率が大きい大学商談
としても相場の半値以下の感じで,こういうダンピングをやるから,スパコンは儲からない,儲からな
いから開発費が出ない,従って,開発エンジニアが減らされて東工大の卒業生も採用できないという
悪循環に陥ってしまいます。大学の先生が,値切って,自分だけ安く買えれば万歳,あとはどうなっ
ても構わないというセンスでは困ったものです。
421Socket774:2006/07/09(日) 06:05:24 ID:xft2AITJ
コピペするなら引用元くらい書けよ
422Socket774:2006/07/09(日) 06:39:24 ID:qhqcwEHR
>>418
CADなんか普通に要る
精度は0.001ミリ(小数点以下3桁)程度は普通だし、
設計するもののサイズが1メートル以上なら小数点以上に4桁必要
最低でも7桁の精度が要るけど、単精度は6桁しかない
423Socket774:2006/07/09(日) 08:26:18 ID:8igiIp9z
>>419のリンク先のリンク先のバークレーの論文によるとOp248で実験
プロセッサ数が書いてないんだが、書いてある数値からすると1CPUでの値っぽい。

K8LクアッドコアOpとかになると、倍精度ではベクタとかCellとそれなりに戦えそうだなぉぃ。
x86系のCPUがここまで戦えるっつーことにちょっとビクーリ・・・
424Socket774:2006/07/09(日) 09:17:34 ID:x1AEqqX9
でもCellより、現行の汎用PowerPCの方が速い
425Socket774:2006/07/09(日) 11:59:36 ID:9oHKFxoF
>>422
CADで使ってるユーザーが、果たしてどれだけ居るのやら。

単精度で間に合うユーザー>>>>>>>>>>>>>>>>>倍精度が必須なユーザー

IA32のCPUが数多の非IA32な他CPUを駆逐していった歴史を見れば、単純な絶対
性能差が市場での勝敗を決めないのは、一目瞭然でそ。

>>424
その汎用のPowerPCをPC用にエンハンスしてくれなくなったから、MACがIntel
に鞍替えした訳だが。
426Socket774:2006/07/10(月) 08:23:27 ID:m+IjQI0P
そうか?
むしろ俺的には、ゲームとかの不真面目(というのは、失礼かもしれんが)な
分野以外じゃあ、浮動小数点数≒倍精度という認識なんだが

俺自身、技術系と業務系の経験しかないんであれだが
ぶっちゃけ単精度を仕事で使ったことは一度もないし
427Socket774:2006/07/10(月) 10:38:29 ID:Un8ZcWEB
普通浮動小数点といったら倍精度

単精度はグラフィクスとかの"使い捨て処理" 専用だと思ってた
428Socket774:2006/07/10(月) 13:20:18 ID:vQtgKj/a
>>426-427
倍精度、倍精度って言ってるだけで抽象的な発言ですね。
宗教論争と変わらん。
429Socket774:2006/07/10(月) 14:05:41 ID:dYbtYSuT
GK乙
430Socket774:2006/07/10(月) 16:20:27 ID:nF3ILQPW
AMD売れてないんだそうですね
431Socket774:2006/07/10(月) 22:21:57 ID:uNADgyCx
誤差が累積するような計算は倍精度じゃないと実用にならないよ。
電気でも流体でもシミュレーションやるなら必ず倍精度。
432Socket774:2006/07/10(月) 22:40:32 ID:a1hJYxFm
Reverse Hyperthreading does not exist
http://www.theinquirer.net/default.aspx?article=32885

やっぱガセだったっぽいね。
433 ◆DanGorION6 :2006/07/11(火) 00:52:25 ID:VBEAkFC2
>>419
PPEはフルセットのPowerPCだからそりゃFPUも載ってるし、
SPEではソフト処理させる必要があるが、それでも7コア分あるから
クロック数×コア数の力技でそれなりの性能は出せてるみたいだけど

http://www.cs.berkeley.edu/~samw/projects/cell/CF06.pdf


Core2はパックド倍精度を利用することで1コアあたり4DP/clockの演算が可能。
これが年内には4コア搭載で、合計16DP/clockに達する。
2.66GHzなら42GFlopsを超える。(単精度ならその倍)

なんにせよCellは専用のコア設計をしてもまだあの巨大ダイ。発熱もかなりのものらしいし
高い玩具の域を出ませんわ。


#いずれにしてもItaniumは要らない子になってしまうね。
434Socket774:2006/07/11(火) 01:10:47 ID:hTv2EF3E
>>433
Core2 Duo 2.66GHzが42GFlops…
Core2 Duoでも、AltiVecを上回れませんか…
435 ◆DanGorION6 :2006/07/11(火) 01:17:45 ID:VBEAkFC2
>>434
倍精度の話をしてるんだけど。単精度なら単純にその2倍ですが。
AltiVecでいつ倍精度がサポートされたんですか?(・∀・)
436Socket774:2006/07/11(火) 09:27:32 ID:6hq/B6Zp
AltiVecうんこ
437Socket774:2006/07/11(火) 11:53:28 ID:a1/7biIR
AltiVecの性能ってさ、どうせ積和(vA * vB + vC)演算だけは
1オペレーションでできるから2×4で8SP/clockとか言ってるんだろ。
同様にCellのSPEもだろうけど。
積-差や和-積なんかはもちろん2オペレーションかかる。
8SPだと思ってたらガッカリすることになるだろう。

Core2は単精度×4or倍精度×2の加減算ユニットと積算ユニットが
それぞれ1つずつだから、積+和はもちろん積+差でも、さらには単精度の加算と
倍精度の積算でも、同時に並列実行できる。
AMDもK8Lでそれに追従する形だ。

ゲーム機としては贅沢な石だが、コンピュータとしてみれば、Cellは言われてるほど高性能じゃない。
平均性能がカタログスペックの20分の1というSCEの伝統を覆しそうに無いしな。
438Socket774:2006/07/11(火) 15:42:21 ID:6gWQ/jhK
DSP と CPU の中間だと思えば面白い石なんじゃないの?
439Socket774:2006/07/11(火) 16:02:59 ID:Of/FQNMk
>>438
面白いって意味じゃ、これ以上ない石じゃないかね。
自分の趣味で叩くのにはいいと思う。
ただ、やっぱり倍精度FP性能がもうちょっとあると
嬉しいかなあ。
440Socket774:2006/07/11(火) 23:53:19 ID:8MoJvThI
GKの戯言なんか聞く必要ないよ。
Core2 DuoとかCPUアーキテクチャスレにもCell厨が湧いてたしな。
441Socket774:2006/07/12(水) 00:14:42 ID:EgPYvYfl
PS2のCPUだって、関和演算やマトリックス演算だけは
恐ろしいスループットを誇っていたではないか。
現実には(ry
442 ◆DanGorION6 :2006/07/12(水) 00:18:15 ID:RKN7RHkO
ユーザープログラミングの余地がちゃんとあるかどうかで評価は分かれそうな気も。
PS3がパソコンだって言い張るなら、MSオフィスが動けとは言わないけど、GNOMEなりKDEなりが
実用的な速度で動くのは最低限だよな。

PPEはともかくSPEは倍精度はハードでサポートしてないから、パックド整数を駆使して
ソフト的に処理しないと使えませんぜ。
命令スケジューリングとかで骨が折れる事間違いなし。
443Socket774:2006/07/12(水) 01:09:01 ID:3ROoNKgd
Cellがたいしたもんじゃないってわかりきってたんだから、お前らスルーしろよ
さんざんファビョった挙げ句、今更どうこう言うなんてアフォだな
444Socket774:2006/07/12(水) 10:58:15 ID:6VYBBKr1
久しぶりに覗いてみたら何でCellの話になってるの?
Appleにも売れず外販の見込みすらなく、Sony本体からも駄目出しされてる出来損ない。
445Socket774:2006/07/12(水) 13:53:12 ID:ym60EYNO
倍精度倍精度焙煎にんにくうるさいな
446Socket774:2006/07/12(水) 13:55:30 ID:HaNTTxEi
>>428 >>431
精度が要求される計算は倍精度でも足りない。
本格的にシミュレーションするなら128bit以上使うでしょ。
逆に余り精度が要求されないなら単精度で大概間に合う。
447Socket774:2006/07/12(水) 13:58:26 ID:HaNTTxEi
>>440
むしろアンチソニーの方がウザい。
SPEにも倍精度ユニットが搭載されてることくらい知っとけ。
448Socket774:2006/07/12(水) 17:26:51 ID:SD73EjVU
↑最高にアホ

パックド倍精度「命令」ならあるが直接実行できる「ユニット」はない。
マイクロコード実装で、複数の整数演算の組み合わせで実行される。
逆にソフトでやるからこそIEEE754規定の精度に従うことができる。
自前でソフト実装しないと使えないというのは誤りだが、都度ソフトで
実装してやったほうが速いかもしれんわな。

単精度のほうは精度は度外視。IEEEのフォーマット上は23bitの
仮数部があるが、事実上の精度は15bit程度。
そのへんはSSEでも同じ。
449Socket774:2006/07/12(水) 22:32:00 ID:jxkIGRN0
>>447は本当にアホだなw
450Socket774:2006/07/13(木) 00:19:18 ID:NCJ7WAtO
まったく関係ないけど
アンチソニーの流れって凄いよね
製品ごとに善し悪し有るだろうに
451Socket774:2006/07/13(木) 00:25:19 ID:X73mYeyf
その「悪し」代表がCell
452Socket774:2006/07/13(木) 00:42:08 ID:PoZl177g
アンチCellならアンチIBMに流れそうだけど…
例の企業とIBMが契約してるのか、Sonyに法則発動中なのか判断しかねるが
453Socket774:2006/07/13(木) 00:58:34 ID:mif0zQTt
■後藤弘茂のWeekly海外ニュース■
コプロセッサの時代を開く、AMDの「Torrenza」イニシアチブ
ttp://pc.watch.impress.co.jp/docs/2006/0713/kaigai287.htm

AMDはコアの開発よりコプロベンダを囲い込む戦略でいくようです
どっかみたいに買収を繰り返すつもりなんでしょうか
個人的にはPCクラスタ用にネットワークカードをHTXに挿してシステムバスに流し込めたらイイカナ
454Socket774:2006/07/13(木) 02:58:54 ID:YMIwCrU0
>>453
そのためのinfinibandカードと一緒に出てきたのがHTXだったろ。
455Socket774:2006/07/13(木) 04:04:06 ID:qY2ZMiEi
最近エンコが多いので、エンコ用コプロがあればなぁ〜
それ以外はCPU負荷ほとんどないのが意味ないwww
456Socket774:2006/07/13(木) 10:16:13 ID:d8/sOKX0
>>448
EEと勘違いしてるだろ。
http://www.realworldtech.com/page.cfm?ArticleID=RWT021005084318&p=4
>Unlike the Emotion Engine, the SPE contains a double precision (DP) unit.
457Socket774:2006/07/13(木) 11:11:14 ID:d8/sOKX0
>>442 >>448
どこからその自信たっぷりの発言が沸いてくるのかソースが欲しいところですな。
http://www.cs.berkeley.edu/~samw/projects/cell/CF06.pdf
この辺の論文を見る限りCellは倍精度でもそこそこの速度が出るようだけど。
458Socket774:2006/07/13(木) 12:42:40 ID:pWEOHd64
基地外GKの連投乙

「そこそこの性能」ってのは8コア(PS3では実働7コア)分でだろwww
計14.63GFlops(ピーク性能)ごときじゃKentsfieldを出すまでもなく
Conroeのローエンドにも負けだな。

いったいその低速なDPユニットがどんな構成になってるのか説明してみてくれよwww
理解の範疇超えてるぜ。

いずれにしても、Kentsfieldと同時期に出る石と2004年のシングルコアアーキテクチャを
同列に比べても意味の無い数字だ。

PCにはベクトル化・パラレル化しにくい処理こそ重要であって
GPUにでもやらせておけばいいFP性能(それも複数コアの合計値)で
オナっても意味なし。

なんにせよ、地に足のついてない新設計のCPUを出しても、マシンごとに
新たにコードを書き直すのが当たり前のゲームならともかく、既存コード
資産でのパフォーマンスを重視するPCやサーバ市場で受け入れられる由は無い罠。

しかもゲームですらたかだか800MHz程度の低速CPU積んだマシンにも劣勢らしいがw
暴れたくなる気持ちもわからないでもないが、PCのコプロセッサとして利用とか
活路でも見出さない限り、この板的には要らない子だね。
459Socket774:2006/07/13(木) 13:24:11 ID:mPYi0WcR
Conroeの2.4GHzの倍精度だと19.2GFlopsか。
Pentium XE 965(3.73GHz)だと14.93GFlopsね。

Cellの倍精度演算の仕組みは知りたいな。
460Socket774:2006/07/13(木) 15:22:02 ID:LngYlzzP
>>457
単精度ユニットがあれば、単精度計算を数回繰り返すことで倍精度計算は可能だ。
っていうか、問題はそこではない。

CellにはSPE毎に32bitの単精度ユニットが4つ搭載されてはいるが、
64bitの浮動小数点演算を1サイクルで実行可能な「倍精度ユニット」は実装されていないのだよ!

倍精度ユニットがあれば、2ユニット*8コア*3.2GHz = 51.2GFLOPSが理論上可能なハズだ。
461Socket774:2006/07/13(木) 15:37:19 ID:mPYi0WcR
>>460
単精度数回で倍精度って相当きつくない?
まともに倍精度を意識したハードでないと
14.63GFlopsとかすら無理だと思うけど。
462Socket774:2006/07/13(木) 15:59:40 ID:LngYlzzP
>>461
数命令/数サイクルだとHWサポート無いとキツイかナ・・・

CellだとSPで理論値200GLOPSくらいで、DPになると7%くらいに激落ちしてるから
とりあえずHWで有効な倍精度サポートが入ってるとは思えないなw

倍精度サポートしてるなら50や100GFLOPS逝っておかしくない
463孟宗:2006/07/13(木) 19:45:11 ID:4Nv4PSdO
ttp://www.theinquirer.net/default.aspx?article=32978
>PS3 Cell yields are in the toilet

ゲーム機はもうPCベースにすれば良いよ・・・
仕様とOSだけMicrosoftが作って
ハードはそれを満たせばいいって。

MSX復活。
464Socket774:2006/07/13(木) 19:46:27 ID:vQ+GX59f
>>463
>ゲーム機はもうPCベースにすれば良いよ・・・
PCがx86から乗り換えてくれるなら、賛成
465孟宗:2006/07/13(木) 19:49:36 ID:4Nv4PSdO
コプロ
466Socket774:2006/07/13(木) 20:02:41 ID:pWEOHd64
HWサポートはIEEE倍精度浮動小数形式と複数のパックド整数/単精度との
相互変換さえあればなんとかなる希ガス。
どのみち倍精度関連の命令は単精度との変換以外は加減算と積算・積和算しかないので、
足りないものはソフト実装しか無い罠。

つか、どうせピーク性能だから加減算の性能だろ。

両仮数を32bit整数×2×2に展開

指数の大小比較

小さいほうの仮数を差分だけシフト

普通に整数加(or減)算

桁上げ(or下げ)の解決&浮動小数形式へのパッキング

これで俺の脳内では2DP/4clk程度のスループットに収まると思ってるんだが

乗算は複数回の積和算が必要になるな。上位53bitだけ求まればいいので
そこそこテキトーでいい気もするがな。
467Socket774:2006/07/13(木) 23:15:48 ID:iqLRZu77
ttp://japan.cnet.com/news/ent/story/0,2000056022,20170387-2,00.htm
65nmは今年中に出荷されるみたいだな。
原文も"AMD will start to ship chips"だし。
もしかしたら年末には秋葉で手に入るかも?

あと45nmが液浸ってのは初めての情報のような。
SRAMを試作したっていうのはすでに出てきたが。
Intelはドライ露光だけど、コスト的にはやっぱ液浸の方が高いんだろうなあ。
"欠陥数はすでにドライ露光と同レベル"とASMLは言ってたりするから歩留まりは時期的にも問題になりそうにはないが。
468Socket774:2006/07/14(金) 09:45:29 ID:JBJ3+3bd
>>461
底抜けのアホばっかだよなぁ。
整数ならともかく、浮動小数点数の場合、
半分ずつ分けて計算なんてできるわけねえっつーの。
packed整数って何のことかも知らずに言ってる奴は救いがたいアホ。
469Socket774:2006/07/14(金) 10:22:39 ID:OM8uhmMH
PS 3のHDDにフル機能Linuxを搭載
http://pc.watch.impress.co.jp/docs/2005/0609/kaigai187.htm
だそうです。
470Socket774:2006/07/14(金) 10:31:08 ID:JBJ3+3bd
しっかし、CellのSPEには倍精度浮動小数点演算器も搭載されているって、全然知られていないんだな。
http://ascii24.com/news/i/tech/article/2005/02/10/imageview/images765508.jpg.html
ISSCCではCellの倍精度乗算器について論文発表があったし、die photoにも見ての通りDP部がある。
http://www.geocities.jp/andosprocinfo/wadai05/20050219.htm
ま、計算速度が非常に遅いので、用途がかなり限定されそうだけど。
471Socket774:2006/07/14(金) 12:05:31 ID:qaWe2HLw
>>467
期待しても無駄だよ。
AMD社が発表している最新のロードマップだと65nmの供給は2007/1Qからだし本格化するのは2007/3Q。
その段階でも、高クロック品は90nmだから90nmと同等のクロックになるのは年内一杯掛かりそう。
TDPは65Wで90nmのEEと変わらないし性能も全く同じ、変化しているのはダイサイズと65Wの選別が楽になる程度。
こんな調子だからK8Lが2007年に発売されるなど期待しない方がいいし、性能も期待しない方が良い。

> ttp://images.dailytech.com/nimage/2008_large_amd_q307.jpg
472Socket774:2006/07/14(金) 12:16:44 ID:mvfWuTNf
↑なんなのこれ。
473Socket774:2006/07/14(金) 12:39:50 ID:WybS+67g
プロセッサーが十分高速になった昨今、重要なのは性能よりも価格や値下げではないだろうか。
474Socket774:2006/07/14(金) 12:55:08 ID:lQutdXGT
>463
それなんて XBOX?
475Socket774:2006/07/14(金) 13:07:40 ID:/FVgTUkc
AMDがプロセスで遅れるのはある意味必然だからな。
intelの生産終了期の歩留り≒AMDの生産開始期の歩留り
らしいから。
476Socket774:2006/07/14(金) 13:14:25 ID:bnJs9YOu
dailytechの記事を「AMD社が発表している最新のロードマップ」と言うのはどうかと思うが・・・。
R-HTTの時も真に受けて必死に反論してたんだろうなぁ。
477Socket774:2006/07/14(金) 13:43:47 ID:fvAeqCxH
だから負け犬GK(ID:JBJ3+3bd )はスレ違いってか板違いだから来るなって

内部構成がどうであれDP演算があからさまに遅いことに変わりは無いだろ。
インオーダだからその低速っぷりに後続の命令は待たされるんだよ。
だからブラックボックスとしてみればどういう演算ユニット構成だろうと
遅いものは遅い、それだけ。

得意の単精度浮動小数ですらスカラ性能で見れば数十分の1程度。
SPE全部に均一に割り振れるような単純な演算でのスループットなんて
汎用性がなさすぎるの。
256KBのアドレス空間に命令コードとデータが収まるかっつーの。
それが7〜8個ってデータの出し入れを担当してやらなきゃいけない
PPEの負担どんだけ重いんだよ。
そのPPEすら2issueでインオーダの貧弱なコアだしな。

大量の物理演算専門のコプロならPhysXがあるしこちらは既にMSもDirectXで
サポートを表明してる。PC用途でCellの出る幕は全く無しだ。
とにかくCellなんて自作板には要らないクズCPUだから
ゲハ板にでもスッテンロ。
478Socket774:2006/07/14(金) 16:36:16 ID:3+ODpiIv
何だが倍精度ヲタが必死だが、それはそれで倍精度専用のコプロを望めば
済む話ジャマイカ。

Cell登載のコプロはそれで充分用途はあるし、少なくとも倍精度用コプロ
より思いっきり沢山売れるだろう。そしてそれはAMDへの貢献度合いの差に
もなる。

今後のAMDのコプロ政策の中では、どちらが優秀という話は不毛な論争だと
思う。
479Socket774:2006/07/14(金) 17:09:28 ID:fvAeqCxH
倍精度が遅いだけが問題じゃない。

SPEが直接メインメモリから読み書きできない。
PPEから明示的に読み書きしてやらねばならず、命令・データ合わせて
256Kに収めないといけない。
256KBじゃ、ポケステやドリカスのVMのミニゲームが入る程度だぜ
とても汎用演算には不向き

さらには32bit固定長命令なのにレジスタ一個指定するのに
7ビットも使ってるせいで、命令セットの拡張が困難。
使い捨てアーキテクチャもいいところ。
480Socket774:2006/07/14(金) 17:19:02 ID:Dx8mC3Hh
まとめ。

2000年前後〜デュアルコア製品が登場し始める。
数年後…

2005年〜Athlon64 X2が登場。「これからはデュアルコアの時代だ!」
同じ頃、Cellが発表される。仕様をみるとピーク以外はたいしたことがないのはわかっていたが、
外界に目を向けない鎖国民たちが「8コア」の部分にのみたまたま見てしまい反応し、騒ぎを起こす。

1年後…騒ぎを起こしてファビョっていた連中が「Cellは結局〜〜なんだから」と気づき、自ら騒ぎを起こしたにも関わらず、Cellの話題を出すと怒り出す。

まあ、じきに鎖国に戻り、信者たちは外界に目を向けなくなるだろう。
めでたし、めでたし。


で、AMDの話題は?あ、発売されてもいない製品を語るのはダメなんでしたっけ^^;;;;w
481Socket774:2006/07/14(金) 17:24:41 ID:BlZIObG8
これから変革期らしいけど
Core2Duo対AM2が当分続くの?
前評判だとインテルに分がありそうだけど、AMDに対抗策は?
482Socket774:2006/07/14(金) 17:26:56 ID:SRHCnJkr
最低でも2007年までは、AMDやられっぱなし。
483Socket774:2006/07/14(金) 17:33:27 ID:BlZIObG8
そうなんだ…
ソケAから乗り換えたかったけど、アムダーだし我慢しておくよ
484Socket774:2006/07/14(金) 18:27:13 ID:QZRZRb0L
>>480
ES品が出ても話題にしては駄目です
正式に発売してからでないと怒る人たちがいますから。

まさかAMDだけはいいっていうおかしな人はいないと思いますけどね^^;
485Socket774:2006/07/14(金) 19:15:29 ID:uQXrLGc5
>>471
これってコピペ?
486Socket774:2006/07/14(金) 21:37:38 ID:H9FmzZsn
AMDだけは発表前でもOK牧場。









なぜならここはAMD次世代スレ。
決してCell雑談スレではナイ。
487Socket774:2006/07/14(金) 23:10:24 ID:5d/r9I7+
スレタイも読めないほど国語力が低い連中にそんな難しい話が理解できる訳が無いw
488Socket774:2006/07/14(金) 23:12:39 ID:kMOoWwLd
Cellは最強の撒き餌だという事はわかりました
489Socket774:2006/07/14(金) 23:17:49 ID:6JSsKwcz
AMD は '4x4' Power Programs で Conroe に反撃
http://www.pcmag.com/article2/0,1895,1989028,00.asp

>4x4 プラットフォームはマザボに二つの物理的なソケットを配置、
>二つのソケットは AMD の Direct Connect アーキテクチャによって互いに接続されている。
>AMD Athlon 64 X2 プロセッサが両ソケットに搭載され、計 4 コアになる。

>8 コアの "8X8" プログラムの登場は 2007 年。
>4 つの仮想的なプロセッサコアを持つ二つの物理的なプロッセッサで構成される予定。

>4x4 プラットフォームの登場時期についてはまだ公式に明かされていないが、
>AMD の広報担当は「早いうちに発表します」と言い、
>インテルをある程度出し抜くことができる時期に間に合わせる可能性をほのめかした。

Athlon 64 x2 1つのシステムと比較して、開発中の 4x4 プラットフォームでは
Vista の最新 beta 上の 3DMark 06 や Maxon Cinebench R9.5 、 WinSAT などの
マルチスレッドのベンチマークで、平均 80 % のパフォーマンス向上が見られる。
490Socket774:2006/07/14(金) 23:25:30 ID:qaWe2HLw
>>486
> AMD は '4x4' Power Programs で Conroe に反撃
へー、そりゃ凄いね、INTELもびびり捲ってると思うよ。
まぁ、そういうことで、俺はConroe買って横から眺めているからガンガレw
491Socket774:2006/07/14(金) 23:45:20 ID:bnJs9YOu
録音、また1日中2ちゃんか?
492Socket774:2006/07/15(土) 00:19:09 ID:oPE6UfwC
>>481
インテルはどうなんでしょうね?
FSBいつまで使い続けるんだろう・・・。
493Socket774:2006/07/15(土) 00:22:34 ID:vB7ko9PJ
いや、流石に8X8は…
可能不可能じゃなくてさ…一体いくら掛かって何ワット必要なんだよ…
494Socket774:2006/07/15(土) 00:49:51 ID:fNdeU3Ow
495Socket774:2006/07/15(土) 05:40:21 ID:2PSIu2Vf
>>494
リンク先に870Wと800Wと書いてあるが?・・・
もちろん電源容量だから使用量はもっと下か・・・
496Socket774:2006/07/15(土) 10:05:02 ID:rZoAUkvk
100WクラスのGPUが4つ8つ搭載されるとなると、それどころでは済まない・・・・
497Socket774:2006/07/15(土) 18:57:52 ID:2PSIu2Vf
>>495
リンク先の話な・・・誤解させる文書でスマソ
498Socket774:2006/07/15(土) 21:38:26 ID:fNdeU3Ow
次元の超えた爆音を轟かせるエンスージアストPC誕生の予感
499Socket774:2006/07/16(日) 13:01:16 ID:+9wszTbS
ttp://sources.redhat.com/ml/binutils-cvs/2006-07/msg00051.html

ttp://sourceware.org/cgi-bin/cvsweb.cgi/src/include/opcode/i386.h.diff?cvsroot=src&r1=1.68&r2=1.69
K8Lに追加されるSSE命令群はSSE4aと呼ばれているようだ。

ttp://sourceware.org/cgi-bin/cvsweb.cgi/src/gas/config/tc-i386.c.diff?cvsroot=src&r1=1.218&r2=1.219
PROCESSOR_AMDFAM10の定義にCpuMNIが入っていないので
MNI(SSE4)は使えないかも
500Socket774:2006/07/16(日) 23:35:47 ID:tfBaYZQF
「CELLチップの歩留まりは良くて10〜20%」
http://blog.japan.cnet.com/nakajima/archives/002988.html
501Socket774:2006/07/17(月) 01:19:33 ID:PDVuYb2N
何だこのレベルの高いスレは。お前らいったいどこでそんな知識身に着けてきたんだ。
502Socket774:2006/07/17(月) 02:02:11 ID:wUPjw18H
AMDに関係ないことが殆どだな
503Socket774:2006/07/17(月) 02:27:06 ID:yz/3dMv9
>>500
スレ違いなわけだが…
元記事 (www.reed-electronics.com) の方を読むと、「良くて 10%〜20% だが、
logic redundancy があれば、それを倍にできる。IBM 以外で、(CPU について?)
それをやってるところがあるかどうかは知らないが」とあるので、なにもないと
10%〜20% だが、IBM の力で 20% 〜 40% にしてるとも読めるんだが、本当の値は
いったいどちら?
504Socket774:2006/07/17(月) 03:09:55 ID:2sZlViZL
このインタビューでの、logic redundancyってのは、SPE8個のうち7個を使うだけってことで、それでチップの歩留まり上げられる
ってこと自慢してるんじゃないかと
あと、10〜20%ってのも、IBM以外の会社ならCellくらいのサイズのチップをつくれば、その程度しか歩留まり上がらないだろうね
って感じで、例にしかすぎない気がする
本当はもっと良いのか、悪いのかは謎だけど

ブログの中島さんもウソを書いてるわけじゃなくて、自分が別のところで、SPE8個そのまま使う仕様だと37%くらいじゃねって
勝手に予想してたのが、IBMのインタビューで10〜20%ってえらい低い数字を挙げてるから、ついそれに飛びついちゃった
だけかと
つまり、タイトルが恣意的で、内容も別記事を見ないとちゃんと把握できないという嫌らしい書き方だ
505Socket774:2006/07/17(月) 04:32:57 ID:8WxB4i7u
普通にやれば、10%〜20%になるが、logic redundancyを使っているから37%になっている

ってことか
ん?PPE1個+SPE7個での歩留まりに決まってるだろ
1コアは無効にして出すことは決まってるのに、何で全コア分動作するダイの歩留まりに言及する必要があるんだよ
「100mm四方のダイ程度の歩留まり」とは言うが、IntelやAMDのメインストリーム〜バリュー向け
ダイは、90nm四方程度で、それを更に「logic redundancy」やってるわけで。

たとえばYonahであれば片コアが動かないものはCore Solo、
さらにキャッシュ半分のCeleron M 4xxシリーズなどという風にローエンド版に
回すことにより、フルセット版としては基準落ちのダイを有効活用することで、
償却効率を上げている。
さらに、スペックは固定でないから全部2.16GHzで動く必要は無く、クロック耐性に
応じて低クロックのコアとすることができる。

Cellが100mm四方相当ならIntelやAMDは50mm四方相当ですか?
Cellの歩留まりは十分悪いでしょうな。
508Socket774:2006/07/17(月) 06:33:47 ID:7pBXl+y4
元記事のインタビューでIBMの副社長さんが言ってるんだから、漏れにかみつかれても…

Electronic News: What’s the defining factor that makes some chips better than others?
Reeves: Defects. It becomes a bigger problem the bigger the chip is. With chips that are one-by-one and silicon germanium,
we can get yields of 95 percent. With a chip like the Cell processor, you’re lucky to get 10 or 20 percent.
If you put logic redundancy on it, you can double that. It’s a great strategy, and I’m not sure anyone other than IBM is doing that with logic.
Everybody does it with DRAM. There are always extra bits in there for memory. People have not yet moved to logic block redundancy, though.

10〜20%って数字を挙げてるところの主語は"you"だから、IBM自身の歩留まりについて話してないでしょ。あくまで一般論みたい感じで、
他社がCellみたいなチップ作ったら、10〜20%がせいぜいだろうって言ってる。
で、"you"がlogic redundancyを使えば、"you"も歩留まりを倍にできる、と副社長が言ってるわけだ。
で、その後でlogicについても、IBM以外に冗長構成やってるかは知らんが、DRAMだとやってるねー。logic block redundancy
だと、まだ一般的じゃないようだね、とIBMの副社長が言っている。
というわけで、記者の質問に対し、"logic redundancy"を使うのがうちのチップ製造の肝だ、とIBMの副社長が回答してるだけで、
10〜20%って数字が実際のCellの歩留まりかどうかは、よくわからんのじゃないの?

logic redundancyがSPE1個冗長の構成、という話と読んだのは漏れだから、違うといわれたら、そうかもしれないが
509Socket774:2006/07/17(月) 06:44:53 ID:Zh8kjLFo
とりあえずIBMはAMDから歩留まりのノウハウ?を手に入れたらしいから10〜20%なんてことはないと思う。
AMDのSempron(たぶん)は95%の歩留まりらしいからな。
510Socket774:2006/07/17(月) 07:00:01 ID:7pBXl+y4
スレ違いを続けて本当に申し訳ないが、中島さんの37%って試算の数字も、PPE1個+SPE8個だと37%で、
PPE1個+SPE7個だと69%で、SPE7個にするのは経営上正しいって話で出てきただけ
(計算の前提は、http://satoshi.blogs.com/life/2005/05/post_12.html を見てくれ)
中島さんも10〜20%を37%と比較してることから、logic redundancyについてはSPEの冗長構成と読んでる模様
だからと言って、漏れの読み方があってるかはまた別問題だがなー
511Socket774:2006/07/17(月) 08:33:05 ID:I4maoZu3
>>508
分かりやすい解説有り難うございました
512Socket774:2006/07/17(月) 09:43:51 ID:9yOH1j4F
513Socket774:2006/07/17(月) 10:32:01 ID:zLHwuhfL
冗長化は主要なPCメーカーなら既にやってるしIBMのお家芸でも何でもない。
INTELにしても冗長化しやすいキャッシュを大きくしても歩留まりがあまり悪化しないのはそういうことだ。
514Socket774:2006/07/17(月) 15:26:07 ID:n1TTyyGq
>>513
察するに、IntelのプロセッサはSRAM素子でロジックを実現しており、
そのためPCメーカーが後付けでロジックの冗長性を確保することも
可能、という発言趣旨かと思うが。

まさに次世代だな。リコンフィギュラブルすぎ。
515Socket774:2006/07/18(火) 11:05:44 ID:Ej52lZVy
>>479
SPEに何のためにDMAコントローラが乗っているのかと。
しっかい相変わらずここはアンチCellスレだなぁ。
アンチやるにもちょっとはもう少し知識を付けては如何でしょうか。
醜いですよ。
516Socket774:2006/07/18(火) 11:08:28 ID:gJhNjTcE
どっちもスレ違い
517Socket774:2006/07/18(火) 11:23:22 ID:lPY9cqIH
64bitは苦手なCore Microarchitecture
http://pc.watch.impress.co.jp/docs/2006/0718/kaigai288.htm
518Socket774:2006/07/18(火) 17:13:27 ID:Ga0DGEu/
>>517
あくまでも32bitと比較しての話だから、Core x64動作 < K8 x64動作 って
話にはなってない。

まあ次回の記事にネタを残しただけだろうから、ワクテカしてマテ。
519Socket774:2006/07/18(火) 22:00:22 ID:7KYJMHoO
>>518
その比較はもう意味がないんじゃないかな。このあまりに悲惨な数字を見てしまうと
64bitアプリケーションを走らせるためにCoreが選ばれることはほとんどいないと思える。
(32bitで走らせれば1.5倍速いCPUを敢えて遅い64bitとして使うのはかなり勇気がいる)

興味深いのは64bit OS上での32bitアプリケーションの性能かな。これがそこそこならば
まだなんとか64bitモードの意味がある。

結局「全方位及第のAMD」と「一点豪華なIntel」という構図は変わっていないが
「今までのコードが速いAMD」と「新しく書いたコードが速いIntel」の構図は
64bitの観点からは混沌となったかもしれない。
520Socket774:2006/07/18(火) 22:25:30 ID:3IMOZA62
別にintelびいきじゃないけど、WoodcrestのベンチだとOSはWin鯖x64やXPx64だが?
ちゃんとベンチテスト環境を見ずに数字だけ見ても意味ないんだがなー
あとアスキーのベンチでも(これはベンチ環境が謎だが)、64bitがまんべんなく遅くなってるならともかく、
64bitの方が速いのもあるので、結局コードの最適化の話で、intelコンパイラだと64bitだと32bitよりさらに
速くなりますよって、可能性もなきにしもあらず
521Socket774:2006/07/18(火) 22:40:49 ID:HaItQ9I3
つまりインテルのCPUはわざわざ最適化してやんないと何も出来ないゴミってこと
522Socket774:2006/07/18(火) 22:46:21 ID:7KYJMHoO
>>520
ねっとばーすとの時も今後コンパイラの改良が云々と言われ続けてきた末に今があるので
microoptimizationには期待しない方が。「64bitの方が速いものもある」という状態から
コンパイラによって「64bitの方が遅いものもある」という状態にまで持っていくのは無理。

その前に新しいコンパイラが出ても使ってもらえないという現実の深く広い川が……
523Socket774:2006/07/18(火) 22:47:47 ID:3IMOZA62
しかも、今のConroeに合わせた最適化をすると、64bitに合わせたCPUを作ったときは、また最適化し直さないと性能が
でないということになるだろうね
いつものintelのことだが

ちなみに、Woodcrestの方が性能上ってグラフだけど、x64のベンチが少ないのでまだ微妙だが、64bitだとクロック辺りだと
Opteronとほぼ互角の印象を受ける
Hound世代できちんと性能アップしているなら、intelのDP鯖奪回作戦もそうそう上手いこといかなさそうだ
32bit/64bitに限らずとにかくフェッチ帯域が足りないと思う。
9バイト10バイトの命令なんてSSE使ってたらガンガン使うのに、フェッチ帯域ネックで
演算ユニットに行き届かないってのが最悪のパターン
525Socket774:2006/07/19(水) 00:16:38 ID:SwQi0LFH
次の世代はかなり期待出来そうじゃないですか?
526Socket774:2006/07/19(水) 06:20:48 ID:G6fZsJnT
>>521
この世のどんなものでもそうだろ
527Socket774:2006/07/19(水) 06:52:20 ID:aR7q4k9c
>>524
お前アホだろ?
そんなこと言い出したら、CPUなんて何もかもが足りていないよ。
SSE処理は十分に高速なのになにをほざいている。
528Socket774:2006/07/19(水) 12:51:40 ID:khFZD256
IntelはItaniumがあるので
AMD主導のx64にはあまり力を入れていないのだろう
529Socket774:2006/07/19(水) 13:27:45 ID:rCMEh699
クマー
530Socket774:2006/07/19(水) 13:35:08 ID:9mT4UPB3
>>528
単純に時間不足だったんだと思うけどな
IA-64があるからというか、HPの手前捨てるわけにもいかないし、
独自なx86-64を作ろうにもMSからサポしないと言われたら実装もできないし

時間不足と言えばVTの方はどうなってるんだろう。
>>527
お前アホだろ?
逆汗してみればわかkるが、最低でも4バイト、REX付きなら5バイトは使う。ロード・ストアが絡めば8バイト
CoreMAくらいユニット数がリッチだとユニット使い切るのに全然足りねーんだよ。
断言するが、CoreMAに改良がない限りAMDはK8Lで圧倒的な逆転を遂げる。
533Socket774:2006/07/19(水) 23:22:16 ID:VJpJ0emY
64bitもそうだけど>>530の言う仮想化技術も、すごく中途半端な実装なんだよね
どっちもこれから旬な技術なのに・・・
32bit蔵ではいいかもしらんが、鯖市場では微妙になってしまう
分かりやすい話をすると、CoreMAは上り下り計256ビットのL1間転送帯域と
128bitのload/storeを各1本持つにもかかわらず、L1の読み書きのスループットは
多くのケースでNetBurstの256bit/clockに満たない。

なぜか?
フェッチ帯域が足りないから。

K8LはもしくはLoad/Store各1つに加え、128bitのLoadを2つ、同時発行可能だが、
16バイトの命令帯域じゃ使い切れるわけがない。
K8Lのフェッチ帯域の32byteへの拡大は必然といえる罠。
535Socket774:2006/07/19(水) 23:54:20 ID:9ZDFblql
>だんご
使いきれないほどのunitを載せた理由を説明してくれ。
536Socket774:2006/07/20(木) 00:25:34 ID:Le5lRIKZ
いっぺんに改良は大変なので弱いところから順に改良していくから。

よく練られたコードを除き、まんべんなく分散されるよりも
一つのユニットに負荷が集中する事の方が多いので
各々のユニットに余裕を持たせておく必要があるから。

デコーダが2命令/clockでLoad/Storeが3個の場合
初めからデコーダを3命令/clockにしないからアンバランスなんだ
という話になるが、実際にはLoad/Storeの帯域、フェッチの帯域、
ALUの数、Conroeに見られるようなデコーダやuFusionの特性、
もっと広い範囲で見るとL1, L2の帯域など様々な要因が織り混ざって速度が決まっている。
従って、何らかのユニットが2個だと少ないが3個だと使い切れない、
といった単純には割り切れない状態になっている可能性が考えられるから。
とりあえずNetBurstよりクロック数が落ちるからSIMDの増強は急務だったのでしょうな。
90nmでNetBurstの失敗が明らかになるまではCoreMAはモバイル用のアーキテクチャだったので
SIMDユニットは64bitで、SSEはμOPsフュージョンでやるものと思ってました。
なんでこんな化け物がTDP34W程度(Merom)に収まるのかただただ不思議ですわ。

なんにせよ、トレースキャッシュ採用を本気で信じてますた。
うまくバランスをとれば省電力技術と高性能を両立する技術になりうると思うし
実際オレゴンもイスラエルも次の世代のCPUはトレースキャッシュ採用のようですが。


なんにせよ、1スレッドの性能を上げるための技術は引き続き必要になると思います。
クロックが上げられないから尚更ね。
538Socket774:2006/07/20(木) 01:55:35 ID:V/FppiIo
ダンゴはアフォ決定だな。
K8Lだと云々と言う。
しかしK8はダンゴの思惑と違ってConroeより性能が悪く、ダンゴに言わせると設計ミスの屑CPUとなる。
されど、K8Lは違うの言い張る。
AMDの広報を信じて疑わぬのは何故だ?
K8Lはダンゴに言わせると屑CPU、そんな屑CPUしか作れないAMDの広報を何故信じているのか聞かせてくれ。
539Socket774:2006/07/20(木) 02:16:08 ID:8fVzvWFX
K8がConroeより性能が悪い→K8は設計ミスの屑CPU
K8が屑→K8Lも屑

という論理がすでに破綻してけど、あえて同一論調で言うのなら
K8の足元にも及ばなかった屑CPUのNetburstしか作れなかったIntelが
Conroeを生み出せた事実をもって、反証となると思うけどね。

まあ何にせよ、現物勝負じゃね?
どこの会社の看板背負ってるかで、現物の性能が変わるわけでもなし。
その時代にあったものを作るだけでしょう。
CoreMAにもっと早期に着手してたとしても90nmで作れてたとは思えない。
シングルコアでもおそらくTejasなみの巨大ダイになってたはず。

Pentium Dだって、90nm時代は圧倒的に負けてたけど
65nmプロセスになってAthlon64 X2とためはれるだけの消費電力レンジに落ち着き、
性能の出せるクロックまで上げられるようになってる。

今はIntelがプロセスでリードし、しかも新アーキ投入でリードしてるからこういう状況に
なってるけどプロセスルールは互角になり、新アーキも投入。
後発の強みでAMDがリードに転じても何ら不思議はない。

K8LがK8の拡張にすぎないなら、CMAはCPUIDが示すとおりPentium Proの拡張の拡張ですが。



整数での優位はどちらに傾くかは微妙だけど浮動小数は十分逆転可能なスペックですわ。
541Socket774:2006/07/20(木) 04:59:00 ID:VCxLc8jM
とりあえずハァハァできればいいだけの一消費者としてダンゴの予言にwktkしとこう。




外したらてめーのうんこを食ってやるからな!
542Socket774:2006/07/20(木) 12:03:34 ID:SzK9d2Cj
ここまでの一連の発言で、ダンゴがアフォで知ったかなのは明らかだと思うが、
匿名とは言え、変な宣言するのはやめとけ。
543Socket774:2006/07/20(木) 12:10:10 ID:1bj+Q7tL
ID:SzK9d2Cj がアフォで知ったかでは無い発言をしてくれるそうです。
544Socket774:2006/07/20(木) 12:28:19 ID:rrfEk9EB
んじゃ俺様が代理で、
てめぇら、よーく耳の穴かっぽじって聞けよ。
K8Lに多大な夢見るんじゃねぇぞ、こんにゃろ。
回路を増やしますとか、機能を上げますとか言ってもだな〜、
それが本当に実現されるのかは物が出てみないことには分からんのだよ。
しかも、回路を増やしたり、一部の性能を無理矢理上げたりすると、どこかにそのしわ寄せが起こり、そう簡単に性能が上がる訳じゃねぇ。
これをトレードオフと言うのだよ。
ダンゴのアフォはそんな当たり前のことを無視してK8Lをマンセーしているから叩かれる。
世の中甘くねぇぞ、もっとシャキっとしろ、シャッキっな。
545Socket774:2006/07/20(木) 13:09:18 ID:VCxLc8jM
Conroeはブツが流れ出す前からマンセーレスが氾濫してたわけだがw
それにそんな素人な話より似非でも何でもマニアックな話のほうが読み手として面白い。

K8Lについてネガティブな見方が多い中、ダンゴのポジティブな意見は面白い。
お前のレスはつまらん。
546Socket774:2006/07/20(木) 13:16:49 ID:TIiXq12h
「性能が上がるとは限らない」って言うだけなら白痴でも出来る詭弁。
SSE自分で触って経験も踏まえて語ってる香具師に何も例を述べずに
アホといって掛かっても説得力が無い。

SSEのユニット幅倍増による演算スループット向上に合わせ、フェッチ帯域を拡大するのは妥当。
メモリロード付き演算のネックが解消するため、実質的な命令帯域は向上する。
さらにフェッチ帯域の向上は64ビット汎用演算のスループット向上もはかれる。
たとえば add r64, imm64 で10バイト。フェッチ帯域16byteなら3命令取り込むのは
厳しいが、32byteなら余裕だ。
Core2よりキャッシュ容量は少ないが、メモコンやHTバスの帯域はある。
整数のピーク性能は高くないだろうが、長い命令安定した性能は得やすくなる。

技術的な問題であれば、K7/K8はL1命令キャッシュにフェッチする際に
プリデコードを済ませているので、フェッチを倍増しやすい。
さらに、プリデコード情報を用いてデコード前の段階で汎用整数パイプとFP/SIMDパイプに
振り分けてしまうので、デコーダの負担も軽く、66Hプリフィックスなどの問題を抱えなくて済む。

Core2はフェッチ帯域を32byteにしなかった理由は想像に難くない。
Core2のプリデコードはフェッチ後なので、フェッチ帯域を増やしても
今度はプリデコードユニットがネックになるだろう。
トレースキャッシュの発想自体はK7/K8のプリデコード命令キャッシュより
進んだものであったはずなのに、P6に退行している。
アラが多い。

問題は、命令長が長くなるとμOPsの供給が追いつかなくなる4issueか、
よりリッチなオペレーションも安定して供給のできる3issueか
どっちが性能が出しやすいかだな。
547Socket774:2006/07/20(木) 13:40:34 ID:VJfVGsFR
>>546
その意見が正しいのならK8は何故そうなっていない?
K8はAMD64の元祖ですぜw
これまでは出来なかったけど、次は出来るってか?
548Socket774:2006/07/20(木) 14:00:46 ID:TIiXq12h
それはPentium Mで64bit対応しなかった理由を聞くようなものものだ。
池沼きわまれり。

プロセスルールの縮小やステッピングの改良に伴ってK8は進化している。
L/S帯域の倍増も、SSE3採用もデュアルコア化も、HTの1600MHz化。
130nmと90nmの間にどれだけの改良が行われたと思う?
65nmではそういった拡張が出来ず公式発表のスペックを満たせない理由が
あるというなら、教えてもらいたいものだが。
549Socket774:2006/07/20(木) 14:05:43 ID:VJfVGsFR
AMDはついこの間まで、K8は完璧で拡張するところなどないとほざいていたのを忘れたか?
550Socket774:2006/07/20(木) 14:07:05 ID:dbKBdIBQ
>>548
それを達成するのに3年。
上がわずかだが徐々に性能をあげようとも、Athlon64 3000+など、2年近く値段が変わらなかった。
AM2が出るまではその3000+よりも性能の劣っていたSempronも、Athlonにならい性能そのまま値段そのまま。

K8が来年、再来年と改良はされていくだろう。
だがそれで対抗できるのか?
551Socket774:2006/07/20(木) 14:10:34 ID:TIiXq12h
K8Lで拡張しているのはユニットのデータ幅であって
K8パイプラインの構成そのものでは無いってのはわかってるよな?
552Socket774:2006/07/20(木) 14:31:58 ID:TIiXq12h
>>550
それを言うならIntelは2年近くにわたってそれを下回る性能しか出せなかっただろw
競争が無い市場は停滞するからな。
ようやくIntelが動き出した「消費電力当たり性能」ならかなり向上してるな。
Pentium 4はキャッシュ増量くらいしかできなかったし、それに伴い消費電力も増加した。
ようやく下がったのは65nmになってから。

IntelはHyperTransport対抗のバスアーキテクチャいつ出せるの?
Opteron対抗に対抗できない限り、メニーコア戦略云々も
決して見通しは明るくないな。
553Socket774:2006/07/20(木) 14:32:58 ID:TIiXq12h
Opteronに対抗できない限り、
554Socket774:2006/07/20(木) 14:42:07 ID:2I68ouRm
Opteronは4ソケット以上で持て囃されてればいい。
サーバー全市場の10%にも満たない市場で頑張ってくれ。
2ソケットまでならHTもメモコンも魅力は殆どなくなるからな。
555Socket774:2006/07/20(木) 14:44:50 ID:Wdv+2s0P
>K8LがK8の拡張にすぎないなら、CMAはCPUIDが示すとおりPentium Proの拡張の拡張ですが。
拡張だろうがなんだろうが、性能で勝てなきゃまさに負け犬のなんとやら。
K8Lと対峙するべきCPUがNehalemになってないことを祈りたいよ、本気で。
いや、そうなった方がいい場合も考慮しておくか♪ >Nehalem失敗説www

NetBurstも随分中身が変わってるし、Core省略も換えないとは言い切れないし、
やはり現物が出てこないものをどうこう言うのは火傷の元ですよ、実際。
556Socket774:2006/07/20(木) 14:50:16 ID:DlZpc7hx
4ソケットは知らんが8ソケット以上になると相手はItaniumですぜ。
Xeonと比しても尚薄紙の如きRAS機能で8ソケット以上のハイエンド市場を狙うのはちょっと無謀では。
付け加えると、IPFと競合するってことはPPCやSPARCとも競合するわけで。
557Socket774:2006/07/20(木) 14:55:14 ID:2I68ouRm
Opteronがこれから売れる市場は、4ソケット以上での自作か、安売りサーバー市場だけのような・・
あ、そうそう大学関係やデモ用スーパーコンピュータのCPU需要がある。
そんなところだろ。
一杯売って沢山儲けてください。
558Socket774:2006/07/20(木) 14:59:49 ID:TIiXq12h
0.35μm, 180nm, 90nmときてこのペースなら次の停滞期は45nmかな。
もとい、どっちが圧倒的優位な状況がいいとか馬鹿げたことは考えない。
競争原理が働かない市場は停滞するだけだって話。
K8LがコケてCore2が高値安定したほうがいいって思う人はいるみたいですが。
559Socket774:2006/07/20(木) 15:16:19 ID:2I68ouRm
K8Lは転けた方が俺は嬉しいな。
Conroeに届かず、半額セールを期待する。
セカンドPCに最適だと思うね。

中途半端に同性能だと、どちらも価格は下がらないし、K8Lが優秀だったとしても45nmに直ぐ移行するIntelは
そう簡単に値を下げないからろくなことにはならんよ。
560Socket774:2006/07/20(木) 15:26:01 ID:gRQuqOZg
>>556
Itaniumが死んでいる件について
561Socket774:2006/07/20(木) 15:32:40 ID:1bj+Q7tL
>>556
Itaniumも4socketが標準だぞ。
Xeonと同じFSB使ってるからな。
大規模サーバは4wayをセットにしてセット間をチップセットで繋いでる。

あとSunのX4600はIAサーバにしちゃなかなか堅牢だそうだ。
メインフレーム市場を侵食できると面白いけど。
562Socket774:2006/07/20(木) 15:59:21 ID:aZ8WQzTL
>>560
IPFは3世代先までは開発が決定している件
>>561
ttp://www.geocities.jp/andosprocinfo/wadai06/20060715.htm
>X4600はメインフレームほどの堅牢性はありません
563Socket774:2006/07/20(木) 17:01:08 ID:PNrd7IZF
団子の人もINTEL派だ認識してるが、誰かさんとは違って
ハードだけでもの考えてないだけだと思うんだが。
ソフトあってのハードだしソフト屋視点から見ると、今現在のC2Dの弱点て結構ある。
特にサーバ市場で考えるとね。
564Socket774:2006/07/20(木) 18:14:15 ID:x+EHYPfz
そういや Opteron 32CPU だったかの Horus はどうなったん?
565Socket774:2006/07/20(木) 18:41:35 ID:dbKBdIBQ
>>557
x86しか使えない職員、学生をかかえる大学くらいだろ、Opteron買い込むのは
Itaniumはさらにドンマイ
566Socket774:2006/07/20(木) 19:12:40 ID:PNrd7IZF
そうでもないようなふいんきなんですよね

例えばXenでHVM使おうと思った時、現状のVTだと使い物にならない。
AMDのSVTと違って、メモリ制御やI/O制御エミュレートしてくれないから。

仮想化技術はレンタル鯖なんかにも使われてくるし、
企業ベースでもロードバランシングと仮想化技術を組み合わせて
適切なリソース配置することでコストを抑えられる。

そういう意味で現状のCMAはサーバ市場では非常に危うい。
まあK8Lが再来年に伸びるなら、それまでに手を打つ期間はあると思うが。
567MACオタ>546 さん:2006/07/20(木) 19:36:42 ID:opnP7RHY
>>546
  -----------------------------
  SSEのユニット幅倍増による演算スループット向上に合わせ、フェッチ帯域を拡大するのは妥当。
  -----------------------------
SIMD (Single Instruction Multiple Data)わ,文字通り命令あたりのデータ処理量を上げる手法す。
なぜSSEの強化が命令フェッチに直結する。。。なんてトンデモ説が妥当なんすか(笑)
568Socket774:2006/07/20(木) 20:20:07 ID:Qltvapir
>>567
K8Lにおいて、予想される1clkあたりのピークスループットは、
一般的な整数演算は3命令、整数SIMDは2命令、
80bitFPUの演算は2命令、FPのSIMDは2命令。
つまり、普通の命令とSIMD命令でスループットはあまり変わらない。
そして、命令長もそんなには違わないが、やはりSIMDの方が長い。

> 文字通り命令あたりのデータ処理量を上げる手法す。
SSE強化で、命令のバイト数あたりの処理時間は短くなっだのだ。
だから命令フェッチ帯域が重要になる。
569Socket774:2006/07/20(木) 20:56:34 ID:seiVcCck
資料

命令長(REXと即値は含まない)
x87: 2 Byte
SIMD-SP: 3 Byte
SIMD-DP: 4 Byte

アドレッシングによる命令長の増加
[reg] +0 Byte
[reg +disp8] +1 Byte
[reg +reg*n] +1 Byte
[reg +reg*n +disp8] +2 Byte
[reg +disp32] +4 Byte
[reg +reg*n +disp32] +5 Byte
(n=1,2,4,8)
570Socket774:2006/07/20(木) 21:58:39 ID:6EmSXzBO
>>557
そう言えば、東京工大のスパコンってOpteron何個積んでるんだっけ?
571Socket774:2006/07/20(木) 22:21:04 ID:JHw+3S9D
Itaniumなんて誰買うの?
572Socket774:2006/07/20(木) 22:28:33 ID:DPWDxefe

http://enterprise.watch.impress.co.jp/cda/topic/2005/12/16/6853.html
「Itaniumベースのシステムの売り上げは、サンやIBMを上回っているのです。
特に日本市場はメインフレームからのリプレースやRISCからのマイグレーション
でリードしています。Itaniumベースのシステムの売り上げは、SPARCベースの
システムの1.6倍に、POWERベースのシステムの1.17倍という数字が出ています。」

http://enterprise.watch.impress.co.jp/cda/topic/2006/02/07/7170.html
「Itaniumはエンタープライズおよび科学技術分野での導入を中心に確実にシェアを
伸ばしている」「近年はRISCからの移行が加速している。とりわけ日本ではSunの
SPARCシステムからの移行が160%、IBMのPOWERアーキテクチャのシステム
からの移行が117%と、世界におけるRISCからの移行トレンドを牽引している」

http://enterprise.watch.impress.co.jp/cda/foreign/2006/02/21/7251.html
IDCによると、Itaniumサーバーの認知度は向上しており、購入意思を示す企業が
増えているという。また、利用中の企業の顧客満足度も高く、概して好意的な反応
だったという。 このほか、HPのPA-RISCサーバー顧客の3分の2がItaniumサーバー
への移行を検討していることも分かった。適用分野としては、ERPやCRMなどの
ミッションクリティカル分野での採用を検討するところが多いという。

http://enterprise.watch.impress.co.jp/cda/static/image/2006/04/07/intel654.jpg
「IDCによるとItaniumベース・サーバ−の出荷金額は2004年の14億ドルに対して
2009年には66億ドルまで成長すると予測している。また、日本においても出荷が
伸びており、2005年下期においてはSPARCを上回る出荷金額だった」
573Socket774:2006/07/20(木) 22:32:28 ID:JHw+3S9D
>>572
にわかに信じ難い。
574Socket774:2006/07/20(木) 22:36:24 ID:TuLNcwZ+
NECと日立が力入れてるからか、日本”だけ”Itaniumのシステムが売れている
AMDは2本の128bitロードユニットを駆使して高速化しようとしてるんだから
それを有効に使うには16バイトじゃフェッチ帯域が不足する。

同様にCore2も上り下り計256kの帯域を生かしにくいですわな。
MMXだと命令長は基本3バイトだっけ。
576Socket774:2006/07/20(木) 23:09:54 ID:bx8RCTgc
へー、K8LのL1データキャッシュってスゲー速いんだ。
知らなかったよ。
まだ128bit/clockですよ。K8L待ちですな。
まぁ、実効で最速はNetBurstでしょうな。
578Socket774:2006/07/21(金) 01:18:28 ID:BVU0dqm5
>573
記事の日付をみると微妙に沈没前夜…
579Socket774:2006/07/21(金) 01:31:04 ID:3NRIx5PE
Itaniumって都市伝説かと思ってた。
580Socket774:2006/07/21(金) 11:10:58 ID:cnh5S9bo
Itaniumなど存在しない
581Socket774:2006/07/21(金) 13:33:35 ID:oxlGcxN0
Itaniumの中の人など存在しない
582Socket774:2006/07/21(金) 14:17:43 ID:qYEdSKMy
  ある          なし
アルミニウム    イタニウム
あるある大百科  トリビアの泉
あるひ〜森の中  グリーングリーン
583Socket774:2006/07/21(金) 18:31:55 ID:1hYr3BFL
後藤弘茂のWeekly海外ニュース
コプロセッサへの分散が進むAMDの次世代CPU
http://pc.watch.impress.co.jp/docs/2006/0721/kaigai289.htm

●AMDのCPU開発と密接に絡むコプロセッサ戦略
●各社で異なるサブプロセッサの統合の仕方
●他社のコプロセッサもAMD CPUに統合する
●CPUに統合するコプロセッサは市場が決める
●不鮮明なAMDの汎用プロセッサコアの今後の発展
●プロセッサコアの改革はパーツ単位で行なってゆく
●汎用プロセッサコア集約からコプロセッサ分散へと変わる戦略
584Socket774:2006/07/22(土) 20:03:59 ID:OHKWrW23
K10無しで当分はK8Lのままって事か
6年後にはK11の足音が聞こえてくるだろうか
585孟宗:2006/07/22(土) 20:09:41 ID:t0qx2oos
ここは静かですね・・・

恐らくKxxって表記は無くなるんではないかなぁと。
明確なコアの世代交代は今後は無いと思われるし。
586Socket774:2006/07/22(土) 20:13:24 ID:IJI2zVDX
既存のソフトが走る性能を落とさないためのK8コアには、ほとんど手を入れないってことかね
587499:2006/07/22(土) 20:25:00 ID:74F8eHOv
[PATCH] Add alignment to amd family 10 instruction tests
ttp://sourceware.org/ml/binutils/2006-07/msg00261.html
フェッチは32 Byteだがアライメントは16 Byteでいいようだ

ところでAMD Family 10 = K10 = K8L なのだろうか
588孟宗:2006/07/22(土) 20:50:37 ID:t0qx2oos
CPUの機能ブロックがモジュラー化されるから
明確にKxx世代って言うのは難しくなるかなぁと思った。

Compute coreが変われば世代交代って言えるかな?
589Socket774:2006/07/22(土) 22:22:49 ID:IJI2zVDX
>>588
ま、たしかにコアは同じか少しの改良のままでも、あとはブランド次第だね
「Athlon64」ブランドに何かを付けるとか
「Athlon」ブランドにするか
それとも別のブランドにするのか。

ただ、GeForceやRadeonみたいに、前世代のソフトを使うと速度が低下するとか起きたら困るな
そろそろAthlon 65出せよ
591Socket774:2006/07/22(土) 22:40:52 ID:7OityYg9
むしろAthlon'07
592Socket774:2006/07/22(土) 22:42:13 ID:iWxjoE7D
Athlon XPでおk
593Socket774:2006/07/22(土) 22:42:39 ID:VUqPQHR8
Athlon Vis太
594Socket774:2006/07/22(土) 23:52:17 ID:AOrcqq7P
>>593
それ、日本語でアセンブラ書けそうだな
595Socket774:2006/07/23(日) 10:52:28 ID:mLsUcuQx
Athlon128 だろ。

プレフィックスを増やして、汎用レジスタを4倍の64個くらいにすれば、
まだまだ性能ウプが出来そうだし。
596Socket774:2006/07/23(日) 16:14:52 ID:JiCaL9rt
性能向上をクロックやモデルナンバーで表現していたのは消費者としては分りやすかったけど、
コプロセッサの性能をそういう分りやすい形で表現するのはかなり難しいね。
どうするんだろう。
597Socket774:2006/07/23(日) 21:12:21 ID:RJ0xILtX
>>590
来年まで待てよw
598Socket774:2006/07/24(月) 03:36:59 ID:f3ofoMCg
情報待ちだお
599Socket774:2006/07/24(月) 03:40:01 ID:t55PY74j
次のアムドは
Athlon Conroe
600Socket774:2006/07/24(月) 21:33:24 ID:3Q94pIO0
2007年Q1 AMDやっと65nm Intelは4コアCPU発売
2007年末 AMDやっと4コアCPU発売 Intelは45nmプロセスへ
2008年 AMDやっと新CPU K8L発売
2009年 Intel 8コアCPU発売 32nmプロセスへ
601Socket774:2006/07/25(火) 04:52:49 ID:oWPi3pe1
>>600

そんなのイヤー
602Socket774:2006/07/25(火) 05:10:39 ID:9QJNEJcT
ATIと合併しちゃったけど、これって技術的なものにどのくらい影響するかな。
603MACオタ:2006/07/25(火) 05:32:37 ID:0k/wfkig
結局のところ,AMDが思いつくことができた「売れる」コプロってのわGPUだけだった。。。と(笑)
http://pc.watch.impress.co.jp/docs/2006/0725/amdati.htm
  ------------------------------
  【Q】 リリースの中で述べられていたCPUとGPUの統合というのは、ダイレベルでの統合を
    意味するのか
  【A】 そうだ。我々は1つのダイでCPUとGPUを統合することを計画している。すべての市場で
    こういったものが今すぐに求められているわけではないが、ニーズはある。
  ------------------------------
604孟宗:2006/07/25(火) 07:17:36 ID:S/ks5CGJ
その場合、コプロと言うよりは
組み込み向けの統合プロセッサでしょ(1チップ)

コプロは別の路線で、これからの計画では?
605Socket774:2006/07/25(火) 08:22:33 ID:zjq48bly
これはMACオタ先生が朝も早くから盛大に早漏してらっしゃいますね。
606Socket774:2006/07/25(火) 08:23:52 ID:wC5KMcc5
それか、メーカー製の大半は内蔵VGAだけど
AMDの場合GPUアクセスがCPU経由してメモリアクセスになるからボトルネックになる
CPU+GPUのやつにすれば直接アクセスできるようになるから解決ということかな???
607Socket774:2006/07/25(火) 09:25:39 ID:kWre2HTO
そうだろうね。
ハイエンド製品には大容量&広帯域のメモリが必要だし、
CPUにオンダイなGPUじゃちょっと性能不足だろうね。

オンダイのGPUも使用しつつ、接続はPCI-Expressなり何なり、
外部のハイエンドなGPUをサポートする、という形なら、
オンダイなGPU分のアクセラレートも望める、という形が理想的な予感。
608Socket774:2006/07/25(火) 09:46:51 ID:Qfj8onpE
つか、HTXでGPU接続の目がでてきたっすな。
609Socket774:2006/07/25(火) 10:00:04 ID:Fkd3GrFV
今のハイエンドGPUだとメモリ帯域は40GB/s程度でしょ。
一方K8はDDR2-800使っても12.8GB/s。
HT3.0でも20.8GB/sだし。
普通にGPUを統合するにしてもハイエンドは無理だね。
コプロ化して演算をさせようと思っても帯域の問題が出てくるな。
まあ演算させる内容にもよるだろうけどさ。
610Socket774:2006/07/25(火) 10:27:18 ID:LXN9v78G
今すぐじゃなければ出来るよ。
シリコン貫通電極が2008年位に実用化される。
その他に無線方式もあるし。
無線はTbit/s既に試作してる。
目標はPbit/sだそうだからな。
611Socket774:2006/07/25(火) 10:52:53 ID:6ytofCpX
>>608
一番早そうなのは、CPUと同じソケット化したGPUエンジンと、DVIインターフェース
を載せたDVIトンネルチップだろうな。

これならプラットフォームは一つで済むし、GPUに必要な性能&メモリ量を差し替え
だけで実現出来る。
612Socket774:2006/07/25(火) 11:41:08 ID:D2ySewbM
久しぶりのMACオタなのに
一レスで終わりか
613Socket774:2006/07/25(火) 11:43:35 ID:LXN9v78G
HTXの方が早いだろ。
ソケット化は二年はかかる。
614Socket774:2006/07/25(火) 12:32:42 ID:qQKa14bo
結局のところ,MACオタが思いつくことができた「ケチ」のつけ所ってのわ1レスだけだった。。。と(笑)
615Socket774:2006/07/25(火) 12:43:30 ID:6ytofCpX
>>611
そういやDVIトンネルで、どの程度の帯域を喰うのか考察してみた。

1920x1440(24BPP)だと8MB必要だから、これを85Hzのリフレッシュレート
に間に合う様に転送するなら、705MB/S か。HyperTransportの帯域なら
全然問題ないなあ。

なまじUMAみたいにワークメモリをメインメモリに取らないから、その分
軽くなる訳だし。

ノート用CPUには、DualCoreなんかよりもコプロGPUをオンダイで組み込ん
だモノを提供する方が良い鴨ね。
616Socket774:2006/07/25(火) 15:18:20 ID:LXN9v78G
age
617Socket774:2006/07/25(火) 15:51:07 ID:AULkHwLP
http://pc.watch.impress.co.jp/docs/2006/0725/amdati.htm
| 【Q】 ATIは今回の件についてすでにIntelに話はしたのか。
| 【A】 いや、していない。

いいのか? それで。
618Socket774:2006/07/25(火) 17:42:44 ID:sDbdp5Lw
突っ込むところはそこじゃないだろ?

> 【A】 我々はIntelと違い、インターフェイス規格をオープンにしている。例えば、IntelはチップセットもネットワークコントローラもIntel製であることを要求する。これにより、
> 他社のコンポーネントを排除している。我々はこういったことはしない。我々はインターフェイスをオープンにすることで、各社にAMDエコシステムへの参加を呼びかける。

これ身勝手な論理。
インターフェイスの中心にAMDがあることを示唆するものであり、決してオープンとは言わない。
ご都合主義の物言いはもうやめて、Intelを取るかAMDを取るか二社択一の選択を迫るべきだ。
敵対するのなら徹底的にすればよいのであって、都合の良いところだけIntelを利用しようと思わぬことだ。
インターフェースも何もかもINTELとAMDで共有化は全くないようにすればはっきりする。
619Socket774:2006/07/25(火) 18:09:37 ID:kTr0wZaq
「AMDエコシステム」の中心にAMDがいるのはオープンじゃないというのは
難癖にしても酷すぎるな
620Socket774:2006/07/25(火) 18:10:53 ID:GfTb5CdU
>>618
nForce for intelはintelバスとHyperTransportの両方使ってるが?
AMDの言うオープンってのは金を取るか取らないかの違いだろ。

まあ、二社択一を絶対条件にするなら、サードパーティが全社intelから離反するのは
明白だな。
ただでさえ、intelの推進するプラットフォーム構想は極論すれば「intel製品以外使うな。」という
独占的構想だからな。
621Socket774:2006/07/25(火) 18:25:20 ID:sDbdp5Lw
> まあ、二社択一を絶対条件にするなら、サードパーティが全社intelから離反するのは明白だな。
それはありえないな。
どちらに付くかは、各社それぞれの都合で決まる、お前の妄想と一致することはないな。
622Socket774:2006/07/25(火) 23:56:46 ID:inoZrzfO
intelとチップセットメーカーはモロに競合するが、AMDとは直接競合はしないからな。
チップセットメーカー同士の戦いなら、ファブレスでも勝算はあるが・・・

バスライセンス料払ってまで製造能力では全く勝ち目のない相手に挑むほど間抜けな奴がいるとは思えんがな。
623Socket774:2006/07/26(水) 05:58:18 ID:LrJIFymE
cpu+gpuっていうのはGPUが〜GHzで動作するということなのですか?
624Socket774:2006/07/26(水) 06:02:37 ID:VabrgE/v
No
625Socket774:2006/07/26(水) 07:46:57 ID:QYZfvJTR
CPU、GPUがお互い協力して、どっちかが忙しいときには遊んでないで助けるっていう形になれば無駄がないのにね
あとメモリも
626Socket774:2006/07/26(水) 10:59:32 ID:7k8KCUoF
AMDとATIのプロセッサは1つに融合する
http://pc.watch.impress.co.jp/docs/2006/0725/kaigai290.htm
627Socket774:2006/07/26(水) 15:45:12 ID:oR5T+oAR
>>623
今のCPUコアだって基本クロックのn倍速だから、GPUだけm倍速って手を
使ってくるだろう。

VIA C3もネヘミア以前はFPUだけCPUコアの1/2で動作してたし、異なる倍速
のユニットを同じダイに載せるのは、何ら問題無い筈だし。
628Socket774:2006/07/26(水) 15:55:54 ID:HYeq62iy
1チップに収めるのはいいとして、どういう用途を睨んでいるんだろうね。
629Socket774:2006/07/26(水) 16:28:23 ID:oR5T+oAR
>>628
オンチップVideoを使っていた様な用途だろうね。

ノートPCや家庭向けメーカー製PCあたり。

オプテロンだと64bitFP対応した専用コアを用意して、殆どが科学計算用途で
一部を表示装置に回す算段かな?FPUユニットの発展版として入れ替えるって
ところ。

もしかしたらノートPCやメーカー製PC向けでも、FPUユニットとの入れ替えを
してくるかもしれん。どうせ64bitFPなんて一般用途では殆ど使ってないのだ
から、32bitx2で代用して少々遅くなっても32bitFPが激速なら文句は出ん
だろうし。

それがいやなユーザーにはオプテロンを買わせれば済む。
630Socket774:2006/07/26(水) 16:38:10 ID:lBzVV6CI
>64bitFP

そんなの昔からx86にあるじゃん。
Core2で64bitFP×4/32bitFP×8だぜ?
いつの時代の人間だよ。
631Socket774:2006/07/26(水) 16:40:12 ID:TFuBMvpS
統合する汎用シェーダーで演算可能なものは任せる、というスタンスなんでしょう。
特にグラフィック関係に限らず。
632Socket774:2006/07/26(水) 16:42:30 ID:oR5T+oAR
>>630
だから今ダイに載ってるFPUを発展解消する形でGPUと入れ替えちゃえば、ダイサイズや
開発リソースの節約が図れるって話をしたつもりなのだが。

因みに次期C7(Isaiah)は、FPU機能を新SSEユニットに取り込んでしまうらしいが。
633Socket774:2006/07/26(水) 16:45:30 ID:lBzVV6CI
>>632
>因みに次期C7(Isaiah)は、FPU機能を新SSEユニットに取り込んでしまうらしいが。

Intelが何年も前からとっくにやってることじゃん。
現行製品で64bitのFPUで128ビットのSIMD浮動小数演算みたいなことやってるAMDからすれば
目新しいことかも知れんが。
634Socket774:2006/07/26(水) 18:35:31 ID:nWG8+T9l
>>623
今のGPUクロックがなかなか上がらないのはASICプロセスだから


まさかわざわざカスタムとASICを共存させるなんてしないだろうから
いずれ CPU+GPU オンダイまでいけば同一プロセスだろうけど
635孟宗:2006/07/26(水) 18:48:18 ID:T9yBVSRD
IsaiahのSSEは128bitに成ります。
FPUはSSEと兼用。
単精度演算なら同時に4つ、倍精度演算なら2つを実施可能。
加乗算の高速化や除算/平方根を非同期で行えるようにする。

何時出るんだろう・・・

ちなみに、IsaiahでようやくOut-of-OrderとSuperScalarが実装される。
(現行のIntel,AMDのアーキテクチャに近づく。)
636Socket774:2006/07/26(水) 20:33:00 ID:pB8V7zkd
ttp://pc.watch.impress.co.jp/docs/2006/0609/comp09.htm

この辺読むとATiのGPUで物理演算できるみたいだから、CPU+GPUが実現されれば、
PhysXの死亡は確定かな。

それにしても
ttp://pc.watch.impress.co.jp/docs/2006/0606/comp02.htm
つい6月にIntelの基調講演内でデモった技術が7月にはAMDの物というのは何ともはや。
637Socket774:2006/07/26(水) 20:39:10 ID:zdimMP/2
>>636
PhysXは既にMSが公式にサポートしてる。

AMD+ATIはまだこれから。どっちかというと
AEGIAにSDKを出してもらうかも知れない立場。Cellもそうだし。
638Socket774:2006/07/27(木) 10:38:20 ID:u/dohkiE
>>633
AMDのSSEユニットは3Dnow!も請け負っていたから、FPUまでは手が回らなかっ
たのジャマイカ。

でもそのお陰で専用FPUが残ったからなのか、確か現行品での浮動小数点演算
能力は、IntelよりもAMDの方が高かったと思うが。

まあIntelがSSEメインでFPU性能を重視してなかったせいかもしれんが、AMD
ならFPU性能での優位を保ちたいだろうから、上手くGPUにFPU機能を作りこむ
のを期待したい。
639Socket774:2006/07/27(木) 14:43:11 ID:dep9KEkp
NetBurstのFPUはクロックの半速動作の128bit SIMDユニットで処理してて
x87やSSE*スカラ演算は半分しか使えない仕様だった。

いっぽうAMDは等速で64bit幅。
x87を使う古いコードだけは、浮動小数ユニットの実クロックぶんだけ
AMDのほうが速かったが、128ビットフルに使うSIMDでは、AMDは2分割して
通すことになるので、Intelが圧倒的に優位。

Coreでは128ビット・等速になってるので、お得意だったx87やSSE*の
スカラ演算性能すら同クロックで同等、SIMDならダブルスコアだ。
x64ではx87よりSSE*を積極活用することになるので、64ビット構成では
圧倒的に不利だな。
K8LではCore2を追従することは確定のようだが。

>>638
んで、どういうパイプライン構成にしたいのか図示してみろよ。
ユニットだけ増やしても命令供給が追いつかなきゃゴミ同然だぜ。
640Socket774:2006/07/27(木) 15:03:06 ID:2EmA+Ny/
PCの世界でオンチップメモリは有りえるのかね
HPCの人たちはプロセスが進んだらスクラッチパッドもしくはオンチップメモリを
どんどん増やせって言ってるけど
641Socket774:2006/07/27(木) 15:04:19 ID:2EmA+Ny/
追加 1000個とか同時につかうのを前提らしいけど
642Socket774:2006/07/27(木) 15:11:44 ID:sWqkoSTT
>>639
> AMDは2分割して 通すことになるので、Intelが圧倒的に優位。
等速64bitと半速128bitなら互角じゃん。
ついでに、ネトバは64bit半速*2だ。
むしろレイテンシなどでAMD有利だが、
クロックが上だからネトバの勝ち。

643Socket774:2006/07/27(木) 15:13:29 ID:qVC6x8zq
つまりK8Lでは再びぶっちぎりというわけですね?
644Socket774:2006/07/27(木) 15:45:47 ID:wC71RWv0
ここで勝利宣言するか
645Socket774:2006/07/27(木) 15:52:44 ID:gV+mHkaq
2008年に出てきてから、ごめんなさいするのねw
646Socket774:2006/07/27(木) 16:22:25 ID:dep9KEkp
>>642
> むしろレイテンシなどでAMD有利だが、

間違い。実際は分割することで依存関係チェインが出来て効率悪化している。
リビジョンが上がって改善されてきたが、根本的な解決手段は128ビット化(K8L)なわけだ。

クロック数ぶんNetBurst優位というのは正しい。
クロックを伸ばしていければx87やSSEスカラ浮動小数も同等以上に
持っていくつもりだったんだろう。
647Socket774:2006/07/27(木) 16:35:20 ID:sWqkoSTT
>>646
分割したら依存関係は緩くなるよ。
(これはネトバも同じこと)
実際、128bit化したCore2では
シャッフルなどが遅くなっている。
64bitの方か小回りが効いていいのだ。
128bit化はパワーを増強するだけ。

まあ、内部命令数が増えるから
デコード・スケジュール・リタイヤなどの
負荷は高くなるけどね。
648Socket774:2006/07/27(木) 19:37:00 ID:u/dohkiE
>>639
という事は、未だにSSEによる浮動小数点演算は活用されてないって事でファ?

いくらOSがx64になっても、アプリの方がx64になるのは少し後だし、まして
や今まで動作してた浮動小数点演算処理を、SSEで書き直すのはそのコストを
吸収出来るくらいの性能差が必要だが、そこまでの差は無さそうな気がするが。
649Socket774:2006/07/27(木) 19:43:41 ID:u/dohkiE
>>648 補足

Itanium の失速状態を見れば、ソースを書き換えて迄対応するのを、世の中の
ユーザーがどれだけ嫌がってるかの証左だと思ってる事が、先の意見の前提。
650Socket774:2006/07/27(木) 23:48:47 ID:LIc5vlwU
シンプルなコード書いて最適化はコンパイラに任せろ
651Socket774:2006/07/28(金) 01:37:27 ID:ozwsBC/g
>>639
昔から偶に見かけるが、NetBurstのFPUはクロックの半速動作って何?
652Socket774:2006/07/28(金) 01:39:25 ID:zUjJered
そのままの意味。

3.6GHz動作ならSIMDユニットは1.8GHz動作なわけ。
ALUが熱すぎるからSIMDだけでも半速で動かさないとつらい訳よ。
653Socket774:2006/07/28(金) 02:01:08 ID:yhU3OdA4
P4のSIMDは半速だが、FPUもそう?
FPUの加算はスループット1だよ。
654Socket774:2006/07/28(金) 02:06:56 ID:NQJemIm6
ALUは倍速なのは知ってたが、FPUは半速だったのか。
へぇ。
655Socket774:2006/07/28(金) 02:14:07 ID:edV8YEZu
またこの話題か
プレスコットのFP演算のレイテンシが奇数だから等速だろ
656Socket774:2006/07/28(金) 02:15:45 ID:zUjJered
上と下が半分ずつ交互に動けば1になるだろう
FPmulは下半分だけしか入らないみたいだが。
657Socket774:2006/07/28(金) 09:19:43 ID:+kImqww9
>>622
intel向けのチップセットは儲かるよ
数が違うよね
658Socket774:2006/07/28(金) 14:47:15 ID:9uBYSOcQ
>>650
それで済むならx64はイランわな。IA64のItaniumが64bit市場を制覇してた筈。
659Socket774:2006/07/28(金) 15:34:20 ID:jP5xkCOJ
OSがCPUに合わせて最適化すればいい。
660Socket774:2006/07/28(金) 16:29:17 ID:q3HWhpTA
人間がコンピュータに合わせて最適化すればいい。
661Socket774:2006/07/28(金) 17:57:08 ID:74gujWWt
662Socket774:2006/07/29(土) 01:41:48 ID:uPVu09FB
>>657
儲かんねーよ。
Centrinoといい、今のプラットフォーム構想といい、他社締め出しの意図丸出しに加えて
チップセットの増産体制が本格化したら、intelより圧倒的に安くない限り誰も使わん。
ディスカウント合戦になってintelに勝てるはずもないしな。

何かの間違いでたまたま売れたとしても、売り上げに比例してバスライセンス料をintelに
持ってかれるだけでintelが儲かるだけの話だ。

AMDの方はバスライセンス料も取らんし、チップセット作ってないからCPUが増産されれば
各社のチップセットも必然的に需要が増えるからな。

優遇税制で企業誘致してる土地と、やくざにみかじめ料取られる土地で、どっちが商売しやすいか
なんて考えるまでもない。
663Socket774:2006/07/29(土) 09:40:24 ID:ru/fqbVv
でも数(マーケット規模)が違う…
664Socket774:2006/07/29(土) 10:21:00 ID:RxVtbZHm
優遇税制で企業誘致してる富山の土地
やくざにみかじめ料取られる東京の土地
665Socket774:2006/07/29(土) 12:59:49 ID:0bXajKAE
座布団一枚!
666Socket774:2006/07/29(土) 17:50:24 ID:d6zENwGH
AMD向けチップセットの純利益と、
バスライセンス料を引いたintel向けチップセットの純利益は
一体どちらが多いのですかね?
667Socket774:2006/07/29(土) 19:04:38 ID:Ncr7pFry
中の人しかわからないんジャマイカ
668Socket774:2006/07/29(土) 19:15:49 ID:k9t9u01s
でもIntelのIGPが悲惨だったからノートで結構出てたっしょ >RadeonExpress
しかもどちらかと言うとミドルレンジ辺りで。965Gが伝統通り悲惨だったらメーカーは板挟みだなw
669Socket774:2006/07/30(日) 03:56:35 ID:tUr2ePpt
ノート向けのchipsetは今年いっぱいくらいは945のまま
だから、intelはVistaPremiumを945でも動くってことにしくれ、と駄々をこねざるをえなかった
670Socket774:2006/07/31(月) 13:07:40 ID:fdl9W1cS
>>663
数と言っても、intel系で10%程度のシェアとAMD系で50%のシェアなら大差ない。

965からは90nmだそうだが、こうなるといよいよサードパーティじゃ勝負にならん。
CPUでは既に前世代のプロセスだが、チップセットで90nmなんて他社には無理。

intelバスは使い回し効かんが、HyperTransportはCPU以外との接続でも自由に使えるし、
メモリコントローラはCPU統合だから、ダイサイズ抑えられて検証の手間も減るし、
実績さえ積めばサーバー向けにも食い込める可能性があるしな。

二社択一なんてアホなこと言い出すとも思えんから、一応、保険程度にintel向けも
作るだろうが、基本はAMD向け中心になるだろうな。>サードパーティ
671Socket774:2006/07/31(月) 15:58:24 ID:fnlZatYP
IntelはNorthが90nmでSouthが130nm。
VIAも次の9xx世代は90nmか80nmに移るらしい。
SiSは今年110nmで、来年80nmとか。
TSMCかUMCがあるからプロセス自体は提供されてるしな。
問題はどっちも予定が当てにならんことだが。
672Socket774:2006/08/01(火) 18:36:14 ID:1KNlGoZ9
Geforce6100/6150が既に90nmじゃなかった? まぁintel向けじゃないけどね。
あとサウスは電圧の関係で微細化は厳しい悪寒。チップセットにPCI MAC、後付で PCI PHY とかしないと
673Socket774:2006/08/01(火) 19:15:56 ID:Xsp//JxI
>>672
ノースだってAGPで3.3Vや1.5Vを、メモリもDDRで2.5V、DDR2で1.8Vを使ってるが。

まあPCIはレガシーになっていくから、確かに昔のISAみたいにアダプタICは必要
かもしれんが、それはノースやGPUがVideo出力するのと同じと考えれば済むかも。
674Socket774:2006/08/01(火) 20:14:16 ID:1KNlGoZ9
>>673
PCI-Express(0.8V)やDDR2(1.5〜1.8V)、SATA(0.5V)と比べると IDEとPCI の5Vは別次元っしょ。
それにAGPの時はまだ130nmとか180nmだったんだし。
675Socket774:2006/08/01(火) 20:59:55 ID:akiJFGA3
chipsetが大電流をその電圧で供給するわけじゃなし。
intelのICH8もPATAはなくしたが、PCIは残ってるな。
いよいよでも信号はレベルコンバータででもすむだろうし、PCIe接続とかで外に出されてもそんな問題でもないだろう。
676Socket774:2006/08/01(火) 22:09:33 ID:xaQ6BQIa
90nmだと3.3Vを作るのはかなり難しいってばっちゃが言ってた。
677Socket774:2006/08/01(火) 22:51:14 ID:xaQ6BQIa
ttp://www.dailytech.com/article.aspx?newsid=3595
何に使うかわからんけどCellAccelerator
Torrenzaにも使えんかな
678Socket774:2006/08/02(水) 07:33:34 ID:gGqm0jTU
>>670
それならAMD向けは価格下げて欲しいよ
チップセットとマザボは価格が直結するとは思わないけど。

もしかしてIntel向けで10%シェア取る方が
AMD向けで50%シェア取るより簡単なんじゃない
679Socket774:2006/08/02(水) 10:29:25 ID:RCa2hpLF
サードパーティーはみんなその考えでIntel向けに参入してるでしょ。
でも結局はIntelが強すぎる、と。
680Socket774:2006/08/02(水) 15:46:00 ID:ZUHpfeua
インテルが強すぎるというか、バスライセンスの問題でしょ。
インテル自身で作るにはライセンス料いらないから安くできたりする
しかし他社が作ろうとすると、そのコストがかかってしまい儲からない。

ATiがいいチプセト作ってくれればいいが、過去の例から全然だめだし
nVIDIAはダメダメ、かつ今後は協力してくれるかすらわからない。
681Socket774:2006/08/02(水) 22:06:30 ID:WPr3kYOR
INTEL向けで成功するのはエントリー向けの
安いチップセットのみ
利益の多いメインストリーム〜ハイエンドの領域は
ほぼ100%といってもいいほどINTELチップで
埋め尽くされてるしな(´・ω・`)
682Socket774:2006/08/02(水) 23:27:17 ID:KCxuMpvO
intelの場合、他社と同じ130nmや90nmでも既に1・2世代前のプロセスだからな・・・
償却の進行度が全然違うからコスト競争になったらまず勝てん。
683Socket774:2006/08/03(木) 00:59:29 ID:ebScuwd1
しかも半分以上のFabは300mmウェハだった気が…

そう言えば、intelはRambusのバスライセンスは解決してんだっけ?
684Socket774:2006/08/03(木) 01:08:49 ID:Deg5LWrb
>>681
つ[鯖ワクス]
685Socket774:2006/08/03(木) 01:55:01 ID:MSMoB39Y
http://journal.mycom.co.jp/special/2006/conroe/

Conroeベンチなのだが、前半のそれぞれのCPUの基本的性能分析のところを見ると
K8の素性が良いとの評価だ
ダンゴがK8の次のコアでL1の帯域増えるって言っていたが、その通りなら、
32bitで同等くらい、64bitでは大幅にぶち抜くってのはあり得そうだな
686Socket774:2006/08/03(木) 02:01:36 ID:s2VAKg98
大幅に、とはいかないかもしれないが逆転はできるだろうね
687Socket774:2006/08/03(木) 02:43:46 ID:yH/p8HFd
ttp://pc.watch.impress.co.jp/docs/2006/0703/kaigai286.htm
を見ると分かるがHoundでは128bit×2
デコード、SSE性能も追いつくならあとはキャッシュ次第かねえ。
64byte維持でレイテンシが増えたりしなきゃ行けるかな。
688Socket774:2006/08/03(木) 03:10:26 ID:MSMoB39Y
そこにある図を見て、L1はデータキャッシュだけ帯域増えるのかと思っていたよ
命令キャッシュも当然帯域増えると思うべきなのかな
689Socket774:2006/08/03(木) 03:17:52 ID:evLOZm6c
K8のデコード部の素性が良いのは単にプレデコードキャッシュの恩恵でしかない。
K8は排他キャッシュ構造なのでL1命令キャッシュをプレデコードキャッシュにするのは容易い特徴を有している。
しかし良い面ばかりでもないことを意識しておく必要もある。

>>685
性能劣化がなく帯域を倍増することが可能かは非常にあやしい。
実際に出来てみないと評価できないな。
690Socket774:2006/08/03(木) 05:35:14 ID:fr7TuDp8
>>684
ServerWorksは既にIntel向けから撤退して久しい。DDR2対応チップすらない。
691Socket774:2006/08/03(木) 09:30:07 ID:KStT+H9y
もしHoundで逆転してもすぐ後にNehalemの恐怖が…
逆転しない場合がそれ以上の恐怖なのがツラスorz
692Socket774:2006/08/03(木) 09:38:41 ID:SB0kzUS8
2007年にK8Lで2008年にもNewCoreあるよ。
693Socket774:2006/08/03(木) 13:09:06 ID:SgTKG3lb
2008年は”core update”だった希ガス。
2008年中盤に45nmに移行予定として、どこで”core update”するんだろう?
あと、”Direct Connect Architecture 2.0”で、もう一度Intelを突き放すと
どこかのインタビューで言っていたけど、DCA2.0ってコプロ+北橋をCPUに統合?
694Socket774:2006/08/03(木) 13:26:50 ID:yH/p8HFd
2008年のNewCoreはモバイルじゃね。
Hound系が降りてくると思う。
695Socket774:2006/08/03(木) 17:26:36 ID:nem/q8Cq
2008年のモバイルは

Intel Core3 VS AMD モバイルコア(K8)
というわけだな
696Socket774:2006/08/03(木) 18:30:29 ID:61/reCaN
FTC、米Rambusに独禁法違反の裁定
ttp://enterprise.watch.impress.co.jp/cda/foreign/2006/08/03/8386.html

やっと鉄槌が下されたか。これで少しはCPUやPCの性能ウプがし易くなるな。
Core2ってSSEのユニットはいっぱいあるんだけど、ある程度のところまでいくと
命令フェッチ帯域が足引っ張って、性能頭打ちなのよね。
Core2のSIMD整数に比べて浮動小数が比較的伸びてないのは、浮動小数のほうがレイテンシが長く
ロード・ストアの依存度が高いからだと分析する。
で、アドレッシングつき命令で8バイトくらい使っちゃうから今度は帯域がネックになる。
もちろん既存アーキテクチャでは平均的に圧倒的な性能を発揮するんだけど、
一部の命令のスループットはNetBurstを下回るわけで、やっぱり改善して欲しいよね。

トレースキャッシュっていうのも解決手段のひとつではあるとは思うんだけど、今度は汎用命令
(相当のμOPs)の格納効率が落ちる。

フェッチが32byte/clockあればSSEもたいがいの64bit命令も、3命令コンスタントに取り込める。
SSE厨としては、初の128bit SIMDユニット搭載のK8Lに期待するところはある。


現行アーキテクチャで32byteのフェッチ帯域といえばItanium2がそうでしょう。
まぁ固定長LIWだけど。
698Socket774:2006/08/04(金) 00:06:00 ID:Ant6dnwB
699Socket774:2006/08/05(土) 14:15:26 ID:WL5yxwH3
>>696
今まで誰がもうけてきたんだろうねぇ。(w
700Socket774:2006/08/05(土) 23:26:38 ID:pI3xfvk6
>>697
Core2に限らず、浮動小数演算ってレイテンシが長く成るでしょ
あと32byteのフェッチ帯域って、PPCとかSPARCとかのRISCチップに無かったっけ?
701Socket774:2006/08/06(日) 00:59:57 ID:msh6ufRA
RMMAの測定結果がおもしろかったので、754pinのAthlon3400+でも同じか確かめてみたんだけど、
大原記事にある命令以外でも大抵同じ傾向がでたんだけど、
2byte命令のMOV,ADD,ORだとほぼ2byte/cycle、LEAだと1byte/cycleくらいしかでなかった
これは命令の性質上こんなもんなの?
>>700
いずれも固定長4byteですな。PPC G5で4issueだから16byte程度でしょう。

VLIW系は
Itanium 2 ・・・16byte×2(3*2issue相当)
Efficeon ・・・32byte×1(8issue相当)
703Socket774:2006/08/07(月) 00:08:04 ID:46wZjQ1C
http://www.geocities.jp/andosprocinfo/wadai06/20060805.htm

>各種ベンチマークでCore 2 DuoがOpteronに勝っている主因は,キャッシュを含めたデータアクセス性能が高い点

これが当たりなら、今後のAMDの方向性は大正解ということになるな。
704Socket774:2006/08/08(火) 11:48:22 ID:acfMu0pZ
705Socket774:2006/08/08(火) 20:08:34 ID:OtVp4y9W
Z-RAMで鬼の様なL3積んでくれないかな。コア4つでL1-64k+64k L2-512k L3-128Mとか。
706Socket774:2006/08/08(火) 21:20:37 ID:un4LtSlE
せいぜい32MBくらいが限界だと思う
707Socket774:2006/08/09(水) 00:35:31 ID:eQxn/h05
チートCPUは焜炉でした。。。。
http://pc7.2ch.net/test/read.cgi/jisaku/1154290759/

K8は非常に優等生で、何をやってもそつなくこなす印象で、
対してCoreは特定の処理に特化してチューニングをしている
雰囲気が見受けられる。

http://journal.mycom.co.jp/special/2006/conroe/006.html
708Socket774:2006/08/09(水) 01:04:55 ID:mplb45hS
リンク先見たがコンローが特別負けているようには見えないな。
K8がマイナーチェンジすればまだまだ戦えることはわかった。
709Socket774:2006/08/09(水) 18:35:45 ID:OLlKRw7A
>>707
そんなこと言われてもなぁ、サクラエディタ64bitとメモリ帯域を除く殆どのベンチ結果で
ConroeはAMDのCPUを圧倒してるしなぁ。
710Socket774:2006/08/10(木) 01:10:58 ID:BJvXf9DF
L1 Hitの範囲でK8とCoreは同等。
L1 Miss / L2 Hitの範囲ではCoreのLatencyの方が少ない。
L1 Miss / L2 Missの範囲に成ると、メモコン内蔵したK8の方がLatencyが少ない。
って事でしょ
711Socket774:2006/08/10(木) 01:15:43 ID:R0NF0tOi
L1も帯域が全く違う。(ConroeはK8の倍だ)
L1からの読み込み待ちでConroeはK8の二倍の性能。
キャッシュミスを前提に考えるようなソフトは元々から低速だ。
712Socket774:2006/08/10(木) 01:18:53 ID:RtgFu70j
あーあ、言っちゃった…
713Socket774:2006/08/10(木) 01:41:20 ID:J2OsefF9
だからメモリ帯域とか、分岐予測とか、そういう内部機構で対決させても意味ないよ。
結果だけが全て。

あと大原は凄い仕事したと思う、どこぞの天皇メモ報道並みに。
これでミスリードだろうとなんだろうと、k8はまだまだいける、という希望的観測をAMD信者に見出させ
Houndに繋がるまでの心の拠り所を作った。
714Socket774:2006/08/10(木) 01:56:27 ID:CKzQkl2/
流石は大原雄介だ!魔術師の二つ名は伊達じゃなかった!
715Socket774:2006/08/10(木) 02:08:41 ID:R0NF0tOi
K8Lの妄想

確かに、L1の帯域を倍に上げますと公表している。
しかも、デュアルアクセスも可能にすると公表している。
これだけを見せられると一般人や信者は凄いと思ってしまう。

しかし、これには大きな落とし穴がある可能性が高い。
それと引き替えに、レイテンシの悪化が想定されてしまうからだ、AMDはそのことには決して触れない。
しかし、よくよく考えてみればL1やL2の性能はそう簡単には上がらない。
性能が簡単に上げられるのならL1はもっと巨大で、もっと性能が良いものになっている。
それでなくてもAMDのL1はIntelの倍の容量があり、性能を高めるのは容易ではない。
大原はそんなこと承知の筈であり自身に都合の良いところだを都合良くまとめたに過ぎない。
しかし、uOPsはどのようになっているか不明であると言いながらだ。
結論として、何一つまともには聞こえてこない。
716Socket774:2006/08/10(木) 02:17:17 ID:tuNJVDIg
>>715
AMDのパターンを考えてみると、レイテンシは極力押さえつつ帯域アップを目指して
……製品化が遅れるとかな。
>>715の後半は壮大な詭弁だな。こういうのがいるからアンチ編む厨は馬鹿にされるんだよ。
K8のL1はAssosiativityを2Way(PenM/Coreは4Way)に落としてPenMの2倍の容量を得てるだけで
別に無理でもなんでもない。
ロード帯域は単に信号線を倍にすればいいだけ。
PenM→CoreでL1ロード帯域は倍増してるがレイテンシやAssosiativityは一切犠牲にしてない。
プロセス微細化が問題を解決してもなんら不思議はない。
レイテンシの増加とかアホさらせ。

Associativity

ごめんね慣れない英単語使って
719Socket774:2006/08/10(木) 02:40:44 ID:CKzQkl2/
まあ一般論としてはどれも間違ってないけど、L1でレイテンシ増は考え難い罠。
>しかし、uOPsはどのようになっているか不明
とりあえず>>715はさり気に良い事言ったNE。
720Socket774:2006/08/10(木) 02:46:56 ID:R0NF0tOi
>>71
Assosiativityを2Wayに落としても容量が増えるわけねぇよw
721Socket774:2006/08/10(木) 02:50:31 ID:R0NF0tOi
ちなみにWay数で大きくレイテンシが変化するのは16Wayを越えるような場合であり、2Way〜8Wayなら殆ど関係なし。
実容量が増えると、実装容積が増えることでレイテンシに影響する。
更に、信号線を増やせばと言っているがそんな単純なものじゃねぇよ。
探索の深度が減らせるので、Latency=3の範囲で実装できるメモリ容量は増えるよな。
4Wayと2Wayじゃえらい違いですぜ。

しかも、キャッシュラインをまたぐとペナルティが大きいから、「16バイトアドレス境界を跨がない」
という制約が加わってる。
帯域が増えるとロードレイテンシが増加する理由さっさと言えよ。説得力がまるでないぞ。


[雑音にはわからないかもしれない課題]
Pentium 4のL2のレイテンシが異常に大きかった理由を説明せよ
ヒント:キャッシュライン
723Socket774:2006/08/10(木) 03:15:33 ID:R0NF0tOi
>>722
Way対応計算は2Way〜8Wayなら殆どかわらねぇよ。
お前、頭おかしいの?
はいはい、だったらなぜCore 2 Duoは8Wayにしないのですか?

一度に読み書きする(キャッシュラインを跨がない)データ幅が増えるとレイテンシが増えるという
トンデモ理論の説明が出来ない以上、何を言っても説得力がありません。
725Socket774:2006/08/10(木) 03:37:02 ID:R0NF0tOi
>>724
ConroeのL1は命令・データ共に8Wayだが、
それがどうかしたのか?
たしかに8Wayだな。読んでなかった。
しかし、電子の移動度が上がらないと無理な改良ですわ。
2Wayと8Wayなら余計に探索のレイテンシの差がつく罠。

AMDが65nm化でロード・ストア帯域を増やすとレイテンシが増える
それは、自分が嫌いなAMDだからそうあって欲しいっていう無根拠な希望的観測じゃないのかな?
727Socket774:2006/08/10(木) 03:51:06 ID:R0NF0tOi
> 一度に読み書きする(キャッシュラインを跨がない)データ幅が増えるとレイテンシが増えるという
> トンデモ理論の説明が出来ない以上、何を言っても説得力がありません。
この馬鹿げた発言にはどう答えたらいいのだ?

キャッシュライン長を好きなだけ大きくすると、キャッシュラインは跨がないからレイテンシは増えないのでお得ですとでも言いたいのか?
L1のような超高速なキャッシュになるとライン長の大きさすら速度に影響することを理解してくれ。
どこをどう読み間違えればそうなる
キャッシュライン長を増やすなんて言ってないだろ。お前マジ池沼だわ。

32Byteの1キャッシュライン上のデータの読み書きをbyteずつをalignedな16byteずつにすると
どうしてレイテンシが増えるのかさっさと説明しろよオイ

ちなみにキャッシュラインサイズが増えるとL/Sのレイテンシが増えるのはL1じゃなくてL2だよ。
Northwoodは64byteキャッシュでレイテンシ2だった。
もうわかるだろ、>>722にもさっさと答えてくれ、雑音先生
8byteずつをalignedな16byteずつにすると
730Socket774:2006/08/10(木) 04:03:26 ID:R0NF0tOi
誰が雑音先生なのだ?
お前か?
帯域を増やすのもそう簡単なことじゃねぇよ。
65nmになってもそれはちっとも変わらねぇし、変えようとすれば搭載するトランジスタ性能をどれだけ高性能化出来るかなんだよ。
ちったぁ勉強してから発言しろな。
64byteキャッシュライン構成でL1-L2間の帯域がたとえば上り下り各8byteなら
L2から1キャッシュラインをロードするのに、32byteキャッシュラインのそれより、
4クロックは多めにかかる(単純計算で)

それがキャッシュラインサイズを大きくすることによるレイテンシの増加だよ。
もともと高クロックを狙った設計だから、1クロックあたりの移動度の問題もあるけどね。

ID:R0NF0tOiは雑音先生の主張と全く同じだしwww

> もともと高クロックを狙った設計だから、1クロックあたりの移動度の問題もあるけどね。
これはNetBurstの話。
733Socket774:2006/08/10(木) 04:12:11 ID:R0NF0tOi
> もともと高クロックを狙った設計だから、1クロックあたりの移動度の問題もあるけどね。
やっとまともなことが言えたじゃねぇかw
てめぇは時間かかりすぎなんだよ、呆けがぁ。
結局のとこだが、回路をリッチにすることに新トランジスタの性能を使っちまうと、今度はクロックが上げれねぇ。
そんなこんなでAMDの発表は非常に煙たいんだよ。
出て見なけりゃ全く評価出来ない内容となっているってことさ。
今からそんなに期待するのはどうかと思うぞ。

> そんなこんなでAMDの発表は非常に煙たいんだよ。


「そんなこんな」と前の文章との繋がりが不明。
煙たいと思うのはてめぇの主観であって客観性がない罠。
IBMの65nm SOIは非常に優秀だという話を聞きますが。
735Socket774:2006/08/10(木) 04:18:38 ID:XYYTEHCo
団子いじるなよ、時間の無駄だぞ
ヲタとは基礎知識に差がありすぎるからいじりがいもねえし
都合が悪くなりゃあ「俺消費者だし」で逃げるぞw
736Socket774:2006/08/10(木) 04:24:44 ID:R0NF0tOi
>>734
IBMの名前さえ出せば納得してくれるとでも思っているのか?
相手はIntelですよ、全世界で最も優れた設備と研究機関とシリコン技術を有しているIntelな。
一度顔を洗って出直してこいよ、ぼうや。

>>735
そうかもな、だんだんムダだと言うことが分かってきたよ。
737Socket774:2006/08/10(木) 07:58:55 ID:0fv2cJFE
雑音がしょっちゅう使う言葉"トランジスタ性能"。
でもそれが具体的に何を指しているのかは不明。

まあ電流量でも見たかったらMyCOMのレポートでも見てこい、と。
738Socket774:2006/08/10(木) 08:11:48 ID:nso2eY5i
>>736
話と関係ないけど、AMDのSOIはIBMのものなんだが
739Socket774:2006/08/10(木) 08:58:11 ID:ZHXxC0zo
64bit→128bit化は単純にアクセス幅の問題だから増やしたからといってレイテンシには直接
影響しないはずだがな。
元々パラレルバスの有利な点はそこなんだし。

バス幅拡大で難易度が上がるのは等長配線だな。
ただそれもK8Lが65nmからってことだと、元のままの回路での光学シュリンクなら単純にバス配線長は
ほぼ2/3でレイテンシ面では余裕が出来るから、それで相殺されてレイテンシは維持できるだろ。

Prescottみたいにキャッシュ容量倍増だと、単純に配線長も倍になるからレイテンシは増えるがな。
740Socket774:2006/08/10(木) 09:24:01 ID:wGljKYud
レイテンシが増えることにしないと
AMDが失敗することにしないと
気が収まらないのです。

ただレイテンシって言いたいだけちゃうんかと。

感情ありきで、何を語らせてもIntelは素晴らしい、AMDは糞としか言えない。
まともに技術論を語らせるだけ無駄。

AMDのL1キャッシュにおける32Bキャッシュラインの2ウェイセットアソシエイティブで
64KB+64KBという構成は、初代K7(0.25μm)の時点で既に実現してきたもの。
(K6は32KB+32KB)
むしろその間に、IntelはPentium III→Pentium Mで容量2倍、Core 2で8ウェイ化。
K8のキャッシュ構成に無理があると言うなら、Intelのほうがだいぶ無理してることになる。

逆に言うと、L1キャッシュ自体の性能強化は行えると思うがな。
レイテンシを2にしたり容量を倍増するのは苦しいかもしれんが、4ウェイ化くらいは
やれるかもしれんわな。
741Socket774:2006/08/10(木) 14:48:07 ID:h7aJaf/o
遅れるのはあるだろうな。
そしてそうなったら、確実にAMDオワタ\(^o^)/
742Socket774:2006/08/10(木) 15:16:54 ID:xBvw5gUW
はやく光子を使うCPUを作って欲しい。
電子使うなら発熱に頭を悩ませることになるんだ。
743Socket774:2006/08/10(木) 16:05:26 ID:h7aJaf/o
はやく重力子を使うCPUを作って欲しい。
光子使うなら距離差に頭を悩ませることになるんだ。
744Socket774:2006/08/10(木) 18:35:43 ID:mN3o4V6d
重力子でも光速は超えないのでは?
745Socket774:2006/08/10(木) 21:06:54 ID:CmuXWZ5B
量子コンピューターまだぁ?www
746Socket774:2006/08/11(金) 00:27:42 ID:PUlWCkmC
空間を捻じ曲げて距離をなくすのでは?
747Socket774:2006/08/11(金) 05:53:17 ID:c6YWWcWK
ワームホール使ったほうが速くね〜?
748Socket774:2006/08/11(金) 15:38:16 ID:lhYSwGgc
>>736
そのインテルが90nmのリーク電流で大失敗したのは、記憶に新しい話だが。

あれが地球温暖化を悪化させた影響は、無視出来ないくらい大きいと思う。
749Socket774:2006/08/11(金) 16:03:47 ID:4/vHQrRS
そして今度はAMDの方がヤヴァイ立場に置かれてしまっているという現実…
orz

本当に残念だが、時代が変わってしまった。
K8Lで逆転したら、昔話で馬鹿にするなんてことしなくてもすむのかな。

それはそうと、例の対決、誰か見てきてくれよ。
750Socket774:2006/08/11(金) 17:19:05 ID:8vxTgi4M
つーかエロなんて本能なんだから規制するようなもんじゃねえだろ
幼稚園児にAVどんどん見せてやれ
751Socket774:2006/08/11(金) 17:35:46 ID:edvR+Ra+
排他キャッシュというのはメモリーからロードした時にL2を経由せずにL1に収め、
L1からパージされたらL2に収めるという動作になり、L1のパージ時の処理が
複雑な感じ。L2を共有にしようとしたら必然的に排他に出来ない感じだが?
752Socket774:2006/08/11(金) 17:39:00 ID:TIX7pmDU
んで、ノートとデスクトップでマイクロアーキの設計が分断されるわけか。
753Socket774:2006/08/11(金) 17:47:36 ID:lhYSwGgc
>>750
幼稚園児はちゃんとパパママのプロレスごっこをシッカリ見てるからオケ。

って、スレ違いカキコだな。

>>752
デスノートでマイコの身体が分断?
754Socket774:2006/08/11(金) 20:45:00 ID:tPXpc0+V
やっぱ将来的にはコアが増えるだけか?
シングルスレッドが格段に早くなる奴だしてほしいんすけど
755Socket774:2006/08/11(金) 20:58:11 ID:wuYdJEis
スレッドを大量に吐くOSやアプリを希望してはどうか
756Socket774:2006/08/11(金) 22:27:56 ID:jIhY4cGJ
>754
あと60年くらい待っててくれ

革命的に速いのを用意してやるから
757Socket774:2006/08/12(土) 00:20:29 ID:U2qJzMYU
キャッシュとメモリ性能を上げればよいという結論はスルーか?
758Socket774:2006/08/12(土) 01:47:20 ID:1i+21Tyn
でもItaniumやPPCはそこまで速くないし…
スレッドを大量に吐くOSやアプリを希望してはどうか
759Socket774:2006/08/12(土) 09:33:42 ID:YLoPM6VT
>>758
2001年のデュアルコアからやっとコアが増えた、クアッドコアPOWER5+はどうなん?
760Socket774:2006/08/12(土) 13:03:42 ID:4TRoygeJ
>>746
縮地法か
761Socket774:2006/08/12(土) 15:48:43 ID:zZ09OmIh
つーか、AMDオワタとか言ってるヤツって、AMDに潰れてほしいのか?
もしAMDが潰れてしまったら、競争がなくなって大変なことになるんじゃないのか?

C2DだってAMDに性能でリードされてなかったら、出さなかっただろうし。
762Socket774:2006/08/12(土) 16:03:59 ID:6ZF9uHgo
本当に潰れそうになったら IBM が拾ってくれないかな
763Socket774:2006/08/12(土) 16:52:38 ID:PC2OxgFw
AMDオワタとか言ってるヤツってキチガイとネタだろ?
764Socket774:2006/08/12(土) 20:54:03 ID:zVhkPISW
AMDオワタとか言ってるやつが大抵人生オワッテルからなぁ^^;
765Socket774:2006/08/14(月) 00:27:22 ID:kxm9idYe
>>764
intelの社員は勝ち組だけどね
766Socket774:2006/08/14(月) 02:17:00 ID:u0m2a3RB
リストラ部署の人はそうでもないようです。
767Socket774:2006/08/14(月) 07:09:10 ID:OGwmtOk6
社員の平均所得はAMDの方が上だった希ガス・・・
768Socket774:2006/08/14(月) 08:07:04 ID:CxLnRZX6
Intelのほうが工場とその作業員が多いからな
研究開発要員は会社が大きいからとはいえ、一定数で事足りる

逆にAMDは研究開発要員を会社規模の割には多く抱えなきゃIntelに対抗できんからな。
769Socket774:2006/08/14(月) 10:36:24 ID:my+daHSO
まさにAMDは少数精鋭のエリート集団
770Socket774:2006/08/14(月) 10:41:08 ID:28m7ys4k
>>769
で、キミは高卒?中卒?
771Socket774:2006/08/14(月) 10:56:36 ID:e2s3WpW0
まあ、そう煽るな。
772Socket774:2006/08/14(月) 21:26:08 ID:gwQnIor6
5分で反応するなんて凄いな
773Socket774:2006/08/14(月) 21:50:48 ID:/5IHfuMX
>>770
きもいなおまえ・・・
774Socket774:2006/08/14(月) 22:20:19 ID:pIucJwz4
簡単なこと
FlashRAM混載してVLIW型CPUにしてしまえばいいんですよ。
クルーソー型の動的最適化掛かるやつを
775Socket774:2006/08/14(月) 23:33:36 ID:7NuvlfWr
煽る奴はバカ
776Socket774:2006/08/15(火) 00:01:41 ID:YMDBBu1k
VLIWはISAの問題なのに、なんでそれが出てくる。
確かに複雑なx86のデコーダの問題とはオサラバできるけど
それはもはやx86CPUとはいえない代物だ
777Socket774:2006/08/15(火) 12:41:41 ID:bb/r7+3d
あー
内部VLIWな。
インストラクション受入れはx86で
>>776
778MACオタ:2006/08/16(水) 06:39:21 ID:bIQQPVfH
K8Lがテープアウトしたす。
http://www.amd.com/us-en/Corporate/VirtualPressRoom/0,,51_104_543~111541,00.html
  ---------------------------
   In addition to launching its Next-Generation AMD Opteron processors, AMD also
  announced the completion of the design, or tape-out, of its native Quad-Core AMD
  Opteron processors.
  ---------------------------
ダイのレイアウト図だけで信者を騙し続けるという状況から脱却できたことわ,素直に喜ぶ
べきかと思うす。
779Socket774:2006/08/16(水) 12:44:21 ID:/2cdMKEr
>>778
それはIntelも同じでわ?
780Socket774:2006/08/16(水) 12:50:49 ID:g+RQYf/h
クロックと提灯ベンチで信者どころか一般ユーザーまで洗脳し続けるのよりはマシだろう。w
もっとも、そのおかげで自分の首を絞めてしまった部分もあるが。
781Socket774:2006/08/16(水) 13:54:32 ID:LHUqNf/Z
K8Lってシングルコアでも普通に売られるのかな?
マルチコアに特化するように設計されてるからそれはない?
782Socket774:2006/08/16(水) 14:59:33 ID:Mt2SFiDY
米AMD、次世代MPUを07年発売
ttp://www.nikkei.co.jp/news/main/20060816AT2M1600G16082006.html
単純に現行のK8を光学シュリンクすると1コア50mm^2を切るのだけど、
メモリーコントローラの幅は縮小できないので、キャッシュを巨大化するなり
コアをもう一個並べるなりして100mm^2四方程度に収める必要があるとか。

それこそCore Duo形式でシングルコアAthlonはX2の片コア無効版として出した方が
合理的だろうね。

Sempronはチップセットとのワンチップ化とかやり出すと面白いかも。
784Socket774:2006/08/17(木) 00:04:04 ID:n1Vf+XlJ
>>779
AMDファンとしてわ、発売されていないK8Lがテープアウトされても話題にしてわいけないらしいす。
785Socket774:2006/08/17(木) 00:15:20 ID:raweXqG/
>>784
それはIntelも同じでわ?
786Socket774:2006/08/17(木) 00:16:25 ID:TkM0sY1I
気持悪いからバカ丸出しの文体をまねてアホの相手をするな
787Socket774:2006/08/17(木) 22:47:57 ID:BRtju9oW
AMDのクアッドは、クロックどの辺りからリリースされる予定なの?
788MACオタ:2006/08/18(金) 06:34:23 ID:EC30dfNH
Socket F Opteronも悲惨な出だしのようすね。。。
4-socket/8-coreでのSPECint2000_rateの比較す。
 Xeon 7041/3GHz: 114(base)/114(peak)
    http://www.spec.org/cpu/results/res2006q3/cpu2000-20060710-06446.html
 Opteron 8220SE/2.8GHz: 146(base)/166(base)
    http://www.spec.org/cpu/results/res2006q3/cpu2000-20060721-06572.html
 Xeon 7140M(3.4GHz): 161(base)/162(peak)
    http://www.spec.org/cpu/results/res2006q3/cpu2000-20060724-06780.html

アム虫の心の拠り所である>2-socketでネットバーストXeonにすら追いつかれるとわ(笑)
789Socket774:2006/08/18(金) 07:47:57 ID:nPInk93k
Tulsa ktkr!!
明らかにIntelはスコアが同等になるようにL3を調整してきたなw
しかしbaseで160overってスゲーな…
790Socket774:2006/08/18(金) 08:57:50 ID:whOL+O1c
Xeonでも性能が出せない訳じゃないってのはわかるが、あれは金かかるからな。
IBMのX-Seriesだと、チップの開発だけで3年と1億ドルも投入してるし。
791Socket774:2006/08/18(金) 08:58:45 ID:aTtEtfjW
> 明らかにIntelはスコアが同等になるようにL3を調整してきたなw

16MB on-chip L3 キャッシュの威力って奴ですかね。

> しかしbaseで160overってスゲーな…

base と peak がほとんど変わらないから、Intel C compiler が、
SPEC + Intel CPU の組合せ向けに、きちんとチューニングされてるって
ことじゃないのかな。
792Socket774:2006/08/18(金) 09:07:28 ID:nPInk93k
baseの意義は誰でも比較的容易にそのスコアが出せるって点にあるわけで
793Socket774:2006/08/18(金) 09:19:55 ID:aTtEtfjW
問題は、ユーザの使ってるアプリケーションで性能が出るかでしょ。
Intel コンパイラが、どんなアプリでも最適なコードを吐けるほど
賢ければ問題ないけど、SPEC のベンチマーク対象を認識して出す
コードを調整してるんだった意味なし。
base と peak で、ここまで差が出ないとすると、後者の可能性も
それなりにありうるのでは? まあ、実際にどちらなのかは何とも
言えないけどさ。

あと、俺の印象だと、gcc 使うと NetBurst の方が遅くなる率が
高い。サーバだとやっぱり Linux が結構強いんだが、Linux だと
カーネルからアプリまで全て gcc でコンパイルされてるから、結局
Opteron の方が速かったり。
794Socket774:2006/08/18(金) 09:26:24 ID:nPInk93k
SPEC叩くならRegulation位知っておけ、と。
795Socket774:2006/08/18(金) 11:05:06 ID:ySP/TP9E
以前からSPECに限ればXeonもOpteronを上回ったりしてた。
>>788は偽物だろ
796Socket774:2006/08/18(金) 14:16:52 ID:Lx2lrM3Z
>アム虫の心の拠り所である>2-socketでネットバーストXeonにすら追いつかれるとわ(笑)
アム虫の心の拠り所って8socketでしょ?
797MACオタ:2006/08/19(土) 01:09:25 ID:WLa2cPcz
>>795 さん
  ------------------------
  以前からSPECに限ればXeonもOpteronを上回ったりしてた。
  ------------------------
速度を測るSPEC2000とスループットを測るSPECrate_2000の区別がつかないヒトがここにも
いたすか。。。 ちなみにrateの成績わソケットの数だけメモリ帯域が増える恩恵で,シングル
コアの時代からOpteron有利ということになっていたす。
 ・2004Q2頃の4-way (4-socket) SPECint_rate2000
  Opteron850/2.4GHz: 63.4(base) / 68.5(peak)
  Xeon MP/3.0GHz: 59.0(base) / 61.6 (peak)

>>796 さん
  -------------------------
  アム虫の心の拠り所って8socketでしょ?
  -------------------------
だんだん脳内で数が増えていくすね(笑) >>554-561でも読み返すと良いかと思うす。
798MACオタ@補足:2006/08/19(土) 01:12:01 ID:WLa2cPcz
SPECint_rate2000 の登録データのリンクす。
 ・2004Q2頃の4-way (4-socket) SPECint_rate2000
  Opteron850/2.4GHz: 63.4(base) / 68.5(peak)
      http://www.spec.org/cpu/results/res2004q2/cpu2000-20040503-03009.html
  Xeon MP/3.0GHz: 59.0(base) / 61.6 (peak)
      http://www.spec.org/cpu/results/res2004q2/cpu2000-20040322-02934.html
799Socket774:2006/08/19(土) 01:25:56 ID:WEhlEEF/
Pacificaの事も考えてあげて下さい。
800Socket774:2006/08/19(土) 02:27:59 ID:zEYTQI7i
Macヲタ、スループットみたいな基本的な単語も分かってないのか。

スループットっていうのは、単に単位時間あたりに処理される量を
示す言葉で、シングルコア、シングルスレッドでも使えるんだぞ。

確かに Sun の言うスループットコンピューティングは、個々のコアが
遅くてもマルチコアでトータルで速ければ良いということを示す宣伝
文句だが、別にマルチスレッドでないとスループットという言葉を
使えないわけではない。
801Socket774:2006/08/19(土) 03:02:39 ID:eJerQmlx
>>800
ソッスネ
802Socket774:2006/08/19(土) 03:50:21 ID:O1wIKm2I
新コア出た直後に勝ててないんじゃ
終わってると普通は言うんだがなw
803Socket774:2006/08/19(土) 04:04:17 ID:+haq6fSS
quadcoreになったとして、どのくらい性能が向上するのか。
804Socket774:2006/08/19(土) 12:35:42 ID:zHOJwM1U
>>802
だな。

だから90nmなネトバは、発熱に関してイキナリ最終回状態だった訳だが。

でもK8Lが出た時はどうなるか、ちょっとドキドキするよ。
805Socket774:2006/08/19(土) 14:19:25 ID:tqjUEait
そういや逆HyperThreadingってどうなった?
806Socket774:2006/08/19(土) 15:13:32 ID:bNqY7fRh
>>797
>>554-561はどう見ても4ソケット以上と書いてあるな。
807Socket774:2006/08/19(土) 16:45:50 ID:+hf2tAoP
>>805
妄想で終わったッポイ
808Socket774:2006/08/19(土) 17:01:22 ID:BpuoRWRi
MACオタにはインテルも検討しているらしい4×4とコプロについて語ってもらいたいす
809MACオタ>808 さん:2006/08/19(土) 17:23:38 ID:WLa2cPcz
>>808
http://pc7.2ch.net/test/read.cgi/mac/1121683774/727
わたしわ,あなたがたがhttp://pc7.2ch.net/test/read.cgi/mac/1121683774/360-361の
ような異常な価格体系に異をとなえないことを常々不思議に思っているす。。。
810Socket774:2006/08/19(土) 19:13:26 ID:0brFZMiY
>>809
作った人間がなにを幾らで売ろうが自由なんで。
811Socket774:2006/08/19(土) 19:25:10 ID:gIyKAJ3c
キチガイの相手をするなよ
812孟宗:2006/08/19(土) 20:36:25 ID:O84k67M6
4x4は、苦し紛れ。

ソケットタイプのGPU(コプロ)は出ない。
DX10(10.1??)世代はPCI-E接続のGPUであれ、それは既にコプロとみなせる。
ただし、それはGPGPU的なソフトが現れて初めて実現する。
2ソケットの片側にはCPUか、またはGPU以外のコプロが乗っかるだろう。
ATIを手に入れたことで、AMDのGPU(VPU)の統合の意思は既に明らか。

また、我々一般人が2ソケットマザーを使用する必然性は今後も無いだろう。
一般的な用途ではGPU(VPU)の応用で、ほぼまかなえそうだ。
GPU(VPU)が処理可能な分野ならパフォーマンスもCPUを圧倒する。

我々が試せる数少ない例として
姫野ベンチの結果・・・

公式認定
ttp://w3cic.riken.go.jp/HPC/Symposium/2005/benchmark.pdf

個人サイト
ttp://gpgpu.jp/article/17502609.html
こちらは3次元配列を2次元配列にしてたりするんで
CPUとの比較はどうなのかなって気もしたり・・・

Microsoftが、どう動くか・・・
813Socket774:2006/08/20(日) 00:28:15 ID:xXxGCvBP
シュリンクでダイサイズが余るならメインメモリごと乗っけてくれたらいいのに
814Socket774:2006/08/20(日) 01:01:04 ID:p8EttmUv
余る量が、帯に短したすきに長しなのさ
815808:2006/08/20(日) 01:12:51 ID:h28eyHiz
こんなに早くレスが返ってくるとは思わんかった・・・
816Socket774:2006/08/20(日) 03:18:47 ID:2OY7tzCl
きもいよな 粘着してんだよ
817Socket774:2006/08/20(日) 05:45:15 ID:oULNwqKZ
>>809
マルチプロセッサ対応CPUが高いんじゃなくて、シングルプロセッサ対応CPUが安いとは考えないのか?

PowerPC系と違ってintel/AMDの場合、ネットやメール位にしか使わないようなライトユーザーや
ビジネス向けクライアント、ノートPC等シングルプロセッサの使用環境が数の上では圧倒的に多いわけだが。

MP向けの動作保障・価格設定であんなに大量にシングルで使われるんじゃ、いくら数量でディスカウントしても
割りにあわんだろ。

どうせシングルでしか使わないのなら、MP向けのバリデーションコストを省いて安くした方がメーカーもユーザーも
助かるしな。

単に、需要のバランスに合わせた製品ラインナップと価格設定というだけの話だと思うが、それのどこが異常なんだ?
818Socket774:2006/08/20(日) 09:01:10 ID:kT5FibnG
だが その時代はもう終わろうとしている
819Socket774:2006/08/20(日) 10:45:35 ID:/h6yNWRJ
>>817
インターネットを使うユーザーなら、デュアルプロセッサは充分役立つぞ。

セキュリティチェックや動画再生なんかは、インターネットでは当たり前田のクラッカー
状態だから、マルチタスクで使い易いこれらにはデュアルプロセッサがシッカリ活用出来る。

ビジネス向けでも、Office系ソフトをチマチマ使うだけの用途ならイランだろうが、これ
からそういう訳にはいかんだろ。グラフィックてんこ盛りなWindows Vistaなんか、OSその
ものがマルチタスクが大前提な作りになってそうだし。
820Socket774:2006/08/20(日) 11:00:40 ID:oULNwqKZ
>>819
そのためのデュアルコア・マルチコア化だろ?
結局、シングル「プロセッサ」なのは変わらんて。
もはや、「シングルソケット」「デュアルソケット」のほうが無難な言い回しか
822Socket774:2006/08/20(日) 20:43:19 ID:5HxpiRAx
>>819
> OSそのものがマルチタスクが大前提な作りになってそうだし。

マルチタスクじゃなくてマルチスレッドだろ。
以前「Win98はマルチタスク未対応」とか言ってたアホがいたが、おまえか?
823Socket774:2006/08/21(月) 02:06:46 ID:28hnObmj
>>822
OS/2雑誌なんかではWin98のマルチタスク処理のあらを探して
「マルチタスク対応は不完全」とか記事にしてたな。当時。
824Socket774:2006/08/21(月) 10:43:51 ID:58uWq0Qv
PrescottはどういうCPUだろうか。発熱量が増えていることは確かだ。
負荷をかけたとたんに急激な温度上昇がみられるし、そう判断できる。
空気の流れが存在しない試験台で44℃程度だから、ケースに収め
、空気の流れがあればもう少し低くなるだろう。
intelが推奨しているケース側面の吸気ダクトを装備すれば、もう少し発熱は抑えられそうだ。
そうすると、発熱問題はまだ大丈夫ということになる。
テストに使ったPrescottは、最大で60Aを超える電流が流れる。
細いピンで60A以上の電気を流さなければならない。
大電流に耐えられるよう、mPGA478からLGA775になり、同時にピンからパッドに変更している。
増えた接続面のほとんどが、電源に費やされている。

LGA775でも発熱量は大きいが、放熱性が向上しているようで熱に関するトラブルは聞いていない。
パイプラインは31段となり、より高クロック動作が可能になっている。
LGA775により電源周辺を改善し、今度こそ高クロックを狙ったとしても、そこで初めて「発熱問題」が出てくる。
クロック効率を落としながらも、徹底的にクロックを上げ、市場にアピールする「クロック至上主義」だったが、ここでintelは方針を転換。
デュアルコア化を押し上げることになった。そうすれば、消費電力を落としたコア(クロックを下げたコア)を2個使って性能を向上させることができる。
intelはNetBurst(Pentium 4系)のCPUを中止し、クロックよりも全体的な処理能力向上を目指すことになった。
intelの考えまで変えさせたPrescott。これはクロック至上主義の終焉を意味している。

圧力をかけてまで製品を売ろうとしたintelは、Prescottからの圧力に負けたのかもしれない。
長いCPUの歴史の中で、Prescottは消すことができない重要なCPUになるだろう。
825Socket774:2006/08/21(月) 10:56:52 ID:58uWq0Qv
やっべgbk
826Socket774:2006/08/21(月) 11:57:56 ID:PVT0j3ZM
>>822-823
汎用コンピュータからこの業界に関わった者からしたら、W98がマルチタスク
なんて完全に詐欺JARO。
827Socket774:2006/08/21(月) 18:07:47 ID:z8BrvLMS
>>826
マルチタスクの定義は?
828Socket774:2006/08/21(月) 19:03:00 ID:PVT0j3ZM
>>827
ttp://e-words.jp/w/E3839EE383ABE38381E382BFE382B9E382AF.html

OSに独裁権のないノンプリエンプティブなんて糞。こんな言葉はPCが
出てくる前は存在しなかった。要するにマーケティングの都合で出てきた
後付の定義でしかない。
829Socket774:2006/08/21(月) 19:19:32 ID:z8BrvLMS
だけども、ユーザに提供している環境はマルチタスクだが。
実行コンテキストを保存したままアプリケーションをスイッチできるDOSSHELLもマルチタスクだしな。
「不完全なプリエンプティブマルチタスク」
831Socket774:2006/08/22(火) 00:16:49 ID:K0Gihfqi
完全なプリエンプティブかどうかがどうユーザにとってのメリットにつながるんだ?
アプリが暴走するとOSまで道連れにするのがデメリットでないというなら
正直何も
833MACオタ>団子 さん:2006/08/22(火) 00:33:35 ID:sidVPKUa
>>832
プリエンプションわ,タスクスケジューリングの問題であって,メモリ保護とわ関係無いすけど。。。
あるだろ。フロッピーの初期化中に他の作業ができないとか。
んで、そのフロッピーがいかれてると(以下略
835MACオタ>団子 さん:2006/08/22(火) 00:44:23 ID:sidVPKUa
>>834
  ------------------
  あるだろ。フロッピーの初期化中に他の作業ができないとか。
  ------------------
それわフォーマットプログラムが悪いだけす。
co-operativeマルチタスクわプロセッサ資源を有効に使用するという点でプリエンプションより
優れているすけど,約束事を守らずに無駄にCPU資源を独占するコードが混じると利点がぶち
壊しになるってだけの話す。
836MACオタ@補足:2006/08/22(火) 00:46:20 ID:sidVPKUa
そういえば,Windows386とかの時点でFDを2枚同時にフォーマットするという芸当をやって
いたような気がするすけど,あれわプリエンプションじゃ無いす(笑)
837Socket774:2006/08/22(火) 00:55:32 ID:K0Gihfqi
>>832
そもそもアプリが暴走するというイレギュラーな事態を前提とするのがおかしくね?
完全なプリエンプティブマルチタスクを実現しているはずのNTでもBSODは起きるし
だれそれの責任でOSを道連れにするという言い訳は話のすり替えでないの?

別にノンプリエンプティブの方が優れてるって言ってるわけじゃないんだから。

ユーザに「マルチタスク」を提供している事実は変わらないけど、それが
どのように「まがいもの」であるのか説明してちょうだいな。
838Socket774:2006/08/22(火) 01:32:58 ID:T1M3jXyF
俺は>>823じゃないけど…
そもそもマルチタスク(プロセス)っていうのはリッチになったプロセッサのパワーを出来るだけ無駄にしない(遊んでる時間を少なくする)ために発案された物。
で、個々のプロセスが別のプロセスを意識して動くなんて無理でしょ。
(プログラマが「自分のアプリを使う人はこんなアプリも使うに違いない」とか想定しながらそれらとの親和性を高める努力をしなくてはならない。
あるいは資源の排他的占有を出来るだけ減らすとか。本末転倒だけど。)
つまりOSにしか出来ない仕事をOSが投げちゃってるから紛い物ってことなんじゃないの。
つか無限ループとかその辺のチェックが甘い言語だとデバッグ地獄に堕ちられるなw
横レス&乱文すまん。
839Socket774:2006/08/22(火) 01:45:34 ID:Cha+vGMm
> co-operativeマルチタスクわプロセッサ資源を有効に使用するという点でプ
> リエンプションより優れているすけど,

イタタタタタ
ごく最近まで、co-operativeなマルチタスクOSしか選択肢がなかった
ユーザらしい意見だな。(w

プリエンプティブなカーネルなら、レイテンシ制約の厳しいプロセスに
高い優先度を与えておき、そうではないプログラムには低い優先度を
与えるといったことができる。プロセッサ資源を有効に活用するっていう
のは、そういうことを言うんだ。
例えば I/O を多く行なうプロセスに高い優先度を与えると、システム
全体のスループットが増加する。この時、そうしない場合に比べて、CPUの
アイドル時間は減る。すなわち、CPU 資源をより効率的に使うことができる。

co-operative なマルチタスクしかサポートしてないカーネルだと、
そういう最適な CPU 割り当てが、そもそもできん。
840Socket774:2006/08/22(火) 02:02:37 ID:Cha+vGMm
> そもそもアプリが暴走するというイレギュラーな事態を前提とするのがおかしくね?

アプリの暴走なんて、実際には、しょっちゅう起きるものだから、
そういう事態を前提としない方がおかしい。

> 完全なプリエンプティブマルチタスクを実現しているはずのNTでもBSODは起きるし

これはほぼ全て、ハードの不良か、デバイスドライバのバグだよ。話が違う。
きちんと検証されてないハードやデバイスドライバを使うのが悪い。
アプリケーション → カーネル → ハード という依存関係があるわけだから、
右側にあるものほど、より信頼できるものを選ぶべき。

あと、なんか誤解しているようだが、Windows 98 も、ユーザプロセスの
プリエンプションは、サポートしてるよ。
そういう、スケジューリング的な意味では、Windows 98 は真のマルチタスク
OS と言って良い。(ここが MacOS 9 あたりとの大きな違い)

Windows 98 が真のマルチタスクじゃないっていうのは、メモリ保護が不完全で、
暴走したプログラムや悪意のプログラムが、他のプログラムやカーネルのメモリ
空間をブチ壊すことができたからだな。
それでも MacOS 9 に比べれば、メモリ保護機能もだいぶマシではある。

まあ、Windows 98 には、メモリ節約のために、16bit 時代からのモジュールを
引続き使っていたため、使えるシステムリソースの制約が厳しかったとか、
他にもいろいろ問題はあったが。
841Socket774:2006/08/22(火) 02:02:58 ID:/RThDX9B
実行予定のタスク内容が事前にある程度わかっている場合は
co-operativeでもpre-enptiveでも大差はない。
そもそも、実行時に優先度を変えなければいけないような状況にあるということは、
システム設計自体に問題があるとも言える。
システム構成におけるハードのコストがこれだけ小さくなっている現状では
pre-enptiveなカーネルの必要性はあまりないとも言える。
ま、優秀なシスマネがいるという前提の話ですけれどもね。
842Socket774:2006/08/22(火) 02:08:05 ID:Cha+vGMm
>>841
おいおい、実行時に優先度を変えるのは、システム管理者じゃなくて、
カーネルなんだけど。
まともなマルチタスク OS は、システム全体のスループットを最大にする
ために、動的にプロセスの優先度をいじってるんだよ。
いくら優秀なシステム管理者がいても、そういうカーネルの肩代りはできん。
843Socket774:2006/08/22(火) 02:51:21 ID:86DO07db
そいえばVistaだとカーネルモードに位置してたGDIがどっか行くから
その分安定するのかな。
844Socket774:2006/08/22(火) 09:26:39 ID:Ixep+d1T
>843
あ、ようやく文理なの? (っていうか元通り?)
845Socket774:2006/08/22(火) 09:30:42 ID:RoNngA/V
そのかわり、D3Dがカーネルの深部まで食い込むんだろ
意味ナス
846Socket774:2006/08/22(火) 10:23:55 ID:4azQEBNd
4*4待つのとE6600あたりで今組むのとどっちが正解なんだろう
今は特にAthlonXP2500+で不自由してない
847Socket774:2006/08/22(火) 10:44:18 ID:KZiQYDhG
AthlonXP2500+で一日300万リクエスト(訪問者数5万人/日)のWEBサーバー普通に動作してるしな。
ベンチとったら、Op146で毎秒3万8000リクまで対応可能だった。
(3万8000リクエスト/s×一日=32億8320万リクエスト/日)

Op146=2Ghz=Athlon 64 3200+相当のマシンで、毎日32億8300万人にhtmlページを1つずつ見せることができる計算。

そんなにCPU何に使うのかと。とくにサーバー分野では、もう十二分の性能だと思う。
848Socket774:2006/08/22(火) 11:04:07 ID:r/vSi+Rq
3コア以上必要な「ながら」作業は、
別PCでやった方が良いんじゃないかね。
つまり、精々2コアで十分。
もっとも、実際に使ってみないと分かんないけどね。
849Socket774:2006/08/22(火) 11:16:02 ID:JZVReuj3
>>847
そんなん動かすものにもよるだろ。
静的HTMLでmod無しならそれでも十分だろうが、CGIやサーブレット動かしたら
じきに足りなくなる罠。
2chなんか何年も前から数十台体制だぜ。

1台の性能上げるよりは複数台で負荷とリスクを分散したほうがいいな。
850Socket774:2006/08/22(火) 20:13:33 ID:RAbuh/px
>>847
38000rpsってどんな設定だよwwww
てかベンチ用ガチガチ設定でkeepaliveONで回してそれがどんな指標になるんだ?w
851Socket774:2006/08/23(水) 03:52:19 ID:l/8Yv4Kb
>>850
ベンチ用だか、なんだか知らんが、
Athlon2500+で動ナビの画像直リン(アダルトHPのヤフー的なサイト)
を大量に収容してもCPU負荷20%だ。
Apache使ってたころは、Op175でも動ナビくらったら80%になってたが
WEBサーバーソフト変えたらAthlonでもぜんぜん大丈夫になった。
>>一日10万人はアクセスされてるサバがAthlonXP2500で動いてるんだぜ。
これ以上アクセスされるサーバーがそんなに世の中にあるとは思えんが。

SPECのベンチで、毎秒何十万の在庫処理できるってベンチでても、超大企業ならともかく
普通の会社でそんな高性能なマシン必要ないわな。(毎秒何十万の処理かます必要ある会社あんのかよ?)
サーバー分野では、もう十二分以上のオーバースペックだと思う。
(パソコンメーカーは新製品売る必要性あるから勧めるんだろうが、法人分野ではそんな高性能なのもう要らんだろ)

>ベンチ用ガチガチ設定でkeepaliveONで回して
3万8000rpsは間違いだった。
Requests per second: 48480.62 [#/sec] (mean)
4万8000rpsだった。(インスト初期のデフォルト状態で)
keepaliveOFFで1万9974rpsかな。計算しなおすと、41億8867万人に毎日htmlページを表示できる計算。そんなに人間いねーよ
852Socket774:2006/08/23(水) 04:06:23 ID:fJ/gn8+j
リクエストってのはry
853Socket774:2006/08/23(水) 08:25:12 ID:O+R/AWga
>>851
某スレのコピってきただけじゃねーかwwww
しかもアレ146じゃなくて148なwwww


せめて自分で回してから書き込めよ。
854Socket774:2006/08/23(水) 19:54:40 ID:fJ/gn8+j
AMD's Next Generation Microarchitecture Preview: from K8 to K8L
http://www.xbitlabs.com/articles/cpu/display/amd-k8l.html
855Socket774:2006/08/23(水) 22:41:51 ID:cL0Eqsso
>>851
サーバソフト、何に変えたん?
LiteSpeed Web Server


まじでおすすめ。
857Socket774:2006/08/23(水) 23:27:25 ID:cL0Eqsso
>>856
ども。
謳い文句はいいとこ取りだね。

移行しようとして嵌った(んで回避した)話でもあれば良いんだけど、
日本語の運用情報がweb上にはあまりないように見える。


自称 Apache の後継だけあって、下記の特徴の通りかなり Apache ユーザを意識している。

静的コンテンツの速度は Apache の 6〜9倍
PHP は Apache(+ mod_php) の 1.5倍以上の速度
Apache の設定ファイルを理解するので移行が容易
アプリ(CGI)接続用の独自のプロトコル(LSAPI) [PHP, Ruby/Rails]
CGI も FastCGI も JSP(AJP1.3) とか大概の外部アプリが動く
SSL、GZIP圧縮、静的ロードバンラサ、VirtualHostも使える
.htaccess に互換があるのは凄い

851の中の人じゃないが、Ruby on Railsの重さに耐えかねてMongrelとともに
試験導入してみたらやたらレスポンス良いから拍子抜けした。
859Socket774:2006/08/25(金) 04:01:25 ID:pQBb+Ssa
>>853
いや、あれベンチして書き込んだの俺だし。そういや148だった。本人ですが。
860Socket774:2006/08/26(土) 01:43:21 ID:3Qbe8YX/
もしも積極的なFab戦略が裏目に出てAMDが倒産したら
何処が助け舟出すのかねぇ
861Socket774:2006/08/26(土) 02:41:43 ID:bwNPD9yX
>860
つぶれられると独禁法で困るIntelが筆頭候補だな
862Socket774:2006/08/26(土) 04:11:08 ID:SW1jNa99
MS(ゲイシ?)がappleの株を持ってる、という事実。
90年代にアポーが金に困ったときに投資してるからね。
864Socket774:2006/08/26(土) 19:11:23 ID:Y0M08nls
自作板のやつってOSの話題になるととたんに素人臭い議論始めるけど、
もしかしてCPUの話もその程度なの?
865Socket774:2006/08/26(土) 19:20:10 ID:7K+auIzv
中身については素人が多いんじゃない?
特にOS(というかソフト)の話になるとビックリするほどユートピアなのが多いよ
部品差し込んでベンチとるだけなら誰でもできるしなw
866Socket774:2006/08/26(土) 19:25:35 ID:oUbQHyaA
スペック厨で、結局パソコンを有効に利用して、他の何かを成し遂げることをしていない

昔の漏れがそうだった。意味ないなと・・・
はぁorz
867Socket774:2006/08/26(土) 21:29:26 ID:c2ESWU3J
>>864
自作板が閉鎖的な世界なのは分かり切った話だろ
868Socket774:2006/08/26(土) 21:38:29 ID:rGL9NDoJ
AMD having trouble with 65nm stock voltage speed
ttp://www.theinquirer.net/default.aspx?article=33964

以前Rev.Gでも劇的に消費電力が下がるわけではないとか言って叩かれてた人が居たけど正しかったんかね。
869Socket774:2006/08/26(土) 21:44:23 ID:mZU1iy7K
今の時期にこういう話が出てくるのはまずいよねえ。
ずっと前から65nmのウェハは流してるはずなのに。
動作品か知らないけどESだって出てたし。
こりゃ年内量産出荷は無いかもね。
単純な回路の設計ミスとかなら良いんだけど。

AMDの歴史
0.25um bad
0.18um good
0.13um bad
90nm good
65nm bad?
単純にダイが小さくなるだけでも収穫率はあがるだろうから、競争力は得られるのでは
871MACオタ>868 さん:2006/08/26(土) 23:54:09 ID:3iedCWVq
>>868
IBM,AMD,SONY陣営が,SRAMの低電圧動作でIntelに遅れをとっていることわ,既報だと思うすけど。。。
http://journal.mycom.co.jp/articles/2006/02/23/isscc/001.html
  ---------------------------
  丁度、前の席に座っていたIBM社のPPC970の開発者に、「IntelはSRAMの電源を下げて
  いるのに、IBMは上げている(後述のPOWER6の論文参照)、何故?」と話しかけたら、「何で
  Intelが下げられるのか分からない。社内では下げろといっているが中々下げられない」
  という答えで、何故だか分からないがIntelのSRAMセルは低電圧での安定性が良いようである。
  ---------------------------
872Socket774:2006/08/27(日) 01:00:03 ID:floKvKMI
でも、技術力はAMDとか言う謎の風評が広まってるのが自作板。
873Socket774:2006/08/27(日) 03:47:08 ID:BV4vcURu
聞いたこと無いけど
874Socket774:2006/08/27(日) 06:02:58 ID:upuASRhe
NOR型フラッシュメモリー四半期売上
ttp://www.ednjapan.com/content/l_news/2006/08/l_news060817_0101.html

Spansion (AMD, Fujitsu)


ついでにNAND
ttp://www.ednjapan.com/content/l_news/2006/08/l_news060815_0301.html
875Socket774:2006/08/27(日) 10:39:49 ID:7JalBlbo
>>867
禿同

マニヤでマイナーなスレで、素人呼ばわりした相手に専門家っぽく偉ぶる
のは凄くカコワルイ。何処にいっても嫌われるタイプでつ。

>>869
90nmでグッターだったのは、Intelがリーク電流で扱けたのを、AMDがSOIで
踏ん張ったお陰だからなあ。

65nmではSOIの神通力が弱くなって、リーク電流の悪影響が比較的大きくなって
きたせいジャマイカ。

>>871
Intelは90nmでの失地回復に必死だし、SOIに頼れない分だけ別の方法でガンガッテ
るんだろうね。もう半年も前の話だから、そろそろIBMにも何とかなっててホスイが。
876Socket774:2006/08/27(日) 10:50:40 ID:76kMWq9X
>>875
この流れだから突っ込むけど、SOIはAMDのがんばりだと思ってる?
877Socket774:2006/08/27(日) 11:04:16 ID:TdDLtYoX
俺には最後でIBM頼りって読めたが
そういう勘違いもできるか
878Socket774:2006/08/27(日) 11:08:24 ID:rRbMgPCy
SPEC協会がCPU2006ベンチマークを公表
http://www.geocities.jp/andosprocinfo/wadai06/20060826.htm

SPEC CPU2006
http://www.spec.org/cpu2006
879Socket774:2006/08/27(日) 13:46:00 ID:7JalBlbo
>>876
SOI「を」頑張った訳じゃなくて、SOI「で」頑張っただけだろ。SOI技術そのもの
はIBM頼りだったと思ってるが。

>>877
別にIBMがSOI技術をAMD専売にした訳じゃないし、Intelがそれを採用しなかった
だけだわな。

SOI導入のリスク対効果が、Intelは駄目だと考えて、AMDは大丈夫だと判断した
結果でしかない。
880Socket774:2006/08/27(日) 13:56:51 ID:7JalBlbo
>>879(続き)

そして今更IntelがSOIを導入するのは、先行するAMDに対して不利になるし、
元々のデメリットだった、数多くのファクトリの設備改変するリスクは
残ってる。

それに他の技術でリーク電流を抑える目処が有ったから、65nmで有利を
取り戻せたのだろうし、結果も出てる。そういう意味では今のIntelは
SOIを導入しなかった不利を、克服出来てると言える。
881Socket774:2006/08/27(日) 20:00:10 ID:fQxREx0s
パラノイアのIntelはDSTしか採用したくなかったんじゃね
882Socket774:2006/08/27(日) 20:00:48 ID:0tu0t6jZ
AMDの90nmSOIはモトローラじゃなかったか?
883Socket774:2006/08/27(日) 20:05:09 ID:fQxREx0s
>>882
Motoで行き詰ってBlueに乗り換えた
BlueはMotoの生き血を吸ってるからそういう意味ではMotoだけど
884Socket774:2006/08/28(月) 00:09:02 ID:Y+1kHjAU
>>882
逆、130nのがモトローラで90nのがIBM
885Socket774:2006/08/28(月) 11:37:32 ID:KKifyrFE
IntelがSOI使わ(え)なかったのは多分
IBMが法外な特許使用料ふっかけるから。
886Socket774:2006/08/28(月) 13:50:40 ID:DxcS7E0V
>>885
製造量に応じた話なら仕方がないし、P4バスのライセンスを出し渋ってサード
パーティ製のチップセット&MBメーカーを苛めて、市場から追い出した鬼Intel
が文句を言える筋合いじゃないわな。
887Socket774:2006/08/28(月) 18:00:52 ID:DxcS7E0V
>>880
そういや下記の記事を見るとP4の 6X1 や 9xx は、65nmのままでステッピング変更
だけでTDPを大幅に下げてきてるが、どういう技術を導入したんだろう?

http://pc.watch.impress.co.jp/docs/2006/0828/intel.htm

まあ単純なプロセス改善で、低電圧品が多く採れる様になっただけかもしれんが。
888Socket774:2006/08/28(月) 18:20:16 ID:ycp8H+W6
トンネル効果は絶縁膜をちょっと厚くするだけで
889Socket774:2006/08/28(月) 18:50:03 ID:DxcS7E0V
>>887
Pentium D 960 をsspec頁で電圧を調べたが、SL9K7:95W/1.225V-1.312V で、
SL9AP:130W/1.3V だった。

電圧だけで下がった訳ではなさそうだから、やはり何か新技術なプロセス導入
の可能性が高そうだ。(勿論デザイン変更による部分もあるかも?だが。)
890Socket774:2006/08/28(月) 19:01:11 ID:XqUvvreh
P1265キターと思ったけど、P1265ってPen4の高速なトランジスタで使えるようなもんじゃなかったな
何が来たんだろなホント
SantaRosa世代のLV/ULV Meromに使われるのそれ?
892Socket774:2006/08/29(火) 00:36:25 ID:7x2K0kWu
http://pc.watch.impress.co.jp/docs/2006/0829/kaigai298.htm

↓関係ないけど「1st dual core」と「Quad Core Module」の文字が光るね
http://pc.watch.impress.co.jp/docs/2006/0829/kaigai_12l.gif
893Socket774:2006/08/29(火) 02:46:33 ID:pXK9sGrN
intelの65nm世代は成功してるな。
AMDもガンガッテほしい。
894Socket774:2006/08/29(火) 15:33:55 ID:JUyB9cqf
>>890
P1265 は複数の技術の集大成だし、組み合わせも一種類じゃないみたいだから、
これらのうちから高速なP4用にも使える1〜2種類を、コア全体じゃなくて部分
的に導入したの鴨。

ttp://www.sijapan.com/breaking/0509/21ssi_intel050921.html
|高性能かつ低消費電力なトランジスタ、歪みSi、8層Cu配線、低誘電率(Low-k)絶縁膜を採用した、P1265は同社の65nmプロセス
|技術としては第2世代になる。

|90nmプロセス同様に、同社は新しい65nmプロセスでも3種類から4種類の派生プロセスを開発する。この新しいプロセスは2007年
|から量産適用される予定。
895Socket774:2006/08/29(火) 16:07:18 ID:XOAn02Rg
Intelのステッピングが何を表してるかだなあ。
AMDのリビジョンは回路設計だけだけど。
プロセスの改良もステッピングの変更に含めるなら、IntelもAMDみたいに継続的にプロセスの改良を始めたって事かもしれん。
でも複数の工場でCopy Exactlyを実行する事を考えるとそんなフレキシブルには改良出来ない気もする。

となるとやはり回路設計が主要因かな。
よりAggressiveにClock Gatingするようになったとか、低電圧で動作しやすくしたとかが考えられるか。
PentiumDのSpecification Updatesも見たけどD-0に関しちゃ何も記述が無かったなあ。
896Socket774:2006/08/29(火) 20:21:20 ID:JUyB9cqf
今更捨てる予定のネットバーストなアーキティクチャに、手間隙かけて大きなデザイン
変更はしてないのジャマイカ。

プロセス主体の変更なら、コアアーキ製造へ移行してもそのままノウハウが使えるから、
コスト対効果が大きいし。

90nmから消費電力&発熱が多くなったのは主にリーク電流の問題だから、トランジスタ
数が多くて変更が一律に行いやすいL2キャッシュに、リーク電流対策のプロセスを導入
したと考えると、結構辻褄は合うかも?

まあド素人の当てずっぽうな推測なので、話半分以下で読んで貰わないと困るが。(藁
897Socket774:2006/08/29(火) 20:25:11 ID:JUyB9cqf
(続き)
L2キャッシュなら、デザイン的にも基本的にコアアーキと大きな差がない筈だから、
これもノウハウの流用がし易いメリットが有るし。
898MACオタ>889 さん:2006/08/29(火) 21:37:25 ID:Z9LUK9DC
>>889
  ----------------------
  電圧だけで下がった訳ではなさそうだから、やはり何か新技術なプロセス導入
  の可能性が高そうだ。
  ----------------------
せっかくSSPECまで確認したすから,"Supported Features"の項目を確かめれば良かった
と思うす。
 SL9AP: http://processorfinder.intel.com/details.aspx?sSpec=SL9AP
 SL9K7: http://processorfinder.intel.com/details.aspx?sSpec=SL9K7

http://www.watch.impress.co.jp/AKIBA/hotline/20060701/etc_petiumdc1.html
899Socket774:2006/08/29(火) 21:50:09 ID:0S7gXgkD
所で、最近はどのプロセスまでArFリソグラフィで行くの?32nm?
900Socket774:2006/08/30(水) 00:07:17 ID:y1+t2KoP
何を言いたいのかサッパリ分からん人がいるな。
勘違いしてるだけだろうか。


>>896
確かにわざわざ手を入れるかなとは思ったけど、そこがIntelのマンパワーかなと。
Celeronではしばらく使うし、Tulsaもずっと開発続けて来てたからそれの成果をフィードバックしてる可能性もある。


>>899
TSMCは32nmまでArF液浸で行くって言ってるね。
EUVと言えばIntelだけど、EUV間に合うのかな。

あと、最近IBMがArF液浸で線幅29.9nmを解像してる。
何とかなりそうな気もしないでもないなあ。
レンズが課題みたいだけど。

最悪、ArF液浸で二重露光って方法もある。
欠陥率が抑えられるかどうかが鍵だけど。
901Socket774:2006/08/30(水) 04:05:46 ID:LdNNpdrh
>>892
AMDがインテルを馬鹿にしてるのが、ドンケツ争いみたいで笑えるね
902Socket774:2006/08/30(水) 11:04:18 ID:CmPrrZ1P
65nmこけそうだな。
1.4Vなら細分化しても意味ねえよ。
903Socket774:2006/08/30(水) 12:22:21 ID:WirwagzH
電圧はそう簡単に下がらない、低速なら別だがw
904Socket774:2006/08/30(水) 16:08:48 ID:eITBlHxA
CPU2個並べて2倍の性能にならないのは明らかに無駄をしてると思うのは俺だけだろうか
実際コラムとかでも1.4倍と書かれてるが
R-HTTの有利なところは1個に見せて今までのアプリがより2倍に近づくためのコードではないかと思う

2コア専用で書かれてるのがさらに速くはならないと思う
905Socket774:2006/08/30(水) 16:30:51 ID:QgoJIomm
1コアが2コアに増えて性能も倍になるソフトは存在するぞ。
906Socket774:2006/08/30(水) 16:31:42 ID:iLYIRk4F
>R-HTTの有利なところは1個に見せて今までのアプリがより2倍に近づくためのコードではないかと思う
技術力のAMDきたね。
907Socket774:2006/08/30(水) 17:18:14 ID:RI9/4I+h
R-HTTでシングルスレッドの性能アップはどんなに楽観的に見ても2倍どころか、1,2割くらいしか期待できないんじゃね?
そもそも簡単に1スレッドを複数のコアに割り振れるのなら、コンパイラの方がより簡単にマルチコアに対応できることになる。
仮に、演算ユニットを二つのコアで共有して実行するとしても、1スレッドから3命令を超える命令を抽出できる機会は、
そんなにないだろう。
どういう実装されてるかの情報すらないのに、R-HTTで2倍とかはさすがにおめでたすぎると思うぞ。
908Socket774:2006/08/30(水) 19:07:34 ID:rAjTCEhL
ハードウェアで並列性抽出するのは効率が悪すぎるからDLPやTLPなわけで
909MACオタ>904-907 さん:2006/08/30(水) 19:19:50 ID:GEjlkWxL
>>904-907
  -------------------
  R-HTTの。。。
  -------------------
とうとう腐れルーマーにまで縋るってのわ,いかにもアム虫らしいと言うべきなんすかね(笑)
910MACオタ@補足:2006/08/30(水) 19:40:13 ID:GEjlkWxL
マルチコア時代に向けて,シングルスレッドアプリをマルチコアで実行するという努力わ
進行中すけど,現状得られている成果ってのわ,この程度す。
SPECfp2000 Peak に見るマルチスレッド化の効果
http://www.aceshardware.com/SPECmine/index.jsp?b=2&s=0&v=1&ncf=2&nct=256&cpcf=1&cpct=2&mf=200&mt=3800&o=0&o=1&start=80
 ・POWER5+/2.1GHz: 3321 -> 4051 (2-chip/4-core)
 ・Opteron/3GHz: 2497 -> 3538 (4-chip/4-core)
 ・Opteron/2.8GHz: 2344 -> 2518 (2-chip/2-core)
 ・UltraSPARC III/1.2GHz: 1118 -> 1344 (2-chip/2-core)

どう見てもメモリ帯域を向上の効果が見えているだけすから,メモリ帯域が増えないデュアルコア
は結果が公開できるような代物じゃ無いってことす。当然より実性能との相関が大きいSPECintも
はかばかしい成果が出ないので公開されていないす。

マルチプロセッサ専用にコンパイルしてこの程度すから,「既存のアプリが高速化される」って話の
腐れ具合わ,虫以外には周知のことす。
911Socket774:2006/08/30(水) 19:41:58 ID:RI9/4I+h
最初の一行で誤解させたとはいえ、俺までR-HTTを信じてると思ってるのかw
俺は少なくともK8Lまで、R-HTTを彷彿させるような性能向上技術は実装されている可能性は低いと思っている。
だから、4x4でコア数多い以外に、どうやって性能向上をアピールするつもりなのかには興味ある。
912MACオタ>911 さん:2006/08/30(水) 20:09:43 ID:GEjlkWxL
>>911
  ---------------------
  俺までR-HTTを信じてると思ってるのかw
  ---------------------
そういう訳でもないすけど,基本的な素養があるにもかかわらずダメなものをダメと言い切れ
ない書き込みにわ落胆したす。
913Socket774:2006/08/30(水) 20:53:12 ID:yvFd9T/k
>>912
>>898の書き込みについて説明してくれ。
何が言いたいんだ?
914Socket774:2006/08/30(水) 21:54:11 ID:rhlzCp44
>>913
>>898は馬鹿だろ。

省電力機能のEISTやEnhanced HALT Stateは、TDP:130WのSL9APのステッピングで
導入されてるから、SL9K7でTDP:95Wに落ちた理由になってない。

TDPっでのは負荷がかかってる時に必要な冷却性能だから、アイドル時に効くEIST
やEnhanced HALT State がTDPを大きく下げる効果が無いのは、普通に考えれば
わかる話なのに。
915Socket774:2006/08/30(水) 22:07:58 ID:rhlzCp44
>>900
いくらIntelにマンパワーがあるといっても、デザイン部門にはそんなに余裕は
無い気がするが。(プロセス=生産部門に関しては確かにダントツだが。)

とりあえずIntelとしてはコアアーキに対しての4コア化や64bit高性能化に、
デザイン部門のマンパワーが優先的に必要だろうし。そうでないと利益率の
良いサーバー向けで、AMDに対抗出来ないし。

>>897 に関しては、ちょっと訂正。

コアアーキとネトバアーキだと、CPU動作クロックが1GHzくらい違うので、例え
L2キャッシュがSRAMで基本的にデザインが同じでも、実際にはかなり違ってしま
ってる可能性が高い気がします。

まあそれでも低消費電力なプロセスを導入するノウハウを得るには、一番好都合
な筈なのは確かでしょうけど。
916MACオタ>913-914 さん:2006/08/30(水) 22:14:06 ID:GEjlkWxL
>>913-914
  ----------------------
  省電力機能のEISTやEnhanced HALT Stateは、TDP:130WのSL9APのステッピングで
  導入されてるから、SL9K7でTDP:95Wに落ちた理由になってない。
  ----------------------
リンク先をどうぞ(笑)

SL9AP: http://processorfinder.intel.com/details.aspx?sSpec=SL9AP
  ======================
  Supported Features:
  - Dual Core
  - Execute Disable Bit
  - Intel EM64T
  - Intel Virtualization Technology
  ======================
SL9K7: http://processorfinder.intel.com/details.aspx?sSpec=SL9K7
  ======================
  Supported Features:
  - Dual Core
  - Enhanced Intel Speedstep? Technology
  - Execute Disable Bit
  - Intel EM64T
  - Intel Virtualization Technology
  ======================

917MACオタ:2006/08/30(水) 22:36:57 ID:GEjlkWxL
Opteron 1000 わ発表から2週間で消滅したらしいす(笑)
 ・製品発表 http://pc.watch.impress.co.jp/docs/2006/0815/amd.htm
 ・AMD最新価格表 http://www.amd.com/us-en/Corporate/VirtualPressRoom/0,,51_104_609,00.html

グダグダすね。。。
918Socket774:2006/08/30(水) 23:09:15 ID:kkyUHMVR
マルチコア向けにプログラムしなくてもいい、R-HTTについてもその有効性
を引き出すには、R-HTT向けにプログラムする必要があるということでOK?

マルチコア向けにプログラムするにも、R-HTT向けにプログラムするにも人間の
脳には不向きな論理的思考が必要なので効率があがりにくいということはあるし。
因果関係があるものだと、そもそも結果が出る前に実行性能に余力があっても無駄に
なると。早くなるのは別として、単位時間あたりにできる処理がリッチになるという
のでいいんじゃないの。既存アプリの高速化で2倍の処理が出来るわけではないけど
10%程度でも早くなるならいいことだ。

マルチコアもR-HTTも無駄というにはまだ早すぎる。

単一のソフトばかりではないですからね。ながら作業なんかじゃマルチコアのほうが
快適だけど、マルチHDDにしてRAID0+1とかで最適化とか自動でしてくれないかなと。
物理メモリ以外へのアクセスも管理するのはAMDの方向性としてあるのかな。
単純2倍にできるのはブロック暗号のブルートフォースアタックくらいだろ。
920Socket774:2006/08/30(水) 23:54:42 ID:rhlzCp44
>>916
それわweb上でのミスっぽいぞ。当初の920~950がエラッタのせいでEISTが
なかった為に、sspec頁で記載してなかったのを、そのままコピペして
修正漏れした可能性が高い気が。

http://www.watch.impress.co.jp/AKIBA/hotline/20060107/etc_presler.html

実際に下記のDataSheetやupdateをみても、EISTの有無が130Wと95Wの違いの
理由とは、何処にも書かれてない。こういう場合、webよりもpdfの記載を信用
すべきだし。

http://www.intel.com/design/Pentiumxe/datashts/310306.htm
http://developer.intel.com/design/Pentiumxe/specupdt/310307.htm
921Socket774:2006/08/30(水) 23:56:56 ID:XNSmHyxs
>>916
あのさ、元々の話題はPen4 6x1(PenD 9xxもだが)のステッピングがC-1からD-0に変更
になったことによるTDPの減少についてなわけ。
ttp://pc.watch.impress.co.jp/docs/2006/0828/intel.htm
ttp://pc.watch.impress.co.jp/docs/2006/0615/intel.htm

で、ステッピングの変遷は以下の通り(CPUIDとの関係も記述)
0F62h = B-1 エラッタによりEIST無効
0F64h = C-1 EIST有効 それに伴い?TDP減少
0F65h = D-0 TDP減少
ttp://pc.watch.impress.co.jp/docs/2006/0201/intel.htm
ttp://pc.watch.impress.co.jp/docs/2006/0217/intel.htm

ここで注目のSL9APを見てみると
ttp://processorfinder.intel.com/details.aspx?sSpec=SL9AP
 Core Stepping -
 CPUID String 0F62h

というわけで>>898は何が言いたいのか意味不明ってこと。
922Socket774:2006/08/31(木) 00:25:06 ID:JiNSe922
>>918
IntelのI/OATはCPUにさせる仕事を減らそうという考えみたいだけど。
1枚のチップにできることには限りがあるわけで何でもかんでも詰め込むのは良くないと思う。
923Socket774:2006/08/31(木) 00:29:39 ID:p7FOhwVr
R-HTT向けとマルチコア向けのプログラムってわざわざわける意味って何?
そもそも、R-HTTは従来のシングルスレッドのプログラムを高速実行できるって話じゃなかった?
それをR-HTT向けにはプログラムを書き直さないといけないのなら、10%程度高速化される
マルチコア向けプログラムだけでいいかと。
さらに、R-HTT自体がどういう風な実装かも謎なのに、それ向けのプログラムとか言い出されても
わけわからんのだが。
924Socket774:2006/08/31(木) 00:30:34 ID:BfB52p+q
>>921
だからwebのミスジャマイカって言ってるだろ。はっきり言うが、今までも
webとpdfの矛盾は見た事があるが、大抵はweb側のミスだ。

ttp://download.intel.com/design/PentiumXE/specupdt/31030711.pdf
|SL9AP C1 2M x 2 0F64h 960 3.60GHz/800MHz 775-Land LGA

恐らくこういう矛盾した資料のせいで、例えばMBメーカーが間違った設計
をして損害を被ったとしても、pdfな資料を元にしなかった場合は訴訟でも
勝てないと思う。
925Socket774:2006/08/31(木) 00:34:22 ID:PVUqnVrs
だからそのミスがあるであろうページを持ち出してきて得意げに語ってくるから
何が言いたいのかわからないってからかっただけだよ。
あとEIST有効によるTDPの減少だって言いたそうだったからその説明もしたまでのこと。
926Socket774:2006/08/31(木) 00:37:19 ID:JiNSe922
AMD man has poetic mission
ttp://www.theinquirer.net/default.aspx?article=34046
>(It's a possibly amusing quirk that Boswell never speaks the name of "our competitor". Is Intel, like Voldemort, too evil to name?)
名前を言ってはいけないあの人ワロスw
ポエマーだなw
927Socket774:2006/08/31(木) 00:42:16 ID:BfB52p+q
スマソ。>>921>>916 とわ別人だったんだな。勘違いしたよ。
928Socket774:2006/08/31(木) 00:48:38 ID:BfB52p+q
余談だがCyrixの頃なんか、pdfな資料にすら間違いや矛盾があったりして
苦労したもんだよ。(爺モード)

しかもpdfやwebにすら載ってない実物CPUが、店頭に出回るのも普通だったし。
(シミジミ)
929MACオタ>921 さん:2006/08/31(木) 00:49:42 ID:vdIUiipz
>>921
自分の引用したソースを読んでるすか?
http://pc.watch.impress.co.jp/docs/2006/0201/intel.htm
  --------------------------
  大きな変更点として、「Enhanced HALT State」と、「Enhanced Intel SpeedStep Technology」
  (EIST)が有効となり、Pentium D 940(3.20GHz)のマザーボード設計ガイドラインが130W枠から
  95W枠へ変更される予定。
  --------------------------
130W -> 95W の変更がEISTによるものだという点わ,すべての資料で一致しているす。
930Socket774:2006/08/31(木) 02:55:17 ID:svAK27v8
>>929
まず、その気持ち悪い言葉使いを直せ
931Socket774:2006/08/31(木) 02:59:50 ID:MOdAIRch
基地外さんわスルーでペニス
932Socket774:2006/08/31(木) 08:07:11 ID:PVUqnVrs
>>929
そっちこそソースを読んでるのか?
その記事はB-1からC-1へのステッピング変更でEISTが有効になるって記事。
(EISTが有効になってTDPが減るってのも個人的には理解できないが今回はおいておく)

で、話題にしてたのはC-1からD-0への変更でTDPが減ってるってこと。
理解できる?
933Socket774:2006/08/31(木) 08:33:52 ID:LOoJeY6o
>>930
他に突っ込めないんすか(笑)
934Socket774:2006/08/31(木) 10:28:56 ID:19emoz46
おっと、ここで華麗にスルー! (AA略
935Socket774:2006/09/01(金) 00:30:59 ID:FMHFbAz/
>マルチプロセッサ専用にコンパイルしてこの程度

まあプログラミングも少ししてみたらいいんじゃないかなw
ICCの自動スレッド生成オプションじゃねーの?

NetBurst路線時代のNehalemが投機スレッディングを使いまくるものだったらしいが
これって従来型アーキテクチャベースのマルチコアにも簡単に応用できるモノなのだろうか
937Socket774:2006/09/01(金) 07:32:22 ID:ToADakeQ
>>934
ほんとに華麗にスルーだな
笑った
938Socket774:2006/09/02(土) 02:41:14 ID:m+FAc64p
intelネトバのクロック以上に焜炉を上げないのかな?
AMDがこのままじゃ出す意味ないしな。
intelがこのまま勝手に一人歩きすると思う?
早く3.8Ghzの壁を破って欲しいが。
65nmではできるのかな?
939Socket774:2006/09/02(土) 02:53:32 ID:f0iaWOID
これからマルチコア化が進むのにクロックを上げるような愚かなことはしないだろう?
上げてもほんの少しだよ。
940Socket774:2006/09/02(土) 03:02:25 ID:UrEzEvHY
Power6なら…Power6ならきっとなんとかしてくれる…
941Socket774:2006/09/02(土) 03:09:28 ID:iIZS3GhZ
Power6のTDPはどの程度なんだろう?
942Socket774:2006/09/02(土) 03:29:37 ID:f0iaWOID
Power6の開発は遅れに遅れているからなぁ、何とも言えない。
それとConroeも3.6GHz程度なら今でも常用OC可能だし、Power6が出てくる頃には大してクロックの差が無かったりしそう。
もちろんOCしての話、マルチコア化を進めているから実クロックはあまり上げない方針のようだしな。
943Socket774:2006/09/02(土) 04:09:52 ID:tUksljO7
Power4がデュアルコアを出したとき、AMDはAthlon 1.33GHzくらいだっけ?
AMD「オーバーギガヘルツの時代!」などと言ってたな。
まあPower4もギガヘルツオーバーだったけど

当時、AMDやインテルPentium4にワクテカしてた連中は、どう見ていたんだろう
それとも、マルチコアの存在すら知らなかっただろうか。
944Socket774:2006/09/02(土) 04:21:21 ID:f0iaWOID
あの当時はデュアルコア全く不要だろうよ。
IntelやAMDの主力は個人向けのCPU、IBMとは住む市場が違う。
性能が向上し業務用とでも使われるようになり市場が重なる場面も多くなってはいるが、やはりベースは違う。
945Socket774:2006/09/02(土) 11:41:56 ID:gbyGcx8c
POWERがデュアルやらクワッドにすぐ走るのは性能がショボイから
946Socket774:2006/09/02(土) 12:03:39 ID:tUksljO7
AMDファン<これからはオーバーギガヘルツ
→IBM<ギガヘルツと同時にマルチコア化も進めるよ
→AMDファン<なにそれ?うまいの?

AMDファン<デュアルコアは業界のトレンド
→IBM<まあな。同時に高クロック化するよ
→AMDファン<何やってんだかwクロックを上げるのは時代と逆行だぜ
→IBM<TDPもPOWER5と同等だし、すでにクアッドだから問題ない。AMDがクロックを上げられないだけだろ?
→AMDファン<・・・・・・クロックを上げるのは(ry
947MACオタ>団子 さん:2006/09/02(土) 13:07:59 ID:QRapaI75
>>936
  ------------------------
  ICCの自動スレッド生成オプションじゃねーの?
  ------------------------
icc for SolarisもPowerPC版iccも存在しないすけど。。。 (>>910参照)
948MACオタ>921 さん:2006/09/02(土) 13:17:18 ID:QRapaI75
>>921
脳内妄想の披露わ,たいがいにして欲しいす。。。
  --------------------
  あのさ、元々の話題はPen4 6x1(PenD 9xxもだが)のステッピングがC-1からD-0に変更
  になったことによるTDPの減少についてなわけ。
  --------------------
Pentium D 9xx のC1->D0ステッピング変更によるTDPの変遷
 ・945: 95W (C1) -> 95W (D0)
  C1: http://processorfinder.intel.com/details.aspx?sSpec=SL9QB
  D0: http://processorfinder.intel.com/details.aspx?sSpec=SL9QQ
 ・925: 95W (C1) -> 95W (D0)
  C1: http://processorfinder.intel.com/details.aspx?sSpec=SL9D9
  D0: http://processorfinder.intel.com/details.aspx?sSpec=SL9KA
 ・915: 95W (C1) -> 95W (D0)
  C1: http://processorfinder.intel.com/details.aspx?sSpec=SL9DA
  D0: http://processorfinder.intel.com/details.aspx?sSpec=SL9KB

どのTDPが減少しているやら(笑)
949Socket774:2006/09/02(土) 15:10:18 ID:QUjfdhqg
わざわざURL貼ってあるのに何で見ないんだろうね。
それともマジで見えてないのかな。

ttp://pc.watch.impress.co.jp/docs/2006/0828/intel.htm
>  対象となるのは、Pentium 4 631(3GHz)、同641(3.2GHz)、同651(3.4GHz)、同661
> (3.6GHz)で、ステッピングがC-1からD-0に変更される。出荷時期は631/641が
> 2007年1月22日、651/661が2006年11月22日。
>
>  これにより、CPUIDがF64からF65になり、TDP(Thermal Design Power)が86Wから
> 65Wに引き下げられる。

ttp://pc.watch.impress.co.jp/docs/2006/0615/intel.htm
>  対象となるのは、OEM向けの仮想化技術「VT」付きPentium D 960(3.60GHz)/
> 950(3.40GHz)、およびVTなしのPentium D 945(3.4GHz)/925(3GHz)/
> 915(2.80GHz)で、ステッピングがC-1からD-0に変更される。
>
>  CPUIDがF64からF65になったほか、Pentium D 960のFMBが変更され、従来の
> 130W(2005 Performance FMB)から95W(2005 Mainstream FMB)に引き下げられた。
950Socket774:2006/09/02(土) 15:47:28 ID:fY8xfvsr
Power6がパイプラインを細分化せずに4GHzオーバーって
そんな都合よくいくものなんですか
951Socket774:2006/09/02(土) 15:56:39 ID:Y/YIyU14
詳しくは、お近くのIBMへ。
952Socket774:2006/09/02(土) 16:18:27 ID:MMp6Qa6i
>>948
TDPは発熱の絶対値じゃなくて要求冷却性能なのだから、性能の低いクラスの
TDPをそれ以上下げる理由がないだろ。TDPを同じままにすれば歩留まりが上が
るのだし。

そんな事はCPUの発熱に関心をもつヤシなら、ほぼ常識だと思うのだが。

一番肝心な、当初から話題にしてる960に対する反証なり反論なりをしろよな。
953Socket774:2006/09/02(土) 17:23:39 ID:tUksljO7
>>952
下がっていないTDPを「下がった」と言ってしまった件については?
954Socket774:2006/09/02(土) 17:55:46 ID:swrHLZ0t
>>950
処理時間の速い命令を基準にuOPs化する。
これで、段数を増やさずに4GHzや5GHz稼働のCPU設計が可能になる。

例)
処理時間の速い命令をA、普通がB、遅い命令はCとする。
これまでの設計だとBを基準にuOPs化してい、これをAを基準にuOPs化すると段数を増やさずに高クロック化出来る。

Bの命令を1つのuOPに分解するのを基本とした場合。
Aの命令は1つのuOPに分解される。
Bの命令は1つのuOPに分解される。
Cの命令は2つのuOPに分解される。
合計4つのuOPが出来る。

Aの命令を1つのuOPに分解するのを基本とした場合。
Aの命令は1つのuOPに分解される。
Bの命令は2つのuOPに分解される。
Cの命令は4つのuOPに分解される。
合計7つのuOPが出来る。

Aの命令を多用するソフトだとIBM-Power6は高クロックのメリットを存分に生かせ高速化される。
Bの命令を多用するソフトだとIBM-Power6の高クロックのメリットは増えるuOPにより相殺され高速化されない。
Cの命令を多用するソフトだとIBM-Power6の高クロックのメリットはそれ以上に増える増えるuOPにより相殺され逆に低速化される。

955Socket774:2006/09/02(土) 18:25:01 ID:ewsHWrZP
雑誌にintelはクロックを上げていくとかいてあったが。
130Wになるまで上げるのかな?
クロック上げないと性能上がらなくて、進歩が止まってしまいますが。
AMDが対抗してこないと新しいものださないかな?
956Socket774:2006/09/02(土) 18:37:29 ID:tUksljO7
>>955
実際そうなんだよね。
マーケティングでは「クロックを上げる必要はない」としか言えないわけで

Core2は3.2GHzまで上げたあと、どうするかはしらん
4コアのは2.66GHzらしいから、これを2.93GHzあたりまで上げる余裕はあるだろう

Core2 1.86GHzはAthlon64 3000+のように、あまり値段が変わらず来年いっぱいくらいまで売られることになるかも
957Socket774:2006/09/02(土) 18:52:58 ID:Ain7h/gr
80ワットのプロセッサでベース1.5Vとすると
60Aもの電流が流れてるのか?
致死量じゃないか
958Socket774:2006/09/02(土) 19:00:01 ID:pqFTRjmP
Intelの歪Si >>>越えられない壁>>> AMDの歪Si
959Socket774:2006/09/02(土) 19:21:32 ID:1BzSkUq5
Woodcresと2000シリーズのベンチ比較をわかり易く載せてるとこない?
それと、Tyan Thunder n6650W(SASなし)発売いつ?
960MACオタ>959 さん:2006/09/02(土) 23:11:37 ID:QRapaI75
961MACオタ>957 さん:2006/09/02(土) 23:15:42 ID:QRapaI75
>>957
  ----------------
  60Aもの電流が流れてるのか? 致死量じゃないか
  ----------------
致死量わ,はるかに小さいということを覚えておくと良いかと思うす。
http://www.eccj.or.jp/qanda/he_qa/elec/d0104.html
  ================
  問 人体機能の中枢部にダメージを受けるわけですね。改めて感電の恐ろしさを認識しました。
    この心室細動を発症させる電気的数値などは、わかっているのでしょうか。
  答 諸説に、いろいろありますが、一般論で言えば、心室細動は、両手または手足の間の通電
    では、100mAで起こり得るといわれています。
  ================
962Socket774:2006/09/02(土) 23:53:35 ID:yRAcPl6S
AMDでもINTELでも、今後クロックあたりの処理能力を向上させることって難しいんだよね?
963Socket774:2006/09/02(土) 23:56:39 ID:PpGYQaPB
>>962
まだやろうと思えば出来るけど、半導体面積に見合う見返りはないよと。
それだったらコアを増やそうっていう話だってw
964Socket774:2006/09/03(日) 00:23:54 ID:lWIERQL3
AMD Virtualization 」(AMD-V) ってあんまり効果ないのかな?
いまのところ、どの記事みてもWoodcrestに完敗ぽいね。
まあ、51××はFBDIMMの高温のせいでで3時間以上の
縁故やると、マザーごとぶっ飛びそうだけど。
965Socket774:2006/09/03(日) 00:31:59 ID:MwHCJMyG
>>964
HostOSのデキ次第じゃない?
機能的にはAMD-V>>>>>現状のVTらしいけど。
Xenあたりの対応に期待。
966Socket774:2006/09/03(日) 00:45:45 ID:mv2VaBrW
>>964
AMD-VやVTが何なのか解ってないだろ・・・
967Socket774:2006/09/03(日) 00:56:29 ID:MwHCJMyG
>>966
Xen関連調べてみるとわかるよ。
事実上今のVTって特権委譲のあたりしか寄与してないから
肝心のI/Oメモリ周りうまくやらないと仮想化した上でのパフォーマンス向上には微妙。
968Socket774:2006/09/03(日) 01:04:57 ID:MwHCJMyG
寝る前に追記。
仮想化するだけなら今のままで十分というか、VMWareでいいじゃないでおkだと思う。
ハードウェア仮想化してさらにパフォーマンスも求めるなら、今のVTだと(´・ω・`)
HVM(VT)使うよりソフト仮想化のDomainU使う方が、5倍くらい早いから・・・
INTELも次期VT開発中らしいけど。
WinベースでHVMが生きるのも次期Winらしいけどさ。
969Socket774:2006/09/03(日) 01:08:53 ID:4NnOhy6v
PCI-Eが5GHzにならないとVTは
970Socket774:2006/09/03(日) 03:53:52 ID:W/3HBVkn
実際、VMware なら、今のところ VT に頼るよりソフトだけで仮想化した
方がむしろ速いらしいしね。まあ、それだけ VMware のデキがいいことの
裏返しなわけだが。
971Socket774:2006/09/03(日) 10:35:19 ID:lWIERQL3
ってことはWoodcresに完敗じゃない?
972Socket774:2006/09/03(日) 11:35:32 ID:1T8EffmI
vmware と Xen は仮想化の方針・使い方がまったく違うし
VT や Pacifica はどちらかというと Xen に向いている
話じゃないかなー

そして Xen 的な見方では Pacifica の方が
分離度も高く良い作りではないか、って話だと思う

違ってたら訂正よろ
973Socket774:2006/09/03(日) 11:46:19 ID:ib27BxqD
閑話休題

久しぶりの焼きサラ報告です。9匹もモッタイナイ・・・・。

http://headlines.yahoo.co.jp/hl?a=20060903-00000002-yom-soci&kz=soci
974Socket774:2006/09/03(日) 11:49:47 ID:ib27BxqD
>>953
TDPが下がった「960」の話をしろ、と何度書けばわかるのやら。
975Socket774:2006/09/03(日) 14:21:35 ID:dnsYUjER
MACオタも途中で間違いに気づいて逃げ出してるくらいだし放置しとけ。
976MACオタ>956-957 さん:2006/09/03(日) 14:34:11 ID:uauwyV9b
>>956-975
勝利宣言お疲れ様す(笑)
新ステッピングに対する技術資料が公開されれば>>889の推論がトンデモなのわ明らかになると
思うす。そもそも物理に反しているすから。
977MACオタ>962-963 さん:2006/09/03(日) 16:07:44 ID:uauwyV9b
>>962-963
  -------------------------
  今後クロックあたりの処理能力を向上させることって難しいんだよね?
  -------------------------
巷間言われるごとく「もはや(半導体プロセスの微細化による)タダ飯を期待できない」という
常識を踏まえて議論を進めるのわ,結構な話す。

しかし,モバイルプロセッサクラスの消費電力とトランジスタ数で実効IPCを大幅に向上させた
Coreアーキテクチャの登場を目前にした今,そういう感想を書き込むという発想はどうなんすかね。。。
2ちゃんねるの知ったかさんの投稿やら,電子工学の教育を欠片も受けてなさそうなライター
の雑文を素直に信じて,目の前にある現実との矛盾を感じないヒトがいることに不安を感じるす。
ハイエンドRISC用のコンパイラにMPI対応オプションは実装されてて当然。。
SPECのソースコード見たこと無いだろ。
マルチスレッド周りをソースコードレベルで記述するとOS依存になるしな。


979MACオタ>団子 さん:2006/09/03(日) 17:20:04 ID:uauwyV9b
>>978
  --------------------
  ハイエンドRISC用のコンパイラにMPI対応オプションは実装されてて当然。。
  --------------------
OpenMPって言いたかったすか?MPIこそソースコードレベルでの対応が必要すけど。。。

それわそれとして,1000以上あるSPECfpの登録の中に"Parallel=Yes"のデータが数える程しか
無いのに「当然」って言い切ってしまうすか??
言いたかった。

GPLのコードを含むといわれてるのにあのライセンスは違反なんで抗議するべきなんだが
なんにしてもソースコード見ないことには憶測でしか語れんね
981Socket774:2006/09/03(日) 18:15:15 ID:7EZKimJg
MACオタが人格攻撃に移ってるのは論理的に間違ってると
認めるようなもんですよ。事実上の敗北宣言ですw

誰にでも判るような赤っ恥かいたら半年くらい姿消すけど
こんなマイナースレじゃそうでもないんでないかなww
982Socket774:2006/09/03(日) 18:22:19 ID:fUvggjyg
クロック当たりの効率を上げられないんだったらクロックを上げるしかないじゃないかよ。
マルチコアかでも上がるけど。
CPUの進歩止まったみたいだな。
130Wだとまた叩かれるし。
P3とAthlonの時のように両者のクロックが上げ競争が始まったら面白いんだけど。
最近、互角な戦いができていないよ。
983MACオタ>団子 さん:2006/09/03(日) 18:41:49 ID:uauwyV9b
>>980
  ---------------------
  GPLのコードを含むといわれてるのにあのライセンスは違反なんで抗議するべきなんだが
  ---------------------
SPEC CPUに含まれるコードわ,すべてどこかでソース公開されているモノばかりす。
http://gcc.gnu.org/ml/gcc/2001-10/msg01310.html
  =====================
  The parts of spec2000 that are free software already exist on FTP sites, but
  anyone attempting to post the tests that use that software (what part to compile,
  what input data to use, how to compute the result) would necessarily violate their
  license agreement with the spec people. It's legal for the spec people to do this 
  (use GPL software in a proprietary context) because of the GPL's "mere
  aggregation" clause: the testbench is proprietary even though it uses free code;
  the free code is always in separate programs.
  =====================
それが問題だっつーてんだろ
985Socket774:2006/09/03(日) 19:19:13 ID:gaK8KDv8
986Socket774:2006/09/03(日) 19:25:13 ID:W/3HBVkn
>>963
SPEC はバイナリ配布はしてないし、GPLなプログラムについてはソースの
改変をしてないから、再配布の義務がそもそも発生しないんだと思うよ。
987986:2006/09/03(日) 19:25:58 ID:W/3HBVkn
おっと>>963じゃなくて>>984だった。
988987:2006/09/03(日) 19:30:34 ID:W/3HBVkn
うーん、ちょっと違うか。GPL部分については、相変わらず再配布の義務があい、
実際再配布することはできるが、GPLなソフトと直接リンクされないtestsuite
部分についてはGPLの適用を受けないってことかな。
989Socket774:2006/09/03(日) 21:15:58 ID:4NnOhy6v
ttp://pc.watch.impress.co.jp/docs/2006/0518/hot425.htm
パルオ記事だがVTの有りと無しでの性能が載ってる
990Socket774:2006/09/03(日) 22:15:06 ID:R0ZnF4pn
AMDには何の関係もない記事だな
スレ違いあっちいけ
991MACオタ:2006/09/03(日) 22:36:12 ID:uauwyV9b
>>990
  --------------------
  AMDには何の関係もない記事だな
  スレ違いあっちいけ
  --------------------
こういうヒトって,AMDのプロセッサわ良い電気で動いていて,Intelのプロセッサわ悪い電気で
動いてるって本気で信じてそうすね(笑)
992Socket774:2006/09/03(日) 22:54:55 ID:+Q8mg9Gc
993Socket774:2006/09/03(日) 23:58:50 ID:dnsYUjER
誰も>>976にはつっこまないね。
994Socket774:2006/09/04(月) 00:03:02 ID:cdFJyC4Q
↓次スレ4649
995MACオタ:2006/09/04(月) 06:29:32 ID:G2DFyhDV
そもそも「次世代」スレッドをIntelとAMDに分ける必要があるすか?
技術を語るのわ,国境も言語の違いも無いす。当然,製造メーカーが違うと物理法則まで
変わるなんてトンデモなことも無いす。

まあ技術論用のスレッドと妄想用のスレッドを分けるとか,人間用と虫用で分けるってのわ
アリなのかもしれないすけど,夢見がちな方隔離用のスレッドわ この辺で足りてそうす。
 「インテルの衰退と AMDの繁栄PART39」
 http://pc7.2ch.net/test/read.cgi/jisaku/1156786255/l50
 「インテルの再建とAMDの停滞 Part1」
 http://pc7.2ch.net/test/read.cgi/jisaku/1152040033/

996Socket774:2006/09/04(月) 08:01:31 ID:qzeyCFdy
次世代をなんだと思ってるのか知らんが、メーカーが違えば設計は違うだろ。
仕様がリークしたりはするけど名前がついてなかったりするから「次世代」という
言い方をしているに過ぎないと思うんだが。
997Socket774:2006/09/04(月) 08:11:08 ID:ddudZKTf
いい加減スルーしろよ…
998Socket774:2006/09/04(月) 08:59:28 ID:YuVlF6Qy
粛々と次スレでも立ててみる

AMDの次世代CPUについて語ろう 6次世代
http://pc7.2ch.net/test/read.cgi/jisaku/1157327883/
999Socket774:2006/09/04(月) 10:09:13 ID:24K23ixY
999
1000Socket774:2006/09/04(月) 10:09:44 ID:24K23ixY
(ΦωΦ)フフフ・・・1000get・・・
10011001
1台のマシンが組み上がりました。。。
新しい筐体を用意してくださいです。。。。

         自作PC板@2ch http://pc7.2ch.net/jisaku/