1 :
Socket774 :
2007/03/03(土) 21:10:24 ID:lsU+58aV お前らいい加減、無能なAMD房・Intel房・GKに振りまわされず、
エンコ時間がどうとかPIがどうとかPS3がどうとかじゃなく、
CPUコアのアーキテクチャについて語りましょう。
x86/RISC/CISC/スーパースカラ/VLIW/MIMD/SIMD
等について語ってもよし、
フリップフロップ回路が小さいPentium Mマンセー、
CISCなのに内部はRISCなPentium 4マンセー、
x86なのに32/64bitコンパチなOpteronマンセー、
昔々8086の時代は(以下略・・・等もよし。
さあ、不毛な争いを止めてCPUアーキテクチャについて語ろう!
前スレ
CPUアーキテクチャについて語れ 6
http://pc9.2ch.net/test/read.cgi/jisaku/1169393906/
3 :
Socket774 :2007/03/03(土) 22:37:59 ID:MyajhQ1J
前スレより転載
999 :983:2007/03/03(土) 22:36:54 ID:MyajhQ1J
>>990 POWER4は整数16段、Float25段。
K7は10段と15段。
4 :
Socket774 :2007/03/03(土) 22:40:22 ID:6mNzS9Ki
>前スレ972 たしか、SimpleTextの直系祖先のはず
5 :
Socket774 :2007/03/03(土) 22:57:15 ID:MyajhQ1J
POWER4のAlpha並速度で16段は間違いで、P6並速度で9段。 PowerPC970でAlpha並の速度で16段と25段。
おれ、プログラミングできないんで間違ってるかもしれないんだけど、 68k macintoshの32KBセグメントってMMUなしでやるんでしょう? ってことは、アドレッシングに余計な操作がかかって、ものすごく遅くならない?
7 :
レトリック君 :2007/03/03(土) 23:42:56 ID:dX6VBe5V
>>6 初期のMacのSegmentはflatな物理memory空間をheapの様に
分託して管理するmemory領域のことであり、MMUの様な論理->物理address変換は
していないよ。変換そのものがないからload/storeには,それによるoverheadはないよ。
68000単体で使うときには論理=物理空間で全てが動く。
8 :
レトリック君 :2007/03/03(土) 23:53:34 ID:dX6VBe5V
FM-11は8bit 6809+結構しっかりしたMMUが付いていたなあ。 物理1Mに対して論理64K。物理memoryの方が多いのね。 だからOS-9でマルチタスクやっても全然へっちゃらで結構rubstだった。 でも下位の4KBは共有で、ここのcode等を破壊すると逝っちゃうんだ。 S1の6309+MMUは共有領域無しの設定も可でもっとしっかりした代物だったような記憶がある。 段々過去に遡って行っちまうな…orz、お迎えが近いのかな。
>>7 >>MMUの様な論理->物理address変換は
>>していないよ。変換そのものがないからload/storeには,それによるoverheadはないよ。
>>68000 単体で使うときには論理=物理空間で全てが動く。
それはそうなんだけど、なんといったらいいのか
まぁありがとう
>>8 8ビットのゲーム機だと、物理空間>論理空間は当たり前なんだけど、
ファミコンの場合、なんとROMカセット毎にMMUを内蔵してた
MMUとはいわずmapperというんだけど、これの種類がたくさんあって
昔はファミコンエミュレータの障害のひとつでした
11 :
レトリック君 :2007/03/04(日) 00:00:11 ID:dX6VBe5V
真鍋かをりの胸に気を取られて、内容については上の空だった…orz 助長なアドレッシングに制限を受けると言いたかったのかな? executableがどこにloadされるかは実行時に決められるため relocalatbeなcodeでなければならないから、絶対番地は使えない 相対addressing mode限定、 そういう意味ではclock数とbyte数の「若干」多いinstructionを主に使うことになるよ
12 :
レトリック君 :2007/03/04(日) 00:05:47 ID:eb/Q7HMz
MMUにはMMUでoverheadがあって、 386では内蔵されたMMUをONにすると変換のoverhead分clock数の増える instructionがあったような記憶がある。だからOFFで使った方が速い。 いまの汎用CPUはMMUをOFFにして使うこと自体がまずないから その差を知りようもない。単なるlatencyの内訳扱い。 Crayは仮想無かったんだよね。全ては物理16MBに納めろと、それが漢だと そういう文化だった。
>>11 >>絶対番地は使えない
>>相対addressing mode限定、
>>そういう意味ではclock数とbyte数の「若干」多いinstructionを主に使うことになるよ
やっぱりそうなのね
>>真鍋かをりの胸に気を取られて、内容については上の空だった…orz
内容はどうでもよかったけど、核融合の実験施設がサイバーで
かっこよかった
>>12 昔、雑誌で組み込み用CPU(確かPPC403)のMMUオンとオフの
比較試験が載ってた
その結果も、もちろんMMUオフのほうが速かったんだよね
>>Crayは仮想無かったんだよね。
CRAY-1のメインメモリは、メインフレームのキャッシュくらいにしか
使われないECL SRAM
超高速を達成するためにはアドレス変換のレイテンシさえ
もったいなかったんだと思う
この潔さって現代にはないよな
15 :
レトリック君 :2007/03/04(日) 00:25:25 ID:eb/Q7HMz
仮想addressingはもはや捨てられないけど swapなんか止めちまえって提案は出るよ memory数十GBに対してswapなんかいらねぇだろう それを止めてもう少し速くできないか、ゴルアと
>>14 MMU有効になってるときは、たとえphysとlogが
一対一でマップされてるようなケースでも
TLBキャッシュ外したらTLB再ロードするんでないかい?
いずれにせよ、TLBに限らず昨今の高速プロセッサはキャッシュ前提。
17 :
レトリック君 :2007/03/04(日) 00:43:29 ID:eb/Q7HMz
>>16 物理と論理が対応はレアケースだと思うけど、
latencyの内訳として
D-cache miss率(L1,L2,L3)
I-Cache miss率(疑似べくにより増加傾向w)
TLB-miss率
くらいは当然見るでしょね。実効効率を語るときは。
18 :
レトリック君 :2007/03/04(日) 00:48:52 ID:eb/Q7HMz
いけね外した、 missしたTLBをloadし直すまでは 対応関係分からないから やっぱ再loadするんじゃないかな、と思うよ
そういや、マカーは平均年齢がかなり高いって聞いたな アメリカの調査だけど
8086も論理64KB、物理1MBである 21264も一部の命令は分解して実行する
Alpha並の高速POWERと聞いてX704を思い出した俺。
22 :
Socket774 :2007/03/04(日) 11:41:55 ID:KTDjqNBR
>>14 CELLのSPEは変換無しの256kだから似たようなもんだろ。
XBOX360のPKとかいう田んぼ形のCPUの方が正直好きだが。
INTELのは奇形児か
24 :
Socket774 :2007/03/04(日) 13:23:27 ID:2liT37LT
>物理memory空間をheapの様に >分託して管理するmemory領域のことであり 不自由な日本語を読むのはもう飽きた!
25 :
MACオタ :2007/03/04(日) 15:17:11 ID:4D+WkUI7
レトリックさんが、しつこくMacOSに32KBの制限があると言い張ってるみたいすけど間違いす。 32KBってのわ、リソースサイズの制限であってmallocとかでヒープに確保するメモリの話じゃ ないす。 (ただしコード用のメモリも"コードリソース"として実装するのが推奨だったことわ事実) 当時のMacOSわ128KBのメモリでやりくりするために、半自動ガベージコレクション機能がついて いて、ガベージコレクション時にメモリ上のオブジェクトの取捨選択をするために、コードやデータ をリソースという単位で管理していたす。ファイルシステム自体がリソース化したオブジェクトの 扱いが便利なようにファイルを「データフォーク」と「リソースフォーク」に分けていたのわ、良く 知られているかと思うす。
実装の詳しい形態なんかわかんないんだけどさ、 MMUがないのなら、32KBセグメントのような仕組みがないと メモリの動的割り当てができないんじゃねーの?
>>26 フラットなメモリ空間をOSを含む複数のプログラムで共有するやり方なんで、問題ないす。
フラットな空間だから問題があるのでは。。。。
>>28 MacOS APIでのメモリ確保わポインタじゃなくてハンドルで行うので、あまり問題わ出ないす。
もちろんこれゆえにヒープメモリわ使い難いし、時々再起動しないとメモリの断片化で色々
不具合もあったす。
>>26 つか128KBしかないのにセグメント単位が32KBじゃ動的割当の役には立たんでしょ
31 :
MACオタ :2007/03/04(日) 15:48:31 ID:4D+WkUI7
余談すけど、旧MacOS的なフラットなメモリ管理ってアプリケーションごとにコードのアドレスが 異なるすから、仮にバッファオーバーフロー等が発生した場合でも"jump xxx"的なやり方 で危険なコードを実行させることわ不可能す。 昨今の深刻なセキュリティ問題を考えると、良かったじゃないすかね。。。
>>31 マルチタスクできないOSをいまさら懐古してもしょうがない
33 :
分託君 :2007/03/04(日) 15:55:29 ID:LcfOad48
Plusまでの64K ROMにはsegment manager/loaderに32Kの制約があったのでは? 下位互換性のためにしばらく後まで足を引っ張った こういう話し不毛だ…
>>32 co-operativeマルチタスクも、立派なマルチタスクだと思うすけど。。。
殊に昨今のようにコアが増えてくれば、タスクスイッチのオーバーヘッドが無いというのわ悪くない
と思うす。。。
ちなみにフラットなメモリ管理のマルチタスクOSってOS/400とか色々あるかと思うす。
OS設計について語れ ……板違いじゃね?
>>33 ---------------------
segment manager/loaderに32Kの制約
---------------------
コードリソースを扱うAPIだったかと。
37 :
分託君 :2007/03/04(日) 16:01:39 ID:LcfOad48
分かってんじゃん。だから32Kに納める苦労をしたの。
いいかげんスレ違いだと思うす。。。
40 :
分託君 :2007/03/04(日) 16:13:46 ID:LcfOad48
当初Pascalしか無かったんでmallocはどうか覚えてないけど この32Kの壁は'84から数年間頭痛の種だったんだよ。 有名な話なんだけどな…勘違いに興味無いし、ムキにならんといて。
42 :
分託君 :2007/03/04(日) 16:19:53 ID:LcfOad48
BIOSやAPIの実装はCPUと関係ないです。 mac板へ帰りやがれです。。。
68kでの32k制限って相対アドレッシングの制限から きてるんじゃないの?
>>42 英語読めるすか?あなたの引用先に書いてあるす。
---------------------
There is nothing in the Mac or 68000 that REQUIRES a 32K limit,
---------------------
46 :
分託君 :2007/03/04(日) 16:25:09 ID:LcfOad48
下の方だよ Straight Story on 32K Limits 68000自体には制約はない、しかし…ってとこ。
>>46 その"Straight Story on 32K Limits"の2行目が
>>45 に引用した文章すけど(笑)
MACオタは2行目まで読んでお疲れのようです
49 :
分託君 :2007/03/04(日) 16:31:07 ID:LcfOad48
The 64K ROM resource manager had a bug that it sometimes barfed for resources longer than 32K. This was fixed in the Mac Plus, and the later Segment Loaders handle longer segments just fine 疲れる
連続した空き領域だけを確保して、 プログラムが巨大化したときのことは、 将来の拡張にまかせときゃよかった
51 :
MACオタ :2007/03/04(日) 16:33:48 ID:4D+WkUI7
分託さんがリンクした文書に書いてあることわ、
1. Plus以前のMacOS ROMのバグによるリソースサイズの制限
2.
>>44 さんの書いたISA中の16-bit相対アドレスの制限によるサブルーチンコールの問題
3. 一部開発環境でのグローバル変数のサイズ制限
4. 一部開発環境での配列サイズの制限
4についてわ、ヒープメモリ自体ににそういう制限わ無いすから、ここで言及されている通りの事態になるす。
---------------------------
[Note: neither Lightspeed Pascal nor Lightspeed C will allow arrays over 32K.
---------------------------
やっぱりCPUと関係ないです。 mac板へ帰りやがれです。。。
>>49 リソースとヒープの区別も無しにMacintoshの開発してたすか(笑)
54 :
分託君 :2007/03/04(日) 16:34:53 ID:LcfOad48
しかし制約は実在したわけで、ムキになるのはやめて。不毛なので。
セグメントローダーもオーバー32KBに拡張されたことで めでたしめでたし
ヒープの話にすりかえているのはMACオタだけだよ
>>56 話の頭わ
>>25 すけど。。。
-----------------------
32KBってのわ、リソースサイズの制限であってmallocとかでヒープに確保するメモリの
話じゃないす。
-----------------------
>>57 リソースサイズに制限があるという話をしていたのに
ヒープには制限がないという話にすりかえようとしているのはMACオタ
>>52 CPUと関係ある
前スレではAIXは単一仮想アドレスだとか
メモリ管理の話題でてたし
60 :
分託君 :2007/03/04(日) 16:40:09 ID:LcfOad48
当初のcompilerでは32Kを越えるloadmoduleは作れなくて苦労した って想い出話を書いたのであって 他人の無知はどうでもよいんですど…
初期のmacって糞なosだから toolboxをすべて迂回すれば、いかようにもプログラミングできるよな
糞固定はきえろ
64 :
分託君 :2007/03/04(日) 16:44:46 ID:LcfOad48
Segment headerのsizeもFarが出る前は16bitだったかな そのへんもう覚えて無くて32Kの苦労だけは印象に残っているから 「かな」なんだけれどもね
>>61 途中でぶったぎらずに最後まで引用するように
「32kBセグメントなんてのもあったよね」 というだけのお話だったのに ヲタのおかげでここまでスレッドがのびますた
x86信者の突っ込むスキがまったく無し
膜ヲタの半可通ぷりがよく現れてる日曜の午後。 当時現場にいなかったやつはすっこんでろ。
>>68 --------------------
当時現場にいなかったやつはすっこんでろ。
--------------------
匿名掲示板で披露された経歴を素直に信じるすか。。。
OSの話はNGワードにしろ レスするヤツはMACオタとみなす
う
出遅れたかな? 32kByte制限の原因の一つは、link命令じゃないの。 ローカルヒープ(というよりろーかる変数専用かも?)確保に多用されるんだけど、 引数が16ビット符号付き整数だけだった。(が、マイナス値を指定してどうなるかは知らない) あとは、絶対アドレスを指定しないで分岐できる命令が16ビット相対アドレスだけって制限もあったが。 これはデータ領域の大きさ制限とは関係ないな。 いずれにせよ、64kByteとか32kByteとかに領域分割されてるわけではなく、 「命令実行時点の」プログラムカウンタやスタックポインタの位置から前後32kByte分ってだけの話だ。
どうでもいいことなんだけど、 8086って条件分岐の即値が8bitしかないんだよな だから条件分岐したいときはjunpを組み合わせる 386以降も同じなの? ってmacro fusionとか言ってるので 同じなんだろう と分岐のオフセットネタ2でした
74 :
分託君 :2007/03/04(日) 22:31:22 ID:SlbZi5JJ
その件に関してはlinkではなくてlea命令でA6動かしてframe構成するなど assemblerだと少々マンドクセーけど、手はあったから越えられない壁ではなかった。 それとは違った話だったけど、もう止めた方がいいわ。 よく分からないがなんか根に持たれているみたいだし。
75 :
Socket774 :2007/03/04(日) 22:59:56 ID:Ll9UOx4L
今どきOSもコンパイラも考慮せずにCPUアーキテクチャを語れるか。 Intelが開発中のトランザクショナル・メモリ支援命令と支援ハードに興味 あるんだが、これもCPUだけじゃなくてOSにコンパイラにチップセットまで 絡めないと効率出ないよね。 昔でもトランスピュータなんて、CSP専用言語のオッカム語専用プロセッサ でリアルタイムOS内臓だったし。 10億トランジスタの有効利用を考えると、マルチスレッドOS支援命令は今後 流行るだろ。
日曜になると、このスレの速度が数倍に上がるな。 ちょっとは太陽の光を浴びてきたらどうかと思うすwww
andoタソ 上手くまとめてくれて乙
っが抜けてたりするけどなw
84 :
Socket774 :2007/03/06(火) 10:06:16 ID:XpgWfaXd
85 :
分託君 :2007/03/09(金) 02:15:25 ID:aYcOn6L0
86 :
分託君 :2007/03/09(金) 02:21:20 ID:aYcOn6L0
しっかし、京速ってどこ行くつもりなんだろうな、 落としどころが見えない。 当初2010完成と聞いた記憶があるけど2011末稼働開始に伸びてるし なんか明後日の方向向いているような… 関わりたくないガクガクブルブル
87 :
分託君 :2007/03/09(金) 02:24:11 ID:aYcOn6L0
お偉いさんが賞を貰ったけど、荷が(ry
reconfigurable processor じゃダメ?
>>88 ってか、結局の所、FPUの数とバス帯域(スイッチ性能含む)で性能の上限が決まる訳で。
reconfigurableってのは限られた資源を有効利用するには有効だけれど、
だからと言ってFPUの数が増やせる訳でなし、バス帯域を拡大できる訳でなし。
勿論、reconfigurable的機能は資源有効利用には有効なので程度取り込まれて逝くのだが…。
90 :
横レス :2007/03/09(金) 16:43:16 ID:uTZUbIHq
>>88 同じソフトを処理させるだけならそうだろうけど
専用回路のほうが電力効率上だけど作りこんじゃってるから汎用性ないよね
じゃ一個の大規模reconfigurable≒いっぱいのASIC
みたいなことじゃないの?
一昨日のNHK,スパコン特集あっておもしろかった。 観た?
>>86 NECのベクトル事業を残すための方便だろ
94 :
分託君 :2007/03/09(金) 23:39:06 ID:hgS7lSTB
reconfigurableのreを抜いてしまった俺ガイル…orz ピーク性能値はFPUや帯域などできまる、そりゃそうだ。 ピークではなく効率が上がる柔軟性があるかなと思ってさ
95 :
分託君 :2007/03/09(金) 23:51:51 ID:hgS7lSTB
単純に考えると 資源の有効利用≒効率向上
96 :
Socket774 :2007/03/10(土) 00:51:34 ID:PX98q8In
マキーノ氏のようなアーキティクチャ〜アルゴリズムまでカバーするような プログラマばっかならリコンフィギュアラブルでも なんでも性能だせるけど普通は無理
計算機と格闘ばかりしてるとサイエンスする時間がなくなるんだよね
98 :
88 :2007/03/10(土) 01:39:41 ID:enltapv8
>>94 コンパイラ技術とか、FPGA調べるとわかると思うけど
リコンフィギュラブルプロセッサは、まだまだ解決しないといけない
問題が多いとおもうよ。前の職場で見てしまったのさ、某プロセッサをw
いちばんの問題は、専用マイクロプロセッサにくらべて
ぜんぜん周波数あげられないところかな。
こんなこと言ってみたけど、前途有望とおもう。
SPEの柔軟性のなさは異常
自分の柔軟性のなさをアーキテクチャのせいにするなよ
GK「トップガンならやれる」
PPEだけ使ってればG4以下ってのは大分納得できた PPEにしろ、FP/VMXユニットは半速、整数ALUは1基じゃね SPEはNでベクトルコンピュータ作ってた老害がかかわってるだけのことはある。 さすがトレンドを全然解ってない。
今年のCoolChipsは何故かスパコン三昧だな。
http://www.coolchips.org/cool10/advance1.html Keynote Presentation
"Introduction of the Japanese Supercomputer Project and its Technical Challenges"(理研)
Invited Presentation1
"A 65nm SPE for a 1 Petaflop Super Computer"
Panel Discussion
"Microprocessor for 10-PetaFLOPS supercomputer"
>>102 >>PPEにしろ、FP/VMXユニットは半速、整数ALUは1基じゃね
なにそのC3は。
105 :
分託君 :2007/03/11(日) 02:53:02 ID:mVAoI/pR
税金使って変なコンピューター作って 実質失敗に終わると思う。
>>102 スカラとベクタの比率的にそれが適切なんだよ
>>102 つーか普通に同クロックのCore 2 Duoの方が速いよな。
108 :
Socket774 :2007/03/11(日) 11:17:42 ID:X3p23P1f
本来はintelx86の後釜になるはずだった、IA-64もx86に食われたな。 当分はエントリーPC・モバイルPCから小中規模サーバはx86の天下だな。
109 :
Socket774 :2007/03/11(日) 17:34:29 ID:XJmvcmV5
紙に「CPU」って書けば良いとおもうよ。
110 :
学生 :2007/03/11(日) 17:42:07 ID:2i15L/F8
ここの人達ってCPU作る職業ですか?
いいえ、CPUを批評するニートです
突然だけど、本命はメニーコアとかダイナミックリコンフュギュアラブル プロセッサじゃなくてGPGPUだよな よく考えたらCPUと同等かそれ以上の演算ロジックがあるのに、 グラフィックスにしか使わないってのはもったいない 処理の一部(でも実行時間にしたら8割以上のような)だけを CPUからオフロードするってのが近い将来、一番 可能性高いんじゃないかな?
スレ違いなんだけどさ、今日昔のSGIのマシンをググってたんだよ でね、onyxみたいな昔のSGIのハインエンドに使われてたGPUって 1チップじゃないどころか、1ボードでさえないんだよね うーん
昔の汎用機のCPUも1ボードですらなかったわけだが リコンフィギュアラブルは完全に実用化されてるよ フィルタ以外に用途はないが
Cellは劇的劣化G5(+FGMT付き)+DSP数個
>>98 クロックが低くてもそこそこ性能が出るので消費電力的にDSPより良いとも言える
消費電力の高いCellはどうすれば
数KBの内蔵メモリしかプログラムエリアのないDSPでやるような ことしかできないんじゃ応用の範囲が狭いという罠
プログラムが困難だったり、マクロセルっつーか演算器間の スイッチ、インタコーネクトがしょぼくて、効率が高くないとして、 演算器が遊んでる=低消費電力なわけで、それそれでメデタイかも
>>115 PS3に関してはPPEとSPEが密結合してないのに無理にオンチップに
したのが駄目なんじゃないの。
たしかにSPEへのタスクのディスパッチって、PPEでソフト的に やるもんだからオンチップにする必要なかったよな ただそれを言うのならジオメトリ演算はGPUでやるから ceel自体必要じゃ以下(ry
GPU機能をCellだけでまかなうつもりだったのに 規模縮小してnVidiaに劣化GeForceの作成を依頼してまかなったのが敗因かと だからあんな支離滅裂な設計になってしまった。 汎用処理にそこそこ強いCPU+プログラマブルシェーダのほうがバランス良い ってことだろうね。 360のシングルスレッド性能はそんなには高くはないが、3コアはあるからね。 Linux使うなら360で動かした方がはるかに実用性ありそう。
>>121 ていうか密結合してるSIMD演算器がないからプログラマが性能出すのに
すっげ苦労してんじゃないの? PS3で組んだことないけどさ。
その意味ではPOWERコア全てに等速のVMXを搭載した360のほうが扱いやすい罠
たぶんさ、並のプログラマなら同クロックならCore 2 Quadがいちばん性能出せるよw 天才は知らんけど。
>>125 x86しか扱えないことを自慢するプログラマいそうだな
まぁ256KBローカルストアじゃ何書いていいかわかんないだろうね
そう思う。 Core 2はスカラ処理ブロックとSIMD処理ブロックが密結合されてるから、 すげー扱いやすい。 整数のSIMD性能がすさまじいし。
cellの問題点 1 .疎結合なのに論理アドレスが256KBしかない 2. ↑以前に日本のゲームプログラマは、並列の経験がない 3. ↑実はそれ以前にメッセージパシングや同期をやる ミドルウェアがつい最近までなく、出たばっかのcray-1や 初期のMPPみたいにツールをつくるとことからやらなけれ いけなかった な希ガスる
>>104 演算ユニットをG4,G5並の贅沢構成にしたら
今より遙かに大きいダイサイズになって生産段階で死亡。
ダイサイズ固定でSPEの数を減らして帳尻合わせると
今度はヘテロジニアスコアとして死亡。
・・・という点を踏まえると結局そういう形に落ち着くわけだ。
90nmプロセスで無理に無理を重ねたネタCPUがCELL。
>>129 日本以外のプログラマも苦労しているからそゆ問題ではないと思う。
そして苦労した結果が「ゲームでは3ないし4スレッド並列しか使わん」なので。
結局のところ、CPUに拘る必要なかったんじゃないのかと。 今のところゲーム用としてはSPE3個くらいしか使われてないみたいだし 逆に360の勝因(北米での)はなんだろうね。 単純に先発の強み?
133 :
Socket774 :2007/03/11(日) 20:25:17 ID:7l50+w86
だってゲームで単純な1種類の演算でCPUパワーの9割方を食うなんてことないものなあ。 1/60秒で同期しなきゃいけないし。
どうみても特定HPC用途向けの設計です ベクトル屋の老害が無知なゲーム屋を騙して作らせたCPUと。 360はアメゲー色が強くて受け付けづらいのかな。 日本でもっと売れていいハードなのに。
>>135 でかいから嫌。
ギャルゲーやるならPS2で十分w
まぁハード面の作り込みが甘すぎると思うよ、360は。 ディスク削りも相変わらず直ってないし… 中身はいいと思うけどね。 逆に言うと、ハードを作り込まれると脅威。
138 :
Socket774 :2007/03/11(日) 21:13:11 ID:GBZtI0ll
http://piza.2ch.net/mac/kako/966/966886633.html 少々長いがMACオタの見苦しさが詰まった過去ログ
ちなみに。
MACオタは2ch開始初期から生息しており、主にMac板へ粘着。
知ったか、無意味な勝ち誇りレス、誤訳、自作自演、Winユーザー挑発、などの行いを繰り返した
Mac板住民の話し合いでMac板を追放されるが、粘着し居続ける。
オタを含む荒らしの所為でMac板が分割される事になったが、ID付きの新板に対して
2ch管理側を酷く非難、「もう来ないと」宣言し自らの信者とともに「2編ch」へ逃走
だが、オタに従って2編chへ来た信者は殆ど居なかった為、太々しく新Mac板に寄生する事になった。
時は流れ、ゲーム系やその他の板へも寄生を始める。
突っ込まれたら転進ってのは昔から変わってないな。 ここまで進歩が無いのはすごい。
俺2000年から自作板にいるけどその頃はMACオタなんていなかった気がする。 2002年ぐらいからかな。
MACオタ 抽出レス数:214 どんだけスレを占拠すれば気が済むんだよw にしても、2000年から何も進歩してないのにはワロタw
創価学会インターナショナル
しかし、MACオタ批判できるなんてこのスレくらいじゃないか? 次世代スレ住人などはもうあれだろ…
スマソ
このスレの住人ならわかるだろ?
なぁこれなんで?
3GHz > 2GHz じゃねーの? シングルスレッドでもC2D 2GHz の方が速い理由が分からん
Pen4 3GHz って3GHzじゃねーの?
↓
691 名前:Socket774
2007/03/11(日) 22:13:54 ID:vNv0G+NH
C2D 2GHz x2 と Pen4 3GHz で、1プロセス動作させた場合
どちらが速いでしょうか?
695 名前:Socket774
2007/03/11(日) 22:27:28 ID:7QEYkGqv
>>691 E6300(1.86G)とD945(3.4G)ですらほぼすべてのベンチでE6300の方が速い。
147 :
分託君 :2007/03/12(月) 02:09:16 ID:yZY28YYz
>>145 E6300(1.86G)とD945(3.4G)をきちんと性能分析・比較したことはないけど、
実効効率がE6300(1.86G)>>D945(3.4G)であれば
clockがE6300(1.86G)<D945(3.4G)であっても
性能(という言葉はあまり好きではない、programの実行時間)は
E6300(1.86G)>D945(3.4G)となることはあるよ。
clockだけで性能が決まるならば、苦労は無いよ、マジ。
ただし、1.86Gと3.4Gで性能が極端に逆転なら
一方の長所と他方の弱点に嵌った希ガス。
ところで、E6300(1.86G)はdualの性能じゃねーだろうな(ーー;;
こんな事まじれすしてもしゃーねー。寝るべ。
148 :
分託君 :2007/03/12(月) 02:10:43 ID:yZY28YYz
あD945もdualか。 がしかしあれはヘボ
アーキテクチャが根本から違うから。 Pen4で1命令10クロックかかってたのがCore2では2〜3クロックなんてこともざらにある。 SSEのpand xmm0, xmm1なんて命令はNetBurstでは2クロックで1命令発行だが Core 2では1クロック3命令発行できる。 まあこれは1例。 クロック数の分Pen4のほうが速い処理もあるにはあるが、 そんなには多くない。
152 :
分託君 :2007/03/12(月) 02:52:15 ID:tHv14sPn
core2はincacheのsuperπ速い。 core2用にrecompilerしてscheduling tunigしたわけでもないのにさ。 あれ、なんでかな。superπのcode見た人いる? なんでかなー、なんでかなー。
153 :
分託君 :2007/03/12(月) 03:17:15 ID:dlu1180h
他がincacheでも遅いという面から見た方が手っ取り早いのかな
キャッシュの転送帯域がL1キャッシュなみでしかも比較的レイテンシ低い。 32byte/clockだったっけな。 寝る
ネットバーストの差をクロックで埋められるとしたら、 FSB帯域取り合うとかそういうことぐらいしか思いつかん。
cellがやりたかったのってGPGPUだったのかな…
ネットバーストは名前の通り、 いくらクロックを上げても無駄な計算でバーストするだけだ。
>>156 Cell単体で性能が期待できなかったからあわててヌビくっつけた
くたがやりたかったのはCPGPU
クタがやりたかったのは世界一美しい建築
クタ「突貫工事を敢行する!(涙」
>>123 ?
CELLのPPEにはVMXがあるのに?
まさかと思うがSPEで演算処理してると思ってるのか?
とはいえ2issueのFGMTじゃ等速あっても無駄だろうけどな。
見れば見るほどよく分からないCPU それがCell
2001年、デュアルコアPOWER4が登場。 ↓ 4年後、Athlon64 X2 Pentium Dが登場。 「これが世界初のデュアルコアCPU!今年がデュアルコア元年だ!」 ↓ その前後でCellとXenon CPUが登場 「え?8コア?3コア?なにそれ;;」(マルチコアを最近覚えた人間=x86に閉じこもった人間 なので、8コア以外のデータは読めない) ↓ 井の中の蛙でも解るCell解説が入る 「ほーら、Cellはやっぱウンコじゃんw」 ↓ POWER6が5GHz弱で発売予定なのが発表される 「ぷぷっ、クロックを上げないのが業界のトレンドだよw…え?TDPそのまま?」(注:×業界トレンド ○x86のトレンド) ↓ POWER6のあうとおぶおーd(あまり解説がないので知らない) 今ここ
実際問題PPEのVMXの性能はセレロン以下だしな
>>166 お前、それしか持ちネタないわけ?
毎度やってるけどx86系の人間だからといってpower系を無視してるとかいう事はないわけで。
このスレでは特に。
どれだけ視野狭窄してんだよ
それはともかくとしてPS3ってよく分からない構造してるよな
Cell自体よく分からんが。
170 :
分託君 :2007/03/13(火) 01:56:17 ID:FcORHNwz
Power4は'99にMPFの論文を読んでいた記憶がある。記憶違いかな? OpenMP1.1も確か同時期で、論文読んでインプリをdiscussionした記憶が。 PCの世界ではCoppermineが秋のIDFか何かで800MHzでも ヒートシンクのみで稼働とか、お露目してた(実は無理)。 嗚呼これでやっとPCもまともなCPUの時代に入るのかなと笑談した記憶がある。 21264Aは500MHzから667MHzに上がって一見無敵のように見え(実は事業がry)、 次の21364はlocal memoryかよ、とか、 SGIはR12000から次どうすんねん、IA64かよゲラゲラwとか そんな話に仲間内で花が咲いて、何となく印象に残っている年。 今年もそんな曲がり角の年になりそうな予感。
171 :
分託君 :2007/03/13(火) 02:00:08 ID:FcORHNwz
Coppermineって2000年秋のIDFだったかな、もう良く覚えてネーや
ええっと、理研のシンポジウムってどうだったんでしょう?
173 :
分託君 :2007/03/13(火) 02:04:32 ID:FcORHNwz
PS3 Cellの構造は難しくない が、しかし使いにくそーだな、何考えてんだか。 使いこなしに手間暇かかる構造は、市場が構築される前にobsolateになる恐れありw
Intelの80コアよりましじゃない? あれもどういう風にプログラム組むのかよく分からんな。
176 :
分託君 :2007/03/13(火) 02:07:10 ID:FcORHNwz
理研ってペタの話? peak性能狙いの超並列見たいなものだろ。 computer archtectureの本質とは関係ないよ。 気にしなさんな。
177 :
分託君 :2007/03/13(火) 02:11:48 ID:FcORHNwz
D-Wave Systemsの16qubitsはインチキなのか否か…
179 :
分託君 :2007/03/13(火) 02:46:28 ID:FcORHNwz
愛度お馴染みちり紙交換TOP500の話 受賞の話 BMTコンテストの話 MDの話 構造流体連成multi physics 遺伝的アルゴリズム 連成の話 Intel 80coreカタワ試作chipの話 Clusterの話
というわけで姫野さんのを見物。姫野さん正直すぎ、、、 それともあれは何か高度な戦略なのかしら? 姫野さん何か言ったのか?
181 :
分託君 :2007/03/13(火) 23:56:23 ID:nL3NRhMb
メオトなのかな、知らないけど。
182 :
Socket774 :2007/03/14(水) 20:31:07 ID:CFceg8AR
>>156 元々は4チップをSIPで1チップにして1TFlops出すはずが、発熱の
問題が解決できずに1チップ化で256GFlopsにダウン。さらに4GHzで8コア
は量産きついから7コアで3.2GHzにダウン。性能足りないからGPUもって
きて、無理やり1TFlops越えさせたら、酷い構造のゲーム機になった。
>>182 いやーGPUなかったら当初の1TFlopsでももっとひどいことになったと思うけど
> 講演しながらでてはまずいところを編集して消すという大技を使ってた うはwそういうことか
185 :
分託君 :2007/03/15(木) 02:39:15 ID:HDx3GAMc
パンチラと同じ心理か?
187 :
Socket774 :2007/03/15(木) 07:15:36 ID:hlTO5LyV
x86⇒PCで成功 Mips ARM PowerPC⇒ゲーム機 携帯等組み込みで成功 IA-64 Power⇒ハイエンドサーバで成功 PA-RISC⇒IA-64に統合 Sprac⇒性能もイマイチ 組み込みもサーバも上手くいってない 一番将来性なし。
なんでこんなところに貼って 自分が落札する確率を下げるのか
シュピーンシャ?
金欠で入札できないから。
新品未開封てことは 動く保証も無いわけだろ。 こんな古物じゃあまだ 「外すまでは正常に動作していました」 の方がマシ。
石(ImPP)だけ生きてれば個人的にはオケ。 入出力は16ビットパラレルの単方向ハンドシェイクだからI./Fなんかはどうとでもなるし。
あ、18bitだったっけか?
壊れるもんじゃないだろ。 それに買っても使わないだろw
196 :
分託君 :2007/03/16(金) 01:11:28 ID:/fJ6hZbT
すわ、LMIかDoradoの未開封新品(w でも出品されたのかなと 妄想逞しくして覗いてみれば…orz
lispマシンならeBayにあるだろ
英語は厨房以下なので ヤフオクしか使えません
199 :
182 :2007/03/16(金) 22:36:54 ID:KsNpHahz
>>183 「あのリングバスで帯域増やさずにレイテンシだけ増える32コアって
誰が使いこなせるんだッ!!」ってこと?
200 :
Socket774 :2007/03/17(土) 17:06:12 ID:ycpTeLRD
どこまでPS3を擁護できるかという限界チャレンジを行ってるんだよ、後藤さんは。
PS3に関連してcellネタをひとつ IBMが今度米政府に納入するスパコン、ロードランナーには cellが搭載されてるんだよね でも、このマシンのポイントはcellじゃないと思うの 今までのIBMのHPCっつーと、準メインフレーム級の Powerサーバーを繋いだもんだったけど 今度のは安価な4ソケットオプテロンサーバーを つないだのと、cellブレードの混合になるんだ これって、とうとうIBMもHPCで高いマシンを使うのをやめた、 コンピュータの歴史ってのは、高いマシンを安いマシンで置き換える、 昔の言葉でいうとダウンサイジングの記録としての側面を持ってると 思うんだけど、今回のはあのIBMもって意味で、ひとつの節目だよね まぁ技術的に新しいことは何もないんだけど
自作住人 『指摘は適当だぜ』
205 :
分託君 :2007/03/17(土) 19:04:19 ID:WuSuIEpE
IBMのHPC戦略は一枚岩ではないでしょ。 まさか製造業顧客の解析部門にロードランナーをプロモしたって 買って貰えるわけないよ。変な物持ってくるなの一括だろ。 ピーク性能だけで考えてちゃダメだよ。
ロードランナーというとどうしても光線銃で穴掘る奴を思い出す。
207 :
分託君 :2007/03/17(土) 19:07:57 ID:WuSuIEpE
実は俺も。そしてスタコラクラッシュ。 ノシ
208 :
Socket774 :2007/03/17(土) 21:17:11 ID:Jcni05jk
UltraSparcVもしくはUltraSparcWをキーワードにGoogle検索すると やたらに中国系のwebが引っかかる。 中国はSparc好きなの? それとSpracのSIMDであるVISはそれなりに拡張されてるの?
マルチバイトなローマ数字で検索してるからジャマイカ
ロードランナーと言えばアメリカーンなアニメだろ
ぷっぷー
ネットランナー
213 :
Socket774 :2007/03/18(日) 11:27:42 ID:TS7OlaIC
しかし、Sparcて3になってもDDR2サポートしてないんだな。 SpecCPUだと同世代のPen4に迫るパフォーマンス(FPU)なんだから DDR2サポートすれば良いのに。
>>213 US4の新型のチップセットが投入できない
DDR2じゃなくても、メモリ帯域がそこそこ確保できてる
US3iやUST1はDDR2対応でつ
>>205 TOP500を眺めてみたらpシリーズクラスタ、BG/L以外にも
IAサーバクラスタやPPC970クラスタがたくさんランクインしてた
<IBM
部門や担当、顧客の要望次第でつね
SUN USのホームページ見たら富士通製PRIMEPOWERが ラインナップされてた 日本のSUNのにはないのに APLって出たたんだね
216 :
Socket774 :2007/03/18(日) 19:11:12 ID:TS7OlaIC
UltraSparc1/143Mhz=PentiumPRO/200Mhz UltraSparcU/500Mhz=PentiumB/1Ghz UltraSparcV/1.5Ghz=Pentium4HT/3Ghz UltraSparcW=Core2DUO SpecCPU2000のfp比較だとこんな感じか。 現行のSparc用SIMD命令であるVISとCore2のSIMD命令SSSE3のパフォーマンス 比較については知らない。 個人的にはCore2のSSSE3の方が上と思ってる。 (SUNがマルチメディアに力入れてるとは思えない)
SunはSIMD整数命令は大したこと無いと思う。 Core 2は化け物
あとPenIII/4の128ビットSIMD浮動小数命令はクロックの半分のスループットだけど Core 2は全部1クロック
220 :
Socket774 :2007/03/18(日) 19:27:38 ID:TS7OlaIC
VISってUltraSparc1の頃からあまり拡張されてないような気がするんだが。
221 :
Socket774 :2007/03/18(日) 19:30:34 ID:TS7OlaIC
222 :
Socket774 :2007/03/18(日) 19:33:21 ID:TS7OlaIC
しかし、x86がここまで性能上がるなんて90年ごろに予測できた やつなんているか? あの当時はx86=時代遅れアーキ=将来はRISCっていう論調だった。
RISCって基本的に命令セット拡張しにくいからね
Wireless MMXにせよコプロセッサ命令扱いだし
>>219 ほぼ詐欺だなそのプレゼン。
命令フェッチ帯域に関してはその通りだけど、ClovertownもBarcelonaも
ロード・ストアは128bitのロード・ストアをクロック毎に各1命令発行。
Barcelonaは128bitロード×2としても使える。それだけ。
命令フェッチは45nmプロセスで改善してくるだろうし、SIMD整数命令に
関してはCore 2に分がある。
>>219 本質的にSIMDわ、命令帯域を浪費せずに多量のデータを扱うために存在するので
命令フェッチの帯域わクリティカルじゃ無いす。
同様に多量のデータをストリーム処理するためにキャッシュバイパスをISA導入/活用
することが普通なのでデータキャッシュの帯域もどの程度利くかわ、現状で何処がボトル
ネックになっているか次第の話す。
225 :
分託君 :2007/03/18(日) 22:09:53 ID:890Rebqh
>>224 キャッシュバイパスをISA導入/活用
しているのはどのarchitecture?
実際たいした問題じゃないと思うけど 命令フェチ幅がネックになってるのは明らかだろ intelが当初64ビット拡張に予定してたヤムヒルって x64より命令長が短めな命令セットだったんだろうな あるいはCore2アーキテクチャが 64ビットで使われることをあんまかんがえてなかったか
レジスタ拡張は入れずにそのまま64ビット化する予定だったみたいだね。 16byte/clockのフェッチ帯域で4バイト長の命令を4命令フェッチできるが REXがつくだけで5バイト。3命令しか取り込めない。 Memory Disambiguationとかレジスタの少なさを解決するものだから レジスタが増えると旨味が比較的少なくなる。
>>225 SXシリーズでは?
キャシュバイパスっつーかキャッシュがないが
VISもUS1の頃は大活躍だった
US3の時代になると、PCワークステーションに
マルチメディア(死語)用途の主流が移ってたけど
95年くらいだとSUNの機械で
PhotoShop使ってる人いたんだよね
メモリ1GBとか積んで
229 :
分託君 :2007/03/18(日) 22:41:31 ID:id7XHpzX
>>228 そりゃそうなんだけどさ…
「キャッシュバイパス」って書いているし
vectorのSIMDとは違った文脈で出てきた話しだから
どのarchかなーと思って。
実際そういうload命令備えたCPUもあるけど、
あれは普通とは言い難いし…
>>225 特に探すまでも無く、MMXとかでも"MOVNTQ: Move Quadword Non Temporal"なんて命令が
あるす。
231 :
分託君 :2007/03/18(日) 23:46:27 ID:TGwYO3mt
>>230 これ、多量のデータをストリーム処理するための命令なの?
cache archで多量のデータをストリーム処理するためのload命令の方は普通なの?
232 :
分託君 :2007/03/18(日) 23:48:00 ID:TGwYO3mt
バイパスが抜けた。 cache archで多量のデータをストリーム処理するための cacheをバイパスしたload命令の方は普通なの?
>>232 ショートベクトルのSIMDでわ、ロード側のバイパスわ聞かないす。
234 :
分託君 :2007/03/18(日) 23:52:49 ID:TGwYO3mt
純粋な疑問で、悪意ある突っ込みではないので
若干近い例わ、Altivecの"LVXL: load vector indexed LRU"すかね。。。 読み込んだデータのキャッシュラインを最優先パージの設定にするす。
236 :
分託君 :2007/03/18(日) 23:57:55 ID:TGwYO3mt
>>233 ショートベクトルって何を意味しているのか分からないけど
ベクトルならcacheは関係ないからね。
cache archでcacheをバイパスしてloadしたら
狭いmemory throuputの直撃受けて、SIMDでブチ回す演算器に潤沢な
データ提供できない、つまりSIMDのためのものとは考えにくいし、
大きなlatency隠匿するための長いload pipeline controlが難しい(最悪parge)、
in cache しているlineとの整合が難しいなどの
問題大ありで、殆ど使い物にならなかったからさ
237 :
分託君 :2007/03/19(月) 00:00:52 ID:S1Hq1JIe
>>235 それは、stride accessやlist経由のrandam access時の
cache hitが見込めない上、
line転送なんてバンドの無駄だから要らない
ってところが目的の命令ではないかな?
SIMDでの大量データ処理と結びつけられる?
238 :
分託君 :2007/03/19(月) 00:04:32 ID:S1Hq1JIe
邪推だけど「ベクトルloadッぽい命令も追加しておけば なんかの役に立つかもね」くらいのノリじゃないかと思うんだ。 cache archでは。
>>237 ストリーム処理 = 「stride accessやlist経由のrandam access時のcache hitが見込めない上、
line転送なんてバンドの無駄だから要らない」
ということで良いと思うすけど、何かおかしいすか?
240 :
分託君 :2007/03/19(月) 00:11:05 ID:S1Hq1JIe
>>239 んなことないよ、cache archで性能出すなら
とことん連続にデータ並べてline転送早めに発行して
in cache でブチ回して実効性能をピークに近づける。
stride/listは極力排除、除去できなければ性能は地を這うから
>>240 確かに「stride accessやlist経由のrandam access時」わ余計な引用だったす。
要は"cache hitが見込めない"という話す。
その上で、大きなデータを処理するという範疇にわ大きな配列の和を取るだけなどという演算の
負荷がほとんど無い処理が少なからず含まれるす。この手の処理わプリフェッチよりキャッシュ
汚染の防止の方が重要だと思うすけど。。。
丁度STREAM benchmarkの内容のような処理の話ということで。
http://www.cs.virginia.edu/stream/
242 :
分託君 :2007/03/19(月) 00:22:38 ID:S1Hq1JIe
そう。 得に最終計算結果のstoreでは皮肉にもキャッシュ汚染回避が主目的に使われる。 cache archでは、memory直接見に行ったら、 ハイそこまーでよ、だから。
243 :
分託君 :2007/03/19(月) 00:23:57 ID:S1Hq1JIe
ということを考えて最初の疑問を書いただけ。 おやすみノシ
244 :
分託君 :2007/03/19(月) 00:26:33 ID:S1Hq1JIe
あ、あとSMPでのmemory同期のからみもあって cacheにのこさないstoreを使うこともある。 でもこれは出だしのSIMDとは全然別の話し。寝る
キャッシュヒットが期待できない配列とかデータ構造でも 可能な限りライン単位にまとめないと性能全然出ないし
246 :
分託君 :2007/03/19(月) 00:37:56 ID:S1Hq1JIe
並べさえすればhard prefetchちょっとは効くしね streamが少なければ… ーみつをー
>>245 通常「メモリのバーストアクセスの単位 = キャッシュラインサイズ」なので、それわ当たり前かと
思うす。
248 :
分託君 :2007/03/19(月) 00:43:05 ID:S1Hq1JIe
連続ならline alignはそれほど影響ないと思うんだけど… どのみちline転送がバンド一杯ひたすら繰り返されるわけだし。 いけね寝なきゃ…
249 :
分託君 :2007/03/19(月) 00:50:59 ID:S1Hq1JIe
ただし、softパイプがtiming合っていれば ーみつをー
たしかに連続してたら、ラインまたがってもいいよな でおやすみ
251 :
Socket774 :2007/03/19(月) 22:01:28 ID:aC5ub3so
P6あたりで内部RISCって表現が使われだしたのに違和感感じる奴ってどのくらいいる? 個人的にはむしろワイヤードでパイプライン化して最小命令サイクルが1になった486 でRISC化と感じた。 PentiumがVLIWでP6はマイクロ命令復活でCISCに戻った。 K7でナノ命令まで出てきて、68000並に複雑になったなと。
K7って2段階マイクロコードなのか 知らなかった かつて、TRONの坂村氏いはく、 「RISCは垂直マイクロコードを主記憶に展開したもの」 LISPプロセッサの水平マイクロコードは ほとんどVLIWだったものが多い、らしい
intelチップのデコーダって コンプレックス*1、シンプル*2以上で 高コストの命令じゃなくて 低コスト命令に最適化されてるよね そこらへんがRISCだと思う IBMメインフレームだと、コンパイラがはくコードじゃなくて 昔アセンブラで書かれたコードに最適化されてるし
254 :
Socket774 :2007/03/19(月) 22:41:02 ID:aC5ub3so
TRONチップはなんでスタックじゃなくてCISCにしたんだろ。 Forthプロセッサにしてアセンブリ言語を日本語風にしとけば、USAの 圧力に文化植民主義だって言い返せたのに。
conroeとmeromの違いって? 動作電圧の違いだけじゃないの?
>>252 水平マイクロというのはたいていそんなもん
>>254 坂村さんはスタックマシンにしたかったのだが
産業界に泣いてお願いされたのでレジスタマシンにした
と授業で言っていた
257 :
Socket774 :2007/03/19(月) 23:04:12 ID:PyJwfOQ4
それはどうかな?
258 :
Socket774 :2007/03/19(月) 23:22:01 ID:aC5ub3so
>>256 授業って東大の情報科の教授だっけ。
スタックならRiscの6分の1だかのコードサイズなんだから、日立のSHなんか
目じゃないコード効率だったのに。ARMなんてSHの真似して16bit命令拡張した
うえにJAVA(スタックマシン)の高速化のために色々追加してぐちゃぐちゃだ
259 :
分託君 :2007/03/19(月) 23:32:02 ID:UkMddBrA
TRON流行の尻馬に乗ってmakerが自分の都合に合うものを作った、って感じだったかな。 あのころ(80年代半ば〜後半)はRISC CISC論争に決着が付いていなくて RISCの有効性は一部の信者の意見的扱いをされていたと思う。 そのうえTRONは性能を追求したarch.まで考えを巡らさなかったんじゃないかな。 コンサバなmakerなどは、2nd sourceしていたCISCに似ている構成で asm のニーモニックを変えたようなCPU作ってた。 あまり良く覚えていないけどそんな記憶がある。牧歌的だったよ。
坂村さんはバロースの可変マイクロコードマシンでD論書いたくらいのCISC好きなのだ > そのうえTRONは性能を追求したarch.まで考えを巡らさなかったんじゃないかな。 さすがにそんなことはない マイクロコードをフル活用して性能を追求するという方針だっただけ 80年代のハイエンドCISCはどれも似たりよったりの設計だけどね
261 :
分託君 :2007/03/20(火) 00:02:14 ID:RhdMcX/F
穏やかな規約?だっけ、makerの考えた仕様はあまり統制しなかった TRONのポリシーに則ってるよって言ってね、 使う上で必用な仕様は公開してね、(そしてお金ね…) そんな感じで、CPU architectureをこうした方が良い という様な議論は聞こえてきた記憶がないな。 そのうちC-TRONとかどんどん話が膨らんで、301でケチ付いて そのころからmakerが引いちゃって下火に。 301が憂き目の原因みたいに言われているけど、関わったヤシの話では あまり良い評判は聞かなかったな。(301で突っ込まれても早晩…みたいな感じ)
262 :
Socket774 :2007/03/20(火) 00:11:45 ID:y0VqH5L9
しかし非同期式のCPUはどうなったんだ? メモリに追い越されてるぞ
263 :
分託君 :2007/03/20(火) 00:13:26 ID:RhdMcX/F
264 :
分託君 :2007/03/20(火) 00:15:42 ID:RhdMcX/F
dataflow machineみたいにならなきゃ良いんだけどね
265 :
分託君 :2007/03/20(火) 00:23:13 ID:4kaEbIro
ああ、でもmicrcodeがどうのこうのbitでぼそぼそ言ってたかなー。 まるでRISCの黎明期とcross overするかのように。
ところでエッセですかここまでのカキコは?
267 :
分託君 :2007/03/20(火) 00:37:04 ID:4kaEbIro
すまね減らすよ
では最後に非同期式のCPUについて
非同期式のは設計がむずかしいうえに同期式プロセッサが細かい省電力をやるようになったので出番はなかろう
実用化されたのあったっけ、ARMのあれはどうなったよ
>>264 今日日のプロセッッサはデータフロープロセッサである
と平木さんが言っていた
分託君おもろいので俺的にはおk
日本人はCPU作る技術無いの?
アボンできるようにコテにしてるだけえらいよな
>>271 4004と同時期(シャープのやつ)から今日までたくさん作っています
ハイエンドもSPARC64をやってるよ
マイクロプロセッサに限定しないなら、それこそリレー計算機の時代からやってますね
ありがと
>263 実身と自身の区別もつかないみたいだし、ちと信頼性に難ありな気もしますねそれ
このスレってやっぱ情報系の院生多いのかな
おっさんが多いんじゃない?
厨房が多いんじゃない
おじさんだろ。 これスレの住人は全体的に知識量が多いのは確かだが、 最先端のプロセッサのアーキテクチャや将来の話には弱いんだよ。
>>280 >最先端のプロセッサのアーキテクチャや将来の話には弱いんだよ。
鎖国な自作板の中ではこのスレがトップクラスだよな
というかIntel/AMD次世代スレですら、出島にも入れないレベル
まあ、弱いというのは言い過ぎで、 過去の話と現在の話が同レベルくらいかな。 他のスレは現在か未来の話が実利をかねているから求められるし。 おじさんは、最新プロセッサのマイクロアーキの実装の話や最適化の話までは ついてこれない。
どちらにしろまじめに論文読んでるやつはいないわな
284 :
分託君 :2007/03/20(火) 23:32:07 ID:ASFNpnnt
processorの中の話は、書けない話か、あるいは聞伝でしょ。 聞伝に対してレベルって、そんな大層な… 実際に使いこんできた実体験のうち差し障りのない話と、あとは昔話になっちまう。 それにエセarchitecture屋さんには散々騙されて来たから、一見格好いい 用語の概念が次から次へと出てくるけど、自分で確かめるまでは迂闊には 信じられなくて、そんな話を書いても自分としてはしかたないと思っているから。 ソフトウェア寄りの視点から見ているのも違和感の元かもね。 ところで、聞伝でなく本当に性能的にクリティカルな局面でCPUをシッカリと使い込んだヤシ ここにどのくらいいるのだろうか…。べつにすくなくてもいいけど。
チトマテ 聞伝ってナニヨ? それ以外はわりと同意。
伝聞ちゃうん
287 :
分託君 :2007/03/20(火) 23:47:41 ID:ASFNpnnt
齢、ん十歳、本日まで聞伝だと思いこんでいた…orz それはさておき、たとえば$のportふやしたら性能がどのくらあがるかとか、 僅かなもんだし、あんまり面白くないだよねそう言う話し。 多分俺はスペックヲタとは対極の考え方をしちゃうんだと思う。 実装や最適化は回路・デバイス・プロセスの話ならば、 それは大切だけれど、archを構築する創造とはまたちょっと違う気がする。
伝聞つうか受け売り
じゃあ分託の理想とするアーキってどんなやつなの?
ASIC
>>289 分託じゃないが、安くてコード書きやすくて何をやらせても速いやつだな
292 :
分託君 :2007/03/21(水) 00:15:54 ID:w4PV7tid
>>289 唐突だねw
ときどき考えることがあるけど、まだ分からない。ずっと分からないかも知れない。
たぶんいまとは全然違う物だと思う。
演算ネックやthrouput、latencyネックににブロードで柔軟に対応できて極端に
ストールせず、scaleメリットがあってサチりいくく、ソフトウェアからも使いやすくて…
archとしての寿命がそこそこ長くて…
ショート貧乳ツンデレで背高めスレンダーなら尚可
いまとは全然違う何かか
でもそれだとそこで話終わっちゃうんだよね
話ふくらまないなぁ
>>293 それはアーキではなく実装では?
俺だんごだけどCellの性能ヤバイぜ
296 :
分託君 :2007/03/21(水) 00:45:28 ID:w4PV7tid
>>294 壮大なテーマにあまりにも唐突だしw
いずれそう言う話の流れになって、そのときアイデアがあれば書くよ。
いや、会社起こした方がw
297 :
分託君 :2007/03/21(水) 00:46:41 ID:w4PV7tid
>>295 なんでやばいのよ一応、演算器山盛りじゃないw
(確信犯的質問)
CPUは妥協の産物。 理想のアーキなんてCPU周辺を考慮せずに言っても無意味。
300 :
分託君 :2007/03/21(水) 00:54:10 ID:w4PV7tid
倍精度ちゅうドジは踏んでないよね(ーー
>>299 あなたはPS3トリッパーの作者ですね?
唐突って言うけど、キャッシュがどうとかの話はつまらないとか言われると じゃあ何の話すればいいのか困っちゃうわけで なんか実装とは離れたところのアーキテクチャに持論でもあると思うじゃない
303 :
分託君 :2007/03/21(水) 01:03:11 ID:w4PV7tid
>>302 あ、いや人が話しあってる分にはおK
そういうこと散々やってきてあきあきしちゃってるから
俺が話に参加する気にないってだけです。
遠慮なくしてください。
>>301 >PS3トリッパー
そんなものは、まだ無い。
ああ個人的な感想だったわけね 了解 絡んですまんかった
>>300 整数しか使ってない。
めちゃ速いって意味でやばい。
307 :
分託君 :2007/03/21(水) 01:15:15 ID:w4PV7tid
>>306 けっこうなこっちゃ。用途が一つ増えた。
もう少し他の応用で性能調べて、いけそうだったらオモチャに買ってみるか
おやすみ
俺の理想はローカルメモリたっぷり(まあ現実的に256MB以上)ある 強力なSIMD演算器を備えた簡素なコアが64〜1024って感じの代物。 CELLはコア数がもっと多ければわりと理想に近い。
お前には地球シミュレータがおにあいだ
このスレにも幻想は多いけどね。 今、一番ベンチマークによる性能評価が定着してて、 何十もの実アプリベースのベンチによる比較で、厳しく性能評価して 購入されるようなジャンルはPC分野だけで。 サーバーやHPCなんてかなりあてにならないんだよ。 客観的に優劣を比較できるほどのデータが集められないから。 TPCとかLinpackくらいのランキングしかないし、 HPCなんてPCかサーバのおさがり技術で成り立っているから。 結局、PCプロセッサの世界が一番熟成していて、 あとは多少まともなのがサーバくらいだろ。
この手の話題だと、 コンシューマ<<<プロ仕様 っていう勝手なイメージが先走りすぎだけど、 現状のコンピュータの世界は逆転しているのが真実。
>>311 技術トレンド
メインフレーム→サーバ→PC・HPC→ゲーム機
C/P
メインフレーム<サーバ・HPC<PC<ゲーム機
こんな感じ?
大体、業務用の世界だと、 この前H社のマシンをかったけど、大きなトラブルがあったからだめだ。 こんどは、I社にしよう。 所詮、口実がうまくなりたつような方向に進むのが普通。 素人がPCを買うのに、Sで失敗したから、Fにしようとかと 同レベルなんだよね。 オタクの世界はまだ健全だよ。
314 :
分託君 :2007/03/21(水) 11:57:26 ID:d69hpeOK
TPCやLinpackの公称性能で高い買い物の選定はしないよ。 結構いい加減なところもあるけどw 多くのところでは、実用途にちかい非常にシビアな性能評価をするよ。公表しないだけ。 PCはCPUに関しては似たり寄ったりだから大差なくてワザワザ測っても差が… あるいはIntel vs AMDの特徴的なところを強調した比較、世代間比較で閉じぎみでは
315 :
Socket774 :2007/03/21(水) 15:09:39 ID:s2ZwxFGt
POWER5は性能出るんだろうか。CELLのSPEよりはマシだろうが、 結局POWER6でIPC重視に戻りそうな気がする。
316 :
Socket774 :2007/03/21(水) 15:12:59 ID:s2ZwxFGt
>>308 リングバスで1024コアって死ぬぞ。RSAの解読かレイトレかモンテカルロ位
しか使わんのか?
>>313 業務の世界だと「AMDが載ってるPC」ってだけで信頼ないからな。
日本だけかもしれんが。
日本でAMD搭載企業向けモデルってそもそも殆どないかもw
まあSunのOpteronマシンくらいならあるんだが、Sunに絶大な信頼があるんだよな。
まあチップセットとか考えるとIntelが無難ともいえるが
VIAのチップセット搭載のCeleron機が大量導入されてたり
自分のところで最近稼働開始したサーバ群はOpteronだ。まあ鯖メーカーはIBMだけど。
そういうところはCPUなんか見てなくて、サポート含めたトータルソリューションで買うもんだろ。 だからIBMとかSUNって話になるんだし、AMDだろうがINTELだろうが関係ないんじゃない?
日本はSun(富士通)とIBM(日立)の信者が多過ぎw
だからソリューションのだな… まあいいや
>>322 信者乙
っつかEWSとかNEWSとか使ったことあんのかコラ
プ、プ、プギャープギャプギャプ♪ \ ププププギャプギャププギャプギャ/ ♪ (^Д^) ♪ _m9 )>_ キュッキュ♪ /.◎。/◎。/| <(^Д^)> | ̄ ̄ ̄ ̄ ̄| | ヽ(^Д^)ノ ) ) | |/ ノ ノ (((( > ̄ > )))) <(^Д^)9m ((( < ̄< )))) ) ) ((( > ̄ > ))))
このスレは高学歴で、ちゃんとした仕事についてる人が多いんだな おれなんか派遣で工場勤め、 趣味は風俗って人間だよ ただ最近働きながら通ってた学校を卒業した 25マンの授業料が浮く・・・ ところで理想的なアーキテクチャについてだけど ハードのリソースと用途が決まれば だいたいの最適解なアーキテクチャがきまるよね これを別の面からみると、ショヨ(漢字わかんない)の条件みたいなのが あれば、だいたい似たようなアーキテクチャに落ち着く つまり革新的なアーキテクチャってのはない
もちろん昔、MIPS VS VAXみたいな意味のわかんない比較が 流行った時代もあって、現実に則してないパラダイムを持ってる、 そしてそれがなかなか変えられないってのがあるから まぁわかんないんだけど
「顧客が求めているのはパフォーマンスじゃない。 ソリューションだ。」 ってIBMの誰かが言った言葉なんだけど、 これって90年代〜現代までの新しい価値観っつーか ビジネスの新しい付加価値みたいに聞こえるよね でもこれって高い箱(ハード)を売り付けて さらにソフトと保守でハードの何倍もの売上を稼ぐっていう、 昔から続くメインフレームビジネスの正当化のための詭弁でしかないと思うの
328 :
327 :2007/03/22(木) 03:32:36 ID:ldv6fgD9
で何を言いたいかっていうと こういったハイエンドマシンの市場構造みたいなものには 技術的な必然性かあるのかな、と 平たくいうと、安いハードに安いパッケージアプリと 最小限の保守で構築すればいいんじゃないか? そうなってないのは、メインフレーマやそれに準ずるメーカーが 既存のビジネスを温存するために、 ってごめんなさい 今日はセンチで意味不明な長文を書いてしまいました すみません
理想的なアーキテクチャとは… ミツグ君
やめろ!
UNIX板の「Sun Microsystems 最大の回復」スレみたいな流れだなw
別にスーパーコンピュータやHPCに限定したスレじゃないんでしょ? PCやゲーム機の理想のCPUを語ってもいいんじゃない? おれの希望なんて低消費電力でとにかくメモリアクセスが早いこと程度だけど。 CPUよりメモリに金をたっぷりかけたほうがいいか。 MRAMなんてDRAMより速いし不揮発性で電力消費も下げられて最高?
ゲーム機は勘弁してほしいな。それ専用の隔離板が存在するわけだし。
その"ゲーム機の理想のCPU"ってよく分からんな。 ゲーム機もPCもCPUに対する仕様要求が大きく違うと思えんが。 ゲーム機特有のグラフィックに対する過度な負担は ビデオに振ってしまえばCPUにやる事無いし。
>>334 PCはx86バイナリが高速に走ることが要求される。
ゲーム機ではパフォーマンス優先で世代ごとに大きくアーキテクチャが変わっても許容される。
ぶっちゃけて言ってしまえばゲーム機に高速なCPUはそもそも必要ないとも言える。 SFC / MD / PCE が3強だった時代、ダントツのシェアであり最も高性能と一般には 信じられていたSFCがCPU性能ではダントツに劣っていた。
SFCは68kだったっけ
>>337 65816 (6502 の上位アーキテクチャ)
>>337 MD 68000-7.7MHZ
PCE 6502カスタム-7.1MHz
SFC 65816-2.7MHz(限定条件で3.6MHz)
PCEだけ8bitだけどMMUとかついてるカスタム品で実質的には65816と大差なく、
クロック分速い。
メモリマッパーをMMUとおっしゃいますか。
ゲハアーキテクチャについて語るのかよ
>>335 ゲーム機も互換性が大事なんじゃね。
PS3みたいに、世代が変わるたびにチップを増やしていたら、コストが馬鹿にならないし、
膨大な数のPS2のゲームソフトに対して、互換性がたった40%だと怖くて買い換えられない。
>342 でも、互換性とかいいだしたのはPS2からで、それまでは過去のソフトは 動かないのが普通だったんだよなあ
>>343 いや、MSX2とかセガマークIIIとか。
そういやそういうのもあったw MSX2ユーザなのにすっかり忘れてた
>>343 SFCはFCと互換とるために65816を載せたのに互換性捨ててたな
FCと互換取りたかったというより、開発者がFCのアセンブラに慣れすぎて いたので、開発しやすくするために命令互換のあるCPUを選らんだという 意味合いの方が強いのでは?
はじめはFC互換の予定だった、ってのは確からしい ゲームボーイは8080カスタムだよね 開発のしやすさを重視して アセンブラの互換性をとるってのはなかったんじゃ?
>>347 山内が互換性維持を主張したのだが、コスト的にあきらめた
というのが真相
と本で読んだ
>>348 GBはZ80カスタム。
ASICをSHARPで作ることになったので6502の線はなくなった。
FCは開発環境から人材まで6502どっぷりだから開発のしやすさは
当然考慮しての選択。
>>348 >>351 いや、ゲームボーイのCPUは、
i8080以上Z80未満のかなり不思議な仕様。
>>352 不思議仕様でもなんでもない。
Z80から、裏レジスタと一部フラグの仕様、携帯ゲームには無くてもかまわない
一部命令を削除した代わりに表示周りにハード資源を割いただけ。
356 :
Socket774 :2007/03/23(金) 00:34:23 ID:4pyq1qBB
age
PS3はアミーガの再来とも言われてるくらいだしそれなりには流行るんじゃないの? 特定処理でめちゃ速いのは納得してる
どうだろ… Cellはともかく、PS3の未来はかなり暗い気がするけど。 ソフトメーカーは国内も含めてXBOX360に逃げてってるし。 ゲーム向けとしては性能がアンバランス過ぎるのと開発が難し過ぎるのがダブルパンチで効いてるっぽ。 Cell自体も完全に特定用途向けというわけじゃないし、 そういうの向けでは後発のストリームプロセッサに太刀打ちできない悪寒… どこで生き残れるのかよく分からん。
粗雑な作りさえ解決してくれれば360も悪くはないんだけど ディスクシュレッダ機能付き半島製ドライブといい、熱設計の糞さといい 国内はPS3が駄目ならWii一本化な希ガス
360 :
Socket774 :2007/03/23(金) 01:38:17 ID:4Rnb2lqf
>>357 amigaに失礼。
ゲーム機としても半端でPCにもならないPS3を名機AMIGAの再来
だなんて。
>>359 そうなー
360の作りの酷さはどうしようもないな。
初代X箱から何も反省してないメリケンクオリティ。
中のアーキテクチャのバランスは素晴らしいと思うんだが。
Wiiもなー
性能強化が足りなくて国内のメーカーのニーズを吸収しきれてないし。
Ace CombatもARMORED COREも360に行っちゃったよ。
つーかそろそろこの話やめたいわ。
362 :
聞伝君 :2007/03/23(金) 02:23:56 ID:Yt3qHQEG
Amigaはgraphics libraryも凝っていて楽しめるPCだったよ。 今と違って文化の多様性があったよ。 また昔話かよ、とか言われる前に引っ込むかw
キチガイを演じているつもりのキチガイを演じさせられたキチガイハードだろ。
初代箱は、プログラマブルシェーダー(といっていいと思う)、 箱360はユニファイドシェーダーとPC用GPUより先行したところがある 初代箱のUMAは、当時としては思い切った選択だった 箱シリーズのアーキテクチャのいいところって 出た直後は斬新なのに、しばらくするとまったくありふれたものに なるところなんだよね これって非常に正しい選択をしてきたってことの証明なんだ
amigaってラインバッファ(ハードウェアスプライト)じゃなくて フレームバッファなんだよね X68000はラインバッファだけど
367 :
Socket774 :2007/03/23(金) 03:34:59 ID:aqeKAj4/
PS3の一番素敵なとこっていったら ひとつのファンだけで全チップを冷却してる点だよな 箱はみならうべき
>>367 性能は知らんが、かなり凝った造りではあるな
箱は有り物適当にぶち込んだって感じだが
箱の選んだ技術にトレンドが動いてるのは、べつに正しい選択をしたからではなく
トレンドはMSの一存で動かせるということだろう。仕様を決めてるのは連中だしな
それはそれとしてnVidiaにクソ食わされたPS3は哀れだな
>>369 cell側でグラフィック処理を負担するアーキテクチャで
その分、GPU側が簡素なの。
cell性能不足で急遽nvidia製GPUを搭載したという話もあるが(w
文句なら性能見積もりに失敗したクタ宛に…
ま、PS3は神話だからどうでも良いけど。
ってか汎用的シェーダで汎用的な処理って考えると、
どうせならCPUに載せちゃばもっと色々できて便利に…と言う心情は解るが〜
7800シリーズをけなすにはPS3持ち出す以外にないってことだなw ATI信者乙。
>>371 なんでそういう結論になるのか分からん。
ここは結構まともだと思ったのに、所詮は自作板か。
7800が糞なんじゃなくてRSXが(ry 逆に、SPEがあるから性能妥協してコスト落としたんじゃないの?
まあなんにせよアンチエイリアシングが効いてないのは痛い
そそ、WX320Kでフォントのアンチエイリアシング無しは悲し(つД`)
ここで書くのはアレだけど、RSXが遅いってのはアーキの問題とかいうより、 単にメモリ帯域がしょっぱくて足を引っ張られてるっていうことでしょ コストの問題で128bitバスだし シェーダ能力はGF7800/7900と同等の8VS/24PSでも、メモリ周りは7600なわけで… そりゃAAかけるときついわな その点、Xbox360のXenosの隣にひっついてるeDRAMはそこらへんうまいことやってると思う \AAのコストが低いのはやっぱり大きい ゲハっぽい話でスマソ
>>373 RSXがショボイとかでたらめ書いてる知能障害乙。
昔は座標変換とピクセル描画で メモリ&チップがわかれてたのが普通 そうおもうと、PS3のSPEをジオメトリパイプ代わりに使うのって 変じゃないよな
次のアップデートではSPEを倍に増やしてくれねーかな
ゲーム機でスペックアップするのってアリなのかな。
板違いのゲハ厨がいきいきしてるように見えるのはアリなのかな。
ゲーム機の場合、互換性の意味ってあんまないでしょ PS3だと、PS2が海外ではがんがん売れてるから意味あるけど あとDSのGBA互換とか
アーキティクチャについて真面目に語るか オブジェクト指向言語で書かれたコードにとっての、 レジスタ間接分岐予測の必要性とか よくわかんないけど CPUの問題は、memory wallなんだよね 1991年のpower1のレイテンシは14CPUクロック、 2003年のpower4のレイテンシは400CPUクロック ここれが全てで、分散メモリでさえこれの隠蔽の一手段に 過ぎないといっていいわけで(分散メモリだと MPレイテンシが問題なわけですが)
蛋白質の折りたたみ解析って、素因数分解と同じカテゴリの処理でしょ? こういうのを速く(この手の問題で速いってのは、どういうことかって 突っ込まれても。無学なおれにはわからないので困るのですが、 GPUみたいに単位時間で多くのピクセルを処理できる=速い、 みたいに単純なもんではないんですよね?)演算するのに 画期的なアーキティクチャって要らないよね BG/LなんてPPC440ベースっていう粗末なコアだし
で、またまた連カキコなんですが、Folding@homeで1ノードあたりの
処理量を見ると、GPUのほうがPS3より上
ノードの1システムの効率はGPUinPCよりPS3が上だろうけど、
cellとGPUだけで比較するとGPUが効率上だよね
じゃぁ
>>384 のリンクには何の意味があるかっていったら
参加台数が多いことくらいだよ
恥さらしはそれ位で止めておいた方が良いかと。
うん、ごめん
つまり平和ということか
NP完全
システム1.60にアップしたら即、メニューに登録される意味は大きいよ。 誰の目にも止まるわけだから。 ハイエンドビデオカード買っても「Folding@Homeに参加しましょう」なんて広告は入ってない。
どうせPS3版Folding@HomeはCellじゃなくGPUつかってるんだろ。
GPUは地球儀と分子モデルの描画だけに使ってるらしい。ほとんどSPE。
2周こなしたからもう秋田
397 :
聞伝君 :2007/03/25(日) 04:36:45 ID:7ey7c2pl
6問題蟻
G70系であるRSXでは 演算自体は出来ても パフォーマンスはATI R5x0には到底かなわない R520の表の数字には現れにくい、濃やかなつくり込みにより こうした演算が実用的になった。
GPUって、ボードまるごとでPS3なみの値段するよな高いのは 現状Folding@homeだけとはいえ(他にあったら失礼)GPUでの演算が そこそこ使い物になると証明されたわけで、AMDのFusionだっけ? あれもけっこう使い道が出てくるかもしれないね
ヒント:電力
>>399 まあ、PS3からCELLとBDドライブ(と筐体)抜いたくらいの構成だけどな
GPUのがメモリバンド幅辺りの性能は低い なんだかGPU統合を賢者の石と勘違いしてる人が多いけど
他山の石
Radeon X1950ってユニファイドシェーダじゃないよね? R600とかGeForce8800より古い内部構造で 誤爆?
マルチスレッディングというとTera MTAという機械が これを開発したバートン・スミス氏は今マイクロソフトにいますが
HEP
>>408 ,409
HEPから始まってこの系列はパッとしないよな。
にもかかわらず続けてるし、バーさんも干されも
してないのは特定用途で滅法強いとかあるんだろうか?
クレイもXMT止めてないし。
414 :
聞伝君 :2007/03/25(日) 23:40:33 ID:OgOmfILT
何を?
精子じゃないの?
何々?早漏の話。 俺も悩んでて・・・
遅漏の話なんじゃないか?
CPUとGPUが合体する今こそCMSをふっかt!!!!!!111 マジで一番いい解決法に思えるんですが。
Intelがずっと研究してるじゃんPARROT
PARROTはGPGPUのフロントエンドとしてのCMSの研究ではないだろ。 まぁPARROTがCMSライクなのは確かだが。
マシンバイナリと中間言語じゃ ダイナミックコンパイルの難易度が全然ちがうくね? GPGPUのフロントエンドとPARROTは重なるとこもあるけど 別々では? マシンバイナリを、レジスタ本数が違うマシンバイナリ向けに 変換するとき、レジスタ割当の最適化がムズいそうな スタック→レジスタの最適化は楽なんだけど
CPUとGPUの合体より、チンコとマンコの合体に興味がある ただし風俗はいいです 無料を希望 も生まれ変わるのなら マルチスレッド対応になって 複数の女子高生を処理したい そしてベクトル化されたチンコで256人くらいのマンコを 連続で貫通 コレゾ貫通陰極
風俗の方が実は安上がりかも
426 :
424 :2007/03/27(火) 22:49:34 ID:sd0Op25h
>>425 そんな気はする
だけどお金を払って女子を買うなんて
もうしたくないんだ
ほんとの愛が欲しい
>>421 ---------------------
Intelがずっと研究してるじゃんPARROT
---------------------
Intel版CMSと言えば、IA32ELの勘違いでわ?
それは正しいが違う コレジャナイロボをもらうぐらいがっくりだ
わがまま言わないの!
CMSもPARROTもエミュレータって点で一緒だろ そういやIA32ELで全然速度出ないんだから CMSは間違ってたよな
>>422 んにゃ、スカラ命令のSIMD化とかの研究やってるよ
利用シーンに応じてCPU内蔵のベクトルユニットがグラフィック処理してもいいし
GPUかVectorユニットかなんて区別する必要なんてもはや無い。
>>423 GPUだけが中間言語を扱うという前提自体おかしい。
MSのCPU命令セットアーキテクチャの本命はx86でもx64でもなく
あくまでMSILだよ。
>>430 IA32ELの性能はクロック相応じゃないの?
OoOもないのにあんだけ性能出るんだからむしろすごい。
いまさら売れるかねえ?SPARC
日本のメーカ、可哀想すぎ・・・
Itaniumサーバが堅調というより日本国内のRISCサーバ市場が壊滅してるってことでは?
IA64の素晴らしさを理解できるのは日本人だけ
442 :
聞伝君 :2007/03/31(土) 02:47:43 ID:tCUgdqF2
ご冗談を、臍で茶が。 猫のAA略
猫と言うな 猫先生に対する侮辱だ
445 :
Socket774 :2007/03/31(土) 18:47:36 ID:2JlAwYPV
>>436 いくらなんでもSparcじゃないだろ?
446 :
Socket774 :2007/04/01(日) 02:35:43 ID:dGao5YH9
ハイエンド特化のPower IA64 組み込みのARM MIPSは良いとしてPC/WSクラスで x86以外使う価値はない。 必要なアプリも十分にそろってるし、性能も十分。 SUNは未だにSparcに未練があるようだが、これも近い将来PA-RISCのように 消えるだろう。
近い将来かなあ。 まだメインラインをx86にする雰囲気無いけど。 intelまで採用したし近いか。
トップの英断次第ではドラスティックに変わるかもよ。Appleみたいに。
449 :
Socket774 :2007/04/01(日) 09:37:46 ID:Sn1HsWDh
最近はSparc搭載機が売れてるらしいが、これもLinuxにあいそう尽きた (思ってるよりもコストがかかかるらしい)ベンダーが購入してるとの ことらしいね。 現在、SUNはRockを出す予定だがハイエンドはあくまでもSparcで行くつもり かな?
SparcはPOWERみたいに広いラインナップはないんだっけ?
451 :
Socket774 :2007/04/01(日) 10:18:13 ID:Sn1HsWDh
>>450 ない。ハイエンドサーバ〜ミドルWSまでのラインナップしかない。
SpracLiteが組み込み向けだったらしいが成功してないし。
Blade100/150みたいな安価WSをリリースしたことがあるがx86搭載機を
侵食することはできなかった。
遅レスだが・・・
>>225 たとえばIA-64
キャッシュを使わずにロードストアしてほしいというヒントが定義されている。
実装されているかどうかは知らない。
453 :
聞伝君 :2007/04/04(水) 01:58:30 ID:SJoGLVhB
ヒントってEPICのことかな IA-64は基本、静的schedulingだったと思うど 静的schedulingでload miss latencyの直撃を食らう memoryからの直接loadは、どんなsceneで有難みがあるんだろう… penaltyばっかの気がする
454 :
聞伝君 :2007/04/04(水) 02:00:58 ID:SJoGLVhB
↑餌ね
>>369 あんな豪勢なヒートシンクが必要になる = 発熱が多すぎる
決して優れているのではなく、そうせざるをえないからだと思う。
ただ、シュリンクしていって消費電力が下がることをアテにして、
最初は発熱量が多くなってでも、背伸びしておこうということかもね。
>>453 疑問に思ったら、自分で調べなよ。
YorkfieldとかK8Lの話しませんか
ぶっちゃけメニーコアとL2増量で 効率上がりましたとか言いそうだからどーでもいい
じゃあ、isaiahの話でも…
女の子とか女の子の話しませんか
ぶっちゃけCPUの話なんてどうでもいいよね IT関係の仕事してるんだったら、ちょっとは関係あるんだろうけど そうじゃなかったらホントに関係ないし このスレも止まって久しいのぉ 久々に覗いたけど閑古鳥ないてる
YorkfieldとかK8Lとか今のコアの改良版でしょ。 それよりNehalemがコケるのかどうか。 Netburstコアで無茶やらかして、AMDをここまで育てた主役 ヒルズボロの設計だし。 同じ轍は踏まないだろうけど。
>>461 かっとび(ぶっとび?)CPUの話?
女性型パソコンだっけ?
胸にシリコン?(柔らかい方の)タイプのハードディスクを搭載した可愛い女の子(パソコン)
四姉妹のうちで一番出来の悪い末っ子が主人公だっけ?
まるでPS3のような(今描いたならPSフォー!とか云う名前になるのかな?)
>>462 ゲーム業界における横井軍平みたいなもんかな
ファミコンの十字キーの生みの親
ゲームボーイを大成功させる
バーチャルボーイ転ける
バンダイでワンダースワンを立ち上げるもGB下位互換のGBカラーに破れる
あんなエロマンガをしってるやつが二人もいるとは。
466 :
Socket774 :2007/04/07(土) 07:40:59 ID:+sCaUJih
PowerPC615というx86コード実行可能なPowerPCが計画されたが、これは x86とpowerPC両方の命令セットを備えていたらしい。 命令切り替え時の性能低下が大きいので中止になった。 しかし、複雑なx86の命令セットとRiscでも複雑な部類になるPowerPCの 両命令セットを備えたCPUなんて、命令セットが複雑になり過ぎだと思うんだが? 思うにPowerPC615はいっそうのこと、そのままintel(x86互換)CPUにした 方が良かったんでは? 現在AMDがx86市場でそれなりに奮闘してるようにあの当時のIBMとMotorola ならPentiumより高性能なx86CPUを作り、今のAMDみたいな地位を築けたと 思うんだが。 (PentiumPro同様のx86⇒Risc命令変換技術ぐらい当時のIBMはあったはず) それとも、あれかな。本来PowerPC615はx86互換CPUにする予定だったが、 それをされるとMACが売れなくなるのでAIMのAppleが反対したとか?
467 :
Socket774 :2007/04/07(土) 07:54:00 ID:G7rTA/g7
1.今までのPowerPCアーキを捨ててまでx86の研究をする必要があるのか? 2.特許周りでIntelとガチンコ勝負がめんどくさい 3.そもそもx86市場に興味が無い こんな所だろ
468 :
Socket774 :2007/04/07(土) 08:35:56 ID:+sCaUJih
>>467 別にPowerPCを捨てなくてもx86アーキテクチャと両立させることは可能だし
(intelがx86とIA64を両立させてるように)
x86市場に興味があったからこそPowerPC615なんてものを計画したんでは?
となるとやはり特許周りなのかな。
469 :
MACオタ :2007/04/07(土) 08:42:17 ID:BW1UDr9K
>>466-468 さん
そんな腐れルーマーの類より、PenrynがAltiVecばりのVector Permute機能"Super Suffle Engine"
を実装できたのわ、AltiVecの特許を共同保持するAppleと組んだお陰だと思わないすか?
思わないす > "Super Suffle Engine" ただのマーキテクチャじゃんそれ バイトローテートして上下64ビットを反転したベクトルを生成してから シャッフルする必要があった(当然ながらコンプレックスデコーダパス)のを シャッフル単位が128ビットになったことで、1μOPsで処理できるようになったことで スループットが大幅に改善しただけの話じゃん。
>>469 45nmで使えるトランジスタが増えただけだろ
PowerPCもあのまま順調に行けばエミュレートしても 互角に戦えたかと。
どうせ今はPowerPCも86も中身はネイティブ動作してないんだから デコーダ複数備えるだけでなんとかならんもんかな?
デコーダが一番のホットスポットだったり。 マイクロアーキはISA上のレジスタが少ないなら少ないなりの構成になってますよ
"共同"保持する特許を一社が勝手に他社に使わせることなんてできるすか?
>>476 契約の内容次第かと思うす。現実にIBMもCELL BEのSPEに同技術を流用しているす。
>>475 残念だがIntelのSuper〜がどうその特許に抵触するかわからんよ
> The data processing system of the present invention loads three input operands, > including two input vectors and a control vector, into vector registers and > performs a permutation of the two input vectors as specified by the control vector, 既に違うしwww Merom→Penrynの実装の進化の過程でどうAIMの許可が必要なのか教えてくれ
その命令好きだねw
あのIntelが後腐れありそうなとこから技術を引っ張ってくるとは思えないけどな
>>481 たぶんpshufbのことだろうけど、
2レジスタまでしか指定できないx86のISA上はまず抵触しようがないな。
マイクロアーキテクチャにまで言及してるのだとしたらどうだか知らないが。
SPEと格闘中 レジスタ上に常時配置したい128ビット変数が80個くらいあるんだが、 registerキーワード明示しないと駄目だなこれ
485 :
Socket774 :2007/04/08(日) 15:34:35 ID:ZXV7Akd9
>>485-486 99年当時の発想としてはいいと思うけど今時は3D演算はGPUがやるからねえ。
SSSE3とか3DNow! professionalとかと比較したらなんともいえないけど。
>99年当時の発想 Cellのことかー
489 :
Socket774 :2007/04/08(日) 20:29:55 ID:ZXV7Akd9
MIPS3Dは99年だったのか。それじゃ、もう時代遅れだな。 この頃のMIPSはゲーム機に採用されてたのでそこら辺を狙ったんだろう。 しかし、ゲーム機向けはPowerPCになり携帯にもGPUが載る時代になると どこに需要があるのか? SparcのVIS同様に不必要な機能だな。
CPUアキテキタ語らない
>488 当初の予定ではcellだけで CG処理全部やる無謀な予定だったから そのなれの果てだよ あの設計は。
99ってCellだっけ?
PS2のEmotion Engineだね。 MIPSベースのコアに3つのVectorコプロセッサ まさにCellの原点
494 :
Socket774 :2007/04/08(日) 23:32:14 ID:ZXV7Akd9
>>493 EmotionEngineはMipsR5000ベースにVectorUnitを2機追加
したもの。
VUは二基だがあとIPUっていうMPEGデコード用のコプロが1基あるよ Cellの発想そのものはEEの延長線上でそ
テメーの強弁を適用すりゃ EEはPS1のGTEから延長線上にある とも言えるんだが? むしろMipsのコプロセッサI/Fとしては同類とも言えるわな。 IPUはプロセッサに密結合じゃないし。ふつうコプロセッサとは言わないよ? 知ったかぶりせずに引き下がりな。
なにを否定してなにを訴えたいのか理解できない
496 名前:あぼ〜ん[あぼ〜ん] 投稿日:あぼ〜ん 頭の悪い人っぽいので
つーかね、CPU側でグラフィック処理をやってしまおうという基本設計思想についての議論であって ISA云々や、疎結合か密結合かなんて細かいインプリメントの違いなんてのは論じてないの。
乱暴な話だな
今や筆頭NG推奨コテだし。
そもそもゲーム用CPUの変遷は
>>500 の言葉を借りれば全て乱暴ということになるな
だからさ、積和演算機能を組み込んだだけのCPUとcellを同じカテゴリ扱いして それ以上の区別はしないなんて乱暴な話に意味なんてないだろうといっているんだよ。
と思ったけど知ったか君のオナニーだから意味なんて関係ないんだね。
実際やってもいないことを設計思想とか言うのはどうかと思うなあ
いや、実際には出来なかったが当初の設計思想はそうだったんだよ。
その点では団子は正しい
でも
>>503 なわけで…
>>499 CPU側で頂点演算やMPEGデコードやることがなんで「グラフィック処理をやってしまおう」
になるんだよ。無茶苦茶だ。
>>503 団子の言い分だとSH4もCellも同じカテゴリw
509 :
Socket774 :2007/04/09(月) 07:31:31 ID:cqb4CEIx
考えて見れば、その昔は3Dや実写動画を扱うにはDSPを用いないと 話にならなかったわけで、
クタの言葉を借りれば「PS3で完成」だからねー PS2専用プロセッサとPS3専用プロセッサの設計思想が「違う」って、 SCEの中の人ですら言わないよね。 「延長」と言ってるがどうして同じレベルの技術と解釈されるのかは理解不能w SH-4の後に出てきたSH-5、SH-Mobileはそこまで進化してないだろ。 そもそもドリキャス専用設計ですらないし。
> SCEの中の人ですら言わないよね。 誰かこの厨房に世間を教えてやってくれ
_
自分の言葉で反論が出来ないからって人に助けを求める君のほうが幼稚だね
団子の人は詳しいんだが、ただの知ったか厨房なんだかワケワカメ
反論? 論にすらなっていないモノを?
そりゃ、しったかばっかだろ。 本職のCPUアーキテクトなんて居るわけない。 海外ルーマーサイトやCQ出版社の雑誌よんでネタ蓄えただけのルーマーばっか。
>515 とりあえず他人の助けなしで「現実」とやらを語ってくれ お前が現実と認識してるものなんて他人にはわかりゃしないよ お前の胸のうちを代弁してやろうか? 「俺の拙い思考ではまともに反論できないので誰か助けてください」
>>517 なんでSCEの中の人がわざわざ
> PS2専用プロセッサとPS3専用プロセッサの設計思想が「違う」って
こんな事言う必要があるんだよ。
これほど理屈にならない馬鹿な話に気が付かないなんて相当頭悪いな。
ほう認識してる「現実」って疑問形なのか そりゃだれも代弁できない
>>520 はて?認識している「現実」なんて何処に出ているのかまず言ってくれ。
お前の脳内だけじゃないのか?
また疑問形か 知ってる現実を語ってくれと言ったのに通じてなかったのか 「会話が成り立たない馬鹿です」 という現実だけは明らかになったな
>>552 お前が自分自身が「会話が成り立たない馬鹿」である事を証明しているぞ。
俺は何の説得力も持たない理屈がおかしいと指摘しただけ。
それすら読み取れないでこんなに粘着かよ。
被害妄想でもあるんじゃないの?
>粘着 自分の書き込み回数と時間を確認してたら言えないセリフだなこれw CellがEEの後継であることを覆す証拠でも把握してるかと思ったから聞いてみたら 疑問形で返されたんで頭の悪い子だと思っただけなんだけどね もういいよ逃げて
あと疑問形は指摘とは言わないし現実とも言わない
まったくもって話にならないです。 > CellがEEの後継であることを覆す証拠 前提となる何をもって後継と言えるのかすら曖昧なままですよ。 > 疑問形で返されたんで頭の悪い子だと思っただけなんだけどね そんな事すら気が付かないのですか?と暗に指摘していたのですが はっきり書かれるまで気が付かないなんで気の毒な方です。
xxX12/3/は団子なのか?違うのか? どっちにしてもキモイし文の読めなさはガチ
頭悪いな 事実の提示がなければ指摘とは言わない 相手に答えを考えてもらうのは「指摘」ではなく「質問」だ 小学生からやりなおしなさい なんだ、Cellがかつて「EE2」と呼ばれてたことも知らないのか
> してき 【指摘】 > (名)スル > 全体の中から、ある特定の事柄を取り上げて示すこと。 事実の提示は必要と書いてありません。 辞書の調べ方の勉強が必要だねwww
まさか「事柄」と「事実」が別の言葉だと思ってるのか。 事柄を示さずに疑問を投げるのは指摘だと思ってるのか。 馬鹿だな。 CPUを新規に開発すると5年は最低でもかかる。 「PS2ショック」のころには既にCellの開発は始まってんだよ。
> ことがら【事柄】 > 経験したり 想像したり△する(した)事がどんな性質・状態・内容かということ。 もちろん「事柄」には「事実」でないものも含まれますが何か?
平木先生は後藤先生の弟子のくせに、「バラメトロン?あんな一入力一出力のものは滅びて当然ですよ」と言っていました。
Macオタ化してんな。くだらん話を続けるやつはコテハンにしろ。
>>532 髪毟りにいくから覚悟しとけ
とお伝えください。
平木先生はデータフロー屋のくせにSIMDスキーでGF11を高く評価する一方、RP/3をゴミ扱いしていました。
串通した名無しで自説を擁護してもすぐ化けの皮が剥がれるね 団子君wwwwww 自分以外の発言を全てあぼ〜んするといいよ(ぷぷ
537 :
聞伝君 :2007/04/09(月) 23:23:16 ID:WG0kWtWj
技術的な話から逸れるとスレが良く伸びるな…唖然
後継がどうのなんてイメージの話でしかないからなぁ
平木先生のIBM時代のハイブリッドマシン、Empireは黒歴史になっています。
それにしても馬鹿だね 自説が「事実でない」って自ら認めてるやん 「最大ポリゴン数」至上主義だからある意味ソニーは一貫してる。
12/3は初代PSの発売日
名前欄と串忘れてるよ 日付変わってから出直しておいで
>>540 > 自説が「事実でない」って自ら認めてるやん
思い込みの激しいキチガイ乙。
集合論の基礎を勉強すればそうならない事はわかります。
>>544 ニート?お前がか?
俺はこれから仕事ですよ。
自宅警備がんばってね
団子は「夜勤の土方乙」と精一杯の返答をしながら 自らは「残業、深夜、徹夜」とステロタイプの 自慢をする春厨だから
ふんいきわるいなあ これなら聞伝君のつまらない愚痴読んでる方がよっぽどまし
ザラ場なら終わってるよ。海外は知らんが。
>>551 やっと気付いたのかwww
誰も日本の話とは言っていないからね。
553 :
聞伝君 :2007/04/10(火) 00:09:51 ID:DmbE4g2N
真人間なら御前 いやちがった、午前から働いた方がいいよ
>>553 いや、東海岸ですらまだ午前です。
と言うか日本も午前だよね?
>>552 ピーク過ぎたからフレックス使って10時出勤しまくりの俺を怒らせた
556 :
聞伝君 :2007/04/10(火) 00:17:13 ID:DmbE4g2N
もうすぐ草木も眠る丑三つ時だよ…
>東海岸ですら まるで西海岸は太陽がてっぺんにあるような言い草だな バカボンボン
558 :
聞伝君 :2007/04/10(火) 00:21:04 ID:DmbE4g2N
in-cacheのgauss分布密度関数 →sqrt→exp→fdivの完全な演算ネック SSE2よりも-ffast-mathの方が効いてワロタ そりゃそうだ。
500 名前:Socket774[sage] 投稿日:2007/04/09(月) 00:52:51 ID:TjNlXuYQ 503 名前:Socket774[sage] 投稿日:2007/04/09(月) 01:32:01 ID:TjNlXuYQ 504 名前:Socket774[sage] 投稿日:2007/04/09(月) 01:34:06 ID:TjNlXuYQ 511 名前:Socket774[sage] 投稿日:2007/04/09(月) 08:38:32 ID:TjNlXuYQ まあ、脳内で世界のどこだろうと自宅警備員には違いなさそうだな
560 :
聞伝君 :2007/04/10(火) 00:25:16 ID:DmbE4g2N
暇人だな
>>558 それって命令キャッシュネックってこと?
その手の高級な命令ってデコーダネックになるから嫌いなんだけど
SSE2にexpは無いな。sqrtpdやdivpdですら近似値だし。
562 :
聞伝君 :2007/04/10(火) 00:36:42 ID:DmbE4g2N
>>561 decodeとかそういうレベルではない
>>577 (西海岸は朝。)いや、東海岸ですらまだ午前です。
と読み取れない団子の頭の悪さにはマジで驚いた。
ID:TjNlXuYQ ID:DQlZEzCh 団子にメタクタに打ち負かされたからと言って粘着するなよ
565 :
聞伝君 :2007/04/10(火) 00:44:05 ID:DmbE4g2N
>>563 ID:DQl*****
もうちょいでDQNだったのにおしい
寝る。
今回も団子の自滅ですが?
>>564 変な粘着に日本語の間違いを指摘をしたら、そいつが遁走したぐらいで
打ち負かされた事実はありません。
あなたの脳内以外でどのあたりに打ち負かされた事実があるのか
教えていただけませんか?
自宅警備員さん、ちなみにいまは業務中ですか?
ちなみに「現実」をとなえつつ それを聞かれると答えずに逃げ続けてるのはどなたですか?
T芝の開発主任がCellがEE後継とはっきり明言した、と言っても、違うっていうんだろうな。
みんなおはよ
NehalemってHT搭載だけど、パイプラインは今とほとんど変わらないんだよね? そんなに効果あるんですかね。
>>573 ネットバーストのHTとは違うかもしれない。
NehalemにHT、と一言で言ったって、実装はどうなるか
それに、HTのようなSMTはインテルだけのものでも、目新しい技術でもない
Nehalemは何段になるか知らないが、Core2の14段でさえ、全体的に見ればかなりパイプラインは深い
576 :
聞伝君 :2007/04/11(水) 01:13:30 ID:lAFBngLf
fdivだのfsqrt等、長いthroughputのinst.の裏はがら空きだろうけど それは例外的で 殆ど何をやらせてもpipelineがスカスカなarchなら きっとSMTは効果絶大 なんだろうね 悲しい話だ
577 :
Socket774 :2007/04/11(水) 07:35:06 ID:L+xeBW52
IntelのHTって元DECの人が設計したんじゃなかったか? x86しか知らない人はわからんけど、intelの技術は他も 同様の技術を有してる見たほうがいい。
てst
CPU稼働時間の40〜90%がストールってされてるから まともな実装ならSMTで速くなるに決まってる Pentitm4のHTがなぜだか異様に糞すぎただけ
>>579 ならば、ハイパースレッディングの名称はやめるべきだろうな…
まあインテルもNehalem発表の場で、「HTのようなSMT」と言っていたが
>>579 けれど別スレッド走らそうが結構リソース競合したりして
SMTは2-3割性能上がるで普通だったような希ガス
Pentitm4のHTもまーそんなぐらいかなみたいな
>>580 Itanium2でもHyperThreadingの名称を使ってるくらいだし期待できない。
Nehalemのマルチレベル共有キャッシュってどういう形になるかな。
8コアだマルチダイの場合、L2を2コアで共有してL3を4コアで共有くらいかね?
>>581 その認識であってるよ。PowerのSMTだってそんなもんだし。
>>582 AnandtechはLast Level Cacheのみ共有と書いてるけど。
>>581 どうせ別スレッドもストールするんだから、
ストールしたら別スレッドに切り替えるのではなく、
ストールしてもしなくても別スレッドに切り替えても同じ
というのが、SunのNiagaraなのかな。
バートン御大もそう言う考えなんだろうな。
MTAにはデータキャッシュないけどね
またpeakだけのGFLOPS競争か
Intel製PowerVRまだ〜
> またpeakだけのGFLOPS競争か プププ
740という謎数字が脳裏を以下略。
ググっていまさら知る。 PDAでメジャーなIntel 2700GのコアはPowerVRだったのかっ でも今はそれもマーベルか…
593 :
Socket774 :2007/04/14(土) 10:24:23 ID:j26XpsdM
http://pc.watch.impress.co.jp/docs/2006/1002/kaigai306.htm >当時は、命令セットを抑えて命令フォーマットを単純化したRISCでなければ、
>今後パフォーマンスを上げ続けることができないという論調が支配的だった。
>しかし、結果を見れば、Intelアーキテクチャは進化を続け、命令セットを拡
>張しながら成功してきた、と言うのがGelsinger氏の見解だ。つまり、Intelは、
>命令セットをシンプル化するRISCの理念を否定、今後も命令セットをリッチに
>し続けると再宣言したことになる。
こんなこと言えるのもP6時代にx86⇒RISC
風命令変換を行うようにしたから。
現行のCore2も最終的にRISC風命令へ変換
してる。
しかし、intel AMD共にx86⇒RISC風命令
変換はオーバーヘッドが大きくなり効率が
悪いと当時の設計者は思ったのでは?
(MIPSのジョン・ヘネシーもx86⇒RISC風命令変換は思いついたかも知れんが、
そんな効率悪いことするよりも素直にRISC作った方がいいと考えたんだろうな。)
しかし、実際のP6はRISCに迫る性能があり、ジョン・ヘネシーも驚いたんでは?
594 :
Socket774 :2007/04/14(土) 11:04:59 ID:Ryq1hhOB
CISCに陰り→RISCに乗り換えたいがx86互換は絶対に捨てられない→多少効率悪くてもx86命令変換してRISCへ のジレンマの中で努力を積み重ねた結果じゃないかな
んで努力を続けるうちにRISCの方にコード密度の低さという問題が持ち上がり、 「あれ?うちらのアプローチってそんなに悪くないじゃーん」という事態に。 デコードの負担はでかいけど、コード密度・互換性・依存関係の解決等を考えると CISC→RISCはそんなに大きな問題じゃないのだろうね。 でもそろそろハードウェア実装からソフトウェア実装に切り換えてほしい。 CMS!CMS!
596 :
Socket774 :2007/04/14(土) 11:37:14 ID:j26XpsdM
x86だと膨大なソフト資産があるからそう簡単に切り捨てられないからな。 しかし、x86⇒RISC変換デコーダを搭載できたのも優れたプロセス技術が あったおかげだな。 一つのダイに膨大な数のトランジスタを詰め込めるようになったから、変換 デコーダを使い命令セットの欠点をカバーできるようになった。
prefetch命令っていちおう4つのレベルがあるんだが 将来的には4次キャッシュまで搭載するんかな
オンダイL1+L2+L3にオンボードL4とかはありえそうな気がするね。 Super7再び
気がつけばMacOSもx86の資産の内の一つに――
>>595 CMSに切り替えたらコード密度のメリットも吹っ飛ぶような気が。
やはりアレだ、1TSRAMの大容量キャッシュ上でCMSを動かすようにすれば……
>>600 >CMSに切り替えたらコード密度のメリットも吹っ飛ぶような気が。
…そういやそうだな。ボケてた。
1T-SRAMでもZ-RAMでもいいからCMSが入るくらいでかくて速いメモリがあったらなー
そこでQuickTransitですよ!
RISCはコード密度低いって言われるけど、 x86も、レジスタ不足で変数がスタックに積まれるから、効率悪いと思うんですが。 mov eax,[esp+4] add eax,[esp+8] とか
>>603 x86が効率良かったら普通に生き残ってる
よくないから資産がなんちゃらって話
605 :
Socket774 :2007/04/14(土) 20:44:29 ID:j26XpsdM
>>599 近い将来、Sparcアーキテクチャが切り捨てられSolaris(SUNのUNIX)もx86資産に
(現行でx86版とSparc版SolarisがあるがSprac版が消える)
Vistaの後継バージョンはx64オンリーになるらしいね。
608 :
Socket774 :2007/04/14(土) 23:50:34 ID:j26XpsdM
今度、中古でSUNのSparcワークステーションでも買うかな。 SGIやHPでもいいがソフトが入手できないからな。
609 :
聞伝君 :2007/04/14(土) 23:58:31 ID:sy9xa1R3
遅いよ〜
610 :
Socket774 :2007/04/15(日) 00:04:59 ID:j26XpsdM
さすがにSparcStaionじゃ、遅いかも知れんがUltraSparcVの Blade2000辺りだったら3.4年前のPCと体感速度は変わらんだろ。 個人的にBlade2000=Pen4/2GhzPCと同性能ではと。 もしかしたらSolarisが重いとか?
Blade100シリーズなんて今買ってもPS3以下だろうな
612 :
Socket774 :2007/04/15(日) 00:24:39 ID:+CXqOGjJ
俺のコアは80Hz程度で動いているらしい。 まったく3Ghzとかで動く奴らが、うらやましいぜ! だが、昇圧とかオーバーなんちゃらってのには賛成できない。 だって、そんなことしてたら死んじまうだろ? それに最近は、静穏ブームなんだって? 俺のは常時ドクンドクンしてるぜ? まぁ、普段は聞こえないが、医者のヘッドホンなら聞こえるらしい。 それから、これは人から聞いたんだが、コンピューターって計算機なんだろ? なんで100円で売ってるやつと同じもんが、20万とかするのか理解できねぇ ほら、液晶だってちゃんとついてるぜ? 確かに、いろいろついてるらしいけどよ、それを使いこなしてる奴なんて見たことないぜ? ほら、奴らは得意になっているが、電子計算機を使ってるんじゃないんだよ。 奴らは、電子計算機に使われてるんだ。 そんなことにも気づかず、趣味は電子計算機で網をすることですとか、気が狂ってるとしか思えないぜ。 この世界は、素晴らしいが、可憐で過酷で醜いところもある、人の愚かさ故だ。 それじゃ外に出て、バーボンでもウィスキーでも飲みに行こうぜ?
俺のコアは1.3Hz〜2Hz程度だ。常人の60倍速ってすげぇな
614 :
Socket774 :2007/04/15(日) 01:12:37 ID:B9W5RcmE
>>611 過去のSolarisソフト資産が使える。ゲーム機としても半端な
PS3以下なんてBlade100に失礼。仮にもワークステーションだ。
んなこと言ったらPS3だってIBMのLinuxソフト資産が動くぜwwww てか、YDLの販売元がPS3クラスタ売ってるし Blade100/150はForte C++とのセットで18万の時代が一番お買い得だったな。
617 :
Socket774 :2007/04/15(日) 09:50:31 ID:B9W5RcmE
Core2ってIPC重視だが、以外とクロックも高いな3Ghz近くで動作するし、 Risc陣営がクロックでx86についてこれなくなったのはプロセス技術の 問題だと思うが、それならintel並みのプロセスを持つIBMまでクロック でx86の後塵を拝することになったのか? それにSparcなんかもTSMCみたいなとこで製造すればもっと高クロックを 達成できたんでは?
618 :
Socket774 :2007/04/15(日) 11:13:09 ID:P/qOIbFg
TDP45WのX2はまだ出んのか。 成せばなるのに。
>>617 CELLは高クロックだし、Itanium2は低クロックだし。
クロックはアーキテクチャに関係するでしょ。
>>617 パイプラインだけでみるなら、一桁で3GHz弱達成してるのもあるな。90nmで
SPARCってTIでしょ。 TSMCより凄そうな気がするけど。 富士通の方も。
622 :
Socket774 :2007/04/15(日) 12:45:57 ID:B9W5RcmE
だからってTSMCだったらもっと速いのが作れたなんてことはないだろ
TSMC/UMCにUltraSparc2作って貰う話がは2002年ぐらいにニュースで出たんじゃなかったっけ?
で、スカウトスレッドってどうなん?
電気の無駄遣いだよなあ > スカウトスレッド
SPARC64欲しいけど、個人で買える/使えるような物が無いし、金も無い
720pならBanias程度でも十分再生できるが、当然フルHDの60fpsだよな?
ハードウェアデコーダでやるということなのだから当然そうでしょう
630リンク先はXscaleだろ? まずIntelがまだXscaleを出す気があったのに驚きだが、 720p相当でもハードウェアアクセラレーションが必要になるぞ。 逆にハードウェア使えばHDも出来そうな気はするが。
>>631 デスクトップは完全にIA一色になってしまったしな。
少しくらい高価でもSPARC64でデスクトップマシンを出してくれたら
そこそこ売れそうな気はするが。
>>631 デスクトップは完全にIA一色になってしまったしな。
少しくらい高価でもSPARC64でデスクトップマシンを出してくれたら
そこそこ売れそうな気はするが。
638 :
聞伝君 :2007/04/19(木) 03:39:52 ID:nosm1uC6
売れネーよ CPUだけで市場が覆せるもんか
639 :
聞伝君 :2007/04/19(木) 03:43:34 ID:nosm1uC6
ハハン、さてはFの方から来た消化器売りですか それともsolarisの幻想を抱いている夢想家ですか
>>638 今でもSPARCのWSがいいっていう金に糸目をつけない人種っていると思うよ。
そういうやつはもう買ってるだろ
個人的には X68000 みたいなのが出てほしいんだけど、今は無理だろな。 一般人はブラウザ(とメディアプレイヤ)とワープロが有ればいいし、 OS違ってもマウス使えば操作同じだし、 ゲーマーはGPUだけ有ればいいし、 Wintelでなくてもいいと思うんだけどな。
GUIがあってもOSとかアプリによって操作は全然違う 今はMS製品に似せる傾向があるんでそうじゃないけど X68000のSX-WINDOWSとかWindowsかmacに慣れたユーザーから見れば わけわかんないGUIだろ
644 :
Socket774 :2007/04/19(木) 05:57:53 ID:AsTJQhWt
一般人はWindowsがあればいい
>>643 「MS製品に似せる」って、どこまで似せることを言っているのか不明だけど、
MSだって他を真似てるし、便利なものは真似ればいいけど、不便なものまで真似る必要は無いと思う。
>>645 それは、SX-Windows でも X-Windows でも MS-Windows でもいい、という意味だな。
SPARC64VIは信頼性は高いかもしれないけど、性能は たとえば数十万円マシンのCore2 Extremeと比べても速いわけじゃないんでしょ?どうせ。 Solaris Sparcで仕事してるので、欲しいことは欲しいけどさ。
PS3のシュリンク版まだー?w 6サイクルもストールするのがやっと改良されたかwww
なにげにメモリがDDR2にかわっとるw
>>648 ベンチマーク取ったわけじゃないけどSPARC64Vは同クロックのOpteron相当って感じだったから
SPARC64VIは同クロックのデュアルコアOpteron相当ってところじゃね?
653 :
Socket774 :2007/04/21(土) 19:58:22 ID:wYC1y5Re
>>652 Spracチップ
SpecCPUなどのベンチではなく、CAEなどのエンジニア向け実アプリでの
性能はどの程度? やはりx86より遅いのかな?
654 :
Socket774 :2007/04/21(土) 20:07:29 ID:wYC1y5Re
CAEアプリは今でもRISCをサポートしてるが、後数年もすればx86 IA64 Power のみになるだろうな。
IA64なんて使ってる奴いるのか?
なんだこの盛り下がりっぷりは… ふざけるな! 大声だせ! Bullshit! I can't hear you! ノ ___l,,,,,,,,,,,,___ | _,,,..-='''''~~~____::::::::::: ̄~~'''ュ | _,,,...-='''''~~~:::::::::::::::::_,,-‐、ノノ、〉::::::::::::::_,.='' _,,,|..-='''''~~~:::::::::::::::::::::::::::::r''''~,="ツ, 、_〈__,,..= ''''~ _,,,...-='''''~~~::::::::::::::::::::::::::::::::::::::::::::: ~''~,ィ'~(i~ 乂 (~::::::::::::::::::::::::::::r=~ _,,,_ ::::::::::::::::::: '  ̄ノ ヽ ~''''''''''''''''''''''~(:::::(("~ヽ~ヽ ::::::::: ..:r ) ):::::ヾ、 l|_、_ ::::::: r`ー'f (:::::::::::`l、 _,-、 / ヽ ヽ:::::::::::ゝ,,_ ノ ' ,イノ `i:::: :::l .〈 〈 タマ落としたか! \ :::l ヽ1 \ ::ヘ ノ ソ \ :::ヘ / f
えっと…類稀な神GPUスレの誤爆…
659 :
Socket774 :2007/04/22(日) 20:27:00 ID:IVb6EVu7
Sparcなんて、デスクトップで使う価値ないだろ? x86が486時代だった頃ならともかく、Core2やPEN4の時代にSparcの性能的な 優位性などどこにもない。
x86は、良いアーキテクチャとは思わないが、安くて速いから仕方なく使っている、って感じ。 他のマシンを使いたくなる。 自作の人だって、全員が最速マシンを目指しているわけではないでしょ。
1:お遊びで手を出すには高すぎる 2:一口にx86と言ってもデファクトスタンダードだけあって色んな分野とつながっている(人生が10回あっても網羅できないほどネタが豊富にある) これに尽きる
662 :
Socket774 :2007/04/23(月) 01:00:35 ID:IKn2C/c5
CPUの命令というのは、CPUの論理回路の組み合わせにより
実装されているCPUを動作させるためのデジタル言語という解釈
でいいのかな?
だから、命令セット(命令の集合)が簡素だとCPUのハードウェア
構成が簡素になると。
>>661 RISCマシン(RISCワークステーション)が高価なのは市場が小さい
からだろうね。
> 命令セット(命令の集合)が簡素だとCPUのハードウェア構成が簡素になると。 割り算や平方根など、それだけで回路が複雑になる命令も有るし、比例関係ではないよ。 必要な機能で複雑になるのは構わないが、 x86の評判が悪いのは、命令セットも回路も、 昔の枠組みに無理に追加を重ねた結果、余分に複雑になったから。
安くて速いならISAが汚なかろうとアセンブラでコーディングする奴以外には なんも関係ない
w 最近は命令のデコードがボトルネックになってることを知らんのか?
>>660 その結果、x86しか使えない人間が多くなり、結局x86優勢に拍車をかけることになるな
>>666 >>664 ×x86しか使えない
○x86だろうが何だろうがISAもアセンブラもどーでもいい(というか知らない)
LinuxもBSDもいろんなアーキテクチャで動くのにx86で使ってる香具師が多くなってきてることだし
それはそれで何か問題でも?という気になってきたw
668 :
666 :2007/04/23(月) 19:05:42 ID:rlH9doHf
>>667 別に何使えないんだろうが知ったことじゃないんだけど、それただの無能自慢だな
速いマシンのアーキテクチャが良いアーキテクチャです
670 :
聞伝君 :2007/04/23(月) 23:00:25 ID:kMcRxqGk
否、儲かるarchitectureが勝る。 速いarchを造るには金がかかる。 開発費を稼ぎ出せる事業戦略のみが速いarchを作り出せる。 逆に考えてる限りダメポ… ーみつをー
>>667 技術者がどうでもいいじゃ困るだろwwwww
使えない言い訳に聞こえる
>>671 いや、まともなやつならどんなISAでもすぐに使えるようになるから
673 :
聞伝君 :2007/04/24(火) 01:52:23 ID:wznBLsbP
ISAとか書くヤシ見ると アセンブラかじったくらいかなと、つい思ってしまう
プログラミングでも、アセンブリ言語以外は、CPUの違いは大した問題ではないのでは? x86しか使えない、というのは、馴染みのソフトが無い(含む開発環境)ってことでは? 「仕方なく」というのも、 学生や新入社員がWindows以外に拒否反応を示すから、とか 予算握ってる人がカタログ性能見て決めたから、とかじゃないの? すると、(ソフト会社の)営業の人がx86へ移植しろって言って、ますます… そんな流れに乗って、Intel自身さえ止めておこうと考えた x86-64が…
>>674 --------------------
アセンブラかじったくらいかなと、つい思ってしまう
--------------------
少なくともBig/Little Endianの違いわ、高級言語を使っていても影響するかと思うす。
アセンブリ言語はZ80のしか知りませんが。 どちらのEndianか意識してコードを書くべき状況もあるけど、意識してればいいだけでは? みなさんはEndian違ったら使えない難しいトリックを駆使してるのですか? なるべくハードのアーキテクチャに依存しないようなコードを書くのが、高級言語の在り方では?
>>674 たいした問題ではあるが、総合的に「速くて安い」という前提があるのであれば
アセンプラでコーディングする奴以外にとってはたいした問題ではない。
x86コードはものすごく組みにくいってわけでもないしな。むしろRISCより楽。
>>675 馬鹿すぎ。そんなどうでもいい違いより高級言語でもCPUアーキテクチャで影響の
大きいところはいくらでもある。
マルチコア、L2容量、SIMD、etc。
しかしそういったものはx86か否かとは関係ない。
>>676 だな。高級言語のメリットは可読性と移植性。
Endianの違いが大きく速度に影響するような状況で小技を駆使して書くのは
インラインアセンブラ使うのと大差ない。
>>603 関数呼び出しが多いとRISCでもスタックに積むから
それほど変らないぜ。
一命令でスタック操作と演算を行えるCISCも結構強い。
LEA A, [B + C * n + m]
なんてこともできるし。
>>673 マジレスするとアカデミックと現場の呼び方の違いす。
683 :
聞伝君 :2007/04/25(水) 02:18:53 ID:OdRkon/G
電子工作キットってところが涙を誘う 680x0エミュレーションとか、なんて言うんだろうこれは。 趣旨は、いにしえの千利休の茶碗よ再びというか…
684 :
聞伝君 :2007/04/25(水) 02:22:02 ID:OdRkon/G
>>681 アカデミズムのghost writterは年中デスマの現場が勤めていたりする
くそったれ
絵を描けない学者様と 絵を描きたくない丁稚(たいていハケン)の 組み合わせは災厄だ。 折れは出入り業者(のさらに下請け)で某研究所に逝き 現実を垣間見てきた。 頼むから学者様、絵を描け。 それから出入り業者といえど、ちゃんと耳を傾けろ。 …それから、俺らに直接発注汁w できれば作業補助でなく、研究で。
分かった上での愚痴だろうが、 教授は派閥争い、助教授は話題性狙い、ポスドク・院生は上のご機嫌伺いをしなければならず 研究の中身なんてまともに考えてない。 研究と出世の両方出来る人もいるかも知れないが、他人を助けるようなお人好しは生き残れないだろ。 x86が繁栄しているのと同じこと。
コードがかけないCPUの研究者>>コード書けるやつ 超級プログラマ == CPUのユーザー 研究者なくしてアーキテクチャの世界は成り立たない 本場は米国 なので、あまりここでムキになるな
688 :
652 :2007/04/25(水) 22:40:38 ID:eqjp2A1I
>>653 CAEじゃないけど実アプリでの話だよ<SPARC64Vは同クロックのOpteron相当って感じ
まあ、デスクトップで使う価値は無いってのには同意
Itanium2はどうよ?
Itanium2をサポートするベンダが少なかった(てゆーか実質皆無?)ので 評価するまでもなく却下されました
てかうちの事業部がItaniumやってるんだけど
そうですか それは失礼しました
新作ウルトラマンの決め技は イタニウム光線です
痛そうだね
HP-UXもWindows Serverも動くし個人的には最強だと思うけど。
うーん、IA64にポートするくらいならx64にポートした方が商売になる ということらしいですよ
IBMがPOWERを使ったUNIXサーバー上で、X86-Linuxアプリがそのまま走るようにしたらしい。
>>697 Itaniumのx86エミュレータはあまり速度でないみたいですが、
IBMは高速エミュが作れるほど優秀ってことですか?
それとも、OSはネイティブでアプリだけエミュレートする、みたいな形式ですか?
中身はQuickTransitらしいよ
>>695 日本人って多機能に弱いよねw
まあItaniumが売れてるのはそれだけが理由じゃなくてIBMいい加減にしろってことだろうけど
>>699 ItaniumもQuickTransitを使ってSPARCバイナリ動かすデモをIDF Fall 2006でやったね
そういえば
>>677 実は意外なところが問題になってきた。x86 のようなアーキティクチャは
その無駄が結果的に発熱になってしまい、サーバルームの空調と電力に
負担をかけ始めた。そのおかげで都市部のメンテナンス性は良いが
狭くて家賃が高くてリソースが貧弱な場所にサーバルームを作りにくく
なってきた。一般人にはサービス料の上昇としてわずかに負担になってる。
高クロック化が頭打ちになって今は低消費電力化に進んでいるがこちらは
そう長くは続かないだろう。そうなるとアーキティクチャに手を入れざるを
得なくなると思うけれど残念なことにインテルは基本設計がメチャ苦手。
将来は暗い。
とにかくおまいら、Itanium 2の素晴らしさに気づくべきと思います
TukwilaでMCM 8コアなんてやらなくていいからMontvaleでMCM 4コアプリーズ
704 :
聞伝君 :2007/04/28(土) 02:03:53 ID:0VXLJNKO
Itanium 2って、静的過ぎて
705 :
聞伝君 :2007/04/28(土) 02:05:23 ID:0VXLJNKO
Itanium搭載したマシン触ってみれば分かるけど 総合的にもう全然
あれはHP-UXの動作するPA-RISCの後継プロセッサであってx86だと思わなきゃいい。 実際Montecitoからx86デコーダ廃止されてるし。
707 :
聞伝君 :2007/04/28(土) 02:12:09 ID:0VXLJNKO
そう言う問題じゃないんだけどな… 時間の無駄か。
いや真面目にIA64で飯食ってるから俺。
>総合的に 全然総合的ではない雰囲気がひしひしとw
>>701 上で誰かが書いているが、x86は売れているがゆえにプロセスも
進歩したものを使えているわけだから俄かには信じがたい。
IAサーバが例えばSPARCサーバに性能あたり電力に劣るとでも?
>アーキティクチャに手を入れざるを 得なくなると
意味不明。命令セットアーキテクチャなのかマイクロアーキテクチャ
なのかはっきりしたまえよ。
きっとあれだ。未だにPPCを捨てきれないマカーだ。 PWRficientは確かにかなり惹かれるものがあるが ESが700ドル、評価キットが8500ドルもするような代物だぜ 出荷時期には安くなるのか?
一年で2億個くらい出れば安くなるでしょ
>>710 >710 の前半は、可変長命令のデコードが電気を浪費している、ってことでしょ。
技術力を結集して作るから総合的には他のCPUに勝っているけど、欠点には違いないわけで、
もしもっとすっきりした命令セットだったら…
ということで、「命令セットアーキテクチャ」を言ってるんじゃないの?
Itaniumが、サーバー専用でなくて、もっとx86互換性を重視した設計で、
最速Pentiumに近い速度でx86コードが走っていたなら、よかったのに。
>>701 総合的に「速くて安い」のだからまったくたいした問題ではない。
x86と同程度の価格と性能で低発熱のプロセッサがあるなら別だが。
そもそもサーバにおいてはもともとx86は弱かったのがどんどんシェアを広げているのに
まったく的外れな批判だ。
715 :
701 :2007/04/28(土) 08:29:57 ID:eydGT+5n
みんな信じられない早起きだな。レスがつくとは思わんかった。
>>710 言葉足らずですまん。
>>713 が補足してくれた
通りです。さらに、x86 命令デコードロジックが足を引っ張って
全体の処理速度が上げられないという問題もある。HT のような
解決策もあるけれどブレークスルーではないですね。
それから
>>714 それは現在の話で、
>>701 で書いているのは
将来の話です。
断続的にNOP食わせるだけでもCPUの発熱かなりのものになるし x86のデコーダはやっぱ熱いと思う。 ちなみにネトバが爆熱なのは、異常にクロックが高いことに加えて 更に汎用ALUの2つが倍速動作だからだと思う。 トレースキャッシュについては、Intelは省電力技術と認識してるみたいだね。 デコーダを止めることができる。SRAMの効率は悪いが。 AMDのプリデコードキャッシュが一番現実的な解なのかな。 各命令5ビット付加するだけでいいし。
Intelが基本設計めちゃ苦手ってアホか…。 現在、Intelが業界トップだろ。POWER6もこけたみたいだし。
65nm SRAMはIntelは成功、IBMは大コケ PS3も360もシュリンクに伴う省電力化にはあんまり期待できんな。
LPIAがスルーされてるのは不都合な事実だから?
組み込み市場ではThumb命令を載せたARMが強いしな 命令密度まで考えればx86 ISAも悪いとこばかりじゃないよ
ARMもARM7TDMIとか50MHz以下が相変わらず主流ではあるけれど 最近、ARM926ES-Jとか200MIPS以上のCPUも安価になってきたからね…。 GbEのハンドリングやらカーナビ需要とかメディア再生機とか色々あるんだろうけども。 まぁセキュリティの関係でシンクライアントや専用端末も見直されてきてるし、 PCも安泰って訳でも無いだろう…。
>>721 ハンドヘルドVista 出るなら欲しいけど。
今ARMなど使ってるメーカーが乗り換えるほど魅力あるの?
新規参入メーカーはともかく。
Intel自体がARM系プロセッサ作ってたくらいだからなぁ
726 :
MACオタ :2007/04/28(土) 14:37:45 ID:WS9bqMMy
>>704 聞伝 さん
------------------
Itanium 2って、静的過ぎて
------------------
CELL BE, POWER6, 等々。高性能プロセッサわ消費電力対策のために静的スケジューリングに
向かいつつあるす。
>>717 団子 さん
------------------
更に汎用ALUの2つが倍速動作だからだと思う。
------------------
昨年か一昨年のISSCCの論文が手に入るヒトわ知っている筈すけど、通常の高性能プロセッサ
わissue queueだのROBだのの命令処理系が最も発熱が大きいのに対して、NetBurstだけ
わ、ALUがとてつもないヒートスポットになっているという発熱分布図が発表されていたす。
ALUは大して電力くってないだろ。NetBurstのは高密度だからホットスポットになっただけだ。 それから、POWER6もCELLも高クロックを目指した結果だろ、OOOをやめたのは。 どっちもこけたに近いから、またOOOが復活する予感。
NetBurstのALUがコアの面積の半分も食ってることすら知らんのか
>>728 ALUは今時のCPUコアのなかでは面積も食ってなくてちいさいいんだよ。
ALUが何かもわかってないやつはひっこんでろ。
出してきたのがWillametteかよ
Prescottも小さいの同じだよ。ダイの数%しかくってない。 写真でRapid Executionの部分が何個並べられるか考えてみ。 面積の半分食っているなんて電波としか言いようがない。
>>729 ALUが何かもわかってないやつはひっこんでろ。
EUが2倍速であるのと同時にレジスタも倍速だしね Prescottは64ビット拡張も入ってるし、Willametteみたいな綺麗なモジュール構造にはなってないよ Prescott/CedarmillのALUの消費電力ってIntelが公表してた筈では。
OOOだとin-orderのX1.5くらいの速度、楽に出るわけでしょ、実装によるけど 電力効率って点から考えると、実は抜群なような ネトバのALUがホットスポットって、尋常でないクロックで動いてる (倍速だから)んで当然だよな
>>736 なかなかいい線ついてるるかと。
OOOにしろIOにしろ、回路規模が大きくなれば電力はあがる。
OOOはIOより一般には回路規模が大きい。
しかし、回路規模に対してどちらがリニアに近い性能向上が得られるのか
というところまで考えると、OOOがIOより消費電力が大きいとはいえないんだよな。
IOで4issueじゃスケジューリングが貧弱すぎて殆ど実行ユニットをあそばしてしまう。
OOOレベルまでIPCをちかづけようとすると結局電力があがるとおもうんだけど。
で、LPIAはOOOで0.5Wといわれる。 結局、電力について重要なのはアーキテクチャよりも デバイスのチューニングと回路実装のほうなんだよね。
書き方がわかりにくかったけど、最適なアーキテクチャは回路規模=使えるトランジスタの数 で大体決まるので、消費電力で頑張るのはデバイスと回路実装の問題がほとんどということね。 低消費電力を考慮したアーキテクチャというのはあるけど、極端な差(数倍とか)は出ないかと。
>CELL BE, POWER6, 等々 2つしかないものを等々ってのもなぁ SunのNiagaraも入れて等々なのかいな 大体OoO外したのIBMだけだ
>>727 POWER6がin-orderなのはエラーリカバリ機能強化も何か関係あるんじゃない?みたいなことをどっかで見たような
>>736 ストールはスレッド切り替えで隠ぺいできる。
これからはマルチコアが主流になりスレッド利用が多くなる。
すると、in-orderのコア数アップのが性能高くなるってことでは。
つーかPARROTは…PARROTはどうなっているのですか?
どうもなっていません
747 :
聞伝君 :2007/04/28(土) 23:00:23 ID:P3Zv8cqj
消費電力もあるだろうけど複雑で大規模回路 周波数上げにくいんだよ、足かせ。 で、ordering捨てたら何が起きたか、ちゅーと…
>>744 CMSみたいなのは、x86コード@Itaniumなどエミュレーションには有効だろうと思うけど、
コード自体が最適化されていれば、ハードで更に効率化する余地は少ないのでは?
それより、
データのロード待ちや分岐ミスペナルティでストールしている時間を減らした方がよさそう。
こっちも、プリフェッチ命令や分岐ヒントなどソフトの対応が必要と思う。
あれ?POWER6ってインオーダだったのか 何故かOoOと勘違いしてた
>>749 情報が錯綜しているすけど、「一部in-orderを取り入れている」ということでレイテンシの短い
IUわin-order、レイテンシの長いFPU, VU, LSUわOoOということらしいす。
http://journal.mycom.co.jp/articles/2007/03/04/isscc1/index.html -----------------------
また、マイクロアーキテクチャ的な変更では、POWER5はアウトオブオーダ実行のコアで
あったが、POWER6ではこれがインオーダに変更された。浮動小数点演算やメモリアクセスに
関してはアウトオブオーダに実行される部分もあるが、インオーダ化で若干の性能低下は
まぬがれないと思われる
-----------------------
昔わ、むしろFPUの方がin-odderだったことを考えると感慨深いす。。。
SMTは2スレッド/コアのままだっけ?
サーバー用POWERの将来展望としてわ、Niagara同様に更なるマルチスレッド化を進める模様す。
これ、ZDNetのBrad McCredie (POWER6のチーフアーキテクト)&Josh Friedrich (POWER6の
メモリサブシステム設計担当)のインタビュー記事す。
http://news.zdnet.com/2100-9595_22-6158739.html ----------------------
IBM likes the idea of adding more threads to processing cores as a way to get more work
out of a chip without adding too much extra circuitry. "You'll see us go more aggressively
after threads. That's definitely a direction you'll see," he [MACオタ注: Dr. McCredie] said.
----------------------
なるほど サーバ用途ではSMTなりVMTなりでレイテンシを隠蔽してこうって算段か
755 :
MACオタ :2007/04/29(日) 17:03:06 ID:x8e03tf/
上から下まで全部持ってるからこういう思い切ったことができるんだろうね OS持ってない会社にはなかなかできないだろう あ、Intelなら大丈夫かな?
そういやPOWER6の遅延について、なんかネタ持ってないの?
1コアで4スレッド走らせるくらいIBMならお手の物かと。
759 :
聞伝君 :2007/04/30(月) 01:11:52 ID:3J7hWzuH
性能はともかく、走らせるだけなら… threadってsoftware的な概念でしょ。 揚げ足ゴメンチャイ
いわゆるlarge-coreがパージされたので4thread/coreが必要になるのはもっと先の話
>>759 CPU屋から見ると
プロセッサコンテキスト?
投機MTにおけるアプローチの主流は、Unixのforkみたく、
任意の時点でプロセッサコンテキストを複製してしまう方向かな?
逆に、PC, フラグ, SP程度しか複数持てない
マルチスレッド実装とか入ったら、もう人間がアセンブラで
手を出せる領域じゃないな。
昔のStellar(Stardent)みたいに若干のハード付加+時分割でマルチストリーム・プロセッサ(MIMD)を実現するのかも。
4way SMTで性能を出せるだけの内部リソースをもつCPUコアは シングルスレッドでも相当速そうだね。電力効率はさておくとして
リソースが増えても、依存関係のため1スレッドで同時実行可能な命令数には限界が有るのでは? リソースを今の4倍にしたら今の1.5倍速くらい出るの? リソース&スレッド共に増やしたほうが、スケジュールが楽で稼働率も向上できる、ってのが目的では?
聞伝君ってCPU屋だったんだ ユーザ側の人だと思ってた
MACヲタや団子厨より有意義なこと喋ってくれるよね。 今のところは。
反論できずに罵る奴よりはな
>MACヲタや団子厨 彼らは自尊心維持活動の一環としてCPUの話があるだけだからな。
だーんごー だーんごー たーっぷりー だんごー 現役のソフトウェアエンジニアだ、ハゲッが。 机上論者と一緒にすんな、ハゲッが。
底辺でしょ
773 :
MACオタ :2007/04/30(月) 21:12:42 ID:qk7MKfVw
話が論理的に矛盾が無く実験事実を説明できるなら、中学生が語ろうが業界関係者(笑) が語ろうが価値わ等しいというのが、正しい技術観というモノすけどね。。。 匿名掲示板で自説の正しさを主張するのに、経歴自慢するヒトって基本的に科学や技術の 話をするのわ向いていないと思うす。
>>757 特に遅れているという訳でも無さそうす。
http://www.itjungle.com/tfh/tfh043007-story02.html --------------------
Two independent sources, reading last week's story, sent me the same rumors that they
are now hearing about Power6, which is that the chip and its systems will be launched
sometime in late May for a June or July delivery.
--------------------
まあ、プロセッサの特性を観察する機会が与えられてない人間が何を言っても 説得力はないんだけどね。 特に誰かさんの大好きな海外ルーマーサイトの転載を根拠とした論理展開などもっての他。
大原某のCore2の連載には毎度抗議させてもらいましたが
ま、的外れな考察など入れずに公開された事実を事実のまま報道できてるなら基本的に間違いじゃないと思うが
>>777 大原氏わ、プログラム書くヒト
後藤氏わ、プログラムなんて書いたこと無いヒト
。。。なんだか
>>769 や
>>775 の御高説と矛盾してるような気がするす(笑)
実験そのものが無意味で論点が的外れなんだから仕方ない ソースは2ちゃんって回もあったなwww
MACオタってまだいたんだ…
ここにGPレーサーきてませんでしたか? そうですか......
プログラマだとそのまま速くなる方がうれしいからな。 ヘテロとか嫌がるのも判る。 特にリタイア組と、1世代前に全力を尽くした人はw
Opteronと組み合わせるぐらいなら、メインコアをOpteronにしたCellを作った方が… なんてね。w
>>785 現在のx86アーキティクチャは互換性のためだけにあるような
ものなのでこういう特殊なプロセッサに実装する意味はないでしょう。
講演後の質問が低調であったので、筆者が手を挙げて、「説明された スケジュールによると基本設計は3月末で終わっているはずだが、 次期スパコンの技術的内容は何時頃になったら公表されるのか」と 質問をしたら、「5月末の文部科学省の審査までは発表できない。 その後」という答えであった。この質問に関して、筑波大の朴先生からは、 「ああいう質問をしてはイカン」とお叱りを受けたが、「皆、聞きたかった。 良く質問してくれた。」という先生も居られ、筆者の質問に関しては、 賛否両論であった。 ワロス。さすが安藤タン。しかしなんだよこの朴とかいう奴。 自由に質問して何が悪いんだよ。誰でも思う疑問だろ。
"説明された…何時頃になったら公表されるのか"これがNGな理由はよくわからんね そりゃ聞いちゃいけないことは当然あるんだろうけど 例えばチップの歩留まりは具体的に何%なのかとか
>>786 なのにバイナリ互換なんて意味のないHPC用途で
Opteronとインフィニで接続というわけのわからない構成
790 :
785 :2007/05/02(水) 00:42:40 ID:3YHDmadR
>>786 789の言うとーり、784の内容をちゃかしただけだって。その位判るべ…
>>789 また例によって、x86しか使えないのが自慢の団体なんだろ
汎用品のオプトロンと設計済みのCellを使う方が 安いからに決まってんだろアホか。
ロスアラモスはOpteronをメインで使ってるので しょうがない。お客さまの要望通りに作ってる だけですよ。
794 :
聞伝君 :2007/05/02(水) 03:28:47 ID:BOO3tAcW
関係者?まさかな。 日本で2chしてるわけがない
795 :
聞伝君 :2007/05/02(水) 03:33:47 ID:BOO3tAcW
Cell単独じゃ糞みたいな代物になる Opteronだけで組んでは演算ピーク性能wが 変わり映えしない そんなとこ
796 :
聞伝君 :2007/05/02(水) 03:38:19 ID:BOO3tAcW
つくづく思ったのは アメリカは軍事の金の流れがあってその分強いけど Cell+Opteronの構成でハイ、スパコン? なんだか技術的にいい加減な面もあるなと。 日本のゼネコン・メインフレーマーはそれ以下だけど。
COTSマンセー 予算蕩尽しなきゃスパコンじゃないなんて大嘘 追い詰められた日本企業の営業乙w
新規にコアを起こすとコンパイラも書きなおしじゃ。
ベクトル演算に強いCellと汎用演算に強いOpteronを InfiniBandで接続するのって、合理的な構成だと思うが。
800 :
聞伝君 :2007/05/02(水) 04:26:23 ID:NeEIRHSN
なんでCellがベクトルなんだよ…(ーー;
触った感じとしては、メインコアとしてPPEは結構貧弱。 リソースマネジメントだけにタスクを割り振って、汎用的な演算は 汎用的なCPUに分担させたほうが良い希ガス。 さて、PPEだけど、リトルエンディアンモードが無いね。 SCEの技術仕様では、ビッグエンディアンモードだけを サポートすればいいということになってる。 ちなみにSPEも同様。 「x86コア+SPEという構成も可能」とのたまう後藤とかいう電波がいたけど x86はリトルエンディアンだけだから、SPEをそのまま使うのは苦しいと思われ。
蚊電君が思うにはCellはスカラ演算向けらしいwww
803 :
聞伝君 :2007/05/02(水) 04:35:31 ID:MIZBpvl2
何で ベクトルレジスタもベクトルパイプラインもベクトル化コンパイラもないのにベクトルなんだよ
804 :
聞伝君 :2007/05/02(水) 04:37:25 ID:MIZBpvl2
笑わせてくれるおもろいレスキボンぬ いや、やっぱいらない。
>ベクトルレジスタ 汎用レジスタ幅128ビットですが それともローカルストアのこと? >ベクトルパイプラインも ベクトル演算の必須要因ですらないな。論外。 >ベクトル化コンパイラ XL C++はこの人の脳内では存在しないことになってるらしい
806 :
聞伝君 :2007/05/02(水) 04:47:47 ID:MIZBpvl2
ダメだコリャ、素人か… cellにxlcとは…南無阿弥陀仏。 話がずれるが、xlcのvector directiveの生成code見なさい vector化なんてしてないから。
ひょっとして昔ながらの「ベクトルコンピュータ」でやる演算じゃない限り ベクトル演算じゃないと思いこんでるのか。 じゃあなんなんだろうな。AltiVecとかVMXのVecあるいはVって。
なんだCellSDKも触ったこと無いのかwww IBMが公式に出してるだろww 恥の上塗りだからとっとと消えてねwww
809 :
聞伝君 :2007/05/02(水) 04:49:31 ID:MIZBpvl2
SIMD。
SIMDとベクトル演算が別物なのかwwwwwww 面白いもっと笑わせてくれwwwww
811 :
聞伝君 :2007/05/02(水) 04:51:14 ID:MIZBpvl2
で、話を戻すとcellがベクトル演算に強いのか?
812 :
聞伝君 :2007/05/02(水) 04:51:50 ID:MIZBpvl2
SIMDはベクトル演算の実現方法の1方式だと思ってたが違うのか
814 :
聞伝君 :2007/05/02(水) 04:53:42 ID:MIZBpvl2
SIMD=ベクトル演算 あたま大丈夫か。 別に俺の頭じゃないからいいけど
816 :
聞伝君 :2007/05/02(水) 04:54:50 ID:MIZBpvl2
更にcellはSIMDではない
817 :
聞伝君 :2007/05/02(水) 04:56:03 ID:MIZBpvl2
放っておけばいい 信じたんだ
2005年現在のコンピュータは、例えば短いQuickTimeのムービーを再生しているときなど、 1970年代のスーパーコンピュータよりも多量なデータを処理している。 ベクタープロセッサの要素はSIMDという名前でほとんどのCPUのデザインに採り入れられている。 それらの実装では、ベクタープロセッサはメインのスカラーCPUの横で動作している。 手前の脳味噌かWikipediaの記事のどっちかを直してきてくれよwww
>更にcellはSIMDではない ぷはwwwwwwwwwwwwwwwwwww 東芝セミコンの部長さんに聞かせてみたい言葉だwww
x86のストリング命令はベクトル演算だとか言い出しそうで怖い
821 :
聞伝君 :2007/05/02(水) 05:02:36 ID:aAgmZH4B
wikiが不正確。 メーカーは都合のいいときに意味も良く分からずベクトルという。 東芝はベクトルの技術がない、一々信じてるのか。 そもそもベクトル演算とはなにか分かっているのか。 カキコ規制食らった
822 :
聞伝君 :2007/05/02(水) 05:03:17 ID:aAgmZH4B
stringが何でベクトルだw バカか
32*4で四次元ベクトルだし、64*2でも二次元ベクトルだが、
どうせ聞伝訓は、「○○が無ければベクトルプロセッサとは言わない」って言うんだろ。
この早朝の煽り合いを見るに、聞伝は団子は同レベルであり、
>>765-768 みたいな評価をする奴は一人しか思いつかない。
なんだ、Cellの設計にNECでSX-8を設計してたエンジニアが関わってることすらしらんのか
825 :
聞伝君 :2007/05/02(水) 05:05:07 ID:aAgmZH4B
騒いでもいいけど、すぐベクトルとか書くと バカだと思われるだけだぞ ましてやcellをベクトルとか言うと。 まいいけど俺の事じゃないんで、
826 :
聞伝君 :2007/05/02(水) 05:06:03 ID:aAgmZH4B
>>824 だからしくじったんだよ、有名な話し。
寝る。
大丈夫、馬鹿はおまい一人だけだから
828 :
聞伝君 :2007/05/02(水) 05:07:58 ID:aAgmZH4B
>>823 すまんな、ベクトルといえばモレはcrayとかそういう
きちんとした vector architecture以外は
単なるSIMDだと見なしてるんで。
http://www-06.ibm.com/jp/developerworks/linux/library/pa-linuxps3-1/index.shtml Cell BE 内の PPE 以外の要素は Synergistic Processing Element (SPE) として知られるもので、それぞれの SPE は、以下で構成されます。
Synergistic Processing Unit (SPU) と呼ばれるベクトル・プロセッサー
SPU に内蔵されたローカル・ストアと呼ばれる専用メモリー域 (PS3 でのサイズは 256K)
外部との窓口となる通信チャネル群
128 ビット幅×128 のレジスター群 (それぞれのレジスターが通常、32 ビットの値を 4 つ同時に保持するものとして扱われます。)
SPU のローカル・ストアとメイン・メモリー間の DMA 転送を管理する Memory Flow Controller (MFC)
蚊電君遁走しますたwwww
> cellはSIMDではない 思わず吹いて飲んでいたコーヒーをキーボードにぶちまけた。 朝っぱらからクオリティー高いな。このスレ。
831 :
聞伝君 :2007/05/02(水) 05:09:53 ID:aAgmZH4B
ちなみにモレはここ2日ほど書いていないよ 遊びに行っていた。
>>828 おまい一人の感想で世の常識を否定するなよwww
>>830 スカラ演算専用器が存在しないからそう思っただけじゃないのwww
「128ビット整数」演算ができるわけでもないのにね
834 :
聞伝君 :2007/05/02(水) 05:12:00 ID:aAgmZH4B
>>829 それこそベクトルとは全然違うってことじゃない。
>>830 cell SPE群はSIMD命令一発で駆動できる?
835 :
聞伝君 :2007/05/02(水) 05:13:49 ID:aAgmZH4B
cellでどうやってvector pipeline構成させるんだ? software的にやれば出来ないこともないけど、メチャメタめんどくさいエミュレーションになってしまうぞ
寝るって言ったんなら寝れwwww >SIMD命令一発で駆動 意味不明なレスだな
837 :
聞伝君 :2007/05/02(水) 05:17:06 ID:aAgmZH4B
>>836 その意味が分からないなら
ベクトルを知らないってことだよ。
時間の無駄だった。ノシ
3Dグラフィックスで多用するのは主に2〜4次元のベクトルなのに 果たしてvector pipelineなるものが必要なのかねぇ
839 :
聞伝君 :2007/05/02(水) 05:20:01 ID:VryTO6mo
graphics座標変換にvector演算なんて必要ない。 完全に勘違いしてる
本物のロートルのようだ
842 :
聞伝君 :2007/05/02(水) 05:33:58 ID:84QHGWvc
次元関係ないんだけどな そんな初等数学持ち出されても… で、cellはvector機でOK?
843 :
聞伝君 :2007/05/02(水) 05:34:48 ID:84QHGWvc
cellはvector機?
844 :
聞伝君 :2007/05/02(水) 05:36:46 ID:84QHGWvc
言い張れよw 意気地なしが。
IBMや学術機関の学者さんが普通に使う語義と 自作板で壊れたラジオのようにわめくロートルの脳内定義と どっちが正しいかは火を見るより明らかだわな
846 :
聞伝君 :2007/05/02(水) 05:38:43 ID:84QHGWvc
バカみたい。 コンピューターの基礎も知らず用語を振りかざして
847 :
聞伝君 :2007/05/02(水) 05:40:45 ID:84QHGWvc
Iって一回もまともなvector機造ってないんだよね でxlcにvectorってdirective入れて 実はload命令ちょっと先に出した位でさ intelも似たり寄ったり
849 :
聞伝君 :2007/05/02(水) 05:42:24 ID:84QHGWvc
自分の言葉で語りなよ 「cellはベクトル機である」 ってさ。
2chで自分の言葉で語られても・・・その・・・なんだ まったくもって信用できない・・・
851 :
聞伝君 :2007/05/02(水) 05:45:04 ID:84QHGWvc
cellがベクトル機か… 無知の知にすら至らず
SIMD≠ベクトル演算なんていう馬鹿にいかなる持論も通用しないのは 数レスみれば明らかだよな。 情報学の権威との知識の乖離を指摘してやるのがボケの治療には一番だろwww
853 :
聞伝君 :2007/05/02(水) 05:46:13 ID:84QHGWvc
>>852 だから、自分の言葉で語りなよ
「cellはベクトル機である」
ってさ。
CELLは、1命令で単精度4個か倍精度2個の並列演算だけど、 聞伝訓は、1命令で64個くらい並列演算しなければ「ベクトル」って言わないんだろ。 いつまで、不毛な言葉遊びしてるのやら。
855 :
聞伝君 :2007/05/02(水) 05:48:51 ID:84QHGWvc
いっそ実名でどこかに公表したらいいよ 「cellはベクトル機である」ってさ。
856 :
聞伝君 :2007/05/02(水) 05:49:32 ID:84QHGWvc
Cell自体は混合型マルチコアであって それ全体を指してベクトル型かスカラ型かなんて言うのは馬鹿だな
858 :
聞伝君 :2007/05/02(水) 05:53:12 ID:RYc/+Gx/
で、vector演算に強いのか? あれがw
859 :
聞伝君 :2007/05/02(水) 05:55:16 ID:RYc/+Gx/
vector演算に強いというのなら cellでvector機をreplaceできるのか?
ベクトル計算を1サイクルで出来るんだからいいんじゃねw
861 :
聞伝君 :2007/05/02(水) 05:58:30 ID:RYc/+Gx/
それで実は役に立たなかったとして 顧客業務が滞って責任もてるのか? なんて考えて発言してないよな2chだから ーみつをー
IBMが無責任だという発言をする池沼は たまに見ますねw NG推奨 ID:RYc/+Gx/
それこそ高次ベクトル演算が1命令でできるとかできないとかの レベルで区別してるから馬鹿なんだろう ベクトルの演算自体は極端な話、スカラプロセッサでもできる。 問題はそれに適した設計かどうかって話。 SIMDはベクトル演算向けの技術。
864 :
聞伝君 :2007/05/02(水) 06:21:24 ID:pyGy6i/M
高次ベクトル演算ってなんだ? faddもvector化するぞ
865 :
聞伝君 :2007/05/02(水) 06:23:36 ID:pyGy6i/M
それに適した設計ってなんだ? ますますワカラン
866 :
聞伝君 :2007/05/02(水) 06:27:24 ID:pyGy6i/M
>ベクトルの演算自体は極端な話、スカラプロセッサでもできる。 算数のベクトルとベクトル演算の区別がつかない人だったのね…orz
物理工学知らないのか 論外
算数(初等教育における数学)でベクトルは扱いません 常識がない人間ってとことん常識がないな
ヒント:浮動小数演算専用ユニットがなくても浮動小数演算はできるよね。
>>862 とりあえず実施の方向で
G80のspはscalarだが、vector演算やるわよね?
871 :
聞伝君 :2007/05/02(水) 06:42:01 ID:0ONiCyKj
愕然とするレベルの低さだった 何なのこれ 板の限界?
872 :
聞伝君 :2007/05/02(水) 06:45:00 ID:0ONiCyKj
無理にとは言わないけど、 vecor processorについて少しは勉強してから ベクトルとか言った方が良いと思うよ
それは違うあれは駄目ばっか言ってないでベクトル演算の定義でも言ってみてよ。
そもそも「ベクトル」の意味わかってないんじゃないの。 ベクトルプロセッサの「ベクトル」が数学のベクトルと別物だと本気で思ってるんなら 救いがないというか。 電磁気学や熱力学の分野で行う演算が、まさに高次元ベクトルを扱うもので それを高速に処理するために開発されたのが、その古典的なベクトルパイプライン。 3Dグラフィックで扱うベクトルは精々2〜4次元程度だから SIMDが最適なベクトル演算技術というわけ。
団子サマは、コンピュータサイエンスとハードウェアには弱いのです 現役SEだけど
876 :
・∀・)っ-○◎● :2007/05/02(水) 07:20:07 ID:G9cwloAP
は? スーパーコンピュータの歴史は物理工学の歴史ですが?www ロートルに同調する馬鹿さらし上げ
877 :
・∀・)っ-○◎● :2007/05/02(水) 07:30:37 ID:G9cwloAP
「テンソル」って何のことか説明できる?
ベクターなら知ってる
がんばれ聞伝君 俺らの誤りを正してくれ
自作板の中心で日本情報処理学会への挑戦をする蚊電くんwww
聞伝君、もうそろそろ素人の俺たちのために vecor processorとSIMDの厳密な定義を教えてくれw
また無駄な喧嘩してる。
団子がオナニーしてると聞いてやってきました
884 :
聞伝君 :2007/05/02(水) 15:32:38 ID:3bAfCxyI
いや今回ばかりは言ってることは正しい 持論に綻びが見えると個人攻撃に走るタチの悪さは、聞伝もMACヲタと大して変わらん
また関係ないことを。 ロード・ストアがパイプライン処理されるのはベクトルの次元数が不定だからこその話。 64bitや128ビット固定ならレジスタに配置したままの方が扱いやすいだろう。 で、ベクトル演算の説明は? 古典的ベクトルプロセッサの説明をしろなんて誰も言ってないが。
887 :
聞伝君 :2007/05/02(水) 15:58:31 ID:2UwJUr7P
数値を配列に並べた意味でのベクトルに対する計算をする何らかの機能があれば vector processorだと思う?
888 :
聞伝君 :2007/05/02(水) 16:00:12 ID:2UwJUr7P
パイプライ化は配列の要素数が不定だからこその話し? 固定じゃダメなの?
889 :
聞伝君 :2007/05/02(水) 16:05:04 ID:2UwJUr7P
64bit、128ビット程度ならベクトルパイプラインなんて大技出す幕じゃない 依存がなければon registerで並列にSIMD演算すればいい。
たとえばたかだか3次元座標ごときでいちいち都度メモリに書き戻してたら レイテンシが大きくなるだろw 違いは主に扱う次元数が少ないか多いかであって、座標だろうが高次ベクトルだろうがベクトルデータにはかわりない。 1インストラクションでメモリ読み書きが行えるかどうかはベクトル演算の本質ではない。
891 :
聞伝君 :2007/05/02(水) 16:28:21 ID:2UwJUr7P
>>890 > 1インストラクションでメモリ読み書きが行えるかどうかはベクトル演算の本質ではない。
誰もそんなこと言ってないよ。
聞くけど、書いている「ベクトル演算の本質」って何?
SIMDがベクトル演算じゃないってトンデモ理論を続ける気が無いならそれでいいし いまだに解らないならこれ以上話をするだけ無駄だな
893 :
聞伝君 :2007/05/02(水) 16:41:23 ID:2UwJUr7P
何でベクトルパイプラインも無くて パイプラインチェイニングも無くて SIMD命令でALUが同時に動くだけでvector processorって言える? 中の動きが全然違うのに
894 :
聞伝君 :2007/05/02(水) 16:43:22 ID:2UwJUr7P
>>887 の様な誤解をしている人が多いんだろうな。
出かけるわ ノシ
887 名前:あぼ〜ん[あぼ〜ん] 投稿日:あぼ〜ん 888 名前:あぼ〜ん[あぼ〜ん] 投稿日:あぼ〜ん 889 名前:あぼ〜ん[あぼ〜ん] 投稿日:あぼ〜ん 891 名前:あぼ〜ん[あぼ〜ん] 投稿日:あぼ〜ん 893 名前:あぼ〜ん[あぼ〜ん] 投稿日:あぼ〜ん 894 名前:あぼ〜ん[あぼ〜ん] 投稿日:あぼ〜ん 弱い犬ほどよくわめくって本当だね
896 :
亀の786 :2007/05/02(水) 17:37:42 ID:GprcE68/
あらあら、あまりに進んでるんで違うスレかと思ったよ。
ちゃかしているんだろうとは思ったんだけどマジレスしてごめんね。
>>785 cell+opteronサーバは互換性は関係なくコスト的に考えて妥当でしょう。
x86はintelやamdがそれはそれは大量なりソースを投入してあの性能を
実現しているのであって、cellの開発リソースを借りたぐらいでは
ヘボヘボなx86コアしかできないだろう。
実際問題、あんだけの大きさのダイの中に8個のSPEが納まってるんだから ISAとかよく考えられてるなと思う。
ベクトル演算(に適した演算器)とベクトル演算器は違う。 SIMDはALUと比較するなら前者と言えるが後者ではない。 ただそんだけの話。 聞伝君も団子もコミュニケーション能力に欠けることがよくわかる。低レベル展開乙。
そろそろMIMDについて教えてくれませんか?
>>787 安藤タソは関係者なんだからってことなんじゃね?
「おれのベクトル演算器の定義はこうだ。」 「違う。おれの定義はこうだ。」 と言い争ってただけだろ? 明確な定義なんて決まってないのにくだらねぇ。 時代によって変わるのも当然だろうし。
俺ペクトルプロセッサなんて一言も言ってないぞ 「ベクトル演算」はベクトルプロセッサじゃないとできないと思ってるヴァカがほえてただけだろ。 「CellはSIMDではない」とか言う電波発言は印象深いがwww
>>902 ちょっとずれてる。団子もSIMDがベクトル演算器だなんて言ってない。
まーくだらないガキの喧嘩なのは同意だがね。
今回は8割方ダンゴの勝利
>>900 マルチプロセッシングのこと。シスアドや基本情報ですら出題されるぞ。
聞伝君は午前で不合格だろうけどwww
○: 団子 ●: 聞伝 : MACオタ とりあえずつくってみたす。。。
誰も戦おうとしてない 「由緒正しき(ベクトルスパコンの)ベクトルプロセッサ」 という土俵で一人相撲を取ってしまった聞伝君がアホ
団子はさ、知識が中途半端だと思うよ。
>>818 とかね。あとで取り繕ってもこんだけ大量に書けばわかるって。
役に立つ度では聞伝の方が上だけどね。
>>818 はそんなにおかしいことは書いてないす。
それただのヰキベヂアの転載だよwww
>>910 「cellはSIMDではない」発言の有用性って?
やっぱり殺伐としたスレで笑いを誘うことによる健康効果ですか
両名とも、ちゃんと見識の一致点と、用語定義の相異点を洗い出して 納得できるところに落ち着ければ生産性のある議論になるのにね。 「自分はこんなに知ってて、お前は低能」ばっか前面にだそうとするから・・・ 古典ベクタと最近のSIMDはちゃんと区別されるべきだけど、 どっちもベクタと呼ばれることはある。たるたるの混同の仕方は どうかと思うが。
SSEやAltiVecなんかはRISC(というかロード・ストア)アーキテクチャの流儀で ベクトルプロセッサのフィーチャを取り入れたもので、たるちゃんの識見が 間違ってるわけでもないでそ
915 :
聞伝君 :2007/05/03(木) 00:26:46 ID:Xfdt06LV
SPEはSSEの様なSIMD命令を備えているが 各SPEをPEとたSIMD実行についてはどう。 各SPEは各local memoryにstoreされたprogramを実行するんじゃない? という意味だよ。
>>915 言いたいことはわかるが、どみてもそれはCellのメリットだろう。
32並列の演算しかできないんじゃ使いづらくて話にならん。
917 :
聞伝君 :2007/05/03(木) 00:37:14 ID:Xfdt06LV
ベクターという用語は口当たりよいせいか、よく濫用されがち。 ベクター=スパコン=速い、という考えのすり込みだと思う。 ベクトルパイプラインを備えないSIMDで配列の演算を行って ベクターと見なすことにはものすごい違和感がある。 メーカーのSEも区別が付いていない人は少なくない。 (へたすりゃSMP loop分配の為のindep directive挿入までベクター化と 呼んではばからず、しつこく説明しなけりゃならなかったりする。) そう言う話だよ。
SPE内は4-way SIMD、SPE間は8-way MIMDだわな。 古典ベクタってのは、俺の理解では、パイプライン遅延、 メモリ遅延を隠蔽して宴慙愧
919 :
聞伝君 :2007/05/03(木) 00:38:12 ID:Xfdt06LV
>>916 いいか悪いかは言及してませんよ。旦那。
失礼 古典ベクタってのは、俺の理解では、パイプライン遅延、 メモリ遅延を隠蔽して演算器の稼働率を高く保つ技術で、 SSEとかにもその効果はあるにせよ、たくさんの演算器を 並列に使うという意味は副次的なもの。
921 :
聞伝君 :2007/05/03(木) 00:41:00 ID:Xfdt06LV
>>918 俺はあの強烈なベクトル・パイプラインチェーン化が
「ああこれぞベクターだ」なって鮮明に区別しているんよ。
パイプラインの強力さが全然違うもの。
名前あぼーんしてるから読めんが 最近のプロセッサはスーパースカラーでSIMDユニットを備え、 更にマルチコアだからな。従来のアーキテクチャの括りが古い。
聞伝のいいたいこともわからなくもないが、>>799-
>>800 団子はそもそもベクトル演算とCellのSIMDの話しかしていないのに、
>>800 で勝手にベクトル機の話を混ぜてこんでいるだけ。これは読み返せば明らか。
以後、ベクトルプロセッサ, ベクトル演算, SIMDなどの定義が
自分の中でも整理がついていなかったことが後続の書き込みで明らかに。
ベクトル機のベクトル演算以外はスカラ演算なんて話はありえんし。
ベクトルパイプラインは大昔の実装の話で、今はSIMDもかわらん。
というわけで今回は団子の勝ちということす。。。
>>920 Athlon64やPentium Mなどでは、2つの64ビットSIMD整数ユニットを使って128ビットSIMD演算やってるな。
あれ?
925 :
聞伝君 :2007/05/03(木) 00:44:11 ID:Xfdt06LV
SSEとかはね、register増やしてSIMD命令で load/store/演算できるようにしたもので、 load- > 演算 -> store といったパイプラインの中を ベクトルデータがザーッと流れていくベクターとは 中のstageの流れが違うよ。
まあどっちにしろゲームで32並列の演算なんて使い切れんけどな。
928 :
聞伝君 :2007/05/03(木) 00:48:39 ID:Xfdt06LV
930 :
聞伝君 :2007/05/03(木) 00:50:13 ID:Xfdt06LV
>>929 理由はしらんが、違うと書いたらそれに反論がくるのよ。
ベクトル演算器でコード書いたことある人は2人だけみたいねー (俺もないよ)
933 :
聞伝君 :2007/05/03(木) 00:52:42 ID:Xfdt06LV
わかったよ、スルーするよ。
934 :
Socket774 :2007/05/03(木) 00:52:59 ID:zCYEC0tU
> cellはSIMDではない 馬鹿皿仕上げ
強力つーかさ、それってベクトル長を長くして初めて 演算器の稼働効率あげられるってだけでしょ。 スーパースカラでキャッシュに収まっていたらピークの半分とか 出ちゃう時代には無用の長物。 そんでリッチなデータレベル並列度のある問題に対しては 演算器を2倍、4倍にして加速しようというのがSSEとか AltiVecなわけだよね。load/storeが弱い(てかランダム アクセスできない)のはご指摘のとおり。
ところでなに32って数字は。 そもそもPS3では7SPE版が使われてる上にハイパーバイザが1個食ってて ユーザーレベルでは6SPEしか使えない。 つか、SPE=4並列ってのがわからん。floatやint32の場合だろ。 shortなら8並列、byteなら16並列おk。 極論、Cellは1PPE+1SPEだけでも動くほど各SPEは独立してる。 全SPE同期して動かすなんてオーバーヘッドが大きすぎww
938 :
聞伝君 :2007/05/03(木) 01:01:39 ID:Xfdt06LV
>>935 peak 性能/costで見れば、数年前からもう10倍以上違う。
でも、memoryを舐める大規模解析ではベクターが有利、
いや、DMPで細分化してcache hit率上げればRISCが有利、
ってガチャガチャやり合っている。
でも大規模解析ではまだ圧倒的にvectoが強いよ。
スルーすれば良かったかな。ビールでも飲むかノシ
alphaはopteronに喰われた(化けた?)よね。 昔はスーパーコンピューティングといえばベクトル化だった わけだが、今はベクトル機=メモリバンドにお金を払うに なったわけだ。
なにこの冷麦
Core 2 DuoはMIMDだからSSEはSIMDじゃない! とか言い出しそうで怖いよ、このスレの誰かさんが
そこまで小理屈こねくりまわすと、今のSSEやAltiVecはSIMDなどとは よべないというマニアが出てくるからな。SIMDレジスタなどではなく、 PE(ALU+REG)に制御ユニットが大量ブロードキャストするのが 真のSIMDだとかいいだすやつ(過去にもそういうやつが実際にいた)。キリがない…。 ベクトルもSIMDも今の集積回路技術がない時代に作られたもので、 ベクトル機にも時代時代でいろんな形態があるし、 あんまり一時期のことにこだわるのは御法度。
944 :
聞伝君 :2007/05/03(木) 01:43:28 ID:jlCDw4HF
SSEはSIMD命令・演算ではあるけど、SIMD「processor」ではないよね。 あまり曖昧にしないでこのくらいの区別は付けた方がイイと思われ。 無理にとは言いませんが。
このスレでSSEをSIMD「processor」として認識するようなやついるか? いねーよ
946 :
聞伝君 :2007/05/03(木) 01:50:22 ID:jlCDw4HF
蒸し返すようだが配列に格納されているベクトルデータに SIMD演算を実行出来ればvector processorなの? これ以上言っても仕方なさそうだけど。
948 :
聞伝君 :2007/05/03(木) 01:54:37 ID:jlCDw4HF
まだ馬鹿がファビョっているな。
950 :
聞伝君 :2007/05/03(木) 02:02:10 ID:jlCDw4HF
951 :
Socket774 :2007/05/03(木) 02:03:30 ID:QkDuQgUY
cellはSIMDではない
勝手に勘違いしてただけだろ。
953 :
聞伝君 :2007/05/03(木) 02:04:12 ID:jlCDw4HF
>>949 これが団子のプロキシ攻撃?まいいけど。
>>953 cellがSIMDでないの説明を下さい。是非。
955 :
聞伝君 :2007/05/03(木) 02:05:05 ID:jlCDw4HF
cellはSIMD processorじゃないだろ。 SPEはSIMD命令を持っているが。
>>955 あれ?Processorなんて付いてないよ?
「SIMDでない」の説明ですよ?わかってる?
957 :
聞伝君 :2007/05/03(木) 02:06:19 ID:jlCDw4HF
ベクトル演算(ベクトルえんざん)とは、同一の演算を繰り返すような操作 (例:FORTRANにおけるDOループ)を逐次的(スカラー演算)ではなく、 一度に行うもの。ベクトル演算が行える計算機をベクトル計算機と呼ぶ。 近年では3D表示の座標変換に行列演算を多用するため、PlayStation2など ゲーム機でもベクトル演算機能が採用されている。 釘を刺すけどPS2のアレ(VU)ってただのSIMD型コプロセッサだよ。
>>958 ベクトル計算機の項目に
現在、ベクタープロセッサを名乗るプロセッサは少ないが、SIMDと呼ばれる
ベクトル演算を行う機能を備えたマイクロプロセッサは多い。
なんて書かれてるよw
961 :
聞伝君 :2007/05/03(木) 02:09:19 ID:jlCDw4HF
なんだあぼーんしないでこっそり読んでいたのか。 だからSIMDというだけでvectorではないとかいたのさ。
>>961 責任を持ってcellはSIMDじゃない説明をして下さい♪
ほらほら。速く。
マッチ放火聞伝君は逝ってよし
964 :
聞伝君 :2007/05/03(木) 02:10:56 ID:jlCDw4HF
vector命令はSIMD命令。 だが、その逆、 SIMDはvector、これは違うよ。
>>964 cellがSIMDでない件について
説明キボンティーヌ
966 :
聞伝君 :2007/05/03(木) 02:11:53 ID:jlCDw4HF
>>962 cellはMIMDだって。上の方に書いたよ。
967 :
聞伝君 :2007/05/03(木) 02:12:42 ID:jlCDw4HF
反論ならばcellがSIMDだって説明しないと。
969 :
聞伝君 :2007/05/03(木) 02:13:42 ID:jlCDw4HF
971 :
聞伝君 :2007/05/03(木) 02:15:49 ID:jlCDw4HF
なんか団子みたいなのが急に沢山湧いてきたな
CellがマルチコアだからSIMD型じゃないって言い出したら Core2のSSEはSMEに改名しないと駄目になるぞ
974 :
聞伝君 :2007/05/03(木) 02:17:05 ID:jlCDw4HF
誰もそんなこといってないし…
恥ずかしいレスを消し去りたいので 早く1000到達してdat落ちさせよう と思ってる聞伝君なのであった
cellはSIMDではない これには感動した。馬鹿過ぎる。
何この流れ
天麩羅に追加ヨロ 816 :聞伝君:2007/05/02(水) 04:54:50 ID:MIZBpvl2 更にcellはSIMDではない
828 名前:聞伝君[sage] 投稿日:2007/05/02(水) 05:07:58 ID:aAgmZH4B
>>823 すまんな、ベクトルといえばモレはcrayとかそういう
きちんとした vector architecture以外は
単なるSIMDだと見なしてるんで。
でも、CellはSIMDじゃなんだぜ!MIMD!!
「MIMD」はマルチプロセッサ以上の意味は無いからね 純スカラなコアの組み合わせでも「MIMD」は構成できる。 コントロールコアのPPEを含め、全てのプロセッサエレメントで、 SIMD(1命令で複数のデータを処理できる)機能がサポートされてるのに SIMDじゃないっていったいなんなんだろうね
981 :
聞伝君 :2007/05/03(木) 02:31:26 ID:jlCDw4HF
>>980 そりゃ真っ当な反論だ。
だがそんな使い方しないだろ。
816 名前:聞伝君[sage] 投稿日:2007/05/02(水) 04:54:50 ID:MIZBpvl2 更にcellはSIMDではない
>>981 どっちかというと藻前産のほうが逸般的だと思うぞ。
984 :
聞伝君 :2007/05/03(木) 02:34:55 ID:jlCDw4HF
CellをSIMD命令で駆動させている?
>「MIMD」はマルチプロセッサ以上の意味は無いからね マルチインストラクションマルチデータならスーパースカラでもMIMDになりそうな……
986 :
聞伝君 :2007/05/03(木) 02:38:14 ID:jlCDw4HF
いなくなっちゃった。 おやすみ。ノシ
SIMDあるのにSIMDじゃないって不思議だわー いやー理解に苦しむわー
単なる言葉の定義でここまで煽りあえるって、 やっぱSIMDとかベクタとかってなんか特別に 偉い冠詞だったりするの?
>>981 「CellはSIMDじゃないだろ」
頑張ってるようだが今年の大賞ねらいは正直難しいと思うぞよ(・∀・)
>>985 「複数のプロセッサ」という前提があるからそこは区別される。
Core2なんか、128bit SIMDユニットを3(+L/S)並列に動かせるしね。
吹いたwwww スカラユニットとSIMDユニットが並んだスーパースカラ型のコアが 更に複数パッケージングされてるのが今のCPUアーキテクチャ。 排他的な概念だと思ってるのは時代に取り残されてる人だけ。
ゲハで最近「CellはSIMDじゃない」っていってる奴が多いと思ったらおまえらか
ベクトル計算機を知っている(使った事がある)人は思い入れが強いって事かな。 うまくベクトル化できればスカラーの200倍ぐらい計算が速くなったりもするからね。w
>>うまくベクトル化できれば HPC分野でやっている計算は実際驚くほど単純だからね〜。 シミュレーションの勉強でもすれば、 何故ベクトルプロセッサが出てきたのかがわかるよ〜。 PCじゃ、数十並列がほとんど使えないというのもわかる。 これは常識だが、ベクトルプロセッサでもマルチ構成にすると MIMD!になってしまうので、vector processorではなくなるす。
CellはSIMDじゃないと聞いて飛んできました! 産業で解説タノム!
CELLはSIMDが複数入ったSIMD対応マルチコアプロセッサ。 マルチコアプロセッサにはSIMD非対応の物を並べたものもあるので、 勘違いする人もいる。 以上三行。
ベクトル計算機の場合マルチと言ってもクラスタに近いから、それほど厳密に区別する必要も無いでしょ。 ベクトル演算ユニットがあればベクトル計算機で良いんじゃね? そいやー、Crayにはベクトル演算中の0除算を無視するモードとかあったなぁ…
1000ならおっぱい
1000
1001 :
1001 :
Over 1000 Thread