CPUアーキテクチャについて語れ 4

このエントリーをはてなブックマークに追加
709Socket774:2006/09/22(金) 13:13:09 ID:7cpne9Jx
しっかしここ最近は、INTELがAMD後追いしてる技術多いな
プロセスとかトランジスタは別にして
710Socket774:2006/09/22(金) 13:29:15 ID:Q1ULqWi/
巨人に勝つには先手を打たないといけないからな。
あと低クロック動作時のメインメモリにGPうがアクセスするときどうするか、という問題もあったようだ。
これも大した問題じゃないといえばそれまでだが。
711Socket774:2006/09/22(金) 14:47:52 ID:N2TBLisj
Conroe+netburstのマルチコア作ればいいんじゃね?
フィルタや何やらをConroeでやって、純粋にエンコードだけnetburst

712Socket774:2006/09/22(金) 17:53:00 ID:WMTtHXOV
Core2のIDCTは相当速いらしい。同クロックのK8の倍速以上。
http://www.marumo.ne.jp/db2006_8.htm#26
713Socket774:2006/09/23(土) 04:35:49 ID:DmU9nyCh
ttp://www.theregister.co.uk/2006/09/22/ibm_power7_opteron/
POWER7 が、Opteron のマザー (にちと手を加えたもの) に載るって、
マヂデスカ.
HyperTransport を I/O および CPU 間接続に使うんだよね、たぶん。

Dell、IBM、HP、Sun、Fujitsu Siemens と、主要サーバメーカ全てが
Torrenza に手を出してるみたいだし
ttp://www.theinquirer.net/default.aspx?article=34531
Intel が CSI 導入にグズグズしているうちに、Intel 以外のサーバ系
プラットフォームは HyperTransport 一色になるかもね。
Intel は例によって社外には CSI のライセンスを出し渋るだろうし。
714Socket774:2006/09/23(土) 04:39:39 ID:DmU9nyCh
> HyperTransport を I/O

サウスブリッジ相当との接続に使うって意味ね。
715Socket774:2006/09/23(土) 05:15:30 ID:wh9v+GhN
不勉強な点
>Intel が CSI 導入にグズグズしているうちに
>Intel は例によって社外には CSI のライセンスを出し渋るだろうし。
716Socket774:2006/09/23(土) 07:09:02 ID:H1gnzqiv
>>683
その記事にもちゃんと書いているが
LSの容量(256K)よりデカい物を扱う
メインメモリに対してのアクセスが絡む時は
もうてんやわんやの大騒ぎになる。

定期的にCELLはx86より高性能な結果とやらが貼られるが
グラフ脇の注記を見れば分かるが
LSに収まりきるブロックサイズのベンチしかやってない。
717Socket774:2006/09/23(土) 10:40:18 ID:aoPtPpxU
>某社で思い出した。
>(上の某社と某F社が同じとはいってませんので念のため)

ならなんで思い出したんだよ :-P
718Socket774:2006/09/23(土) 10:43:48 ID:nLVm/+2t
>>716
某I社のベンチみたいなもんですね。712とかみたいな。
719Socket774:2006/09/23(土) 11:27:34 ID:xmkltVVl
>>718
はい?
720Socket774:2006/09/23(土) 12:14:15 ID:mFKyra2/
最大256KB内でなるべくメインメモリにデータ取りに行かない処理って
ストリーミング処理以外なかなか思いつかんな。

相互依存関係がある処理は駄目だし。
データサイズが大きいシムも駄目だし。
(ゲノム屋定番のタンパク質構造解析でやるMDシミュレーションに
Cellは使い物にならんという事)
721孟宗:2006/09/23(土) 12:32:03 ID:Nyfo7wvO
ttp://www.theregister.co.uk/2006/09/21/intel_open_chips/
>Intel will open server chips to partners next week
>Just like AMD

方向は結局同じになるのか。
IDFで何か発表予定?
GPUの統合も恐らく同じくして来るだろうし・・・

そう考えると
Intel -> 自社製GPU
AMD -> ATI GPU
VIA -> S3 GPU
x86 CPU3社はそれぞれGPU持ってることになって
あぶれたnVIDIAはどうなるのか・・・
722Socket774:2006/09/23(土) 13:50:43 ID:rnSYxwlV
ミドルレンジ〜ハイエンドGPUメーカーとしての地盤が磐石となる
723Socket774:2006/09/23(土) 13:57:17 ID:c4/6QLhT
>>703
Timna復活だな。。。
724MACオタ>716 さん:2006/09/23(土) 13:57:35 ID:eMoSoCrg
>>716
  -------------------------------
  LSに収まりきるブロックサイズのベンチしかやってない。
  -------------------------------
判りやすいように日本語の資料リンクしておくすけど,Fig.3やらFIg.4の解説に
あるような2^21個やら2^24個の浮動小数点が256KBに収まる。。。と思ってる
訳じゃ無いすよね(笑)
http://www-cr.scphys.kyoto-u.ac.jp/member/nakamori/ppt/tenmon_2006spring.pdf
> SPEのメモリサイズの制限により、Z-testでもデータを細かく分けて、
> 並列処理する必要がある。SPEへのデータ送受信にはいくつかの
> 手段があるが、今回は大規模データの転送に最適なDMA転送により、
> 観測データを各SPEに転送。そして、検定する周波数f を使って
> ループを作るために、word 単位のデータ転送に最適なMailBoxを使用
(以下略

おもっきし糞じゃん

>>724
FFTは巨大配列をランダムルックアップするようなアルゴリズムじゃない
SPEの得意とする浮動小数積和算やシーケンシャル処理主体のFFTみたいな
アルゴリズム持ち出すなんて、詭弁もいいところ。
726Socket774:2006/09/23(土) 15:00:10 ID:VnTAHz/5
自動的に溜め込み、被ったら利用するだけのキャッシュとは基本的に違うのだよ!
http://www.ne.jp/asahi/comp/tarusan/main148.htm
727MACオタ>団子 さん:2006/09/23(土) 15:02:32 ID:eMoSoCrg
>>725
  ----------------------
  浮動小数積和算やシーケンシャル処理主体のFFTみたいなアルゴリズム
  ----------------------
それ「LSに収まるデータサイズ」という難癖と何の関係も無い弁護のような気がするす(笑)
全然違うだろ。
Trieを探索するたびにメインメモリに読みに行かなきゃいけないのと
断片だけでも必要な配列の一部が納まってるのとでは。
参考までに、FFTはこんなコードです
http://www5.airnet.ne.jp/tomy/cpro/sslib8.htm#source

一部の頭のおかしい人でなければ

  LSに収まりきるブロックサイズ

に分割し並列処理可能なことはおわかりでしょう。
>>712
これこれ
SSE4・・・じゃなくてSupplemental-SSE3でミスリードしてしまったのは申し訳なかったな。



H.264エンコーダの処理の大半がIDCTなんだが。>>718
こういう実用的なサンプルコードを無償提供してる姿勢は評価すべきだよ。
731Socket774:2006/09/23(土) 15:56:20 ID:TLNNm/lP
SPEのローカルメモリって256KBでしょ?
MS-DOSの640KBより少ないメモリで作れるプログラムなんて、高が知れてるよ。
732MACオタ>団子 さん:2006/09/23(土) 16:14:56 ID:eMoSoCrg
>>729
  ----------------
  分割し並列処理可能なことはおわかりでしょう。
  ----------------
この手の処理が特例。。。という主張わキャッシュやMPの有効性全体に対する否定なんすけど(笑)
733Socket774:2006/09/23(土) 16:19:50 ID:acwe8lDv
ヲタがたる同様ソフトウェアの知識がない事を認識。
734Socket774:2006/09/23(土) 16:23:40 ID:/YBMEIR0
それでも>>731みたいな知恵遅れよりははるかにマシだけどね。
プログラムなんぞはHDDに追い出しても実行できることは十年も
前にマイクロソフトが証明してます。
735Socket774:2006/09/23(土) 16:24:53 ID:acwe8lDv
>>734
釣り・・・だよな?
736Socket774:2006/09/23(土) 16:29:08 ID:rnSYxwlV
512 :大将 [] :2006/09/22(金) 02:34:16 ID:5BcAUztB0
んー
cellはスパコン業界じゃ流行らないんじゃないかね。
結局数字の上でのspecと実際のspecの乖離が激しそうだからね。

linpackで鬼のようなスコアを出すBlueGeneが国内でどれだけ入ってるか知ってるか?
僕の知る限り、茨城辺りに1件だけだよ。
ところが、>>1のサイト(tarusan)で散々叩かれてるItanium2ベースのスパコンなんて
国内で死ぬほど納入実績がある。

帯域だのピーク性能なぞで実際の計算が出来るワケじゃなくて
科学者が組んだ解析プログラムがいかに速く計算出来るかが問題なんだよ。
その点でItaniumは非常に優秀であって、cellがどうなのかは未知数。
少なくともウチ等近辺ではcellは話題にもならない。
価格対性能比ではまだしも、単体性能の比較では比べるまでも無いと思う。
737MACオタ>736 さん:2006/09/23(土) 16:39:35 ID:eMoSoCrg
>>736
何故,イタい知ったかさんの書き込みを貼るすかね。。。
  ------------------------
  linpackで鬼のようなスコアを出すBlueGeneが国内でどれだけ入ってるか知ってるか?
  僕の知る限り、茨城辺りに1件だけだよ。
  ------------------------
KEK: http://www.itmedia.co.jp/news/articles/0509/28/news091.html
ニイウス: http://japan.cnet.com/news/ent/story/0,2000056022,20075938,00.htm
産総研: http://www.ibm.com/jp/press/2004/09072.html
738Socket774:2006/09/23(土) 16:53:38 ID:wh9v+GhN
下位のMadison相手に勝ち誇ってもみっともないだけです
739Socket774:2006/09/23(土) 16:56:51 ID:XBLBRpyC
まあCellを使わなくても、Powerは何系統もあるわけで
Itaniumは一つ失敗したら死亡
740Socket774:2006/09/23(土) 17:01:34 ID:DmU9nyCh
なんかどっちもどっちって気がするなあ。

FFT って非常に応用範囲が広い演算なのに、FFT が速いってベンチを
詭弁扱いするなんて、それこそ詭弁な気がする。
もちろん locality がまったくないような演算では LS のメリットは
ないだろうという指摘自体は正しいけど、locality のあるアプリの
方がむしろ世の中には多いわけで。

でも、Cell が既存の HPC マーケットでバカ売れするかっていうと、
まあ売れないだろうとは思うけど。
既存のアプリは全く動かないだろうからねえ。
Cell 向けの演算パッケージが多く出回れば話は変わるかもしれんが。

BlueGene は MPI 使って書いたアプリならそのまま動くわけで、
そこら辺が Cell とは大きく違う。
741Socket774:2006/09/23(土) 17:03:35 ID:VnTAHz/5
TV&周辺機搭載でリアルタイムうpこんが低価格機でできるようになると思うね
将来は
742MACオタ>740 さん:2006/09/23(土) 17:12:39 ID:eMoSoCrg
>>740
  --------------------
  BlueGene は MPI 使って書いたアプリならそのまま動くわけで、
  そこら辺が Cell とは大きく違う。
  --------------------
その通りす。Blue GeneとCELLベースのHPCシステムとの違いわ,IBM自身がこう述べているす。
http://www.hpcwire.com/hpc/893353.html
  ====================
  HPCwire: With that in mind, what kinds of application differentiation do you see between
    Roadrunner and Blue Gene?

  Turek: Clearly, the Roadrunner represents a bigger memory model than Blue Gene. But it
    also has a different kind of programming model. Today for example, MPI applications,
    in almost 100 percent of the cases, are capable of being ported to Blue Gene, usually
    within a day, with reasonably good performance. Tuning, we've discovered, takes maybe
    another two to five days to get really outstanding performance. With respect to the
    Roadrunner model, that's going to be a bit different because of the way that system is
    architected. We'll reveal more details about the Roadrunner APIs down the road; it's a
    little premature to do that now. We'll go public with that sometime this fall, for sure.
  ====================
>>740
まー、おいらとしては、ループの内側が数万回でもまわれば十分局所性はあるし
データ全体の容量を持ち出して「LSに納まらない」っていうのは詭弁といいたかっただけで

いくらピーク性能が優れてても、ピーキーな設計ゆえにソフト開発に
金がかかったら元も子もないわけで。
今回のTGSでPS3ソフトがろくに性能出せずに醜態さらしてる現状考えれば
やっぱりCellは扱いづらい代物だと思う。
744Socket774:2006/09/23(土) 17:25:34 ID:DmU9nyCh
扱いづらいってのは、誰も否定しないところでしょ。(MACヲタは知らんが)

でもキャッシュの振舞いを必死に想定して頑張るよりは、LS を使って明示的に
指定した方がむしろ楽だと感じる変な人(褒め言葉)は一定の割合で存在すると
思うし、Cell が想定しているのはそういうピーキーな性格のマシンが大好きな
人なわけで。

ダンゴはむしろ、そういうタイプの人間のような気がするんだが、そうまでして
Cell を嫌うのは、任天堂ヲタなのか?(w
745MACオタ>団子 さん:2006/09/23(土) 17:36:35 ID:eMoSoCrg
>>743
>>744さん同様,私も何故団子さんがCELL BEを嫌うのか不思議に思っているす。
AltiVecも正当に評価してるみたいだし,トリップ解析コードに入れ込んでるヒトだし,
CELL用のコードが書けるようになるのを楽しみにしてそうなモノすけどね。。。

まあ評判より現物見てから評価するつもりなのかと,好意的に受け取っておくす。
746MACオタ@補足:2006/09/23(土) 17:40:50 ID:eMoSoCrg
そもそも現状のプロセッサアーキテクチャの進歩の方向性で,プログラミングの設計として
 ・SIMD (or データレベルの並列性)に対応しましょう
 ・処理わ,複数のプロセッサに分割できるようにしましょう
 ・プロセス間通信とメインメモリへのアクセスわ,メイン処理の裏に回すようにしましょう
ってのわ,CELL BEに限らないと思うす。
ヒント:正規表現オートマトンがLSに納まらない

748Socket774:2006/09/23(土) 18:04:24 ID:XEH59eD7
倍精度演算性能を強化したCELL+が出るっていうのはマジすか?
749MACオタ:2006/09/23(土) 18:09:47 ID:eMoSoCrg
>>748 さん
本当す。>>742のリンク先をどうぞ。

>>747 団子さん
正規表現すか?たとえばここを見ると http://katsu.watanabe.name/grep/p7.html
対象パターンが「長文」の場合,
 単純パターンマッチ: SIMD化
 遷移: マルチスレッド化
に対応しているように見えるす。
対象パターンが短い場合にわ,単純に探索領域を分割してマルチプロセス化すれば良い
ように見えるすけど。。。
PS3が安価なCellワークステーションとして使えるならともかく
BDプレイヤ付きゲーム機じゃん

ユーザープログラミング出来ないデバイスには萌えない
751MACオタ:2006/09/23(土) 18:55:13 ID:eMoSoCrg
CELLわ,CELLで非常に面白いすけど,もう一つの現実的な"alternative"である
Itaniumのてこ入れが始まったようす。
Intelが自ら日立チップセット搭載のMontecito搭載ラックマウントサーバーをベアボーンキット
で販売するんだそうす。
http://news.com.com/2100-1006_3-6118469.html
公開されているロードマップでわ,XeonとItaniumの「システム価格」(プロセッサの価格でわ無い
ことに注意)が同程度になるようにする。。。とのことだったすけど,本気で手を打ってきた模様す。
752Socket774:2006/09/23(土) 19:33:51 ID:UIyJDVgQ
こういう条件下では速い石より
どういう条件下でもそこそこ速い石の方が
使い勝手がいいと思うが。

石が人間様に運用の仕方を強制してくるのは
主従関係が狂ってる。
753MACオタ>752 さん:2006/09/23(土) 19:40:07 ID:eMoSoCrg
>>752
  ------------------------
  石が人間様に運用の仕方を強制してくるのは
  主従関係が狂ってる。
  ------------------------
それが正しいことなのかどうかわ、ともかくとして、戦車のサイズに合わせて乗務員
を選抜していた国もあるということで。。。
754Socket774:2006/09/23(土) 19:47:28 ID:FxT04hTJ
>>752
汎用でないプロセッサなんて世の中にごまんとあるけど、
それらすべてが汎用プロセッサに置き換わるべきだとでも?
755Socket774:2006/09/23(土) 19:50:35 ID:VvqPqjUA
>>747
コード書いて飯食ってる人間なら皆、大まかな向き不向きはわかるだろ。
引き合いに出すなら、「使えそうだが使えない」例を出せよ。
756Socket774:2006/09/23(土) 19:56:11 ID:GhTgLn8c
>>598のスペック比較は正しいのかい?よく分からんのだけど。
757Socket774:2006/09/23(土) 20:10:14 ID:/YBMEIR0
>>744
アンチの妄想もひどいなw ずっとCell関連のスレみてたらMACオタへのそんな感想でねーよ。
>>752
コンピュータ自体が人間選んでるけどw
あんたプログラム1つもできないでしょ?
地球上にはあんたが言うような理想的なCPUは存在しないということだよ。

>>756
256KBのメモリじゃなんにもできないといってるアホはスルーでw
758Socket774
>>750
Linux搭載は中止になったの?