しっかしここ最近は、INTELがAMD後追いしてる技術多いな
プロセスとかトランジスタは別にして
巨人に勝つには先手を打たないといけないからな。
あと低クロック動作時のメインメモリにGPうがアクセスするときどうするか、という問題もあったようだ。
これも大した問題じゃないといえばそれまでだが。
Conroe+netburstのマルチコア作ればいいんじゃね?
フィルタや何やらをConroeでやって、純粋にエンコードだけnetburst
> HyperTransport を I/O
サウスブリッジ相当との接続に使うって意味ね。
不勉強な点
>Intel が CSI 導入にグズグズしているうちに
>Intel は例によって社外には CSI のライセンスを出し渋るだろうし。
>>683 その記事にもちゃんと書いているが
LSの容量(256K)よりデカい物を扱う
メインメモリに対してのアクセスが絡む時は
もうてんやわんやの大騒ぎになる。
定期的にCELLはx86より高性能な結果とやらが貼られるが
グラフ脇の注記を見れば分かるが
LSに収まりきるブロックサイズのベンチしかやってない。
>某社で思い出した。
>(上の某社と某F社が同じとはいってませんので念のため)
ならなんで思い出したんだよ :-P
>>716 某I社のベンチみたいなもんですね。712とかみたいな。
最大256KB内でなるべくメインメモリにデータ取りに行かない処理って
ストリーミング処理以外なかなか思いつかんな。
相互依存関係がある処理は駄目だし。
データサイズが大きいシムも駄目だし。
(ゲノム屋定番のタンパク質構造解析でやるMDシミュレーションに
Cellは使い物にならんという事)
721 :
孟宗:2006/09/23(土) 12:32:03 ID:Nyfo7wvO
ミドルレンジ〜ハイエンドGPUメーカーとしての地盤が磐石となる
> SPEのメモリサイズの制限により、Z-testでもデータを細かく分けて、
> 並列処理する必要がある。SPEへのデータ送受信にはいくつかの
> 手段があるが、今回は大規模データの転送に最適なDMA転送により、
> 観測データを各SPEに転送。そして、検定する周波数f を使って
> ループを作るために、word 単位のデータ転送に最適なMailBoxを使用
(以下略
おもっきし糞じゃん
>>724 FFTは巨大配列をランダムルックアップするようなアルゴリズムじゃない
SPEの得意とする浮動小数積和算やシーケンシャル処理主体のFFTみたいな
アルゴリズム持ち出すなんて、詭弁もいいところ。
726 :
Socket774:2006/09/23(土) 15:00:10 ID:VnTAHz/5
>>725 ----------------------
浮動小数積和算やシーケンシャル処理主体のFFTみたいなアルゴリズム
----------------------
それ「LSに収まるデータサイズ」という難癖と何の関係も無い弁護のような気がするす(笑)
全然違うだろ。
Trieを探索するたびにメインメモリに読みに行かなきゃいけないのと
断片だけでも必要な配列の一部が納まってるのとでは。
>>712 これこれ
SSE4・・・じゃなくてSupplemental-SSE3でミスリードしてしまったのは申し訳なかったな。
H.264エンコーダの処理の大半がIDCTなんだが。
>>718 こういう実用的なサンプルコードを無償提供してる姿勢は評価すべきだよ。
731 :
Socket774:2006/09/23(土) 15:56:20 ID:TLNNm/lP
SPEのローカルメモリって256KBでしょ?
MS-DOSの640KBより少ないメモリで作れるプログラムなんて、高が知れてるよ。
>>729 ----------------
分割し並列処理可能なことはおわかりでしょう。
----------------
この手の処理が特例。。。という主張わキャッシュやMPの有効性全体に対する否定なんすけど(笑)
ヲタがたる同様ソフトウェアの知識がない事を認識。
それでも
>>731みたいな知恵遅れよりははるかにマシだけどね。
プログラムなんぞはHDDに追い出しても実行できることは十年も
前にマイクロソフトが証明してます。
512 :大将 [] :2006/09/22(金) 02:34:16 ID:5BcAUztB0
んー
cellはスパコン業界じゃ流行らないんじゃないかね。
結局数字の上でのspecと実際のspecの乖離が激しそうだからね。
linpackで鬼のようなスコアを出すBlueGeneが国内でどれだけ入ってるか知ってるか?
僕の知る限り、茨城辺りに1件だけだよ。
ところが、
>>1のサイト(tarusan)で散々叩かれてるItanium2ベースのスパコンなんて
国内で死ぬほど納入実績がある。
帯域だのピーク性能なぞで実際の計算が出来るワケじゃなくて
科学者が組んだ解析プログラムがいかに速く計算出来るかが問題なんだよ。
その点でItaniumは非常に優秀であって、cellがどうなのかは未知数。
少なくともウチ等近辺ではcellは話題にもならない。
価格対性能比ではまだしも、単体性能の比較では比べるまでも無いと思う。
下位のMadison相手に勝ち誇ってもみっともないだけです
まあCellを使わなくても、Powerは何系統もあるわけで
Itaniumは一つ失敗したら死亡
なんかどっちもどっちって気がするなあ。
FFT って非常に応用範囲が広い演算なのに、FFT が速いってベンチを
詭弁扱いするなんて、それこそ詭弁な気がする。
もちろん locality がまったくないような演算では LS のメリットは
ないだろうという指摘自体は正しいけど、locality のあるアプリの
方がむしろ世の中には多いわけで。
でも、Cell が既存の HPC マーケットでバカ売れするかっていうと、
まあ売れないだろうとは思うけど。
既存のアプリは全く動かないだろうからねえ。
Cell 向けの演算パッケージが多く出回れば話は変わるかもしれんが。
BlueGene は MPI 使って書いたアプリならそのまま動くわけで、
そこら辺が Cell とは大きく違う。
741 :
Socket774:2006/09/23(土) 17:03:35 ID:VnTAHz/5
TV&周辺機搭載でリアルタイムうpこんが低価格機でできるようになると思うね
将来は
>>740 --------------------
BlueGene は MPI 使って書いたアプリならそのまま動くわけで、
そこら辺が Cell とは大きく違う。
--------------------
その通りす。Blue GeneとCELLベースのHPCシステムとの違いわ,IBM自身がこう述べているす。
http://www.hpcwire.com/hpc/893353.html ====================
HPCwire: With that in mind, what kinds of application differentiation do you see between
Roadrunner and Blue Gene?
Turek: Clearly, the Roadrunner represents a bigger memory model than Blue Gene. But it
also has a different kind of programming model. Today for example, MPI applications,
in almost 100 percent of the cases, are capable of being ported to Blue Gene, usually
within a day, with reasonably good performance. Tuning, we've discovered, takes maybe
another two to five days to get really outstanding performance. With respect to the
Roadrunner model, that's going to be a bit different because of the way that system is
architected. We'll reveal more details about the Roadrunner APIs down the road; it's a
little premature to do that now. We'll go public with that sometime this fall, for sure.
====================
>>740 まー、おいらとしては、ループの内側が数万回でもまわれば十分局所性はあるし
データ全体の容量を持ち出して「LSに納まらない」っていうのは詭弁といいたかっただけで
いくらピーク性能が優れてても、ピーキーな設計ゆえにソフト開発に
金がかかったら元も子もないわけで。
今回のTGSでPS3ソフトがろくに性能出せずに醜態さらしてる現状考えれば
やっぱりCellは扱いづらい代物だと思う。
扱いづらいってのは、誰も否定しないところでしょ。(MACヲタは知らんが)
でもキャッシュの振舞いを必死に想定して頑張るよりは、LS を使って明示的に
指定した方がむしろ楽だと感じる変な人(褒め言葉)は一定の割合で存在すると
思うし、Cell が想定しているのはそういうピーキーな性格のマシンが大好きな
人なわけで。
ダンゴはむしろ、そういうタイプの人間のような気がするんだが、そうまでして
Cell を嫌うのは、任天堂ヲタなのか?(w
>>743 >>744さん同様,私も何故団子さんがCELL BEを嫌うのか不思議に思っているす。
AltiVecも正当に評価してるみたいだし,トリップ解析コードに入れ込んでるヒトだし,
CELL用のコードが書けるようになるのを楽しみにしてそうなモノすけどね。。。
まあ評判より現物見てから評価するつもりなのかと,好意的に受け取っておくす。
そもそも現状のプロセッサアーキテクチャの進歩の方向性で,プログラミングの設計として
・SIMD (or データレベルの並列性)に対応しましょう
・処理わ,複数のプロセッサに分割できるようにしましょう
・プロセス間通信とメインメモリへのアクセスわ,メイン処理の裏に回すようにしましょう
ってのわ,CELL BEに限らないと思うす。
ヒント:正規表現オートマトンがLSに納まらない
倍精度演算性能を強化したCELL+が出るっていうのはマジすか?
749 :
MACオタ:2006/09/23(土) 18:09:47 ID:eMoSoCrg
PS3が安価なCellワークステーションとして使えるならともかく
BDプレイヤ付きゲーム機じゃん
ユーザープログラミング出来ないデバイスには萌えない
751 :
MACオタ:2006/09/23(土) 18:55:13 ID:eMoSoCrg
CELLわ,CELLで非常に面白いすけど,もう一つの現実的な"alternative"である
Itaniumのてこ入れが始まったようす。
Intelが自ら日立チップセット搭載のMontecito搭載ラックマウントサーバーをベアボーンキット
で販売するんだそうす。
http://news.com.com/2100-1006_3-6118469.html 公開されているロードマップでわ,XeonとItaniumの「システム価格」(プロセッサの価格でわ無い
ことに注意)が同程度になるようにする。。。とのことだったすけど,本気で手を打ってきた模様す。
こういう条件下では速い石より
どういう条件下でもそこそこ速い石の方が
使い勝手がいいと思うが。
石が人間様に運用の仕方を強制してくるのは
主従関係が狂ってる。
>>752 ------------------------
石が人間様に運用の仕方を強制してくるのは
主従関係が狂ってる。
------------------------
それが正しいことなのかどうかわ、ともかくとして、戦車のサイズに合わせて乗務員
を選抜していた国もあるということで。。。
>>752 汎用でないプロセッサなんて世の中にごまんとあるけど、
それらすべてが汎用プロセッサに置き換わるべきだとでも?
>>747 コード書いて飯食ってる人間なら皆、大まかな向き不向きはわかるだろ。
引き合いに出すなら、「使えそうだが使えない」例を出せよ。
>>598のスペック比較は正しいのかい?よく分からんのだけど。
>>744 アンチの妄想もひどいなw ずっとCell関連のスレみてたらMACオタへのそんな感想でねーよ。
>>752 コンピュータ自体が人間選んでるけどw
あんたプログラム1つもできないでしょ?
地球上にはあんたが言うような理想的なCPUは存在しないということだよ。
>>756 256KBのメモリじゃなんにもできないといってるアホはスルーでw