パイプライン長じゃなくって、ループの長さ。 ベクトル機は for(i=0; i<LOOP_LEN; i++){ c[i] += a[i] * b[i]; } みたいな計算が得意で(とうかこういう風に書かないと性能出せない)、 性能出すために必要なLOOP_LENがどんどん大きくなってしまった、 ということを伝え聞いている。
>>952 なんでCrayはloop長数百、120位でも
バッチリvector効いたのか知らないんだな
あわれ
がんばって勉強しておくれやす 付き合いきれん
Crayのどの機種? Crayの初期のものと日本の後期のもの比べてるつもりだったんだけど。
>>943 >そのチップがとても安くて納期が非常に短ければ
無理。Intelでも無理。
>>946 最悪共通化されたのはガワと電源装置だけ、とかなりそうだ。
そういや自分で回路を最適化する奴はどうなった。 効率よくてもやっぱ遅いのか。
960 :
モコーリ派 :2007/01/21(日) 13:03:44 ID:igVkwtul
まあ、ClearspeedやGRAPE-DRじゃないけど、同一CPLDで、 スカラ型とベクトル型で回路構成してどっちが高flopsに 構成することができるかを考えれば、ベクトル方の方がリソース効率がいいのは わかると思うけどね。この単純な事実がこのスレでなかなか受け入れられないのはなぜか? 実際のプラグラムを動かしてどちらが速いかはプログラムしだい。 もちろんベクトル機はシステムでは高くなるのは理解できるけど。
961 :
モコーリ派 :2007/01/21(日) 13:12:18 ID:igVkwtul
>>921 例のごとく間違いが多くてSunに対する噛み付き記事になってるな。
もう少しよくしらべて数字出してほしい。計算の意味ないし。
どこが間違ってるのか教えて
>>960 > まあ、ClearspeedやGRAPE-DRじゃないけど、同一CPLDで、
> スカラ型とベクトル型で回路構成してどっちが高flopsに
> 構成することができるかを考えれば、ベクトル方の方がリソース効率がいいのは
> わかると思うけどね。
うははは。
あんたバカだろ。そんな出鱈目をしらふで吐けるんだから。
964 :
モコーリ派 :2007/01/21(日) 15:15:44 ID:igVkwtul
>>963 ClearspeedもGRAPE-DRも純ベクトルプロセッサとは言いがたいけどSIMD系の技術の延長だから、
スカラとベクトルでどっちが安あがりかという例として示すのにはそう遠かないだろ。
966 :
モコーリ派 :2007/01/21(日) 17:50:22 ID:igVkwtul
967 :
モコーリ派 :2007/01/21(日) 18:01:14 ID:igVkwtul
いや、失礼 >Each PE core in the poly execution unit is similar to a VLIW processor とも書いてあるな。さっき検索したばかりなのでよくよんでないわ。
おまえもなーって言われる前に気がついて良かったねw
969 :
Socket774 :2007/01/21(日) 21:20:23 ID:vx/zJ8NY
Linpack専用のチップを作ればよくね? そしたら安価に世界最高速狙えるんじゃね?
牧野日記ワロスwww
つか足跡プロジェクトのS担いでるほうの人にしか思えません…
>>956 インテルはカスタムLSIとかマスクROMやってないじゃん。
日本の半導体メーカー各社には、かつて、任天堂というお客様がいて、
ファミコン&スーパーファミコンのソフトのカセットに使うマスクROMを、
あまりまとまってない分量を、極めて短納期で製造するシステムがあったのです。
足跡プロジェクト?
>>972 あのねー、、、GRAPEだって最初は20万円だったのが今は50億だぜ?
>>976 設計コストとイニシャルコストが跳ね上がっているからね。
だからこそ、
その2つを劇的に安くするための研究開発をすべきなんですよ。
Intelが最先端プロセスを利用して数千円でプロセッサを売られるのはx86だから。 研究開発とか、そういう理想ですらない妄想を語られてもな。 あ、もしかして、奴隷が沢山居るアカデミーで云々とかそういう話?(w それともホワイt(ry
何回読んでもオタクコアにしか見えない
>>969 つ[BlueGene/L]
チップじゃなくてシステムだけど
事実上Linpack(とほんの少しの実用アプリ)しか実行効率が出ないらしい
最初からそれしか狙ってない開発だろうから最良の設計なんだろうけどさ
どっかアメリカ以外がLinpack専用機つくればHPCチャレンジベンチ(だったっけ?)がメジャーになるんじゃね?
そういう意味のない遊びに金を突っ込める米国がうらやましい。
>>980 ベクトル機用に進化したアプリを基準に考えると実用性は
ないということになるけど・・・
メモリをひたすらなめるという以外の演算量の多い用途では
努力次第で威力を発揮すると思う。
メモリバンド幅もネットワークバンド幅も不足しがちではある。
QCD専用計算機にDRAMつければLINPACKもいけそうって
いうプロジェクトだったんだっけ?
マキノも書いてたけどLINPACKで性能出るように作っておけば
使い道はそれなりにいろいろあるらしい。
LINPACKでTopを取られてから、
「ベクトル機じゃなきゃ実アプリで性能は出ない」キャンペーンが
始まってこの国はおかしくなったような気がする。
xj7ZXQ5qにはまっきー以外だれも突っ込まないの?真理をついてると思うんだけど。 クソみたいなコードのツケをシステムにカネぶっこんでクソみたいな研究 してる連中には税金返せと言いたい。おまえら坂村と同類の国賊だ。
>>981 付き合わされるsoftwar開発者の見にも成ってくれ
何の答えを出すわけでもない積和演算の秒数測定、
つまんなくてつまんなくて。何も生み出さなないし
そのための準備、tuningやらcompiler OS libraryの気が遠くなるような
bugだし検証など莫大な手間かけて
それがホント人生の無駄に思えてきて泣ける
そのくせチョット複雑な実用的ソフトは地を這う遅さ
ホントくだらねぇ
apacheは2からmulti thread化されていて たしかデフォは8個だったかな、同時に走っている そういう用途でも多分ありがたいんだろうな 俺はopenMPで行くか、自動並列化で行くか それとも手抜きでithreadとしゃれ込むか…
いけねぇ誤爆した…
なに言ってんだよ、ホワイトー
るせー、ブルー
単純に格子QCD計算が速くなると俺はうれしい。
>>991 開発費数百億宜しく。
こういう人がいるから
余計花も実もない方向に行てしまうのかな
ホワイトセックス?
QCD専用機なら用途も予算もそれで閉じて欲しいんだよ 他の用途で使い物にならないんだから それを他の解析でも性能が出るようなレトリック使うから 周りが迷惑するんだよ
レトリック君は以前HP-UX 11v3も叩いてたね どこの中の人なんだろうw
それは別人だな いまどきHP-UX なんて使っていない
これ俺だw しかし良く覚えているな… 迂闊なことはかけないわ。 じゃあね。ノシ
はきゅ〜ん
ニョーン
1001 :
1001 :
Over 1000 Thread