>>158 核物理関連には必要らしいよ
あとは何でもそうだけど、精度の高いシミュレーションを高速でやるには
あった方が便利なのは確か
消費電力云々は関係ないね、価格は重要だけども
日本のベクトル型のスパコンが問題なのは、とにかくコストが高すぎることかな
ベクトル型が向いてる分野ってのもあるらしいけど、
それでも10倍近いコスト差があるのはちょっと・・・
PCを何百万台も使用するスカラー型のスパコンの分野に進出が遅れてるのは問題なんじゃないか?
161 :
名無しさん@3周年:2009/11/22(日) 23:08:43 ID:oImReAAe
>>157 バイオや薬品開発では、速いハードウェアがあるかどうかが
最初に特許を取るための最重要項目なんだろう。
流体シミュなどの分野では、まだまだ自然現象の正確なモデリングや
計算アルゴリズムの効率化も重要だろう。
理研の場合、バイオや薬品開発の事しか知らないから、
速いスパコンがとても重要に見えるんだろうよ。
162 :
名無しさん@3周年:2009/11/22(日) 23:14:13 ID:oImReAAe
>>160 後半部分については、恐らくだが、スカラ型(並列)スパコンの
場合、FLOPS表示は、全プロセッサが有効に働いたときの理論値
を書いているだけらしく、全プロセッサを上手く働かせられるよ
うな処理内容でなければ、あるいは、そういったアルゴリズムが
見つからなければFLOPS道理の性能は当然でない。
それは、ベクトル型でも大して事情は変わらないと思うが、
共有メモリの量と、分散メモリ(ローカルメモリ)の量の
バランスや、インターコネクトなどの性能により
結構大幅な変化をするとは思う。
163 :
名無しさん@3周年:2009/11/22(日) 23:22:08 ID:oImReAAe
ベクトル型プロセッサの場合、基本的に全てのコアが共有メモリ
に直にアクセスできるようになっているのかも知れない。
一方、スカラ型(並列)スパコンの場合、分散メモリ(ローカルメ
モリ)がココのプロセッサの近くにあり、アクセスも速いが、
共有メモリへのアクセスは、それよりは遅い。
行列などを計算する場合、共有メモリの行列を分散メモリの方に
コピーしてからでないと効率よく計算できないから、共有メモリ
には入っても、分散メモリには入らないような巨大な行列は
上手く分散処理できないだろう。
その点、ベクトル型プロセッサは、分散メモリがなく、唯一の共有
メモリにある唯一の行列データを、複数のコアがアクセスできるで
あろうから、巨大な行列の計算には向いているのかも知れない。
ただし、その場合でも、メモリアクセスは同時に数アドレス以上は
行えないだろうから、複数のコアからのアクセスは「調停」される
必要があるだろう。複数のコアから共有メモリへのアクセスが集中
した場合、それがボトルネックになって性能が落ちてしまうだろう。
その部分をどう回避しているのかが知りたい。
164 :
名無しさん@3周年:2009/11/22(日) 23:33:43 ID:oImReAAe
165 :
名無しさん@3周年:2009/11/22(日) 23:42:41 ID:oImReAAe
166 :
名無しさん@3周年:2009/11/22(日) 23:49:02 ID:pQAtMq/+
200億のスパコンで有望な特許取り放題なんだったら、
普通は借金してでも自腹でやるよね。
つーか大手の製薬会社の研究開発費から見たら雀の涙みたいな金額でしょ。
167 :
名無しさん@3周年:2009/11/22(日) 23:53:42 ID:eFSjDyxm
スパコンマーケットは小さい
OVER THE COUNTER の薬品に較べたら
スズメの涙。
168 :
名無しさん@3周年:2009/11/22(日) 23:57:14 ID:oImReAAe
SXシリーズの累積販売台数は、2007年11月時点で、1,100台だった
そうな。もちろん、古いSXシリーズも含まれるんだろうが。
169 :
名無しさん@3周年:2009/11/22(日) 23:59:00 ID:oImReAAe
170 :
名無しさん@3周年:2009/11/23(月) 00:01:51 ID:vtyJiqmI
171 :
名無しさん@3周年:2009/11/23(月) 00:03:16 ID:vtyJiqmI
意外とお安い。
172 :
名無しさん@3周年:2009/11/23(月) 00:07:25 ID:vtyJiqmI
この仕様を見ると、CRAYの最速スパコンより性能良さそうだね。
AMD Opteronの並列マシンでは、SX-9の性能は超えられないんじゃ
ないかな。
173 :
名無しさん@3周年:2009/11/23(月) 00:08:47 ID:vtyJiqmI
やっぱ、何度も誰かが書いたように、TOP500の評価は間違い
なのかも知れない。今でも、地球シミュレータ2の性能は、
世界1なのでは???
製薬関係の特許取得がメインターゲットだったとする、
製薬会社の儲かり方の割には、薬害エイズ、C型肝炎など、
国民へのリターンが思いのほか少ないという印象の方が
多いのではないだろうか。
これでは感傷的に国民から協力を取り付けるのは
困難だと思われる。がっつり稼いでるんだから民間で
金だしなよというわけだ。
175 :
名無しさん@3周年:2009/11/23(月) 00:15:25 ID:HbGJddGd
いずれにしても、採算上難しいからNECは撤退した。
IBMもBLUE GENEは頭痛の種。
カスタム品は難しい。
176 :
名無しさん@3周年:2009/11/23(月) 00:17:04 ID:vtyJiqmI
>>174 それに、国で補助しなくてもNECは十分速いスパコンを作り続けて
くれそうな気配もある。
理研の人も、一般人も、スパコン TOP500に惑わされすぎかも知れん。
実際は、NECのSX-9はIBMやCRAYのマシンより速い可能性がある。
パソコンと同じAMD Opteronをいくら繋いでも、SX-9のベクトル
プロセッサに勝つのは至難の業なのではなかろうか。
それとも、外部キャッシュを工夫すれば、貧弱なプロセッサでも
勝てるのだろうか?
177 :
名無しさん@3周年:2009/11/23(月) 00:20:43 ID:HbGJddGd
>>176 あなた方のやってることは間違いです、と言ってみたらどうですか。
あんたの思い込みだよ。
178 :
名無しさん@3周年:2009/11/23(月) 00:20:54 ID:vtyJiqmI
>>165 (NEC SX-9)から抜粋
2.2 スカラユニット
SX-9のスカラユニットは、SXシリーズ互換の64bitRISCアーキテクチャで
あり、64bit幅の汎用レジスタを128本、命令・データそれぞれ32Kバイト
のL1キャッシュを搭載しています。スカラユニットの特徴を以下に示し
ます。
(1) 6ウェイスーパースカラ構造
SX-9では、浮動小数点演算系2本、整数演算系2本、メモリ系2本の合計6本の
実行パイプラインを持ったスーパースカラ構成になっています。これにより
並列度の高いアプリケーションに対する性能向上を実現しています。
(2) 命令実行制御
アウトオブオーダー実行機構によってプログラム順によらず実行可能と
なった命令から実行することで高性能を実現しています。しかし、更な
る性能向上のためには複数の分岐命令をまたいだより大きな領域に対す
る実行可能命令の検索が必須となっており、SX-9では、最大8つの分岐
命令をまたいでの検索を可能にしています。また、実際に分岐命令が
実行されるまでの間、その後続命令の仮実行を行い、分岐予測が失敗
した場合には正しい状態から実行を再開する投機命令実行機構を採用
しています。なお、アウトオブオーダー実行機構における命令ウインド
ウを広げるべく、SX-9ではリオーダーバッファが64エントリに強化され
ています。
179 :
名無しさん@3周年:2009/11/23(月) 00:22:08 ID:vtyJiqmI
2.3 ベクトルユニット
ベクトルユニットは、ベクトル演算部、ベクトル制御部から構成され
ます。
(1) ベクトル演算部
ベクトル演算部は、おのおのに並列動作可能な論理演算、乗算、
加算/シフト演算、除算の基本演算パイプライン(乗算器及び加算/
シフト演算器はそれぞれ各2パイプライン)に加え、マスク演算、
ロード/ストアの各パイプライン、及び64ビットの容量を持つ16個の
マスクレジスタ、おのおの512バイトの容量を持つ72個のベクトルレ
ジスタから構成されるベクトルパイプラインを1セットとし、プロ
セッサ当たり8セットのベクトルパイプラインを有することにより、
合計144kバイトのベクトルレジスタを備え、48本の基本演算パイプ
ラインを同時に動作させることにより、強力なベクトル処理を行い
ます。