【スパコン】スーパーコンピュータ関連情報6【HPC】
乙。
はいはい仕分け対象です
ミンスの死分けはまだですかー
日本国内のスパコン需要を増やすのが先だ
需要があればメーカーが供給してくれる・・・いまなら、まだ供給できる
しかし
スパコン需要を増やすのは、一朝一夕にできることじゃない
スパコンは、もともと、安上がりに済ませる手法だ
つまり、とくにテコ入れしなくても、どんどん利用されるはずだ
しかし、現実には、そうはなっていない
これは非常に根が深い問題だ
理化研「京速計算機の予算足りません」
文科省「まじで、でプロジェクトの進行状況は」
NEC「ベクトルプロセッサ開発にがんばってまふ」
富士通「スカラ用のプロセッサでけたじぇ」
NEC「やっべ」
東工大「おーいNECまだかにゃー」
NEC「Σ!!(゜д゜) ベクトルプロセッサ作ってなかったじょ 京速計算機のプロジェクト抜けまーす」
東工大「どうにゃー?」
NEC「でけてるじょ」
東工大「京速は?」
NEC「あーあれ?抜けたからもういいの(どうせ開発費は燕に使ったし)」
東工大「おー随分安くできたにゃー」
13 :
不明なデバイスさん:2010/06/29(火) 19:31:35 ID:7xA0NHNF
富士通にこんな質問してきた。
>PCサーバ PRIMERGY
>ブレードサーバ PRIMERGY BX
>UNIX サーバ SPARC Enterprise
>基幹IAサーバ PRIMEQUEST
>メインフレーム GS series / PRIMEFORCE
>オフコン PRIMERGY6000
それぞれの「用途の違い」について詳しく知りたいんですが、解説したサイトってあります?
自分の見た限りでは、CPUについては「UNIX サーバ SPARC Enterprise」だけが富士通製
で残りは全てインテル製ということですが、それ以外の違いがまったくわかりません。
こうして富士通サイトを眺めているぶんには、どのサーバを使っても同じに思えますが。
例えば富士通本社のサーバ運営に関しては、どのような使い分けがされてますか?
「お問合せをいただきました件、現在確認しております。 ご迷惑をおかけしますが、
もうしばらくお待ちください。 」とのこと。
>>13 おまえ・・・迷惑な奴だなぁ。
買いもしないものの話まで聞くなよ。
>>14 日本RADのデータセンターって、むかし目黒の計算流体力学研究所がスパコン置いてたビルを買い取ったもの、だっけか。
パソコンの性能が上がってスパコンいらなくなって、スパコン用のビルも必要なくなって、計算流体力学研究所は近くのマンションに引っ越したらしい。
18 :
不明なデバイスさん:2010/07/01(木) 14:07:12 ID:LWgmwNu2
誠に申し訳ございませんが情報の開示はいたしておりませんので、
誠に申し訳ございませんが情報の開示はいたしておりませんので、
誠に申し訳ございませんが情報の開示はいたしておりませんので、
■お問い合わせ内容:
独自プロセッサ
高い処理性能、高信頼性、容易なメンテナンス性などを実現するために、
各サーバ専用に開発されたプロセッサです。
AP8800(メインフレーム)
http://www.hitachi.co.jp/products/it/server/portal/navi/spec/cpu.html >独自プロセッサ
それは具体的に何というプロセッサなのか、詳しく教えて下さい。
いくら調べても出てこないのですが、自分の検索ミスでしょうか?
■回答:
弊社にてAP8800メインフレーム専用に開発したプロセッサで、
プロセッサ単体での販売はしておりません。
誠に申し訳ございませんが情報の開示はいたしておりませんので、
ご了承願います。
敬具
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
(株)日立製作所 エンタープライズサーバ事業部
AP8800事務局
〒140-0013 東京都品川区南大井六丁目26番3号大森ベルポートD館
電話 :03−5471−2062(ダイヤルイン)
FAX:03−5471−2437
E-mail :
[email protected] ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
----------<Original Message>----------
日立と言えば、SR16000はLINPACKの実行性能70%前半だよね。結構な値段だけど。
核融合研 Rreal/Rpeak=56.65/77.00 => 73.57%
気象研 Rreal/Rpeak=51.21/72.79 => 70.35%
演算性能に比べてノード間通信幅が不足してる?
>>18 イタ電レベルだぞ
大人をからかって遊ぶのやめれ
http://www.green500.org/lists/2010/06/little/list.php Green500 Rank MFLOPS/W Site* Computer* Total Power (kW)
1 815.43 National Astronomical Observatory of Japan GRAPE-DR accelerator Cluster, Infiniband 28.672
2 773.38 Forschungszentrum Juelich (FZJ) QPACE SFB TR Cluster, PowerXCell 8i, 3.2 GHz, 3D-Torus 57.54
>>18 おまえさ、
>>15で注意されてるのに
>>18を書き込んだってことは、自分が悪いことやってるっていう自覚がまるでないだろ?
個人が遊びや趣味で立ち入ることができる領域じゃない。仕事でやってる人に迷惑かけんな。
もし学校の課題か何かなら、指導教員に相談して許可を得てからメーカーに接触すべきだ。
(まぁ、まともな指導教員なら、許可しないだろうな。)
HPCについて教えてく欲しい。
シングルコア1GHzのパソコンがあるとする。
このパソコンではsshdを走らせると、CPU使用率が常に100%を占めると(あえて)
する。
ここで、グリッドというシステムを活用し、このパソコンが2台構成にあるとする
。
クライアントはそのsshdの起動をそのグリッドシステムに任すと、それぞれパソコ
ンは50%の使用率でそれを動作させることが出来る、
という認識で居たんだけど、違うの?
そうではなく、このシステムの利点は、「二つのsshdを起動したときに、二台のパ
ソコンそれぞれでsshdが一つずつ同時に実行されるので、
sshdを同時に二つ走らせることが出来、それぞれのパソコンではCPU使用率は100%
のままである」
ということなの?
LSFとかSunGridEngineはどうもそういうもののような気がしてきたんだけど、これ
は正しい?
あと、TUBAME2.0とか理研のスパコンもそういう理解であってる?
グリッド(クラスタ)とは、仕事というものをどういう単位で区切って分散させて
いるのかがわからない。
デーモン単位??
俺は仮想CPUというものを作るというものだと思ってたんだけど。
「二つのsshdを起動したときに、二台のパ
ソコンそれぞれでsshdが一つずつ同時に実行されるので、
sshdを同時に二つ走らせることが出来、それぞれのパソコンではCPU使用率は100%
のままである」
でおk
>>34 ありがとう。
ってことは、これっていかにして効率よく仕事を振り分ける技術そのものってことか。
つまり100台のパソコンでグリッドを組んだからと言って、
「100GHzのパソコン」が1台出来上がるわけではなくて、
プログラムを100も200も走らせなきゃいけない状況に遭遇して初めてグリッドは有用ってことか。
LSFでやってることもTUBAMEも同じなのね。
>>35 sshd で説明するのには無理があるけど、科学計算なら多くの場合
MPI もしくは OpenMP で並列化するので、各 Node (複数の mult-
core CPU のかたまり) は計算全体で見るとそれぞれ別の部分を
計算していることになる。
もちろん、イメージとしては
>>34 で OK だけど、各CPU が全く
同じ sshd を走らせているというのは少しイメージが違う。
マジで自称世界一なんかw
TOP500に入ってないから自己満足だとか世界一じゃないとか言ってるやつは権威主義的で
物事の実態が見えていないと思うぞ。500という数字になにか技術的な根拠がある訳でなし。
Green500のスパコンの定義はTOP500に入ってるって条件だ。それを無視してまで、
俺様理論を主張して、世界一を名乗りたいというとんでもない権威主義はどっちだw
俺の関数電卓なんて太陽電池式だから外部からの電力ゼロで演算できるぞ。
効率世界一だ、と同じレベルだな。
>>45 いやGRAPEが入ってるのは通常のGreen500じゃなくてLittle Green500の方だし。
まさかマキーノがごり押しで通常のGreen500とは別のリストを作らせたとでも言いたいの?w
だからlitte green500 になんの意味があるのw かつて誰かさんのコメント、
SX-9、HPCC19項目で世界一に対して、
>いや、SX-9 は大変良い機械だと思うけど、これはちょっとねえ、、、グローバルなもので1位になってるのは一つもないし。
>こういうのを発表するから足をすくわれるんである。
まったくこれに通じるものがありますなw
Green500には意味があってLittle Green500には無いと言う根拠は何よ?
そんなの自慢できるかどうか位のものだろう。
今後ますます電力の壁が大きくなるHPC分野において製造技術ではかなり遅れているにも関わらず
GRAPEがトップクラスの電力効率を示しているというのは今後を占う上で示唆的な話だと思うがね。
マキーノに計画性が無くてGRAPE-DRプロジェクトが滅茶苦茶だとかそういう事のために
揚げ足を取るようなレスばかりになったというのは残念だ。
揚げ足取りねw、小規模なシステムでかつ汎用性に乏しいGRAPE-DRの現段階での電力効率なんかが、
今後を占う上で示唆的な話というのは、関係者の希望だろうがw
>>49 やってることは応援してるが、
やたらと日本製の商用機を貶めたり、単純にFlopsあたりの値段なんかで比較したり、
そのくせ自分のはどうなんだよ、ってのが多すぎるからじゃね?
本来ならGreen500のトップを取るはずだったような。
今回のTop500には「間に合いませんでした」→小規模構成では500位以内に入れず、LittleGreen500で
前回のTop500でも「間に合いませんでした」→小規模構成で登録のためランク下位
GRAPE-DRの何がマズいって、2PFのシステムを「整備する」っていうプロジェクトだったのに、
いつまでたっても2PF分を繋いで動かしたベンチマークのスコアすら公開できないってことだ。
開発元が、Grape-DRは肝心の天体計算でもGPGPUにボロ負けしてるって公言するくらい、
終わった話なのに、なんでいつまでもひっぱるんだ?>GRAPE-DR
学者さんの企画としては可もなく不可もなくという程度のありきたりな話だろう。
別に擁護したいわけではないが、事実に基づかない話は筋が悪い。
>汎用性に乏しいGRAPE-DR
は一応、これまでの GRAPE とは違ってプログラマブルだよ。
>開発元が、Grape-DRは肝心の天体計算でもGPGPUにボロ負けしてるって公言
これのソースは?
>事実に基づかない話
で事実に基づいて結局GRAPE-DRが、他に比べて優位に計算できるようになったものってなによ。
汎用だっていってるだけだろw
>>54 >これのソースは?
GRAPE-DRの開発環境にはまったく関心なしかよ。
HPCに関心がない「ぼくちんの考えた最高のすぱこん」野郎は、全員失せろ。
まずおまえはくだらないメール出して迷惑かけたこと反省しろよ
ここは2chその2か
GRAPEを叩きたくて必死な猿が一匹いることはわかった
>>60 GRAPE-DRはダメだろ。
納期× 遅れすぎ
性能× 予定通りのトータル演算器数×動作クロックを実現できてない
もしメーカーが作って納品だったら、こんな酷いものは大問題になってたはずだ。
なのに、なんとか調整費を出した連中は金返せとすら言わない。
腐ってるだろ。
CellにしろTeslaにしろそんな事例は商用でもザラだ
>>62 0/1思考で誤魔化すなよ
GRAPE-DRは年単位で遅れてるゾ
計画 2008年に2PF
実際 まだ
GRAPE-DRは、歩留まり対策で演算ユニットが少し少ないどころじゃないぞ?
計画 1024個×8チップ×2ボード×64サーバ×2ノードで2PF だから、演算ユニット1つで1GF/s
実際 512個×4チップ×1ボード×(64+32)サーバ???で ???? で、動作クロックが3割引で・・・???
報告書は、わかりにくいようにボカして書かれているので、状況が良くわからん。
だがしかし、2PFの半分どころか1/4未満なのは、たぶんそうでしょう。
Teslaは、ここまでヒドくはなかった。
だいたいマキーノは2chのこのスレ見てるんだから、2PFの目標に対して実際どうだったのか日誌にでも書いたらどうよ。
2PFというのは(実際には出ない)ピーク性能なんだから、チューニングで性能を上げてる最中だから待てとかいう話にはならんでしょ。
風の噂では、天文台のGRAPE-DRは、いまだにサービスインしてないっていうじゃないか。
2012年までは電力あたりの実スループットでXeonに負けないとか言ってるけど、
それまでにサービスインできれば、まぁ何とか「間に合った」と屁理屈をこねるのかな。
そういや日誌で、
情報公開すると2chでツッコミ入るから、もう情報公開しない
みたいなことを言ってたな。
隠蔽体質にならざるをえないってことは、
隠さなければならない失敗・不正があるってことを匂わせるよね。
68 :
不明なデバイスさん:2010/07/08(木) 13:10:08 ID:2IAo25jP
記事の写真を見るたびに思うんだが、
地球シミュレータ(初代)と同じ計算能力が、たった標準ラック1本で実現
みたいなことを記者に言ってたのは、誰かなー。
当初、64ノードを19インチのラック4本に収める予定だったよねー。
たぶん、GRAPE-DRで2PFlops機が仮にあったとしても
地球シミュレータで動かしているようなアプリに関して、
同等性能以上を平均して出すのは難しいんじゃないかな。
もちろんプログラムのチューニング次第なんだろうけど。
PowerXCell機って、案外数出ているのな。
電力効率も優秀だし、こんな感じだとは知らなかった。
>>73 GPGPUはメモリバンド幅はそれなりにあるから、通信を隠蔽することでまあ見られる値になったと。
実際は単精度での値とスカラーの比較だから、ベクトル並みには程遠い。
メモリバンド幅すらないGRAPE-DRでチューニング次第で性能がでるとは、やってから言えよw
GRAPE-DRの何がアレかというと、開発サイクルが長すぎること。これは、京速スパコンにも言えるが。
スパコンではない別のPC関連の少量生産のボードでの話だが、本質的には同じだろう。
(数字は実際とは変えてある)
あるA社では開発に1億円かかるものが、別のB社では100万くらいしか、かからない。
どちらも、日本の会社で、日本国内で全工程をやっているのに、100倍も開発費が違う。
なぜか?
A社は、新しいボードを作るのが10年に1度で、
その都度、ボードを作るのに必要な技術を新しく習得しており、様々なトラブルで開発は難航する。
B社は、新しいボードを作るのは週に1度で、
ボードを作るのに必要な技術は既にもっており、とくにトラブルなく開発が済む。
A社B社ともに、基板製造などの都合で最小ロットの100枚を製造。
1枚あたりの開発費、A社は100万で、B社は1万
販売価格、A社は200万で、B社は20万
とりあえず製造費は別として、
A社は50枚売らないと開発費すら回収できないが、B社は5枚売れば回収できる。
A社の人は、B社を見て不思議だという。
なぜB社は売れてないのに次々に新製品を投入し続けられているのか、と。
これは会社の構造的なもので、
A社は製品ごとに組織が分かれていて、それぞれの組織で別々に技術を保有してる
B社は技術ごとに組織が分かれていて、様々な製品の開発に技術を使いまわす
で、アメリカはB社的で、日本はA社的なんだな。京速もGRAPE-DRも。だから勝てない。
実際、そんなだとホント効率悪いなぁ。
製造面でも技術開発の面でも。
でも実際の日本のA社は実務は子受け、孫受けに外注●投げ出し。
子や孫はB社状態で薄利多売自転車操業で生かさず殺さずだしwwwwww
それがJAPAN
> 熱心な人がいるなあ、、、
> 63 :不明なデバイスさん:2010/07/08(木) 09:54:16 ID:PibubPXF
> 64 :不明なデバイスさん:2010/07/08(木) 10:03:11 ID:PibubPXF
> 65 :不明なデバイスさん:2010/07/08(木) 10:15:25 ID:PibubPXF
> 66 :不明なデバイスさん:2010/07/08(木) 10:19:13 ID:PibubPXF
子供じゃないんだからさ・・・
それにしてもマスコミってプレスリリースを書き写すだけなんだな、マジで。
公的な補助金を受け取りながら性能目標を達成できなかったプロジェクトを
国民が好意的に受け取るような報道をするのはヤバいと思いますよ。
> それにしてもマスコミってプレスリリースを書き写すだけなんだな、マジで。
> 公的な補助金を受け取りながら性能目標を達成できなかったプロジェクトを
> 国民が好意的に受け取るような報道をするのはヤバいと思いますよ。
トンデモ医療だろうがなんだろうがそのまま報道してるマスコミに何を期待してるんだおまえは?
>>81 ちょ・・・マザーボードに対して、GRAPE-DRボードが斜めになってるゾ
PCI Expressのスロットのコネクタが可哀想だ
マザーボードの下に段ボールは、燃えるゾ
段ボールが時間とともに炭化して発火点が下がるとか、
マザーボードの裏面の部品(チップコンデンサとか)が放熱できなくて劣化が早まったり
マキーノ先生の5〜8時って朝の?夕の?
見たい
失敗したプロジェクトを、別の観点で成功ということにする
その手腕は立派な「日本の研究者」ですな。
89 :
名無しさん@そうだ選挙に行こう:2010/07/10(土) 13:13:25 ID:TMBMNaQw
牧野見苦しいぞ
2008年にTop500にRpeak 2PFで登録できなかったことは純然たる事実じゃないか
そりゃぁ本人が失敗を認めたら、次がないし、様々な人に迷惑をかけることになるから、
どんなに見苦しくても失敗は認められないというのは、わかるけどさー。
何年もかけてLinpackだけカリカリにチューニングしても
ドラッグレース程度の意味しかないよな。
値段が多少高くても電力効率が多少悪くても使いやすくて性能が出しやすいシステム
つうのは科学研究を進めるには非常に重要だと思うんだけど。
ベンチマークのためのマシンと、仕事に使えるマシンを一緒に取り扱うのは
そろそろやめたほうがいい。
うむ、そのとおり
ホストPCがなくて倉庫に寝かされているGRAPE-DRボードは、いくら電力効率が良くてもベンチマーク値が良くても、使えないもの。
Little Green 500 で世界一になりました。
今回、残念ながらもGreen500での一位は逃してしまいましたが、
スコア提出が期日に間に合わないというトラブルがなければ、
Green 500でも一位になっていた素晴らしい省エネスパコンです。
って報道したところは、ないのか。
成功したなんて言い張るなら、新プロジェクトを、税金でなんて考えず、
GRAPE-DRの販売利益と出資をつのってやってもらいたいもんですなw
>>115 R4議員はそんな違いまで分かっちゃいないからっw
でも、SPARC。これからも開発続けるのかなぁ…。
CPUの違いはともかくとして、商品としてスパコンが売れてるなら、良い事なんじゃないかな。
>>117 ブレードサーバで、IBMやHPにやられちゃうよりは、
富士通が頑張ってくれた方が良いですね。
でもTSUBAME2.0は、HPが色々やっているみたいな話を聞きますね。
TUBAME2.0はNECだろ。HPには技術分の金を払ってるだけ。
>>121 > 400nsのデバイスメモリを250nsのキャッシュで高速化するというセンスも良くわかりません。
> まあ,これらの測定はCUDAコアからのアクセス時間の測定なので,
> 物理的なキャッシュアレイのアクセス時間だけでなくワープのスケジューリングの影響を含んだ値になっているのかも知れません。
キャッシュには、高速化だけでなく、外部バスの帯域幅の削減という役割もあります。
たとえば、HPのmx2は、メインメモリと同じDDR-SDRAMをL4キャッシュとして持っています。
IBMのPower7で32MBのeDRAM導入されて、ほほ〜と興味持ったばかりなのに、
もうL4なんて積み始めてるのもあるんだ…(-_-;メモリカイソウフエルフエル
> 理研側は当初計画したスパコンを開発できなくなったことで、
> 神戸市に建設中の収容施設に余剰が生じ、損害が発生したとして、賠償を求めているとみられる。
高コストな過剰な建物を作った理研が批判されでもして、矛先をNECに受け流すのか?
京速を見捨てて、大学スパコンに乗り換えたことに対する意趣返しかね。
利権が「何が何でもLinpackで世界一位!」とか言わずに、
地球エミュレータver.2.0を目指していれば、NECの撤退はなかった。
SXに未来はない。
・・・夏だなぁ
>理研、NECに賠償請求 次世代スパコン撤退めぐり
開発費だけとって途中離脱
さては別の用途に使い込んでものが作れなかったに違いない
さっさと開発費返せよな
>>134 途中離脱できる契約だったんだろ。
返せってことは、金、払ったんだよね。
払ったってことは、理研側が、開発の「成果物」の納品を受けて検収だしたんだよね?
未払いw
ちなみに時系列で並べると
ベクトルいらない、スカラーのクラスタのみにすべきという検討結果
↓
空気を読んだベクトル担当のNECと日立が、自社の経営状況を理由に撤退
ベクトルを入れた計画を立てた人達のメンツと、既に使った金の責任をうやむやに
↓
事業仕分けで損害賠償請求しないのかと突っ込まれ、しますと回答
↓
理研、NECに賠償請求 ← いまここ
>>136 え? じゃぁ、払うべき金を払わず、そのうえ、金を取ろうとしているのか。
神戸のあの建物のキャパシティが無駄になったとか、もうねアホかと。
あの建物、もともと過剰スペックだろ。ヤクザな話だな・・・。
>>138 そうそう、まだ予算を認められていない計算科学のCOE拠点やリプレース用のスペースを入れちゃってるからな。
今回の訴訟も時期的に、宿題は片付けておかないと、次年度予算の概算要求に響くって考えてるのがみえみえ。
まあ他をけなし、大風呂敷を広げて予算を獲得したものの、全く結果が伴わず、
最後には、結果に合わせて研究計画書を書き換えて、自画自賛してる腐った葡萄に比べれば、まあかわいいもんだよなw
>>138 > あの建物、もともと過剰スペックだろ。ヤクザな話だな・・・。
予定の性能が出なかった時には増設する余地が必要でしょ。
>>135 開発費かどうかは別として、大型案件には、契約書に先に契約金額のn%支払うと言う項目がある場合が多い
少なくとも私の見た案件にはあったぞ
あ、末端の奴は知らなくて当然か。がんばって上に上がってこい
>>140 そう思うんだが、NECが撤退してキャパシティが無駄になった、なんて言ってるんでしょ?
損害賠償請求をするというのが事業仕分けで先に決まって、後から損害を探したから、
わけのわからない損害を捻り出すことになるわけでしょう。
あの建物に、まっとうなコスト競争力のあるのなら、
空きキャパシティの埋め草は、比較的かんたんに見つかるでしょう。
どこの掲示板だったかな、
研究棟の建物の外観に無駄なコストかけるよりも、部屋を使いやすくしたり賃料を安くすべきだって言ったらさ、
日本一のスパコンの建物なんだから立派な外観は当然だし、
美術的なデザインのよい建物は研究者の人の知的活動に良く作用し良い研究成果を出すのだから必要
といった内容の、アホな日本の建築家のようなこと、言われちゃった。
まさか、あの神戸の計算機棟の横にへばりついた研究棟、
空調能力が足りなくて灼熱地獄になるとか、電気配線の容量が足りなくて電圧が下がるとか、
最初から増設工事しないとコンセントが少なすぎるとか、通信ケーブルを配線する場所がないとか、
エレベーターの中身が2/3しか設置されていないとか、そんなオチないでしょうな。
さすがに、過剰に金かけてる建物だから、そんなことはないか。
>>142 官需系の場合、
・予算は来年度に通る予定だが、現物は今年度に欲しい
・現物を今年度予算に間に合うように納品してほしいが、来年度以降に仕様変更を無償でやってほしい
・納入は一括だが、支払いは一括ではなく、複数年度に分けて行いたい
なんていう酷い話がゴロゴロしてまっせ。
マジで賠償請求するのか・・・
>>137 空気を読んだというかなんというか、中間評価作業部会で無茶言われてたみたいだしねえ。
撤退が5月で中間評価報告書が7月だから微妙だけど
ttp://www.mext.go.jp/b_menu/houdou/22/01/1289511.htm > ・ スカラ部による性能目標達成のためには、ベクトルは完成が遅れてもやむを得ない。
> ・ 現状では、世界一奪取に対する貢献度が見えない。
> ・ 統合アプリはない、統合Linpack はやらない、ということなので、ベクトル部を継続する意義はほとんど無い。
> ・ ベクトルで3ペタ達成可能であるならば、作る意味はある。3ペタが達成されないならば意義は低い。
こんな意見まであるし。
ま、少なくともNECの撤退は、受注したのに投げ出したんだからペナルティがあっても仕方がない
しかも、設計変更のための費用とかも余計にかかってるし、素直に払えよって感じだな
で、日立はどうなったんだ?
受注したのは設計で、製造の契約はしてなかったんじゃないの?
最後までやらせたいのなら、理研が一括契約しておけばよかっただけで
NECに落ち度はないように思えるけど。
>>143 当時のやりとりを聴き直すと損害賠償の話は京速サイドが今現在準備中と言っていた事で
特に仕分けの場で求められて決まったという事のようには思えないけどな。
ってか何で根拠も無いネガティブな話(さすがに〜そんなことはないか。と予防線を張っているが)
を書き散らかすかね。風説でも立てようとしてるの?
>>146 日立はNECと契約する形で間接的に参加してたんじゃなかったっけ?
>>147 そう一括契約しとけってだけ。でも国の予算は単年度決算だから絶対無理w
おまけにGXのように国の都合で、一方的に事業を打ち切ることができるんだから、
抜ける自由もあるだろ。
>>148 あんた社会常識皆無だね。役所サイドとしても、
>>139 にあるように研究計画の変更を行えば問題にすらならないのに、
研究所が進んで訴訟し、金をとって国庫に返納なんてするわけない。
>>146 フェーズごとに分割して発注されるので、設計はやるけど製造はしない、というのも"制度的には"何の問題もない。
現実には無理だが、NECが設計し、富士通が製造し、IBMが保守する、みたいなのも"制度的には"可能だろう。
自分の研究がイケてると思うなら、リケンや本省頼みでなく自分で金集めようとする
バイタリティーも研究者には必要なんじゃないかと思う今日この頃…
自分の研究のために金を集める労力を惜しむような研究者にはふつう期待できんだろ。
そういう研究者こそむしろ税金投入する価値ないね。
これからはどんどん予算調達の競争も活性化すべきだよ。
研究者だから==金に疎い
ではこれからはダメ。
マキーノ先生、
Quartus2での不要なRAM化類推処置はコンパイルオプションでOFFに出来た気がしますぜ。
SynthesisオプションでMoreSettingだか。
いま近場に環境がないのでうろ覚えで恐縮ですが><
嘘だったらゴメンナサイ><
test
配置・配線を1000並列だなんて簡単に言ってくれるなあ
ハードウェアコスト < 空調コストなら、冬場だけ運転するスパコン、なんてのもアリじゃない?
夏に計算したい人は南半球のスパコンセンターを使ってくれ、と。
ついでに北海道や東北は、冬になると風がよく吹くので、風力発電とも相性がいいぞ。
風力発電の発電状況に応じてクロックを下げたり、ノードを休止させたりも、エコでいいでしょう。
にっぽつ
マキーノ先生は中国とかで無線LANフツーに使えたとか言ってるけど、
セキュリティとか大丈夫なのだろうか?
東大とか天文台に持って帰ってきて繋いだら、いらんもんばら撒いたり・・・
そして機密情報だだ漏れ
その手の会場で無線LANが使えるのは普通では
中国では有線でも無線でもLAN繋いだ瞬間に
当局の監視決定だもんね。
PCアプリレベルでどうにかしないと
どうにもならんような。
203 :
>>200:2010/08/30(月) 20:40:55 ID:v376oZOu
>>203 何も軍事技術でなくても、普通の技術の流出でさえ、本当はマズいんだよ。
日本は、政府からして民間企業に中国への技術協力(流出)をしないさいと圧力かけてるからね。
>>201 学会発表はウイルス感染の温床らしいね。
用意されたプロジェクター&PCが感染していて、
スライドのファイルを入れたUSBメモリをさすとウイルスを持ち帰ることになるとか。
容量の少ないUSBメモリは安いから、使い捨てたほうがいいかもね。
>容量の少ないUSBメモリは安いから、使い捨てたほうがいいかもね。
公衆衛生だな
使い捨てコンドーさんみたいなものか
使い捨てるために安いのを買ったら、最初からウイルス入りだった、なんてことも考えられるか。
工場で混入しちゃってました、っていうニュースけっこうあるよね。あれ、氷山の一角だよね。
>>219 京大のPOWER7、1ノード860GFLOPSで、ノード間転送が4x2GB/sってノード間が貧弱すぎないか。
Nehalemの10コアも発表されたようだが、世界最速Venusは、今だに発売すらできないのか・・・
>>220 4GByte/sec x 2 な
空冷のXM1だとこうなるみたいだね。
水冷+空冷のL2は(ノード間最大16GByte/sec x 2 )買えなかったのだろう。
スパコンについての質問はこちらでよろしいでしょうか?
開発の意義について
事業仕分けの際、日本の研究者・企業の方々がスパコンの国内開発を強く希望していましたが、これは何故でしょうか。
技術の維持、販売などの視点から開発者側が要求するのは理解できますが、実際には使用者の側からも国内開発への
要求が強く出されました。
仮に日本が開発をやめて外国から購入する場合でもアメリカ国内に複数のメーカーがあるため、
不当に高い価格になる可能性は少ないと思われます。
にもかかわらず、開発者・利用者双方から国内での開発が求められた理由は何でしょうか?
今のところ私が考えている理由としては以下のようなものがあります。
・輸出規制品に該当する場合があるため、必要な性能の製品が得られない可能性
→アメリカのThe Export Administration Regulation(輸出管理規則)を確認中ですが、
スパコンが商務省や国防省の規制に引っ掛かるものなのかはまだわかりません
・国内企業の技術の底上げ
→外国企業に技術情報が流れるのを規制する法律があるのでしょうか
また、投資に対してどのようにペイしているのかがよくわかりません
正直、これらが正しいのかどうか確認できません。詳しい方がいらっしゃるようでしたら、どうぞよろしくおねがいします。
>>223 まず税金を使う際の大前提を理解する必要がある
国内開発なら国内で金を回すので公共工事と同じ
海外からの調達だと税金が流出して日本に戻らない
だから、海外からの調達は国内では入手不可能な
ものに限定し、なおかつ最低限にすべきなんだ
国全体で見ると、スパコンが国内調達不可能ならば
そもそもスパコンへの投資は最低限にして、国内の
別の分野に投資すべきということになる
スパコン使用者もその理屈が分かっているので、
計算科学分野全体の予算を削減されないように、
国内開発を後押ししている
>>223が正しいとすると、税金の使い道として
国内開発と海外調達のどちらも優先度が同じ
になってしまう。
上に述べたように実際は違うので、223は間違い。
蛇足すると
国内の研究者がみな、スパコンの純粋なユーザー、というわけじゃない。
自分でスパコンの利用料金を払うのではなく、国のスパコン開発のプロジェクトに便乗してタダでスパコンを利用しようっていう人達もいるんだよ。
実質的には1つの研究プロジェクトだが、
予算的にはあちこちの研究プロジェクトから少しずつ予算を獲得している、
そんな研究者がたくさんいるから。
>>223 研究者は税金をつかって物を買い、
仕事をしているという意識が一般に低い。
10億円で調達してようが、1000億円で調達してようが、
国が調達してくれるものは自分達にとってどの道タダだからな。
あとは自分達が楽に使えるのがベスト。
海外製で環境やサポート体制が違うと面倒だし、不安だろ。ただそれだけ。
牧野先生ってVineLinuxユーザー?
GRAPEつながり?
>>223,224,228
スパコンの開発・運用を自前で行うことで恩恵を受ける研究者・企業は見かけよりも多いということですかね。
回答ありがとうございました。
Say Hello to the New ADIOS
ワロタ
fdさ
nvidiaってつぶれないのか
結局次世代dsのグラフィックチップも日本メーカだったのに
提灯記事とリネーム詐欺で荒稼ぎした貯金が結構あるから後1年くらいは今のグダグダでも大丈夫
その後は余程の新製品を出さない限り倒産一直線だろう
そこまで落ちぶれたらたぶんIntelが買うだろうな
DARPAのお金でゾンビ化するかもね
富士通のTOFUっ発想がグリッドっぽい?各ノードを超高速のインターネット回線で繋いだ感じ。
それに比べてIBMのは一枚のマザボに近い?
ノード→スーパーノード→システム間のバスが、レジスタ→内部キャッシュ→FSBみたい
予測されていたことだけど、Alltoall通信なんて考えてるわけないだろ、ってユーザをバカにしたよう仕様だな。
しかも自分たちで、HPCC 4awardで1位をとるって公言しておきながらなw
その上、簡素化した割には、価格はBlueWatersよりも高いこと間違いないしな。
実質スパコン専用になっちゃった45nmプロセスと違って
65nmプロセスはある程度顧客が付いてたはずだから、
それなりに価格競争力はあるってことで
さすがにチップ面積が1.8倍のチップより価格が高いって
ことはありえないんじゃない?
マキーノ先生は次のはeASICでやるのかな
ALTERAのHardCopyは駄目なんですかね?
eAsicは次世代専用機だって言ってるじゃん
246 :
不明なデバイスさん:2010/09/14(火) 17:40:28 ID:5OeLClLF
>>241 アメリカは、地球シミュレータの巨大なの作ろうぜ
日本は、小規模PCクラスタの巨大なの作ろうぜ
なんだろうな
これからの時代はスパコン専用機なんかイラネ、PCクラスタで行く
なんていう幻想を誰かに吹き込まれた人が大勢いたってことだ
うちの会社なんか酷いぜ。
偉い人達が、実際に第一線で仕事している人達よりも、怪しげな雑誌のほうを信用してる。
さらに、偉い人達の取りまきが、Yesマンばっかり。
だから、偉い人が、ろくに考えずに気軽に雑談のつもりで「うちの会社は○○を検討したか?」という発言をすると、
その取りまきが、「うちの会社は○○で行く」という意味で受け取り、「○○をやれという指示が出た」と下に指示を出す。
そのうえ、屁理屈で強引に「すでに○○はやってます」という説明をして誤魔化すから、もうワケワカメだ。
248 :
不明なデバイスさん:2010/09/14(火) 19:59:37 ID:z77+G9XK
dellのFlexmem Bridgeってどんな仕組みになってるんだろう?
そりゃそうと、
4ソケットのサーバなのにCPUを2個しか積まない
そんな構成で買うのは、いったいどういうユーザーなんだろう。
自作PCじゃないんだから、後からCPUを増設したりしないだろ。
それとも、DELLは後からのCPU増設をしてくれるのかな。
演算ネックじゃなくてメモリネックなアプリを使う人じゃないの?
とりあえず、このスレとは関係無さそうだ
それなら、最初からNehalem-EXの2ソケットのサーバを買えばいいじゃん。
もしかして、Nehalem-EXで2ソケットはDELLは作ってないのかな。
>>252 >自作PCじゃないんだから、後からCPUを増設したりしないだろ。
SunやIBMの詐欺的な営業知ってたらそんなこと言わないよね
4ソケットサーバをそのまま使えることでコストダウンになるんじゃないの?
>>252 あとから増設してくれるんじゃない?
>>254 一応拡張可能性はありますよ的なことがいえたらうれしい場面とか
あったりなかったり。
>>259 まぁね
ラックまるごとの巨大な筐体に、ちょびっとだけモジュールを積んで、将来の拡張性とか笑っちゃう話あるよね。
実際に拡張するほど急成長することもないし、いざ拡張しようとしたときには、モジュールが販売終了してたり、
モジュールの保守期間と筐体の保守期間が合わなくなったり・・・etc
ちゃんと長期にわたって拡張できるようにしているメーカーもあるけど、そういうところのは筐体が高い。
っていうか、最初からフル搭載で納品されてきて、ライセンス買うと封印が解けるみたいな。
半人前のクラウドだね
半人前の玄人
中国のgodson-3Bに負けてるvenusちゃん
GODSONと聞くとゴッドマンを思い出す。
なにそれ?
東宝特撮だな
中国もMIPSを担ぐとはな
むかしは日本もMIPSだらけだったんだよー
NECや東芝がMIPS作ってたんだよー
>>270 知ってる
EWS4800とかプレステとかそうだったしね。
NECのハンドヘルドCEのなんたらギアも。
R10000などは、MIPSが設計して、NECと東芝が製造してた。
SGIのOrigin2000とかのスパコンに使われてた。
EWSやゲーム機やPDAはスパコンじゃないじゃん。
まじで?
277 :
ビーナスボーナス:2010/09/18(土) 23:40:43 ID:i7CzjLV0
今更だけども、HotChips22で京とBlueWatersの全体像が大体出揃ったから
思うんだが、、、何故に同じ水冷でありながら、これほどの実装密度の差
があるんだろう。。。
特に京の方だけど1ラックに96CPUしか搭載できない(少なくともプロトタイプ
ラックではそうなっていた。)
昔、PrimePowerというUNIXサーバでも128CPU搭載じゃなかったか?
10年前の空冷UNIXサーバよりも実装密度が低いってどういうこと?
多額の税金つかった効果って、やっぱどこにもないと思うんだけど。。。
あと、この京の構成って、細かい違いはあるけど、昔のアメリカの
サンディア研究所にいれたクレイのRedStromと、ほとんど一緒じゃん、
って気がしてならない。(CPU : Opteron->Venus InterConnect : Start->ICC)
今回のスパコン開発って、BlueWatersはともかく京の方はどこに革新があった
のでしょうか?
ラックの大きさ同じなの?
使った税金が実は全然多額じゃないから
以上
日本国がスパコンを国家戦略として継続的に開発していく箱物や制度ができたところ
>>277 京速とBlueWatersでは、ラックの床面積が倍くらい違うよ。
BlueWatersのメインボードなんか「畳」って言われるくらい巨大だ。
そして重量もかなり違う。
アメリカの工場のような平屋建てのデータセンターなら搬入も設置もOKだが、
日本の免震構造のビルのようなデータセンターだと、搬入のエレベータに乗らないし、フロアの床が抜けるだろう。
> 多額の税金つかった効果
スパコン本体には大して税金は使われてないと思うぞ。
だからこそ、NECや日立が自腹切るのに耐え切れず、逃げ出したんだろう。
あの神戸の、やたら高い土地代の埋立地や、無駄に金をかけまくった建物、
要素技術の研究だとかいって日本中の大学にバラ撒いた研究予算、
そういったものが、京速スパコンの値段を押し上げてるんでしょう。
ま、京速スパコンは、ノードの中身の写真を見ると、筋の悪さを感じてしまう。
なんかねー、普通のラックマウントのPCサーバを水冷してみました、って感じ。
これからはPCクラスタだ! なんていう話を真に受けちゃったのかなーって思う。
HPC厨はまだ専用プロセッサに夢見てるのか。
哀れだな。
>>282 そもそもアメリカはハードの開発費なんか国費で出してないだろw
神戸の高い土地代ね、神戸市からの無償貸与だよ。
NECや日立がぬけたのも別の理由、お前恥ずかしいやつだなw
>>284 話が繋がらないぞ。
>>285 アメリカは、大量に調達することで、開発を促してる。
あの埋立地は神戸市持ちか、いずれにしても税金だが、京速の値段には入らないか。
>>277 強いて挙げれば10万ノード並べて動かすってとこかな
ほんとに動けばだけど
MSのこの前建設したデータセンター、
80万コアって噂もあるな。HPCよかデータセンターの方がすごい。
>>289 Top500の下のほうには、
インターネット・プロバイダーのホスティングのサーバらしきものが、
ゴロゴロしてるよ。
データセンターは謎が多いからなあ。
衛星写真で推測とかw
>>289 データセンターはデータセンターで確かにすごいけど
スパコンで10万ノードいっぺんに動かすのだって十分すごいでしょ
用いられるソフトウェアの性質が違いすぎて比較するには無理があるかと
BOINCがあるからスパコンなんてもう必要ないとかいう言説に近い
295 :
ビーナスボーナス:2010/09/19(日) 20:14:44 ID:q/oNQ08Y
でも富士通ってJAXAに入れたFX1のころからそうだけど、なんで1CPU1ノード
に拘るのかな?なーんか、方向性が世界の潮流とは違う気がするけど。
しかし、IBMのPower7は既にUNIXサーバとしても出荷しているのに、Venus
の方は、あくまでも京向け専用でUNIXサーバ向けには別チップを起こして
いるのかな?しっかし何でこういう重複した無駄な開発しかできないのかな。
別チップで起こすのであれば、わざわざSPARCアーキ拡張でVenusをつくる
必要があったのかな。。。うーん。。昔から言われているけど、日本って
やはり現場の技術者レベルでは欧米とそんなには変わらないと思うけど
大局的に物事を見る人がいない、というか、いたとしても見れる人に決定権
がないから、こういうことになっちゃうんでしょうかね?
ビジョンとか戦略が糞だからでしょ。
我が弱くて同調的な気質がよくない気がする。
米国であれが流行ってるからウチも早くあれやらなきゃ、
みたいなこと繰り返しても永遠に追いつけるわきゃないし。
GPUでスパコンが話題になったら話題になったで
次はGPUか、時代に乗り遅れないようにウチもあれやらなきゃ、
でGPUの話ばっかりになったり。
一方、ガラパゴス携帯とか2ちゃんねるのような匿名掲示板とか、
海外のこと何も考えずにつくったのが世界の先端いってるんだが。
297 :
ビーナスボーナス:2010/09/19(日) 20:26:30 ID:q/oNQ08Y
確かに、そんな感じですね。
あとやっぱり、スパコンの仕様とか考えるときに日本企業のなかの
サラリーマンが寄り集まっても、革新的な何か、が生まれる筈は
ないんでしょうね。
日本の技術関係は米国に憧れるあまり、
メインストリームが米国のマネと思われているからな。
国内になんとなく存在する世界よりも進んでいるものを
早期に発見して積極的に海外に売りこむというスタイルになかなか
なれないようだ。
>>295 > わざわざSPARCアーキ拡張でVenusをつくる必要があったのかな
というが、SPARC以外のアーキテクチャでつくる必要もないだろ?
メインフレーム互換にしろとでも?
あと、1CPU1ノードじゃない世界の潮流って?
サーバにしろメインフレームにしろ大規模ノードの独自設計はIBMのお家芸。
IBMは優秀だね
同じような日本大企業は浮き沈み激しいのに、GEとIBMだけはアメリカの良心だね
303 :
ビーナスボーナス:2010/09/19(日) 21:21:37 ID:q/oNQ08Y
いや、sparcアーキ以外でつくる必要はありませんが、どうせsparcアーキ
拡張でチップを起こすのであれば、通常のUNIXサーバにも乗せられるように
すべきだったのではないか、と。
1CPU1ノードがまずい、とは言いませんが、あまりに粒度が細かくなりすぎ
るのではないか、と。BlueWatersでも基本単位は4CPUを乗せたMCMが最小
単位ですよね。1CPU1ノードとする利点がある、もしくは、これほどノード
を細分化しても効率が落ちずに、性能がリニアに上がるということであれば
良いことだと思います。
304 :
ビーナスボーナス:2010/09/19(日) 21:26:16 ID:q/oNQ08Y
いや、sparc以外のアーキにする必要はもちろんありませんが、サーバ
ビジネスも考えるのであれば、VenusをそのままUNIXサーバに乗せられる
ようにすべきなのではないか、と。
あと1CPU1ノードが悪いとは言いませんが、制御する単位が細かくなりすぎ
るのではないか、と思った次第です。
BlueWatersでも、最小基本単位は4CPUをまとめた1MCMですよね。
1CPU1ノードでも、効率が落ちず、性能がリニアにあがるのであれば
どういう構造でもよいとは思います。
>>295 日本の会社の上のほうの人達は、
自分の会社の技術者に話を聞くのではなく、
日経なんとか等の雑誌の記事を読んで判断する。
ひどいことに、
技術系雑誌の新人向けのインチキ記事を読んで、
これをヤレという指示をだす偉いさんもいて困る。
制服組スルーして普天間やってたパト山とクダみたいなもんだな
>>304 UNIXサーバに乗せるメリットくらい誰でも思い当たるのだから
Fの中の人だって考えただろうさ
むしろ何でHPC専用にしたか、理由を考えてみたら?
たぶん、Sunが富士通に、APL2やらない、って言ったんじゃね?
そしたらUNIXサーバに乗せるSPARC64は用無しになってしまう。
>>304 4CPU1ノードにしたとして、そんなに効率変わるかな?
これが3DトーラスじゃなくてFat Treeだったら
階層を増やしてノード数を減らすことに大きな意味があるんだろうけど
1ノード1CPUにこだわった理由は、単純に技術力がないからだよ。
HPC2500の仕様を見れば分かるように、DTU(ノード内クロスバ)を使ってたけど、
レイテンシ増大で、同時期のQPIやNUMA対応の多機種に惨敗。
1ノード1CPUで設計すれば、これらの設計を省くことができるし、共有キャッシュの設計もいらない。
で、実際FX1は結構性能がでるようになってる(それでもXeonの方がたいていのアプリで高速)。
まあ今更10万ノードで動いたからすごいだろっていわれてもなw
やるっていったことで評価しないと、どっかの詐欺グループと同じだわな。
> まあ今更10万ノードで動いたからすごいだろっていわれてもなw
俺は10万ノードで動いたらすごいと思ってるけど
別に京の中の人達がそう主張してるわけじゃないからなあ
> やるっていったことで評価しないと、どっかの詐欺グループと同じだわな。
まあ、これについては同意
どんな風にすごいのか説明してくれ
10万ノードで並列化効率50%出そうと思ったら、並列化率:99.999%は必要。
全く独立なジョブ10万個投げたとしても、それこそ並列化率99.999%はいかないだろw
それを通信が発生する実アプリでやって見せて、HPCC 4項目でトップの成績を出すといってるんだから、想像もつかないほどすごいこと。
でも、いったことをなかったことにして、とりあえず10万ノードで動いたからいいだろって言うんであれば、それは違うだろって言いたいだけ。
ぺろぺろ
ID:Ba4StrB7
あなた人間のクズね
ハード屋とソフト屋の喧嘩だな
こんだけGPGPUが日の目を見てるのに
まるで話題にならないTSUBAME2.0
海外では中国nebulaeの二番煎じと考えられてる
>>322 無知かどうか見分けるのに楽で良いじゃん。
>>322 TSUBAME2.0はnebulaeにCPU数でボロ負け、GPU数でも負けてる
nebulaeは曙光製で中国産だがTSUBAME2.0はHP製で米国製
日本が米国にも中国にも負けている象徴にしかならない
327 :
不明なデバイスさん:2010/09/23(木) 16:00:39 ID:I56z86mG
DP GFLOPS/Wattが、Maxwellで3年後にFermiの10倍以上よくなる根拠はなんなんだろ?
Keplerで3-4倍とか言うのも信じられん。
328 :
えるえる:2010/09/23(木) 20:27:42 ID:4gil++I8
>>327 そこは信じなくてOKだろ。
景気のいいロードマップを公開したことでハードルアップ。
今後が楽しみだな、いろいろな意味で。
329 :
えるえる:2010/09/23(木) 20:29:34 ID:4gil++I8
GPGPUはnVIDIAと運命を共にする研究会だからな。
国内研究者は市場の動向に依存した一過性のネタにとらわれずに、
もうちょっと一般的な並列化の問題にチャレンジして欲しいものだが。
330 :
えるえる:2010/09/23(木) 20:48:14 ID:4gil++I8
ちなみにHaswell以降の展開は、
HPC上でのPCクラスタの問題を一部軽減する可能性あり。詳しくはまだグレーなので秘密だ。
もしそうなれば、またPCクラスタ以外の選択肢は相対的に価値が下がる。
(Fused MAのことではないよ)
将来のことなんてどうでもいい。
今安くて使えるものを使う。
CUDA Nowhere
スパコン市場がこれだけ大きくなったのは、地球シミュレータの登場がきっかけだろ。
あれが米国に火をつけ、それが世界中に広がった。
ココまできたら藩用品のスケールメリットとか考えずに、スパコン専用でがんがん
プロセサ開発したほうがいいし、儲かると思うんだけど?
>>340 おいおい
> 433MHz くらいまでは問題なく動作
結局、500MHz動作する製品は出せず、か。
チップは500MHzで動くけど、ArriaGXがネックでクロックを下げてるんですなんて言い訳、ひどいとおもう。
> 現在シングルカードの性能としては世界一。
おいおい、TesraもRadeonも、普通のATX規格のPCに入るが、
GRAPE-DRは、ぜったいに入らない巨大基板じゃないかよ。
比較するならGRAPE-DRの1チップ版とするか、
あるいは、
2チップの搭載のボードを2枚積んだ場合と比較しろって。
> 一昨年に前者を特別推進、後者を基盤(A) で申請して、前者はヒアリングでこけた
あたりまえだ
> GRAPE-DR は大体出来て、性能もでるようになった。
遅いんだよ。
牧野先生、あなたは京速スパコンをコケさせた自覚、ないんですか???
やっぱ反応に中一日か
>>343 牧野乙
ずっと貼り付いてるわけじゃねーんだよ
京速計画と牧野先生関係あるの?
>>345 京速は当初、
・ベクトル 少し
・スカラー 少し
・アクセラレータ 20PF
というハイブリッドにする構想だった。
そのアクセラレータには、GRAPE-DRを使うという話だったのよ。
2PF行けるって言うのなら、それを10倍にすりゃいいじゃん、と。
でも、GRAPE-DRは技術なさすぎで実現不可能と判断され、外された。
結果的に、その判断は正しかったが、構想は大きく方向転換することに。
ほんとに粘着乙だな
粘着してたの牧野
外されて、愚痴り続けてるじゃないか。
2PFの結果すら出せてないのにな。
GRAPE-DRは成功したんだから、将来性があれば開発費ぐらい投資してくれる企業があるだろw
TOP500の内で、開発費に占める国費率世界一ってかw
二度と汎用なんてほざかずに天文分野でがんばってください、って感じだな。
これって見方を変えると家電向けのASIC開発と同じようなもんだから
単体の性能やパワーで世界一だとかこじつけてもほとんどインパクトないんだよね。
mp3のデコードがPCのCPUと比較して1/100の電力でできるASICを作りました、
ってのと同じ世界。そりゃそれ向けに特化してんだから当たり前だよ。
国産メーカのシステムを散々貶めておいて結果がこれじゃあちょっとなぁ。
せめて当初の目標の2PFを達成しろ、と。
500Gflopsのチップを4千個製造したから2PFです、なんて酷い話だと思わないか?
出荷開始のニュースで京速叩きの流れかと思いきや
まさかのマッキーノ叩きw
当然だろ
Tsubame2.0とちがって京は注目されてますね。
当然だな。粘着が必死だからw
もっとTsubame2.0にも粘着してやれよ!
>>357 ちょ・・・京速スパコンのCPUはBGAで、メインボード直付けなのか。
たった800筐体のための生産ラインも、なんか虚しいが、NTT向け交換機の生産ラインに比べりゃ遥かにマシか。
マキーノDRの性能劣化は
(1)マキーノ設計が悪い
(2)台湾Alchip社のASIC設計が悪い
(3)TSMC社製造が悪い
(4)実装ボードの設計が悪い
電源周りとかが貧弱でCLK上げたら死ぬとか?
どれなのかな?
あるいは組み合わせ?全部?
俺が悪かった・・・すまない
>>363 ちょwww
お前だれだよw そしてなにしでかしたw ゲロってみろw
>>362 > (1)マキーノ設計が悪い
牧野のプロジェクト管理が悪い。
> (2)台湾Alchip社のASIC設計が悪い
> (3)TSMC社製造が悪い
それはない。彼らはプロだ。
SINGチップ自体は、予定通り500MHzで動作している。
> (4)実装ボードの設計が悪い
これが原因だろう。
プロに頼まず、牧野の弟子が素人設計で作ったと思われる。
当初は基板上に8チップ搭載で、それを2枚ずつ1Uサーバに実装する予定だった。
ところが、
8チップの予定が4チップに半減し、
基板は肥大化して通常のボードサイズを遥かに越えて、1Uサーバに入らず、
低速なFPGAを選択し、それに引きずられる形で動作クロックが低下、
etc・・・
当初予定の4000チップなら、FPGAが4000個必要で、
性能を犠牲にしてでも低価格FPGAを使わないと予算オーバーする
という言い訳もわかる。
しかし実際には4チップ搭載ボードを1枚積んだマシンを128台並べた写真・ベンチマーク結果しか出してない。
512チップしか使わないのなら、試作で使っていた高価なFPGAを使っても予算オーバーしなかったろうな。
ていうか、いつまで残りの3500チップを使わずに塩漬けしとくつもりだ? 牧野は。
妄想おつ
>>366 一般に公開されている情報がベースなんだが・・・
京の出荷台数は、800台以上ってなってるけど、理論値10Pで850台、
実行値で10Pだと、低く見積もっても950台、通常は1000台以上のような気がするけど・・・、相変わらず秘密主義だね。
IBMのBlueGeneみたいに実効値で10Pに達するまで、Fは提供しなければならないって契約なのか?
>>368 RoadRunnerみたいにLinpackの時だけ増設して、
測り終わったら増設分を富士通が持って帰るのかもしれん
一時的にオーバークロックして4Ghzで動かすんじゃね
そうすりゃ15PFくらい
アレブログ、もう惰性で続けてる感じだね
すぐ壊れるんだから常備800台でいいよ
昔のNECのSXのように、富士通の工場の中に設置したらどうよ。
>>374 そりゃソーダろ
京もGrape-drもハチャメチャで、
結局、漫遊記の1人勝ち
やりがいネーじゃネーの
Atomって本当に省電力なのかな。
Atom N550 1.5GHz 2コア TDP 8.5W
Atom D525 1.8GHz 2コア TDP 13W
Xeon L3406 2.26GHz 2コア TDP 30W
処理能力あたりの消費電力は同程度に見えるんだが・・・。
それXeonの方は選別品だし
30Wでは厳しい分野もあるということだ
チップサイズが大人と子供だろ
もうぜんぶクレイに任せればいいんだよ
変なのはIBMが作ってくれるし日本企業がやる価値はマイナスしかない
潰れたのって、クレイだっけ、SGIだっけ
円高の今のうちにIBMにスパコン受注してはどうか
受注じゃなくて発注だ
お金出せば何でも売ってくれるのかな?
例えばBlue Watersとか
IBMではなく日立に注文したらどうだろ
どうせ日立はIBMのOEM販売するんだろ?
金を出せばOKならば、いつだったか話題になったステルス機もすんなり日本に入ってくるよ。
F-22か。ってかFX計画って今どうなってるの?
中国との関係悪化なう。なのに防空網に穴開いたらチョー不味いよね。
まずくない
中国が尖閣諸島に武力侵攻したとしても、日本は自衛隊を動かさないだろう。
遺憾だの何だのとコメントをするだけで、竹島や北方領土のように放置プレイだよ。
結局、事業仕分けで凍結で時間を無駄にした分だけ、税金の無駄づかいだったのね・・・
完成時期を前倒しするには、生産ラインの増強(予算増)が必要と説明してたのに、なんで予算の前倒しで対応できるの。
>>399 いいんじゃねぇの
大胆に動いたらかすり傷はしょうがないよ
仕分け自体は数兆円の削減効果があったんだし
早くレンフォーの頭の中をシミュレートして対策を練るべき
TSMCにでも頼めばいいじゃない
>>401 > 仕分け自体は数兆円の削減効果があったんだし
あなた、騙されてますよ。
事業仕分けは、
いままで国民に見えにくいトコロで行われていた予算折衝をテレビカメラの前で演じてみせた
というだけなんですよ。
従来どおりに、
財務省が各省庁に予算削減ノルマを課し、各省庁が取捨選択して削減
しても良かったんですよ。
それを、わざわざ、「事業仕分け」などといって、費用をかけて派手な演出をした。
事業仕分けに要した費用こそが、無駄づかいですよ。
削減効果って言うけど実は予算自体は膨れ上がってんだよな
官僚叩きの一環で重複を無くすための事前協議を廃したり皆が知ってる通りあちこちバラ撒いたからな
参院選の結果を見る限りさすがに騙される馬鹿は減ったようだが
仕分けとかなんとか
いってるにわかがうざいのだが、
仕分けなどあろうがなかろうが、自民だろうが民主だろうが、
京速は元から糞だった。これは紛れもない事実。
にわかは他板で僕の考えた最強の国家戦略論でもやっててくれ。
誰が京速は素晴らしいとか言ってんの?
アメリカのスパコンに対して京速が劣っている、またスパコン政策に関しても日本は問題だらけだ、
という意見はもっともだが、だからと言って凍結して再考すべきだというのは単純すぎた。
ナマモノのスパコンを凍結にすれば再開したときには事実上やり直しということになっただろう。
京速を取りやめて10年もの空白期間をさらに伸ばすのが本当に得策だったのか?
結局仕分けをするには時期が遅すぎた。どちらかと言えば失敗した国家プロジェクトではあるが、
結果的に計画続行ということになったのは正解だったと思う。
まだ結果も出てないのに失敗w
2chらしいね。
むしろ計画がダメだと凍結されるという事例を最後までまっとうして、
しめした方が良かったと思うぞ。科学をマンセーすると科学がよくなるとは思わないからな。
人間、だれでも抑圧されている立場の方が力が出るものだ。
最初から負ける話ばかりしている。
まるで死期を宣告された病人のよう。
やっぱり負けるかな。
そんなこと言ってないで早く勝てるものを見つけてくださいよ
>>411 おいおい
計画が凍結になって痛い目にあうのは、
下手な計画を立てた連中ではなく、
彼らに頭が上がらないメーカーだよ。
>413
見つけてもダメ出しするんでしょ?w
何もやろうとしない評論家そのものだな。
あれがダメだこれがダメだと言っていたら、
いつまでたっても設計段階に出戻りし続けて長期化し、
コストパフォーマンスが酷いことになるよ。
途中で、もっと良い方法があると分かったら、それは次のプロジェクトでやるべきだ。
だが、日本では巨大スパコン開発のプロジェクトが滅多にない・・・だから日本のスパコン開発はダメなんだよ。
アメリカを見てみ。
次々に新しいスパコンが作られているので、成功・失敗どちらの経験も次に活かせている。
どんどん改良され続けてる。
つまり文科省やFやNや池沼田や悩澤と同じくらい、ここの住人もアホ。つーわけですな。
FとNはアホじゃないぞ
FはIBMに勝てるのか?技術力はあるのか?
>>418 見込みの無い自社技術にこだわり続けたアホ共。
まあ見込みがないと思うこと自体は自由だな。
どれほど考えた上でそう思うのかは別として。
ここの住民は抜きん出てアホでバカだろw
>>415 ほんとに勝てるものだったらダメ出ししたりしないよ
少しは景気の良い話も聞かせてちょうだいな
撤退戦やってるんだから負ける話ばかりになるのは仕方ない
いかにうまく負けるかがテーマだからね
出来てもいないのにIBMの脅し?で撤退戦という発想ではなあw
もしも関わってる奴がこんなのだったら絶対負けるな。
発想っつーか実際撤退戦なんだから
それ以外に表現のしようがない
撤退なんて綺麗なもんじゃないですし
脱落ですしおすし
負け癖が染みついてるな。
>>429 SX作ってるところは単に先が読めない能無しなだけ。
>>428 いやいや、撤退戦って綺麗なもんじゃないでしょ
普通しんがり負かされたら「お前は死ね」って言われたも同じ
俺らが泥啜ってる間にクラウドとかいうので勝てるといいけどね
犬死にだけはかんべんな
なんか今時スーパーコンピュータごときに期待ている馬鹿が
たむろしてるだけのスレになったな。
日本の情報技術戦略を現実的に考えるスレを立て直したほうがいい。
コンピュータといっても色々あるがスパコンは実際使ったことも無いやつの
幻想でバイアスがかかりすぎてキモイ。
米国とばかり比較しても仕方がない。
米国はスパコンだけでなくコンピュータの多くのジャンルで
日本と比較して圧倒的な地位を持っている。スパコンはそれに付随した結果にすぎないのに、
スパコンにかねかけりゃ科学技術が発展するとか、単純馬鹿がウザすぎる。
シミュレーションは重要な技術だが、世界最速のスパコンの価値なんてたかが知れている。
スパコンマンセーのオタク研究者の意見を真に受けてもダメ。
昔パラメトロンとトランジスタというのがあったが、
それとは質が違う低レベルな日本のオリジナル技術をもちあげても仕方がない。
最速のスパコンにこだわってる研究者は
手段と目的を履き違えているのでシミュレーションで大した結果だせないだろうな。
シミュレーションは計算力が全てではないし、100倍の性能ならきになるが、
数倍のレンジは殆どの場合どうでもいい。
気軽に入手できる設備の範囲内で、淡々と結果をだせるのが真の研究者。
3連投乙
蓮舫みたいなスパイの発言を真に受けてる時点でもう駄目
441 :
不明なデバイスさん:2010/10/09(土) 13:05:19 ID:tdK7TsY+
ノーベル賞の件でスパコン予算が絶対的地位を確保したようだが、そもそも
実際のスパコン構築に対して、どのように予算が使われているのかが
不明確なままなのはどうしたことか。
一番を目指すにしても、でたらめな出費を積み重ねていいという理屈にはならない。
> ノーベル賞の件でスパコン予算が絶対的地位を確保した
んなわけないだろ。
ノーベル賞の受賞者が出たからといって何かするのなら、
逆に、
ノーベル賞の受賞者が出ないと何かしないってことだ。
そんな朝令暮改のような浮ついたことじゃ、
長期的にじっくりと取り組まないといけないことなんて、
できやしませんぜ。
今回の発言はリップサービスみたいなものだよ。
> 実際のスパコン構築に対して、どのように予算が使われているのか
次世代スパコンのプロジェクトは「開発」と「構築」の両方を見ないと。
開発するのは大学で、構築するのはメーカー。
しかし大学には実用品を開発する能力なんてないわけで、結局はメーカー頼みだ。
大学に研究予算をばらまくだけだと、形として残る成果物がキングファイルだけになる。
それだと国民に対するアピールにならんので、メーカーが尻ぬぐい的な帳尻合わせとして、現物を作る。
アメリカのように、「調達」するほうが健全だと思うよ。
あとね、「京」に関しては建物がね・・・
心配しなくても10年後にはイチガイflopsくらいになってるよ
キチガイflopsスパコン欲しいでござる〜
ところでPCに限っても、去年だけで100PFlopsくらい生産されてるよな
447 :
不明なデバイスさん:2010/10/09(土) 21:18:09 ID:FGhYHC94
>>442 あんた、何言ってるのかさっぱりわからんよ。
> ノーベル賞の件でスパコン予算が絶対的地位を確保した
これはさすがに違うな。
そもそもレンホウの発言は「ちゃんと説明してみろ」だし。
予算分捕るときにあの程度のプレゼンは要求される。
そもそも、世界一じゃないのをごまかして予算出そうとしてたわけだしね。
絶対的地位のある予算なんて無駄に使われるの眼に見えてる。
コンピュータ関係の予算がどれだけ無駄に使われてきたか知らんわけじゃないだろうに。
ちゃんと使えばもっと発展したかもしれないのになぁ。
>>448 いやいや、あれは出来レースでして、
いったん事業仕分けで×にしておきながら、後で騒いで復活させる
っていうシナリオなんですよ。
どういうことかというと・・・・
まず、文科省の削減ノルマは決まっているので、
事業仕分けでスパコンを○で通すとなれば、他の予算を削らないといけない。
そこで、まずスパコンを×にして、他の予算を削らずに通す。
そして、後でスパコンを「予算別枠」で復活させる。
そういう文科省サイドの思惑があったし、それは民主党の思惑にも合致する。
民主党は、とにかく無駄を削ったという実績が欲しい。
事業仕分けでスパコンを削って別枠で復活させることは、
民主党の事業仕分けの成果を水増しするのにも役立つ。
実際には削っていないものを、別枠に移すことで、削ったと言い張れるから。
そこを突っ込まれたら、
スパコンは科学者の猛反対にあったので、しかたなく復活させました、
これは民主党が悪いのではなく、科学者に文句を言ってください、といって矛先をそらすことが出来る。
ちょっとそこのあなた考えすぎよっ!!
>>450 あ、ミンス痘に投票しちゃったアホの人だ!
>>451 同意。民主がそこまで考えてるわけがない、と同様に「2位じゃだめなのか」も
勝手に本質を突いた質問と考えすぎているだけで、本人は場当たり的に発言しているのも間違いないだろ。
ダークマタ、なにそれぜんぜんわかんない、って言う発言と同レベル。
ttp://blog.livedoor.jp/petaflops/ さて興味は、国家機密のように未だに詳細を公表しない理研にウルトラCがあるのかだな。
>>453 民主には入れてない。
>>454 そのブログの人は、
21ヶ月かけて毎日同じペースで製造する
などという間違った「己の発想」を元にアレコレ言ってるぞ。
おかしな計画だと思うのなら、まずは「己の発想」を疑うべきだ。
報道された製造ラインの写真を見る限りでは、そんな悠長なペースで作るとは思えない。
プリント基板1つとっても、作る基板が変るたびに、かなりのオーバーヘッドを伴うので、
ある数量をまとめて作らないと大赤字になる。
ボトルネックは、おそらく、組立後の動作試験だろう。
最初のうちは工場で動作試験して問題を早期に発見しないといけないが、
ある程度まで進んだら、工場では全数を動作試験しなくていいんじゃないか?
どうせ神戸に輸送して据え付けた後にも、みっちりと動作試験をするのだし、
不良が見つかったユニットは、フィールド交換すりゃいいじゃないか。
あんまり台数が少ないと、空調ができないのかな?
それとも、神戸の建物の電気代は、まだ予算が出てないのか?
徹底的にF社にぼって鍛えてもらうしかないな。
民間企業に騙されずに商談できない連中に未来ない。
>>457 その「納入」ってのは、
別の言葉で言えば「引き渡し」かもしれないし、
「検収を上げてもらう」かもしれないぞ。
普通に考えて、最後の1筐体を2012年5月末日に搬入したら、2012年中のサービス・インは無理だと思うから。
>>458 むしろメーカー側が、国家プロジェクトだからといって巻き込まれてると思うぞ。
メーカーに対して、
世界一を取れれば、京速のミニチュア版が、日本中の大学や研究機関に売れる
だから、他所に売る分で十分に儲けを出せるでしょうから、ぜひとも京速は赤字でお願いします
みたいなことを言ってると思うぞ。そういう計画だったから。
機種選定から契約までの間だけ、世界一であればいい・・・そういうプロジェクトだからこそ、
二位じゃダメなんですよ。その時の一位のスパコンのミニチュア版を買われてしまうから。
まあこのライターの記事の書き方が悪いだけな気がするが、
遅れを解消するためにあとから100億とかポンと出てくるあたり(ガセ説大だが、)は
さすがに国家プロジェクトだな。この円高不景気に100億はマジなら民間にとっちゃとんどもなくでかいぞ。
会社ぐるみで相手を騙す価値あり。
Nのような競合もないし、理研はとにかくプロジエクトを完成させなければ、
政治的な立場が苦しいところなので、あとは京が泥沼崩壊してもいいから
民間としては徹底的にぼれるだけやりまくるところだろう。
こんなうまい話はない。
そういうことだから、NECが離脱した理由も、
京速に赤字でつきあっても、ベクトル機の売れ行きにプラスにならない
ということなのだろう。
京速のミニチュア版、ただしベクトル部は抜きで
みたいな注文になるのは目に見えてると。
>>461 うーん、あんまり景気に左右されないんだよ、富士通は。
日本のIT需要の半分は、国や地方自治体だからね。
そうかねぇ。
最終的にFがぼって行っただけだった、みたいなシナリオに期待している。
そうすれば次回からはもう少し考えなおすだろう。
一般国民にまで知れ渡ってしまったがために、最後までやりとげられなければ
今後の国家プロジェクト全体に関わるからな。
ぼったのは、
次世代スパコン開発がらみで研究予算をゲットした各所と、ポートアイランドの建物
だと思うよ。
前者は、普段からやっている研究の内容を、「この予算向けの」報告書の体裁に書きなおすだけで、お金ゲット
後者は、必要以上の豪華な建物を作って売上がっぽり
どうもスパコン批判は感情的なものが目立つな。
「ぼったくり」とか「話にならない」とか第二、第三のレンホーみたいだw
情感に訴える書き方はそれだけで読む気が失せる。
レンホー批判の方が感情的だと思うけどね。
この先どんどん米中、その他でスパコン格差が広がっていき、いずれはウェブ越しに
スパコン資源を開放することで両者に囲い込まれていきそう。
米中以外でスパコンを構築しようなんて国や機関は現れなくなるよ。
一世代遅れの開放で良いのならばね。
工業力の水準ってさ、個々の要素をバラバラに考えるのではなく、相互に絡み合っているので全体で見ないといけないと思う。
たとえばロケット開発なんかは、
外国の商業ロケットを使えばいいじゃん・・・というのは、あくまでもロケットだけ見た話だし、
国産でロケットをやる・やらない、それ自体のインパクトは小さくても、
そうやってインパクトの小さい案件を片っ端から捨てていったら何も残らなくなるのよね。
工業力のバロメータとしてスパコンを見たときの話をすると、
バロメータのだけ取り繕ってもなぁ、という話になりかねないが、
しかし、それでもスパコンでアメリカや中国と競争しないというのは、
どうなんだろうねぇ、と。
>>470 スパコンなんて計算の道具で最新でなくても
計算できればなんでもいいんだろ
ロケットみたいほんとの工業製品と
電子そろばんをごっちゃにするなよ
スパコンよりパソコンの敗退の方が重症だわな
パソコンで負けるからスパコンで負けるんだろ
>>472 古いコンピュータほど、使うのがアホらしいものは、ないぞ。
計算は遅い、メモリは少ない、電気代はかかる、保守にも金がかかる。
スパコンなんて使い捨て感覚で、どんどん新しいのを作って、古いのを捨てるべきだよ。
蓮舫の写真集を捨てられないタイプなんだろ。
↑古いアーキテクチャにこだわったプロジェクトの支持者が言うなよなw
大手メーカーはボッタクリだから、牧野先生に150億円渡して、GRAPE-DRで1PFのノードを16ノードくらい繋いだシステムを組んでもらったほうが安いよ
なんていう話にならなくて、本当によかったな。
もしそうしていたら、今ごろ・・・
同じ1000億かけるんなら、
クラウドタイプのデータセンターを構築
↓
SCORE使ってスカラーマシンを構築する。
↓
壊れた部材から新世代の物と取り替える
とかやった方が長期に渡って高性能を維持出来そう。
それでもスパコンとして能力が足りなくなったら仮想マシンを
切り売りするなり、小さな能力で足る研究にちょっとづつ
振り分けるなりして、、、
1000億で作ったPCベースのスカラーマシンがどのくらいの
実効演算性能を持つのか知らんけど。
>>476 GRAPE-DRに150億掛けてれば少なくとも今のような惨状にはならなかっただろう。
1000億以上も掛けてこんな状態じゃ京速も牧野を笑えんわな。
1000億円の京速と、
1000億円のGRAPEだったら、
GRAPEだろうな。
わざわざあまり売れてない富士通製でスカラマシンとか
何も新しくないしわけわからん。
ニワカは黙ってろ
京速=レンホー
とにかくレンホー叩けばよい
みたいに思ってる連中が一番キモイし、ニワカでしょw
レンホーも誰かのつくった資料ベースに言っているだけで、
レンホー自体がスパコンに詳しいわけもないのだがニワカの焦点はワケ分からん。
>>479 FがSPARCだけでなく、コンパイラ、ライブラリ、MPI、ストレージすべてダメダメなのは同意だが、
京よりもGRAPEなんていうのは、GRAPE関係者か、ハード屋の自己満足だろ。それこそ何に使うのかってもんだ。
しかもSPARC64VIIIfは京用に開発してても、富士通の自主開発で税金は入っていないはず。
開発費100%税金のとんでもスパコンはGRAPEのみw
483 :
えるえる:2010/10/12(火) 20:35:54 ID:cBMZQXih
そんな架空の話よりSPARC64の次回作が気になるな。
SIMDしか拡張できなかったから、VIIIのようなスタイルになったんでしょ?
本格的にOOOコアを弄りきる技術はないと思う。
ニッチジャンル向けの並列処理拡張でとりあえず逃げきったように見えるが、
今後もスカラ部分の拡張をしながらハイエンドプロセッサ市場を生き続けることができるのだろうか。
484 :
えるえる:2010/10/12(火) 20:37:01 ID:cBMZQXih
能澤たんの歴史本はおれ的に結構面白かったぜ。
>>482 俺もKよりGRAPEとは思わないが、計算科学としての要求だけを満たせればいいのなら
なんら革新性の無い国産機を1000億投入して自主開発する必要があるのかとは感じる。
トップレベルに近い性能は数百億でCray等から導入できるのだから、残りの数百億で
国産のGRAPE的(上手く行けば革新的な)プロジェクトにお金をかけるのもありでは?
計算科学を優先した保守的設計を続けていては輸入するより高い上に何ら見るべき
所のないスパコンを開発し続けることになる。これは結局計算科学にとっても毒。
旧来のソフトウェアに配慮しすぎてきたのが日本のスパコン没落の一因でもあると思う。
>>478 GRAPE-DRが予算が足りなくて失敗したとでも?
>>483 SPARC64VIIIfxは、CPUのSIMDを強化したというよりは、アクセラレータを強化してスカラCPUを付けたって感じかも。
>>485 スパコンは使う時代に入っているから、実用のためのスパコンのプロジェクトで、実験をしてくれるなということも・・・
>>486 >GRAPE-DRが予算が足りなくて失敗したとでも?
そうだと思うが?
綱渡りで奇跡的な安価を狙った、というよりそうせざるを得なかったのが
GRAPE-DR失敗の最大の要因だろう。15億でASICを起こして2PFの
システムまで完成させるなんて話がそもそもうますぎた。
>>488 それはそうなんだが、予算が十分にあれば成功したとも思えないんだが。
予算があっても、身内であるところのKFCRに仕事を回しただろうから。
そりゃ違う、
親マッキー → 子ピンハネKFCR → 本当にデキル孫受け
こういう構造に出来たはず
良くある話だろ、公共事業系で
KFCRに、下請けがコケたときに尻を拭く体力があるとは思えないんだが。
ITゼネコンってのは、ただ中抜きするブローカーなのではなく、本質的には保険屋だと思う。
ま、下請けがコケたときに尻拭きの手配もしないITゼネコンの人間もいるだろうがね。
>>492 ノード間バンド幅がナローバンドとブロードバンドくらい違うからだろ
TOFUではバンド幅あげたんだろ
>>495 Fはいつもそうやって開き直るよねw、HPL・メモリバンド幅は言うべくもなく、
1ノード1CPUの単純構造でしか性能を出せないという技術力なんだろ、しかし、高価格だけはきっちりキープ。
ヘタレナスは定期的にサボタージュしだすしさw
日本のメーカーが高いのは、込み込みの値段だからじゃね?
>>496 もっと未来を見たほうがいい
CPUがメニーコア化してスペックアップしていくことを想定すると
無駄に詰め込まないのは正しい選択
>>492 FX1ユーザにはバレバレで、体感値とぴったりだな。
>>497 Fの提供するBX900と比べてもFX1は高い。
>>498 1ノード1CPU、バケツリレーで23ノード介してやっと1通信なんてのが、未来を見据えた姿ね。
むしろ逆だろ、数万並列で少しでもMPIプロセスを減らして通信を抑える方向だろう。
>>499 それは近視眼的
スパコン分野では超伝導プロセッサが主流になるから自然な発想
>>500 何世代後の話だよw それまで放置って言うのであればもう笑うしかないな。
要するに世界一を目指せるような企業じゃないってことだ。
おつとめ、ご苦労様です。
>>484 なんか星野力を嫌ってるのを露骨に見え見えにしてるのはどうかと思った。
個々の機械の内部構成にまで踏み込んでるのは良いと思ったけど。
>>506 まず建物が無駄に高いし、構築にかける時間が長いから(相対的に)高くなるよね。
製造したプロセッサを、
すぐに使ったときのコストパフォーマンスが良くても、
それを何年も塩漬けしてから使えばコストパフォーマンスは悪くなる。
つーわけで、補正予算で少し前倒しとか生ぬるいこと言わず、
2012年度分の構築の予算を前借りしてでも、2011年度前半に完成させるべきだ。
>>507 それでトータルが安くできます
といってやればいいのにね
本当は5000億くらいぶち込んでファブから建てるのが一番コストパフォーマンスがいいけどな
現にATICはそうしているし
製造ラインを増設するのに100億とか言ってたんだから、外注しない限り、前倒しは無意味だろ。
それともこの100億も便乗請求か?
まあ完成時期を早めても、どうせコンパイラ、ミドルウェアが間に合いませんでしたって言い出すのがFクオリティ。
間に合う言って間に合わなかったら本来訴訟モノだが、
所詮国家プロジェクトの人たちが、国のカネにのために
面倒にも労力を使うわけもないので余裕で牛歩できるな。
http://4d2u.nao.ac.jp/t/index.php 10月23日(土)、「三鷹・星と宇宙の日」において、天文シミュレーション
プロジェクト内4D2Uプロジェクトは、理論研究部と合同で10時−17時まで、
ミニ講演会を行います。
2) 11:00 牧野 淳一郎「計算機を作るところからやる天文学」 ※整理券配布開始時刻 10:15
>>
天文台も悪いジョーダン言うなw
アホの素人が時間潰しに動かないのをつくるより
東工大のTSUBAMEと同じHP+nVIDIAを買った方が
はるかに安くて速くて信頼性が高い
>>515 GRAPE-DR失敗の煽りを、京速だけでなく、他でも受けてるところ、あるかもな。
518 :
不明なデバイスさん:2010/10/17(日) 10:01:20 ID:bNvxGwcH
>>515 で、アホじゃない玄人って日本のどこに隠れているんですか?
日本にはいないんじゃね?
>クラウド普及へ消防規制を緩和 総務省、コンテナ型検討
この許可まだ下りてなかったのか!? 動きオセー!!!
まじでスパコン特区とか必要なんじゃ無いかと、、、
気温も低いことだし夕張市辺りに誘致してみてはどうかな?
北海道にIT特区を作るべきですね
523 :
不明なデバイスさん:2010/10/18(月) 20:58:36 ID:0ffRqwcv
まさにスパコン。
スーパーコンプレックス。
GRAPE-DRとかいうゴミでいまだに遊んでるんだな
ゴミの予算ゼロにして、他のところに使えよ
15億も使って、40TFlops(笑)
fdさ
TSUBAME2.0は1PFとどかないそうだ
TOP500楽しみだ、Nebulaeの効率向上、Tianhe-1の改良、TSUBAME2.0
mole8.5を参考にすると
mole8.5 1ノード
2*E5520 2*IOH 6*C2050
Linpack GPU効率 CPU含む効率
1GPU 240GFlops 46% 41%
2GPU 440GFlops 43% 40%
3GPU 580GFlops 38% 36% ここがTSUBAME2.0とほぼ同じ構成
4GPU 700GFlops 34% 33%
5GPU 720GFlops 28% 27%
6GPU 750GFlops 24% 24%
QPIやPCIEがボトルネックになって性能上がりにくくなる
Sandy Bridge世代ならPCIE内蔵でQPIのボトルネックは無くなるが
天文台いってきたけど、
整理券大好評で配布終了orz
でも生マキーノ先生見れた
講演1分前に場外をぬら〜っと歩いてたw
誰か講演聞けた方、内容UP期待
>>538 > 普通のパソコンにつく PCIeボード
つかねーよ、そんな巨大なボードは。
> 400-433MHzクロック
なんだ、やっぱり500MHzでは動かないのか
> 820-887Gflops
当初の 8Tflops/カード の計画値から、ずいぶんと後退したもんだ。
> GRAPE-DRクラスタシステム
当初の19インチ・ラック8本から、随分と肥大化したもんだ。
> 128ノード、128ボード(105Tflops peak)
当初の256ボードで2Pflopsから随分と後退したもんだ。
> 専用計算機を作ると、同じコストで計算機を買ってくるのではできないことができる
なぜストレートに、買ってくるよりも安いと言わないんだ?
「できないこと」=専用計算機を作ること?
それにしてもGRAPE-DRのピーク2PFは、いつお披露目するんだろう。
Top500の上位は、すでにピーク2PFを越えちゃってるよ?
いいかげん粘着もうぜーよ。もう失敗した事はみんな分かってるから。
>>541 逆じゃねーの
マキノに
いいかげん粘着もうぜーよ。もう失敗した事はみんな分かってるから
ってことじゃねーの
まあ、あんだけ他のマシンをこき下ろしてたんだから
自分の総括もちゃんとやらないとねぇ。
545 :
>>536:2010/10/25(月) 22:58:30 ID:kdvaU4UP
>>538 ありがとうございます!
ひょっとして本人降臨ですか!
>>541 失敗したのにGRAPE-8とかいうのをまた作ろうとしてるわけだが
さすがに大失敗して汎用では無くしたらしいが。
まあやるんなら税金1円も使わないでね
税金を使ってやるのはいいけど、詐欺みたいな報告書を書くのはやめてくれ。
何がどのように失敗だったのか、ちゃんと公表した上で、
同じ失敗を繰り返さないようにするための対策を考え、
それが妥当か匿名のメーカーの技術者群のチェックを受けて、
また次に挑戦して欲しい。
本当はプロジェクト管理なんて学者にやらせるもんじゃないんだが、
プロジェクト管理を外部に頼むと、何もしないで金を取る連中の餌食
というか、そういうところに金を回すための建前に利用されちまうんだよな。
まぁ、
失敗した「方法」ではなく失敗した「人」を排除するってのは、いかにも日本らしい。
でも、それは野蛮で、進歩の遅い方法だよ。
ちなみに、とある補助金の場合・・・
審査に通って採択されると、期間中プロジェクトに100%専念できるくらいの金額が支給される。
ところが、採択された場合には、指定されたプロジェクト管理屋の管理を受けなければならず、
その費用は被支給者が出すことになっているため、支給された金額の大半が吸い上げられる。
・・・具体的にどこの何かは聞かないで欲しい。
>それが妥当か匿名のメーカーの技術者群のチェックを受けて
って・・・、スパコンは調達にしろ、の人かな。まあ調達にすることには同意なんだが、
Fみたいに、国内最高のスカラ機、でもLINPACK50%以下とか、
1B/Fの高メモリバンド幅、のはずが実行効率30%台みたいなのを、涼しい顔して納品するのも当然なしだよね。
あと、大学じゃいくら研究資金をとってきてもプロジェクトに100%専念できるなんてありえないから。
教授クラスのエフォート率は40%程度がMAX。
アホかよ。
チップは単精度1P、倍精度2P分焼けてるはずなんだよな。
チップが焼きあがったあたりからプロジェクトが空中分解。
経験のある人間を確保して専念させることができなかった。
ホストやFPGAの進化についての不確定要素を大きく抱えたままのプロジェクト敢行。
HDDとかフラッシュメモリって核爆発級の電磁嵐が起きたとき
どうなるの?世界中でそれがおきたとき、多くがロスとテクノロジーになっちゃうの?
どうもなりません。
電磁嵐でおかしくなるのはMOSとかDRAMとかです。
しかも一時的なフォールト。
>>551 > Fみたいに、国内最高のスカラ機、でもLINPACK50%以下とか、
> 1B/Fの高メモリバンド幅、のはずが実行効率30%台みたいなのを、涼しい顔して納品するのも当然なしだよね。
そういう例が"許される"のは、調達が少なすぎるから、なんだよね。
アメリカのように、複数社から十分な頻度で調達していれば、競争が発生して、変なのは淘汰される。
ま、日本にはそんな金はないし、日本のやり方だと仲良く同じ割合で調達し続けて競争もなにもないかもな。
>>558 出鱈目言うなよ
TSUBAMEはどうなのよ
32億とかだろ
買うほうがジャブジャブいくらでも金出すから悪いんだろ
小泉ー竹中じゃないけど、
市場を活性化するには市場開放だろ
>>559 TSUBAMEなんか知らん
しかし、どうせ、予算は一括で払うから、そっちで「遣り繰り」してくれ、なんていうスタイルだろう。
予算システム的に、そういうスタイルになっちゃうんだよ。
市場開放? 何が開放されていないと?
客が日本の大手メーカーから買いたがるだけでしょ。
なんたって、海外のメーカーにとっては扱いにくい客なんですよ、日本のユーザってのは。
保守メンテナンスのために、わざわざ日本支社作るような市場じゃないからだろ
これからはHPとかHPとかHPとかがどんどん受注してくとおも
開発w
巷は中華スパコンで盛り上がってますなw
このスレってGRAPEの手下ドモが粘着しちゃってて
未だに腐った葡萄を蒸し返してるんで
とても巷にはついていけまへんわw
コピペの担当はんはべつでっけど
> Tianheは200人の研究者が2年間にわたって開発し、コストは8800万ドル(約72億1千万円)。
うらやましいわ。
> Tianhe-1Aの処理速度は、LINPACKベンチマーク計測によると最高で2.507ペタフロップス
> Tianhe-1Aは、理論的には1秒間に最大1000兆回以上の計算(1ペタフロップス)を行うことができる。
> 実際Tianhe1-Aの最大パフォーマンスは1.206ペタフロップスに達し、LINPACKベンチマークによると0.563ペタフロップスの速度で稼働する。
わけわかめ
コストから見て10PFを300億コースだよね。
つまり1000億円あれば30PFいけるって、NEC撤退時に京ちゃん見直しで叫んでた人いるけど
本当なのか。
スパコン本体だけのコストなのか、建物などのコストも含むのか、実際には貢献していない寄生虫のコストも含むのか・・・
20MWくらいでいけそうじゃね
2.5PFで4MWなんだから30PFなら単純計算でも50MWいくでしょ
tsubame2.0かんざんで
Magni-Coursと組合せて10P狙うって話はどうなったんだっけ
>>580 1〜1.4PFで1MWってことだから、単純計算なら21〜30MWだね
583 :
不明なデバイスさん:2010/10/30(土) 13:31:08 ID:e7+r2Wxf
結局、飛騰は CPU じゃなくてインターコネクトのようだ。
中国のメディアは CPU とインターコネクトの違いも分からないのか?
このTianhe-1Aシステムは2.93GHzクロックのWestmereを14336個,NVIDIAのM2050を7168個となっており,
WestmereのデュアルソケットにM2050を1台という構成で,東工大のTSUBAE2.0に比べるとCPUリッチな構成です。
Westmereが70.32GFLops,M2050が515GFlopsですから,
全体ではピーク性能は約4.7PFlopsで,Linpack性能のピーク比は53.3%で従来よりも上がっています。
また,2010年10月28日のThe Registerはこの独自インタコネクトはArchと呼ばれ,ポートの双方向の合計バンド幅は160Gbit/sで,
総バンド幅は64Tb/s以上。スイッチのレーテンシは1.57usと報じています。
そして,Tianhe-1A全体では262TBのメインメモリと2PBのストレージを持ち,
計算ノード筐体112本,ストレージ筐体8本,インタコネクトスイッチ筐体6本,I/O筐体14本で構成され,
消費電力は4.4MWだそうです
それから,NVIDIAのプレスリリースではNVIDIAのGPUはTop3の内の2システムで使われていると述べられており,
東工大のTSUBAME2.0は天河,Jaguarに次いで3位になるようです。
TSUBAMEはロードランナー抜くから1ペタは超えたか
NVIDIAのベンチだと
X5550 *2 C2050 *2で640GFLOPS、効率57%だから
Tianheは良い線の実行効率いってるな
>>587 2010/6の時点で2位の、中国の
Nebulaeと、米国のJaguar、と今回のとの
3台で、TSUBAME2.0は、勘定に入っていないかも。
アゴラのセンセ方は相変わらずのにわか仕込みだな
研究所に設置する巨大スパコンばかり注目されるけど、艦船に積む小型スパコンって殆ど話が出ないね。
>>606 >
> ちなみに3位はPalystation3に用いられているCELLチップを使った
> 「Loadrunner」であった
やっちゃっているね。
システム名間違えちゃっているし(top500の3位なら"Roadrunner")
PS3と同じCELL方式(PPEとSPEのヘテロ構成)だけど、科学技術計算用に
倍精度演算を強化したPowerXCell8iを使っているので、
同じCELL(B.E.)を使ってはいない。
"IT"mediaなんだから、もう少ししっかりして欲しいな。
また、間違った知識を覚えちゃう人が増える
>>606 >>607 以外にもツッコミどころが満載だな。典型的な三流記事。
"ベクター型の方がスカラー型と比べて稼働率が高いとされている。"
"GRAPEプロジェクトで実績のある富士通が主契約者となった"
"理化学研究所は256台のGPUを並列に動作させることで、42テラフロップスの実効性能を達成した。"
「ベクタープロセッサ開発でインテルと提携」ってのも間違ってるよなあ
>伴大作
この人の過去の記事を読んでみても色々と酷い。
>>612 たしかに設置機関は重要でしたね。失礼しました。
こんな素人以下の文章書いて金貰ってんだよね
ITmediaの編集はチェックしないのかね
固有名詞の間違いとtypoは訂正されてるみたいだけど
>>615 今、確認したけど、RoadrunnerがLoadrunnerのままだったよ。
情報を売る職業として、最後に固有名詞と事実関係が、
自分の記憶と合っているかどうかチェックするのは最低限の
ルールだと思うんですよ。計算機に疎いのはしょうがないとしても。
SX脂肪だけは合ってんじゃないのw
>>608 >"ベクター型の方がスカラー型と比べて稼働率が高いとされている。"
について補足しておくと、これは実行効率の間違いだろう。
情報通信分野のジャーナリストを名乗るのは恥ずかしいレベルかと。
>>618 地球シミュレータのSXは、ほとんど壊れない、使えなくなる事は無いのかと
思いましたよ。
建物全体にダンパーを用意して振動を抑えたり、アルミで建物全体を
囲って、電磁波対策して、年に45億円の保守費を払っている豪華なシステムだから。
情報通信分野のジャーナリストなら、現代のスパコンの方式の話で、
安易に、ベクトル型とスカラー型という言葉を使う事じたい、問題だと思うべき。
能澤はスパコン自体が否定されるのは気に入らないわけか
なんか面倒くせえポジションにいるんだな
ただのIBMのセールスマンだからな
>彼の一連の誤解は、自分の屁理屈に合わせるための創作/捏造の類
www
自己紹介乙って感じだな
>>622 事業仕分けであれだけ痛い目に遭っていながらいまだにコスト意識が変わってないんだな。
>>627 事業仕分けでは、メディアを煽って、ノーベル賞受賞科学者を担ぎ出して、
仕分けの判断を、政治的にひっくり返しているから理研からすると
「勝った」わけで反省するわけ無いかと思います。
「1位を取るための前倒しのための40億円」がカットされたという事で、1位が取れない
言い訳も出来ましたし。
631 :
620:2010/11/10(水) 01:49:54 ID:DNgrmhSG
>>628 >>620 は今回の記事の技術的なことではなくて、過去の記事のことね。
能澤の記事はクオリティーの落差が激しくて、まさに彼の言う
"自分の屁理屈に合わせるための創作/捏造の類" としか思えないもの
があるという話。
>>631 基本的に記事はその内容で評価すべきだと思います。
>>606 の記事は、初歩的な間違えをしながら、「NECの事情」とかいって、
内情に詳しいような文章を書いているので、我田引水とか
以前の問題だと思います。
また、そんな記事が、ITmediaのアクセストップになっちゃっているし。
2chでスパコンの話をすると
「PS3のCELLを使って、米国が作ったスパコンがロードランナー」
とか言う書き込みする人がまた増えそうで嫌だなぁ。
>>632 >基本的に記事はその内容で評価すべきだと思います。
には同意。
>>620 には、その記事についての評価は書いていないつもり。
>>628 自分は620じゃないけど、能澤の記事については中国をみくびった、
調査不十分な記事に見える。
まず、計算機開発に関して。
Tianhe-1AにはNUDTが作った「飛騰」プロセッサ2048個も載っている。
アーキテクチャは日本、インドと同じくSPARC。
ネットワーク用LSIも2種類作っている。
買ってきて安いというだけのものではなく、別途開発費をかけている。
彼らの自主独立の気概には敬意を表するべきだと思う。
次に、計算力の保持に関して。
TSUBAMEはGPGPUを本格的に試すという意味では野心的だけど、
PCクラスタ部分は200テラだから、実用的な計算力としては普通。
利用者も一般大学の学生、研究者。
それに対してTianhe-1AはPCクラスタで1ペタあるから、
「他では解けない計算」が行われる可能性がある。
特に「国防科学技術大学」がそれを保持している意味は大きい。
一般大学と異なり、軍事目的で使用され、その成果が外部に
発表されない可能性が高いからだ。
まだ大騒ぎするほどの脅威にまでは育っていないが、
超大国の米国から見ても警戒が必要だろう。
1位とか2位とかいう問題じゃない。
>>631 具体的に能澤さんのどの記事が落差が激しいの?
次世代は失敗するとか、GRAPE-DRはハチャメチャとか、
日本のスパコン調達はデタラメとか、
去年の仕分けのことなど
みんな反発したけど、結局、今頃になって、
能澤さんの言ってたとおりだって事が
わかってきたんじゃねーの
俺達がアホで遅れてたってことだろ
ついでに補足すると、米国のスパコンでもっとも有望なのは
Blue WatersでもGPGPUでもなくてBlue Gene/Qだ。
その用途は核実験のシミュレーションな。
自分は過去の核実験データとシミュレーション技術を保持しつつ、
他国の核実験に圧力をかけるのが米国の外交戦略。
それが、中国も米国と同じ戦略を取れるようになったら、
中国の国際的な発言力は飛躍的に高まるだろう。
中国はそこまで賢くないだろうと見くびっていると、
後悔する羽目になると思うね。
638 :
不明なデバイスさん:2010/11/10(水) 08:15:40 ID:kBF6f4/F
>>635 > Tianhe-1AにはNUDTが作った「飛騰」プロセッサ2048個も載っている。
> アーキテクチャは日本、インドと同じくSPARC。
これソースはありますか?
>>636 そんなこと言ったら伴の記事だって、SXは死に筋だとか
スカラ使いこなすにはソフトウェア開発にも投資が必要だとか
正しい部分も含まれてるだろ
結論がたまたま正しくても、その論拠はメチャクチャだって話
641 :
不明なデバイスさん:2010/11/10(水) 08:50:40 ID:kBF6f4/F
>>635 Tianhe-1Aに関しては、独自開発はインターコネクト部という情報もありましたので、
top500のリストに載るのを待って確認したいと思います。
で、当該記事に関してですが、事実を間違えていなければ、
記事で個人的な見立てを書くのはその人の主張だから良いと思うのです。
中国に対しての「普通の分析」として、
> ・日本は単発であったが、中国は長期的戦略で段階的に多くのスパコンを
> 作ってきており、ゆくゆくは独自CPUを組み込んでくるから、長期的には脅威になる。
> ・こうした意味で米国が保持しているHPCでの優位性はリスクに面しており、
> 米国の将来の経済基盤に打撃を与えるかもしれない。
と、「普通の観点」での危機感をちゃんと説明しているし、
Tianhe-1AとTSUBAMEの比較も、
> 幸いな事に、日本に於いても、中国のTianhe-1Aと殆ど同じシステムが
> この11月から東工大で稼働しており、規模は1/2ほどであるが、
> 様々なデータが蓄積されていると思うので、
> 日本のスパコン戦略見直しの参考になるものと思う。
という記述なので、計算力を保持できているという内容ではないと思います。
TSUBAMEがあるから良いという主張ではなく(規模は1/2と説明している)
TSUBAMEで色々調べて、Tianhe-1Aを追いかけろという主張に読み取れます。
>>641 Galaxy FT-1000というのが通信用のチップですかね。
面白いのは、CPUとGPUが別シャーシでGPU用のシャーシが
中身に余裕がある事。
nVIDIAは、消費電力当たりの性能を、Fermiの次(Kepler)、さらに次(Maxwell)で向上
させる予定なので、このシャーシの余裕なら現在、2枚のボードを、
4枚まで増やしたものと、そのうち入れ替える予定なのかも。
644 :
不明なデバイスさん:2010/11/10(水) 09:41:02 ID:FdHIG2om
実行効率で負けそうなtsubameちゃん
ところでgrapeちゃんの方はLittle greenを卒業出来そうなの???
>>640 伴某や池田信夫さんと能澤さんを一緒にしたら、彼が可哀想
伴某は論外で、これはこれを載せるITMEDIAのデタラメさの問題だな
能澤さんの過去ログを読み直しているんだけど
池田さんとの関係は不明 というより何も見当たらない
池田さんはブログやTwitterで能澤さんを引用しているんだが
俺の印象では 池田さんが一方的に能澤さんを引用してるだけみたいだな
で
>結論がたまたま正しくても、その論拠はメチャクチャだって話
て言うメチャクチャな論拠てのを具体的に教えてよ
近頃読み返してるんだけど、俺は説得されちゃってんだけど
というより今の日本のスパコンの体たらく見てるからかも知れないが
近親憎悪だなw
>>645 TFLOPS価格で無理やり整理し、それからずれると内外格差にこじつける点は典型的じゃない。
例えばT2Kで、TFLOPS価格を見れば、筑波が安いが、3段のFat-treeと
フルバイセクションバンド幅が確保されている東大・京大とじゃ格差が生じて当たり前。
しかし彼に言わせると国内メーカーががめてることになるらしい。
>>647 ちょっと待ってくれよ
質問 T2Kって共通仕様なんだろ、でフルバイセクションは共通仕様なの?
おかしいんじゃないの?
余計なのくっつけて高くしてるわけ?
まあともかく、「T2K スパコン」で検索し探し出した能澤氏の記事に因れば
http://blog.livedoor.jp/petaflops/archives/51404790.html 東大京大のTTFLOPS単価が5000万前後で、筑波が2200万てのは
いくらなんでも東大京大は高すぎるだろう。
この差がインターコネクトの値段の差だッて強弁するわけ?
なんとなく笑っちゃうし、根拠薄弱だな
インターコネクトの値段調べてきて教えてよ
それでハッキリすれば、信じるよ
だけどこれって単に売れないT2Kの開発費の差だけなんじゃないの
T2Kって他に売れたんだっけ?
各1大学1社の特注じゃ高いの無理ないよな
3大学1社なら意味あったろうけと
バラバラじゃ安くなんかならないんじゃないの
まあ折角だけど全然説得力無いよ
他に論拠の無い事を示す有力な論拠は無いの?
>>648 T2Kがいつから、すべてに対し共通仕様になったんだw
人に聞く前に調べればわかるはず。
まあそんなんだから能澤の意見がすべてまっとうだって思うだろうなw
能澤に'氏'とか"さん"付けてる時点でお察し
>>647 >>648で紹介されている記事を読むと、
「単純化」した比較である事を明記してありますし、メーカーががめているとも書いていません。
T2Kプロジェクトが何故必要だったかの下りで出てくる「技術ゴロ」どうこうは、T2Kで回避したかった部分の類推で、国産のT2Kスパコンが高い理由ではないですよ。
文章的には。
勘違いしていませんか?
>>652 別に勘違いしてないが。単純化して、米国が1000万で、輸入すると2000万になり、国産メーカがつくると5000万前後
ってなったら、通常の思考じゃ、オレ様定義の単純化が間違っていて、その他の要因を考えるだろ。
>>650 http://blog.livedoor.jp/petaflops/archives/cat_50044713.html 話がループしてない?
遥か昔に破局を予見していた事が今考えて凄いなって言ってるんだが
そりゃ、GRAPEちゃんが必死になって悪口いたいのはわかるけど
でも結局口先だけで、結果で負けたんだからねー
今ごろ自爆した口先GRAPEちゃんのを持ってこられてもねー
同じような事が次世代にも、地球シミュやべクタにも言えるんだが
他に論拠の無いことを示す有力な論拠は無いの?
>>645 >>653 話の本筋が読めないみたいね
東大京大はフルバイセクションのため高くなったの?
それともそんなゴミより開発費じゃないの?って言ってるんだが
だから、話を明確にするため
Fat tree フルバイセクションのコストを示してよって言ってるんだが
何か話題をそらそうと必死みたいね
>>654 あんたは、本質どころかT2Kの仕様さえ理解できないだろw
少しは調べてからいえよw
>>653 >>647 では、
> しかし彼に言わせると国内メーカーががめてることになるらしい。
と書いているが、記事中にそのような記載は無いし、全体としては、
従来のクローズな調達より、オープンなT2Kの調達を評価している記事なのだけど、
そこらへんを勘違いしているのではないか?ということです。
>>656 えっ?、TFLOPS価格の評価が妥当であると判断しているなら、
米国の5倍以上の金額の差額はどこに行ったの?メーカ側に入っている、と判断するのが妥当じゃないの。
クローズな調達って言うけど、阪大の部分段階調達さえも理解できずに不透明な入札だ、ってさわいでるようじゃね。
>>657 マッシブパラレルなスパコンは、スタートの時点で国家プロジェクトの恩恵を
得られた米国と、大型プロジェクトにホルホルしていて、その成果が
メーカーには殆ど恩恵の無い日本で、差が開いてしまっていたし、
日本のコンピューターメーカーの高コスト体質(正確にはユーザーも含めてなんだけど)
もある。
スパコンビジネスは、日本のコンピューターメーカーの商売として、
割の悪いビジネスというのが、常識だと思うし、能澤氏もそのぐらいの常識はあるでしょう。
>>655 一生懸命話題をそらして逃げ回るだけって事が
結局アンタの言ってる事に論拠は無いってことを
証明してるんだろうな
他に論拠の無いことを示す論拠って無いのかなー
>>658 だから、それはTFLOPS価格が、ほぼ同じスペックの価格だと考えての判断だろ。
それがそもそも違うって言ってるんだよ。
>>654見ると何言っても無駄そうだね
おめでとう 君の勝ちだよ
>>661 そうか、よかったなw 同じものを5倍の価格で買ってるなんて思ってるなら、
会計検査院に告発したらどうだw
国内のスパコン調達価格が高すぎるっていうのはみんな同じ意見かと思っていたんだが。
能澤の言うことなら何でも間違ってるってわけじゃないだろ。
日本のアメリカに次ぐ規模のスパコン投資額とTop500での現状の隔たりをどう説明するの?
"自分の屁理屈に合わせるための創作/捏造の類"
能澤のダメな所って結局これに尽きると思うんだけどね。自分限定の仮定(創作/捏造)の話を
膨らませて批判を展開するんだけどそもそもの仮定が手前勝手で妥当性が全く無いんだよね。
ひとつだけ具体例を上げておくと
http://blog.livedoor.jp/petaflops/archives/51404393.html SPARC64で10PFLOPSを実現するには5120ラック必要となり「不経済を通り越し設置不可能」と
結論づけ10PFLOPSの達成は現実味がないかのように印象づけているが、実装密度の低い
大規模SMP機のままで10PFLOPSという自分の主張に有利な形の仮定を設定した結果
ありえない結論が導かれているとは思わなかったらしい。
664 :
訂正:2010/11/10(水) 23:03:40 ID:lyo2TTEK
×10PFLOPSという自分の主張に
○10PFLOPSを目指すという自分の主張に
>>663 この記事は、内容から見るとSPARC64Yまでしか発表されていない頃で、
> 勿論、FPUアクセラレータをSPARCに組み込む方法も考えられるが、
> 今までのところ、この手の方式で成功した例は聞いたことがない。
という事で、SPARC64のままでは無茶で、FPUの高速化が必要という
ところまでは指摘しているので、まぁまぁな内容じゃないですか。
SPARC64[fxのキモは、倍精度のデータを8個同時に演算できるSIMD部
ですよね。
>>663 この記事のタイトルを読むと、
「次世代スパコンは2010年に10PFを達成できるか?」
なので、2010年には実現できていない(現在の完成予定は2012年、仕分けで減った
投資がもし出来たとしても数ヶ月の前倒し)
事は、当てていますね。
SPARC64[fxのような、科学技術演算に特化したSPARC64が開発される事は、
予見できていませんが、まぁ当然でしょうね。
マッシブパラレルの良い所は、市販されている汎用のCPUを使って安く仕上げる
事なので、ほぼ専用に科学技術演算に特化したCPUを開発するようでは、
その「良いところ」を潰すようなものですから。
ここでの「2010年」ってのは「計画通りに」って意味でしかないでしょ
あと、科学演算に特化したってただのSIMD拡張じゃないの
つか、そもそも2010年に10Pなんて誰も言ってなかったと思うけどなあ
本人はバレてないと思ってるのかもしれないけど、
本人乙>能ザワ
>>666,667
「この手の方式で成功した例は聞いたことがない。」とか
「その意味ではLANLのRoadrunnner1.6PFの結果が興味深い」とか言っているので
たぶん既存のコアにSIMDユニットを組み込むのではなくヘテロジニアスな構成を
想定していたんじゃない?実際にはもっと穏当な拡張で周波数あたりの性能は
POWER7と同レベルだし科学技術演算に特化したとは言えないと思うけどね。
むしろPOWERと違ってどうせメインの用途は京速なんだからもっとやって良かったはず。
>>669 最初の頃は確か2010年度にLinpackで10PFLOPSとか言ってた記憶がある。
>>663 663自身が"自分の屁理屈に合わせるための創作/捏造の類"なんじゃないのw
今のSPARC64-[fxでも800台超とかで納入に2年とか掛かるとか言ってんだろ
何年も前に台数問題を指摘出来たのは彼だけじゃない
東大京大のT2Kが高いって話にしろ
彼の言ってることはどれも当たり前な事なんだよな
それを何で一生懸命反対したいのかがわからないってこと
彼は国立大学や理研を含む国立研究機関などの
調達のまずさを非難しているようなので
これらの利害関係者達が意図的に潰しにかかっているって事なのかな
>>671 2010年度までに開発を終えて2011年度に10Pじゃなかったっけ?
まあ、どうでもいいけど
>>668 SPARC64Zは、2.5GHz動作で、4コア、4コアが共有するL2キャッシュは6MB。
SPARC64[fxは、2GHz動作で、8コア、8コアが共有するL2キャッシュは5MB。
という事で、コア数が2倍になっているのに、L2キャッシュの容量は小さく
なっているというのが、汎用的に1コアの性能向上は期待出来ないと思われる
顕著な部分です。
大規模な科学技術計算はキャッシュに当たらないので、科学技術計算では、
L2キャッシュが小さい事は、大きなマイナスにはならないのですが、
いわゆる整数演算ではキャッシュの容量が小さいのはマイナスです。
1コア当たり、前の世代のプロセッサの半分以下のキャッシュ容量にするというのは、
汎用のCPUとしては順当で無いですし、商品戦略としてもやりづらいものになっています。
(使い方によっては、新しいCPUの方が性能が低下してしまうというのは商品として難しい)
動作クロックが下がっているのも、SIMD命令のために下がっているのでしょう。
現行のXeon X7560は、2.26GHz動作で、8コアで24MBのL3キャッシュを搭載しています。
>>672 まあ台数多すぎってのは正しいね
でも800台超?でそれなりに性能だせたら予想は外れたってことかな
確か256台でも多すぎで性能出せないだろうって主張だったから
T2Kの話には特に反論ないや
>>671 >
>>666,667
> たぶん既存のコアにSIMDユニットを組み込むのではなくヘテロジニアスな構成を
> 想定していたんじゃない?
だと思います。
> POWER7と同レベルだし科学技術演算に特化したとは言えないと思うけどね。
POWER7の技術的特長の一つに、eDRAMを使って小さい大サイズに32MBのL3
キャッシュ(コアで共有するキャッシュ)を搭載した事が上げられます。
当然ですが、性能を維持するためにこれだけの容量のキャッシュが
必要という判断があって、容量は決められています。
SPARC64[fxの5MBのL2キャッシュ(コアで共有するキャッシュ)というのは、
コア性能がPOWER7の2分の1としても異色の小ささです。
また、これは手際の良さの違いかもしれませんが、POWER7を搭載した
汎用のサーバをIBMは既に出荷しており、富士通はSPARC64[fxを搭載した
汎用のサーバは、今のところ出荷していません。
>>675 キャッシュ容量のバランスの話だとか電力当たりの性能を意識した動作周波数抑制だとか
VIIIfxがスパコン専用になっちゃったってことに異論はないけど
>>666の「一番のキモ」ってのはただのSIMD拡張であって
>>671の言う通りPOWER7でも導入されてるし、IntelもAVXで載せてくるし
いまや一般的な機能だと思うよ
>>673 事業仕分けの大事な部分が抜けていますね。
あの仕分けで出された予算要求は、予定より増額されたものである事。
増額の理由として、40億円で富士通の生産ラインを強化し、生産を加速させれば、
top500で1位が取れるというものでした。
そのため、予算要求の正当性を主張するためには、1位に拘らなければならなかった。
あと、二つ目の地球シミュレーターとTSUBAME等の比較は乱暴すぎるかな。
>>678 SIMD拡張が、特別な技術ではなくても、あのチップにとっては「一番のキモ」
という事で、ご理解いただければと思います。
>>677 でも京速にかかわらずSPARC64ってVI以降世代が進むごとにキャッシュが小さくなってんだよね。
細かい話だけどなんかSPARC64VIIIfxのキャッシュサイズは6MBになってるみたいよ。
ああ、FPU強化の話とスパコン特化の話は独立してんのか
すまん、日本語苦手で
>>680 > 細かい話だけどなんかSPARC64VIIIfxのキャッシュサイズは6MBになってるみたいよ。
失礼しました。
一応、ググッって出てきたプレゼン資料みたいなので確認したのですが。
Roadrunnerの名前を確認しないでLoadrunnerとか書いちゃうような事が無いように。
L2$は5MBで合ってると思うけど
で、話を戻すと
- ラックあたりのCPU数を大規模SMPマシンのものを採用
→実際はもう少し増やしてくることは十分予想可能
- コアあたりのFLOPSはSPARC64VI相当の値を採用
→FPU拡張の可能性に自ら触れながら過去に例がないと却下
と、自分の主張に有利な値を採用して計算した結果のみを示し
批判の対象をこき下ろすという手法を問題視してるのよ
>>686 >>663の記事を読んで話をすると、
2007/9/13に2010年には京速スパコンは10Pflopsを出せるかどうか疑問
という記事であり、実際に現在の計画は2012年になっており、
2010年には達成出来ない予定という事で、記事の主旨は妥当。
富士通がJAXAに出荷したSPARC64Z(この記事の時点では発表されていないのかな?)
を使ったFX1というスパコンでは、大雑把に言って1ラック1Tflops。
1ラック当たりの性能が2倍になると計算して、5000ラックなので、
2007年の時点で、汎用CPUとしてSPARC[が開発されるという前提で計算すれば、
こんなものでしょう。
関係者を馬鹿にしたような表現方法はいかがなものかと思いますけど、
フリーの売文屋さんとしては、刺激的な表現をしないとやっていけないのでしょう。
「専門化が発表しているんだから、ちゃんと策があっての事なんだよ。
素人は黙っていろ!」
とか考えるのはジャーナリズムの否定なので、
記者さんが勉強して書くのはいい事じゃないですか。
>>686 >批判の対象をこき下ろすという手法を問題視してるのよ
というのは仕分けられる側の利害関係者の見当違いな反発だろうな
T2Kの記事などから彼が言ってるのは税金の有効活用・無駄排除の事だろ
彼は、次世代スパコンはテクノロジミスマッチで目標達成には無茶が必須なので
無駄で膨大な税金が掛かってしまうと
警告を国民に向かって発したんだろうな
一般人目線では警告なんだが、利害関係者にとっては
俺達をこき下ろす批判って感じるわけだ
ごり押しの結果はベクタは自滅、スカラは2012年に延びて
後の運用費も膨大なお荷物ってわけだ
彼の警告は正解だったんじゃないの
参照記事
次世代スパコンは2010年に10PFを達成できるのか?
http://blog.livedoor.jp/petaflops/archives/51404393.html
>>688 その主旨は45nmを使っても2PFLOPSまでしか達成できないというのが根拠になっている
のでたまたまその部分が当たっていても論拠に妥当性がない。
能澤は一般紙の記者とは違って一応一端の専門家でSIMD等の方策を考えつかなかった
わけがないのに都合よくあえて可能性を排除していたとしか思えないんだけどなぁ。
Sequoiaの20PFLOPS等は無批判に肯定するにもかかわらず。
692 :
688:2010/11/11(木) 21:44:10 ID:ss6mkOfS
>>691さんは能澤氏の能力について「SIMD等の方策を考えつかなかったわけがない」
と高く評価されているようですけど、
私は計算機に関しては、詳しくは無くても常識的な事は知っているつもりですけど、
能澤氏について、たぶん名前を見た事あるのだろうけど、基本的には知らない人物
なので、能澤氏を高く評価し、良く知っているらしい
>>691さんが氏の能力について
言われる事には、なかなか反論出来ません。
>>688 素人は黙っていろなんて言うつもりはないよ
俺だって素人だし
でも、ラックあたりのCPU数増やすとかSIMD導入するとか
素人の俺でも思いつくような方策すら想定に入れないなんて
故意でないなら問題外だし、故意だとしたら悪意があるとしか
考えられない
技術的な正当性は半ば置き去りで、自分に有利な数字だけを
取り上げるような形で自論を展開するような人の意見なんて
信に足るとはとても思えない
まあ、2010年にfxの付かないSPARC64VIIIで3Pのシステム作ってたら
世界一狙えたわけか
で、2年後にプロセス1世代進めてコア数を倍にすれば
10Pまでは行かずとも6Pにはなったわけか
確かに京速は筋悪いやw
>>693 2007/9というと、top500のリストではまだ、OpteronとBlueGeneが争っていて、
x87命令を速いFPUで実行する事が、Opteronの「スカラー型スパコン」
としての売りだった頃です。
http://www.top500.org/list/2007/06/100 倍精度のSSEは、単精度に比べてあまり力が入れられていなかった頃で、
Corei7の出荷は1年以上先だし、動くNehalemが発表されたのは、2007/9/19で、
この記事が書かれた後です。
システムとして2010年完成という事は、2010年頭には出荷が始まるような技術で
なければならなくて、記事を書いたタイミングから、2年後+3、4ヶ月です。
SPARC64ZがHotCHipsで発表されたのは、この記事の約1年後の2008/8月。
2007/9時点の素人が、マルチメディア拡張としてのSIMDではなく、
科学技術計算を狙ったSIMD拡張で2009年中には完成されたSPARCチップが
出てくると予想するものでしょうか?
>>622 なんか近鉄が書いたんじゃねえのというレベルだw
>>694 ベクトル型、スカラー型、アクセラレータ型の複合システムとか言わずに、
開発当初からスカラー型で一本で始めていれば、
世界一を獲得できたかもしれないですね。
>>691 >Sequoiaの20PFLOPS等は無批判に肯定するにもかかわらず
691は時間の観念が無いんじゃないの、調べてみた結果だ
Blue Gene/P 2007年6月発表 (最大2Pflops?)
参照記事 2007年9月
Blue Gene/Q 2009年2月発表 Sequoia 2011年納入予定
だから参照記事のときに「Sequoiaの20PFLOPS等は無批判に肯定」することなど
ありえないよな
691は「Loadrunner」やってんじゃないのw
>SIMD等の方策を考えつかなかったわけがないのに
691のSIMDが何を指してるのか不明なんだが、
当時SIMDって言うのはベクタ機のことかな
AVXはこれからだし、nVIDIAのGPGPUも最近だろ、
Clear Speedは今一だったな
で691は能澤氏に何を期待してたんだかわからないんだが
彼は所詮は評論家なんだから期待してもねー
>>695 この頃は64bit modeだしx87じゃなくてmulsd/addsdがコンパイラベースで当たり前に使われてた。
k8ではmulpd/addpdにしてもスループットは変わらなかった。
P4ではpd系命令を使わなかったら性能が半分になった。
その後core2/WoodcrestでSSEがフルスループットになった。
また、バンド幅単価という意味でもk8/Woodcrest/Nehalemのインパクトは大きかった。
スカラかベクタかって議論をするには用語の定義ができてないと議論にならないし、
その定義を争うことにはさして意味が無い。
とはいえ、ベクタといえばCray-1からSX-9までのアーキテクチャ(含むメモリアーキテクチャ)
だろうし、あえて名前をつけるなら古典ベクタとでもいうところ。
スカラはというと、SIMD拡張があろうともいわゆるマイクロプロセッサの系列はスカラ。
Short vectorとかいうこともあるけど、BG/LにもSIMD拡張はあったよ。
用語のイメージにとらわれてあれはスカラあれはベクタという言い争いは不毛。
>>695 当時から科学技術系のアプリでもSSEは使われていたし、SIMDってそんな目新しい
技術じゃないと思うんだけど。
>>698 >だから参照記事のときに「Sequoiaの20PFLOPS等は無批判に肯定」することなどありえないよな
別に記事を書いた当時に肯定していたと書いたつもりはないんだけど。
>691のSIMDが何を指してるのか不明なんだが、当時SIMDって言うのはベクタ機のことかな
>AVXはこれからだし、nVIDIAのGPGPUも最近だろ、
誰でも使えるパソコンにすらSIMDがあったと思うんだけど。SSE。
>>701 SIMDって、ひとつの演算器に長いデータを渡してもいいし(cray-1/k8)、
もちろん単純な制御回路で沢山の演算器を使うためにも使われる(GPUは両方してる)。
命令セットのアーキテクチャであってそれで計算機の分類が決まるというものじゃないと思う
(いちおう語源は偉い先生の並列計算機の分類)。
>>702 ああごめん、そういうつもりで書いたんじゃないんだ。
「SIMDが使われていた」とでも読み替えてくれ。
704 :
695:2010/11/12(金) 00:20:09 ID:RqwQp+68
>>699 失礼。x87系というのは間違えでした。
Opteronのスパコンが注目を集め始めていた頃は、SSEは、まだマルチメディア
用の命令(精度は低くても沢山実行)で、科学技術計算には、
FPUを使った演算を使うものだったという認識です。
>>695 何かで読んだんだよなあと思ったら、マッキーのとこだった
2007/8/6に富士通の人がSIMD拡張スカラプロセッサの発表をやった
と紹介されてて、富士通もAltiVecみたいなことやってくんのね
って思ったことを覚えている
まあ、実際にはこの発表はVIIIfxのSIMD拡張とは違う話だったみたいだけど
素人でもそのくらいの妄想は十分可能だったよ
>>704 x86_64からはSSE/SSE2 scalarがdefaultになったの。
SSE/SSE2は単なるSIMD拡張だけでなく、x87からの単精度/倍精度浮動小数点命令の
移行をはかったものでもあって、これによってIEEE754に準拠したものにもなった。
AMDに追認されてしまったかたちにはなるけど。
MMXのイメージを引きずった感はあるよね。
あと、FPUは一般名詞だから、x87といった方が無難だと思う。
>>707 なるほど。この論文を知っていればSPARC64のSIMD拡張の可能性に
気がついていそうなもんだと思うのはわかります。
でも、話題としている記事が書かれる1ヶ月と13日ほど前の提案レベルの
論文を知っている素人って、素人なんでしょうかね。
>>700 計算機アーキテクチャはどんどん革新されるから、
古いアーキテクチャの分類はどんどん使えなくなってしまうね。
いわゆる「ベクトル計算機」が喧伝されたころは、そもそも
浮動小数点演算は「汎用スカラプロセッサ」でなく
「専用コプロセッサ」で行うものだった。
だから、1回の起動で演算器が何回も動いてくれる
「ベクトル・コプロセッサ」は重宝された。
これが30年前。
でも、マイクロプロセッサがRISC化されて処理効率が上がり、
超高級計算機にしかなかったスーパースカラ機構による
1サイクル複数命令処理を実現するに至り、ベクトル計算機の
時代は終わった。
レジスタが1要素でも、浮動小数点命令と整数命令が同時に
実行できるし、複数の浮動小数点命令実行さえ可能だ。
この時点で20年前。
この頃、日本はベクトルプロセッサの拡張に血道を上げていた。
レジスタサイズも演算器パイプラインもどんどん拡張され、
64要素レジスタ、4パイプラインまで発展した。
しかし、スーパースカラにも限界があることが認識された。
どうも実際のプログラムでは、1つの命令列から同時実行
できるのは、せいぜい1サイクルあたり2命令程度らしい。
これがいわゆる「ILP Wall」(命令並列性の壁)だ。
この時点で10年前。
現在では、ILP Wallを乗り越えるために2つの方法がとられている。
一つはマルチコア、もう一つはSIMD命令拡張だ。
マルチコアは言うまでもないが、SIMD命令はレジスタサイズを
複数要素に拡張するものだ。これはベクトルプロセッサの復古とも
言われる。ただし違いはある。現代のプロセッサではSIMD命令
レジスタの要素数は基本的に、演算器パイプラインの数に等しい。
(Pentium4のSSE2実装のような例外はある)
さて、10年後の計算機を考えたときに、ボトルネックは何で、
どうやって解決するのが正解か、自信を持って主張できる人は
いるかな?
ちなみに詳しくは書かないが、現在専門家の間で最重要課題と
考えられているのは「Power Wall」だ。
みんな、よく考えてくれたまえ。
後藤の記事を丸写しにしたようなレスだねw
>>712 ハーバード白熱教室風の語り口にしようと思って
ノリノリで書いたんだが、読み返して見ると確かに
後藤さん節だね、これは(笑)
こりゃ一本取られた。
>>710 使えるゲート数が少ない頃の知恵というのは、それなりに本質を突いている
部分があって、CPU+GPUがワンチップ化されると、GPUがベクトル演算ユニット
とも考えられるわけです。
10年後の計算機を考えた時のネックはニーズの壁ですね。
最近、一般的なPCのユーザーは壊れでもしないと買いかえなくなってきている
ようで、なぜかと言えば、古いPCで十分、用が足りているから。
現在のプロセス技術のリーダーが、Intel VS AMDであり、この両者がとんでもない
金額の投資が出来るのはそれが世界中に個人に1個レベルで売れると思っているから。
スーパーコンピューティングのニーズじたいは、まだまだあると思いますが、
民生品での技術革新が減速すれば、スーパーコンピューティングのための
要素技術も減速する。
アポロが月に到着した後、人類はどんどん宇宙へ出て行く時代になるのかと夢想
されたけど、そこに立ちふさがったのはニーズの壁。
宇宙に行ってどんだけ儲かるの?という壁。
スパコンで飯食ってるわけじゃないし、専門の教育受けてもいないし素人でしょ
スパコン(というかCPU)のことに興味を持っていて
マッキーのとことかたるさんのとことか覗いてるレベル
まあ俺のことなんてどうでもいいな
demand wall か
省電力、多コア、高クロックというような要素の内
一般消費者向けのPCでも省電力化はいつまでも進むだろうから
HPC的にはそれを束ねてうまいことすることを考えればいいんじゃないかな
来年度からスパコン使って研究やるんだが、
今は電電だからスパコンの中身とかは全然分からない
誰か、スパコンについて詳しく載ってる良書教えてもらえませんか?
スパコン使って研究
ってスパコンを作る研究?スパコンに計算やらせる研究?
>>701 >誰でも使えるパソコンにすらSIMDがあったと思うんだけど。SSE。
704で指摘があるようにPC用CPUの中にある技術計算用倍精度FPUとマルチメディア用単精度SSEを
ごっちゃにしてSIMDっていってるのか!
だから単純にFPUの拡張で済むものをSIMDの拡張とかいってるんだな
疲れるなー、ここの前提は倍精度FPUのスパコンの話なんだがね・・・
しかも701が思ってる妄想拡張SSEをもとにした予測性能で計算をしていないから
能澤氏は論拠の無い自分に都合のいい仮定でだけで言っているって主張してるわけだ
うーん 余りにも基本的な誤解と身勝手で根拠の無い妄想の押し付けなんで
疲れちゃってまともな議論は出来ないんじゃないのw
ところでSPARCってSSEみたいのもってんの?そんな話聞いた事が無いが
じゃどうやってSPACRのSSEの拡張をするんだろ?笑っちゃうな
素人でも知ってる富士通のSIMD拡張案ってSSEの拡張なの?それともFPUの拡張なの?
SPARCにSSEなんて無けりゃ単にFPUの拡張ってことしかないよな
しかも国内のマイナー集会での発表なんて国プロ御採用アーキの発表にしちゃおかしいって思うのが普通だな
結局その拡張案ってSPARCでは採用されて無いんだろ、採用されなかったからそこで発表したんだろ
要するにガセってわけだ、ガセをもとに予測しろっていうのはどういうことw
まーIntel/AMDのCPUで考えると技術計算で有意味に使えるSSEの倍精度拡張ってのはこれからのAVXだから
2007年時点でAVXの性能をもとに計算しろってのも、そりゃいくらなんでも彼がかわいそうだろ
逆にそんなのもとに計算したら、いい加減でデタラメって言われちゃうのが落ちだな
701の言ってる事は殆ど妄想レベルの話で議論の対象ではないな。
701の教育問題って話みたいね
疲れるよな・・・・
>技術計算で有意味に使えるSSEの倍精度拡張ってのはこれからのAVXだから
もう少し勉強したほうがいいと思う、日本語も、計算機も
SSEが倍精度サポートしたのってもう10年前だよ
726 :
不明なデバイスさん:2010/11/13(土) 08:17:48 ID:4jd1kk4M
>>720 スパコンを使う方です
シミュレーションとかそういう感じで
>>723 恥ずかしすぎるな・・・
DPPD,MULPD,ADDPDのスループットすら知らなそうだ
>>723 >>727 微妙
「有意味な」だから単純な倍精度のことでなく
AVXのFMAやベクタのことでは
SXやPowerは昔からFMAサポートしてる
日本語は難しい
SSE2の倍精度命令は無意味なの?w
IntelR Math Kernel Library LINPACK Download
http://software.intel.com/en-us/articles/intel-math-kernel-library-linpack-download/ While the paragraph above describes the basic optimization approach for
IntelR Compiler, with respect to Intel's compilers and associated libraries as a
whole, IntelR Compiler may or may not optimize to the same degree for non-Intel
microprocessors for optimizations that are not unique to Intel microprocessors.
These optimizations include IntelR Streaming SIMD Extensions 2 (IntelR SSE2),
IntelR Streaming SIMD Extensions 3 (IntelR SSE3), and
Supplemental Streaming SIMD Extensions 3 (IntelR SSSE3) instruction sets and other optimizations.
Intel does not guarantee the availability, functionality, or effectiveness of any optimization on
microprocessors not manufactured by Intel. Microprocessor-dependent optimizations in
this product are intended for use with Intel microprocessors.
自分のPCでLINPACKぐらい試せば良いのに
LINPACKで4コアnehlaem 3GHzは40GFlops以上
積和同時実行、ADDPD,MULPD 1サイクル1スループット
4DP FLOP *3GHz *4コア ピーク性能48GFLOPS
x87命令なんて使ってたらピークで24GFLOPS以下
>>721いわく、有意味に使えないらしいSSEは存分に活用されてるんだけど
微妙
パソコンならね
でも技術計算では・・
LINPACKが技術計算じゃないなら、何が技術計算なんだか・・・
技術計算って何か知らんけど
SSE2は無意味で、LINPACKは技術計算じゃない、かw
"技術計算"はたぶん科学技術計算とは違う何かなんだろうなぁ
>>722 スルーされてる orz
誰かIBMが新しいアーキテクチャで何をやろうとしているのか解説してください
お願いします
>>734 前にMACオタさんが考察していたので転載
541 名前:MACオタ[sage] 投稿日:2010/11/03(水) 08:56:48 ID:NtTeKFkQ
RWT掲示板から拾ってきたネタですが、GCC Sumit 2010 で IBM がスーパーコンピュータ用の新アーキテクチャのコンセプトついて語ったのこと。
http://gcc.gnu.org/wiki/summit2010?action=AttachFile&do=view&target=Kenny.pdf 新アーキテクチャの概要は下記の通り。
- 64-bit GPR x 256
- FPR や VR 等、専用レジスタは持たない
- 上記汎用レジスタを4分割し、それぞれに専用 ALU を割り付ける
- 浮動小数点やベクトルは、上記 FPR と ALU の組を束ねて使う。例えば 256-bit SIMD はスカラレジスタを4本まとめて使用。
- レジスタウィンドウ
- 命令長 40-bit 固定
- 各コアにローカルメモリ (LS を持つ)
- ただし、異なるコアの LS は異なるアドレスを割り付ける
- 全体としては NUMA
CELL/B.E. から LS, ユニファイド・レジスタ, 多数のアーキテクチャレジスタ, といったアイデアを拝借した新世代 Blue Gene 用プロセッサというところでしょうか?
その他、汎用レジスタを FPU や SIMD に流用するのは、Motorola の計画した Book-E SPE (CELL の SPE とは異なる組込用ISA拡張)、複数レジスタをまとめて使うのは Blue Gene の Double Hammer FPU, レジスタウィンドウは日立の SR8000 などの影響が見られます。
反応してくれてありがとう
実はそのレスを見てここに貼ったわけで
アーキテクチャの概要はスライドをまとめただけだし
後半の部分はオタさんの蘊蓄自慢だしで
IBMがいったいどういうことをしたいのか分からないので
ここに貼ってみたんだけど…
燕2はlinpack 1264TFLOPSか?
正式発表は月曜か
Little Green500とか言うしょうもないランキングじゃなくて
Green500でトップ取れそうかな
>>726 ユーザーとして使うだけなら
大学の計算機センター的な部署が出してるドキュメントを読むのが一番です。
たぶんダウンロード出来るようになってるはず。
大学のWebサイトを覗いてみてください
>>736 GCCのミーティングで発表して、binutilがどうこうとか書いてあるので、
GCCみたいな、多様なCPUへ使えるコンパイラは、
中心とする仮想的なCPUアーキテクチャがあって、その段階で論理的な
最適化(無駄なループを外すとか、論理的に並列化出来るものは並列にとか)
をしていて、それから各CPU毎のコードへの最適化をしていて、
IBMからの新しい提案は、その仮想的なCPUアーキテクチャを
変更しようぜという意味かと思った。
>>737 単にBlue Gene/Qのコンパイラの話だと思うよ
256bitってBlue Gene/Pの倍でしかないし。
>>738 装置の規模を考えれば、Linpackの1.2Pflopsは、そんなに悪くない数字じゃないかな。
>>741 とすると、Blue Gene/Qは、NUMA可能なのか。
あるいは、コヒーレンシーをハードウェアで制御しないから、
コンパイラ側にNUMAを意識させてソフトウェアでコヒーレンシーを
制御するのか?
Power7も、Sandy BridgeもCPUの仕様としてはNUMAに対応している
という点が面白いなぁと思っていたので、世の中の方向性なのかな?
>>742 >The Memory System
>? Each processor has several classes of memory that are local.
> ? The classes differ in size and latency.
>? The machine has a uniform address space (NUMA).
メモリシステム
・各プロセッサーはローカルに、いくつかのクラスのメモリを持つ
- クラスにより容量と遅延が異なる
・マシーンは単一アドレス空間を持つ(非均一メモリアクセス)
NUMAというのは単に、同じメモリ空間のメモリでも参照する
アドレスによって性能が違うということ。
素直に読むと、システム全体で単一のアドレス空間があるが、
性能は均一じゃないよと注釈しただけかと。
NUMAと書いてあるからといって、Power7やSandy Bridgeと
同じような作りのCC-NUMAとは限らない。
あと、TSUBAMEの数字はマキーノがコメントしている
>1264.20 peak MFLOPS/Watt. ピーク?
>なんだ、これのスライド14にそう書いてある。で、これは確かにピークなんだ。
http://www.artcompsci.org/~makino/journal/journal-2010-11.html#13
>>739 むぅ、そんなものなのか…
ありがとうございました
レスありがとう
もう少し先の話なのかと思ったらBG/Qの話なのね
あらためて考えてみたらBG/Pのメモリ階層がどうなってるのかすら
知らないことに気づいた
自分でももう少し調べてみます
TOP500キタ━━━━(゚∀゚)━━━━!!!!
燕2 4位
Tianhe-1A - 2566.00 TFLOPS
TSUBAME2.0 1192.00 TFLOPS
Tianhe-1A 1733KWってなんだ、この異常な電力の低さは
燕は1408ノード中1357ノード使った数字か
東大 90億円 83TFlops 2008/6 opteron-QC*3776
地球 185億円 122TFlops 2008/11 NEC CPU *1280
JAXA 110億円 110TFlops 2009/6 SPARC64 VII *3008
JAEA 60億円 186TFlops 2010/6 X5570*4268
燕2 40億円 1192TFlops 2010/11 X5670*2816 4224GPU
JAEAが酷すぎるな
Blue Gene/Q Prototypeもいるよ
http://www.top500.org/system/10697 >Processor Power BQC 1600 MHz (12.8 GFlops)
BQCって何だろう?
8192コア 512ノード だから筐体半分のプロトかな
それだけで 115 位に入る性能は凄い
しかし効率は62.3%と低い
Blue Gene/Pは少なくとも80%行っていたし
京はいきなり効率92%出してる
GRAPE-DRもリスト復活
http://www.top500.org/system/10798 279位で効率47%
Tianhe-1AとTSUBAME 2.0が効率50%越えに対して
これは苦しいな
Blue WatersというかPower7は1台もなしか?
このスレ的に話題になりそうなの簡単まとめ
順位 Rmax 実行効率 電力効率
Tsubame2 4 1192TF 52% 852MF/W
BlueGene/Q Prototype 115 65TF 62% 1684MF/W
京 170 48TF 92% 829MF/W
GRAPE-DR 100node 279 39TF 47% 863MF/W
GRAPE-DR 81node 383 35TF 52% 953MF/W
>>755 GRAPE-DR 2台あって、小さいほうは効率50%超えか
気が付かなかった
Tianhe-1Aの消費電力が4040.00KWに訂正された
NCSA United States EcoG - Hybrid Cluster Core i3 2.93Ghz Dual Core, NVIDIA C2050, Infiniband / 2010
Rmax Power
33.62 35.84
938MF/W
759 :
不明なデバイスさん:2010/11/15(月) 09:01:50 ID:IBzJkuf+
ドングリの背比べだな
BG/Qバーベキューの前では霞んで見える
しかし旨いことリトル逃れしたものだが。
唯一のチャンスを前期のがしたぶどうなんとかとは違う
GRAPE-DRはわざわざ構成変えて2回も計測して省電力狙いか
TSUBAME2.0の0.02倍の性能しか無いコンピューターの効率とかどうでも良いわ
>>753 > JAEAが酷すぎるな
量産品のまま新しいことはやっていない(つまり安いはず?)
だと思うのだけどね。
つまんない時代になったなぁ…
ワクワクが無い…
使う方としてはいいのかも試練けど
EcoG - Hybrid Cluster 35.84KW
実効33.62TF ピーク68.86TF 48.8%
C2050
*128 65.9TF
i3-530 2コア2.93GHz
*128 3TF
CPU 3TFしかなくても33TFでるんだな、少し実効効率落ちるけど
やはり問題はCPU性能ではなく、PCIe帯域か
これが4コアCPUを64個に128個のTeslaだと大幅に性能落ちる
Cypressの効率が78%で、GRAPE-DRとの比較なのに、
途中からFermiの話ばかりになっている
87%だった
>>762 ここで教えてくれた方がいたのですが、
独自開発らしきにFT-1000という名前の"Computer"が、top500のデータに載っていますね。8コアかな?
>>736 そうそう、POWERってレジスタ・ウィンドウ持ってなかったよね
HPC向けに追加してきたのかな
>スパコン開発で気付いたパッケージ/実装技術の重要性,日本アイ・ビー・エムが講演
京とIBMのスパコンを比較すると本当にこれは強く感じるね。
IBMのBlue Waterって、京より進んだ実装技術に見えたけど。
うん、だから京が遅れているという意味でさ。
>>775 あ、なるほど。SX-9のプロセッサとメモリを高速スイッチで
つなぐのも凄いと思ったけど、Blue Waterはそれをノード間接続まで含めて、
綺麗に階層化して実装しているのが凄いなぁと思ったので。
スイッチの階層4段で、端から端までアクセス出来るという。
>>776 高密度化や冷却でも京より一枚も二枚も上手だよね。
プロセス技術の時点ではほぼ同等なのに出来上がった物の差が非常に大きい。
スパコンも中国産を購入する時代か。
つーか、今回大幅な性能アップに寄与してるGPU自体からしてMade in Chinaな訳だけど。
TUBAMEは20億円ほどの費用がかかったって話だけど、TUBAME2はどうなんだろ?
京は予算1120億円だっけ?で、国産とかいいながらSPARCベースなんよね?
その程度の国産でいいなら、
その予算の1/10でTUBAME3を発注した方が何も知らない国民も含めてみんなが幸せになれるんじゃないかな。
ここまで低レベル化したのも蓮舫のせい。
低レベルついでにいうと、
国策スパコンについては、NECと日立は撤退したそうだけど、残った富士通も撤退するべき。
そうすりゃ空中分解して、1000億の税金無駄にすることもない。
で、手をあげた企業がどこでも、GPUスパコンを適正価格で政府から受注すればいいじゃん。
(というか、そもそも政府はスパコン作って何に使うんだ?)
それでもパッケージ/実装技術の発展・継承はできるでしょ。
大体からして日本の理系は声をあげなさすぎ。
なんか内にこもってさ、おまえらレベル低い、わかってないとかやってるだけなんだから。
そんなだから訳の分からん文系官僚にいいようにアゴで使われたままなのよ。
>>778 >GPU自体からしてMade in China
天河の CPU は Intel Xeon で、GPU は NVIDIA Tesla M2050 だと思う。
そして、独自開発の飛騰はインターコネクトだったような。
それらしいこと書いていても、事実誤認があると冷めるわ。
日本も CPU/GPU は汎用品を使って、飛騰や Cray の SeaStar のように
他の部分にお金をかけるというのが良いね。売れない SPARC に投資
しても仕方ない。
>>781 NVIDIAはファブレスメーカーで、契約してる主なファウンダリは台湾のTSMC。
つまり、チップの製造はTSMCが担当してる。
TSMCは中国現地工場をもってるから、普通に考えてグラフィックカード自体はそこで組み立てるだろうから、
Made in Chinaで問題なかろうと思うんだけどね。
Xeonに関しては前の書き込みで何も触れてないんだけど。
中国産スパコンというのは問題ないでしょ。
>>782 天河が中国産スパコンというのは良いが、重要なのは独自技術
の部分が何であるかということだと思うけど。
>GPU自体からしてMade in China
はミスリードになりかねない。
富士通もルネサスもロジックプロセスは30nm以降TSMC委託だから
今後、富士通や日立、NECが独自CPUのスパコン作ってもMade in Chinaだねw
>>783 Made in 〜にそこまでの思いいれをこめるのはもうないから大丈夫
最近買った日本の有名メーカーの家電や、PS3やWiiなんかのゲーム機も、
手持ちのNVIDIAのチップ載せたビデオカードも全部Made in Chinaってなってるし。
一度身の回りの比較的新しく購入した電気製品見てみるといい。
>>784 TSMCに委託したら台湾産か中国産になるね。
>今後、富士通や日立、NECが独自CPUのスパコン作ってもMade in Chinaだねw
それは国内で組み立ててたらMade in Japanでしょ。
Made in 〜ってのはどこで製造されたかってことであって、
どこの国で作られた部品を使ってるかとか、どこ国の企業が設計したかということではないから。
>TSMCは中国現地工場をもってるから、普通に考えてグラフィックカード自体はそこで組み立てるだろうから、
>Made in Chinaで問題なかろうと思うんだけどね。
インテルのCPUはメイドインマレーシアやメイドインフィリピンだね
なんか本質的じゃない議論してるね
>>781 >>641にもあるように飛騰はCPUということだ
飛騰とは別にインターコネクトのチップも自国開発したようだ
なんでも、飛騰はSPARCアーキテクチャで、OpenSPARCだなんて話もある
>>784 富士通は40nm以降、ルネサスは28nm以降だね
SC10でBG/Qのプロトタイプが展示されてるらしいな
はやく見たい
>>780 今さらそんなことをしてもソフトウェアの対応が追いつかず
箱だけ作って中身は空という本末転倒な状態になるだけ。
東大も地味に新スパコン入れてた
東大物性研 20億円 162TFlops 2010/11 X5570*3840
燕2 40億円 1億円あたり30TFlops
京 1120億円 1億円あたり8TFlops (実効90%として)
東大物性 20億円 1億円あたり8TFlops
Grape-DR 15億円 1億円あたり2.6TFlops
京の1120億ってのは箱物代や次々世代用の研究費も込みみたいだから
ちょっとかわいそうだけどな
まあ、議論に影響を与えるほどの割合じゃないようだが
796 :
755:2010/11/17(水) 00:14:25 ID:hRUuehKX
>>755のGRAPE-DR 81node の方の電力効率はTop500が誤って発表した数字を
さらに誤って1桁間違えて計算してしまったものです。ごめんなさい。
797 :
755:2010/11/17(水) 00:19:13 ID:hRUuehKX
今見たら100nodeの方の数字も同様でした。本当にごめんなさい><
どんまい
修正すればいいじゃん
>>789 Top500 にある FT-1000 8c ってのが飛騰の型番みたいだ。
(FT って、中国製兵器(戦闘機)の型番でもよく見るな)
それから、Tech-On には、1GHz動作のマイクロプロセサ
「銀河飛騰(FT)-1000」2048個とあった。
ちなみに、Xeon は1万4336個、Tesla M2050 は 7168個
だから、それと比べると随分少ない。飛騰は何をやっている
だろうね。
>>801 8cは、8コアだと思いますが、
使い方がね。
803 :
不明なデバイスさん:2010/11/17(水) 11:29:56 ID:gtw1J4/J
まあ安藤さんでも間違うことはあるってことで
おー、地球シミュレータが Global FFT でトップ取ったか
(∩´∀`)∩ワーイ
米国空軍研究所、PS3 を用いた世界最高レベルの高速クラスターシステムを構築(2010/11/18)
http://www.fixstars.com/company/press/20101118.html >PlayStation 3を2016台連結
>Yellow Dog Enterprise Linux
>500テラFLOPSの処理速度
>プロジェクト全体の初期投資を200万ドルに抑え、投資対効果では世界トップレベルのシステム
これまだ動いてたんだなぁ。
fixstarsが受注したのか、よかったよかった。
「その他のOS」が潰されたのが確か2010年4月だったと思うから、その前にPS3自体は納品されてるのね。
こんだけ大口だとSONYのサポートは受けられるんだろうか?
Green500キタ
BG/Q 1位
ツバメ 2位
EcoG - Hybrid Cluster 3位
K 4位
819 :
不明なデバイスさん:2010/11/19(金) 16:23:22 ID:zEHCyBUi
濱田・似鳥氏がゴードンベルV2?
The low price/performance: prize has awarded by a team lead by Tsuyoshi Hamada (Nagasaki University) for
190 TFlops Astrophysical N-body Simulation on a Cluster of GPU
Hamada presented the results of a hierarchical N-body simulation on DEGIMA,
a cluster of PCs with 576 graphic processing units (GPUs) and using an InfiniBand interconnect.
DEGIMA stands for DEstination for GPU Intensive MAchine, and is located at
Nagasaki Advanced Computing Center (NACC), Nagasaki University.
They upgraded DEGIMA’s interconnect using InfiniBand. DEGIMA is composed by 144 nodes with 576 GT200 GPUs.
去年のGPUスパコンのネットワークとかを改良して、効率上げて受賞
An astrophysical N-body simulation with 3,278,982,596 particles using a treecode algorithm
shows a sustained performance of 190.5 Tflops on DEGIMA.
The overall cost of the hardware was $411,921 dollars. The maximum corrected performance is
104.8 Tflops for the simulation, resulting in a cost performance of 254.4 MFlops/$.
>>819,820,821
日本のGPGPUを使ったスーパーコンピューティング技術は、世界をリードしているかもしれないのに、評価されないのが残念。
>>823 めっちゃ評価されてるじゃん。
どう報道するかでマスコミの質は計れるけど。
>>824 でも2chではGPGPUのスパコンはLinpackとかは速いかもしれないけど、実用では役にたたないとか言う人多いじゃん。
827 :
825:2010/11/19(金) 19:03:44 ID:g9vOEkbj
>速報値のランクと随分と違うなあ。
と思ったら、速報値には DR 入ってなかった。
それから微妙に違うというのは、
>>794 のことなのね。
TUBAME2.0は32億円かー。
>>828 Tianhe-1AのCPU2に対してGPU1の構成(ワークステーションとか普通の構成)
に比べてTSUBAME2.0は、CPU2に対してGPU3という、より積極的にGPUを
使おうという構成で、同等程度の効率を叩き出しているという事で、
GPUコンピューティングとしては重要なポイントだと思うのだけど、
「GPUは役に立たない」という人は、そういう点も評価しないでしょう。
>>826 中国が世界一になったのを否定したいネトウヨが言ってるだけ
831 :
不明なデバイスさん:2010/11/19(金) 21:05:43 ID:JSTai1Pu
>>829 GPUが役に立たないとは思わないけれど、
TSUBAME2.0 52GB per node 52.1%
Tianhe-1A 32GB per node 54.5%
なので、3GPUとはいえメモリが多い分TSUBAMEのほうが高効率をだしやすいのでは?
>>831 メモリ増やすだけで効率が上がれば楽なんだけどね。
そんなことは無い。
ノードにPCIブリッジもQDRのIBも2系統あるのだから潔く負けを認めた方がいい
>>833 実行効率で少し負けただけで、Green500 も含めて TSUBAME の方
が遥かに実装レベルは高いと思うけど。
それはHPの手柄だねw
あっちは中華プロセッサと中華インターコネクトでよく頑張ったともいえるが
ツバメの独自技術は?
>>831 >TSUBAME2.0 52GB per node 52.1%
>Tianhe-1A 32GB per node 54.5%
>なので、3GPUとはいえメモリが多い分TSUBAMEのほうが高効率をだしやすいのでは?
1ノード
Tianhe-1A
CPU 140.64GF 22%
GPU 515GF 78%
Tsubame2.0
CPU 140.64GF 9%
GPU 1545GF 91%
メモリ96GBで同等
PCIeが問題になるけど
>>835 別に独自開発に拘る必要はないと思うが。
独自に開発しなくても、IB で CPU2 に GPU3 という構成で
Tianhe-1A と大差なくて Green500 では圧倒できたわけだから。
それよりはソフトの方で頑張る方が良い。ASUCA GPU 化とか。
http://twilog.org/ProfMatsuoka 他にもいろいろと頑張っているみたいだし。Top500 で 1位でも
実アプリでどうかということの方が重要。
実行効率で負けたってことはソフトの技術だって中国に分があったんだよ
>>838 んじゃ具体例を上げてみてくれ。SC10 で Tianhe-1A 使ったもので
論文賞(Gordon Bell賞以外も含めて)の候補論文になっている成果
あったっけ?
>>836 やはり90%以上がGPU演算というのは凄く感じる。
ソフトの技術(笑)
1545GFで効率よく動くDGEMMのサイズにメモリが足りないだけ
演算能力に対して帯域とメモリが足りて無いんだよ
SIでも負けたw
某氏もツイッターに拠点変えたようだな。
847 :
不明なデバイスさん:2010/11/20(土) 08:29:28 ID:rEncJCSs
top500と互換性がなきゃダメ!絶対ってことか
マキーノ先生のページが見れない…
どうせ年一のアレのタイミングだろう
100node 38.85 81.92 45.05 862MF/w
81node 34.55 66.36 29.37 1176MF/w
効率上げるためにノード減らしか・・・
規模が小さくなれば電力で有利になるからね
次は60ノード
その次は40ノードの数字出して、さらに高電力効率達成とか言いそうだな
起動できる限界まで電力削ったりして
>>813 薄型だとLinux動かないんだよね。
旧型をそんなにたくさん発注できるものなんだろうか。
それとも独自にハックしてLinux入れてるのか。
でもそれだとSCEのサポート受けられないよなあ。
>>850 そもそも、TOP500ってノード数を変えて申告なんて許されてなかったような気がするけど。
段階的に80ノードと100ノードが導入されたとしても、こんな申告が許されるのなら、
毎週8ノード単位で納品される京は、こまめにデータをとれば、TOP500のシェアの30%ぐらいは独占できるんじゃないのw
実態として同じものを複数システムもってるなら問題ない。
しかし実態は1システムなのに100ノードと80ノードで重複エントリーしたら問題だろう。
でGrapeはどっちなの?
結局、Green500 の 2位はどっちなの?
862 :
不明なデバイスさん:2010/11/21(日) 14:37:13 ID:dCgHxQXv
とんでもないヘテロジニアスなチップだなー
BG/Qは1CPU,16/17コアか
1コア 4 DP FMA
1CPU 16コア 1.6GHz
1コンピュートカード 1CPU DDR3 8GBor16GB
1drawer 2U 32コンピュートカード
1ラック 32drawer 209.7TF 1024CPU 16384コア
50ラック 10PF
京速
1コア 4 DP FMA
1CPU 8コア 2GHz
1システムボード 1U 4CPU
1ラック 24システムボード 12.3TF 96CPU 768コア
800ラック 10PF
>>867 飛騰はOpenSPARC T2ってこと?
>>871,872
京速の1ラック24システムボードというのもなかなかだと思ったけど、
BG/Qは凄いね。120〜200ラックでLinpack20PFぐらいいくのかな。
>>866 マイコミの記事, 朝日の報道, 東工大の垂れ幕と
TSUBAME2.0 が 2位ということが既成事実化されつつ
あるのに、何でマキーノは公式に反論出さないんだ?
それに東工大の松岡氏も マキーノ の twitter や公開日記
を見ていると思けど、何の反応も無いのはような。
やっぱり電力効率も容積効率も
>>871,872
BG/Qはちゃんと性能面で「COTSでは出来ない」ことをやっているのが凄いよね。
京速だとx86でいいじゃんってことになる。存在意義が見えない。
>>875 なんでこんなに対応が遅いんだろうな。
GRAPE側の申請に不備がなかったのだとしたら酷い話だ。
京速が2Uで8CPUに対し、BG/Qは2Uで32CPU
京速の4倍詰込んでる、それプラスCPUコア数が倍なので
面積あたりのコア数は8倍
面積あたりのピーク性能は6.4倍
>>879 まぁ、そうなんですよね。京速は技術的にチャレンジな部分が
ほとんど無いですからね。(インターコネクトは速いのかな?)
>>879 > 京速だとx86でいいじゃんってことになる。
x86のMFLOPS/Wは京の半分も行ってないけどな。
今倍しか無いのなら、2012年には抜かれるな。
Sandy Bridgeで並ばれIvy Bridgeで抜かれるのは既成事実
>>884 英語のWikipediaを引くと、Sandy Bridge-EXが2011Q4、
Sandy Bridge-EPが2011Q3予定と出てきます。
コアは最大8コア。
1コアで8個の倍精度を演算できるので、2GHz動作と計算しても、
128Gflops。3GHzと計算すれば、192Gflopsとなります。
で、MFLOPS/Wは?
デスクトップPC用だと、Core i7 2600というのが、2010年末から年始にかけて出てくる。
3.4GHzの動作クロックで4コアなので、108Gflops出る。
>>887 来年にはAVXによって電力効率がざっと二倍に伸びる。その時点で京速とほぼ同等。
Ivy Bridgeではそれがさらにシュリンクするので京速は十中八九抜かれるだろうね。
>>889 困ったものだな。ここまで酷いとは思わなかった。SCで表彰しちゃった手前引くに引けなく
なったんだろうか。ほとぼりが冷めて皆の視線が離れた頃にコソっと差し替えるつもりかな。
京速CPU
SPARC64 VIIIfx 2GHz 128GFlops 58W 45nm 513mm2
2.2GF/W
Sandy Bridge
Core i5 2500T 2.3GHz 73.6GFlops 45W 32nm 220mm2 一番電力効率良いやつ
1.6GF/W
35%及ばない
8コア、2GHz、58Wか8コア、3GHz、85Wが出れば並ぶけど、まあ出ないだろう
他にはAtom 2GHz 1コアの倍精度の積和ピーク性能は
1.06Gflopsで使い物にならない
>>891 > 京速CPU
> SPARC64 VIIIfx 2GHz 128GFlops 58W 45nm 513mm2
それ、30度に冷やして、ティピカルな値ね、最大じゃなくて。
30度まで冷やすと、リーク電流が減って、消費電力も小さくなるらしい。
Kは、現在の小型版で、効率92%を達成している状態でのMflops/Wが、828.67。
ラック800台の構成にしたら、どのぐらいなんだろ。
インターコネクトのトポロジーが似ているJaguarで75%なので同じぐらいの効率なら
676Mflops/W。
828.67〜676Mflopsに対して、Xeonのクラスターを探すと、NECのアーリントン
大学に納めた354.56Mflops/Wが一番Green500では高そうな値なので、その
2倍の性能が出るとすると、700Mflops/Wぐらい。
>>893 このNECのクラスターに使われているので、Xeon X5550で、
4コア、2.66GHz動作42.56Gflopsで、Max TDP 95W。
Sandy Bridge-EPはTDP150〜80らしいので、動作周波数を下げて、
2GHzで計算しても128Flopsで、3倍、
消費電力当たりの性能はCPUだけだと3倍ぐらい出そう。
>>879 マッキーにかかればBG/Qですら境界線上だってよ
もうIntelと勝負しちゃだめだな
んなこといったら京なんて、、、
商業レベルの成功はアーキテクチャのデモンストレーションより
数段難しいってことだよね。Teslaも境界線。
うん、京は問題外
IBMのそこ力、Intelの馬鹿力って感じで、両方凄いよね。
もしプロセッサの開発からやるならプロジェクトの範囲内でCOTSを超えることを目指すべきだね。
最初から様々な応用を考慮してまともな汎用プロセッサを開発していたらx86にはかなわない。
京速プロジェクトが生んだのは良い所無しのスパコンと商業的にも利益の出ないプロセッサ。
>>901 (COTSを超えるためにも)COTSでできることはCOTSでやる、
ということも必要。
垂直統合囲い込みによる旨味を捨てる勇気も必要。
旨味なんてないだろ
京はメーカーは大赤字って話じゃないか
コツコツ努力、っと。
京速
SPARC64 VIIIfx 8コア
7.6億 45nm 513mm2 45nm 58W L2 5MB
BG/Q
PowerEN 16コア
14億トランジスタ 428mm2 45nm 55W
INTEL
Bloomfield 4コア
7.31億 263平方mm 45nm
何この京速のトランジスタ効率の悪さ
いいじゃん国産なんだし
それでノーベル賞取った人からもほめてくれるらしいヨ
褒めるだけじゃなくてけつも叩いて欲しいものだな
トランジスタと言っても色々だけどな。
>>910 まずキャッシュ容量が少ないから、そこで効率は下がりますね。
後は配線が下手なのか、同じ微細度でも配線層の数が少ないか。
さらに、どこまでカスタムで回路を作りこんで、どこまでがスタンダードセルの
組み合わせなのか。
>>910 面積はトランジスタ効率だけで決まるわけじゃないよ。ピン数がネックに
なって面積が決まる場合がある。SPARC64 VIIIfx の写真を見ると、DDR3 インターフェース
と高速シリアルI/Oがずらっと並んでいるので、そこで面積が決まっている可能性がある。
oooのリッチコアや大量のレジスタ、512bitのDRAM接続を考えれば、
i7を2つ並べた物に比べて特に効率が悪いということはないんじゃない?
共有キャッシュは少ないけど、キャッシュに収まる何かよりもDRAMの幅が
重要ってのが彼らの考え方じゃ。
>>918 ここでの「効率」は、単位面積にトランジスタを詰め込む効率ですよ。
一般的な組み合わせ回路に比べ構造の単純化なメモリのブロック(レジスタファイルって一般的な言葉かな?)は、トランジスタの密度は高い。
下品な言い方すれば、「トランジスタの密度なんてアホみたいにキャッシュ積めば高くなるもんで、テクの比較にはならんのでは?」
という事なんですけど。
レジスタファイルをSRAMで実現するやり方もあるとは思うけど
普通はレジスタファイルってSRAMほどにはトランジスタ密度高くないんじゃ
>>922 SRAMとかレジスタファイルって呼び方だけの問題のような。。。
つうか、レジスタファイルってSRAMだろう。これをDRAMやフラッシュメモリで実装
することは普通はしないな。
ごめん、レジスタファイルはSRAMを使う方がむしろ一般的なのね
まあ、そうだとしてもレジスタファイルに使うトランジスタと
大容量のキャッシュRAMに使うトランジスタではサイズがだいぶ違うはず
キャッシュを大量に積めばトランジスタ密度は高くなるというのには同意
トランジスタのサイズって・・・
SRAMのキャッシュとレジスタで違うとしたら、何個のトランジスタで1bitを構成するかぐらい。
ECCとかの回路は除いて
レジスタもキャッシュも数個のトランジスタで0か1を保持してるだけ
>>926 いや、キャッシュ向けのSRAMセルとレジスタファイル向けのセルはサイズが
異なる場合が多いよ。
レジスタファイルは高速性が要求されるからWが大きいトランジスタ、
キャッシュ向けは高密度が重要だから小さいトランジスタが使われる
場合が多い。まあ設計次第だけど。
green500 はどうなった?
能澤さん元気でよかったね
GRAPEは能澤の飯の種になっているんだから
能澤はマキーノに感謝すべきだな
ぴろしき
ごねるくらいなら中国と共同で新しいベンチーマーク作れよな
green500、牧野日記では12月1日までに何とかすると返事があったそうだけど、
特に変化なしだな
>>944 京速スパコンで使うSPARC64[fxは、やはり汎用のサーバには使わないのね。
そりゃそうだ
ちょっと改造したTSMC製SPARC64[+が京より先に活躍したらまずいだろ
>>947 そのうち使うでしょ。
時間が止まってるかのようだ、>SPARC64 Z+。
>>949 そのままでは使わないんじゃないの
>>948 それは高コスト化とかのもとになる発想じゃね?
どの口がそんなことを、、、社長氏は ここによると9月に 1.5Gflops/W といったんだそうで。
2ヶ月の間に数字が3倍になったのかな? CPU も Core i3 2390T とか Xeon E3-1260L とかだと
CPU だけなら倍精度 1Gflops/W を 超えてたりして、、、というか 1.5 超えるのか、、、
http://jun.artcompsci.org/journal/journal.html ピーク性能と実効性能、ボードのMF/WとCPU単体のMF/Wをごっちゃにして語るのが牧野流ですか
こんな勘定だから2000TFの目標で39TFしか出ないなんて事になるんですね
小学生でもできるような計算できずにTOP500に間違った数値入力してるしね・・・
GTX580 3.24GF/W
HD 6990 5GF/W DP1.5TF TDP 300W
GRAPE-DR model2000のピーク性能は
827Gflops 350W
2.36GF/W
>2ch には熱心な人がいるのに感心する。GRAPE-DR については一生懸命色々捜して
>一番消費電力の大きい数字(Top500 にでてる数字と矛盾する)を わざわざもってきているところが素敵である。
>今後一層の努力を期待したい ところ。
うわ、自分の発表を否定してるよ・・・
>実際、4チップの GRAPE-DR カードは400MHz 動作で理論ピーク 819.2Gflops、
>DGEMM での性能 740Gflops 程度を実現しており
消費電力(最大) 約350W
http://www.kfcr.jp/grapedr.html 牧野流比較だと、比較対象はMAX TDPの数値出して
GRAPE-DRの数値は都合の良い実測の数字出すんだっけ?w
マッキーノは終わった人
池沼信夫やアレブログに突っ込みいれるためだけの要員
公正さが無い人はダメだね。
GRAPE-DR model450だとピークで3.4GFLOPS/W、DGEMMで3.1GLOPS/Wってところか
低性能でいいなら
HD 5830M 500MHz 800SP 24W 800GFlops 33.3GF/W
HD 5870M 700MHz 800SP 50W 1120GFlops 22.4GF/W
クロック下げれば消費電力が格段に下がるという当然のことだね
京のvenusにGPUなりGrapeDRなり繋げたら最強じゃねーの
>>968 >マッキーノは終わった人
同意
GRAPEは終わったスパコン、今はTSUBAMEのような
>池沼信夫やアレブログに突っ込みいれるためだけの要員
マッキーノちゃんて公務員なんでしょ?
天文台は暇なんでしょうね、関係ないスパコン遊びのおしごととかw
おしごとすると失敗、でやけっぱちの突っ込み要員ですかw
>>969 >公正さが無い人はダメだね。
全ての彼の論理はGRAPEへの我田引水ですかねw
悲しい人ですね
>>972 >京のvenusにGPUなりGrapeDRなり繋げたら
最悪のガラパゴス結合ですかw
プログラム書かされる人達かわいそうですね
venus + grapeDRでBG/Qの効率超えちゃうからな
必死すなあ
いわゆる、おわコン
GRAPE-DRはDGEMMの電力効率は750GFLOPS/250Wらしいから3GFLOPS/Wで
この時点でHD5870のピーク値を超えている。わざわざ一番悪い数字を持ってきた
というのは間違いではないだろう。だが、GPUが2倍の電力効率になればAMDには
かなり引き離されるし各社とも倍精度の効率を強化する方向であることを考えれば
28nmのGPUとほぼ同等というのはかなり甘い見通し。実際には40nmと28nmのGPU
の間というあたりで我田引水ではどっちもどっちって感じ。
GPUの倍精度は3Dグラフィックのために満載した単精度演算器を流用しただけのあくまでおまけ機能だからな
それ専用に開発されたものとの間に効率や性能に差があるのは仕方ない
>>979 >GRAPE-DRはDGEMMの電力効率は750GFLOPS/250Wらしいから3GFLOPS/Wで
また都合の良い実測の数値出して、最大消費電力と較べてるの?w
C2050ですら実測消費電力は
CUBLAS SGEMMで150W
MonteCarloOneBlockPerOptionで160W
http://www.nvidia.com/content/PDF/sc_2010/theater/Matsuoka_SC10.pdf 225WのFermiでこれだからHD 5870の実測はこれより数段消費電力低いだろうね
GRAPE-DRはどう比較してもHD 5870にすら負けてるよ
GPGPUと関係ないテクスチャ等のグラフィックス機能も
全開に回したベンチの消費電力を出さないと気がすまない人が居るみたいだけどw
GRAPE-DRって
ただクロックが上がらなくて低クロックだから消費電力が低いだけなんだよね
それをあの人は勘違いしちゃってるみたいだけど
クロックが近いGPUと比較するとこんなもん
HD 5830M 500MHz 800SP 24W 800GFlops 33.3GF/W
GRAPE-DR model450 400MHz 60W 409GFlops 6.8GF/W
限界までクロック上げたGPUと較べて、電力効率どうこう言ってもね・・・
5870より、クロック下げてる5970の方が電力効率良いし
984 :
訂正:2010/12/11(土) 20:52:48 ID:8rdYcT4w
×TDP225Wで150Wならだいたい71%の電力だね。
○TDP225Wで150Wならだいたい67%の電力だね。
またperomance/Wへ逃げ込んだか。
>>983 その資料古いよ
On a C2050 GPU the new DGEMM gets up to 300 GFlop/s (58% of peak) and
the SGEMM up to 645 (63% of peak). On a GTX480 DGEMM gets up to 166 GFlop/s
and SGEMM up to 844 GFlop/s.
the up-coming MAGMA 0.3 library release and will be included in
CUBLAS 3.2 as well.
CUBLAS performance improved 50% to 300% on Fermi architecture GPUs,
for matrix multiplication of all datatypes and transpose variations
古い数値どうし較べたいならlinpack実効効率20%、DGEMM 実効400GFlopsのGRAPE-DRの数値と比較しても良いんだけどね
もうこれで良いよ
HD 5870
実効450Gflops 最大消費電力188W 2.4GF/W
GRAPE-DR
実効740Gflops 実測消費電力250W 3GF/W
GRAPE-DR圧勝www
GRAPE-DR
実効740Gflops 最大消費電力350W 2.1GF/W
牧野はGPUはボード全体の消費電力出して
GRAPE-DRはGRAPE-DRプロセッサ単体の消費電力出したり姑息なことしてるからねぇ
>どんどんいろんな技が開発されている。Fermi の数字と称して GTX285 の数字をだすとか。まあ、単に元論文が読めてないだけかな?
・・・・・ということで
>>981に挙げられている数字はGTX285のものでFermiはまったく関係なかったようですね。
キャーハズカシイ(/ω\)
>>985 ペロペロ(^ω^)
2chばっかみてないで研究しる!
>>987 Green500に乗らないのも細工した数字出したからかもね
思いつきでこれだけ遊べたんだからもう満足してほしいなあ。
京と同様、負けが確定してからまだ金をひっぱろうとする。
当事者の発想としては仕方がないが、それをストップさせる歯止めが働かない。
これが日本の科学技術支出の無駄なところ。