【スパコン】スーパーコンピュータ関連情報【HPC】
1 :
不明なデバイスさん :
2009/04/18(土) 12:55:12 ID:kq24Fda5
Inside the DOE’s power-hungry supercomputer
http://www.itnews.com.au/News/101543,inside-the-doe%E2%80%99s-powerhungry-supercomputer.aspx AMD DirectConnect 2.0 Prompts New Opteron Roadmap
http://www.pcmag.com/article2/0,2817,2345782,00.asp IBM boasts Sun-HP server pact pillaging
http://www.theregister.co.uk/2009/04/22/ibm_hp_sun_takeouts/ Panasas counts in revamped product range
http://www.channelregister.co.uk/2009/04/23/panasas_new_range/ 'Space blob' baffles astronomers
http://news.bbc.co.uk/2/hi/science/nature/8007844.stm チップスタッキング技術でメモリウォールを破る2010年代のCPU
http://pc.watch.impress.co.jp/docs/column/kaigai/20090424_153641.html AMD、サーバ向け16コア・プロセッサの開発計画を明らかに
http://www.computerworld.jp/news/plf/143753.html Xeon (Nehalem) にてLinpack HPL定点観測テストを実施し2.93GHz機で81.1GFLOPSを達成
http://www.hpc-technologies.co.jp/benchmarks/HPL-Bench-table.html DDR3対応のハイエンド製品「Phenom II X4 955 Black Edition」
http://pc.watch.impress.co.jp/docs/column/tawada/20090423_153014.html オラクルのサン買収、狙いはハードウェアとソフトウェアの統合システム
http://japan.cnet.com/news/biz/story/0,2000056020,20392041,00.htm オラクルのサン買収--予測される「統合」という課題
http://japan.zdnet.com/sp/report/story/0,2000056431,20392052,00.htm
イア
13 :
不明なデバイスさん :2009/04/26(日) 21:39:06 ID:qk+7A+fw
14 :
不明なデバイスさん :2009/04/26(日) 21:50:20 ID:qk+7A+fw
人には定量とか数値とか強要する割りに自分は思い込みでしかしゃべらないのなw
なんか15億円とか言って粘着してるけど 今時のプロセスでカスタムチップ作ろうと言う割にはお金が無いにもほどがあるだろ 道路なんか作ってないで、犬ECや蛆通に餌やってないで、 こういうところに投資しろって主張ならわかるのだが
税金から15億とってる割にマネジメントが甘いって指摘は正しい。 それ以外はクソだがw
最近は池田信夫さんの参戦がなくて、少々寂しいです。 他のスレではSX-9の話がでるとアメリカの陰謀やら、犬氏ね、 とかいう言葉の雨あられ。もうわけわかめですw ITゼネコンやら、役人の利権やら、そーゆーのからちょっと離れて きっちりプロレスをしていただきたく思います。 と、また意味不明のあおりをひとつw
CM-1/2がデータフローマシンだとか、データフローマシンがAI向けだとか 馬鹿を抜かすヤツにアーキテクチャを語る資格なんか無いな。
AI屋さんだが、CM-5を買ったのはAIなんて単なる口実。 まぁでも実機があれば色々分かって来ることが沢山有る。 それ以前のAIなんて、論文や仕様書を基にした脳内妄想 だらけだったな。最近のユビキタスとか、脳内妄想の愚行を 繰り返してるように見受けられるが。
23 :
不明なデバイスさん :2009/04/30(木) 17:30:46 ID:3pY85Tb4
24 :
不明なデバイスさん :2009/04/30(木) 17:38:19 ID:3pY85Tb4
ちなみに削除されたのは、上の魚拓の17番のコメントです。 不適切だったのかなー?
一部コメントかと思ったら全部消えたよ!(;_;)
> 追記: 急にスパムが増えたので、コメント欄は当面、閉鎖させて頂きます。 スパムねえ(にやにや
少なくとも、スパムに見えたそうです(にやにや
やっぱりグローバルサービスか サービス過剰だなw
にやにや
31 :
28 :2009/04/30(木) 23:39:02 ID:OzBaZynJ
訂正 s/引用してたけど/触れていたけど/ 失礼しました。
忘れてました
>>23 氏に今年たくさんの幸せが訪れますように
同じく
>>23 氏に祝福を。
23氏の最大の功績は、
この言葉を引き出したことだろう。
GRAPE-DRに関して言えば、
1.東大 記者発表 2004年5月26日 世界最高速のコンピュータ開発プロジェクトがスタート
2.東大 研究成果発表 2006年11月3日 記者会見「世界最高速のスーパーコンピュータ用プロセッサ チップ開発に成功 − ペタフロップス実現へ大きな一歩 − 」
3.SC07 Nov 13 GRAPE-DR
4.文科省 2006年12月 平成18年度科学技術振興調整費の評価結果等について
5.K&F Computing Reserach 社 Home Page
6.文科省 政府調達情報検索
7.プロジェクト期間が終了してしまっている4月24日現在で、新たな公式発表は認められなかった事。
などの情報を基にしたものであり、情報の出所を明らかにする意味で、参照URLにリンクしてあるはずです。
本稿は、これらを総合し、時系列性を考慮しながら、発表内容の相互関係をチェックし、矛盾点を洗い出し、結局、7との矛盾から、どうやら、情報操作がなされていたのではないかと帰納的に判断しているわけです。
まともに読めば、1から6までと、7の要素が矛盾する、つまり発表はどうなってんだ
っていう部分しか突っ込みどころがないってことでしょう。
ってことで、Grape開発の皆さん、まともにマネジメントしましょうw
矛盾は
>>28 のこれもでしょう
(GRAPE-DR開発関係者で異議があったらコメントに書き込んでください。
適切なデータがあれば修正はやぶさかでは有りません)
コメント封鎖してwww
青い魔物の正体を暴いた
>>23 氏に再度感謝
人類の敵というのは間違いではないのだなと
>>23 コメント17 の前に追加でコメントを書こうとしたのですが、すでに
私のID からはコメントが書き込めないようになっていました。また、
私の疑問にも答えてくれませんでした。まあ、過去にも批判的な
コメント削除はあったことなので、彼の仕様でしょうね。
>>34 「いつから科研費では終了年次の終わりにプレリリースが
義務付けられたの?」と容易に反論できてしまうような・・・
つまり、彼が唯一の拠り所にしている点についても、何ら根拠は
ないということに。
なので、批判したいのであれば、事後の成果報告書や評価書が公開
されてからにすれば良いかと。とりあえず、来月まで待ちましょう。
40 :
不明なデバイスさん :2009/05/01(金) 03:28:34 ID:KB3EXhdG
何時もなら、一応最後まで記事を読むんだけど ・・・今回の記事は、途中で気持ち悪くなって 読むの止めました > 能登ブログ はっきり言って「読むに値しない」駄文以下 最低限、読者に最後まで読ませる文章力を希望 罵詈雑言だろうと、嫌いな相手にだって、 力尽くで読ます程度の事を書いたら?
>>40 今回のメインコンテンツは、コメント欄でしょw
そんな刺身のツマにケチをつけるような無粋なまねは粋じゃないですよ。
#なんであんなにdisるのか、不思議ではありますが。
ブログのコメント欄は、難しいですね。 技術的には、一般公開しているブログで、一般にオープンにしているコメント欄であっても、 運用的には、知り合いのみに門戸を開き、知らない人が書き込むと、土足で上がり込まれたと思われる などというブログのほうが多いのではないでしょうか。 技術的な話を書いているブログだからといって、ブログの技術に長けているとは限りませんし、 ましてや、オープンに議論をするつもりがあるとも限りません。 自分の意見に賛同してくれる人との馴れ合いだけを求めている、そういう場合のほうが多いでしょう。
で、私はGRAPEシリーズには懐疑的。 良く言えばアマチュア精神で頑張ってると言えますが、 彼らはDIY的にやれる限界を越えてしまってると思います。 昔は、学生や院生が、ちょっと回路の勉強をしてボードを自作するのは当たり前だったし、それで良かった。 ただ、その延長線上を走りすぎたのだと思う。 チップもボードも、外部の専門家に設計させるべきだったと思う。 スキルの低い人が勉強しながら専従で時間をかけてやるよりも、 スキルが高い人が既に持っている技術で短時間で仕事として処理するほうが、 時給単価は1桁から2桁は違うけど、結局は、安くあがる。
ぶっちゃけ、nVidiaあたりとの共同研究にして、nVidiaがすでに持っている技術を借りて、 GPGPUの1つの方向性についての実証実験ということにすれば、 15億円で、それなりに動く現物を手にすることができたような気がするよ。
>>43 これは事実誤認ではないでしょうか?
GRAPE-DRの物理設計は Alchip のエンジニアですし、
既に配線もDYI的にできるレベルを越えています。
また、計画概要を読めば分かりますが IBM も入っています。
>>44 GPGPU との差別化は必要でしょうね。
>>42 彼はブログスキル、結構高いと思うよ。
今まで反論ウェルカムな姿勢を出して、実際に来た自分とことなる
意見には、ネチネチと、小ばかにするような態度で返事をし、対応
しきれない部分は削除してきたわけだし。
>>23 氏がいままでと異なるのは、そういったN澤氏の、使ってきた
論理をそのままN澤氏にぶつけたことにあったんじゃないかな。魚拓
に残ってるから、実際見ると分かるけど。多分、自分の書いてきた
コメントがそのまま自身のネックになることに気がついたから、
他のコメントも消したんだろう。しかも昔の方のよいしょコメントは
消してなかったりするし。「反論ウエルカムで全部ぶちのめしてやるから、
そんなオレが税金の無駄、っていうんだからオレのいうことが正しい」って
いう演出をし、それができなくなるような事態がおこったから、
今回の大量削除となったんだと漏れは推測してるよ。
まぁ、ある意味スパムですね、23はw
>>45 実はかくいう私も42氏と同様、ちょっとGRAPE-DRには懐疑的な
面があります。ただし、過去に実際に動いたGRAPEシリーズに対して
ではないです。なによりもN澤氏のように、非建設的な批判をするつもりは
全く無いけど。
なので、
>GPGPU との差別化は必要でしょうね。
このあたりの理由をもうちびっと詳しく書いてくれるか、
参考資料へのポインタを示してもらえると嬉しいです。
>>47 まず、GRAPE-DRも アクセラレータチップ なので、 GPGPU と比較できると思います。
現時点での私の理解は、倍精度での演算性能と演算性能当たりの電力使用量では
GRAPE-DRが優位というものですが、既に大きなシステムが動いている、CUDA などの
統合開発環境が用意されている点では GPGPU が優位というものです。
また、以下に示すように GPGPU で既に大規模な N体の計算が行われていたりします。
よって、差別化がないと今後使ってもらえないのではないかという指摘です。
単精度190Tflops GPUクラスタ
http://w3cic.riken.go.jp/HPC/Symposium/2008/hamada.pdf ところで、ブログのコメント欄には 2-4TFLOPS/500万と書いている人が
いましたが、これは 1TFLOPS/25万 (恐らく単精度)の間違いだと思われます。
>>48 どうもです。
なるほど、指摘はニーズについてですか。
おれはGRAPE自体は昔から応援しているけど、 牧野と能澤はちょっと離れて見るとどっちも同レベル。 GRAPE-DR発表時はESがラック1本でできる。ESはクソ。とか素人をだますような宣伝しておいて 結果が伴わないんじゃ見てる方が恥ずかしいわな。 演算器演算器言ってるけど、データの転送やストレージを含めて「演算」なのを分かってない。 特定用途向けに固定回路作り混めば、その用途に対しては性能もパワーも何桁も優れるものが できるのは当たり前で、(メーカーが見向きしない分野のため)たまたま先行して多体問題専用ASICを 起こしたから成果が出せただけで、技術的にはそんなにすごいものではない。 専用計算機を最初にやって、ちゃんと研究に使えているのはもちろん大いに評価する。 それを一般の汎用コンピュータと比較して相手を貶めるような宣伝をして金を集めたり 素人をだますのはどうかな。この辺は能澤と同レベル。
↑なんかこの人ゲハ板の臭いがするんですけど
>>50 >演算器演算器言ってるけど、データの転送やストレージを含めて「演算」なのを分かってない。
どうかな。彼の書いたもの見る限り、その点良く分かってるように見えるけど。
>それを一般の汎用コンピュータと比較して相手を貶めるような宣伝をして金を集めたり
>素人をだますのはどうかな。この辺は能澤と同レベル。
能澤氏が素人に対して「税金の無駄」という論点で記事を書いているのと、
牧野氏が国から研究費を引き出すために宣伝してるのは、議論のレイヤーが
違うような気がする。牧野氏が「騙す」としたら、素人じゃなくて玄人でしょw
実際に今まで動くものを作って、成果も出してるわけだし。
今回のプロジェクトに関しては、成果報告を見てから批判するなり
評価するなりすればいい、ってオレは思ってるけど。
53 :
52 :2009/05/01(金) 21:54:36 ID:/7vzdFWl
訂正。 「騙す」としたら ↓ 「騙す」必要があるとしたら
>ESがラック1本でできる。ESはクソ。とか素人をだますような宣伝 これのソースは?最初のは密行列に対しては真なのだろうけどあとは君の勝手な解釈じゃ。 >演算器演算器言ってるけど、データの転送やストレージを含めて「演算」 これも君の勝手な定義。しかも一般的じゃないし。 >特定用途向けに固定回路作り混めば、その用途に対しては性能もパワーも何桁も優れるものが >できるのは当たり前 演算量の多い用途ではそうなんだろうけど、メモリアクセスやIOへの要求が高い用途ではそうでもない。
>>52 >>演算器演算器言ってるけど、データの転送やストレージを含めて「演算」なのを分かってない。
>どうかな。彼の書いたもの見る限り、その点良く分かってるように見えるけど。
そう、最近は。
昔とは微妙にトークポジション変わってきている。
>牧野氏が「騙す」としたら、素人じゃなくて玄人でしょw
金出す人は素人でしょ。いわゆる一般人ではないけど。
あとは、あれだな。秋葉で部品集めたらメーカ品の1/10で済む、なんつう議論をよくやってるが、
自分で家建てたら1/10で済んだ、と同レベルでPCマニアがニヤニヤしながら読むには面白いが、
じゃあそれで、家建てる趣味は無くて単に手っ取り早く建てたい人や、安心して住みたいだけの人
の解決にはなってないし、耐震性は?とか火災時の保障はどうすんの、というコストが入ってない。
コメント欄再開してるね。 ますます脳味噌沸騰してるみたいなんで、また誰か魚拓よろ。
なんだか、ものごとよくわかってない人の上から下目線の「評価」って痛々しい。
>>55 >>どうかな。彼の書いたもの見る限り、その点良く分かってるように見えるけど。
>そう、最近は。
>昔とは微妙にトークポジション変わってきている。
ということは、55さんも「今」は「分かっている」と認めているわけですね?
ならいいんじゃないかな。人間成長するんだし。
>>牧野氏が「騙す」としたら、素人じゃなくて玄人でしょw
>金出す人は素人でしょ。いわゆる一般人ではないけど。
そうだね。でもかね出す人は、一応、「金を出すことの専門家」なわけで。
素人をだます、っていう言い方にはそぐわないと思うんだよね。
まぁ、その金はもちろん国民のものだけど。
>じゃあそれで、家建てる趣味は無くて単に手っ取り早く建てたい人や、
>安心して住みたいだけの人 の解決にはなってないし、耐震性は?
>とか火災時の保障はどうすんの、というコストが入ってない。
これについて議論したいのなら、55さんがどのようなユーザを想定して
議論したいのか、っていうのを明確にしないと、実りあるものにならない
と思うよ。
>>58 いちいちごもっともだと思うので特に反論しません。
>>57 の人が書いているように、牧野先生も他の評価をするときには
上から下目線の能澤レベルの内容がちょいちょい混ざっているっつうことが
言いたかっただけで、特にここで議論したいわけじゃないです。
>ESがラック1本でできる。ESはクソ。とか素人をだますような宣伝 Linpackで1位取りたいならそういう設計にするべきみたいなことは言ってたが 別にESが糞とは言ってないだろ
>>60 そりゃ直接「クソ」とは言ってないが、全然別物を比較対照にして
たとえば設置面積や消費電力の比較が成り立つのかな。
MPEG2デコーダASICとPen4をコストや消費電力で比較しても、
そりゃその土俵じゃ勝つのが当たり前で、比較にどんな意味があるの?ってことにならんかな。
デコードならpen4でリアルタイムで余裕でできちゃうから専用チップを追加する意味はないよね。エンコードなら専用チップの存在に意義が出てくるわけでしょ。pen4は要らないともいってなくて、エンコードに一定の需要がありますというだけじゃ。 簡単な話の割には宗教論争みたいになるんだよね。
>>62 ごめん。例えの内容には意味ないので。
でも昔はPCでDVD再生するのに専用カードがあったのよ。
確かに486やPentiumの頃だからP4との比較はいい例ではなかった。
486の頃にはvideo CDというのがあったぞよ。
>>45 私が言った「チップの設計」は、Alchip担当部分よりも上流のことです。
AlchipやTSMCの仕事を自前でやるのは、いくらなんでも、ありえないので
そういう解釈をされるとは思ってもいませんでした。
いずれにしても、私の文章が誤解を招いたことは、申し訳ありません。
要するにどっかからIP買ってきてやればよかったってこと? 性能でないか高くつくのがオチじゃねー? つかそんなの最初に検討してるだろjk
>>68 違います。
要件定義だけして、後はすべて、経験のあるメーカーに任せるべきだったのです。
チップだけでなくボードも、変です。
見た目からして違和感があります。まるで新人が設計したかのような。
経験のあるハード屋ではなく、KFCR社に発注したのは、なぜでしょうか。
>>69 抽象論でおかしい、といっても、読んでる人にはわからないと思います。
69さんが見た回路図へのリンクでも張って、具体的に言わないと。
69さんが見た印象は分かったけど、それが一般的に問題と認識されうる
ものなのかは分からないわけですし。印象論だけを書き込んでしまうと
フェアじゃないんじゃないでしょうか、って思います。
私も興味あるので、そのあたりを是非詳しく解説していただければ嬉しいです。
IBM age
名のある会社なら仕様だけ投げれば値段なりのものを作ってくれる、 そう思っていた時代が俺にもありました。
>>70 わからない人には、
まるで新人が設計したかのような基板
これ以上の話はできないし、
わかる人には、
まるで新人が設計したかのような基板
これだけで十分に伝わります。
この話で、回路図という言葉が出てくる時点で、あなたは前者です。
>>72 投げりゃ、そりゃぁ、うまくいかないでしょう。
投げられたほうも、そのまま他所に丸投げしちゃいますよ。
>>73 うーん。回路図、っていう言い方が悪かったのなら、73さんの見たボードの写真、
でもいいかなぁ。「分からないやつはすっこんでろ、分かるやつには分かる」
っていう議論がしたいのなら、こんな掲示板に書く必要はないわけで。
職人の勘とか長年の経験の勘、ってやつはどんな業界でも大切なものだけど、、
こういう掲示板で議論する場合は、それを上手く言語化する必要があるのでは
ないでしょうか。じゃないとただの印象操作でしかなく、フェアじゃない
と思います。
>これだけで十分に伝わります。
っていうのは、結局73さんの願望であって、普遍性を持つものでは
ないものなのではと、今のところは思います。
>>73 俺も基板見たけど、まあ試作レベルならあんなもんだろ。
この程度の回路は仕事でよく作ってるけど、最初の試作で一応動作したなら
まあ成功の部類じゃないかな。
新人が設計したかのような・・・言いたいことはよく分かる。素人臭さは拭えないな。
まあ、何度もいうけど、そのまま大量生産するわけじゃないし、
研究レベルならこれでいいんだよ。
76 :
74 :2009/05/02(土) 11:16:48 ID:iGnnLBQu
修正。 職人の勘とか長年の経験の勘、ってやつはどんな業界でも大切なものだけど、、 ↓ 職人の勘とか長年の経験の勘、ってやつはどんな業界でも大切なもので、しかも 言語化しにくいものだけど、
>>74 基板のどこが変なのかという具体的な話をしてもいいですが、それは脱線になると思う。
あくまでポイントは、経験を積んだ人に設計してもらったほうがよいという一般論だから。
脱線だけど、ちょろっと言うと、
回路図では省略できて、しかし、基板のパターン設計では重要なこと
というのがあるんです。
電源のデカップリングとか、部品配置とか、放熱とか。
目標の500MHzではなく380MHz止まりという話の原因は、
1つは、基板の電源回り
もう1つは、チップ内の「放送」
にあるんじゃないかなーと思います。
>>75 研究のための手段が目的になっちゃっているのなら、自分で設計するのも一興で、
とくに学生さんは時間が比較的に豊富で給料も必要ないから、時間をかけて作るのもアリ。
でも、他所との時間と金の競争があるところでは、プロに頼んだほうが早くて安いよ。平均的に。
>>77 デカップリングや放熱に関してはまあ当たり前の話だけど、
GHzに近いような回路では昔と違うノウハウが出てくるんだよね。
電源やGNDを(昔の常識の)ベタにせず、あえてインピーダンスを持たせるとか。
それからチップ内の設計については、(あえて素人向けに書くと)、
配置配線が終わったあとでアノテーションをやるから、設計段階で何MHzで
動作するかはかなりの精度で分かる。
もちろんCMOSプロセスなのでSlowとFastで倍半分違うけどね。
当初狙いの周波数に行ってないってことは設計段階で既にダメだったのを
チップの派生や電源電圧調整で誤魔化しているんだろ。
これも少量の試作レベルならことさら問題じゃない。
ただし設計では到達できていないのに、偶然出現した一番出来のいいチップを集めて、
さらにオーバドライブさせた瞬間最大風速の性能を、さも「実現」したかのように書くのが学者連中。
これは能澤も指摘している部分で唯一まともな点で、メーカと学者のマネジメントや責任の違いだろうね。
安く作ったことを宣伝しているけど、失敗しないためのコストや人件費は入ってないから。
いろいろと突っ込んで、すみません。
>>69 >要件定義だけして、後はすべて、経験のあるメーカーに任せるべきだったのです。
何か勘違いされていませんか?ある研究を推進するには GRAPE-DR が必要
ということで、科研費を申請しているなら、あなたの言う通りだと思います
が、GRAPE-DR を開発するということでお金を取ってきている以上、要件定義
だけして、あとは丸投げではお話になりません。
GRAPE-DR がどういうプロジェクトで、これまでにどのような情報が公開
されているかを一次情報に遡って議論しないで、二次的な情報にご自身の
解釈を入れ込んでしまうと議論が変な方向に行ってしまいますよ。
>>77 興味あるし脱線でもないと思うのであえてひっぱると、
> 電源のデカップリングとか、部品配置とか、放熱とか。
部品配置は、チップが4個きれいに並んでないのは、たぶん通信経路長を最短にするため。
そのあおりで放熱、というか風の通りが悪くなっている、というとこまでは分かる。
他には? あと、もっとマシな配置があるなら知りたい。
>>78 > 設計段階で何MHzで動作するかはかなりの精度で分かる。
> もちろんCMOSプロセスなのでSlowとFastで倍半分違うけどね。
結局、設計段階でわかるのかわからないのか、どっちなん?
素人な質問ばかりで申し訳ないが、素人むけに書いてもらった説明のはずなので
できれば教えてほしい。
>>78 2ペタFlopsを得るために、
チップを4個積んだボードを2枚さしたPCサーバを512台ならべてクラスタにする
という話なので、少量の試作・・・では済まないと思う。
>>79 もし安定稼働しないなら、それは、動くとは言ってはいけないと思う。
また、たとえ500MHzで安定稼働するチップが取れるとしても、
500MHz動作保証で選別すると歩留まりが悪いのであれば、
500MHzを定格にしてはいけない。
380MHzという数字のソースは
ttp://www.kfcr.jp/grapedr.html 表を見ると400MHz動作が定格のようだが。
>>82 じゃ簡単に説明するよ。
微細加工の極みである半導体集積回路は、製造のバラツキを避けられないから
どうしてもロット毎、ウエハ毎、チップ毎に特性が変わる。
しかしどの程度バラつくかは(統計的に)分かるので、それを設計のパラメタに入れる。
すると、製品として許容できる範囲のものづくりができた場合には、
最低いくら(Slow)、最高いくら(Fast)というのが設計段階で分かる。
ASICの場合は、最低の出来でもLSIのスペックを保障する必要があるので、シリコンがもっとも遅めの
性能で出来た場合を想定した設計をするのが一般的。
メジアン辺りで設計しちゃうと出来たチップのうち半分は捨てないといけないからね。
PC向けのCPUなどは速度選別して値段付けして売れるからこれとは違う考え方で設計されることも多いけど。
つまり、製造で倍半分はバラつくが、設計段階でSlowで何MHz、Fastで何MHz、というふうに把握できているわけ。
まともなFabでまともな設計者なら。
逆に設計でその程度のことも押さえられないようじゃ、
ランダムバラツキや信号伝送のSkewやジッタもあるからSetup, Holdを満たせなくて全く動かないか、
半導体プロセスの性能を生かしきれないしょぼいチップしか設計できないのよ。
要はASICと言えども単に最新の半導体プロセス使うだけじゃ性能はなかなか出せないわけ。
牧野先生辺りもこの辺をちょっと甘く考えてるんじゃないかな。
説明ありがとう。詳しく説明しておいてもらって申し訳ないが、だいたい知ってる話だった。 俺もFPGA用の回路ならよく設計してるから。 で、そんな俺ごときでもやってる程度のことを彼らがやらずにASIC設計 してるわけはないんじゃないかとは思うが。過去のGRAPEで何度もASICおこしてるし。
>>85 知ってるなら聞かないでくれよ。
俺が書いた内容は素人でもちょっと興味があれば常識的なこと。
>そんな俺ごときでもやってる程度のことを彼らがやらずにASIC設計
彼らがやらずに作ってるなんて一言も書いてないが。
やった上で当初目標性能は未達成の設計でテープアウトしたんじゃないのか?と言ってるだけ。
全部俺の勝手な予想で適当なことを書いているだけだ。
当事者が見りゃ、まあいろいろ思うところはあるだろうが。
わるいわるい、じゃ俺も勝手に予想すると、 安物のFPGA使ってるせいでこっちのタイミングが厳しいとか。 あるいは誰か言ってたみたいに電源周りか?
実機と結果報告が手元がない分、結局ここでの議論は憶測の域をでないんでしょうね。 でもここまで読んで、すごく面白かったです。 もしよければ、 15億でGRAPE-DR(もしアクセレータ的な考え自体に反対ならば、クラスタなHPCでもいい) を作るとしたら、ここにいる人ならどう作るか?(上の議論を踏まえれば、どの段階から業者 に投げたほうがいいかを、明確にしてもらうといいかも) って観点で持論を整理してもらえると、分かりやすくて嬉しいです。 GRAPE反対派も擁護派も複数名いるみたいで、しかもどちらの派も個々人で意見が違うみたいだし。
>クロックねえ、、、いや、その、Arria GX なんで。メモリ周りが DDR 233 で、というのが一応メーカー側の主張でございます。Stratix や Virtex を買うお金はないし。
15億にこだわらずに最小限の投資でlinpack top1とるとか10P達成するにはどうすればいいのか考えてみるのがいいのかもね。 ベクトルカルトやcell厨は御遠慮下さいということで。
>GRAPE-DR チップ自体は worst 500MHz の設計なので、周辺が間に合う なら 600 くらいでは回る。 能澤徹オワタ?
評価対象がGRAPE-DRチップなのかボードなのかシステムなのか プロジェクトなのか、その辺りを分けた方が良いのでは? 15憶の使い道としては、能澤や池田に投資するより1000倍マシ だと思うけど(w
2007年度中に稼働開始するハズだったのに、4チップ版のボードの調達が2008年度末にズレ込んだ。 その原因は、学生ベンチャー臭い会社にコネで発注したことにある可能性を検討してみよう。 FPGAの発表・サンプル出荷を待っただの、 ローエンドFPGAに独自開発でPCIe x8を付けただの、 メモリインタフェースが遅いだの、云々・・・ いくらFPGA自体が安くても、開発費が嵩んだり、納期を守れないようじゃ、話にならない。 綱渡り的に特定のFPGAと心中するのではなく、その時点で使えるモノを選んで使うべきだろう。 こんなGRAPE-DRにとって本質的には無関係な、実装上の泥臭いリスクを、なぜプロジェクトが負ったのか。 それが出来ないのは、コネで癒着していて切るに切れないからだろう。 本来なら、発注先の会社が負うべきリスクであり、 納期を守られなければ契約を破棄して他所に発注し直すべきだったろう。 各メーカーの各ラインのFPGAを巧みに使い分けられるプロのFPGA屋に仕事を頼めば、それほど期間は必要ないだろう。 ただし、彼らはGRAPE-DR専属ではないので、発注側の手間は格段に増えるが。 これが事実ではなく、想像であることを願いたい。
Intel Core i3が遅れたのもコネのせいですよねw
まあ遅延なんて世界一のIDMであるIntel様ですら常態なんだから 遅延という一事のみを取り上げて失敗だと叩くのは xxxxxが、xxxxxで、xxxxxな人だと思いますw
スパコンの世界では遅延は重大な問題
99 :
78 :2009/05/03(日) 09:21:28 ID:CqbT149Z
GRAPEチップがちゃんと500MHzで出来たんだったら、ひとしきりFPGAで遊んだ後は そいつもASIC化した方がもう安いんじゃね? 90nm辺り使えば今ならそんなに高くないし、もうDDR2のIPもそろってるだろ。 ちゃんとやることやって結果を(反省も含めて)公表するなら、俺は後5億くらい追加しても 全然問題ないと思うよ。
>>100 装置構成上、上からでも横からでも電源コネクタを挿せるようにしてるとか。
入力Lがないって、ただのステップダウンコンバータだろ。
リニアのコントローラにFET、その先にLが付いている普通の構成に見えるが。
>>101 > 装置構成上、上からでも横からでも電源コネクタを挿せるようにしてるとか。
それならば、もっと右のほうに付けると思う。
どうも配置的に、右端にあるのがSINGの電源、中央にあるのがFPGAの電源、って感じに見えるよ。
> 入力Lがないって、ただのステップダウンコンバータだろ。
> リニアのコントローラにFET、その先にLが付いている普通の構成に見えるが。
おそらくリニアテクノロジのデータシートの回路図を、ほぼそのままコピペしたのだろうが、
それに書かれているVinというのは、電源ユニットから基板への入り口ではないよ。
適切にLCフィルタを構成するのは、設計者の仕事だよ。
>適切にLCフィルタを構成するのは、設計者の仕事だよ。 そういう意味か。 改めて写真見ると確かに何も無いな。
>>104 こういう匿名の場所で、そういうレスは無粋だと思います。
>>94 開発費が嵩んだ、っていうのは本当なのでしょうか?国からの予算で、
出せる予算って始めの段階で決まってるのでは?これは94さんの推測ですか?
純粋な疑問なんですが、こういう研究開発に付き合ってくれるFPGA屋さんって
どのくらい日本にあるのでしょうか?
ボードを外注にすればまだ市場にないFPGAの分までメーカーさんがなんとかしてくれるはず、って発想は画期的だね。
プロジェクトとしてFPGAへの依存が大きいというのは仕方がないとはいえ確かに問題。
>>99 さんのいうようにまずは高いFPGAで動くもの作って、それをASICでというのがもの作りの正攻法かも。
シリコン焼くのは一回ぽっきりで計算機作るというのが無謀なんだろうけど。
>>105 > 開発費が嵩んだ、っていうのは本当なのでしょうか?
推測でしかありません。
しかし普通は、開発費は開発期間に比例する部分が大きいですから、そう外れてはいないでしょう。
通常、技術者を確保しつつタダで待機させることはできないので、金を払わなければなりません。
馬鹿正直に本当のことを言って払うのは、まずムリなので、何かを買うとか、そういう形になるかと。
>>106 皮肉はよしてくれ。
体力があるメーカーさんと信頼関係があれば、それ相応の金額で仕事をたのめば、リスクを引き受けてくれる。
値段の高い上位製品を使って間に合わせるとか。やりようはある。
恐いもの知らずの人を使って綱渡りをし、奇跡的な安さを実現する博打とは比べ物にならないほど高くなるけど。
GRAPE-DRがFPGAを使うのは、計算内容によってFPGAを書き換えるからだろう。
ASICにするにしても、FPGAに近い何かになるので、ASICにする意味がないと。
基板が変だという話だが、拡大写真があった
ttp://www.kfcr.jp/gpcie-agx8.jpg KFCR社がArriaGXの評価ボードとして売っている基板なのだが、
GRAPE-DRボードの右半分に部品を実装していないだけのシロモノ。
ふつうFPGAの評価ボードつったら、I/Oピンがコネクタで出てるものだが。
いったい、誰が買うのだろう。
おっと話がそれた
この写真を見ると、やはり2つの電源コネクタは役割が違うようだね。
>>107 お金がとてもたくさんあればね。
現実的に存在しない選択肢を取らなかったことを叩こうとしているようにもみえるが。
GRAPE OBのベンチャーは値段相応の働きはしたように思えるが。
民間のプロジェクトと違って、技術者を囲って月給を払う必要はないから、工期に比例するコストってほとんどないんじゃないかな。ポス毒は雇えるけど、今年度はもういないでしょう。
プログラムが動くようにすればいいんだから、ASICでいいはずなんだよ。仕様が固まっていて一発で動けばね。
>>109 やっぱりKFCRって、GRAPE OBの会社なのか。
> 技術者を囲って月給を払う必要はない
KFCRの中の人は月給が必要だし、KFCRの事務所の家賃等々も月々かかるよ。
KFCRが途中で潰れたら困るから、KFCRの資金がショートしないように仕事を発注してると思う。
たとえば、案件を細切れにして段階的に検収するとか。何か追加で購入するとか。
もし開発期間によらずギャラが同じだとしたら、ALTERAのリリースが遅れた分、KFCRは大損害だよ。
> プログラムが動くようにすればいいんだから、ASICでいいはずなんだよ。仕様が固まっていて一発で動けばね。
それが、GRAPE-DRでも
ttp://www.kfcr.jp/pgpg2.html を使うらしいんだよ。
プログラムでシーケンシャルに計算するのでは速度が出ないのでしょう。
KFCRはDRの案件とってきてはいるが基本的に自活している会社。ボードの発注はアルテラのスケジュールに合わせて無理のないものにしているでしょう。その辺のリスクはKFCRでなくプロジェクトが背負う。あくまでも私の勝手な推測ですけどね。 PGPGは、相互作用のかたちを指定すればFPGA用のパイプラインもDR用のアセンブラも吐いてくれるツールじゃないかな。
プログラムでシーケンシャルに計算するんですよ。ただし512個のPEがSIMDで。命令は制御チップからブロードキャストされる。
KとFの経歴は会社案内に書いてあるね。研究者としては勝ち組だけど企業家としては今後どうなるんだろう。
>>111 Arria GXが間に合わなかったのだと思うが、初期のPCI-Xな試作基板にはStratix2が実装されているようだよ。
Arria GXのサンプルが手に入るようになってから仕事を発注されたとは、とうてい思えないくらい初期から参加してる。
ていうか、GRAPE-DRに合わせて会社設立されてないか?
>>112 いや、PE×512のカスタムLSIだけでなく、FPGA側でも多少の計算をするようになってたと思う。
GRAPE-7に合わせて創立されたんじゃない?DRとどっちが本命だったか知らないけど。 PCI-Xのプロトタイプと量産版は別の案件でしょ。あくまでも推測ね。 FPGAでやらなきゃならない演算なんてある?そういうハイブリッド構成というのは自分の聞く限りないなぁ。
118 :
不明なデバイスさん :2009/05/05(火) 22:18:55 ID:WrvyYT8A
4チップのLINPACK値?
だとしたら7割ぐらいの効率はでてるの?
124 :
不明なデバイスさん :2009/05/08(金) 22:47:15 ID:GY5SXyEd
結局、いくら安くてピーク性能が高くても 用途に強い制限があったりマニアックな最適化をしないと使い物にならないようなものは 計算機学者のおもちゃだってことだわな。
用途があってればいいんじゃね?
用途を制限しないと、どんなB/Fのアプリでも効率出さなきゃいけないということになって、結局メモリバント幅に全ての投資を回すということにならない?まあ、極論ですが。
量産効果が出るまでSX-Nみたいのを作るとか 市場がないね
で、天文台はSX-9とXT-4、GRAPE-DRの三本建てということらしいけど、こういう構成にすろことや性能やお金の配分比率に異論のあるひといる? XT-4一本でも良かったんじゃと個人的には思うこともある。
>>132 SXはメモリバンドがコストに直結してるんじゃないかな。メモリからCPUにたどりつまでの配線の複雑さとか考えるとそんな氣がする。
たくさん作ればなにかやり方があるんじゃないかなー と素人考え
SXもクソのように叩かれてるから、もうB/F落としてピーク性能を上げる方向になるだろ。 Linpackの値で価格や消費電力を比べられるんだから、もう今のようなマシンは作れないだろ。
>>128 メモリのランダムアクセスがボトルネックになるとわかっているのなら・・・
64bit幅のメモリモジュールをバースト長8で使う
PCのメインメモリに頼らず、
16bit幅のメモリチップをバースト長4で使い、それを沢山ボードに並べる
っていうアプローチをすればいいのに。
メモリのランダムアクセスでは、データ自体の転送に要する時間よりも、それ以外のほうがずっと大きいからね。
素人考え的には色んなのがあった方が面白いんじゃないかと 思ってみたりするけど、そういうのじゃ駄目なのかな〜
Intelみたいに儲かってるならそれでいいんだろうね
儲かればペイすれば、用途があれば市場があれば 天気予報核開発流体計算宇宙物理学バイオ
牧野先生の文章を読むほど、綱渡りだなぁって思う。 10GbEの値段が下がらなかったので、 メモリの値段が下がらなかったので、 ・・・ええーっ、そんな外部要因に大きく左右されちゃうの〜。 しかも、ホストPCについては、 現時点では予算内で性能が高いものが手に入るが、 2008年度の予算に間に合わなかったので、高くて性能の低いものを買いました って、お役所仕事の弊害だよね。 予算を使わずに取っておいて、最終局面に一気に購入できれば、 同じ金額でより高性能なものが得られるのに。 金利と性能をドブに捨ててる。ある意味、税金の無駄づかいだよ。 しかし、プロジェクトが順調に進んでいれば、 2007年度には稼働開始しているはず(2008年度は増強分のみ)なので、 つまりホストPCは2006年から2007年に調達されてたわけで、 スケジュール遅延によって、より高性能なホストPCを買えたとも言えるね。 まぁあれだ。現物はなるべく後に買ったほうが得だが、 先行して買わないといけないので、在庫している間に陳腐化ってのは、 なんか、モルフィーを思い出させる。
>>142 確かに。
でもメーカの場合は顧客に約束した性能を約束した時期に達成しないといけないので
開発プロジェクトは大学なんかより格段に厳しいと思うよ。
そういう意味では、ある瞬間にもっとも安価なコモデティ製品と
メーカ製のシステムを値段だけで比較するのはアンフェアな気がする。
研究のスピードを左右するような先端HPC分野や宇宙開発分野においては、だけどね。
だれでも買えるような実験器具やPCなら世界中から一番安い製品を買えばいいけど。
>>137 ピンネック、intelだって3chなわけで・・・
一方で、まさにソレを力技でやってるのがSX
>>144 2のN乗の距離のストライドアクセスなら、
独立したDRAMコントローラを多数もつのではなく、
1つのDRAMコントローラのアドレス出力に細工することで、
比較的ローコストに実現するんじゃないかと。
ちなみに、SunのUltraSPARC T1は、DDR2を8ch持ってる。
2chずつ束ねて使うのでランダムアクセス性能では実質的には4ch分だが。
T2になると、FB-DIMMになってしまうが、やはり8ch(やはり2chずつ束ねて)
しかも、10GbEのMAC(ワイヤースピードが出るという)を2つ内蔵してる。
ただし、CPUから直に出ているPCIeが、あまり速くなかったような気がするし、
Sunのサーバは値段が高いんだよね・・・。
>>128 これだけ読むと、専門が天文学だとはとても思えないなw
148 :
不明なデバイスさん :2009/05/11(月) 19:18:21 ID:T/EfcP8C
あれブログの中の人降臨age
天文学の専門家が自分用コンピュータのなにかをつくるのはよくあること
でもさ、手段が目的になっているような気がするよ。
手段のために目的を選ばないのもよくあること。
>>147 それってむちゃくちゃ少ないって意味かw
理論でガチ固めるとかorderを考えfactorを考えないとかいう側面があるとすれは天文屋さん的。
設計を全部済ませてから、製造したいから予算くれ、っていう話に持っていけなかったのかな。 シミュレーションでは高い性能が出ている、予算さえ出れば数ヶ月でTop500の1位に入る って言えば、単年度で15億、取れたんじゃないかな。
カスタムLSIのプロジェクトで、一年では無理なんじゃないかな。 市場にあるFPGAやGPUと、コモディティのホストやネットワークでこれだけのことができます、ってのなら可能かもしれんが。 DRにしても、本来out-of-orderでできるはずの仕事もin-orderになってしまっているともいえるかもしれん。 あ、実行ユニットが足らんのか。
>>154 チップも論理設計までは終わらせておくのよ。
もちろん、それには結構な金額がかかるが、それは設計フェーズとして予算を取ってさ。
最終的にものができなきゃその設計予算は無駄に終わるわけでしょ。 PEの設計が、できていれば後はそのときのプロセスルールにあわせてスケーラブルに、みたいにこの世がなっていればいいんだけどさ。
>>156 > 後はそのときのプロセスルールにあわせてスケーラブルに、みたいにこの世がなっていればいいんだけどさ
いまどきの物理設計屋さんは優秀なので、物理設計にはそれほど時間がかからないよ。
現実問題、カスタムのコストはうなぎのぼりなわけでさ。シンプルなPEさえ設計できたらそれを並べたものは安価に製造できるようになって欲しいよね。
ふと思ったんだが いっそのこと 科学技術計算用特化したFPGA ってのを作ったらどうだろう たぶん既に検討して、ダメってことになったから、やってないのだと思うけど。
ふつーのFPGAとどう違うの? 強力なDRAMコントローラつけるとか単精度積和ユニット内蔵して4つ使うと倍精度としても使えるとか?
SocketBに挿せるとかじゃねw
>>161 ん、それ何てGPU?
汎用のFPGAで演算器が多いものを選んでも、自由度の高さと引き換えにパフォーマンスに劣る
自由度を下げて、その代わり、演算器を増やし、遅延を減らし、動作クロックを高められると思う。
京速計算機って今どうなってんの?
京速は、地球シミュレータの失敗を反省してないと思う。
ttp://www.jamstec.go.jp/es/jp/es1/status/index.html の「ジョブ規模別計算資源利用状況」を見ると、
需要よりも大きなサイズのスパコンを作ってしまったことがわかる。
スパコンはリアルタイム処理ではないし、
大勢で共同利用していると、
計算よりも順番待ちの時間のほうが長いので、
半分のノードでも倍の時間で計算できるなら、
半分のノードでやったほうが安上がり。
とくに地球シミュレータは単段クロスバーという贅沢な構成なので、
少ないノード数のジョブを投入するのは、もったいなさすぎる。
それでも地球シミュレータに少ないノード数のジョブを投入するのは、
研究機関単位でSXをリースするよりも安いからで、
それは、大家が身銭切って安い家賃で部屋を貸しているようなものだから。
最後のほうは、利用者が足りなくて、学術研究だけでなく、
民間企業の産業部門にも使って欲しいなんて言ってた。
おそらく京速も同じことの繰り返しになりそう。
>>168 うぉっちのTypical Supercomputerというのはネタか?
うぉっち系はそもそもネタサイトだろうw
なんかこのスレ褒められたみたいね。
皮肉でしょう この程度で、えらくまともって言われたら恥ずかしいわ。
富士通がSPARC64の新しいの作ったってさ。
>>173 ,174
どこぞのブログと比べて、って話だろうよw
先生、2chなんて見てないで仕事してくださいw
何年か前までは物理板とか、ちょくちょく大学の 教授クラスが来てカキコミしてたようだが… 最近はどうなんでしょねw
>>178 このスレの実質前スレであるItaniumスレでは少なくとも去年の夏には話題になってた
746 名前:不明なデバイスさん[sage] 投稿日:2008/08/31(日) 11:39:42 ID:yURRhG8z
> また、富士通の発表では、最後に予稿集に含まれていないおまけスライドが表示され、Venus(ビーナス)と呼ぶ
> 開発中の次世代SPARCチップの概要が公開された。それによると、Venusは45nmプロセスを使用し、8コアを
> 1チップに集積するペタスケールコンピューティング向けのCPUであり、HPC-ACEと呼ぶSIMD機構を搭載し、
> ソケットあたりの性能は128GFlopsとなっている。また、CPUチップにメモリコントローラを内蔵するという。
> 時期と内容から見て、富士通担当の次期日の丸スパコンのスカラ部には、このプロセサが使用されるものと
> 考えられる。
747 名前:不明なデバイスさん[sage] 投稿日:2008/09/04(木) 22:51:39 ID:Imfx6nOm
HOT CHIPS 20 - 富士通の次世代SPARC64チップ「Venus」は8コア
http://journal.mycom.co.jp/articles/2008/09/02/hotchips3/
>>181 おおー!
これはこれはご丁寧にありがとうございます
SX-9が既に100GF超えてるから45nmで128GFつってもそれほどの驚きはないなあ。 それより富士通が45nmプロセスで製品を作れるレベルにあるって方が驚きだw
ヴィーナスにウブンチュでものせて、ネットブック作ってくれ!
SX-9もVENUSも、マネージできるキャッシュみたいなのを積んでいるね。CellがLSを 積んで賛否があったけど、この二つは結果的にそっちの方向に進んでいるといえるかな。 LSほど困難な仕様でもないみたいだからほどよくよいかも。でもSXの場合は批判されるのかな。
>>184 /.Jにもいたけど、ワークステーションでさえSPARCは滅びたのに。
>>183 GF出すのは簡単なんだけどさ、SXより圧倒的に周辺回路は単純なのが良いところだよね。
あとはメモリバンドとスケーラビリティ。
あと何倍か安ければ文句ないんだけどね。
ちなみにISAもx86+AVXにして欲しかった。
たぶん、SPARC64 VIIの後継としてエンプラ向けのサーバにも使うだろうから、SPARC64であることは捨てられないと思う。
SPARC64は、FX1でもアレな評価の 足回りを速くしないと・・・ 瞬間最大じゃなくて
195 :
不明なデバイスさん :2009/05/14(木) 03:35:29 ID:g87bF3Mk
なななななな なんだって〜〜〜〜〜!?
最低 IBM野郎のFUDに負けんなよ
Marcedのころは IntelのFUDに負けた会社が多数あったのもじゃ
Fの128GのCPUの隣にHの1Tのアクセラレータなんかが座るなんてウルトラCがあれば楽しいんだが。
>>194 残念だ。
NECが降りたら、その穴はどうやって埋めるのか。
NECの撤退は残念だけど、1/3以下の費用で富士通の尻拭い(実アプリの効率は全てベクタみたいな)を 押し付けられる可能性があったのだからある意味、いい引き際だったと考えられなくもない。 M先生も天文台のSX-9が東北大のSX-9とは比較にならないぐらい安いと書いていたようだが、 単一ノードとマルチノードじゃ当たり前だろ。しかも単段クロスバーでつながってるんだから。 むしろ阪大のシステムがかなり割高になっているように思える。
何か裏がありそうだな
考えられる可能性としては
・実は開発が進んでいなくてプロジェクトが頓挫・破綻してきたのを隠しきれなくなった
・どこかの鶴の一声で、富士通一本に絞ることになった 読売の昨日の報道は地ならし
他には何があるだろう
>>200 単一ノードを長時間回せば済む計算なら、単一ノードを何台も並べて別々の計算をしたほうが安いよね。
しかも、単一ノードなら単年度にドカンと導入しなくていいので、常に処理能力が上がり続ける。
富士通だけじゃ面白いのが出来なさそう…
つうかスパコン撤退とか書くからSXシリーズ終了かと思ったよ。
将来的にはSXやめる可能性もある、みたいな記事じゃなかった?
>>202 ・SX-9で報告されているようにB/F値の低下に伴い、実行効率が半減し
次世代ではさらにこの傾向が強くなる。
・単段クロスバーからFat Treeに変更したところ、不具合が多発し、
実行効率も最悪。
以上から、ESのときのような実アプリでの華々しい成果を出すには、
B/F値の維持とノード間通信・MPIライブラリの整備及び実アプリのチューニング
が必要だが、それに回す金はない。元々NECのソフト開発能力が高いとは
思えない。
しかし低速SPARC+山のようなコンパイルオプション
=最適化しすぎで、計算結果が変、といった富士通製品にはうんざりだ。
NECの撤退で次世代は叩きどころ満載になりそうな予感w
パフォーマンス厨ニングですね わかります
いま209が良いことを言った。
>>209 どうもm(__)m
実際未執行の予算がどれだけ残っているのか知らないけど、1000億と仮定して
100億ずつ10個の大学研究機関に配って、1TFLOPS=1000万円換算でシステム
作れって言ったら 1PFLOPSのスパコン10個作れるだろうに(日本企業に発注
したらちょっときつそうですが)。
まぁ、1PFLOPS級置くには施設の増強とかに金が掛かるだろうから、全部 1PFLOPS
とは行かないまでも、500TF-1PF クラスが10個できた方が研究者や外部使用で
利用できる私企業なんかも嬉しいんで無いですかね?
10PFシステムひとつの方が遥かに国益に適うと思うけど。 全ての性能で10≧1×10じゃん。なんで1PF×10の方が良いと思うの?
>>213 横レスすると、
国益はともかく性能や効率を考えると、
各ノードの性能が一緒なら、
10PF <= 1PF×10
なんだわ。
どうせ丸ごと使うのは TOP500 Challenge と HPCC ぐらいでしょ。 だったら、1PFx10 でアーキテクチャがそれぞれ異なってた方が良くないですか? Vector+Scalar やめて F の Scalar だけになりそうですし。 だったら、Vector, Scalar Cluster, GPGPU Hibrid などなど各機関が特色持った スパコン作った方が良くないですか? Vector 使って 100億=1PFはコスト的に成り立たなくて小さくなるけど、 GPGPUとか使えば100億で数PF は行くでしょう、実効性能は落ちるけど。 10PFの単一システムに合わせてアプリ書きなさいより、自分の研究に合いそうな アーキテクチャ持ったスパコンに合わせて書いて良いよと言うような選択性が 合った方が良くないですか? 実際問題 F が作る SPARC で 10PF スパコン作ったからって、それが一般に広がって 行くとは思えませんね。地球もそうだったけど。で、結局大学とかが使うのは x86 Cluster だったりするわけですね。 10≧1x10 って言うけど、10PF の方は Vendor の持ち出し百億クラス。1PFx10 の 方は予算内でできるんじゃないですかね?持ち出しがあったとしても10億も行かないでしょう、多分。実際、US とかは 1TF=1000万切ってますし。
地球シミュレータの利用実績からは、 まったく同一のシステムでも、1PF×10のほうが良いと思う。
10PF単一システムを1/10づつノードを分けて使うことはできますが、 分散した1PFシステムでは数PFの実行速度は得られません。 また、将来普及する性能、並列度でのソフトウェアを先行開発する という側面も無視できないと思います。 >持ち出しがあったとしても10億も行かないでしょう 普及レベルの製品のためにベンダーが自腹を切る事はないのでは?
>>217 > 分散した1PFシステムでは数PFの実行速度は得られません。
リアルタイム処理をするわけじゃないので、得る必要はないと思う。
Top500で目立つこと以外には。
> また、将来普及する性能、並列度でのソフトウェアを先行開発する
> という側面も無視できないと思います。
それじゃぁハードウェアがサービスインしてから何年も無駄使いするってことじゃないか。
ハードウェアがサービスインする前に、ソフトウェアを「先行開発」しておくべきだろう。
(実機がないと開発できないようなところは、脱落すべきだ。)
> 理研は、現在、文部科学省が実施しているプロジェクトの中間評価の過程で得た技術的な意見も踏まえ ベクトル不要論を突きつけられたのかもな。
意外な展開
ワシントンポストまで…
>>217 >10PF単一システムを1/10づつノードを分けて使うことはできますが、
>分散した1PFシステムでは数PFの実行速度は得られません。
TOP500みたいなグランドチャレンジ以外で一般ユーザが全ノード(1/10でも)
占有して使えるのであれば。
使えたとして、10PF までスケールできる一般アプリがあるのかと。1PF
でも怪しい。parameter run で数千万ー数億 jobを投げるのならありかも、
それで何を得たいのかは不明ですけど。
TOP500 で1位になるのが「国益」じゃないですよね?
先行開発云々は
>>218 の方が書き込んでくれてますので、割愛。
>普及レベルの製品のためにベンダーが自腹を切る事はないのでは?
いや、実際かつかつですよ、予算に見合わない性能求めるから。
「秋葉原ではいくらで売ってる」みたいな感じで予算組んできたりする。
これは極端ですけど、普及品(x86系)は実勢価格が分かりやすいので、
元々マージン少ないところにさらに値引かないと Spec in できなかったり、
構築・保守費足したら持ち出しなんてざら。
その点、SX とか FX1 とかはお客と握ってるから逆にマージン取れるかも。
長文すんません。
そしてGRAPE-DRが残った
そもそも、そんな巨大なスパコンは、日本に必要なのだろうか。 地球シミュレータの利用実績を見ると、 相対的に性能が下がるにつれて、 使用ノード数が多いジョブの「ノード数×演算時間」が増えている しかしそれでも、 全ノードの半分を越えるようなジョブのそれは、全体のごく一部でしかない。 良く言えば、古くなっても使える 悪くいえば、宝の持ち腐れ 地球シミュレータでさえも、その全力を発揮させる使い方がほとんどされなかったのに、 それよりも巨大で実効性能を出しにくいシステムの全力を、いったい誰が使うのだろう。 利用者不在で、手段が目的になっているような気がしてならないよ。 NECが離脱した理由は、もしかしたら、日本でのスパコンが供給過多になるのを恐れたのかも。 赤字で売って、そのうえ利用者が足りなくて空き時間を民間に安く解放されちゃぁSXが売れなくなる SXを売るためのフラッグシップ案件としての宣伝料どころか、自分の首を絞めるのに金を払うようなもの ・・・さすがに、それは考え杉か?
> parameter run で数千万ー数億 jobを投げるのならありかも、 > それで何を得たいのかは不明ですけど。 トリップ検索w
当初は「京速」をキーワードに「次世代」を強調していたけど、 突然「国策」って言葉が前面に出るようになったね。 「国策」という熟語は「税金の無駄使い」とか「失敗に終わる」の 接頭語に思えちゃうんですが。(cf.国家プロジェクト)
Σプロ(うぁ、何する止め/w
単に企業や大学レベルで持てないようなでかいシステムを組むって レベルのプロジェクトに成り下がるのならもう止めるべきだろうな。 そんなIT公共工事をやるよりは、プロセスとかアーキテクチャとかの 基礎や要素技術の長期研究に金出す方が国の仕事として正しいと思う。
>>232 ん?2択なの?両方やればいいと思うけど。
234 :
不明なデバイスさん :2009/05/15(金) 06:06:33 ID:lQroTEl1
>>231 231さんの友達です。231さんはΣプロダクションと言いたかったそうです。
きちんと231さんが供述した内容を書いた文章に、231さんの母音も頂きました。
231さんはしばらく人里離れた場所でひっそりと暮らしたいそうなので、探さないで挙げてください。
では、引き続き議論をどうぞ。
第五世代プロ(うぁ、何する止め/w
236 :
229 :2009/05/15(金) 06:57:11 ID:lRvjQ3IJ
>>230 あ、誤解されたかも。
マスメディア側はそういうムードに
なってきてる(ということにしたい?)
のかなぁぐらいの意味です。
個人的にはどんどんやれーって感じw
237 :
235 :2009/05/15(金) 08:12:11 ID:lQroTEl1
私も旅にでます。探さないで下さい。
>>233 両方やる金があるのならやればいいんじゃねぇの?
でかいことに意義があるモノを作るなら 企業ぎゃ大学レベルで持てないようなでかいシステムを組むってレベルのプロジェクトでもいいかも。。 じゃあでかいとこに意義があるようなプロジェクトとはなにかと。
ひとつのアプリケーションがシステムを占有して計算し続ける ような用途なら企業や大学より数年早く結果を得られる。 基本的に最先端のスパコンはそう使うべきだな。
>>233 両方やるほど金がありあまっていれば、ね。
IT箱物行政は、効率が悪すぎるので、やるべきじゃないってのは、いいよね?
ヲレはIT箱モノやればいいと思うよ 人材育成と技術の底上げになるならね
>>240 巨額を投じた公共的スパコンを占有するなんて、無理無理。
誰が使うかで揉めるよ。
地球シミュレータの実績を見なよ。
ノード数×使用時間×ジョブ数
をノード数別に見ると、256ノード以上の割合が1割くらいしかない。
逆に1〜16、32ノードあたりが非常に多い。
地球シミュレータは640ノードが単段クロスバーという豪勢な仕様なのに、
X-6で済むような規模の計算に使っていたってことなのよ。
占有するに足る用途や正当性や政治性がないとね
地球シミュレータ256ノード以上のジョブはメモリ量でいえば4TBを越える訳だ。 2009年時点で、大学の全国共同利用施設で4TBのメモリを越えるジョブを常時開設している施設はない。 それを2002年時点で達成し、常設ジョブとして受け入れ10%近くのジョブがこれを占めていたということは、 ハイエンド計算機として十分活用され、かつ現時点でも十分な能力を持ち続けているといことだよ。 もちろん消費電力等は、考えてない。
でかいジョブを動かすためにでかい計算機が要るってのは分かるけどさ。 それなら大学や研究所ごとに計算センター持つのを止めて何箇所かにまとめる とかで済む気がするんだが。
>>245 ジョブのメモリのサイズがボトルネックなら、演算速度よりもメモリ量にコストをかけるべきだろう。
地球シミュレータは、ノードのメモリを倍にする代わりに、ノード数を半分にしてもよかったろう。
> 10%近くのジョブがこれを占めていた
演算速度が半減しても20%だから、まだまだ余裕だね。
地球シミュレータから追い出された50%分は、小さな演算なので、別の小規模なスパコンで桶
>>247 そんな無意味な計算してアホか。ESでしかできない計算が100%なら満足なのか?
2009年時点でES・256ノードを越えるジョブは運用できていない。
つまり2002年からすればもっとたくさんのジョブがESでしか実行できない状況で、
実行されてたってことだ。
>>248 > そんな無意味な計算してアホか。ESでしかできない計算が100%なら満足なのか?
100%はありえないだろ。
> 2009年時点でES・256ノードを越えるジョブは運用できていない。
運用する必要がないんじゃね?
T2Kですら、そのメモリは地球シミュレータのそれを上まわってるしさ。
4TBなんてSX-9×4ノードでしょ?東北大でも阪大でも普通に実行できるんじゃね! ?
酔っぱらいの妄想だが。 GPUを使ったPCクラスタは、 GPU→ホストPC→Infiniband→Switch っていうヒエラルキーになってるよね。 ホストPCとInfinibandを端折って、 GPU→PCIe Switch っていう構成は取れないものだろうか。 メモリ4GB搭載の1.6TflopsのGPUを16個、PCIe Switchで繋いで、4Uのシャーシに押し込めるのよ。 シングルノード構成だと、これを制御PCにPCIe x16のexternal cable 1本で繋ぐ。 25.6Tflops、64GB。 マルチノード構成では、4UのシャーシからPCIe x16のexternal cableを16本出す。 そのうち15本を他の15ノードに繋ぐ(フルメッシュ)。残り1本をPCIe Switchを経由して制御PCに繋ぐ。 409.6Tflops、1024GB。 そのPCIe Switchって何だよって? まぁ気にするな。 ホストPCを使わないメリットは、レイテンシとバンド幅。
Teslaじゃん
いやいや、Teslaは外付け筐体つっても、PC本体にGPUカードをザクザク刺すのといっしょ。 PCIe Switchは、ただのバスブリッジで、GPU間で互いのGPU上のメモリにアクセスできるわけじゃないでしょう。
したらOSはGPUごとにいるでしょ
OSというほど大層な機能は必要ないかと。
PCI Expressの物理層、データリンク層を初期化するにはOSがいるやん
注:PCI Expressはシリアル・バスであるため, 単に物理的に線をつなげただけでは通信できない. 初期化シーケンスによって,リンク(二つのデバイスを通信させるための信号線の集まり)の 両端のデバイスが同期した後でないと,通信可能な状態にはならない.
>>257 ごめん、これ嘘
リンクの両端のエージェントがやってる
Root Complexが存在する場所は何処になるんだ?
池田先生はこのネタはちょっと…
>>262 相変わらずの電波に対してアホな取り巻きがちやほやしている構図が
なんともほほえましいね。
SPARC64を「どう見てもベクター型」とか言ってるのが「専門的なツッコミ」ねえ(にやにや
池田セソセの言いたいことは結局「ITゼネコン市ね」ってだけで 後はあることないこと理由付けてるだけなんだよね 「ITゼネコン市ね」ってのは、まあ分からん話でもないので 技術的な観点から間違ってるだとか、実はたかってるのは役所側だったとか 批判しても、あんま意味ないんだけど、そうは言ってもやっぱり技術的に とんちんかんなことを言ってると突っ込みたくなるんだよね
267 :
不明なデバイスさん :2009/05/16(土) 15:29:46 ID:ZnWCDMa3
そういや、アレブログの勝利宣言はまだなのかな
富士通も撤退してCrayのが入ることになったらするんじゃねぇの?
正直、NECはもう完全にハブられるんじゃないの 特にスパコン業界や市場から
なんで??
NECのスパコン事業で売れてるのってほとんどベクトル型だけだろ? その評判ががた落ちになるからだよ 国のプロジェクトから脱退したってのが大きいよ。 だいたい設計段階まで予算を使ってきたのに、製造ってなってから脱退しますじゃ 税金泥棒っていわれてもしょうがないよね
たしかに
じゃ日立もじゃん。途中で抜けた。 てかスカラーとかベクトルとか、関係なくね? その理由だと。
日立はNECとの契約らしいから、とりあえず今回は日立の意思とは関係ない話 > てかスカラーとかベクトルとか、関係なくね? そりゃそうでしょ
>>272 将来にわたってソフト資産を活かせる可能性を求める客は逃げるだろうけど、
現在の性能だけを求めている客は気にせず買うと思うけどなぁ。
俺思うんだけど、自分が今まで情熱を傾けてきた学問を否定したくないという理由のみで この手のスパコンの必要性を訴えているだけの人間が居るような気がする。 該当する学者は、「補助金などの「食い扶持」が無くなると困る」と正直に主張するべきだ。 それは決して恥ずかしいことでは無いと思う。 学者は確かに日本経済のことを考える必要は無いだろうけど、自分の生活のためにこの国家事業が必要だ、 という理屈だけには至らないで欲しい。
>>243 >地球シミュレータの実績を見なよ。
>ノード数×使用時間×ジョブ数
>をノード数別に見ると、256ノード以上の割合が1割くらいしかない。
>逆に1〜16、32ノードあたりが非常に多い。
ES を占有するくらいのノード数でジョブの実行を希望している
プロジェクトはほんの一部だけどあるよ。しかし、計算資源を薄く
広く配分するようになっているから、大きなノードで計算できない
というのが実際ですね。
それから、ベクトル・スカラー関係なく、国内のT2K(筑波を除く)など
の大きなシステムでも例えば 1000 core 以上では計算できていません。
恐らく、実アプリで 1000 core 以上で計算できるのは天文台の Cray
と筑波の Appro の機械くらいしかないでしょう。
つまり、国内ベンダは全て駄目です。ここが重要。
というわけで、京速のお金で Cray XT-5 を入れるのが一番良い。
もう、ハードは諦めてソフトに資源(人も含めて)を投入すべき。
んで、日本にHPCを作る技術が無くなったらCRAYは吹っかけてくるだろうよ。
>>278 > しかし、計算資源を薄く広く配分するようになっているから、大きなノードで計算できないというのが実際ですね。
もったいない。
地球シミュレータでしか計算できないものを最優先すべきだよ。
小さな計算はSX-6とかを併設して、そっちで走らせてもらうことにしてさ。
いまさら済んだことに、とやかく言ってもしかたないし、結果論だと言われれば何も言えないが。
>>279 アメリカの他のスパコン屋と競わせればいいじゃないか。
>>280 >小さな計算はSX-6とかを併設して、そっちで走らせてもらうことにしてさ。
一応、SX-8Rが併設されているようだけど足りないみたいだね。
>地球シミュレータでしか計算できないものを最優先すべきだよ
その通りですね、このような機械の運用は資源を極端に配分して
本当にそれでしかできないものを実行すべきなんだけど、日本は
アメリカと違って、そのような運用はできません。反対も多いし
税金で作っているのだから、広く使わせという話になるからね。
1100億あったらcray買収できないかな?
CRAYも流転の人生だね
日本のコンピュータ関係の政策でまずいところは、国がきちんと顧客になってないところだと思う。 ここはアメリカをみならって、(初期条件はないけど)原爆シミューレーションとか、 エシュロンもどきとか、国がきちんと「顧客」になれるプロジェクトをたちあげるべきなんじゃないかな。 で、そのプロジェクトのために、コンピュータを作る、って感じで。
JAMSTECに公開されているのは2005年度からの利用状況だからそれ以前は JAMSTEC自身のアプリが占有して使う事も多かったんじゃないの?知らんけど。
じゃあ原爆開発ってことでここはひとつ
>286 >JAMSTEC自身のアプリが占有して使う事も多かったんじゃないの? そうなんだけど、JAMSTEC内の全てのプロジェクトが大きなノードを 要求していないわけではないです。ES のほとんどのリソースを要求 するようなプロジェクトが、ほんの一部しかないんです。
>>288 地球シミュレータのページで2005年度からの利用状況しか
見つけられないんだけどその話のソースはどこから?
>>289 公開されていないと思うよ。中の人から聞いた話だから。
地球シミュレータ、やっぱり、無駄に巨大だったのね。 160ノード×4セットくらいにしとけば、ケーブルや単段クロスバーのコストが大幅に削減できたのにね。 さらに、トラック無線の影響を受けないような土地に作って、大地震が来たら諦めることにして建物を簡素化すれば、 その分で、普通のSXスパコンをたくさん買えただろうに。
なんでそんなに卑屈なの? 国産のスパコン持つことがそんなに税金の無駄? 大型のコンピュータ作ることができるから日本は舐められないで済んでるのに
>>292 舐められるとか、そういう話じゃないよ。
>>293 じゃどんな話なんだよ。
どういう用途に使うのが税金の無駄じゃないんだよ。
だれもが納得する用途はなんだ?
どうせ日本は技術売るしか生きる道はないんだから いまさら道路作るくらいなら高速増殖炉やスパコン作れよって話 これらに批判や反省点はあっても作らないという選択肢はない
296 :
不明なデバイスさん :2009/05/16(土) 22:37:58 ID:ICMYWyVP
文部科学省の京速計算機プロジェクトは自分も疑念があるが、 途中で撤退するくらいなら最初からやるなと言いたい。 >NEC出身の渡辺貞氏が「天上がり」し、1150億円ものプロジェクトが随意契約でITゼネコン3社に発注 言いだしっぺが自分で降りるってんだから、責められるのはそっちのほう。 一度やりはじめたからには、計画がうまくいかないからといって丸投げするのではなく、 ほどほどのところで計画を縮小して、最後までやり遂げてから終わるべき。 富士通には国家プロジェクトだからといってあまり無理をせず計画縮小で最後までやってほしい。
アメリカに買ってもらえるスパコンなんてもう作れないじゃん。
>>294 >>295 相手の発言ちゃんと読んでからレスしてよ。
国産のスパコンを持つなとは一言も言ってないんだよ。
むしろ、同じ予算でより多くの演算能力を持つべきだと言ってるの。
>>298 それなら家庭にあるPCの演算能力をひかりグリッドのように買い上げた方がいい
それとは別に大型コンピュータを持つ能力を維持するのは国の責務です
内容の問題ですね
こんだけ国も民間も使えるリソースが減ってるなら そんくらいやんないとブレークスルーにならないよ 高速1000円で整備不良の車が燃えまくってるみたいに 家庭用のPCを連続稼働で壊させるぐらいのことはやっていい
そうやって日本にある全部のコンピュータをグリッド化する前提なら 田舎含め日本中に光回線を引くことも十分に正当化できる 官民共同じゃないとこの手詰まりは乗り越えられない
必要なのは省電力性を中心とした低ランニングコスト
既製品をいくら量産して並べても、ブレイクスルーにはならんだろう。 スケールメリットが拡大するくらいで。
新しく組むなら機械を買う予算だって要るんだからな 壊れたから買い替える これが新しいエコ 家庭にPCは1台程度あるのだからそれで参戦してもらえばよい
省電力性を中心とした低ランニングコストが重要だと思うのなら 家庭にあるクライアント側で工夫してもらえばいいだけのこと
なんかPC繋げば性能出ると勘違いしてるバカばかりなのか?
全角にレスしてもと思ったが 繋げば単純に性能出るアプリもある
馬鹿並列のアプリを、スパコンからクラスタへ、クラスタからグリッドへ追い出すのも重要なことだよね。 ジョブ並列も、科学技術の進展のためにとっても大事。
当たり前だボケw
スパコンってビジネス的には厳しいよね 1年で1.8倍くらい性能向上してるから、 もし開発が1年延びれば値段を半分に下げるか、あるいは、値段据え置きで性能を2倍にしなきゃならん。
話がgdgdだなー 誰が使うんだとかどれぐらい能力が不足なのか?とか そんなのは実質二の次じゃろーw 国策でやるのはロケットと同じで構築技術の力を蓄えたいんだよ。 BlueGeneとかCray買ったらそれだけで終わり。 建築設計みたいにスパコン作れる人を育てたい意図もある。 トップスピードでも消費電力比でもB/Fとやらでもいいが 日本の技術力をアピールできないことは意味がないとまでは 言わないがまぁやらんでしょ。 スパコンを日本の輸出産業としてPRするには こうでもしないといけなかったっちゅーことだけど、 民間がついてこれないんじゃしゃーないね... Top500 November 2008 みるとわかるけど、 1〜9位がアメリカ、10位が中国(曙光)なんだよね。 つまり表面上は日本は中国にも負けてるってことさ。 日本はAT互換機市場を台湾に持っていかれた失敗を 繰り返すのか?税金以上の損失かもしれないよ? ま、F他のやり方を探すしかないね。思いつかないけどさ。 その点、牧野先生には期待してます。(直接関係ない?w
中国のってどっかの買っただけじゃなかったのか…
316 :
314 :2009/05/17(日) 02:41:50 ID:dXcgLXQ1
うっかりenterおしちまったぜ... 誤 F他 正 Fまでこけたら他
>>314 日米貿易摩擦のときに日本政府は米国政府に対して、
コンピュータ産業において日本メーカーを米国メーカーと競合させない
っていう約束をしちゃっているので、あんまり目立つことはできないのよ。
次に、構築技術というが、実際に構築しなきゃわからんっていうようじゃダメなの。
コンピュータの開発は、シミュレーション技術の塊でもあるのよ。
だから、実際にモノを動かしてみないとわからんっていうのは、藍屋の白袴なのよ。
すでに開発が終わって、製造段階に入れるってことは、
シミュレーションで十分な成果と経験が得られてるってことなのよ。
あとは一般人にもわかるニュースのネタを作るための作業なわけ。
318 :
314 :2009/05/17(日) 03:36:20 ID:dXcgLXQ1
>>317 それは残念ですなぁ...10位でも良いと思うけど。
構築しなきゃわからんのでは悲しいですねぇ。
私は力を蓄えたいと言ったんですけどね。
理論を現実とするには場数を踏むのが有効でしょう。
「作れる作れない」から「こうすれば壊れないor安くなるor電力食わない」
ということを追求するべき時代になっているし。
一般人にもわかるニュースを早く見たいですね。
税金使っているのですからw (現時点でどれくらい払ったのだろう?)
>317 >シミュレーションで十分な成果と経験が得られてるってことなのよ。 その点では >314 の言う目的は果たしたということかもな。 >314 >国策でやるのはロケットと同じで構築技術の力を蓄えたいんだよ。 >BlueGeneとかCray買ったらそれだけで終わり。 大学や研究所の計算機センターだったら、最適なものを選んでそれで 終わりというのが正しいけどね。で、日本のベンダはというと、 「しがらみ」とか無しで一般競争入札をちゃんとしたら、どこも勝て ないのが現状だと思う。(この点では、能澤の言っていることは正しい) HやFの基幹の大規模サーバは、コストパフォーマンスが悪すぎる。
アメリカと直接競合できないならさ スパコン事業に1000億出すより その金でIntelのデザインセンター誘致した方がマシじゃねw 日本の技術力うp & アメリカ様の国力うpでwin-winじゃん
>>315 >>314 はただのにわか
中国のやつは部品はほとんど、海外製だよ
特にプロセサは全部、AMD
部品が全部海外製だろうがプロセッサが全部AMDだろうが ランクインするブツがそこにあるのに意味がある という側面もありますにょろ
ベクトル止めても良いってのは実質、CPUもその他の部品もみんな海外製でも良いって言うのと一緒でしょ。
スパコンの新たな使い方、面白い使い方を考えてから作りましょう
Intelはマルチコアメニーコアの新たな使い方、面白い使い方を考えてから作っているようには見えないわけだが
いつもの使い方でいいよ 天気予報 核兵器開発 流体計算 宇宙物理学
>>326 よりによってintelをもちだすとはw
世界有数の超優良企業と赤字垂れ流しの事業をどう比べるの?
>>328 自爆テロ作戦かよw
余った予算をスカラに振り向け、全体性能を15PFとか20PFに上げればいいじゃん。
>>330 まったくNECは酷いよな。スパコン業界からも撤退するべきだよ
linpac機以外のメリットを持たせた複合型で、そのための応用ソフトウェアだったのに
それができなくなっちゃうなんて。
全体性能20PFの役立たずでも作ればいいんじゃないw
>>331 希望通り役立たずになって叩けると良いね。
まあ静かに退場してください。
333 :
314 :2009/05/17(日) 12:46:26 ID:dXcgLXQ1
>>322 既知。So what?
Dawning 5000A - Dawning 5000A, QC Opteron 1.9 Ghz...
って書いてあるもんね。中身はよう知らんけど。
主題は中国がTop10に入るマシンも作れると証明されたことだろう。
>>321 筑波になかったっけ?
っていうか物事には表とウラがあってだうわなにするやめ(ry
>>319 作りあげる経験も必要だと思いますね。応用ソフトも重要でし。
ユーザーとしてなら買い物で終わるのが正しいと思いますよ。
「使って」結果を出すのが目的ですからね。
でも国策となると話は変わってくる。国内産業の活性化も
テーマに入ってくる。国内労働需要も増えればなおよろし。
C/Pの改善もテーマですねっ。
で、今後どうなっちゃうのよkeisoku。CPU以外わからんぞ。
わからんのは機密だから当然なんだが。
>>332 希望してるのはお前だろ。傾いたまま意地になって計画を続行して自爆する流れ。
今となってはプロジェクトを白紙に戻して、計画を一から練り直したほうがいいよ
>>334 えっ?どこに役立たずを希望したような事書きました?
>>335 なぜ複合型になったのかを知っていれば理解できるだろ。
和製ロードナンナーを作ってもねぇ。
>>336 最初からスカラ一本にすべきだったけどね。
> 和製ロードナンナーを作ってもねぇ。
?あんな変態構成になってないはずだが。
>>337 HPCでの実績どころか、汚点だらけのSPARCじゃ、さすがに皆さん不安だったのでしょう。
ESを見る限り、当初の設定目標以上の成果を挙げても多額の税金をかけてどうのこうのと、
門外漢から批判が沸いてくるのに、自称世界最速CPUとやらで、
設定目標のlinpack 10ペタ、HPCC 4awrd は無難にこなせるのかね?
>>336 ロードランナー自体は,3つのアーキテクチャを混ぜ合わせた複合型のシステムだ.
ただあまりの変態構成すぎてプログラマが泣いているって話も聞くし,
理研もそのことを踏まえてプロジェクトを立ててる.
むしろアメリカでさえがこれからは複合型の時代だと認識しているわけだらか,
スカラだけの単一構成にすればいいって言ってるやつのほうが時代遅れだよな.
>>277 そういう言い方は可愛そうでは。現実問題として補助金でなんとか生活
をやっていけている人は研究者に多いわけで。研究者の中から落ちこぼ
れというのはどうしても生まれてしまうし、かといって明日から仕事が
無いという状況が生まれてしまっては誰も研究者になろうなどとは考え
なくなるでしょう。
スパコンを作るのと導入するのとでは違う。 作る・・・これは総合的な技術力が問われます 導入する・・・買ってくるだけです スパコンのメーカー各社の最大構成は、メーカー側でも実機テストはしていないでしょう。 ユーザーが欲しいって言えば、そこまで開発しますよ、という意味です。 つまり、金さえ出せば、他人が開発してくれるのです。 とりあえずNECのSXのWebサイトを見てくださいな。 最大構成は華々しいけど、誰もそんな構成で買ってない。 スパコンを作ることと、使うことは、分けて考えるべきでしょう。
ベクトルとスカラの差がなくなりつつあるので、その2つの複合という考え方自体が、ナンセンスになりつつあります。 必要なのはアプリケーションに適した、ノード間ネットワークやメモリシステムでしょう。 汎用のPCサーバにInifibandボードを刺したものでクラスタをやれば、ベクトル型と大きな差があっても、 PC向けCPUを独自のチップセットを使って結合すれば、ベクトル型との差はなくなります。 PC向けCPUを使った演算ノードを十分な帯域と低いレイテンシの単段クロスバーで結合すればいいんです。 さすがにそれはコストが高すぎるので、Crayさんは3Dトーラスあたりで済ませていますね。
>>338 > ESを見る限り、当初の設定目標以上の成果を挙げても
スパコンは使うのが目的で作るのは手段です。
手段が目的になってはいけません。
複合型というのが大人の事情だからね。スカラとベクタをネットワークで繋いでも役に立たん。 スカラ+SIMDアクセラレーターというのは使い道あるけど。 まーそれでもバランスというものを考えなきゃ某所のようになるけど。
富士通のBioServerのようなアプローチ、どっかやらないかな。 BioServerは粒度が恐ろしく細かいPCクラスタで、ノード間通信が恐ろしく貧弱で、 インターネットでパソコンを使った分散コンピューティングをやるのと似たようなものだが、 しかし、電力効率と省スペース性に、とても優れていた。
終わってるとまでは言わなくとも いい加減行政をどうにかしないと希望が見えないのも事実 政権交代すれば〜なんて簡単な話でもないだろうが・・・・
>>346 逆に7年以上も前の地球シミュレータが、国内先端のスカラ機の10倍以上の効率なわけだ。
やっぱ地球シミュレータすげえな、と思うけどな。
当時のアメリカの世界最速機を5倍の性能でぶっちぎったといわれていたが、実行性能では50倍、
下手したら100倍くらいだったかもな。
そりゃ、あれだけ豪勢な構成にすりゃあね。 重要なのは 効率 じゃない。コスト×効率 だ。 効率が10倍でもコストが10倍なら一緒。 そんなに地球シミュレータが優れているのなら、 なんで同型機を導入するユーザーがいないのだ。
>>349 こういう分野はコストは最重要ではないだろ。
コストコスト言うなら何もしないのが一番だ。
何もしないか、IBM(笑)を買うか それ以外の選択は必ずハエのような奴がタカってくるw
>>350 いいえ、コストは重要です。
なぜなら、同額で2倍の性能のスパコンを調達すれば、2倍の計算ができるからです。
より多くの先進的な研究にスパコンが使えるようになるのです。
だから昨日提案したじゃん 市井のパソコンをグリッドにして、 そこで走るアプリと大型機を二本立てにすればってさ
>>352 そりゃ「同じもの」なら安い方を買うのがいいよ。当たり前のこと言ってんじゃねーよ。
アホだろ。
>>354 その当たり前のことが、巨艦主義によって、蔑ろにされてるんですよ。
>>353 一般のパソコンは電力効率が悪いし、
そういうので済むような計算には既にPCクラスタが使われてる。
> その当たり前のことが、巨艦主義によって、蔑ろにされてるんですよ。 ハァ?
>>346 最後のはXT4じゃなかった?
ハードはcrayだけど国産ソフトで頑張っているのはいいことじゃない?
>>355 だからさ〜、同じものじゃないだろつってんだよ。
Linpackで比較して同じ数字なら同じように使えるとでも思ってんの?
>>348 SSEを無効にすることで2倍の効率を実現しました、じゃ意味ないわけね。
バンド幅当たりの価格を最小化することが肝心なんだけど、ベクトル機は既にそういうのからかけ離れたデザインになってしまってるわけね。
CPUにメモコン内蔵してメモリはできる限り近くに置くというのがほぼ唯一の解なわけ。
アムダールの法則があるから、スカラではノード数が多い所でスケールしない、なんて言う人いるけどさ、その並列化不可能なシリアルな箇所がベクトル化出来るとでも思ってるの?
うじゃうじゃ言ってないで、Linpackに取って代わるベンチマークを 提起すべきだと思う。これならかかる予算は誤差程度。
>>359 意図的に間違った方向に相手の発言を誤解し、
その誤解した内容を罵倒するという自虐プレイは
やめていただけませんか。
>>346 のリンク先のPDFを見ていて思ったのだが、
何度みてもGRAPE-6やMDGRAPE-3の基板のデザイン、変だわ。
デザインが変でも動いて性能が出るんだから、いいじゃねーかって話もあるが、
しかし、なんていうか、ねぇ。
MDGRAPE-3は後ろに何か入る予定なのか変な空間があるが、
そのためか、DC-DCコンバータのモジュールの配置が変だし、
赤い謎の太いケーブルが怪しげだし。
たぶん、電源プレーンとパスコンの設計がアレなんだと思う。
GRAPE-6は端っこにまとめてコンデンサが並んでるとか、
基板上にDC-DCコンバータがなくて、低い電圧を外からケーブルで供給するとか、
ドーターボード上にコンデンサが見当たらないとか、ちょっとアグレッシブすぎる。
>>362 いやいやLinpackは大切よ。
わかってない人の目を誤魔化すのには非常に便利。
複数のスパコンを安いコストで連結してもLinpackのスコアは延びるので、
連結のための予算は広報部門から出るといっても、あながち冗談でもない。
Linpackで性能出すのって真面目に大事だよ。命令セット、演算機、レジスタ、キャッシュ容量、キャッシュバンド幅、主記憶容量、主記憶バンド幅、ネットワークバンド幅の全てが重要で、システムの負荷テストにもなるしソフトウェアチューニングの技術も必要。 ただ単に演算機を沢山並べて効率の出ものではないのね。 キャッシュの階層構造をチューニング次第で有効に使えてしまうのが欠点なのかもね。 ベクタカルトにとっちゃスーパーコンピューティング=ストリームだからね。
>>363 >意図的に間違った方向に相手の発言を誤解し、
>その誤解した内容を罵倒するという自虐プレイは
>やめていただけませんか。
お前が言うな。最初からゆっくり読み直してこい。
だいたいコスト×効率ってなんだよw
値段あたりの実効性能という書き方が誤解が少ないかと。B/Fはアプリによりけりだから…
ごめん、 コスト÷効率 だね。
ここだけの話、G6は低電圧大電流を単一ボードに供給しようとしたため安定性がアレだと聞いたことがあるな。
ボード設計なんぞ、プロの設計屋に任せればいいのにね。 そりゃ素人でもCADでお絵かきすりゃ、 基板製造工場は、その通りに作ってくれるけどさ。
> 最終的にいいたいのは、現状ソフトとサイエンスの方にもうちょっと力を入れてもいいかなとかそんなところ。 禿同。 箱物行政的なスパコン、Linpackを走らせてオシマイじゃ困る。 むしろ、使い倒すために十分に多めの研究プロジェクトに唾を付けとくべき。 なあに、ジョブをさばききれなければ、増設なり次のスパコンなりに繋がるんだから、さ。
> 好意的に解釈すると富士通はちゃんと NEC を無視してないけどマスメディアが勝手に間違えた、ということかな。 なわけねーよ。 マスコミは(インプレス等も含め)、企業のプレスリリースを多少翻訳しながら書き写しているだけだろう。 富士通サイドが、そういう話をしたんだよ、たぶん。
374 :
371 :2009/05/18(月) 02:27:26 ID:FOPPAYoA
牧野先生のコメントはサイエンスの面から見たら、まあそう悲観しなくて も良さそうに見えるけど、1万コア以上で実行できるというのは脅威的だと 思いますね。つまり、Cray のシステムは、 (1) 実アプリで1万コア以上でもスケーラビリティが出るチューニング (2) 1万コア以上の計算に対応したデータI/O とファイルシステム (並列ファイルシステム、Cray の場合は Luster) (3) 超大規模計算に対応した可視化システム(並列可視化システム) をちゃんと実現しているわけですよね。日本にはこれはできないと思う。 つまり、1万コア以上のシステムは用意できても、日本の場合は、 (1) コードを開発した研究者が自力でチューニングしないといけない (2),(3) まだノウハウが無い なので結局、単に京速ができても IBM の roadrunner と同じで Linpack 出した後は息切れしてしまう可能性が高いと思います。その証拠に 現状は、使う側に > 最終的にいいたいのは、現状ソフトとサイエンスの方にもうちょっと力を入れてもいいかなとかそんなところ。 と言われてしまっているわけですから。ということで、私は悲観的です。
済んだ話にあれこれ言うのもあれだが・・・ > 10年前に 2.5V 200A の電源を、というのは結構専門家に聞いてもなかなか難しかったです。 2.5A 200Aの電源欲しいって言えば、まぁ、そうでしょう。 しかし、1チップで200Aじゃないんだから、分割すりゃよかったのよ。 32チップそれぞれに小さな電源付ければ、それぞれは1/32の6Aちょいだし、 4チップごとのドーターボードに1つずつ電源付けたとしても、25Aで済む。 電源は、なるべく近いところで最終的な電圧を作って供給するのが初歩の初歩です。 たぶん、電子工作やっているアマチュアでも、電源のインピーダンスとか気にしてますよ。 どうしても外部から低い電圧を供給せにゃならんという場合には、せめてセンス線を使いましょう。 ケーブルの抵抗成分で、流れる電流に応じて電圧が下がってしまいますが、センス線を使えば それをカバーできます。 > でも、逆に今だと 1.0V ならXeon 用 VRM とかが使えるけど、 2.5V だと結局適当で安いものがないんだよね 電源回路の設計に関わらないようにするのは、1つの正解ではあるけど、 適当で安いモジュールが出まわっていない場合は、既製品のモジュールを使わずに、 電源回路を自前で持つのが普通、だからかもしれません。 もしかして、MDGRAPE-3のDC-DCコンバータは、出力が並列に結合されてたりします? DC-DCコンバータには、それをするための特別な機能が備わっていることがあり、 それを使えば済みますが、そうでないなら、動作の安定性を損ないますよ。 ヒートシンクの間を走る、あの赤くて太いケーブルは、電源ラインのインピーダンスを下げて安定させよう という目的だと思いますが、DC-DCコンバータを近くに配置し、出力を結合せずにチップをグループに分けて電源を別にし、 チップの近くに十分なパスコンを備えれば、プリント基板の電源レイヤだけで足りたと思います。
4チップのGRAPE-6AはPCの12Vから生成してて、すこぶる安定しててクラスタで導入してるところも世界にわりとあるんだよね。
GRAPE-DRボードについても・・・もう手遅れかもしれないが、電源回りは設計を見直すべきです。 FPGA等に電源を供給しているLTのμModuleですが、 LTのデータシートには指示が書かれてないけど、 μModuleへのVinのピンの近くにキャパシタを置くだけでは不十分で、 12V → インダクタ → キャパシタ → μModule とすべきです。 漏洩電磁波の規制がない設計だからかもしれませんが、 μModuleのスイッチング周波数が電源ケーブルからダダ漏れするし、 12Vを供給する電源ユニットが誤動作(安定しない)をする原因にもなりかねません。 写真をみると、大きな固体電解が付いてますが、 インダクタがない故の不具合をなだめすかすための、大容量じゃありませんか? また、DRチップに電源を供給しているほうも、同様です。 1チップのボードで、電源コネクタが2つに別れているのは、 1つだと不具合が出たからではありませんか? インダクタを適切に入れていれば、1つで足りたと思います。 電源まわりは、簡単なようで奥が深い世界で、それなりの経験も必要です。 素人設計は火傷のもとです。 ぜひともプロの設計屋にお金を払ってコンサルを受けてください。
>>376 GRAPE-6Aの基板には、コンデンサたくさん付いてるもの。
それでも、あのドーターボード側が素っぴんなのは心配だ。
裏側の写真みてないけど、MLCCがビッシリ付いてるのかもしれないが。
浜松メトリックスのWebサイトでGRAPE-6Afの基板を見ると、さらにコンデンサが増えてる。 Grape6-BLX64も、コンデンサ沢山。 たくさん付ければいいってもんじゃないけど、少ないのも問題だ。 MDGRAPE-2の基板にも、コンデンサがたくさん。 Advanetのロゴが入っているので、基板設計はプロの仕事だね。
なんかここの人たちで京速作れるような気がしてきたぞw そしたら金も技術ないけど幹事やるよw
電源といえば関係ないけどxbox360のモスラはいつまであれなんだ
じゃあ、オレが横から口出ししてやる
じゃ俺、池田信夫の役ね。
俺メタルラックやるわ。
じゃあ、ボク平木教授の役でいいや。
このスレは、本人が自己紹介するスレとなりました。
∧_∧ ┌──────────── ◯( ´∀` )◯ < 僕は、小柳義夫ちゃん! \ / └──────────── _/ __ \_ (_/ \_) lll
スパコンって夢があるよね なんとなく
>>346 その大気大循環モデルの計算は、圧縮性流体の計算だから、元々スカラーでもそれなりに性能がでると言われている。
また論文中にもあるようにESでの計算がありえないくらいベクトル長が短いから、性能が全く出てない。
この計算結果で、流体計算がスカラー機でベクトル機を凌駕できると考えるのはあまりにも短絡すぎ。
どこの流体シミュレーション屋さんだったかな。 昔はスパコンを使っていたが、いまではパソコン、それもクラスタではなく、1台とかで済ませている会社。 なんでも計算のアルゴリズムと、社員の経験の豊富さで、計算量が極めて少なくて済むんだとか。
T2Kの全予算でXT5買えばよかったと思う。どうせ4プロセス立ち上げてローカルメモリにヒットさせなきゃ性能でないんだろ。
>>392 凌駕する必要はないんじゃないの?それなりの性能が出るなら、
コストパフォーマンスの面からスカラーを選択しても良いでしょ。
>圧縮性流体の計算だから、元々スカラーでもそれなりに性能がでる
圧縮性だとスカラーで性能が出るという根拠が不明ですね。
圧縮性か非圧縮性かは関係ないよ。流域分割だけで並列化できて、
袖転送しかしないのであれば、スカラーで性能が出るという話なら
分かるけど。
×流域分割 ○領域分割
>>345 ああいうのが欲しけりゃ、今ならコントローラ内蔵の新atomをバカほど並べるんだろうな。
というわけで
>>380 の出資で
>>345 が作るって事でw
>>395 なにわかりきったこと書いてるの?
圧縮性流体の解法では、波動型方程式の解法がメイン(陽解法では、通信部分が袖転送になる)だろうが。
それにこのコードがコストパフォーマンスが優れていようが、流体計算全てが当てはまるわけではなく、
むしろ例外的といってるんだろうが。
まぁまぁ、せっかくいい感じに議論が続いてるんだから無意味にケンカ腰にならんでも、 と思う今日この頃、みなさんいかがお過ごしでしょうか。
>>398 分かっているならいいよ。
>>392 は圧縮性なら云々と短絡的
に書いてあったものだから。
要するに
>>345 が上げた例だけでは不適当だというなら了解。
先生、webにいろいろ書いてくれる のうれしいんですが、だれかに揚げ足 とられやしないかと、いつもハラハラし てます。 少しは自重して、その分論文書いてくださいw
>>401 それは余計なお世話というものじゃ。
部外者としては情報どんどん出してもらったほうがありがたい。
間違い指摘されたら訂正するだけだろ 何も問題ない
404 :
不明なデバイスさん :2009/05/19(火) 22:10:38 ID:jrj1x5YZ
>>50 なるほど。
おれのもやもやを書いてくれてありがとう。
で、GRAPE-DRはいつ完成するのだろうか 教えてえろい人
接続はinfinibandか、、、 クラスタ間の接続にfirewire3200を使ってみたいがまだだよなぁ。。。
>>406 POWER6辺りだっけ?
もはや全然わくわくしないなあ。
>>406 富士通のPRIMEQUESTから乗り換えたのか?
害人のつくった玩具で日本人同士が殺しあう様子
・計算間違いの回数 が話題になるくらいあるということですね。
レジスタやキャッシュはECC等で保護されているのだろうか?
ゲーム用のGPUならソフトエラー率が多少高くても問題ないわなぁ。 CPUと違ってオーバークロックして画面にノイズが出ても、ノイズさえ気にしなければ動き続けるし。 (間違った計算結果が次の計算に影響を及ぼさないから、一時的な描画異常で済む。) GPUチップ本体だけでなく、メモリなんかも際どいところで動いてるよね。 (PC本体側に使われるメモリよりも数倍のクロックで動いてる。) だからGPUを単なるベクトル計算機として使うと痛い目にあうわな。 とはいえ、浮動小数点の丸め誤差が問題にならないように使う技術があるように、 計算ミスが問題にならないように使う技術だって、これから育つかもしれないよ。 (脱線するが、計算ミスが起きたときに数値の変化が小さいように工夫した回路をどっかで見た。 符号が反転したらビックリだが、実数部の一番下の桁が反転してもまぁ許せる、みたいな。) ところでGRAPE-DRチップとボードのソフトエラー率って、どれくらいなんだろうね。
GRAPE-DRには検算回路が実装されて いて、加算/乗算をした後に、必ず 同じ数で引き算/割り算を実行して、 元の数に戻るかを確認していま すので、算数のテストではかならず 100点を取れます。
ATiが蚊帳の外なのがカナスィ。。。
じゃあ、出力を入力して計算させたら入力データが出てくるの? 情報の減らない計算機だったんだ。
Intelのららびーは科学計算には使えるの?
Larrabeeも1代目はECCメモリじゃないから少なくとも金融とか石油では採用は無理じゃねーの 今Core 2とかCore i7でクラスタ組んでる人は気にせず使いそうだね 科学技術計算と言っても色々だし
パソコンがECCサポートをどんどん切り捨ててるのは、ちょっと嫌だよね。
128MBとかの頃はmemtest86とか走らせても1日で何周もできたが、いまはもう無理。
>>417 まじ?
それは、なんか、もったいないな。
はたから見てるぶんには楽しいね。
流体力学の計算に使う計算機が専門なのに 空気の読めない弟子だな
GRAPEで和製神GPU作ってくれ
次期GRAPEってありえるの? お金的な意味で
お金さえあればやるんじゃね。
教授の一番の仕事は予算を獲得すること、そのために政府の委員会の委員になって暗躍すること っていうのが、ちょっと悲しいわ。 俺の出身校で、他所の大学から移ってきた教授が、 政治ばかりで研究がろくにできずに残念だって愚痴ってた。
とはいえ誰かしらが金策をしないと始まらないからねえ
ガンガン研究できるパワーのある若者が研究して、 歳とったら金とってくるのと若者に的確なアドバイスを出すのに精を出す、 というシステムはそれなりに良いと思う。
>>433 すべての計算に倍精度が必要ってわけじゃない。
最終的な計算結果が倍精度でも、途中段階は単精度で十分な場合もある。
単精度を組合せて倍精度計算するのを試してる人結構いますね
安いのは正義
437 :
433 :2009/05/20(水) 23:19:08 ID:LQW0/apN
>>437 その記事は古くて現状とは違ってる。
いまのGPUはNのもAのも倍精度をハードでサポートをしてる。
ただ、Nは単精度の演算器10基に対し倍精度のを1基しか持ってないし、
Aは単精度の演算器4基で倍精度の積和をこなすようにしてるんで、
単精度ほど演算速度が伸びない。
主旨は間違っていないがより精確に書くならこうなる ただ、Nは単精度の演算器8基に対し倍精度のを1基しか持ってないし、 Aは単精度の演算器5基で倍精度の積和をこなすようにしてるんで、
Nのは単精度は8+スーパーファンクションユニット2じゃなかったか? あと、Aのはスーパーファンクションユニットは倍精度の積和に 使ってないと聞いたが。
ところで、メタルラックマスターのところの記事の日付だけ 更新されてて非常に気になるんだがw
ま、ベクタが飛んだおかげで、ソフトウェア開発の側でやんなきゃいけないことは明確になったわね。
本質的には、ベクトルとスカラに違いはないと思うんだが。 昔ならともかく今のスカラは、ベクトル的な計算でしかスループットが出ないのだから。
本質を理解してあっさりコードを書き換えられる人間ばかりじゃないから 問題なんだろうよ。
んなこたぁない
ベクトル長を長く取るために主記憶アクセスの増えるコードなんて消えてくれ。
Tukwilaがそうなるのは想定内
マネジメントに問題がある感じだ GRAPEの真似をしたわけではないだろうがw
ベクトル向けの予算がスカラにまわるなら ピーク性能は当初より上がりそうだな。楽観的すぎかな?
>>453 そんなことをすれば、それこそ理研の研究マネジメントが問われる行為だな。
馬鹿なことを 結果がすべてなのだ
>>453 Venusじゃ10万個つなげても、ようやく実行速度で10PF超えるくらいだろ
あと1150億円ても、新しい箱物とか施設環境含めてだからその半分もスパコン自体には
使えないんじゃ?
同じ金額を使うなら、GRAPE-DRを100箇所に導入、ってほうが面白いかもな。
>>454 なぜ?
>>456 SPARCとはいえスカラ部の方がFLOPSあたりのコストが安かった
ことはほぼ確実だと思うんだけど。
>>458 3年間予算つけてもらって設計し、この設定目標を達成するには、
このスペックでこれだけの経費が必要です。予算認めてください。
⇒というのはネタでした、うちらやるときはやりますので、予算額はそのままで、
やり方の方は要相談でお願いします。
もはや、演算器がスカラかベクトルかは問題ではなく、共有メモリの読み書きが問題なわけで。 たとえ演算器がスカラでも、 メモリの読み書きの単位が大きくて、 読み込みと演算がきれいにパイプライン処理できるように、先行して必要なデータをロードする仕組みがあり、それを適切に使いこなせれば それは、もはやベクトルプロセッサと区別が付かないわけですよ。外から見れば。
>>460 ESが現段階でも実アプリの実行性能でスカラーを圧倒できるのは
むしろノード間通信能力の影響が大きいと思う。
ES2はそこが期待されてた程じゃなかったの?
>>459 だからそのスペックがNECの撤退で現に不可能になっている。
理研もシステム構成を見直すと明言している。
いまさらなに言ってんの?
ttp://www.artcompsci.org/~makino/articles/future_sc/note070.html これを読むと、メモリ量がネック、ということなのかな
たとえばNが十分に大きいとき、
double a[N][N];
for (int i=0; i<N; ++i) {
for (int j=0; j<N; ++j) {
※
}
}
※の部分で
a[i][j]を読んで何かするよりも、a[j][i]を読んで何かするほうが遅い(1/8くらい)
それは、メモリアクセスが連続ではなく飛び飛びになるからだ、と。
両方を1回ずつやらねばならないなら、スループットは (1 + 1/8)/2 = 9/16 だ。
もし、メモリが大量にあるのであれば、8つのデータに対して
double a[N][N][8];
for (int i=0; i<N; ++i) {
for (int j=0; j<N; ++j) {
for (int k=0; k<8; ++k) {
※
}
}
}
とすることで、
a[i][j][k]を読んで何かするのも、a[j][i][k]を読んで何かするのも、(TLBミスを除けば)速度は同じ。
前者の例と比較すると、スループットは ( 1/8 + 1/8 )/2 ×8 = 1 だ。
a[i][j]またはa[j][i]について見れば64バイトのうち8バイトしか使わないが、
a[i][j][k]について見れば常に64バイトすべてを使っていることになり、
仮にCPUとメモリが64バイトずつのアクセスであれば、速度低下がなくなる。
現実には、1度のアクセスが、もっともっと長いので、無理か。
>>463 だからベクトル部分を切り離した構成を再提出するんだろ。
ベクトルでやる分もスカラーでやりますからそのまま予算くださいなんていえるわけないだろう
同じ予算で同じことができるならそれをはじめから提示しないのかが問題となるだけだ。
せいぜい、スカラー部分でもベクトル用コードが善処できるようにしますので、
拠点形成、施設の予算はそのままでお願いしますぐらいだろ。
>>462 詳しくはいえないけど、自分の場合でも確かにスカラーでもキャッシュチューニングをすれば、シングルで10%程度性能が出るから、
台数効果が得られれば、高々8GFLOPSのESに劣るわけはないと思うが大規模計算ではそうもいかない。
>>465 そんなところだろうね。当初計画がスカラーとベクトルの両方を使って10ペタ目指しますってわけじゃなさそうだし。
理研自体が、スカラーだけでも10ペタ達成は可能っていってるしね。
それなりのプロセスを経て予算というのは認められてるわけだから
>>464 スカラはキャッシュライン単位で読み書きするからおっしゃることはごもっとも。
で、j-loopが長くって、i-loopが短いとき、スカラではそのまま、ベクタではループを入れ換えることが最適化となることに注意。
ベクタは強力なメモリアクセスをもって演算機の稼動率を高めようという発想に基づいている。
演算機はほぼタダ、メモリアクセスこそがコストとなる今日のテクノロジトレンドに照らし合わせてどうなの?ってこと。
○ベクタは効率に優れる じゃなくて ○メモリアクセスにお金を払ってる のね。 スカラはスカラで、キャッシュに当てるだけでなくキャッシュラインの無駄読みを無くす最適化が肝心。 structを上手く使わなきゃいけないんだけど。 バンド幅当たりのコストで競争力がなくなった時点でベクタの消滅は運命付けられてたんだけど。 プロセッサの隣にメモリ直付けしたものとは勝負にならんよね。
fortranで並列度を抽出するのがベクタ時代のプログラミングなら、c++で並列度とローカリティの両方を抽出するのが昨今のやりかたね。 言うは易し…
公開日誌のだけど、なんでGPUはATIなの?
そっちでやったから
えーと、 既にそれで始めちゃったから、そっちにして ってだけの話?
>>472 当たり前だろ。ほかにどんな理由があるというんだ。
倍精度演算性能が高い。 ピークもちょっと高い。 low levelなAPIが公開されてるから自分で最適化できる。
え、そうなんだ。 CUDAとかのイメージでnVIDIAの方がいいのかと思ってた
スペックはATIがいいけど、開発環境はCUDAがリードしてるよね。
自分でゴリゴリ何とでもなる人はAPIとか判ってれば開発環境の多少の優劣なんて気にしないって事なのかな。 というか力押し/物量のNVIDIAに対して(会社規模的にも)正面から勝てないATiは 良くも悪くも尖った、先進的な設計でGPGPUに振るのもNVIDIAより早かったんじゃなかったっけ? LarrabeeのリングバスにしてもATiにしてみれば数年前に採用→捨ててたような。
CUDAって、実際に使ってみると、使いにくいらしいぞ。 ユーザーに見えないところでやっていることを理解・想像して、うまく使いこなさないといけない分、面倒だとか。
ほー。 nVIDIAがまだGDDR5使ってないのは影響してるのかしら
>>480 へー。
ユーザーに対する要らん気遣いが多いのかね
世代ごとにガラっと変わる内部構造を隠蔽してるから、ちょろっと使うならともかく 本当にパフォーマンスを目一杯引き出そうとすれば結局のところ構造を理解しないとダメなのかな? ならNVIDIAもATiも土俵は変わらないし、それなら速い方がいいとか。 GDDR5に関しては単に対応メモコンの開発とかで冒険したくなかったとか。 ATiはキマンダと共に開発かつランチカスタマーだからその辺、年季が違う。 とはいえ512bit/GDDR3なんてしたから、メモリインターフェイス部分だけでも ダイサイズがそうとう巨大化したんじゃ…
あー今までの積み重ねが複雑にしちゃってるのか
nVIDIAも次出るのからは5になるみたいだなぁ AMDはGPUをどう扱っていくのかな…
CUDAは低レベルで考えて高レベルで書くにはなかなかいい言語。
CUDA ZONE はいい。cell もメールは見ないとか書く前にもりあげてくれ。
> 何故計算機科学の人は片対数でグラフ書くんだ? あれは実質的に両対数グラフですよ?
横軸(Array Size)がlinearだから片対数なんでは?
128x128 256x256 384x384 ・・・ 対数ではないが、リニアでもない
もしかして牧野先生は理学畑の出身なのかな。 工学畑の出身なら、大学の1、2年次あたりに、工学屋のグラフの書き方を叩き込まれるから。
女玩の人のサイトが・・・。 そういえばモバイル板のMorphyOneスレはまだ継続してるのね、一応・・。
あ、ATIの件、日誌で反応していただいてたんですね。 ありがとうございますm(_ _)m
灯台の交換日記と化している件
> 薦めてはいけないものが幾つか見受けられます。 2ちゃんで具体名出すのが憚られるなら、具体名示して直接連絡したほうが 有意義だろ。まるごと封印されたらそれはそれで損失。 あと、計算屋の間ではニューメリカルレシピがそういう本だとされているけど、 ちょっとしたことで調べるには非常に参考になるけど、本格的にやる時には きちんと別のもっと専門的な資料でチェックしないと危ない本、とか、そういう 本は、承知の上で使うぶんには有用。
え、にゅーめりかるれしぴってそういう本なのか。 知らなかった。 ま、あんまり使ってないけど。
数年間にわたるユダ公とその手先による工作活動が功を奏して 「米国のスパコンはよい国家プロジェクト、日本のスパコンは悪い公共事業」 と洗脳されてしまった
>>500 そうですか、あなたが洗脳されたんですね。
以上、朝鮮人がお送りいたしました。
>>497 代替となるものを紹介できない
(出版されている本には書かれてないけど、みんな知ってるってことも、あるんですよ。)
ので、言いにくいのですよ。
MorphyOneは自分が100%信頼するプログラマもまったく問題ないと言ってるよ。
結局,NECが京速用に開発したプロセッサってどんな仕様なの? だれかその辺の情報を知っている人っていないのかな? なんか知り合いに聞いた話ではSXとはかけ離れた変態使用だったらしい. そんなSXに技術還元できず,理研しか買わないプロセッサ作るよりは, とっとと次期SXの開発に移った方がましだということらしいんだが.
>>505 ×変態使用
○変態仕様
まあ,変態しか使用しないでも通じるのかな...
HPC使ってる奴なんて変態かマゾかの どっちかだろw
508 :
不明なデバイスさん :2009/05/25(月) 15:05:27 ID:0oGSnjMV
景気対策に大規模な投資とか言ってたのに京速には追加予算来なかったのか 飼い犬に手を噛まれた文化省の無能っぷりは明らかですね
だってNが脱退公式発表したのって、内々(京速プロジェクト本部クラス)に通告してから 2週間もないんだぜw
相変わらず中身のない記事だな
>>509 常識的に考えてそれはありえない。
昨日今日でハイやめます、なんて話なわけないだろ。
そういう関係者が本当の事を言ってるとは限らんぞ。
>>514 そうですね。
>>517 そんな風に話をそらせようって・・・まぁ言い分はわからなくもないが、
ただそれを加味しても、1ヶ月未満だったってことは明らかだろ
推測すると、理研からはflopsの要求が高く、NとしてはB/Fをこれ以上落としたくない、というところ? Flopsが大好きなら専用で、効率何%が好きならベクトルにすればいいのにね。 SIMDも幅が広くて結構。
これを大きな声でいう人はあまりいないんだけど、ベクトル機はB/Fが8か4を割ったあたりから、ほとんどの高級言語でベクトル化されたアプリで実効性能がB/Fに比例して低下する。 理由はデータの再利用性よりもベクトル長を優先してきてしまったせい。 でもアプリの「本当の」B/Fがいくつなのかってのは難しいよね。
Venusの前世代を積んでるFX1の実行効率は90%超えてるだろ。jaxaに入ったやつ
あれ100ラック規模だろ。
>>510 の見積もり方だと京速は間違えて20PF近くでかねん
それだけ出れはたいていの悩みは解決
演算性能なんてぶっちゃけどうでも良いからメモリの絶対量とメモリアクセス量/sで 競争してくれないかなあ。
実際の成果で競ってほしい…w
>>523-524 同意。FX1はLINPACK以外見るべきところはないし、Venusは本当にメモリ周りは直してくるのかな。
FX1と同等でも、128GB/sは必要だが、キャッシュにいたっては絶対値で減らしてきてるからな。
京速プロジェクトで見込まれている主要な成果の一つが、10PF超えだと思うんだけどw 名前もほら。京速だし
いや、京速機はまあいいんだけどさ、普通のHPC機の方向性がさ。 みんなそんな重たい演算に使ってるん? おれなんかでかい空箱を転がすようなことばかり。
>>526 スパコンは使ってナンボなわけで、Linpackのスコアを成果とするのは、恥ずかしいよ。
それを成果としていいのはメーカーだけだ。
529 :
不明なデバイスさん :2009/05/26(火) 14:24:48 ID:T2FY3Rmi
>>525 128GB/secというと、4.0Gbps×32bit幅のGDDR5を8個で余裕だね。
GDDR5を16個、なんていうモンスター級のGPUもあったような。256GB/secか?
Venusはエンプラにも使われるので、普通のDIMMなんだろうなぁ・・・不利だ。
Top500で1位になれればいいんだろって開き直った感じ?
linpacで10PFさえ超えればいいんだって感じじゃね もともとそれは富士通部分の責任だったし、お題目さえクリアすりゃ国への面目も立つだろ。 ベクトル部が消えこれまで設計してたソフトウェアの多くが無意味になった段階で もうそれしかないだろうよ
>ベクトル部が消えこれまで設計してたソフトウェアの多くが無意味になった たぶん、ベクトルが必要なのってそんなにないと思う。ほとんどスカラでOKなやつが多い。 むしろ、スカラ部が増えてうれしいという方がおおいんじゃないか。
ソフトといっても色々あるべさ。 スパコンを使って研究する人のそれと、 スパコンの使い方を研究する人のそれは、 ちがうもの。
DIYで作れるクラスタってどれぐらいが限度なんだろうね。ネットワーク、電源、空調、個々のノードの安定性。100ノードぐらいまではなんとかなりそうなんだけどなぁ。
ベクタが飛んでくれて、ソフトウェア開発の指針は明確になったね。とりあえずはスケーラビィリティを優先で設計して、ある程度コードができたらメモリアクセス、スレッド化、SIMD命令の利用のチューニングをすればいい。 レガシーなコードはES2でやってもらうことにして。
>>538 ハードウェア屋は複雑なシステムを作るだけ作って,後はソフトウェア屋に丸投げ.
システムの性能が出ないのは,ソフトウェア屋がまともな仕事をしないから.
ソフトウェア屋は数万レベルの並列プログラムが書けて当たり前,
完璧なメモリアクセスのチューニングとSIMD化とその他諸々も出来て当たり前.
それが出来ないのはそいつに能力がないから.そんなやつにはスパコンを使う権利なんてない.
使いたかったらまともな技術を身につけてから来やがれ.
こんなことやってれば計算科学研究者=自分でソース書く人たちはスカラ型システムを使おうなんて気は起きないだろ.
540 :
539 :2009/05/27(水) 02:45:30 ID:bmit8bVC
書き方が悪かった ×複雑なシステム ○無駄に超並列なシステム roadrunnerとかは複雑なシステムという表記で問題ないと思うが.
にもかかわらずベクトルは衰退の一途 どうやらソース書けない愚図が成果を出せずに脱落する世界へとパラダイムシフトしているようだ
とは言ってもCELLやGPUのようなウンコは生き残れないだろうがな 50歩100歩は倍違うということだ
分業体制を何とかしないとなぁ。 スパコンの計算センターどうしを市場原理で競争させたほうがいいって。 そうなれば、チューニングが上手なセンターは少ないハードで多くの売上を得られるし、下手なセンターは生き残れない。
>>541 研究者はコードなんて書けなくていいんだよ、本来は。
どういう計算アルゴリズムが良いのかさえ理解していれば、
あとはプログラマの仕事だと思うのよ。本当は。
>>543 スパコンの計算センターに売上なんて概念ないだろ.
計算センターてのは学術機関なんだから.
>>544 計算科学と計算機科学というものを理解できてない人が多いよね.
そこのところが理解できていないくせに,パラダイムシフトが起こっているんだって煽る人,
その煽りに乗せられる人,こんな人たちばかりだから結局まじめに研究してる人たちが泣きを見るんだろうね.
あとはプログラマの仕事とか簡単にいうけどw そのプログラマは誰がどうやって育てるんですか養うんですかっていう 研究者側が兼ねるのが一番早いし合理的
ベクタにしがみつく老害研究者が淘汰されてMPPで性能出せる若手が育つのは望ましいこと、かな。
判断実務の切り分けを考えると、一番非合理的な選択肢だと思うがな。 本筋じゃ、センターに職員として配備するべきなんだろう。
AsRock X58 Core i7 mobo の正式名が ASRock X58 SuperComputer というのが楽しいw
>>546 >あとはプログラマの仕事とか簡単にいうけどw
むしろそれを簡単に言っているがハードウェア屋の人たちだよね.
そもそも研究者ってのは研究をすることが一番の仕事で,
一個でも新しい数値モデルなり何なりを完成させることが研究者としての役目だ.
別にコードを書くことが本来の仕事ではない.
コードを書いてる暇があったら,本業の研究をもっと進めろってのが当然だろ.
しかもそのコードを書くのに,プログラマとしての高い能力が必要になる.
そうすればプログラムの勉強をしたり,コードを書くにもそれなりの時間が必要になる.
その分の時間はどっから持ってくるかといえば,本業の研究をする時間を割くしかないわけで.
結局,全部のしわ寄せは研究者に集まってくることになる.
それでも,この問題をどう解決するかが問題だね,これからみんなで考えていこうってなるならいいが,
結局はソースを書けない研究者が悪ってなるんだよな.
>そもそも研究者ってのは研究をすることが一番の仕事で, >一個でも新しい数値モデルなり何なりを完成させることが研究者としての役目だ. >別にコードを書くことが本来の仕事ではない. >別にコードを書くことが本来の仕事ではない. >別にコードを書くことが本来の仕事ではない. >別にコードを書くことが本来の仕事ではない. もうね、この発想がウンコ コンピューターサイエンスを完全に見下している 膠のように接着して切り離せなくなっていることをまだ理解しないのだろうか 既に立場は完全に同等なんだよ スパコン用のコード書くのも立派な研究で成果なの
え?だから対等だからこそ役割分担の話をしてるんじゃないの?
うちの老害にも言ってくれ 自分がコード書けないからってプログラマを格が低い職業と見下す
コードの効率化や書き方を研究するのは重要な研究、それは研究として突き詰めて頂くとして、 その成果を公に示し、それを元に実務専門家が正確に業務をこなす形にしないと、立ち行かないぞ。 どうしてこう、日本人とはグループワークの構造化が苦手なんだろうな。 成果より実務労働、フローより上下意識、全員が一列に並んで鍬もって耕す方向になる。
格が低いと見下すからプログラマが成果や技術を囲い込む 場合によっては難読化してる ぶっちゃけ相互利益がないから構造化なんて絵にかいたもちなんだ
上下関係として見なすのは悪い習慣だ。 組織としては、役員と社員、兵卒と将校の関係と同じく、そこに厳格な区分けは絶対に必要なんだよ。 問題は、実務労働側の利益、つまり雇用安定が担保されてないって事なんだよね。 だから、本筋はセンターなりなんなりの別組織体に労働者としてちゃんと雇用されるのが望ましいんだ。
アルゴリズム渡されてそれをコードに書き下ろすだけなんて IT土方仕事を優秀なプログラマがやると思ってる時点で痛い。
というか、計算科学やるのにコード書きませんってどういう了見よ? 英文学やるのに英語読めません書けませんって言ってるのと同じだろw
>>545 え? スパコンを使っても課金されないの? うらやましい。
いや、もちろん、コードを書く必要はないのは、
計算機を利用するための科学の人の事ではなく、
計算機を利用した科学をやっている人の事だよ。
たとえばさ、
自動車の車体や航空機の機体形状の設計で、
風洞実験の代わりに計算機シミュレーションをするって場合に、
それらの形状の設計者はコードを書くかというと、書かないよね。
既存のシミュレーションのプログラムを利用するだけだ。
まぁ、中には遺伝的アルゴリズムを使って、
コンピュータに形状を選ばせようなんていう話もあるけどさ。
>>546 プログラマを雇い育てるのは、もちろん、個々の計算センターがやるべきだね。
その優劣で、同じ設備でありながら、スループットが大きく変わってしまうのだから、
こういうのは経験の蓄積と反復が、パフォーマンス向上に不可欠だと思うよ。
まぁ日本の場合は、便利に何でもやってくれる人として、
各プロジェクトに専従っぽくなって、無駄なことになりそうだけどね。
>>551 > コンピューターサイエンスを完全に見下している
スパコンを作ったり、その効率良い使い方を研究するのはコンピューターサイエンスだが、
スパコンによるシミュレーションを道具として、コンピューター以外の研究をするのは、
コンピューターサイエンスじゃないだろう。
>>554 スパコンとは別の業界だが、製造業の設計の話。
あるメーカー(A社)では、製品ラインごとに設計部門の部署が別れている。
技術者は基本的にはジェネラリストで、担当製品のために様々な技術を習得する。
1つの製品の設計に1億くらいかかり、しかも、スケジュール遅延が多々発生し、品質も悪い。
別のメーカー(B社)では、技術ごとに設計部門の部署が別れている。
技術者は基本的にはスペシャリストで、習得した技術を幅広い製品ラインに応用する。
1つの製品の設計は、500万くらいで済む。スケジュール遅延はあまりなく、品質は高い。
どっちがいいか。
スパコン利用に関して、A社のようなやり方をしすぎてないか?
「中身なんかどうでもいから結果が早くでる魔法の箱が欲しい」 ってレベルの話は他所でやったらいいと思うんだが。
>>554 それは日本人だけに当てはまらないと思うんだけど、でも日本人的な理由を考えてみると、
日本人て、明示的な交渉のないまま勝手に線引きして(日本人同士の暗黙の了解みたいな
ものを考慮した結果)、相手がそれ以上前に出たら、いきなり切れるじゃん。
イギリスのチャーチルが第二次大戦前、日本人は外交を知らないっていったように、
詳しくは→
ttp://www.asks.jp/users/mechag/187345.html (なぜ日本は馬鹿にされるのか?)
こういう気質がまだあまり変わってないからだと思うんだけど。
こういうことに対してどうすればいいかってことを海外留学で学んでる人達は、国内に帰ってきても強いよ。
>>562 スパコンを使う人たちにとっては、
中身の特性を理解することは必要だが、それを作る技術は必要ないんよ。
たとえば自動車のラリードライバー。
彼らは自動車の特性を熟知して自在に操縦するが、
しかし、自動車を作る技術はないんだよ。
>中身の特性を理解すること あんた、そういう話全然してないだろ。 延々ハードと関係ない組織論見たいな事書いてるだけでさ。 そういう話が無駄とは言わないが、ハード板でやることじゃないだろ。 マ板でも経営板でも、そう言うところでスレ立ててやってくれ。
次のXeonの情報が出ましたね。 Xeonはどこまでいくのかすら…
>>565 スレを最初から読んでみ。
政府の科学政策の話まで総合的に扱ってるんだが、ここは。
>>567 あれ?Linpack効率世界一をうたっていたFX1よりSX-9の効率の方がいいじゃん。
572 :
505 :2009/05/28(木) 00:28:33 ID:3hzqgVlY
>>505 なんだが、結局1個もレスをもらえてない。
やっぱりプロセッサの仕様を知っている人っていないのかな?
京速の方もF社オンリーで決まってしまったし、このままお蔵入り確定?
せっかく設計したのに非常にもったいないと思うんだが。
せめてどんなプロセッサだったのかくらい明らかにしてほしいな。
ISSCC2010で発表とかないよねやっぱり
京速プロジェクトの他のメンバーは知ってるんだよね?? NECの担当箇所の仕様を
しつこくGRAPE-DRの電源回路なんだが・・・ LTspiceのLTM4600とLTC1629のサンプルを見ても、電源の入力にLが入っていない。 そのままシミュレートすると、電圧源の電流が思いっきりパルス状になる。 電源ケーブルや基板上の配線にも、抵抗成分、インダクタンス成分が含まれるので、 それを想定して適当なパラメータでLを直列に入れて、LとVinの間に低ESRのCを追加しても、 まだまだ、電圧源の電流は盛大にパルス状なままだ。 もちろん、Lのインダクタンスを適当な値にすれば、電圧源の電流はきれいになるが、 その分、LとVinの間のCに流れるリプル電流は大きくなるが、それは必要なことだ。 いちど、ボードの電源の入力電流をオシロで見てみることをお勧めする。 基板を手直しせずに動かしていると、基板に電源を供給している側が悲鳴を上げる。 たぶん普通のPC用のATX電源だと思うが、それの出力部分のLCフィルタが許容する リプル電流は、さほど大きくなく、L、Cともに発熱して超高温になり、特性が劣化してく。 すぐには問題は表面化しないが、期待よりも遥かに短い期間で電源ユニットが壊れると思う。 すでに基板に手を入れることができないなら、LCフィルタを別基板に組んで、間に噛ませる。 もちろん、GRAPE-DR基板の電源入力端子からの配線が最短になるように。 ・・・いや、問題になるくらいなら、すでにATX電源が何台も壊れて気がついてるはずだよな。
Nの社内ゲシュタポきたw
578 :
505 :2009/05/29(金) 01:09:20 ID:Kp9t7CPN
>>576 具体的にどこの誰とはいえないが、大学にいる知人です。
多分、その知り合いってNECの関係者なんじゃないの?ということを聞きたいんだと思いますが、
違う分野の人でNEC(スパコン)とは関係はありません。
そもそも
>>505 の後半の話は、その知人が耳にした情報を、さらに私が伝え聞いたもので
情報自体に信頼性があるわけではないです。
ただ、その信頼性を判断しようにも、そもそも京速用ベクトルプロセッサの情報がまったくないので
このスレで聞いてみたわけです。
579 :
窓際研究者 :2009/05/29(金) 03:28:21 ID:UmsGfcdT
然るべきソフトウェアを選定したり そのソフト上でパラメータを入力したりはするけど 自分でコードを書いたことなんてありまへんわ
変体仕様からみて変体仕様ってんなら普通じゃねぇの?
牧野先生、ここ何回か、プログラミングについて書かれてますけど、もっと良質な本を人に薦めるべきです。
C++本になりますが、Herb Sutterの著書を1冊でも読めば、
原著が日本語のプログラミング系の入門書がいかに洗練されていないのか、
よくわかりますよ。
とりあえず
ttp://www.gotw.ca/publications/index.htm あたりを見て、いくつかオンラインで読める記事を見てみると、日米の差というのを痛感します。
SMASH Science Modeling Algorithm Software Hardware 階層構造を表す言葉だが、上のもの程偉いんだと勘違いを始めた段階で歪みが出てくる。
"The Free Lunch Is Over" の人か
マキーノ、easicと何をたくらんでるんだ?
>>583 うがった見方をすれば、scienceの人間以外は問題外で、より下の世界を掌握した者がすばらしい、といってるようにもとれる。
>>587 幅広く知識を持たなければ・・・というのは、いつどの業界でも言われ続ける話です。
しかし人間のキャパシティは有限ですから、広く深くは無理で広く浅くになります。
つまり、願望に過ぎず、現実解にはならないのです。
多少のオーバーラップのあるスペシャリストのチームを組んでやるのがいいです。
全部を自分でやるのではなく、うまく分業して、それぞれが一流の仕事をする。
専門家にとっては当たり前のことを、素人が四苦八苦してやって時間を無駄に
するのはよくない。
どうしてここ数年、日本に作られるスパコンは、100TFいかないようなのばかりなの? 海外じゃ米国以外にも200TF以上のものがどんどん出てきてるのに
一つの要素として、スパコンに対して需要がない、ということがあるかと。
nextreme-2に決める前にactelの65nm品を調べてみるのもいいかもな。
内外価格差は原因ではなく結果だよ。 根本的な原因として、日本ではスパコンの需要が少ない。とくに官需。ていうか軍需。 もっとスパコンがあれば面白い研究ができます、ってんじゃ予算がショボくて当然。 安全保障に関わるとかでなければ、他の予算を圧迫してまで予算を拡大できない。
文系と左翼がのさばっているせいといういつもの結論でつね わかります
たとえばNECのSX-9は、カタログ上の最大構成なら840TF出るってことになってる。 でも、世界でいちばん大きな構成で買った客(JAMSTECH)でさえ100TF程度の構成。 本当に超高性能なスパコンに需要があれば、もっともっと売れてるはずでしょう。 ※需要というのは、言うまでもなく、莫大な金額を払ってでも使う必要、ということです。
んな金あればJaguar買う。
日本の主要な大学や研究機関はこの数年であらかた更新してるけど ほとんど3桁ないね。京速が完成する3年後くらいまで派手な更新はないんだろうなあ
ここにレスしているやつで、勇ましいことをほざいている人間ほど 実際にスパコンさわったこともなく、さわる能力も皆無のクズなんだろうな、と思う。
FPGAの値段が高い・・・基本的にはロット単位で買うものだから。 スポットでよく出てよく売れるようなものではなく、 需要が限られるようなものだと、 たとえば、 100個欲しいんだけど・・・100万円 じゃぁ200個なら?・・・それも100万円 もし1000個なら?・・・それでも100万円 もし1001個なら?・・・そりゃぁ200万円 てな具合になっちゃう。 いっそFPGA使って計算したい人たちで集まって共同購入できればねぇ。 そして、1個や2個だと、試作用のサンプル価格だから、べらぼうに高い。
>>600 2chに愚痴垂れてる暇があったら予算獲得せいや。
最新のCPUってどんな風に設計してるんだ
ボタンを押すと出来ます。設計用のAIが、自分をより早く動かすために頑張ってます。 どうでもいいが、昔は体育館に紙を敷き詰めて、設計者達がわらわらーっと鉛筆で書いてたんだぜ。
>>605 そっちの方が楽しかっただろうな
プロジェクトXの日米スパコン競争で見た。富士通の池田さんだっけ
凄い人は早死に
えーとね。 個人の能力の凄さであっと驚く回路が出来たのは90年ごろが最後。 シーモア・クレイの最後の作品ってなんだっけ。
>>608 じゃ今は人月だけで「あっと驚く回路」が出来るのか?
そこは0か1かじゃなくて程度問題だろ。
608はなにも、そんなこと言ってないような気がするが
ロジックから逆算して浮動小数点形式を設計するとか、クレイにしかできない。
612 :
不明なデバイスさん :2009/06/01(月) 12:51:21 ID:QGnTnp7l
人月よりはCADの力業じゃないのか?
ここって牧野先生もたまに書き込んでるよなどう見ても
実は、日記の文体が2chっぽくなってるだけなんだが。 ところで6月に5月へのリンクが無いみたいな。
616 :
不明なデバイスさん :2009/06/01(月) 21:33:40 ID:KCne5f/P
2009-05.html にするだけ。
> F は 45nm は量産移行しない あれ、そんなアナウンスしてたっけ 45nmまでは自社ファブで製造って言ってなかった?
>>605 >ボタンを押すと出来ます。設計用のAIが、自分をより早く動かすために頑張ってます。
ハツカネズミがクライアントだったりするわけだな?
42?
ん?そろそろ立ち退き期限か?
地球シミュレーターって書いてあるやん
625 :
不明なデバイスさん :2009/06/02(火) 06:21:41 ID:naA6w2S0
暇な女いる? 柏でセックスしようよ
あれで超大型案件なのか。 NECでSX-9の設計している人たち、泣いているよね。 だれか最大構成で買ってやってくれ。
NAREGI なれぎ?
先生、忙しくてテンパってるみたい ですけど、落ち着いてください。
なぜトヨタ
>>631 その案件のユーザーだから、だと思うよ。
何に使うのだろう。
ドライビング・シミュレータにでも使うのかな。
このご時世に特定用途でカスタムチップ作るか、、、 やっぱり金持ってんなぁ。
設計やデザインする時に大活躍だろ あとは展示とか販売店で商売道具にするとか あと車に積んだら画像認識系で色んなことできそう
デスクトップサイズで800TFLOPSか 1ラックで10PFLOPSいけるかも 外販したら売れるだろこれ
>>634 自動車会社は設計のために膨大な計算をしているとはいえ、
それらの用途なら、
既製品のスパコンを買ってきて使ったほうが安いじゃないかな。
637 :
不明なデバイスさん :2009/06/03(水) 12:14:42 ID:Ga6oOIsh
これからは、まねができる技術は負け組み。 おまいらのことだよ。本来学術なものは真似ができるんだが それをブラックボックス化した人が、何故ブラックボックスにしたか想像 するべきだ。 日本の技術は、その技術をもっている子会社ごと海外へ流出、大陸に進出 その結果うまれたのが今の技術の氾濫である。 全部技術をコピーできないようにできなかった奴らの危機管理の問題だ。 儲けるべきネタが漏れ出していることに気がつかない。 一心同体なのに、親と子の関係のようにし対等に技術を持ったものを保護しない から共生関係は崩れ、技術は垂れ流しのように東南アジアへ向かってゆく。 ウリジナルだ。パクリだ。 では、法で裁いてみせよ。
専用チップとはいえ90TFってどういう勘定なの? しかも45nm,17mm角で1億3000万トランジスタ?
レイトレ特化だろ
記事にあるように「相当」なんだろうね、たぶん。 実際に800TFの計算をするのではなく、 普通のプロセッサで普通にプログラムを書いたら800TFの計算になってしまうが、 レイトレーシングに特化して専用の回路とすることで云々ってことなんだろうね。
この記事の図、9コアってあるけど、図には8コアしかないな。 それぞれのコアに、専用レジスタという囲いで 8x16x4(512バイト) 2x4x16x4(512バイト) 2x4x16x8(1Kバイト) 4x8x16x16(8Kバイト) 4x16x4(256バイト) 4x16x16(1Kバイト) 4x16x16(1Kバイト) 4x16x16(1Kバイト) とある。 つまり計算の語長は、 16bitが2コア 32bitが5コア 64bitが1コア ということかな。 16bitは、たぶん浮動小数点ではなく固定小数点の計算だろうから、 800T"Flops"ってのは、ちょっとアレだ。 かといって、800Topsと書いても読者はわからないだろうしなぁ。。。
残りの一つって、もしかしてメモリ管理プロセッサ?
GRAPEだって固定小数点やらテーブルやら対数形式使ってflops値公称してきたからな。「相当」が相応しい。これまでスパコンでやってきたことを置き換えましたという意味合いもあるんだろう。
気にいった?
うーん… 微妙かな。なれぎ
そっか
でも何となく日本語っぽい語感なところはいいかも
NECの新型「地球シミュレータ」が国内最速を達成〜実効効率は93.38%で世界最高 6月4日 発表
http://pc.watch.impress.co.jp/docs/news/20090604_212472.html NECが独立行政法人・海洋研究開発機構に納入した新型の「地球シミュレータシステム」が4日、LINPACKの
ベンチマークで122.4TFLOPSの性能を達成した。
新型の地球シミュレータは、3月1日より海洋研究開発機構で稼働を開始。今回、LINPACKベンチマークで国内
最速となる122.4TFLOPSを達成した(2008年11月のTOP500との比較)。これまでの国内最速は東京大/筑波大/
京都大の「T2Kオープンスパコン」の83TFLOPS。理論性能に対する実効性能を示す実効効率では、世界最高の
93.38%を達成したという。
システムは同社のベクトル型スーパーコンピュータ「SX-9/E」160ノードで構成され、ピーク性能は理論値で131
TFLOPS。CPUは1CPUで102.4GFLOPSの演算性能を持ち、稼働システムとして世界最速としている。このCPUを
活かす大規模な共有メモリや、CPUとメモリ間のデータ転送、ノード間の高速ネットワークにより、世界1位の実効
効率を実現した。
□NECのホームページ
http://www.nec.co.jp/ □ニュースリリース
http://www.nec.co.jp/press/ja/0906/0401.html [Reported by 山田 幸治]
めでたい
N澤は歯軋りしてるだろうw
また値段あたりの性能とか言い出すだろ
B/Fが下がった割には頑張ってる。 BLASをアセンブラで書いてデータの再利用性を活かしたんだろう。 筐体あたりのプロセッサ数を16でなく8に絞ったセンターの決断も評価したい。
「効率」を追求するプロセッサのデザインというのも面白いが、TOP100ぐらいに入らないとつまらない。
ペタの前に「つる」が自動挿入される俺ハジマタ
いくら実行効率高くても、時代的には消費電力あたりの実行速度だろ
ほだね
なんで6コアなんだろうか。
668 :
不明なデバイスさん :2009/06/06(土) 11:42:53 ID:EHAapT91
値段あたりの実行効率って言うけど、使用料金からしたら 東北大SX-9・6.4TFLOPS(64CPU)=> 0.1円/秒 名大FX1・5TFLOPS(512core)=> 0.72円/秒 なんだな。頑張ってスカラーチューニング及び並列化し10倍の料金を払う、 それでも実行効率は低い。すごいマゾプレイだな。 そもそも各機関のスパコン費用はどれも月1億前後で大差ないわけだから、 導入価格でなく使用料金価格も重視してもらいたいもんだ。
使用料金は、導入価格あるいはリーク価格に電気代や人件費などを加えて、算出してるんでしょ? つまり、利用者への課金だけで比較していいと思うんだわ。
そういうのだと学術目的で部分大学負担とか、あるいは法人化したからビジネスとしての料金だったり、 独立行政法人とかの海洋研究機構にあるES2だとどうなるんだ。利用者の立場によっても変わるじゃんかよ!
研究所の場合は大抵、ユーザは計算機使用料を支払わないはずだ。 自分の場合も、タダであれば遅くてもそれなりに我慢して利用すると思う。 だからこそ、使用料を払ってまで使用するユーザの動向がある意味、HPCのニーズともいえるんじゃないの。 まあ研究所にあれだけの性能のスパコンを入れしかも、使用料を徴収していないという体制については 議論してもらいたいもんだけど。
>>669 FX1と比べてもねぇ。
筑波大のApproあたりと比較してみたら。
なれぎってどういう場合に使うと効果的?
>>673 筑波のT2Kでも、44ノード(6.3TFLOPS)で0.35円/sだね。
ちなみに名大によるとFX1は、T2Kの2倍以上高速と考えているみたいだよ。
だから名大でもHX600(T2Kよりは若干速い、クロック2.5GHz)だと0.35円/s程度だね。
>>677 ふーん、面白いねぇ。TSUBAMEではどう?
天文関係にしか使えないけど、天文台はタダらしいね。 でも、大学は大学共同利用機関ではないので、有料なのは仕方ない。
まあ、無駄に占拠しっぱなしのアホウを排除するうまい仕組みがあれば、 無料でも良いんだけどね。
681 :
不明なデバイスさん :2009/06/07(日) 15:12:03 ID:tRDFfNFb
よくリンクだけ張る人は何がしたいの?
公平に実費を課金すりゃいいのに。 それぞれの研究テーマごとに予算を配布するってことで。
そもそもここはリンクだけ張るために立てられたスレ 雑談してる人は何がしたいの?
人力RSSか。
>>680 普通、ジョブスケジューラでその辺はちゃんとやっているのでは?
占拠はできないと思う。
>>686 牧野先生の愚痴は、
そういうことをやっていないからこそ、生じたのでしょう。
ジョブのシステムを構築する手間を省いたがゆえの悩み。
>>678 TSUBAMEだと、40ノード(6TFLOPS)で0.1円/秒だね。
TSUBAMEも外部利用ができるとは知らなかった。メモリアクセスもノード間通信も
貧弱らしいけど…。
もはや、各組織が自前で持つのではなく、メーカーの工場内のものをリモートで使うような、時代になるのかな。
>>684 まあ、システムの規模に依るみたいね。天文台の Web を見るかと Cray と NEC
の機械にはスケジューラが入っている模様。まあ、あっても設定がダメなら無い
のと変わらんけど。
補足 ジョブのシステムを自前で作ることに工数をかけるくらいなら、 他のことをやったほうがいい、というのには同意なので、 批判しているわけではないので。念のため。
ジョブ管理システムを構築しなかったのは経費の節約のため? それとも人間同士で直接話せば必要無いって判断だったのかしら。 てか両方かw
異色なソースが混ざっているようだが
チリソースとか?
>>687 >まあ、もちろん Cray や SX や GRAPE もバッチキューなんだけど
>、ポストプロセスとかいちいちそういうので、というのも、、、
>というので 4ソケットくらいのサーバーをいくつか用意していると、
>そっちで長大計算を始めちゃう若者がいる、と。
牧野先生は、結局ユーザを教育しないと駄目というオチだった模様。
>>687 ,696
> ジョブのシステムを構築する手間を省いたがゆえの悩み。
不特定多数が使う事を前提としてない、判ってる人だけが使うのが前提のシステムだからじゃないの?
しょっぱい環境にわざわざ組むのはむしろ無駄じゃないのかな。バッチキュー導入云々は迷惑こうむった人からの
「あのアホ何とかしろ」苦情の大人表現だろ。呼び出して注意で済む事だよ、次やったらアレだけど。
上でも有ったSMASHの件もそうだけど、難癖つけてる人っていわば今回のアホと同じようなレベルなんだよね。
自分では事象の全体を視たつもりになってるけど視てないし、見えてすらいない。
「スケジューリングに手間かかるのは本末転倒だから目の前にあるマシンを使えばいいじゃん、
俺は他の人の迷惑ならないよう上手くやれるし」ってねw
698 :
窓際研究者 :2009/06/08(月) 05:36:09 ID:jXB0603q
素朴な疑問 4ソケットのサーバでも可能な計算なら、たぶん1ソケットでも可能だろうから、 その学生さんの自宅のPCでやらせりゃいいのよ。
>>698 微妙。IPCC の成果がすべて ES によるものというのは極端過ぎると思う。
日本が優れた予測モデル(ソフト)を持っていたという話なら分かるけど。
>>699 メモリが少なくてもよいなら可能だと思うが、4ソケットのマシンは
大メモリ(128GB とか 256GB)積んでるんじゃないのか?
そこで仮想記憶ですよ
>>700 たるさん記事の内容を真に受けちゃダメ。
面白い文体の一般人向けの読み物なんだから。
>>700 4ソケットなだけでなくメモリが大量に積めるマシンか・・・それじゃ無理だ。
個人が気軽に自宅に用意できるような安いマザーボードとメモリだと12GBだから。
真相ねぇ…
> バンド幅強化は最新のトレンドだ。 > バンド幅強化は最新のトレンドだ。 > バンド幅強化は最新のトレンドだ。
いまおもえば、分散メモリへの切り替えも、スカラへの切り替えも、富士通は早かった。経営陣が技術トレンド読めてたのかな。Venusもトレンドは読めてないとは思わないから、IAとの価格競争に耐えたら未来はあるんじゃ。
>>708 新聞屋さんはお気楽ね。
デカいスパコンを1つ作るだけなら、金さえかければ何とかなるが、産業にはならん。
京速スパコンを目標の性能を満たして完成させること自体は、あまり意味がない。
同じものを沢山のユーザーに売らなきゃならん。
NECが離脱したのは、それが出来なさそうだから。
富士通が残っているのは、それが出来そうだから。
つまり、同じものを沢山のユーザーに売ることができないような、
巨大なスパコンを作るというプロジェクト自体に、最初から問題があった。
地球シミュレータは話題ばかりで、同じものを買ったユーザ、いないでしょ?
>>710 のお気楽な頭の中ではSX-7は無かったことになってるようだな。
需要は小口のレガシーコード用だからSMPにしがみつかなきゃならない。B/Fもこれ以上落とせない。ますます先細り。 ESでMPIコードの資産は残せたんじゃない?
>>711 地球シミュレータのノード転用は、SX-6だろう。
>>709 単に NEC が遅いというだけでは?富士通の VPP シリーズの中止は随分前だし、
日立もね。んで、ベクトルは NEC だけという状況がもう結構続いている。
メインフレームとも関連あり、かもね。 富士通のスパコンのSPARC64の設計は、メインフレームのGP21(だっけ?)と同じ人たちがやってる。 NECのスパコンのSXのプロセッサの設計は、メインフレームのNOAHと同じ人たちがやってるらしい? NECのメインフレームは、昔はぜんぶNOAHだったのが、XeonやItaniumに置き換えが進んでる。 つまり、SXのスケールメリットは年々なくなりつつある、と。
いまどきメインフレームもそこまで性能が必要なわけでもない
メインフレーム、それも大規模な奴で必要なのは CPU性能じゃなくてI/O性能みたいだしね
むしろFは、HPC用として10年以上スカラーに取り組んで、 いまだにあの程度のものしか作れないことが能力を示している。 Venusも価格・性能ともにPOWER7にまったく太刀打ちできないだろう。
POWERっていうだけで、値段が高い別世界だと思うのは、偏見ですか。 富士通のSPARCなスパコンというと、AP1000ですか。 AP3000の筐体の足が、ピザボックスやランチボックスの足と同じデザインだ・・・面白い。
>>718 > むしろFは、HPC用として10年以上スカラーに取り組んで
CPUって意味じゃ違うんじゃね
一時期、自社製CPUを諦めてItaniumに移行しようとしてる
FX1で再参入した形だけど、まだ付け焼刃って感じで
あれを実力と言ったらかわいそうかも
まあ
> Venusも価格・性能ともにPOWER7にまったく太刀打ちできない
ってのには同意
>>719 AP3000もUltraSPARCだから自社製CPUじゃないね
WSを高速ネットワークで接続してパラレル化しましたってやつだから、
今で言えばPCクラスタ機みたいなもんでしょ
当時それを実現するのはたいへんだったかもしれないけど
CoreMAならメモリはそんなもん
AP1000はSuperSPARCだったのか 知らんかった
値段あたりの主記憶バンド幅を最大化するのってどうすればいいんだろうね。 CPUにメモリを直結するのが唯一の解かもしれないが。 富士通のように無理矢理512ビットにするのか、それとも256ビットで2ソケットのほがいい? GPUのやりかただと容量(単価)がネック。 結局COTSのDIMMになって、DIMMがウン万枚あるからそれをテキトーにつないで演算機もおまけで付けとけってなるのかな。
いまのDDR系のDRAMのI/Fである限り、ただビット幅を増やすのは得策じゃないよ。 データ自体の転送に要するクロックよりも、それ以外に要するクロックのほうが多いので。 ただビット幅を倍にしても、たった1クロック分しか短縮できない。 どうせ倍のDRAMを使うのなら、ビット幅は同じままバンク数を増やして、 パイプラインでクロックを削ったほうがいいかも。
>>710 ビジネスニュース板で暴れてる、スカラプロセッサ至上主義の人?
NECが「地球シミュレータ」って商品を一般向けに販売してるなんて知らなかった。俺はESはワンオフ物だと思っていたよ。
そいつのカタログはどこに行けば見れるんだい?
喧嘩腰はお控えになっておくんなせぇ。
>>726 前者は、ちがう。
後者は、NECの営業に相談だろ、普通。本当に買うつもりなら、な。
メモリ転送速度はへっぽこで良いから、単純にメモリがたくさん使える安価な マシンが出ればHPCの需要が広がると思うんだけどなあ。 お手軽パッケージ(これに対応してもらう必要はあるけど)をお手軽に使った お手軽な屁理屈を使ったプログラムをお手軽に書ける。 今のHPCは敷居が高すぎるよ。
敷居が低いとHPCっぽくないなw
732 :
不明なデバイスさん :2009/06/09(火) 23:55:13 ID:LJd98Qhv
>>728 >前者は、ちがう。
それは、すまなかった。謝ります。
>後者は、NECの営業に相談だろ、普通。本当に買うつもりなら、な。
ESというワンオフ物を、大量生産のビジネスモデルに当てはめて評価することが
不適切ではないかと言いたかったんだ。
確かにNECに話を持ち込めばES相当の物は作ってもらえるかもしれないが、それはあくまでオリジナル品。
他の多数のユーザにも売ることを考えたものでは無いだろう。
そもそもスパコンの概念に、大量生産のビジネスモデルを当てはめること自体がナンセンスじゃないだろうか。
スパコンてのはその時代の計算機に比べて飛びぬけた性能をもつコンピュータのことだ。
スパコンが大量生産されてしまったら、それはスーパーなコンピュータではなく、
どこにでもあるただのコンピュータでしか無いんじゃないか?
まあ、言葉のあやだといわれてしまえば、それまでだが。
いずれにせよ商売として成り立たないとはじまらない
しかし、その言い方なら"京速計算機"が他で売れることもあるまい、 というのは別にしてもSPARCの遅さは関係者には知れ渡ってるから こちの方がよっぽどスペシャル仕様になるかもな。 理研からもFX1より、Nehalemがいいっていわれたんだろ、10万CPUなんてシステムならともかく、 普通の仕様ならそう思うよな。しかも高いし…
>>732 他のユーザーとは桁違いのスパコンを「使うために」政府機関が購入する
(つまりメーカーは、その案件だけで黒字を確保できる)
という、単純なプロジェクトなら、まぁいいんです。
地球シミュレータでは、そういうスキームだったから、問題なかった。
ところが、京速スパコンは、
「作るために」開発費と製造費を半分出して旗振りをするという、
メーカーは同じものを多数のユーザーに売らないと赤字になる
というプロジェクトらしいんですよ。
地球シミュレータの量産機とも言えるSX-6では最大ノード数を抑えたし、
その後の後継機でも、最大ノード数で買うようなユーザはいなかった。
つまり、大きな構成には需要が、ほとんど、ないんですわ。
で、京速スパコンだが、ファーストユーザーだけで終わる可能性が高い。
1つは需要がないだろうということ、もう1つは完成してから受注活動しても手遅れだということ。
スパコンを納める建物も含めて、受注から稼働開始までの期間が長いのだから、
完成したときには、もう競争力がない。
事実、いまだに2番目以降の受注のニュースがないのだから、これからも、ないだろう。
予想されるツッコミに予め答えておく 京速スパコンと同じものが売れなくても、フラッグシップ事例として宣伝に使うことで、 より小規模なものが売れればいいじゃないか、という話は・・・NECは否定している。 すでに報じられているように、京速でしか使わない技術になる見込みだという。 より小規模なら、既存のSX-9や、その後継機でも構わないだろう。 さらに、スカラとベクトルの複合システムというのが売れるかどうかもアヤシイ。 スカラのみ、ベクトルのみ、という構成で売れたとしても、それはもう、京速の小型版じゃない。 というわけで、 一品もので終わるのに、ユーザーが全額を出してくれないのなら、商売にならない。
けいそくはvenusなんかで良いのかねぇ あといちいちなんとかセンターという箱物に金かけすぎなんだよ 作ったらちゃんと使え。末代まで使えESのセンターは明らかに無駄となってる
京速ってなんで国が全額出さないの?
まぁ1150億円だしてもぜんぜん足りないって計画がうんこなんだけどな
京速の最大の問題は、 世界のスパコンの性能向上のトレンドに沿っている ってことだと思う。 競合に比べて、同じコストで10倍の性能が得られる、あるいは同じ性能が1/10のコストで得られる といったようなアドバンテージがなければ、 ただスケーラビリティが高くて巨大な構成も可能ですよ ってだけだもの。 (いや、そのスケーラビリティが大変なんだよ、ってのはわかるけど) 実際に多くのユーザーが買うのが小規模構成なら、そんなスケーラビリティなんて不要だもの。
>>738 >ところが、京速スパコンは、
>「作るために」開発費と製造費を半分出して旗振りをするという、
>メーカーは同じものを多数のユーザーに売らないと赤字になる
>というプロジェクトらしいんですよ。
俺の認識不足だったらごめん。
京速プロジェクトって開発したプロセッサを、京速以外で販売していくことを想定してたっけ?
次世代スパコン用プロセッサのための「要素技術」の開発をして、
その「要素技術」を京速以外のシステムにも活用するってのは、プロジェクトの中に含まれていたとは思うが。
あと、
http://www.nsc.riken.jp/p4.htmlのプロジェクト概要 (3)に書いてある通り、
京速スパコンは全国の計算センタの中心的役割を果たすものであり、
京速2号機、3号機を作っていくことは想定してないんじゃない?(将来のリプレースはあるだろうが)
じゃ、尚の事、国がもっと出すべきだったんじゃないのかね
746 :
744 :2009/06/10(水) 01:31:04 ID:7jrlJG/8
>>739 それって結局は、京速で開発したプロセッサは、京速以外では使わないってことじゃない?
そうすると、
>>738 の
>ところが、京速スパコンは、
>「作るために」開発費と製造費を半分出して旗振りをするという、
>メーカーは同じものを多数のユーザーに売らないと赤字になる
>というプロジェクトらしいんですよ。
は前提条件からしておかしくならないか?
ふつーにポータブルに書かれたC/C++のMPIコードで価格性能比がX86より良ければ飛ぶようにうれる。
>>744 他にも売ってトータルで黒字化することを想定しないのであれば、メーカーは持ちだし出来ないでしょう。
メーカーが持ち出しをしているということは、他にも売ってトータルで黒字化することを前提としているはず。
>>746 > それって結局は、京速で開発したプロセッサは、京速以外では使わないってことじゃない?
NECは、京速以外では使う見込みがないので、撤退。
富士通は、京速以外でも使う見込みなので、残った。
ということだと思うよ。
> は前提条件からしておかしくならないか?
そう、おかしいんですよ、京速プロジェクトは。
750 :
744 :2009/06/10(水) 01:46:43 ID:7jrlJG/8
>>749 だから、そもそも京速用に開発したプロセッサを京速以外にも使いことが、プロジェクトの目的だったのかを聞いてるんだが。
京速以外も使うことが前提だったらNECの違反だし、
京速以外に使うことが前提でなければ富士通が勝手にやったことでしかないだろ。
話は変るけど、 汎用品のDIMMってUnbufferedに対してRegisteredは自由度が高いよね。 Unbufferedだと8bit×128M構成のチップを16あるいは18個で2GBのDIMMのみだが、 Registeredだと4bit×256M構成のチップを18個で2GBのDIMMもアリ。 それどころか、36個で4GBも可能。 ならば、72個で8GBっていうDIMMがあっても、いいよねぇ。 安価な1GbitDRAMを沢山ならべたほうが、高価な2GbitDRAMを使うよりも、安いでしょう。 2GBのDIMMの5倍の値段で8GBのDIMMが手に入れば、 DIMMスロットが6本のマザーボードで、48GBですよ。 12本なら、96GB。 ・・・CPU側のメモリコントローラが対応してないか。
>>750 全額を出さないのだから、他にも使うことが前提でしょう。
いちいち明記しなくても。
ん、後半の違反どうこうってのは、何のことだ?
754 :
744 :2009/06/10(水) 02:16:20 ID:7jrlJG/8
>>752 なんで全額を出さないと、他に使いまわすって結論になるの。
その辺の論理展開を、文章を省略せずにきちんと示してくれると助かるんだが。
>>753 違反って書き方が悪かったかな?
京速以外にも使いことが前提の契約なら、きちんとそういうプロセッサの
設計・開発をしてないとNECの約束違反だよねって話。
NECは京速以外には使わないって明言してるからね。
言われたとおりのプロセッサ設計をしてなかったじゃんて突っ込まれる。
755 :
744 :2009/06/10(水) 02:17:56 ID:7jrlJG/8
>>754 うう、また変換ミスしてしまった。
×使いこと
○使うこと
756 :
744 :2009/06/10(水) 11:40:06 ID:0ONCuGCU
ああ、意味がようやくわかった。
国(プロジェクト)が開発・製造費の全額を出さないのだから、
各企業が持ち出した分の費用は別口で回収しなければならない、ということね。
でも、企業の持ち出し分をどうやって回収するかは、それぞれの企業が決めることであって、プロジェクトとしてどうやれとは言ってないんじゃない?
富士通は開発したプロセッサを他に使いまわすことで開発費を回収する方式を取っただけであり、
NECは開発した要素技術の方をSXに利用することで、次期SXの方で開発費を回収する方式を取っただけ。
本来次期SXに転嫁するのは技術開発費だけだったはずなのが、製造費で100億程度の追加費用が発生して、
さすがにこれは次期SXに転嫁できないから、京速用プロセッサの製造はしないって判断をしたんじゃない?
そもそもNECも、富士通と同様に開発したプロセッサを他で使いまわすことで費用を回収するモデルをとっていたんなら、
プロセッサを製造しないと決めた今、これまでの開発費用をどうやって回収するんだ?
本来京速スパコンはESと同様に、国が旗振りをして単一のスパコンを建設するものだったはず。
その根拠は
>>744 の後半で示しているし、ES型のプロジェクトの有効性は
>>738 でもみとめている。
もし京速スパコンがESの様な単一スパコンを作るプロジェクトではないというなら、
「京速スパコンのスケールダウン版が各計算センター等に導入されることがプロジェクトの目標の一つだ」
みたいなことを言っているソースを示す必要があるんじゃない?
もちろん京速がESと同様な単一のスパコンプロジェクトだというのにもかかわらず、
プロジェクトが開発・製造費の全額を出さないのは確かにおかしい。
この点で次世代プロジェクトがダメだというなら、これには同意する。
> プロセッサを製造しないと決めた今、これまでの開発費用をどうやって回収するんだ? 回収しない、だと思うよ。
RmaxとNmaxを取り違えて第三者が気づく というので、誰か推定してくれw
761 :
756 :2009/06/10(水) 16:26:09 ID:0ONCuGCU
>>758 それを見ると、次世代スーパーコンピュータ計画(京速プロジェクト)位置づけは、あくまでもリーダーシップシステムの開発じゃない?
もちろん京速用のプロセッサを改良してそれを次々世代のインフラストラクチャスパコンに使うのは別に自然だとは思う。
ただ、それは今の京速プロジェクトの範囲外での話だし、
京速プロジェクトがプロセッサの大量生産を前提としているという事ではないよね。
役人連中がでっちあげた非現実的な青写真を真に受けちゃダメだぞ。
つくづく残念だ… たとえ使い物にならなかったとしても、 変態ハイブリッド構成スパコン見たかったのに
日本は、もったいないことしてると思う。 自社内で一通り揃えられる、IBM級のメーカーが何社もあるのに、うまくいかないのだから。
>>764 財(メーカー)は国内である程度食えちゃうから、じゃないのかな。
あとの政官にスパコン(に限らないけど)の開発力やシェアが安全保障に繋がるって言う視点が無いからってのもあるかな。
日本は水と安全はタダってのが根強いし、仮に意識しても安全保障=軍事って短絡的過ぎる。
前の戦争でも経済問題が根本にあるってのを教えないし忘れてる。
>>765 とはちょっと違うのだけど、
日本では核兵器開発が無い分
スーパーコンピューター市場は少なめなんじゃないかな
その分他のことにお金をかけているかというとどうだろう。
核シミュってそんなに頻繁にやってるものなの?
予算は山ほど付いているように見える
DARPAとか、CEAとか皆核だ。 国内だって内閣官、、、あ、誰かきた様だ うわなにを
へー。 核ってまだシミュする必要あるのか… マンハッタン計画の頃に比べてどんだけ進んだのかしら
軍事技術に優秀な人間のリソースを割いていたら、その分民生分野の開発力が落ちる。 軍事技術名目に関係ない分野にリソースを投入するなら、民生分野への悪影響は ないが、そもそも、そんな事態が歴史的にある程度起きたのは、軍産複合体が存在する 米国の特殊事情。 軍事技術が民生に転嫁されるメリットを取り上げて軍事技術推進の根拠とするアホウは、 軍事技術に投入された膨大なコストと便益の比をまったく考えていない。 戦車師団の戦車を鋳つぶして、今までかかっていたその師団維持費を スパコンに投入しろ、とかいう話なら賛成できなくもない。
>>768 アメリカのスパコンを牽引しているのは、エネルギー省の国家核安全保障局だよ。
ASCIとか。
ロボットとかモビルスーツとか… 海外は日本の民生技術に興味津々なんだよね
>>771 核実験できないわ保有してる核弾頭の劣化(放射性崩壊とか)を管理しなきゃだわで
スパコン使いまくりってどこかで見たよ
>>773 >>775 ほうほう。なるほど…
日本は核兵器無いしなぁ。何かそれに代わるものは…
やっぱり自然環境、天災系シミュってなっちゃう?
国が安定した大口顧客になるものは。
あれ、でもこっそり一応やってるのかしら…かく
このスレは不可解なことを言うやつが多いと前々から思っていたが、 理由がわかったよ。 このスレはハードウェア板にある。 だから、ユーザもしくは潜在的ユーザが、当該ジャンルの製品について、 高くて買えねえだの安いだの速いだの遅いだのの褒貶をするのが大まかな趣旨だ。 ところが、このスレに限っては、ユーザもしくは潜在的ユーザはむしろ少数派で HPC機を使ったこともないのはもちろん、そもそも自分自身が使う立場になることを まったく想定していない輩が多い。 勝手な想像だけど、たとえば車板にあるだろうフェラーリスレでも、 現実のユーザは少数派かもしれないが、残りの大多数は潜在的ユーザとして レスしているはず。 ここに相当数いる、スパコンを宇宙船と同等に扱う輩とは明らかに性質が違う。
スパコンの速度もメモリもバンド幅も貧しすぎる 何もかも100エクサ以上いる
ユーザはユーザで、コード書けないのに選民意識あるやつ多くてうざい。
ユーザーはコード書くでしょ。書かなきゃuse出来ないじゃん。 あ、酷いコード書くってこと?
スパコンを使うからといって、必ずしもコードを書く必要はないだろう。
>>779 むしろ逆じゃね?
関係者と思われる人間が相当数紛れ込んでるぞ。
でtop500の発表が6/23でおk?
中国とインドがトップ10から追い出されれば満足だ
789 :
不明なデバイスさん :2009/06/12(金) 22:56:50 ID:bvFxOi8e
University Wire 04-10-2002 IOWA CITY, Iowa -- University of Iowa officials blocked the Internet privileges of the man they say sent a threatening e-mail to the UI College of Nursing, but campus police said Tuesday they can do nothing more. That's because former UI nursing student Takahiko Senuma, 32, now lives in Tokyo -- too far away for officials to question him, said Duane Papke, the associate director of Public Safety. Public Safety evacuated and locked down the nursing school March 29 after concerned officials reported the threat. The building reopened the next morning. "From almost the beginning, we knew it was him," Papke said, explaining that Public Safety used the UI Information Technology Service to trace the threatening e-mail back to Senuma. " The case is not closed. We're not going to investigate further at this time, but if he returns to the United States, we'll want to talk to him." Papke said that because the investigation isn't final, the department will not make a copy of the threatening e-mail public. Steven Burrows, a former UI freshman who lived down the hall from Senuma's Hillcrest room, said the accusations against such an "innocent, gentle person" shocked him. "He was having a rough time with school," Burrows said. "I knew he was having some problems with a professor's class, and he later dropped it. He had a lot of complaints about the school." Senuma, who already held a law degree in Japan, came to the UI because he wanted to continue his schooling, Burrows said. But his age often left him as an outcast, he said. "He's a whiz with computers," Burrows said. "We helped each other. He didn't speak English well, so he brought his papers to me, and I would edit them. And when I had computer problems, he'd come fix them."
790 :
不明なデバイスさん :2009/06/12(金) 22:57:31 ID:bvFxOi8e
During last semester, when Senuma grew angry that Burrows' roommate had not paid for a football ticket he loaned them, the friendship became strained, Burrows said. During his time as a student, Senuma openly criticized the university at least twice. Earlier this year, he petitioned to end the UI's flex-dollar program, which automatically bills students $100 per semester for non-charge food purchases. Senuma said employees called Public Safety after he allegedly tried to use his flex dollars to buy food for others -- a practice the university bans. In a March 15 letter to a DI reporter, the UI senior said he left the nursing school and returned to his native Japan in February because of the "inefficiency and bureaucracy of the faculty." The letter, signed "Taka," did not go into specifics. Nursing school faculty have remained quiet about the incident, refusing to comment and not returning phone calls. An assistant nursing professor, speaking on the condition of anonymity, said the school's administrators "have been keeping it really quiet." "We got an e-mail on the following Monday saying the message made a serious threat," the teacher said, adding that administrators did not disclose the letter's contents but called them "bizarre." Chuck Green, the assistant vice president for Public Safety, could not be reached for comment; he did not return phone calls. The last e-mail threat at the UI, a racist letter vowing to detonate a bomb in the UI College of Dentistry, led Public Safety to evacuate the Dental Building in the spring of 2000. Former UI dental student Tarsha Claiborne was later charged; she admitted to making the threats. She was sentenced to four years' probation and ordered to pay the university $17,000 in restitution.
まとめて( ;∀;)
>>788 計算機センターの予算を集約して、価格性能比の良いシステムを米国から調達すればよい話だな。
それともRadeonクラスタDIYでやる?
スパコン保守員の私が覗き見
>>792 なぜRadeon(w
mtyクラスタでも組むのかいな
それはそれでいいぞwww
796 :
不明なデバイスさん :2009/06/13(土) 23:19:24 ID:1ooRtnR+
M野先生ん家は光化か。いーなー。 てかテラバイト級のファイルなんて送ってたら 回線絞られちゃうんじゃなかろうか
>>795 いや、ただのNehalemよりRadeonでDGEMM加速するのもいいなじゃないかなって。
ラデと言えば、次は1ボード4チップ(2チップMCMx2)の噂があるよな。 実現すれば遂に1ボードで倍精度1テラに手が届くわけだ。
わーい 1000枚並べれば1ペタだー
>>797 ほだね
結構いろいろなプロバイダで規制されちゃいそうな予感
>>801 ,803
GPUクラスタは通信がネックになるって話を富士通の人がしてたな。
+ + / ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ∧_∧ < わーい1ペタだー! 1ペタだー br(´∀` )ワーイ ! | 何でもできるぞー + ヽ つ \_______________ (⌒_ノ し'ゝ ;;::⌒:: いや、なんとなく思い出したんで。
>>805 GPUの場合、ホストCPU上で走るソフトウェアを介さないと、他のノードと通信できないからなぁ。
GPUから直に口が生えていたら・・・ホストいらないかもな。
>>807 ホストに依存せずに計算を行うGPU…
なんか、本来のGPUの仕事を忘れてる気がするな。
GPU「CPUさん。スンマセンが、代わりに描画しといてくれる?」 CPU「わかりやした〜!おやかた〜!」
GPUからHTやQPIみたいのが4本とか6本出てたら、 それで分散メモリのメッシュネットワーク作れる。
GPU「おいこら、ジュース買ってこい。財布はお前な」 CPU「うぃーっす」
もはや何が何やらw
いま世界中にどれくらいのflopsがあるんだろ。去年だけでもエクサ単位で出荷されてるよな?
>>813 アレブログによると東北大、阪大のTFLOPS価格は2億、3億ということだけど、
これみるとディスク(1PB)が含まれていないからか?
しかし知り合いに聞くと、正統派SX-9は東北大らしく、
むしろ阪大はNECがあきれるセコイ仕様らしい。
>>815 段階的システム更新で導入時期が同じになってしまった名大と理研では、
価格は名大>理研、だけと理論スペックは倍近く理研が上。
メモリバンド幅もNehalem>FX1>M9000≒HX600から、実行性能も理研とすると…
スパコンの価格ってよくわからないね。
>>817 金額が大きくなると、お役所にならざるをえないから。
>>817 FLOPSやメモリバンド幅ばかりに目が行くと、
> スパコンの価格ってよくわからないね。
ってなるんだろ。
システムに占めるCPUのコストなんて1/10以下だろうし。
FLOPSやメモリバンド幅はスパコンの性能を見極めるうえで重要なfactorであることに違いない。 むしろFのSPARCがHPC分野で、低速・高価格の勘違い機種であるだけで、 他は従来言われてきた傾向に一致する。
富士通のすぱーくって高いの?
同一ハードを、エンプラ向けとHPC向けで、別の値段を付けて売っていると思うが、 エンプラ向けに遠慮して、HPC向けの値段を高く抑制せざるをえないのかもね。 スパコンって、規模が大きくなればなるほど、処理あたりのコストが安くなる必要がある。 たとえば、64CPU機は4CPU機の16倍未満のコスト(購入から電気代など・・・)でないと。 ところがエンプラだと、規模が大きくなればなるほど、処理あたりのコストは高くなることが許される。 これはビジネスモデルの問題なので、同一ハードで両方をカバーする富士通ならではの苦労だと思う。 NECはスパコンとメインフレームを同じ技術で別製品として作っていて、互いに流用不可能だから、 それぞれに合った価格を付けられるのだろうね。
へぇー。
>>824 >ノード当たりのB/Fは倍以上違うしな。
ここは、笑うところでしょうかw
STREAM実測値(4core)
FX1 13GB/s(理論値40GB/S)
Nehalem 18GB/s
>>825 > ここは、笑うところでしょうかw
うん、あんたの頭をね。
「インタコネクトも、ノード当たりのB/Fは倍以上違うしな。 」
なんで変なところで引用切ってるの?
>>826 インタコネクトも ってその次につながってたんだ。tooの意味かと思ったよ。
でどこ見ればそれがわかるの?
826のような発言をする人間はスルーしたほうがいい
829 :
不明なデバイスさん :2009/06/17(水) 00:42:04 ID:zrkPwZLG
詳しい人教えてほしいんだけど、 理研が神戸につくってるあれ、Venusで 2GHz、8コア チップで128GFlopsなんでしょ? アメが当ててくるのはPOWER7で4GHz、 コア数はおなじ、チップで 256GFlopsらしいんだけど、 同じ45nmプロセスで倍クロックが違うって 何を意味すんの?
やっぱりvenusは3Ghz駆動で! とか出来ないの?素直に1.5倍の性能にはならない?
実際は2GHzでさえ厳しいんじゃないの?
>>829 まず、一口に45nmと言っても、同等のものとは限らない。
その数字が何を示すものなのかが会社によって違うし、
たとえ同じものを指していても、それ以外の要素が違う。
次に、動作クロックは設計によって大きく異なってくる。
同じ能力のトランジスタを使ったとしても、
パイプラインの1段で通過するゲートの数によって遅延は異なるし、
ゲートの出力がドライブする他のゲートの入力の数によっても遅延は異なる。
ゆえに、同じプロセスでも、動作クロックに2倍の差があっても、不思議じゃない。
>>833 前作のSPARC64 VIIが2GHz overなのだから、2GHz出ないってことはないと思う。
最初の稼動間近になって、実は3Ghzでしたとかいって、完成してないのに 10PF超えたらかっこいいのに
836 :
不明なデバイスさん :2009/06/17(水) 02:39:28 ID:stI+f6OW
「アメが当ててくる」というのが Sequoia のことなら、あれは1ノード16コアでは。 だからクロックは2GHz のはず。4GHz だと消費電力の目標を達成できないと思う。 Venus もクロックを落としているのは消費電力対策だろうし。
>>836 Sequoiaは98304ノード,20PFだから3.2GHzか1.6GHzでは。
でも96ラックに収めて320m^2はすごいな。
京速は1000ラック超で面積10倍は確実だし。
2チップのMCM 1チップで256Gflops これをソケットで256Gflopsと誤解すると、クロックが半分になっちゃう。
中国の例のスパコンはやっぱり核シミュに使ってるのかしらん
>>841 【話題/PC】中国製スパコン『魔方』稼動--“米国に次ぐアジア1位”の演算速度 [06/17]
http://anchorage.2ch.net/test/read.cgi/bizplus/1245230053/l50 >魔方は中国語でルービック・キューブの意味。演算速度は100兆回/秒クラスとされ、
>中国現地では「アジア第1位の、米国に次いで100兆回/秒クラスのスーパーコンピュー
>ターを保有する国となった」などと報じている。
>
>「魔方」はもともと「曙光5000A」と呼ばれており、ピーク時の演算速度は200兆回
>/秒を実現しているという。
おそらくLINPACKでの性能なのだろうが、実行効率が50%あるかどうかも怪しい。
TOP500攻略のためだけのLINPACK専用機で、実際に何かを計算すること考えてるとはとても思えない。
>>842 Chankoro版Tsubameですね。わかります
>>842 ほう。見栄機か。
まぁスパコンは見栄も大切なのかも知れないがw
あんまり馬鹿にしないほうが、いいと思うけどなぁ。 全ノードを動員して1つの計算をする・・・そんな使い方はLinpackだけだろうから。 密結合されたノード群が、さらに外側で疎結合されている、なんて構造かもしれない。
>>846 ホントだ。なんかよく分からんニュースだな。
約100TFlopsの計算能力って話はどこから出てきたんだ?
魔方は top 10 で唯一 Windows HPC のようなだが、これは何か 用途と関係ある?他は、サイエンスや軍事での利用だが、 魔方はビジネスユースか?
中国は金融とかに使うって言ってるみたいだけど
850 :
848 :2009/06/17(水) 23:51:54 ID:rOJs2a8L
>>848 マイクロソフトがフラッグシップ案件として目をつけた
中国側が技術を習得したくて飛びついた
ってことだと思うよ。
あとは、あれだな。
アメリカの眼が届くという意味もあるのかもな。
それにしても、Linpack180Tflopsが27億円って、どうよ。
上海一帯の盗聴解析とか 法輪こうみたいな丸金ワードの発音拾ったり
おまいらTsubame2.0の仕様書案みたか? 2010年6月に3Pflops GPGPU 倍精度 2.7PFlops CPU 倍精度 0.3PFlops が内訳。世界一とれるんかな
一位はまず無理だろうなあ
GPGPU実効どんだけかわからんが、RPeak 3PFは一位の射程圏内じゃね?
なんでこう日本は、ビッグバン的なプロジェクトをやろうとするかな。 日本が得意なのは漸進的な改善だよ。 株価や株主の顔色を伺って短期で成果を摘み取らねばならないアメリカと違って、 日本では赤字を垂れ流しつつも長期的に粘って粘って生き残るやり方ができるんだから。 とはいえ、NECが京速から降りた件など、世知辛くなってきているのではあるが、 それはすなわち、日本の凋落を意味するわけで、長期的には非常にまずい。 非関税障壁だとか不公正な競争だとかクレームが付かないように気をつけながら、 政府機関が毎年度、大量導入を続けて買い支えるべきだろう。 京速にしても、1つ作ってオシマイだから、NECが降りてしまうんだよ。 京速がサービスインした1年後には京速2.0が、さらにその1年後には京速3.0が・・・ といった具合に、毎年1つずつ完成させていくようにすべきだと思うよ。 どうせ性能寿命は5年くらいなんだから、日本中がスパコンで溢れることはない。 5年たったら、最初のが引退するんだから、構築期間も考えて、7箇所のローテでいいだろう。
そういえば、ASCI RedのようにCPUをアップグレードする、っていうのはないの? スパコンにおけるCPUのコストの割合が小さいのなら、 途中でCPUを交換したほうがコストパフォーマンスいいんじゃない?
みんなのスパコンというわりにはGPGPUで本当によろこぶのか?
M先生やA先生のおもちゃじゃないのw
>>860 京速のスカラー部分はCPUを入れ替えてアップグレードを考えているって聞いたことあるけど。
まあSPARCじゃ導入時点で、2年落ちみたいなもんだから…
> 日本が得意なのは漸進的な改善だよ。 CP-PACS、NWT、地球シミュレータと、野心的なプロジェクトでいくつも成功してるんですが。
>CP-PACS そこは元祖PAXシリーズだろ
>>862 地球シミュレータなんて一発屋じゃないか。
>>865 >GPGPU 倍精度 2.7PFlops
これ本当に倍精度?単精度じゃなくて?
>>433 にあるように GPGPU は倍精度だと速度出ないから、相当な規模になる。
HPC向けに倍精度の能力を強化した新製品を当て込んでいるのかもよ。
nVIDIAはTSUBAMEに相当力入れてるのかね?
新しいGT300シリーズは大きくアーキテクチャを変えてくるらしいから 倍精度もそれなりに改善されてるのかもだ。
主要ベンダ毎の、セグメント別のシェアってどうなってるのだろうか?
*****I ってのは NAREGI のことか?
NとFがほとんどなのに、なぜ東大と北大はH製なの? HのSR?って性能がいいのか?
NFOHでスパコンやってるのはO以外 HのSRはIBM
Olivetti懐かしい
> HのSRはIBM は?
XT4にも勝てなかったとなるとねぇ、、、
なんか、同じのがズラズラ並んでるだけで全然面白くないな。
熱死
>>880 同じのがズラズラ並んでいることが重要なんじゃないか。
XT4とGDRを繋いで40 Tflopsぐらい出せないかね。 ついでにSX9も繋いであげれば喜ぶ人いない?
サウジアラビア始まったな
トップ500以内のカウント数が、中国にも負けてるって信じがたいな日本
「金もやる気もございません」って事だろw
うーん、今全体の3%だ。 しかし20年前は30%あった
やっぱりスパコン需要が少ないのだと思うよ。 実は需要は豊富なんだけれども、小規模な構成のスパコンが分散しているという可能性も・・・ないな。
もし、 海外 ・・・ 巨大なサイトを作って共同利用。平等に課金する。 日本 ・・・ 組織ごとにスパコンを占有。他所に解放していても割高に課金する。 ってことだとしたら、 日本では個々のスパコンの規模は小さくなる。 それぞれの組織の予算で導入できるのは小さなものだし、 そもそも、その組織で必要な計算量は限られているし。 NECのSX-6iなどのiの付く、デスクサイド型の小型スパコンなんかは、日本ならではの製品かもしれないよ。
>>890 目的と手段が逆転しているHPC屋っぽい発言に見えるよ。
スパコンをたくさん作ったからといって、成果が増えるわけじゃない。
(スパコンを作るのが目的の人にとっては成果だが、それは別の話)
スパコンはあくまでも道具であって、道具だけあっても仕方ない。
しかし、
スパコンが足りなければ、成果が減ってしまう。
道具が足りなければ、やるべきことも出来ない。
肝心なのはTop500のランキングではなく、
スパコンを必要としている研究者の計算需要の総量と、
国内のスパコンの計算資源の総量のバランスだろう。
とりあえずスパコン作ろうぜ、っていうのは勘弁してほしい。
x86+Linux+Gigabit Ethernetなんてのは、大半がスパコン用途じゃ無くて、 導入したついでにLinpack測っちゃった程度のノリだろう。 Linpackとは言え36.9TFも出るWEBサーバーとか、WWWと記載されているのが スパコンに対する笑いの意味に見えてくるなw
>>895 35位のロシアの"IT Service Provider"
81位のアメリカの"IT Service Provider (B)" ※137位、252位、274位にも入ってる。
94位のアメリカの"IT Service Provider (D)" ※108位、129位、150位、237位、304位にも入ってる
っていうのが何をやってるのか不明だが、それっぽいね。
ていうか100位以降は、産業がゴロゴロしてる。
ま、国家凋落の兆しとみてもあながち間違いではないな
凋落が嬉しくて言ってるのではない それをゲスの勘ぐりと言う
>>894 >肝心なのはTop500のランキングではなく、スパコンを必要としている
>研究者の計算需要の総量と、国内のスパコンの計算資源の総量のバランスだろう。
そう言う細々とした計算需要の総量がいくら多くても、それはいわば「日常茶飯事」レベル
の問題を多く解いてると言うだけの話であって、Top500レベルの計算パワーを必要とする
ような先端領域の研究開発が日本で減ってるのではないかと言う俺の話とは何の関係もない。
>>900 研究開発が減ってるのに、スパコンだけ作ってもしょうがないでしょ。
もとい 研究開発が減ってるとしたら、スパコンだけ作ってもしょうがないでしょ。 計算のサイズの領域ごとに分けて、需要と供給を見て、どうなのよ。
> Others GRAPE-DR processor 330 MHz (10.3 GFlops) 処理によってメモリに合わせてクロックを変えるのだろうか・・・
>>903 >研究開発が減ってるとしたら、スパコンだけ作ってもしょうがないでしょ。
その研究開発が減ってることが問題だと言ってるのであって、
HPCを作れないのが問題だとは一言も言ってない。
>計算のサイズの領域ごとに分けて、需要と供給を見て、どうなのよ。
そんなことは、俺の関心事ではない。自分で調べろ。
IBM営業マンのcnetブロガーがまた暴れてるのか
日本のTop500に占めるシステムと計算パワーの比率が落ちてることを指摘する事の どこが、「HPCを作れないのが問題だ」と言うことになるんだ? 説明してもらおうか?
冬野 “日本ダメだ論”がすごいんですよね。 「見よ、この落ちっぷりw」と言いたい人がすごく多いんですよね、日本って。 まろゆき 日本をダメって言うのが好きですからね、日本人が。 冬野 自国が凋落するとすごくうれしそうにする日本人、いっぱいいるよね。 普通はうれしくないと思うんですけど、「やっぱ日本ダメだ、だから俺もダメなんだ」という感じだよね。 自分の会社が「金もやる気もございません」状態なんだろうね。
日本をダメにしたい、ダメだと言いたいのは日本人じゃなくて 日本人をダメにするようにGHQから要請された日本人に化けた朝鮮人と 日本政府を名乗ってるアメリカ占領政府のアホ連中だろ
>>905 スパコン作っても、箱物行政のようになるってことだね。
ヤフオクにSX-8iが出てるお
日本がんがれ。 Rmax&Nmaxが無理ならper wattだ!
qqq
>>917 そもそも、日本の全スパコンがTop500に登録しているって前提がおかしい。
少なくともSX系はES以外は意図的に登録していない。
それを日本の全スパコンのリース料で評価するなんて、相変わらず意図的な内容としか言いようがない。
Linpackだけで評価するならPS3を並べたものが最強でしょう。 256Mbyteあれば行列積には十分な粒度が確保できるし値段で も消費電力でもかなうプロダクトは皆無。
>>919 PS3は倍制度20GFLOPSだろ
次の世代だったらGPUも使えたんだがな。もったいないな
>>919 >>920 そこで、GRAPE-DR ですよ。
と言いたいとこだけど、GRAPE-DR は今回 22.0Tflops ですね。確か目標は
2Pflops だったわけで・・・これはやばいような気がします。振興調整費
だっけかの事後評価?(あるか知らんけど)で問題になりませんかねぇ。
まだ、チューニング中だし、システムも小さいということでしょうけど、
ttp://www.artcompsci.org/~makino/articles/future_sc/note072.html#rdocsect77 にある場所の手配とやらが、間に合ったとして、2Pflops にするには現在の
システムを数十倍から100倍にする必要があるわけで、その辺は大丈夫なのか
と心配になります。
このスレにもあった設計上の問題とか、足腰(電源、メモリ、ネットワーク周りなど)
とか、そもそもマザーボードくらいの多きさがある GRAPE-DR Model 1800 のような
ものでは、マキーノ式は無理なんじゃないかとか、いろいろ心配になります。
まあ、牧野先生のことだから、その辺はちゃんとクリアしているんじゃないかと
思いたいところですね。
高速道路を1m建造するのに1000万〜2000万円かかる。 官から民までそういう構造になってるこの国で、 価格に焦点をあててスパコンを叩く記事にはウンザリだ。 核兵器“保全”のために、TOP500で1位をとる規模のスパコンを 造らなきゃいけない某国の方が、傍から見てどうかしてる。
日本駄目だ論は朝鮮人 日本をダメにしたい、ダメだと言いたいのは日本人じゃなくて 日本人をダメにするようにGHQから要請された日本人に化けた朝鮮人と 日本政府を名乗ってるアメリカ占領政府のアホ連中だろ
その日本だめだ論の連中が国を動かしたり扇動してりしていて、 実際に駄目な形へ変えて言ってるんだけど
いや、むしろ日本マンセー馬鹿が増えてからの方が 日本の調子が悪い。彼らには反省というものがないらしい。
>日本をダメにしたい、ダメだと言いたいのは日本人じゃなくて >日本人をダメにするようにGHQから要請された日本人に化けた朝鮮人と >日本政府を名乗ってるアメリカ占領政府のアホ連中だろ まあ、こんなのウ○コ陰謀論、盲信してたら 全て他人が邪魔をしているから良くならない 努力もしない 糞ばかりが増えるのも無理もないよな
ちょっと煽ってやったらこれだw 本章丸出し
何か駄目だったすぐ他国のせいにする、 悪かった部分を分析して次にフィードバックしない こんなトンデモな思想のガキが日本に増え始めているのはよくない。 すぐに陰謀論にすがりついて他人のせいにするのは楽なんだけど、 ゆとり思考も大概にしろといいたい。 会社の業務でもやってりゃ、いかに客観的な失敗分析が大事か自然とわかるだろうに、 本やネットで読んだ薄っぺらい知識でものを考えるな。
ハイハイ、客観的分析 米国のスパコンはよい国家プロジェクト、日本のスパコンは悪い公共事業 露のスパコンはよい国家プロジェクト、日本のスパコンは悪い公共事業 中国のスパコンはよい国家プロジェクト、日本のスパコンは悪い公共事業 独のスパコンはよい国家プロジェクト、日本のスパコンは悪い公共事業 死ね
>>930 こういう馬鹿って幸せだな。
他人がどこまで真剣に考えているか知らずに、
盲目的にワンパターンな思考でボクは日本マンセー、日本人マンセーだって発言してればいいんだからさ。
悪い点を洗い出して改善ってのは普通の行為。
それに過剰反応して見当違いのことをのたまっているガキが君らなんだよ。
国力の象徴がスパコンによる計算能力なんだから 他国が日本のスパコン投資を妨害するに決まってるじゃん あの手この手でさぁ
国力の象徴がスパコンによる計算力ってw 米国を除くと国産技術を主軸に据えた設計でランキングに食い込めてるのは 日本だけだが。TOP500で高順位を取るだけが技術力なわけないだろw これだからわけわかんなく陰謀論にもっていきたがるやつは妄想癖が激しすぎて 実は深く見てないんだよなあ。
目安にはなるね IBMが売れないとハエのように唸りたてるやつの存在が放置されている段階で 立派に陰謀も機能してる
陰謀説は、誰でも簡単に考えつくし、陰謀説で語るのは楽だ。 しかし、陰謀説は十分証明されるまでは意味がないし語るべきではない。 かもしれない陰謀論をつみかさねていった結果はどんどん理論の精度が落ちて 電波説にしかならんぞ。9割の確度も5回繰り返せば、6割以下だ。 小学生でもわかるだろう…?
あちらさんは証拠を残しながらでも好き勝手するってさ 殴られても殴り返す根性のない奴は語るべきではないっていう感じですか?w
ぶっちゃけコンピュータの設計は米国がダントツなだけで、 日本が駄目だと思う原因は、米国がダントツなだから以外の何者でもない。 米がいなきゃ日本のプロセッサが普通にうれるのは容易に想像できるだろ。 これは昔から変わってない。
日本人は米国の真似をするのが好き、米国と比較するのが好き。 大概日本は駄目だ論って冷静になってみれば比較の対象が米国なんだよな。 上のひろゆきの対談もそうだしな。日本人は1位じゃないと駄目だと感じる人種なんだろうか。
Top500 の話題になる相変わらずですねぇ。 基幹技術が米国発だろうと日本発だろうと、実際に使う側 にとってはほとんど関係ないですね。問題なのは、予算に 対して得られている計算機資源が少ないんじゃないかなー ということです。
実際に使う側がどうかよりも、 日本のコンピュータの技術の一例として語られることがおおいんだから仕方がないだろ。 日本だってIntel石ひたすらつないでトップレベルのコンピュータは出せるだろうけど、 それでコストパフォーマンスもよくなったし、性能もトップクラスの何度か出し続けてもそのうち TOP500に興味を持つ日本人がそもそも少なくなるだけ、 今はそうじゃない、日本の独自性があるから話題にできるんだよ。 なかったら最初っから関心の対象になってないんだけど。なかなかわかりづらいのだが。
そういう意味じゃ、ドイツ、中国のマシンなんてあまり気にならんが、 理研のベタでコストパフォーマンスがそこそこな Nehalem機か40位あたりにいるあたりにむしろ苦しさを感じるよ。
国家の勢いの現れで、日本が弱くなった(ランクインしている数が減った)んじゃなくて、 普通に米国製の汎用スカラプロセッサボードをたくさんつなぐ っていうお手軽設計・購入で技術力の低い国でもHPCというジャンルに入りやすくなったってのが 真実です。コンピュータの設計の中心は集積回路の中になって久しい。
素直な感想としては、簡単お手軽数珠繋ぎスパコンはつまんない。 ま、使う方からしたらつまるつまらないは関係ないんだけどねw
>>932 国力の象徴や目安になるのは、そうだと思う。
しかし、指標だけ取り繕う、つまり、需要を上まわるスパコンを作るのは、間違い。
緑色の塗料で塗って「緑化」するようなもので、やるべきことじゃない。
>>940 話題性に依存した予算獲得は、ろくなもんじゃないと思う。
例として出すのは失礼だがあえて挙げると、ノーベル賞を受賞した田中さん。
ノーベル賞を受賞してから、田中さんにポストや予算が付いたというのは、いかにも日本的。
日本の素晴らしい技術もあるんだから、 そういった物にお金出して育ててほしいね。 CELLとかGRAPEとか。 そしてこれを活かせる人材を増やしてほしい。 トリップ解析もいいがw おいちゃんは影から見守っとるからな。
たとえばGRAPEならさ、 本来の目的の、天文学という学問に、国民がどれだけの金を出すのか ってことだと思う。 ちなみに、 Top500でエネルギー効率でトップになったから、ごほうびとして予算を出します っていう日本のやり方はマズい。 しかも、どこかに予算を出せば、他の研究者の予算が削られるという、限られたパイの取り合い。 最初の成果を出すために、実家の資産を担保に借金をした教授とか、 予算を獲得するために何十年も、別の成果や根回しに奔走した教授とか、 そういうのが普通にある日本では、世界的な競争に勝てるわけねーって思うのよ。
GRAPE-DRは天文だけじゃないって言うのが、大きな売り。 天文だけでよかったなら、もっと性能出せる。でも、それじゃそもそもお金もでてない。 だから、ピーク性能だけじゃなく、汎用利用の実績がかなり必要。でも、それはGPUとの熾烈な争い…。
952 :
951 :2009/06/25(木) 01:34:25 ID:YN7tgRC/
意味不明の文になってしまった orz
>>1 もビックリだなw
だった。
変なのが増えたからitaniumスレのままでよかったのにと思う俺ガイル
ドライに言ってしまえば、 天文に特化したものに予算が出ない時点で、 オシマイってことなのだと思う。 もう、天文台の教授の席なんか捨てて、 コンピュータのアーキテクチャの研究をやってるところに席を求めたほうがいいと思う。
ゴードンベル賞取ってる人の考えに、よくそんな薄っぺらいことを…。
GRAPE-DRは、一応汎用なんだから対応してないアプリは、効率を考えればアプリ側が対応すべきです、よね。 隗よりはじめよで、次期更新時は、天文台のOpteronとSX-9の予算及び電気料金等の運用費も大幅削減。 すばらしいです。
958 :
951 :2009/06/25(木) 01:48:26 ID:YN7tgRC/
まあ、そういうことも十分起きることもありうるとは思が、しかし、 天文台の中のみみっちい話じゃなくて、全然違う分野での利用が促進した 方が、インパクトは大きかろう。MD-GRAPEが2ペタみたいな方向性で。 むしろ、汎用のハードは作ったはいいけど、ソフトは投げっぱなしっていう よくあるパターンになりそうな嫌な予感。
>>956 そのゴードンベル賞は、天文学の業績表彰ではなく、コンピュータ・サイエンスのそれなんだよ。
>>958 それは理解していますよ。
その上で、
牧野先生に、天文に特化したコンピュータを作る資金を与えない、
国の、日本人の、天文学に対する予算配分の少なさを嘆いているのです。
>>960 国がお金くれないことを憂えてるのはあなたのひとりよがりでしょ?
全ての国とは言わないけど、普通、そんなお金、天文シミュだけで出るわけない。
でも、そこで簡単にあきらめないで工夫するから面白いんじゃない?
例えば大型粒子加速器を作るとき、何億(それ以上?)もかけて特注の電磁石を作る。 それに対して、自称経済学者が 「んなもんに、何億もかけてんじゃねーよ。売ってる磁石たくさんつなげばトータルの磁力なんて同じだろ」 と批判をする。 役所とかはコロッと騙されて「そうですね!じゃあ予算削りましょう。予算削っても同じもの作れるでしょ、あんた達。」となる。 普通は「そりゃねーよw」と思う笑い話だが、スパコン業界では現実的に起きてる問題。
その結果、大型粒子加速器はできなかったけど、売ってる磁石がいろんなことに 使えて、なんだ、これはこれで使えるなあ〜、むしろ、こっちのほうがニーズは 高いなって気づいてしまう落ち。
>>961 > 全ての国とは言わないけど、普通、そんなお金、天文シミュだけで出るわけない。
国立天文台のSX-9&XT4の月額リース料は2千万ちょいらしい。
5年リースなので累計で12億円ちょい。
GRAPE-DRが5年で15億のプロジェクトだったかな。
痩せ方よりも、眼に生気がないよ。 牧野先生の右後ろに立っている人も。
プロセッサ別の統計で その他1 NEC1 てのに泣いたw
>>966 マイコン的なスタンバイモードだろ、ECOだよ。
あるいは、仕事うまくいってなくて意気消沈なのかしら?
牧野先生は妖精だから!
それを言うならむしろ亡霊
だってマキーノは神だから。 メタルラックのw
亡霊といえば京大のN先生だろjk
>>969 なんかその表現はナニかの病気が妖精っぽい言い方でヤダなあw
先生、仕事してくださいw
2009/6/225 焦るんじゃない!!
6月225日ってなんかの暗号か
6月中に225位の意味かw
残り225日、来年の修論発表会までのあれ
修正前のアレ s01.megalodon.jp/2009-0625-2316-56/jun.artcompsci.org/journal/journal-2009-06.html
Core i9… こああいないん 言いにくい
なんかオロナインっぽい気もした。
こああいきゅーっていっちゃいそう
うじきつよしを思い出した
カルトQだっけ?
> アメリカで木曜深夜に催促を出すのはなんか理由があるのかしら? 日本では、金曜日の夕方に「月曜の朝一までに」という話をする。土日にやれよ、ってこと。 アメリカでは、木曜の夜に「月曜の朝一までに」という話をする。金曜の夕方までに片付けろよ、ってこと。
ここはマッキーナのブログのコメント欄じゃないっつの
「マッキーナ」は新しいな
みんなマッキーナ大好きなのお?
機械? そりゃ好きさ。 でも、デウスエクスマキナは勘弁な。
ワイアマキナ
プラウベル マキナはいいカメラだね
メタルラック、大好きですw