【スパコン】東大・国立天文台グループ共同開発のスパコン、電力あたりの性能ランクで世界一に！

34 ：名無しのひみつ：2010/07/09(金) 07:23:36 ID:WhQosuGy

電力あたり性能ｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗ
玄関の大きさあたりの家の面積
ハンドル径あたり燃費
庭の広さあたり節水

35 ：名無しのひみつ：2010/07/09(金) 09:24:08 ID:2QxUot1x

N体計算
N体計算

36 ：名無しのひみつ：2010/07/09(金) 09:46:51 ID:Ybv1YF2z

仕分けされませんように・・・。

37 ：名無しのひみつ：2010/07/09(金) 12:07:34 ID:aVUYW5ue

>>30
大口たたいて、わずか4%程度の達成値ｗ　消費税も足りないって話だが、
消費税程度のお仕事は、してもらいたいもんですなｗ

38 ：名無しのひみつ：2010/07/09(金) 13:11:04 ID:F9foTFIz

GRAPEは、問題を絞り込むことで、低消費電力と値段を達成してるから
他の仕事をやらせて、低性能というのは間違い。

以前のGRAPEはリンパックベンチマークも走らせられないくらいの専用機。
ちょっと汎用になったからと言って、素直に走るわけもないし
そんな用途につかうべきでもない。

39 ：名無しのひみつ：2010/07/09(金) 16:11:12 ID:dR9CmYti

>>31
とりあえず↓のスレや、その過去ログを読んでみよう。

【スパコン】スーパーコンピュータ関連情報6【HPC】
http://pc11.2ch.net/test/read.cgi/hard/1277508882/

GRAPE-DRのアンチが、いかにGRAPE-DRがママゴトなのか繰り返し説いてるぞ

40 ：名無しのひみつ：2010/07/09(金) 16:22:36 ID:dR9CmYti

>>38
そうでもないぞ

GRAPE-DRは前回のTop500にランク入りしており、実行効率が低いものの、25%前後を出していた。
今回はランク外になってしまったが、
当初予定通りに2PFlops分の現物を作っていれば、500TFlops前後で10位以内に入れただろう。

今回の報道を見ると、
200GFlopsの独自開発チップを4つ積んだボードを1枚ずつ付けた64台のPCを繋いでいる
とあるが、本来は
ttp://grape-dr.adm.s.u-tokyo.ac.jp/system.html
にあるように1TFlopsのチップを8つ積んだボードを2枚付けた64台のPCを繋ぎ、さらに2クラスタを高速IPネットワークで繋ぐ
というもの。

計画→実際
1チップの性能が1TFlops→200GFlopsで1/5
1ボードのチップ数が8個→4個で1/2
PCあたりのボード数が2枚→1枚で1/2
クラスタあたりのPC数は64台→64台で増加なし
2クラスタを高速IPネットワークで繋ぐ→繋がない

計画時点では、19インチ・ラック1本で地球シミュレータを凌駕するとか豪語してたんだけどねー

41 ：名無しのひみつ：2010/07/09(金) 16:29:55 ID:dR9CmYti

当初予定ではGRAPE-DRチップは2千個だったが、1チップ内のプロセッサ数が半減した分、4千個以上を生産したはずなんだわ。
ちょっと覚えてないけど、4千個だか5千個だかつくったという記事をどこかで見た。

でもいま実際に使われているのは4×64=256個だけらしい、今回の報道の内容からすると。
残りのチップはどこに行ったのか。
もしかして
http://www.kfcr.jp/grapedr.html
で売られてるのは、その余りなのだろうか。

牧野先生は500MHz動作したと言ってるが、売られているのは400MHz動作とか380MHz動作だ。
たった60Wなのに、電源コネクタが2個あるという謎の仕様。

42 ：名無しのひみつ：2010/07/09(金) 16:33:53 ID:NRUX4XSh

>>39
そこで聞きかじってシッタカしてるのが湧いてるのか、アホの能澤クローン量産かよ
欝になるわ～

43 ：名無しのひみつ：2010/07/09(金) 16:38:43 ID:0OsYPMyJ

カネさえあれば作れるスパコンか

日本独自の技術が見られないとは悲しきことですな

44 ：名無しのひみつ：2010/07/09(金) 17:21:57 ID:2aOHdXD/

昔から日本は独自技術より小技が目立っていたし問題ない

45 ：名無しのひみつ：2010/07/09(金) 17:34:08 ID:/5h8cWrS

>>42
レッテル貼りすんな

能澤の、買ってきたほうが安いのだから開発するな、という意見には全く賛成しない。
だからクローンとか言うな。

京速スパコン、初期の構想では、
ベクトル1PF + スカラ1PF + アクセラレータ20PF
という構成で、アクセラレータにはGRAPE-DRの成果を使うとあった。

GRAPE-DRが京速から弾き出されて、ほんと良かった。
もしGRAPE-DRで京速をやっていたら、とんでもないことになってただろう。

46 ：名無しのひみつ：2010/07/09(金) 18:30:25 ID:F9foTFIz

究極のハイバンド=SX
超汎用だがクソ高い

究極のローバンド=GRAPE
超専用だがクソ安い

あとはやらせたい仕事に応じて
適当に設計するだけのこと。

現状のスパコンの限界は、この二つが示している。

47 ：名無しのひみつ：2010/07/09(金) 23:08:23 ID:qtrb851c

おれは教授の髪型につっこみたい

48 ：名無しのひみつ：2010/07/09(金) 23:29:05 ID:vsR4hXVB

いくらGRAPE-DRをネット検索しても2006/11/6 updateの
ページしか出てこなかったので，てっきりこのプロジェクトは
大失敗に終わり，闇に葬られたのかと思っていた。
往生際が悪い。

49 ：名無しのひみつ：2010/07/10(土) 00:14:36 ID:aIEoCCfd

ttp://scfdb.tokyo.jst.go.jp/db/Top
で
分散共有型研究データ利用基盤の整備
を検索してみ

ttp://scfdb.tokyo.jst.go.jp/pdf/20041080/2008/200410802008er.pdf
> 総合評価 A
> 高速インターネットと分散共有型研究データ利用システム（ＧＲＡＰＥ－ＤＲシステム）開発において、
> 世界トップクラスのオリジナルな技術力を発揮し、優秀な人材も輩出することができ、
> 所期の計画以上の成果を挙げたと判断される。
> 状況判断を的確に行い極めて高い成果を挙げている。

> 目標達成度
> ＧＲＡＰＥ－ＤＲ開発においては、
> ハード面におけるトラブルとしてブリッジチップの問題が指摘されていたが、
> これについても解決されており、当初の目標は十分達していると判断される。

当初の目標は
ttp://scfdb.tokyo.jst.go.jp/pdf/20041080/2004/200410802004pa.pdf
> 具体的な達成目標
> 計画最終年の時点で，世界に先駆けて２ PFLOPS を超える計算能力
(中略)
> 科学技術研究の現場から利用可能とし
とあるのよ。
計画最終年というのは2008年ね。

詳しくは
ttp://scfdb.tokyo.jst.go.jp/pdf/20041080/2008/200410802008rr.pdf
を。

成果では100TFlopsしか実現できていないがデバッグが終われば2TFlopsに到達する予定と書いてある。
こういうのが許されるって、すごいね。

2TFlopsを整備するってプロジェクトなのに、GRAPE-DRボードを200枚しか製造してない。
1チップで単精度400GFlopsで、4チップのボードで1.6TFlops。これが200枚だから、320TFlops。
ね、おかしいでしょ?

50 ：名無しのひみつ：2010/07/10(土) 00:27:22 ID:aIEoCCfd

あ、別のページには800枚を製造したって書いてあるな・・・それなら1PFlopsは越えてる。
でもさ、800枚のGRAPE-DRボードを160台のPCに装着するなら1台に5枚ずつだよね。

なんか、報告書を読んでいるとウソはなくても読み手の誤解を期待しているような・・・

51 ：名無しさん＠そうだ選挙に行こう：2010/07/10(土) 05:21:11 ID:Vaq1VDzI

こういうの新しく後から作ったほうが有利なのは当然だから
世界一とかわざわざニュースにしなくてもいいのに

52 ：名無しさん＠そうだ選挙に行こう：2010/07/10(土) 07:20:39 ID:tF4Rtb/R

>>51
いや、これ、プロジェクト管理が悪かったらしく、色々と遅れたりして、肝心の演算チップは作られてから使われるまで塩漬けだった。
チップは2006年度には完成して、プレス・リリースも打ってる。
ttp://grape-dr.adm.s.u-tokyo.ac.jp/press-release20061106/

3年半も前に90nmで作られた古いチップが世界一になったのが、このニュースの本当の凄いところ。
でも、牧野がそれをプレスリリースに含めないから、当然、そのような報道にはならない。

53 ：名無しのひみつ：2010/07/12(月) 21:55:39 ID:g3VuJVpE

悪いが電力当たりじゃダメダメ
電力当たりかつ世界一
これでグっと俺の心をつかむ

54 ：名無しのひみつ：2010/07/25(日) 19:04:25 ID:XZc8NcNS

質問です。まいくろ波搬送電力供給機構の大気圏外太陽電池ぐりっどに直接こんぴゅーたを搭載すれば電気を沢山使いたい放題にならないんですか？

55 ：名無しのひみつ：2010/07/25(日) 20:37:19 ID:t4BEdIxg

>>54
私の思いつく限りを書いてみます。
宇宙に物を持っていくのには、とてもお金がかかりますし、
失敗する可能性も大きいです。
ハッブル宇宙望遠鏡でわかるように、修理に行くのも大変です。
宇宙には宇宙線という、生半可な方法では防御できない
放射線がいっぱいで、コンピュータが誤動作してしまいます。
だから、宇宙に持っていくコンピュータは、
それに対応した特別な物で、安全を見込んで性能も抑えてあります。
電気を沢山使えば、熱も沢山出てきますが、
空気や水がない宇宙では、放熱が大変です。
太陽光で信じられないくらい加熱されるし、影になった部分は、
その逆になります。

56 ：名無しのひみつ：2010/07/25(日) 20:41:51 ID:HUD8qchV

なぜGreen 500じゃなくて、little Green 500なのか、
よく考えた方がいい

57 ：名無しのひみつ：2010/07/25(日) 21:03:11 ID:ud1E264M

もうフライ級とかフェザー級とかも作ってやれよ。

58 ：名無しのひみつ：2010/07/25(日) 23:20:02 ID:0fjHke2O

電力消費量が少ないと何がGreenなの？

59 ：名無しのひみつ：2010/07/26(月) 22:36:39 ID:myEmrz4B

>>56
考えるも何も、
GRAPE-DRプロジェクトが実際には失敗していて、
当初予定どおりならTop500に入る(=Green500の対象になる)はずが、
まるで演算能力がなくて1/10くらいの性能しか出ず、Top500に入ってないから。

60 ：名無しのひみつ：2010/07/27(火) 08:52:46 ID:FrPsjW9S

x86系は１コア当たり10GFlops程度で頭打ちになる欠点がある

61 ：名無しのひみつ：2010/07/27(火) 18:14:16 ID:9Xnr0Zk5

>>30
ああ、俺はスパイは殺すから。

62 ：名無しのひみつ：2010/08/02(月) 14:27:34 ID:/20Mv7TU

能澤w

63 ：名無しのひみつ：2010/08/02(月) 21:12:14 ID:7RvXXOqP

国立天文台はNTPもやってるよ
豆な

64 ：名無しのひみつ：2010/08/03(火) 10:15:25 ID:gEjrx7hQ

>>60
SSE3で導入した倍精度浮動小数点演算を１クロックに4個計算するという機能を使うと
4GHzのコアなら
4GHz*4＝16GFLOPS
になる。

パイプラインに工夫をしてキャッシュやレジスタも増量して
倍精度浮動小数点演算を１クロックに8個計算出来れば
4GHz*8＝32GFLOPS

12コアなら384GFLOPS

65 ：名無しのひみつ：2010/08/03(火) 10:40:37 ID:+bI49K0s

>>64
ずいぶん時間が経ったんでアレだが、
TOP500のflops値をコア数で割ってみれ

多少の増減はあるが、見事に10Gflops
前後になるから。

演算能力そのものは、それ以上あっても
いろいろな要因で、そのあたりでストップするらしい。

66 ：名無しのひみつ：2010/08/03(火) 10:55:46 ID:+bI49K0s

いま、最新のTOP500から、コアあたりに割ってみると
Xeon系でトップは12Gflopsまで行ってた。
nehalem系で効率が上がったかな。

この計算だと、Tesla系が上位に来るが、teslaは内部に多数の演算コアを持っているんで
その分も割ってやらなければ、コアあたりの計算としては、不適切だろう。

また、コアあたりの性能ではPoweｒ6の性能向上が素晴らしい。
１コアあたり、18.8Gflopsの速度が出ている。

67 ：名無しのひみつ：2010/08/03(火) 20:25:31 ID:elpyQVlF

>>64
3GHzで計算すれば、12Gflopsで、>>66の数字になるね。

68 ：名無しのひみつ：2010/08/08(日) 10:05:51 ID:QcYUNX7Z

通常はメモリの転送能力がボトルネックになりやすいので、
演算器を増やして、メモリの転送量あたりの演算回数を増やせば良いのだよ。
勿論そのためには、計算法をそれに適したやり方に変えたり、それが可能と
なる計算の手法を発明したりしないとダメだが。

69 ：名無しのひみつ：2010/08/08(日) 10:25:27 ID:SMNu82fD

まあ動作周波数が４Ｇｈｚどまりじゃねえ
というか

70 ：名無しのひみつ：2010/08/08(日) 12:34:22 ID:hAvCxSe0

4GHz動作のパイプラインの各段を2分割できれば、8GHz動作も可能でしょ。
動作周波数というのは、パイプラインの各段で通過するゲートの数で決まるんだから。

ただパイプラインの段数を増やすとトランジスタ数が増えるし、電力を食う高速なトランジスタも必要になる。
だから、動作周波数を2倍にするよりも演算器を2倍にしたほうがよい、っていうことで3GHzくらいで停滞してるのでしょ。

71 ：名無しのひみつ：2010/08/08(日) 12:56:36 ID:MyMTh45c

演算器だけいくら高速にしてもデータを供給できないと遊ぶよ。

72 ：名無しのひみつ：2010/08/08(日) 13:08:32 ID:jM8bsCsY

>>66
>この計算だと、Tesla系が上位に来るが、teslaは内部に多数の演算コアを持っているんで
>その分も割ってやらなければ、コアあたりの計算としては、不適切だろう。
CPUの1コアにゃSIMD含んでるんだし、流石にそりゃねーわ。
GPC単位かSM単位だろ。

73 ：名無しのひみつ：2010/08/08(日) 15:42:47 ID:2TdPLQa4

teslaのシェーダエンジン、SIMD、スカラ
演算器ごとの効率でも出してみるかな。

74 ：名無しのひみつ：2010/08/09(月) 23:36:18 ID:V+tgZTdN

ゼロヨン機ですか？

75 ：名無しのひみつ：2010/08/11(水) 00:55:19 ID:f9+AxBRW

天文台型スパコン　
http://www.youtube.com/watch?v=vuFoMLh0v6k&feature=channel

76 ：名無しのひみつ：2010/08/12(木) 11:31:41 ID:/J7kLBAb

>>66 POWER6は、LINPACKですら実行効率70%台だぞ。
T2Kでも80%は軽く超えるというのに、素晴らしいどころか、設計ミスだろｗ

77 ：ひﾟょん♂：2010/08/12(木) 11:54:01 ID:0RSASIrH BE:416597344-2BP(1029)

一方、コンパイル効率は糞なままであった　とか？
糞コ～ドを高性能マシンで走らせれば　糞効率だしｗ

78 ：ひﾟょん♂：2010/08/12(木) 11:59:57 ID:0RSASIrH BE:1093567267-2BP(1029)

>>63
とても大切でつ

79 ：ひﾟょん♂：2010/08/12(木) 12:10:01 ID:0RSASIrH BE:833194548-2BP(1029)

>>43
これからは、開発も世界１位のグリ～ンにしないとｗ
開発性能が悪すぎるよ。
そもそも、高性能を実現するには　費用は一次関数で比例なんかしなくて
冪乗関数みたいに　高性能を達成しようとするほど費用は爆発的に増えるでしょ
だから、開発性能あたりの開発費用あるいはリソ～スで世界１位になれってくれないと　金食い虫の批判は止まないでしょ
税金はもう国債発行しないと賄えない状況なんだから
そんなにやりたきゃお前の金でやれよと・・・

80 ：名無しのひみつ：2010/08/12(木) 14:41:31 ID:b5JmSerj

コンパイル効率ってなんだよｗ、LINPACKにクソコードもねえだろｗ

81 ：名無しのひみつ：2010/08/15(日) 00:49:31 ID:b1RGwOmo

半導体の進化のスピードを考えたら意味あるんかいな
来年には２２ナノプロセス、５年後には１１ナノでしょ
いま最先端なんてすぐに時代遅れになる
重要なのは汎用ＰＣ向けでどれだけ利益を得られるか

82 ：名無しさん：2010/08/19(木) 20:00:31 ID:IPxmEa6e

周波数限界はインテルが証明した。
パイプライン段数が20段を超えると分岐予測ミスのペナルティが大きくなり、性能は頭打ちとなった。

汎用CPUとは違うし、解かせる問題も限定的なのかもしれないが、
ある程度一般的な、条件判断と分岐を伴う問題に対応させるなら、
12、3段あたりが目安だろう。

83 ：名無しのひみつ：2010/08/19(木) 23:02:43 ID:LbfVKViE

ベクトル的な計算するなら、パイプライン段数は多くても、構わないんじゃない?