【スパコン】世界2位の省電力性能スパコンにNEDO助成事業の高性能プロセッサ©2ch.net
掲載日:2015年1月8日
新エネルギー・産業技術総合開発機構(NEDO)は1月8日、同機構の助成事業の成果としてPEZY Computingが
開発した高性能プロセッサが小型スーパーコンピューター(スパコン)「Suiren(睡蓮)」に搭載され、昨年11月の
「SC14」国際学会で、スパコン省電力性能ランキング「The Green 500 List」の世界第2位を獲得したことを発表した。
搭載されたプロセッサ「PEZY-SC」は、1チップ内に1024個の演算コアを有することで超並列演算を可能とし、
倍精度浮動小数点数演算1.5TFlopsの演算能力を有している。
「Suiren(睡蓮)」では同プロセッサを256個使用し、システム全体として理論性能395TFlopsの演算能力を有し、
絶対性能を競うTop500リストでは178.1TFlopsで369位にランクインした。一方、省電力性能が高い順に並び替えた
Green 500リストでは、1Wあたり演算性能4.946GFlopsをを記録し、世界第2位を獲得した。
現在、HPC分野においては、演算能力だけでなく、電力効率の改善がより一層強く求められている。NEDOは
「高性能と低消費電力を両立させた『PEZY-SC』プロセッサを用いることで、小型ながら省電力・高性能な
コンピュータシステムが実現できることが実証された」とコメント。今後、PEZY Computingでは今回実証された
消費電力性能の高さを活かして、HPC分野の実アプリケーションの実装と性能検証を進めていく予定だという。
<画像>
「PEZY-SC」プロセッサ
http://news.mynavi.jp/photo/news/2015/01/08/391/images/001l.jpg <参照>
NEDO:NEDO事業の成果を搭載したスパコンが省エネ性能ランキングの世界2位に
http://www.nedo.go.jp/news/press/AA5_100343.html <記事掲載元>
http://news.mynavi.jp/news/2015/01/08/391/
レンホーよかったな
2位だぞww
3 :
名無しのひみつ@転載は禁止:2015/01/08(木) 21:06:40.82 ID:vJH33jfa
祝電出すしかないなwww
4 :
2chのエロい人@転載は禁止:2015/01/08(木) 21:07:58.88 ID:opkunITW
蓮舫歓喜
大本営発表に喜ぶアルか?
2位で しかもPETA/京の時代に
シュリンク技術もついて活けないのに
6 :
名無しのひみつ@転載は禁止:2015/01/08(木) 21:16:25.46 ID:AWRSGZcW
そ内容なら
ダントツの1位じゃなきゃやってる意味ないと思うの^^
なんかすごそうな人だよね
京が830MFLOP/Wで、今回のは4,945MFLOP/Wか。
本気でエクサスケール狙うならまだ10倍は効率化が要りそうなのは良くわかった。
あと5年しか無いが、頑張ってくれ。
9 :
名無しのひみつ@転載は禁止:2015/01/08(木) 21:36:13.96 ID:8h7MN0+9
秋葉原に買いに行きたい。1CPUのシステムを
幾らで売っているのだろうか。TKー80みたいな
キットとして売っているのか? BASICは動くの?
10 :
名無しのひみつ@転載は禁止:2015/01/08(木) 22:11:05.35 ID:xFskW0Zh
チップは何処が製造してるんだろ?
狙って2位とかすげーなw
PEのアーキテクチャーってなんなんだろうか。独自?
ルネサスは以前SH-2の1000コアとか構想してた気がするが、
今回制御用にARMコア搭載のヘテロジニアスって事は、
ARM以外のアーキテクチャーなんだよな。
スパコンは性能あがるほど周波数が微妙に落ちる仕組みになっていて笑えるわ。
いまどきの半導体なら演算回路は腐るほど積めるが、
それに見合うレジスタメモリと、主記憶へのメモリバンドを
確保できないと、演算回路が無駄になる。
16 :
名無しのひみつ@転載は禁止:2015/01/09(金) 05:50:14.07 ID:ebyBUlM0
狙って2位はすごいわ。
民主党時代の予算だろ?
>>15 今回TSVなのでメモリバンド幅は上がってるんじゃないか。
どのくらいかは知らんけど。
>>17 トポロジ的にそうなのは間違いないだろうが、だから独自というわけではない。
Xeon-phiはIntel独自だが、これはIntelが作ってきたx86アーキテクチャーの流用だ。
直接ハードウェアを叩く事はしなさそうなのでどうでもいい疑問ではあるのだが。
20 :
名無しのひみつ@転載は禁止:2015/01/09(金) 09:58:38.16 ID:sN9uJnOU
どうだろうね 競争力のない産業を育成しちゃうかな スパコンは並列処理で使い道ないし
if A then B else C
この場合、A の結果が判明しないと、次は B か C か 決まらない
そんなケースでは使えないんだな 姑息な手はいくつかあるけど
へ?露骨に並列処理出来るケースだろ
京よりはまし
2位じゃダメだろ
24 :
名無しのひみつ@転載は禁止:2015/01/11(日) 00:02:09.99 ID:Z5Y9RBBd
これでPCを作るなり家電に組み込んで普及品にしなければ、
社会に対するインパクトは極めて小さい。
AMDのAPUと同じ
なんの目新しさも無し
26 :
名無しのひみつ@転載は禁止:2015/01/11(日) 00:33:17.00 ID:vZD1w7t3
2位で十分成果を上げる事が出来ました
ネトウヨ、ネトサポ残念(笑)
27 :
名無しのひみつ@転載は禁止:2015/01/11(日) 02:19:11.04 ID:gpY+5+XX
睡蓮って推論回路でもはいってるの?
28 :
名無しのひみつ@転載は禁止:2015/01/11(日) 03:30:24.32 ID:yASJmtdk
でもシングルコア性能は高性能Atom同じ程度でしょ?
dhrystone benchmarkでシングルコアだとPCに足元にも及ばないとか
言い出せばネトウヨとかレッテル貼るんじゃない?
ARM ISAにしておけば民生転用も可能なのに・・・
つくづくゼネコン的な発想しかないんだな
>>28 最先端プロセスとはいえ1000コア搭載とのことなので、
コアは相当シンプルなはずで、IPCは良くてAtom並、
それがたったの700MHzの動作なのでシングル性能は高性能Atomに遠く及ばない。
>>29 コレのISAなんなんだ? 制御コアはARMのようだが。
ARMにHPCに適したISAなんか無いぞ
/:::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::ヽ
/:::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::://ヽ:::::::::::::::|
l:::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::// ヽ::::::::::::::l
l:::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::/:::「'ヽ:::::::::::// ヽ:::::::::::|
|::::::::::::::::::::::::::::::::::::::::::::::::::::::::::ノl:::ノ l:::::::/ ヽ::::::::|
ノ:::::::::::::::::::::::::::::::::::::::::::::::::::::/ ゙゙ ノ:::/ ,,;;;;;;,, ,,,,ヽ:::::l
):::::::::::::::::::::::::::::::::::::::::::::::/ ノ/ __,'''i: ('''__):::l
)::::::::::::::::::::::::::::::::::::::::::::::::::/  ̄ ̄ン:. :「 ̄`ヾ
1:::::::::::::::::::::::「 `┤l:::::::::::::::::l  ̄ , ヽ ̄ l
`l:::::::::::::::::::::ヽ :l li:::::::::::::/ ヽ /´ `l |
ヽ::::::::::::::::::::::\_」 lヽ::::/ .l !:-●,__ ノ /
ノ:::::::::::::::::::::::::::ノ | l `゙゙ i ,,;;;;;;;;;;;;;;;;;;;;, /ヽ ヴッ!!
,/ ヽ::::::::::::::::::::::( l l::::::::.. /.:''/´ ̄_ソ / `ヽ
ヽ:::::::::::::::ヽ | l:::::::::::... /::// ̄ ̄_ソ / \
ヽ:::::::\| l::::::::::::::::... / :::.ゝ` ̄ ̄/ / ヽ
ヽ:::l l:::::::::::::::::::..  ̄ ̄;;'' / ヽ
l l;;;;;;:::::::::::::::.....;;;;............;;;;;;''ノ l
l l '''''''''''''''''''''''''''''''''''''' ̄l | |
https://www.youtube.com/watch?v=z2qK2lhk9O0
34 :
名無しのひみつ@転載は禁止:2015/01/11(日) 06:04:52.56 ID:oeXah4iL
ワットあたりのフロップスなんて、何の意味もないじゃないか
LINPACK専用マシンにすら劣る
民生は倍精度浮動小数点数が必要な場面が少なすぎて
ハイエンドスーパーコンピューターを視野に入れたプロセッサと
共通化するメリットが乏しい
NVIDIAのGPUも倍精度やECCをサポートするものと民生の大半は
別シリコンになった。ドライバで隠蔽されてるけど、機械語命令の差分も
かなりあるんじゃないのかな
36 :
名無しのひみつ@転載は禁止:2015/01/11(日) 06:32:54.06 ID:funS927z
ARMは最近はクロックアップしかしてない感じがする。
さらなる性能アップを考えるなら、インテルと同じ道をたどるしか無いかな?
まさかのwwwwwww
>>34 >ワットあたりのフロップスなんて、何の意味もないじゃないか
京速の1000倍の計算速度に、1000倍の消費電力は使えないんだよ。
地球シミュレーターでも、火力発電所の発電機一機分なので、大問題になった。
それ以降は、性能向上 = ワット辺りのフロップスの低下 なんだよ。
京速のCPUは、チップ辺り58Wで、家庭用デスクトップのインテルより消費電力が低いぐらいだよ。
(ゲーム用ノートPCのクラスだ)
40 :
名無しのひみつ@転載は禁止:2015/01/11(日) 09:39:07.69 ID:oeXah4iL
>>38 何頓珍漢なこと言ってるんだ
ワットあたりのフロップスの為にメモリやレジスタや通信機能削って消費電力下げても、
意味ねーんだよ
電力量に不安がある以上、これ以上の高性能化は省エネ化にかかってるからな。
省エネスパコンをぼったくり価格で売られたり、ブラックボックスで使い辛くないようにするには、自前で開発するのが一番だ。
>>40 >ワットあたりのフロップスの為にメモリやレジスタや通信機能削って消費電力下げても、
何をポイント外すんだよ。 全部最高にして、家庭用なみに消費電力下げて、
ようやく関西を停電させずに京速が動かせるのだよ。
43 :
名無しのひみつ@転載は禁止:2015/01/11(日) 11:09:54.08 ID:oeXah4iL
>>42 >全部最高にして、
チップの入出力速度はそう増やせない状態でコア1024個ってことは通信放棄だし、コアあたり
のメモリも申し訳程度でしかないってこともわからん素人は、黙ってたほうがいいぞ
ワットあたりのフロップスで評価すると、そういう箸にも棒にもかからん構成が最適解になるか
ら駄目なんだよ
PEZY-SCはGPUの代わりなんか全く出来ない超単純構造なんだろう。
でなければこんな電力効率にはなるまい
PEZY-SCは倍精度1.5TFLOPSで(たぶんPEZYのみ)60W。Tesla K40は1.43TFLOPSでボード245W。
製造プロセスはどちらも28nm。
>11 >17にあるように、PE毎にローカルメモリ、PE間接続と共有キャッシュは階層化。
近くの転送は速いし早い。ソケット間もPCI-E 3.0x8x4 というのはK40の倍。
DDR3インターフェースは8ch 153.6GB/sでバンド幅はK40の288MB/sには及ばないが
容量では有利。L3キャッシュが8.5MB(内部記憶合計33.5MB)あるから
DRAMバンド幅の不利が顕在化する場面は少ないだろう。
>>44 どういう使い分けするのか知らんけど、WideI/Oもついてる。
単純さに関してはよくわからんが、nVidiaは2800コア言うてるので
コア数なりの消費電力喰ってる事になるんじゃないか。
なぜ電力効率が出るのか知らんけど。
>>43 >ワットあたりのフロップスで評価すると、そういう箸にも棒にもかからん構成が最適解になるか
何を当て外れな頓珍漢な事を偉そうに書いてるんだ?
そう言うお前こそ、FLOPS/Wに代わる最適なパラメータを提案すべきだ。
47 :
名無しのひみつ@転載は禁止:2015/01/11(日) 15:19:53.68 ID:oeXah4iL
>>46 フロップス馬鹿には理解できんだろうが、バイセクションバンド幅に決まっておろう
48 :
名無しのひみつ@転載は禁止:2015/01/11(日) 15:40:12.22 ID:O7N07Ei3
何年経てば、この性能がノートPCで実現できる?
>>44の言う通り、GPGPUに比べればバンド幅があるだろ。
制御チップ混載って事はGPU-CPU間のワンホップもないのだろうし。
>>48 ムーアの法則が限界近いとはいえ、10nmまで行けば何とかなるんじゃないか。
2017〜2020年くらいにはなると思う。
もっとも、実際スパコンに使う場合はこのプロセッサ沢山搭載するけどね。
50 :
名無しのひみつ@転載は禁止:2015/01/11(日) 15:51:19.76 ID:TiF6qwEc
これと14nm版Xeon Phiだと、どっちが効率がいいのかな
>>45 Ultra Wide-IOにDRAMをつなげたらバンド幅は広くなりそうだな。
DDR3/4 と同時に使うことは無理っぽいが
>>51 現行版のCPUではそんなに速くないらしい。
2048bitが2ポートで102.4GB/sとか。
メモリ全部HBMやらWideI/OにしてPCIexのレーン数を更に増やせば
スケーラビリティが上がるんじゃないか。
>>52 I/Oのビット数を増やし、クロックを上げると、
コストと電力消費が増える。
メモリを増やしてもコストと電力消費が増える。
高性能と省電力は相反する傾向にある。
>>53 コストと消費電力を増やしても
性能上げる道筋を考えられないよりはいいんじゃないか。
まあそれはHBMやらWideI/Oやらの話で今回のCPUとあんまり関係ないが。
57 :
名無しのひみつ@転載は禁止:2015/01/11(日) 21:15:41.89 ID:Z5Y9RBBd
58 :
名無しのひみつ@転載は禁止:2015/01/11(日) 22:42:44.21 ID:+raX06jc
>>47 あ、おちょくるつもりで煽っただけだから、大丈夫です。
PEZY-SC はPE毎という一番下のレベルにローカルメモリを持っていて、
これはCellに似てるけどCellとは違いL1、L2、L3のキャッシュも持つ。
ハードウェアキャッシュはプログラミングの負担の軽減、
ローカルメモリ(または明示的に制御可能なキャッシュ)は
自動キャッシュでは届かないチューニング限界の提供、
最近のスーパーコンピューター向けプロセッサは両方が当然になってきてるな
L3までデータと命令分離してるのってあまりなさそう
62 :
名無しのひみつ@転載は禁止:2015/01/12(月) 08:25:02.21 ID:FuP86v1F
2位じゃダメなんですか
63 :
名無しのひみつ@転載は禁止:2015/01/12(月) 08:26:43.64 ID:wG0KNXlT
>>44 そういう問題じゃないだろ
The Green 500 List
1位 AMD FirePro(GPU)
2位 PEZY-SC(非GPU)
3位 NVIDIA Tesla(GPU)
:
19位 INTEL XeonPhi(非GPU)
浮動小数点の積、和のアクセラレーターとしてはGPUもXeonPhiも
余計なものが少なからず載ってるから
シナのスパコンはインテル技術者が助けてるよな
作れば作るほどインテルが大儲けできる仕様だし
68 :
名無しのひみつ@転載は禁止:2015/01/12(月) 14:40:25.75 ID:wG0KNXlT
>>64 >>47でわざわざ釘さしておいてやったのにそれって、くやしいのうwwwww
専用機としてDSPで組んだほうが
効率よくないかなあ?
>>68 悔しいか悔しいのぅウヒョヒョww
まあ、きっと来年には勝てるじゃないの?
ん?(笑)
ウヒョヒョ、って面白いと思ってんのかなこのおっさん。
話の筋で説き伏せたい気持ちがいつのまにかどこかに押し流されて
相手の気分を害したい気持ちが湧き出し溢れてダダ漏れになるパターン
話の内容が重要でそれに比べたら気分の煽られなんか二の次という人間も
いるのだが、このパターンに溺れる人にそれは理解されない
>>69 効率はいいけど、開発と製造のコストが掛かりすぎる。
とはいえ、今はFPGAの動的プログラムをOpenCLでやれる時代だから、FPGAを使うスパコンというのは十分ありだな。
但し、時分割で複数のユーザーの計算をこなさせるのは不可能に近くなるだろうけど。
77 :
名無しのひみつ@転載は禁止:2015/02/26(木) 11:35:20.37 ID:bDGwbwTT
補助金 補助金っと
>>40 1スパコンに大型発電所数基独占されてたまるか!