【スパコン】世界2位の省電力性能スパコンにNEDO助成事業の高性能プロセッサ©2ch.net

掲載日：2015年1月8日

　新エネルギー・産業技術総合開発機構(NEDO)は1月8日、同機構の助成事業の成果としてPEZY Computingが
開発した高性能プロセッサが小型スーパーコンピューター(スパコン)「Suiren(睡蓮)」に搭載され、昨年11月の
「SC14」国際学会で、スパコン省電力性能ランキング「The Green 500 List」の世界第2位を獲得したことを発表した。

　搭載されたプロセッサ「PEZY-SC」は、1チップ内に1024個の演算コアを有することで超並列演算を可能とし、
倍精度浮動小数点数演算1.5TFlopsの演算能力を有している。

　「Suiren(睡蓮)」では同プロセッサを256個使用し、システム全体として理論性能395TFlopsの演算能力を有し、
絶対性能を競うTop500リストでは178.1TFlopsで369位にランクインした。一方、省電力性能が高い順に並び替えた
Green 500リストでは、1Wあたり演算性能4.946GFlopsをを記録し、世界第2位を獲得した。

　現在、HPC分野においては、演算能力だけでなく、電力効率の改善がより一層強く求められている。NEDOは
「高性能と低消費電力を両立させた『PEZY-SC』プロセッサを用いることで、小型ながら省電力・高性能な
コンピュータシステムが実現できることが実証された」とコメント。今後、PEZY Computingでは今回実証された
消費電力性能の高さを活かして、HPC分野の実アプリケーションの実装と性能検証を進めていく予定だという。

<画像>
「PEZY-SC」プロセッサ
http://news.mynavi.jp/photo/news/2015/01/08/391/images/001l.jpg

<参照>
NEDO:NEDO事業の成果を搭載したスパコンが省エネ性能ランキングの世界2位に
http://www.nedo.go.jp/news/press/AA5_100343.html

<記事掲載元>
http://news.mynavi.jp/news/2015/01/08/391/

レンホーよかったな
2位だぞｗｗ

祝電出すしかないなｗｗｗ

蓮舫歓喜

大本営発表に喜ぶアルか？
　2位で　　しかもPETA/京の時代に
シュリンク技術もついて活けないのに

そ内容なら
ダントツの１位じゃなきゃやってる意味ないと思うの＾＾

なんかすごそうな人だよね

京が830MFLOP/Wで、今回のは4,945MFLOP/Wか。

本気でエクサスケール狙うならまだ10倍は効率化が要りそうなのは良くわかった。

あと5年しか無いが、頑張ってくれ。

秋葉原に買いに行きたい。１ＣＰＵのシステムを
幾らで売っているのだろうか。ＴＫー８０みたいな
キットとして売っているのか？　ＢＡＳＩＣは動くの？

チップは何処が製造してるんだろ？

>>10
TSMCの28nmだよ
詳しくは
http://news.mynavi.jp/articles/2014/09/17/pezy/

しかしNEDOはなんで今更こんなニュースリリースを出したんだ？
Green500で2位になったと表彰されたのは1ヶ月半前なのに

狙って２位とかすげーなw

PEのアーキテクチャーってなんなんだろうか。独自？
ルネサスは以前SH-2の1000コアとか構想してた気がするが、
今回制御用にARMコア搭載のヘテロジニアスって事は、
ARM以外のアーキテクチャーなんだよな。

スパコンは性能あがるほど周波数が微妙に落ちる仕組みになっていて笑えるわ。

いまどきの半導体なら演算回路は腐るほど積めるが、
それに見合うレジスタメモリと、主記憶へのメモリバンドを
確保できないと、演算回路が無駄になる。

狙って２位はすごいわ。
民主党時代の予算だろ?

>>13
CPUというよりもGPUやXeonPhiの仲間で、独自と言っていいだろう。

【レポート】1チップで3TFlopsの演算性能を実現 - PEZY Computingの1024コアプロセサ
1 日本のベンチャー企業が生み出した1024コアの高性能メニーコアプロセッサ
ttp://news.mynavi.jp/articles/2014/09/17/pezy/

>>15
今回TSVなのでメモリバンド幅は上がってるんじゃないか。
どのくらいかは知らんけど。
>>17
トポロジ的にそうなのは間違いないだろうが、だから独自というわけではない。
Xeon-phiはIntel独自だが、これはIntelが作ってきたx86アーキテクチャーの流用だ。
直接ハードウェアを叩く事はしなさそうなのでどうでもいい疑問ではあるのだが。

2013/11/21
【IT】スパコン省エネ世界一に東工大
http://anago.2ch.net/test/read.cgi/scienceplus/1385043651/

【スパコン】NEC、性能10倍の商用スパコン発売　世界最速チップ搭載 [13/11/15]
http://anago.2ch.net/test/read.cgi/bizplus/1384685676/
【電機】NECが次世代ベクトル型スパコンを2017年販売へ、1ラックで地球シミュレータに匹敵 [14/11/17](c)2ch.net
http://anago.2ch.net/test/read.cgi/bizplus/1416198643/
2014/11/16
ＮＥＣ、500万円のスパコン　17年に発売
http://www.nikkei.com/article/DGXLASDZ31HH0_V11C14A1MM8000/

2010/01/19
【IT】富士通、スパコン技術開発でシンガポール研究機関と提携--海外市場に再参入 [01/19]
http://anchorage.2ch.net/test/read.cgi/bizplus/1263907848/
【企業】富士通が最新鋭スパコンで納入遅延、原子力機構に違約金3億円支払いへ　2014/10/16
http://anago.2ch.net/test/read.cgi/bizplus/1413465251/

【財政政策】“ポスト京”スパコン開発費計上　100倍の性能…巻き返しに期待［13/12/25］
http://anago.2ch.net/test/read.cgi/bizplus/1387939885/
2014/06/24
【計算機科学】スパコン14年上期TOP500、中国「天河2号」が引き続き首位日本の「京」は4位
http://anago.2ch.net/test/read.cgi/scienceplus/1403562703/
2014/07/29
【計算機科学】次世代スパコン、創薬・革新エネなどに重点
http://anago.2ch.net/test/read.cgi/scienceplus/1406585054/
【IT】スパコン評価に新ランク採用へ...理研の「京」に有利？ [14/11/11](c)2ch.net
http://daily.2ch.net/test/read.cgi/newsplus/1415685237/

どうだろうね　競争力のない産業を育成しちゃうかな　　　スパコンは並列処理で使い道ないし

if　A　then　B　else　C

この場合、A　の結果が判明しないと、次は　B　か　C　か　決まらない
そんなケースでは使えないんだな　姑息な手はいくつかあるけど

へ？露骨に並列処理出来るケースだろ

京よりはまし

2位じゃダメだろ

これでPCを作るなり家電に組み込んで普及品にしなければ、
社会に対するインパクトは極めて小さい。

AMDのAPUと同じ
なんの目新しさも無し

2位で十分成果を上げる事が出来ました
ネトウヨ、ネトサポ残念（笑）

睡蓮って推論回路でもはいってるの？

でもシングルコア性能は高性能Atom同じ程度でしょ？
dhrystone benchmarkでシングルコアだとPCに足元にも及ばないとか
言い出せばネトウヨとかレッテル貼るんじゃない？

ARM ISAにしておけば民生転用も可能なのに・・・

つくづくゼネコン的な発想しかないんだな

>>28
最先端プロセスとはいえ1000コア搭載とのことなので、
コアは相当シンプルなはずで、IPCは良くてAtom並、
それがたったの700MHzの動作なのでシングル性能は高性能Atomに遠く及ばない。
>>29
コレのISAなんなんだ？　制御コアはARMのようだが。

ARMにHPCに適したISAなんか無いぞ

31は>>29へのレス

　　 /:::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::ヽ
　　　　/:::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::://ヽ:::::::::::::::|
　　　 l::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::://　ヽ::::::::::::::l
　　　 l:::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::/:::「'ヽ::::::::::://　　　ヽ:::::::::::|
　　　 |::::::::::::::::::::::::::::::::::::::::::::::::::::::::::ﾉl:::ﾉ　l:::::::／　　　　　ヽ::::::::|
　　　ﾉ:::::::::::::::::::::::::::::::::::::::::::::::::::::／　ﾞﾞ　ﾉ:::/ ,,;;;;;;,,　　　 ,,,,ヽ:::::l
　　　）:::::::::::::::::::::::::::::::::::::::::::::::／　　　　ノ／＿＿,'''i:　('''＿_）:::l 　
　　）::::::::::::::::::::::::::::::::::::::::::::::::::/　　　　　　　　￣￣ン:.　:「￣`ヾ　　
　1:::::::::::::::::::::::「｀┤l:::::::::::::::::l　　　　　　　　　￣　　 ,　ヽ￣　l 　　
　｀l:::::::::::::::::::::ヽ　 :l li:::::::::::::/　　　　　　　　ヽ　　/´　　　｀l　　|
　　ヽ::::::::::::::::::::::＼_」 lヽ::::／　　　　　　　　　.l　　!:-●,__ ノ　 / 　
　　ノ:::::::::::::::::::::::::::ﾉ | l ｀ﾞﾞ　　　　　　　　　　 i　,,;;;;;;;;;;;;;;;;;;;;,　 /ヽ　　　　ヴッ！！
,／　ヽ::::::::::::::::::::::（　 l l::::::::..　　　　　　　　 /.:''／´￣＿ｿ　 /　｀ヽ
　　　　　ヽ:::::::::::::::ヽ　| l:::::::::::...　　　　　　/::/／￣￣_ソ　 /　　　　＼
　　　　　　　　ヽ:::::::＼| l::::::::::::::::...　　　 / :::.ゝ｀￣￣／／　　　　　　ヽ
　　　　　　　　　　　ヽ:::l l:::::::::::::::::::..　　　　　￣￣;;''　／　　　　　　　　　ヽ
　　　　　　　　　　　　　 l l;;;;;;:::::::::::::::.....;;;;............;;;;;;''ノ　　　　　　　　　　　　l
　　　　　　　　　　　　　　l l　''''''''''''''''''''''''''''''''''''''￣l |　　　　　　　　　　　　 |
https://www.youtube.com/watch?v=z2qK2lhk9O0

ワットあたりのフロップスなんて、何の意味もないじゃないか

LINPACK専用マシンにすら劣る

民生は倍精度浮動小数点数が必要な場面が少なすぎて
ハイエンドスーパーコンピューターを視野に入れたプロセッサと
共通化するメリットが乏しい

NVIDIAのGPUも倍精度やECCをサポートするものと民生の大半は
別シリコンになった。ドライバで隠蔽されてるけど、機械語命令の差分も
かなりあるんじゃないのかな

ARMは最近はクロックアップしかしてない感じがする。
さらなる性能アップを考えるなら、インテルと同じ道をたどるしか無いかな？

まさかのｗｗｗｗｗｗｗ

>>34
>ワットあたりのフロップスなんて、何の意味もないじゃないか
京速の1000倍の計算速度に、1000倍の消費電力は使えないんだよ。
地球シミュレーターでも、火力発電所の発電機一機分なので、大問題になった。
それ以降は、性能向上 = ワット辺りのフロップスの低下　なんだよ。

京速のCPUは、チップ辺り58Wで、家庭用デスクトップのインテルより消費電力が低いぐらいだよ。
（ゲーム用ノートPCのクラスだ）

2014/11/7
“液浸”冷却の国産スパコン　2018年にエクサ級へ
http://www.nikkei.com/article/DGXMZO79362480W4A101C1000000/
http://www.nikkei.com/content/pic/20141107/96958A9F889DE5EBE1E4E0E6EAE2E2E4E3E3E0E2E3E6E2E2E2E2E2E2-DSXZZO7936254006112014000000-PB1-7.jpg
Suiren(睡蓮）システムの室内部と液浸冷却用PEZY-SCモジュール（写真：ExaScalerとPEZY Computing）

　新しい冷却技術を持つExaScaler（本社東京）とメニーコアプロセッサー技術を開発しているPEZY Computing
（本社東京）は、演算性能が最大395T（テラ）FLOPSのスーパーコンピューター（スパコン）を開発、
高エネルギー加速器研究機構（KEK）が2014年11月から「Suiren（睡蓮）」として稼働を始めた。
　このスパコンは、PEZYが独立行政法人の新エネルギー・産業技術総合開発機構（NEDO）の助成を受けて
開発した1024コアのプロセッサー「PEZY-SC」を256個搭載する。同プロセッサーの単精度浮動小数点演算性能
は3.0TFLOPS、単精度浮動小数点演算性能は1.5TFLOPSである。これらのプロセッサーは、32枚のボードに
搭載されて、4基のラックに分けて実装されている。
■リーク電流を抑え低消費電力化
　冷却システムには、液浸技術を使っている。ラックごと冷媒を満たした水槽に浸す。冷媒はポンプで屋外の
空調システムで冷却する。冷媒にはフッ化炭素を使う。…

http://www.nikkei.com/content/pic/20141107/96958A9F889DE5EBE1E4E0E6EAE2E2E4E3E3E0E2E3E6E2E2E2E2E2E2-DSXZZO7936255006112014000000-PB1-7.jpg
Suiren(睡蓮）システムの室外部（チラー＋熱交換器）（写真：ExaScalerとPEZY Computing）

■電力性能はいきなり世界2位に
　KEKに設置した今回のシステムを使って実施した初めての性能試験で、153.7TFLOPS（最大演算性能は
395TFLOPS）の性能値と4.02GFLOPS／Wの消費電力性能を確認した。それぞれ2014年6月発表の「Top500」
で420位、同月発表の「Green500」で2位になる。いずれも2014年11月版のランキングに申請する。
　ExaScalerとPEZY Computingの代表取締役社長の齊藤元章氏は、今回のスパコンの性能をさらに向上させる
計画だ。同氏は2018年に1エクサFLOPSを実現できるとみている。2014年6月時点で最高性能のスパコンの
30倍以上の能力となる。

2014/11/16
蓮舫元行政刷新相「スパコン仕分け、失敗だった」
http://www.nikkei.com/article/DGXLASFS11H1I_S4A111C1I10000/
　2009年に誕生した民主党政権は抜本的な行政改革に乗り出すとして「事業仕分け」に着手した。
このとき、霞が関と対峙する仕分け人の１人に就任したのが蓮舫参院議員だ。菅内閣と野田内閣では
行政刷新相に就き、采配をふるった。当時を振り返ってもらった。
　――仕分け人として当初は30人程度を想定していたようですね。
　「結局、十数人に絞ったが、コアは変わらない。寺田学さん、尾立源幸さん、菊田真紀子さん。政権交代…

>>38
何頓珍漢なこと言ってるんだ

ワットあたりのフロップスの為にメモリやレジスタや通信機能削って消費電力下げても、
意味ねーんだよ

電力量に不安がある以上、これ以上の高性能化は省エネ化にかかってるからな。
省エネスパコンをぼったくり価格で売られたり、ブラックボックスで使い辛くないようにするには、自前で開発するのが一番だ。

>>40
>ワットあたりのフロップスの為にメモリやレジスタや通信機能削って消費電力下げても、
何をポイント外すんだよ。　全部最高にして、家庭用なみに消費電力下げて、
ようやく関西を停電させずに京速が動かせるのだよ。

>>42
>全部最高にして、

チップの入出力速度はそう増やせない状態でコア1024個ってことは通信放棄だし、コアあたり
のメモリも申し訳程度でしかないってこともわからん素人は、黙ってたほうがいいぞ

ワットあたりのフロップスで評価すると、そういう箸にも棒にもかからん構成が最適解になるか
ら駄目なんだよ

PEZY-SCはGPUの代わりなんか全く出来ない超単純構造なんだろう。
でなければこんな電力効率にはなるまい

　PEZY-SCは倍精度1.5TFLOPSで（たぶんPEZYのみ）60W。Tesla K40は1.43TFLOPSでボード245W。
　製造プロセスはどちらも28nm。

　>11 >17にあるように、PE毎にローカルメモリ、PE間接続と共有キャッシュは階層化。
　近くの転送は速いし早い。ソケット間もPCI-E 3.0x8x4 というのはK40の倍。　

　DDR3インターフェースは8ch 153.6GB/sでバンド幅はK40の288MB/sには及ばないが
　容量では有利。L3キャッシュが8.5MB（内部記憶合計33.5MB）あるから
　DRAMバンド幅の不利が顕在化する場面は少ないだろう。

>>44
どういう使い分けするのか知らんけど、WideI/Oもついてる。
単純さに関してはよくわからんが、nVidiaは2800コア言うてるので
コア数なりの消費電力喰ってる事になるんじゃないか。
なぜ電力効率が出るのか知らんけど。

>>43
＞ワットあたりのフロップスで評価すると、そういう箸にも棒にもかからん構成が最適解になるか
何を当て外れな頓珍漢な事を偉そうに書いてるんだ？
そう言うお前こそ、FLOPS/Wに代わる最適なパラメータを提案すべきだ。

>>46
フロップス馬鹿には理解できんだろうが、バイセクションバンド幅に決まっておろう

何年経てば、この性能がノートPCで実現できる？

>>44の言う通り、GPGPUに比べればバンド幅があるだろ。
制御チップ混載って事はGPU-CPU間のワンホップもないのだろうし。

>>48
ムーアの法則が限界近いとはいえ、10nmまで行けば何とかなるんじゃないか。
2017～2020年くらいにはなると思う。
もっとも、実際スパコンに使う場合はこのプロセッサ沢山搭載するけどね。

これと14nm版Xeon Phiだと、どっちが効率がいいのかな

>>45
Ultra Wide-IOにDRAMをつなげたらバンド幅は広くなりそうだな。
DDR3/4 と同時に使うことは無理っぽいが

>>51
現行版のCPUではそんなに速くないらしい。
2048bitが2ポートで102.4GB/sとか。

メモリ全部HBMやらWideI/OにしてPCIexのレーン数を更に増やせば
スケーラビリティが上がるんじゃないか。

>>52

I/Oのビット数を増やし、クロックを上げると、
コストと電力消費が増える。
メモリを増やしてもコストと電力消費が増える。

高性能と省電力は相反する傾向にある。

>>2
最下位を希望してるはず

>>53
コストと消費電力を増やしても
性能上げる道筋を考えられないよりはいいんじゃないか。

まあそれはHBMやらWideI/Oやらの話で今回のCPUとあんまり関係ないが。

フランスのモネが制作した睡蓮
http://ja.wikipedia.org/wiki/%E7%9D%A1%E8%93%AE_%28%E3%83%A2%E3%83%8D%29

☆☆☆☆☆
☆ 自民党、グッジョブですわ。 ☆
http://www.soumu.go.jp/senkyo/kokumin_touhyou/index.html

☆ 日本国民の皆様方、2016年7月の『第24回参議院議員通常選挙』で、改憲の参議院議員が
3分の2以上、当選すると日本国憲法の改正です。敗戦後70年の苦しい戦いの道のりからやっとここまで
来ました。皆様方、必ず投票に自ら足を運んでください。そして、絶対に日本国憲法の改正をしましょう。☆

>>47
あ、おちょくるつもりで煽っただけだから、大丈夫です。

PEZY-SC　はPE毎という一番下のレベルにローカルメモリを持っていて、
これはCellに似てるけどCellとは違いL1、L2、L3のキャッシュも持つ。

ハードウェアキャッシュはプログラミングの負担の軽減、
ローカルメモリ（または明示的に制御可能なキャッシュ）は
自動キャッシュでは届かないチューニング限界の提供、
最近のスーパーコンピューター向けプロセッサは両方が当然になってきてるな

L3までデータと命令分離してるのってあまりなさそう

２位じゃダメなんですか

>>59
フロップス馬鹿、乙

>>63
泣くなよw

>>44
そういう問題じゃないだろ

The Green 500 List
1位 AMD FirePro(GPU)
2位 PEZY-SC(非GPU)
3位 NVIDIA Tesla(GPU)
：
19位 INTEL XeonPhi(非GPU)

浮動小数点の積、和のアクセラレーターとしてはGPUもXeonPhiも
余計なものが少なからず載ってるから

シナのスパコンはインテル技術者が助けてるよな
作れば作るほどインテルが大儲けできる仕様だし

>>64
>>47でわざわざ釘さしておいてやったのにそれって、くやしいのうwwwww

専用機としてDSPで組んだほうが
効率よくないかなあ？

>>68
悔しいか悔しいのぅｳﾋｮﾋｮww
まあ、きっと来年には勝てるじゃないの？

ん？（笑）

ウヒョヒョ、って面白いと思ってんのかなこのおっさん。

話の筋で説き伏せたい気持ちがいつのまにかどこかに押し流されて
相手の気分を害したい気持ちが湧き出し溢れてダダ漏れになるパターン

話の内容が重要でそれに比べたら気分の煽られなんか二の次という人間も
いるのだが、このパターンに溺れる人にそれは理解されない

>>69
効率はいいけど、開発と製造のコストが掛かりすぎる。
とはいえ、今はFPGAの動的プログラムをOpenCLでやれる時代だから、FPGAを使うスパコンというのは十分ありだな。
但し、時分割で複数のユーザーの計算をこなさせるのは不可能に近くなるだろうけど。

2015/01/19
【エネルギー技術/植物生理学】究極のエコエネルギー現実味増す「人工光合成」スーパーコンピューター「京」でのシミュレーション [転載禁止](c)2ch.net
http://anago.2ch.net/test/read.cgi/scienceplus/1421636875/

2015/01/26
【スパコン】日立、極地研の「極域科学コンピューターシステム」の稼動開始を発表(c)2ch.net
http://anago.2ch.net/test/read.cgi/scienceplus/1422268182/

2013/09/04
【物理】量子コンピュータの実現に一歩前進、核スピンの制御技術を開発/東工大
http://anago.2ch.net/test/read.cgi/scienceplus/1378293131/

2013/05/21
【IT】GoogleとNASAが共同で“量子コンピューター”研究所を設立
http://anago.2ch.net/test/read.cgi/scienceplus/1369140965/

2014/03/18
【量子】世界最大規模の量子コンピュータを実現する新手法を確立…NTT
http://anago.2ch.net/test/read.cgi/scienceplus/1395148087/
【情報】世界最大100万ビット規模の量子コンピュータ実現に向けた新手法確立　/NTT
http://anago.2ch.net/test/read.cgi/scienceplus/1396955964/

2014/05/19
【量子力学】量子コンピュータ　突然商用化した夢のマシン「D-wave」 [ITpro]
http://anago.2ch.net/test/read.cgi/scienceplus/1400489114/
【IT】D-Wave社の量子コンピュータは「本物」…米研究者グループが「量子効果を確認」とネイチャーに発表
http://anago.2ch.net/test/read.cgi/scienceplus/1372699485/
【計算機科学】D-Waveの量子マシンは古典コンピュータより高速か？
http://anago.2ch.net/test/read.cgi/scienceplus/1403521231/
【計算機科学】混迷深まる量子コンピュータ論争---第3の方式をマイクロソフトが支持
http://anago.2ch.net/test/read.cgi/scienceplus/1403743127/

2014/09/03
【IT】米グーグルgoogle、超高速の量子コンピューターチップ開発に着手　人間のように思考する機械開発目指す [9/3]
http://daily.2ch.net/test/read.cgi/newsplus/1409750221/

2015/02/23
【技術/量子情報科学】日立、量子コンピュータに匹敵する性能の室温動作の新型コンピュータを試作 [転載禁止](c)2ch.net
http://anago.2ch.net/test/read.cgi/scienceplus/1424680504/

補助金　補助金っと

>>40
１スパコンに大型発電所数基独占されてたまるか！

2015/02/26
【AI/機械学習】グーグル、自ら学ぶ人工知能「Deep Q-network」開発　ゲーム繰り返し遊んで攻略(c)2ch.net
http://anago.2ch.net/test/read.cgi/scienceplus/1424914735/