1 :
戦慄の選定者:
藻前らが導入したコンピュータを書き込めば良いだけさ(´ー`)┌
とりあえずスペック・ノード数
身元バレしないように気を付けな〜
2 :
名無しさん@3周年:04/12/08 01:52:06
れっつのーと
3 :
戦慄の選定者:04/12/08 02:09:51
テンプレ付けとくです。
ex.
【CPU】 Pemtium4 3.2Ghz
【Mem】 1GB
【HDD】 80GB
【ノード数】 24node
【用途】 CFD並列計算,etc...
【導入費用】 約800万円
こんな感じでよろすくです
【CPU】 Z80A(相当品) 4MHz
【Mem】 32KB (本体16KB + 拡張カートリッジ16KB)
【テープドライブ】 2 (Wラジカセ)
【ノード数】 1 (RS-232C I/F 別売り)
【用途】 インベーダーゲーム, スタートレック, etc...
【導入費用】 約10万円
5 :
名無しさん@3周年:04/12/08 20:40:28
自家用車を諦めて、自家用スパコン買っていいですか?
6 :
名無しさん@3周年:04/12/08 21:20:58
7 :
戦慄の選定者:04/12/09 01:31:42
>>6 SX-6i-1チップで8GFLOPS 1400万
Pentium4-3Ghzで大体1Gflops 40万
実効性能でSXが10倍あったとしても悩むなぁー
粒度の低い計算はクラスターでCPU増やしても速くならないから
スパコン入れなきゃ時間短縮にならんから、金があったらSX入れたいな。
>>7 MKLかATLAS使えばP4 3Gでも普通に4Gflopsくらいは出るな。
あと今なら普通に買えばP4 3Gで10万もしないな。
9 :
名無しさん@3周年:04/12/20 02:36:45
>>8 3.6Gくらいなら35〜40万くらいする罠
商用アプリだと実効性能そんな高くないし。
自分の金ならいくらでも好きな様に使っていいけど、
税金使ってすぐゴミになるようなもの買わないでねw
11 :
名無しさん@3周年:04/12/20 17:09:22
ccc
12 :
名無しさん@3周年:04/12/21 01:58:12
SX-8導入予定です
13 :
戦慄の選定者:04/12/22 00:44:33
14 :
名無しさん@3周年:04/12/23 02:40:05
だれか、数学科の修士の学生が、水爆の3次元解析コードを書いてさ、
それをGPLをつけてネットに放ったりしたら、ちょっとした話題に
なるんだろうけどね。
15 :
名無しさん@3周年:04/12/23 02:44:34
東北大学スーパーコンピュータSX-7がHPCチャレンジベンチマークにおいて、世界最高速記録を達成!!
NECはこのたび、東北大学情報シナジーセンター(根元義章センター長)に納入し、2003年
1月から稼動しておりますスーパーコンピュータSX-7において、HPC(高性能計算)分野での
新しいベンチマークテストであるHPCチャレンジベンチマーク(
http://icl.cs.utk.edu/hpcc/)
で、28項目中16項目で世界最高速を達成いたしました。
HPCチャレンジベンチマークは、米国政府の援助のもと、テネシー大学のJ.ドンガラ(J.
Dongarra)博士を中心に米国や日本のHPC関係者が参画して、作成されたものであります。
従来、高性能計算機の性能番付として主流であったTOP500ベンチマークで使用されてきた
Linpack(連立方程式の計算)を補完し、高性能計算機の性能を多面的な観点から評価する目
的で開発されたベンチマークであります。同ベンチマークはHPCシステムで重要となる複数
の性能テストから構成されており、コンピュータの演算性能だけではなく、メモリアクセ
ス性能、並列処理のためのライブラリであるMPI(Message Passing Interface)の通信性能
など、HPCシステムにおける様々な機能の性能を総合的に評価することが出来ます。
今回のベンチマークテストでは、NECのSXシリーズのようなベクトル型スーパーコン
ピュータだけではなく、汎用プロセッサを使用したスカラー型スーパーコンピュータの性
能も数多く登録されており、今後のHPCベンチマークテストの主流になるものと見込まれて
おります。
このたび、SX-7が世界最高速を達成した、HPCチャレンジベンチマークは、Linpackベン
チマークも含んだ7カテゴリー28項目のベンチマークから構成されております。
プレスリリース全文はこちらです。
日本電気株式会社プレスリリース 2004年12月21日
http://www.nec.co.jp/press/ja/0412/2102.html
16 :
戦慄の選定者:04/12/26 02:19:10
17 :
名無しさん@3周年:04/12/29 03:32:39
>>13 大規模数値計算。
主に流体シミュレーション、粒子シミュレーション。
18 :
名無しさん@3周年:04/12/31 00:03:28
テンプレ付けとくです。
ex.
【CPU】 Pemtium4 3.2Ghz
【Mem】 1GB
【HDD】 80GB
【ノード数】 24node
【用途】 CFD並列計算,etc...
【導入費用】 約800万円
こんな感じでよろすくです
19 :
名無しさん@3周年:04/12/31 12:56:24
【容姿】
12〜31歳・割と恵まれた容姿
【主人公の生い立ち】
ある王国の村の少年
【ストーリー展開にどう絡むか?】
村を出て騎士になるための試験を受け合格する。その後大臣達の反乱が発生する
と王家だた一人の生き残りである姫君を、反乱軍から救い出し一躍英雄となる。
その後ある州でレジスタンス勢力とともに、反乱軍を駆逐し本人にその気はなか
ったが同州の長となる。その後反乱軍勢力を討伐、というよりほとんど吸収する
形で勢力を拡大する。彼の軍団には軍人、商人、レジスタンスなど多くの階層の
人々が集まっていた。戦後は議会派として、絶対王政を進める女王と対立。
直接の戦闘は起こらなかったものの、長きにわたって冷戦状態となった。
【ストーリーの中の役割】
主人公はけっして反王政でも、自由主義者でもなかった。むしろ革命を押さえ込んでいた。
女王もまた議会派への徹底的な弾圧はさけていた。
【結果としてどうなるか?】
主人公と女王の友情は続いていたらしく、ぎりぎり平和が続いたという
20 :
名無しさん@3周年:05/01/30 00:09:19
並列機の使用経験のない初心者なんですが一つ教えてください。
1ないし2個のプロセッサーを積んだ計算ノードをネットワーク接続するのと
多数(32個とか)のプロセッサーを積んだSMPサーバーでは
どちらが処理効率が高いでしょう。
CPUが同数であればネットワークオーバーヘッドが無い分
SMPのほうが有利であるような気もするのですが。
よろしくお願いします。
21 :
戦慄の選定者:05/01/30 20:30:34
22 :
名無しさん@3周年:05/01/31 04:22:49
マジで?
23 :
名無しさん@3周年:05/02/01 05:54:44
>>20 処理効率の比較において
クラスターとSMPを比較するのはクラスターにとって荷が重すぎじゃないか?
SMP機は共有メモリのメリットが生かせるようにメモリの帯域が凄く広く作ってある
その分値段がもの凄く違う訳だが・・・
クラスター型は少ない並列化数であればそこそこの効率が出るので安いハードで構築できる為に
最近のトレンドになっている。
24 :
名無しさん@3周年:05/02/01 07:34:09
>>21>>23 ありがとうございます。
やはりそういうことですね。
最近のSMPサーバーはメモリーもずいぶん積めるので
プロセッサー数が同数程度であればSMPの方が処理能力が高くなるそりそうですね。
25 :
名無しさん@3周年:05/02/03 01:36:29
>>24 Opteron-8wayシステムが値段も性能も良いとこ突いてると思われ
ソフトのライセンスが気になる場合もノードロックライセンスが適用できて~(┌┌┌ ´Д`)┘ ウモァー
27 :
名無しさん@3周年:05/02/04 18:27:35
>>26 0.5Tflops、1Tbyte?豪勢だな。予算いくらあるの?
2億ぐらい?2億でも無理か。
2000万もあれば十分。
29 :
名無しさん@3周年:05/02/04 22:48:32
>>28 0.5Tflops、1Tbyteが2000万!?メモリーだけでもそれじゃ無理でしょ?
パソコン用の安いメモリーで1G/5万でも1T5000万だよ。
どんな構成?
30 :
名無しさん@3周年:05/02/04 23:10:57
31 :
名無しさん@3周年:05/02/06 01:06:59
化学反応を加味した3Dの熱流体解析です。
>>33 >性能は8個のSPEによる単精度(32bit)浮動小数点演算で256 GFLOPSに達する
ひゃー、凄いですね。でもHPC用は今年度中には間に合わないかな?
35 :
戦慄の選定者:05/02/10 00:41:21
これまではXeonでも32bit縛りがあったけど、
EM64Tのおかげでメモリ大漁に載せてCPUもdual以上積めるシステムが安価で買えるようになるのか?
cell 8wayで大体1TFlops(倍精度)か。
2〜3Rackで地球シミュレータ並みだね。
8000台のクラスタで1PFlops。10億くらい
で組めるかな。
37 :
あのぅぅぅ:05/02/10 23:10:03
私はタンパク質の分子動力学をしていますが、
上のようなメチャ速いシステムって、
当然、クーロン力のような遠距離力をcut offできる
系で用いるのですよね。 ってParticle Mesh Ewald法
をどうすれば速くできるかうを知りたいので。
>>35 なるんでないの?
そうなると商用で32ビットモードしか対応できないソルバは負け組みですね。
40 :
戦慄の選定者:05/02/11 13:29:09
>>39 2wayじゃーこれまでと変わらないでしょ。
唯一はメモリ多く載せられるだけでさ。
これまでは4wayでも使えるメモリが2Gのままだったから大規模できなかったでしょ
でもメモリが10Gあっても2wayじゃダメ
要は両方揃ってないとね。
そろそろXeon MPのEM64Tが出ても良いと思う。
まずは、4wayの4GBが出たら考えるかな
41 :
名無しさん@3周年:05/02/12 00:39:49
>>39 なんか、中途半端だなぁ...
これを使うぐらいならMac G5 2Wayのほうがよくない?
Xserveならクラスタへの拡張も容易だし。
42 :
名無しさん@3周年:05/02/12 00:46:08
>>33 >>CellのPPEは、Powerアーキテクチャのプロセッサコアだが...命令セットは既存のPower系CPUと完全に互換
これってPowerPCとバイナリ互換てこと?そりゃ凄いな。
でも、こんな凄いのが出てるのに一般の新聞、ニュースその他ではどうして話題にならないの?
43 :
戦慄の選定者:05/02/12 00:58:58
>>41 だよね、中途半端すぎ。
だったらOpeteron 4wayか8wayとか買うよ。
44 :
名無しさん@3周年:05/02/12 01:44:19
>>39 そこのベンダーさ、itanium2も真性スパコンレベル!
Xeonもスパコンレベル!!!
なーんてほざいてるけど一体何がスパコンレベルなのかと問いつめたいよ。
今のスパコンは地球シミュレータレベルじゃないのかね。
何世代も前のスパコンと比べられたら困るわ。
言うならば3世代前のスパコンレベル!
とかさ、12世代前のスパコンレベル!って具体的に言ってくれよ。
45 :
名無しさん@3周年:05/02/12 02:10:33
>8000台のクラスタで1PFlops。10億くらい
1ノード12.5万?そりゃ安すぎ。
通信系含めたら1ノード100万(今のMac Xserverぐらい)はするから
100億ぐらいはかかるでしょ。それでもESよりは激安。
こんなに一気にブレークスルーするとは思わんかった。
>>44 アルキメデスと亀みたいなものだろう。
汎用CPUがはやくなってスパコン並になったとき、スパコンもまたさらにはやくなっている。
>>45 cellプロセッサもXDR-DRAMもPS3の量産効果で値段が下がるから、
1ノード16way200万、×500ノード=10億で計算したんだが、やっ
ぱり無理かな。
48 :
名無しさん@3周年:05/02/14 18:54:20
49 :
名無しさん@3周年:05/02/14 21:34:33
Cell、ちゃんとした最適化コンパイラが提供されるといいなあ。そうすれ
ばHPCに使えるのに。でもどこでコンパイラ開発してるんだろう。ソニー
が開発できるとは思えないし。
51 :
名無しさん@3周年:05/02/17 18:53:27
情報があまりなくてよく分からないんだが、cellって倍精度ベクトル演算を
ちゃんとサポートしてないみたいだね。しょせんゲーム用か。残念。
52 :
名無しさん@3周年:05/02/18 23:04:16
情報挙列してみてくれ
∧_∧ ∧_∧
ピュ.ー ( ・3・) ( ^^ ) <これからも僕たちを応援して下さいね(^^)。
=〔~∪ ̄ ̄ ̄∪ ̄ ̄〕
= ◎――――――◎ 山崎渉&ぼるじょあ
54 :
名無しさん@3周年:05/02/20 17:13:49
...これからも僕を応援して下さいね(^^)。
━―━―━―━―━―━―━―━―━[JR山崎駅(^^)]━―━―━―━―━―━―━―━―━―
∧_∧
ピュ.ー ( ^^ ) <これからも僕を応援して下さいね(^^)。
=〔~∪ ̄ ̄〕
= ◎――◎ 山崎渉
__∧_∧_
|( ^^ )| <寝るぽ(^^)
|\⌒⌒⌒\
\ |⌒⌒⌒~| 山崎渉
~ ̄ ̄ ̄ ̄
∧_∧
( ^^ )< ぬるぽ(^^)
(⌒V⌒)
│ ^ ^ │<これからも僕を応援して下さいね(^^)。
⊂| |つ
(_)(_) 山崎パン
∧_∧ ∧_∧
ピュ.ー ( ・3・) ( ^^ ) <これからも僕たちを応援して下さいね(^^)。
=〔~∪ ̄ ̄ ̄∪ ̄ ̄〕
= ◎――――――◎ 山崎渉&ぼるじょあ
56 :
名無しさん@3周年:05/03/02 00:40:11
56ですが、12,17じゃないっす。
スパコンなんて買えないっす。
59 :
戦慄の選定者:05/03/05 22:38:12
>59
上から2番目は人がどんどん辞め、技術者が残っていないので
ろくなサポート出来ていないから注意しろ
61 :
名無しさん@3周年:2005/04/29(金) 16:55:36
62 :
名無しさん@3周年:2005/05/18(水) 23:05:09
>>62 SX-8のプロセッサは16GFLOPSで世界最速となってたけどCellが26GFLOPSということは
世界最速を更新するということ?
それともSX-8は倍精度ではなくて、比較方法をCellと合わせるともっと速いの?
巨大なメモリを使用する場合、CPUとメモリ間のデータ転送速度も重要。
Cellの場合、26(GFLOPS) × 8(Byte) = 208
一秒間に208GBの結果をアウトプットできるが、
CPUとメモリ間のデータ転送速度がそれについていかない。
PS3: 25.6GB/s
SX-8: 256GB/s
>>62 理論値だと4万台で超えるね。
>>63 SX-8のプロセッサは最大ベクトル性能が16GFLOPSで世界最速。理論性能は22GFLOPSで世界最速の記載は無し。
おそらくCellの26GFLOPSは理論性能で最大ベクトル性能はもっと低いと思われ。
詳しい方よろしく。
>>64 SX-8はシングルノード512GB/秒、マルチノード262TB/秒ですよ。
メモリの容量やノード間転送能力も重要と思われ。
500万くらいでお勧めのクラスタ教えてー
やぱPenDは論外よね
67 :
名無しさん@5周年:2006/01/23(月) 06:39:14
Opteronマシンにclearspeedを差したやつ2,3台
ベンダはどこよ
特注?
70 :
名無しさん@5周年:2006/01/24(火) 01:47:46
HITでFA
4core PowerMac G5を10台くらいが
かなりのコスパ。
倍精度でピーク400Gflops超。
マクで数値計算とかやってる椰子いんのか…?
73 :
・3・:2006/01/24(火) 14:56:29
今のクラスタの主流はオプだろ?
75 :
名無しさん@5周年:2006/01/25(水) 14:21:31
すごいなぁ
その割には目立ってないような気がするんだが・・・というか消えちゃいそうだしw
なんで?
Quad coreのXserveがほすぃ。
でもあの熱さはプレスコ以上な気がする。
77 :
名無しさん@5周年:2006/01/29(日) 19:58:33
数値計算の場合、メモリの速度がボトルネックになってるわけだから、
こっちを早くしてくれんことにはCPUがいくらすごくなったとこで恩恵が少ないよ
マルチコアだの騒がれてるけど、メモリが未だにDDRではねぇ・・・
78 :
名無しさん@5周年:2006/01/30(月) 21:25:11
ソニーはかつてNEWSというワークステーションを作って売っていた。
日本語処理が出た当時としては結構しっかりしていたのとBSDだったので、
大学などでインターネットの始めの頃にはとても人気があった。
ところが10年もしないうちに、ソニーは方針を変更してワークステーション
部門を放り捨ててしまった。だから、HPCとかそういう基礎体力の要るような
ソフト開発の重要度、教育や知識の重要な部門はソニーのようなチャラチャラ
フラフラした流行追うだけのメーカーなんかにゃ無理。付き合うと馬鹿を見るだけ。
組み込み家電のチップだ位に思っておけばOK,数値計算をソニーに期待するな。
ソニーは金出すだけでしょ
どう考えてもIBMが主体
80 :
名無しさん@5周年:2006/02/02(木) 01:18:55
PENTIUM4の3GHzは、倍精度6GFLOPS,単精度なら12GFLOPSの潜在性能を持つから、
ヂュアルコア版は、それの二倍になるはずだよ。つまり12GFLOPS/DP、
24GLOPS/SPというわけさ。キャッシュが2MBYTESつづそれぞれのコアについて
居れば、2MBの範囲に納まる計算を主としてやる分には、性能が
これらの数値に近いものが出せるはず。
81 :
名無しさん@5周年:2006/02/05(日) 00:30:24
よう分からんけど、netburstなP7が高クロックなのはパイプラインが深いからでしょ?
つまり予測が外れたときのペナルティもでかいと。その辺考えなくて良いのかな?
単純にクロック×IPCで評価するのはどうかと思うが
2オペランドで少ないレジスタ数のIA32/x86_64にとっての
ピーク性能はただの飾りですよ。
エロい人にはそれがわからんのです。
ベンチの結果が全て
ピーク性能なんざまやかしよ
84 :
名無しさん@5周年:2006/08/27(日) 10:08:49
SSE4を搭載したCoreDuo2とかゼオン5100番台では、コアあたり
倍精度演算で実にクロックの4倍という驚異の演算速度を
潜在的に持つ。これは3GHzのCPUなら実に倍精度12GFLOPS
を意味するわけで、2つのコアが動けば24GFLOPSだ。
どうだすごいだろう。しかも2CPUにすればさらに2倍で48GFLOPS
ということになるぞぉ。4CPUなら96FLOPSだ、どうだ参ったか。
はいはいまいったまいった
てか、ベンチマークの数値も出せないのに激しくワロス
山崎剛明は正真正銘の馬鹿
88 :
名無しさん@5周年:2006/09/30(土) 00:13:14
48GFLOPS->96FLOPSに落ちるわけだな?
89 :
名無しさん@5周年:2006/10/01(日) 05:34:35
ジョブ管理ソフトウェアって何使ってる?
LSFあたりが有名だが。
>>90 Sun Grid EngineとかCondorとかPBS一家(OpenPBS/PBS Pro/Torque)らへんがめぼしいとこ
あとWindows Compute Cluster Pack
うちはSun N1 Grid Engine.
>あとWindows Compute Cluster Pack
windowsで計算って実際にやられてるの?
まだマイクソソフトが参入宣言してる段階だと思ってたが
94 :
名無しさん@5周年:2007/06/16(土) 22:00:48
しかしこの
>>1名欄を見る限り凄まじい厨二病患者である
95 :
名無しさん@5周年:2007/07/03(火) 09:04:29
SSE4を搭載したCoreDuo2とかゼオンでは、コアあたり倍精度演算で実にクロックの
4倍という驚異の演算速度を潜在的に持つ。これは3GHzのCPUなら実に倍精度
12GFLOPSを意味するわけで、2つのコアが動けば24GFLOPSだ。
4つのコアが動けが48GFLOPSだ。どうだすごいだろう。
しかも2CPUにすればさらに2倍だからヂュアルコアXEONなら48GFLOPS、
クアドコアXEONなら96GFLOPSということになるぞぉ。
さらに4CPUならデュアルコアXEONでは96FLOPS、クアドコアXEONなら
192GFLOPSだ、どうだ参ったか。
3GHzで4CPUのクアドコアXEONのマシンを5台並べれば、もうそこは
1TFLOPSの入口正面だ。クロックも今後徐々に上げていって、4GHzとか
5GHzとかが出来ればなお結構。
地球シミュレータの40TFLOPSに達するには、200台並べれば良いという
ことになる。これなら体育館は要らない。セブンイレブンの店舗程度で
十分置けるだろう。
96 :
名無しさん@5周年:2007/08/16(木) 09:29:39
SSE4という名称は誤りで、SSSE3というべきなんだけどな。
97 :
名無しさん@5周年:2007/09/12(水) 20:41:30
AMDのSSE5にしたら、さらに倍になるのかな?
最近でたQuadCoreのOpteronはどうなっているのかな。
98 :
名無しさん@5周年:2007/09/17(月) 13:51:44
SSE4A
99 :
名無しさん@5周年:2007/09/18(火) 18:45:24
100 :
名無しさん@5周年:2007/09/22(土) 14:50:31
性能低いから
102 :
名無しさん@5周年:2007/10/06(土) 19:28:50
103 :
名無しさん@5周年:2007/12/07(金) 23:46:18
104 :
名無しさん@5周年:2009/07/31(金) 23:21:27
スパコンの時代・・・
IntelとかAMDの汎用チップを大量に並べればある程度何とかなるようになっちゃったし
特殊用途向けの特殊仕様品としてのスパコンは終わるんだろうね
メインフレームはまだ一部で頑張ってるらしいけど、スパコンは性能命だしそうもいかんよな
JAMSTECの一般公開でES2見てきました。
正面にある"SX9"の表示って"X"の部分がじんわりと赤く明滅するんだね。どうかと思った。
初めて見たんで、遠い側のノードの上空に陽炎を発見してさすがスパコンとか感心したw
【CPU】 Pemtium4 3.0Ghzハイパースレッティング(仮想デュアルコア) ソケット775
【Mem】 1GB
【HDD】 80GB
【ノード数】 24node
【用途】 ゲーム
【ビデオカード】あり スペック ジーフォース8400GS 256MB
【導入費用】 約1万円
オプティプレックス745です
あと、初カキコです
スパコンではないですがそれなりの性能はあります^^
108 :
名無しさん@5周年:2010/05/03(月) 11:51:44
今、3GHzのCPUでコアが6つあれば、
3x4x6=72GFLOPSピーク。
コアが12個あればその倍で144GFLOPS。
4GHzのCPUでコアが6つあれば、96GFLOPSピーク
コアが12個ならその倍で192GFLOPSピーク。
M.B.がデュアルソケットならそれぞれ2倍に、
4ソケットなら4倍になる。
たとえば4GHzのCPUでコアが12個のものを4ソケット
挿してやれば0.5TFLOPS弱なのだ。
そういったWindows7のPCがもうすぐ可能になる。
109 :
名無しさん@5周年:2010/05/05(水) 19:15:39
不勉強で申し訳ないが、このパソコンでどんなアプリが動くの?
48コア分のソフトの購入価格教えて。
110 :
名無しさん@5周年:2010/05/05(水) 20:21:02
ソフトの価格なんて
車一台分にもならないよ。
111 :
名無しさん@5周年:2010/05/05(水) 22:01:12
なんか空しい。ピーク500GFLOPSのハードと言われても
実効性能は、たかだか2,3%のアプリを走らせるのは。。
しかも、コア数増えてもどんどん効率下がる。
アプリの開発や性能向上に金を注ぎ込むべきではないか。
1アプリで新車1000台程度の金はかかるだろうが。
112 :
名無しさん@5周年:2010/05/05(水) 23:03:17
なにを回してるんだ?
113 :
名無しさん@5周年:2010/05/22(土) 18:05:19
これからはこれぜよ、GPUGPUの時代ぜよ。
114 :
名無しさん@5周年:
ないない