【IA-64】Itanium2専用スレ・その3【アイテニアム】
84.8Gbps
あと、個人サイトでたまに見るのが、GHz (ギガヘルツ) を
GMHz (ギガメガヘルツ?) とか Gz (ゲルツ?) とか言ってたり。
ゲルツじゃなくてゲイツの方がいいよ
804 :
783:2005/07/20(水) 00:57:55 ID:2LDMNfAv
>>796 >>すでに2台とも部屋の肥しと化してるので
もったいないですね。
私は自宅のzx6000(single 1.5GHz)がフル稼働状態でもう一台欲しい.....
会社の仕事とは別に自分の研究用で使ってます。(FEM解析)
コードは自分で書いて徹底的にチューニングしてます。
(ベクトル計算機を相手に15年以上高速計算技法を駆使してきました。)
やっぱりSuperServer 6113L-8で組むかな。
ヤフオクにrx1600が出ているけど,あれはCPUのアップグレードパスがないから見送り。
いくらItanium2の浮動小数点演算能力が化け物だとしても、
AMDのK8を物量投入したほうがコストパフォーマンス良かったりしませんか?
シングルスレッドでないといけないとか、
仕事用と同じ技術を使いたいとか、
そういうことか・・・。
Itanium2でUDやってみたいな〜
凄いことになるのか、はたまた平凡か。
少なくともWindows版のUDはIA-64に対応してなかったと思う。
漏れが試した時はIA-32EL上でしか動かなかった。
>>804 FEM 解析計算を実行した時の IPC とか CPU サイクルあたりの EXE_BUBBLE の割合とか公開キボンヌ。
810 :
783:2005/07/21(木) 02:49:46 ID:3NwvwRzz
>>805 たまたま安く中古を購入できたので,このマシンに関してはコストパフォーマンスは良いです。(20万してない。)
CPUはヤフオクで29,800円でしたし。
(新規に組もうと思っているものも,中古だけど1.3GHzのCPUを3個もっているので安上がりな方を考えている)
全く新規なら,安くて性能の良いコンパイラがあれば,Opteronの方が良いかもしれません。
不安定現象を扱っていてマトリクス解法に直接法を用いる必要があるので,分散メモリ型はやりにくいです。
>>806 マルチスレッドに対応してます。
singleで動かしているのは1.5GHzの安い出物がないから。(要はお金の問題)
>>807 仮にIA64用にコンパイルされていても,super scalar計算機用にチューニングされていなければ性能は全く出ないでしょう。
>>809 マトリクスの三角分解では
密行列:理論性能値の80〜85%
block skyline: 理論性能値の60〜75%
supernodal-multifrontal法:理論性能値の50〜60% (Intel MKLのPADISOよりも高速です。)
(block skylineとsupernodal-multifrontal法は解く問題で性能がばらつきます。)
要素レベルの計算は,単純なスカラー計算が多いので動作クロックの低いItanium2では不利です。
それでも,剛性マトリクス作成や応力計算の際の多重loopを上手に(手で)unrollingすれば,
Itanium2に限らず,要素レベルの計算性能は数倍向上します。
(save命令の回数が少なくなるようにloop unrollingする。)
復元力特性を追跡する計算がかなりの部分を占める場合は,
単純なスカラー計算なのでItanium2は向いてません。(動作クロックが低いので)
当たり前のことですが,
1.如何に計算量を減らすか。
2. 計算量を増加させずにloop内の計算密度を如何に上げるか。(もちろん再起参照無しです。)
3. 計算量が少々増えてもloop内の計算密度を上げて結果的に高速化する。
(ベクトル計算機だと結構効いた。要はレジスタを遊ばせない。)
4. 大容量キャッシュを生かす解法
を考えることですかね。
>>810 加えて IA-64 にはループ最適化を支援するために、
ローテーション・レジスタやループ分岐命令とかが存在していますが、
これらは効いているようですか?
プレディケーションって、どれくらい威力あるんですか?
下に降りてきたら大怪我しそうな気がするけど
ニッチメーカーはニッチでやっとけばいいのに
>>815 それトンデモな提灯記事す。IBMのプレスリリースによると
http://biz.yahoo.com/iw/050722/091506.html ---------------------
Each p575 is powered by 8 Power5 microprocessors running at 1.9 GHz and is configured with
32 GB of memory. The Purple demonstration system consists of 1,280 servers interconnected
with two planes of the pSeries High Performance Switch (HPS).
---------------------
デモの構成わ、POWER5/1.9GHz x 10,240-way (1,280-node x 8 (シングルコア))すから、ピーク性能
1.9 [GHz] x 4 (dual FPU + 積和演算) x 10,240 = 77.8 [TFlops/s]
す。どいういうごまかしで100TFlopsということにしたのかわ謎す。。。
>>743のMontecitoのイカサマ発表のように、最近わHPC分野で騙すってのが流行なんすかね(笑)
>>816 そのプレスリリースに
----
In fact, the performance requirement of 101 teraFLOP/s, trillion floating-point operations
per second (77.8 TeraOps peak plus 23.2 sustained) was exceeded when the performance
standard of 111 teraFLOP/s was achieved on June 23.
----
とあるのをみて、そのまま書いたんだろうな。足すのにどういう意味があるのか知らんが。
819 :
MACオタ:2005/07/24(日) 20:51:05 ID:mEUMtn92
ハイエンド(2GHz/24MB L2)版のMontecitoわ相当遅れるというネタす。そんなに新鮮なネタじゃないすけど、
だれも書かないので。。。
http://www.theinquirer.net/?article=24842 --------------------
The problem with this is they are all the high end parts, the 2.0GHz/24MB versions will be
the hardest hit, not coming out until next March or so. The launch has been scaled back from
2.0GHz to 1.8GHz, and now those are looking iffy.
--------------------
>>815-816のように、ライバルのPOWER5+もさっぱり出てこないすから、それほど影響無いかもしれない
すけど(笑)
>>793のリンク先だと
----
With the arrival of a new power management technology that is codenamed "Foxton"
and is most likely to debut with the Itanium2 "Montvale" in the second half of 2006,
Intel will increase clock speeds up to 2 GHz.
----
なんていっていたが、本当にMontvaleまで2GHzはおあずけだったりw
そういや以前噂になった、ProjectZってどうなったんだろう?
見えないものは存在しない、すなわち消滅
空気は見えないが、存在している。
隣人が僕の頭を覗く。
Dual-Core Intel Xeon Processors “Likely” to Emerge in 2005 ? Intel’s CEO.
http://www.xbitlabs.com/news/cpu/display/20050720031103.html --------
Intel Corp.’s CEO Paul Otellini in the most recent conference call dedicated to the company’s
financial results of the latest quarter rather surprisingly said that the company was likely to
release its 90nm dual-core Intel Xeon server processors and supporting platforms as early as
in 2005, whereas the 65nm dual-core server chips and supporting platforms are only likely to
come in mid-2006.
また、ニュース貼っ付けるだけのスレに戻ったな
だいぶ増加率が鈍ってきたな。
>>833 なんか巧妙にIA-64とEM64TをごっちゃにしてItaniumを良く見せようとしているのは
俺の思い過ごしなんでしょうか
プラットフォームに注力と言いつつIntel自身では667MHz FSBのチップセットを出さないし
そりゃ、自分達の売りたい方を良く見せようとすのは当然だろ
てか、良く読んでみたらIA-64の話なんておまけじゃんw
なになに?またトロンみたいなことやるの?
トロンよりシグマだろ。
シグマってプロセッサ作ってたっけ?
Linuxが走るプロセッサをみんなで作りましょうって話でしょ?
rx2600(中古)を手に入れました。
CPUやHDDは換装して以下のとおりです。
CPU: dual 1.3GHz 3MB L3
HDD: U320 36GB 10000rpm, U320 73GB 15000rpm *2 (RAID1)
OS: RHEL4.0を公開されているソースコードからベータ版の上でコンパイルして
mediaに纏めてあるので,それをインストール。
発熱が多いのとうるさいのは玉に瑕ですが性能には満足してます。
さっそく幾つか試してみました。
密行列の三角分解 (size=8192*8192, 366.54 GFLOP)
プログラムは夫々のキャッシュサイズに合わせて調整してます。
3MB L3用にはチューニングがまだ不十分です。あと数%は性能を上げれると思います。
zx6000(single 1.5GHz 6MB L3): 68.92 sec (理論性能値の88.6%)
rx2600(dual 1.3GHz 3MB L3): 82.3 sec (1 thread) (singleの理論性能値の85.6%)
rx2600(dual 1.3GHz 3MB L3): 41.7 sec (2 thread) (dualの理論性能値の84.5%)
75,365自由度(15,265節点, 8,568要素(9節点シェル要素))の幾何学非線形解析
連立方程式解法はsupernodal-multifrontal法
連立方程式解法と要素レベルの計算はmultithread対応です。
zx6000(single 1.5GHz 6MB L3): 4.84 sec/iteration
rx2600(dual 1.3GHz 3MB L3): 5.60 sec/iteration (1 thread)
rx2600(dual 1.3GHz 3MB L3): 3.20 sec/iteration (2 threads)
170,645自由度(34,419節点, 3,792要素(9節点シェル要素))の幾何学非線形解析
zx6000(single 1.5GHz 6MB L3): 15.51sec/iteration
rx2600(dual 1.3GHz 3MB L3): 17.78 sec/iteration (1 thread)
rx2600(dual 1.3GHz 3MB L3): 10.48 sec/iteration (2 threads)
続きです。
304,325自由度(61,249節点,15,264要素(9節点シェル要素))の幾何学非線形解析
zx6000(single 1.5GHz 6MB L3): メモリーが足りなくてswapした。(2GBしか搭載してない)
rx2600(dual 1.3GHz 3MB L3): 41.12 sec/iteration (1 thread)
rx2600(dual 1.3GHz 3MB L3): 24.58 sec/iteration (2 threads)
このサイズだと,dual 1.3GHzで非線形計算はつらいですね。(250 stepでトータル1000〜1500 iterationsの計算)
かつてはclusterを組まないと解けなかった問題が1台でそれなりの時間で解けるのはありがたいことです。
他のマシンとの比較ですが,データは掲載できませんが,
E8870チップセット+dual 1.5GHz+DDR200よりも,
zx1チップセット+dual 1.3GHz+DDR266の方が速いですね。
日立のチップセット(FSB667, DDR2対応)には期待したいところですが,
1Uサーバ, 2Uサーバ等の機種は予定に無いようなので残念です。
コンパイラはIntel Compiler v9.0を使用してますが,
multithread部分はCILK-5.4.2.2 rev1708を使用してます。
1. CILK命令を含んだコードをCILKでコンパイル(source-to-source compile)
2. 生成されたmultithread コードのinline assembler部分をIntel Compilerのintrinsic functionに書き換える。
3. Intel Compilerでコンパイル
CILKはMITで公開されてます。
rev1708は,GCC3.2までに対応しているようです。Windowsは非対応です。
ユーザーが増えて要望がたくさん送られれば,GCC3.4やGCC4に対応してくれるかもしれません。
RHEL4.0ではlegacy supportのパッケージ(compat-gcc-32, compat-glibc-2.3.2)が必要です。
ttp://supertech.csail.mit.edu/
ただでマシン貸してアプリ開発して良いやつだろ?
シャットダウンリブートを繰り返すプログラム流したら
他の人迷惑だろうなぁ。
847 :
846:2005/08/02(火) 01:55:38 ID:xJWTxhg7
RSSから生でとってきたか、もしくはコメントスパムみたいなスレ
Intelの営業さんが貼ってたりして
保守ついでにネタを投下するのに目くじら立ててるのか・・・
Itanium2マシンを自作する予算がないからって、僻むなよ。
日本HPとマイクロソフトが、ミッションクリティカル・システム分野での協業を拡大
- システム提案、構築の技術知識集約とジョイント・ミッション・クリティカル・サポート・センターの拡張により、
提案から導入後の保守までトータルなサポート体制を確立 -
ttp://h50146.www5.hp.com/info/newsroom/pr/fy2005/fy05-151.html マイクロソフトの提供するWindows Server Systemをベースとしたシステムの構築は、拡大を続けています。
特に、日本HPのインテルR ItaniumR 2プロセッサ搭載の「HP Integrity Superdome」などのハイエンドサーバと
Microsoft SQL Server を使った、ミッションクリティカル・システムの構築実績が大きく伸びています。
これに伴い、高い信頼性、拡張性、管理性を提供するサーバやアプリケーションに加えて、
システム提案、構築時から保守・運用まで一貫した高いレベルのサービス提供への期待が高まってきています。
>>852 ネタふりにしちゃあっさりしてると思ったら保守だったのか
じゃあ反応しない方がいいね
ごめんなさい
Itanium2なんかで自作して、いったい何に使えばいいのだろう。
自作なんてのは、使うのが目的ではなく、組むのが目的みたいなもんだから、
あんまり考えずに突撃・・・・するにしても、ちょっとなぁ。
MSのプラットフォームSDKについてるItanium用コンパイラでコード吐かせてみたりすると、
なかなか凄いコード吐いてくれるというか。
かなりレジスタがリッチで並列度の高い演算だと凄い性能が出そうだなとかいう気にはなる。
Windows系OSは2003 Serverしか選択肢が無いわけだが。
AMD64もIA32よりはましにはなったのだけどやっぱりレジスタ本数もうちっと欲しいなと思う。
いちおうWindowsXPが2バージョン出てる。
実験用ってことならMSDNが安上がりだよ。
>>858 XPはItanium版は売ってないよ。
DSP版はあるとの話だったけど売ってるところはない。
よって買えない。
64bit EditionはItaniumには使えない。
よって、2003 Serverか MSDNしか選択肢はないよ。
860 :
858:2005/08/05(金) 13:00:07 ID:i9pC/2nl
>>859 無理に揚げ足取りしなくていいって。
・WindowsXPをMSDNで入手。
・2003 ServerをMSDNで安上がりに。
そう解釈すりゃいいに。
>>861 メモリーが2枚しか装着されてないね。
これだと4.2GB/secの帯域しかない。
あと2枚挿して4chで動作させないと8.4GB/secの帯域が得られない。
FSBが6.4GB/secだから、メモリが4.2GB/secでは、足りない場合もあるかもね。
事実、初代のFSBは2.1GB/secだったわけだけど、CPU1個でも足りなかったそうだし。
>>863 >>861はdual CPUだから,理想的には12.8GB/sec欲しいところ。
最も性能が欲しい計算部分で帯域を取り合うことになる。
Itanium2って面白いね。
整数データはL1データキャッシュを経由するのに、
浮動小数点データはL1データキャッシュを通さずに直接L2データキャッシュに書かれるんだね。
結局、鯖側のDualcore化は同時期に一斉射になるんだな。
いずれにせよIA64の将来はドトネトに委ねられてるようなものだな。
Windows 2006 Server次第だろ。
まあクライアントサイドはネイティブのほうが断然有利だろうな。そのへんはJavaと似たような運命か。
ただ、VBなんか元々ランタイム上で動いてたものだし、.NET CLR化してるから、それなりには普及すると思っている。
いまでもIA-64で自作できますよ。
自作用にCPUもマザーボードも1個から小売りされてるよ。
IA-64脂肪とか言ってるのはAMD厨だけなわけで、
メインフレームとかにWindowsが切り込んでいくためには、
OpteronではなくIA-64が必要だからね。
当初のシナリオが大幅に狂ったとはいえ、まだまだ活路はある。
ということにしたいのですね。
クライアント向けのWindowsがないとか、あっても周辺機器のドライバとか、云々。
結局Linuxで、無いドライバは最悪自分で書けってことになるのかね。
クロック至上主義からIPC重視に転換しつつ、ダイナミックトランスレーションのアプローチは残すらしいので
x64とIA64のマイクロアーキテクチャレベルでの統合が将来的に実現できないかと妄想している。
あと、なにげにx64をIA32ELでサポートしたらそれなりに性能出そうな気がしてるのだが。
論理レジスタが増えてる分、最適化の際に並列度が高められる可能性があるから。
なるほど。
IA-64を、
x86/x64→uOPsへの変換やOOOなどをCPU内からコンパイラに移した
ものだ
という見方をすると、そーなのかもなぁ。
それにしてはクロックが低いのが問題だが。
x86/IA-64のHybrid Multicoreとか造りそう。。。
IntelのCPUのPCクラスタ売ってる。
先年PC屋開業して最高のHPC部材探しに行ったら見た瞬間に即決した。
カッコイイ、マジで。そして速い。信頼できる技術者が責任をもって開発してる、
マジで。ちょっと感動。しかも下位機種は普通のPen4採用だから導入も簡単で良い。
NetBurstは力が無いと言われてるけど個人的には最適だと思う。
Opteronと比べればそりゃちょっとは違うかもしれないけど、そんなに大差はない
ってDELLも言ってたし、それは弊社の技術を読む目の確かさの証明だと思う。
ただ戦略ミスとかで足踏みされるとちょっと怖いね。
時代のメインストリームなのに規格や方針がコロコロ変わるし。
コストにかんしては多分AMDもIntelも変わらないでしょ。安物CPU採ったこと
ないから知らないけど導入当初からちゃんと所定の性能を発揮できてたら
アホ臭くてだれもIntel機なんて買わないでしょ。個人的にはIntelでも十分に安い。
嘘かと思われるかも知れないけどIA-32eで獅子はうさぎを狩るのにも全力を尽くすで
マジでIntelの世界制覇が完成した。つまりはAMD64に飛びついた人々は先物買いで
損失を出すことが確定と言うわけで、それだけでも個人的には大満足です。
http://pc4.2ch.net/test/read.cgi/jisaku/1077161594/229
Xeon は Xeon スレへ
>>882には、ちょこっとだけItaのことも書いてあるよ
どんどん使ってあっという間に番号枯渇したね。
バカだ w
最初からそのつもりのナンバリングだったんだろ。サーバが先行して4桁採用だし。
5桁になるともう製品名(80xxx)と区別がつかなくなるが
てか、チップセットで955Xまでいっちゃったから65nmあたりで新名称採用の希ガス
888 :
Socket774:2005/08/20(土) 19:24:51 ID:Pt+gQ87S
Meromの新アーキテクチャ; The Inquirerの大胆な推測
2005年8月18日のThe InquirerにNicholas Blachford氏が,Intelの次期アーキテクチャについて大胆な推測を書いています。
IntelはItaniumでVLIW(EPICはVLIW)をやり,旧DECのアルファの上でx86バイナリを動かすFX!32テクノロジをDECの技術の買収で手に入れ,更に2004年5月29日の話題で紹介したようにVLIWに経験の深いロシアのElbrusを買い,
VLIWとエミュレーションの技術を手に入れてきた。とし,次期アーキはTransmetaのようなVLIWプロセサ上でバイナリトランスレーションでx86コードを動かすのではないかと,大胆に推測しています。
http://www.geocities.jp/andosprocinfo/wadai05/20050820.htm
それがParrot?
>>888 いろんな既報をまるで無視した予測だな。
バカだ w
891 :
Socket774:2005/08/21(日) 01:29:54 ID:N1u4KEay
馬鹿を笑う者は、己の愚かさに気付かない。 金正日
よりによってジョンイル加代
ていうか、IA-32ELでいいじゃん。
もしItanium2を3.2GHzで動かせば、Pentium4 2.4GHz相当くらいの速度はでるでしょ?
ただ単に互換性確保が目的ならそれでいいだろうが、
上記の推測はそのレベルの話じゃないでしょ。
つか、そもそも、Yonah → Merom の流れから
いきなりそんなドラスティックなアーキ変更がある筈ないよ。
x86系よりもEPICのほうがコアが小さいなら、
x86系よりも多くのコアを積めわけで、
4倍とか8倍のコアを積んでしまえば、
IA-32ELでも、かなりの性能が・・・
なんか言ってて虚しくなってきた。
バカだ w
ってのは、あざ笑ってるわけじゃないのよね。
いうなれば、愛に似たものというか。
バカよ……まさに空手バカ!
のバカですな。
>>888 それが例のProjectZの招待なのか?
900 :
Socket774:2005/08/22(月) 22:52:10 ID:yYwQIBUP