895 :
876:
>>894 確かにPrescottの-xNを使ってみたいところでしたが,残念ながら
2003年8月版のifc7.1でSSE3の対応していませんでした.
とりあえず,-tpp6で行った結果です.今回は,3.2XEも追加します.
オプションいずれも,-O3 -tpp6 -axW -xW -Vaxlib -static
[email protected] 992.42 Mflops
[email protected] 1464.85 Mflops
[email protected] 1046.39 Mflops
となりました.Himenoベンチは単精度計算なので,確かに-tpp6の方が速くなるのですが,
Prescottではほとんど変わらないのが興味深いです.
また
[email protected]が遅すぎる感がします.L3-cacheとはいえ,2MBの本領が発揮されていない気がします.
896 :
877:04/02/22 13:05 ID:E0CmsZKJ
>895様
早速のご報告ありがとうございます。
しかも、3.2XEまで付けてくださいまして。お金持ちなのですね。
3.2XEはあまり良くないですね。3.4GHzと比較してわずか50MFLOPSしか変わらない。
これで、5万以上の価格差があると考えてしまいます。L-3はレイテンシがかなり遅いんでしょうね、
Prescottの大容量L-2が1.4倍ものスコアを出しているのがそれを物語ってる気がします。
ひさしぶりに intel からメールがきた。
icc8.0 を Debian/sid に入れた。
rpm がへんだ、という理由で、
install.sh が止まる。
rpm の deb はちゃんと入っているので、install.sh を変更。
- rpm -q rpm &> /dev/null
+ dpkg -s rpm &> /dev/null
- GLIBC="$(rpm -qa 2> /dev/null | grep '^glibc-[[:digit:]]' | cut -d'-' -f2)"
+ GLIBC="$(dpkg -l 2> /dev/null | grep '^glibc-[[:digit:]]' | cut -d'-' -f2)"
-DEFAULTOPTIONS='-U --replacefiles'
+DEFAULTOPTIONS='-Uvh --replacepkgs --replacefiles --nodeps'
gcc の "方言" が原因でコンパイルが止まることは、
もうほとんどないようだ。
xmame を
-xK -O3 -rcd -ipo -ipo_obj で
コンパイルしてみた。
とても速い。びっくり。
898 :
877:04/03/02 19:42 ID:ZpErCZad
[email protected]版の検証の続報です.
himenobmtxp_s.fを悪名高きifc8で検証しました.
コンパイルオプション-NPを付加してみました.
-O3 -tpp7 -axWNP -Vaxlib -static
MFLOPS: 1478.510 time(s): 50.11000
となるのに対して,-tpp6にすると
-O3 -tpp6 -axWNP -Vaxlib -static
MFLOPS: 601.8895 time(s): 61.56000
と,とんでもない結果となる.(3回行ったが傾向は同じ)
恐るべし・・・
899 :
877:04/03/03 01:13 ID:kXEuxeA0
>898
どうでもいいけど 877は私です。
-NP オプションの結果ありがとうございます。
すごいですね、この結果!
姫野ベンチにおいては
Prescott以前では、-ttp6の方が速かったのに、
Prescottでは、-tpp7の方が速い。
Pentium4オプションの-tpp7で速い、Prescottは真のPentium4ですね。
コンパイルオプションをもう少し頑張れば、1.5GFLOPS超えますね。
既にOperonがかなわない領域です。
ホントに恐るべしです!
-NPによるSSE3効果と、CPUが-tpp7を真に理解できている効果ですね。