929 :
jj:04/03/31 22:19 ID:7a9Jd4Eb
927の自己レスです.
カーネルを2.4,24にアップデートして無事解決しました.
(Pentium1機では動いていたのが謎ですが)
930 :
login:Penguin:04/03/31 22:22 ID:NtEOVCsn
P4 で動かせば コンパイラは P4 に最適化した
オブジェクトを吐こうとしますよね。
コンパイルオプションで 66Mhz Pen 用の
オブジェクトにさせてはどうでしょうか。
また、4行は大きいので 男はだまって
END 文。だけではどうでしょう。
保守あげ
保守あげ
933 :
login:Penguin:04/05/08 11:56 ID:006/DMWD
Prescott2.8Ghz+ifc8でhimeno_sベンチなんだけど1400Mflopsぐらい出ます.
でも自作コードだとPen4 2.8Ghzに1割以上負けちゃうんだよな〜
なかなか扱いが難しい.
それと3.0Ghz程度にオーバークロックしてもhimenobmtの数値が
ほとんど上がらない傾向にあるんだけど,なんでだか分かる人います?
そんな経験ないっすか?
久しぶりの書き込みです。
v8.0でコンパイルするとI/Oが多い部分が極端に遅いので,マニュアルを調べてみたら
-assume nobuffered_io
がデフォルトだった。
-assume buffered_io
にしたら速くなった。I/Oが多い部分でv8.0は遅いと感じてる人は試してみると良いと思います。
FEM解析のソフト(チューニング済)では,IA64用に関しては
v8.0(l_fc_pc_8[1].0.039_pl044.1)は
v7.1(l_fc_pc_7[1].1.040),v8.0(l_fc_pc_8[1].0.046)よりも速かったです。
(自宅にHP ZX6000 1.3GHz(中古)が来たので色々試している最中です。)
>933
姫野ベンチは、演算も重要だがそれ以上にメモリ周りが効いてくる。
プレスコットで姫野ベンチが早いのはL2大容量(+SSE3)と思ってますが、
オーバークロックしてメモリの周波数が下がったら、それらの恩恵は
薄まるのでは?
オーバークロックしてメモリの周波数が下がってない?
あと、sサイズだとプレスコットではキャッシュインしている可能性がある。
キャッシュインしたら、オーバークロックしてメモリの周波数が上がったとしても、
そんなにスコアはあがらないと思う。
姫野ベンチはメモリ-CPU間を計っているようなもんだからなぁ。。。
428, 430, 431と同じテストを行ってみました。
Itanium2 1.3GHz (zx1 chipset)
efc7.1, Build 20040310
block size: usr sys wallclock % : GFLOPS: 理論性能値比
mb=1:313.470u 0.243s 5:14.11 99.8%: 1.061: 20.41%
mb=2:128.245u 0.247s 2:08.56 99.9%: 2.593: 49.87%
mb=3:129.956u 0.237s 2:10.26 99.9%: 2.559: 49.27%
mb=4: 78.585u 0.242s 1:18.86 99.9%: 4.228: 81.23%
mb=5: 82.121u 0.228s 1:22.38 99.9%: 4.047: 77.83%
mb=6: 86.212u 0.245s 1:26.46 99.9%: 3.856: 74.15%
Itanium2 1.3GHz (zx1 chipset)
ifort8.0, Build 20040101 Package ID: l_fc_pc_8.0.039_pl044.1
mb=1:315.175u 0.241s 5:15.86 99.8%: 1.055: 20.30%
mb=2:130.405u 0.236s 2:10.72 99.9%: 2.550: 49.04%
mb=3:131.009u 0.235s 2:11.59 99.7%: 2.534; 48.72%
mb=4: 83.629u 0.250s 1:24.41 99.3%: 3.950; 75.95%
mb=5: 84.566u 0.229s 1:24.84 99.9%: 3.930: 75.57%
mb=6: 90.751u 0.237s 1:31.05 99.9%: 3.662: 70.41%
Itanium2 1.3GHz (zx1 chipset)
ifort8.0, Build 20040416 Package ID: l_fc_pc_8.0.046
mb=1:540.660u 0.232s 9:01.71 99.8%: 0.615: 11.84%
mb=2:129.862u 0.234s 2:10.15 99.9%: 2.562: 49.26%
mb=3:130.882u 0.242s 2:11.19 99.9%: 2.541: 48.87%
mb=4: 83.520u 0.241s 1:24.06 99.6%: 3.966: 76.27%
mb=5: 85.637u 0.236s 1:25.89 99.9%: 3.882: 74.65%
mb=6: 89.692u 0.240s 1:29.93 99.9%: 3.707: 71.29%
異様にmb=1の場合が遅い!!
続き
Pentium4 3.06GHz (i850E chipset)
ifc7.1, Build 20040310
mb=1:488.470u 0.560s 8:09.40 99.9%: 0.681: 22.26%
mb=2:218.320u 0.540s 3:38.97 99.9% 1.523: 49.76%
mb=3:159.510u 0.610s 2:40.51 99.7%: 2.077: 67.88%
mb=4:139.200u 0.500s 2:21.07 99.0%: 2.363: 77.23%
mb=5:176.180u 0.550s 2:57.01 99.8%: 1.883: 61.55%
mb=6:180.060u 0.550s 3:00.61 99.9%: 1.846: 60.32%
このテストではefc7.1速いが他の大次元の部分固有問題(SubSpace法)では
IA64に関してはifort8.0, Build 20040101 Package ID: l_fc_pc_8.0.039_pl044.1が
他のversionよりも1割ほど速かったです。
OSはRHEL3.0ASです。
RHEL3.0AS_update2ではglibc_develのバグでifort8.0はリンクできません(IA64)。
939 :
login:Penguin:04/05/23 02:15 ID:luj+XkrJ
Version 8.0 で-axNPや-xNP のオプションでコンパイルすると
forrtl: severe (174): SIGSEGV, segmentation fault occurred
Image PC Routine Line Source
test_prog(※←プログラム名です。) 08530327 Unknown Unknown Unknown
Stack trace terminated abnormally.
となるのですがこれはベクトル化不可能と考えてよいのでしょうか。
940 :
login:Penguin:04/05/29 02:18 ID:ltoFE3kC
どうだろか、もう8.0 は十分に信頼に足りる程に安定になったと言えるかな?
以前出始めの頃に、コンパイルの間違いと性能の劣化で、しばらく手を出さないで
置いたのだが、どうですか?
私はIA32ではNorthwood coreのP4を使用してますが,
v7.1用にチューニングしたコードではv8.0は性能が全然でません。
それまでVectorizedされていた部分が,のきなみPartial vectorizedになってしまって
全く×です。使い物になりません。
v8.0でVectorizedになるように書換えるのはあまりにも多くの作業が必要で(数値計算ライブラリが50万ラインある)やってられません。
ですから,
IA32: v7.1
IA64: v8.0
で使用してます。
Prescott coreを使用している人の情報をお願いします。
Linux magazine 7月号
>今回評価したAbsoft社のFortranは、一部のプログラムでは
>GNU Fortranより低い性能しか出せませんでしたが、
おいおい
MKL6.1 for Linux の30日体験版を落としたんだけどこれって製品版から
BLASとかの中身が省略されているものなんでしょうか?
今までのMKLだとコンパイル(リンカ)が通ってたプログラムが定義されてない関数が残ってるっていうエラーはいて止まる。
それ以前にライブラリ自体が見つからない。libmkl_p4.aなんかはlibmkl_p4.soにファイル名が変更されてたけど・・・
944 :
login:Penguin:04/06/19 17:05 ID:hcBGH92p
MKLのクラスタ向きバージョンがリリースされた模様。
ScaLapackをサポートしたらしい。
#
インテルのIA32の64ビット拡張アーキテクチャー向きのコンパイラは
いつでるのだろうか? それはAMD64用にはうまく動かないように
なっているのだろうか? はたして。。。
945 :
login:Penguin:04/06/20 12:40 ID:VDbqbQOf
>943
なんかいろいろと変化がある模様。
私はとりあえずコンパイル時に
ifort source.for /opt/intel_fc..../lib/32/libmkl_lapack.a /opt/intel_fc..../lib/32/libmkl_ia32.a /opt/intel_fc..../lib/32/libguide.a
としてうまくいっている様子。
場合によっては-staticオプションが必要かも。
コンパイラーのオプションがDec Fortranと違いすぎ。
誰か簡単な一覧作ってくれ。
946 :
945:04/06/20 19:00 ID:1lntWs6/
というわけでどうもライブラリを-lで指定するのではなくソースコードと同じように並べるみたい。
Intelのサイトのどっかにmklの使い方のドキュメントがあったはず。
それより誰か実行時デバッグのオプション教えてくれ。
947 :
login:Penguin:04/06/22 00:44 ID:4JCCOPeW
AMDもフリーでコンパイラ出してくれりゃいいのに。
948 :
login:Penguin:04/06/22 00:49 ID:4JCCOPeW
シングルスレッドのプログラムをマルチスレッドに勝手に
コンパイルするコンパイラってない?
( ゚д゚)ポカーン
>>947 コンパイラは知らないけど、ライブラリかなんかは出してなかったっけ?
>>947 う〜ん、ifort でコンパイルしたやつもはしるけど激オソ。
行列の対角化のルーティンだと Opteron 1.4G の速さは
Northwood 3G の半分くらい。ifort の x86-64版が出ると
差は縮まるのかな。
( ゚д゚)ポカーン
954 :
login:Penguin:04/06/23 16:18 ID:Hm7j1sae
ちょっと伺いたいんですが...
Ver.7の方がVer.8よりも高速ということなんで過去に入手していた
Intel(R) Fortran Compiler for 32-bit applications, Version 7.1 Build 20030307Z
をインストールしたんですが...
>>761のような症状が出てしまいました.そこで,
>>766のような対処をしようと思うのですが.
パッチが見つかりません.Premier Supportには登録してあるのですが,なぜかCコンパイラのアップデートしかでてこないのです.
#Cコンパイラの非商用版
どこか,Premier Support以外でパッチを落すことが可能なサイトがあれば,教えていただけないでしょうか?
また,Intelにクレームを送りたいのですが,メールアドレスを御存じの方もいらっしゃれば教えていただけないでしょうか?
よろしくお願いします.
ちなみに,Ver.8は以下のような構成になっています.
Intel(R) Fortran Compiler for 32-bit applications, Version 8.0 Build 20031231Z Package ID: l_fc_pc_8.0.039
>>954 Premier Supportに入ると"What's New"にまず入りますが,
左のリストの"File Downloads"に入ってProduct欄で
"Intel(R) Fortran Compiler for Linux"
か
"Intel(R) C++ Compier for Linux"
か
"All"
を選択して"Display File List"ボタンを押すと2004年1月からのが現れる.
最新のFortran v7.1はl_fc_pc_7.1.040.tar (3/17/2004)
最新のC++ v7.1はl_cc_pc_7.1.038.tar (5/21/2004)
957 :
957:04/06/23 20:39 ID:Hm7j1sae
>>955 >>956 さっそくにレスありがとうございます.
>>956さんがおっしゃるとおりにすると,C++コンパイラの更新情報は出てくるのですが,
Fortranの方が出てこないのです.Fortranの方も登録してあるのですが...
#現に, 3月の時点では件のパッチのお知らせがメールで届いているんです.
じつをいうと,4月でメールアドレスが変更になっていて,それをPremier Support
の個人情報に反映させてはいるのですが,それが原因なのかもしれません.
いずれにせよ,
>>955さんから教えていただいたアドレスに問い合わせを出してみようと
思います.
#英語で書くのが欝出し...
958 :
login:Penguin:04/06/25 11:10 ID:KGqHK0Va
Intel Fortranでオーバーフロー時に止まるオプションってありませんか?
compaq Fortranで -fpeみたいなの。
ユーザーズガイドでは見あたりませんでした。
959 :
955:04/06/29 12:51 ID:MmwrCOQy
>>957 下のに必要な分(XXとか名前とか)をいれて送るよろし
Dear Intel premier support:
I registered Intel Fortran Compiler for Linux XX month ago.
But, I could not find it in the product list on Premier Site.
Can I update the software?
Regards,
あなたの名前
960 :
login:Penguin:04/06/29 18:58 ID:0kjj/IXp
intel fortran compiler 8を使用しています。
DO I=1,3
K_DASH(I,1)=KV(I,1)-KV(4,1)
ENDDO
上のような計算をベクトル化やSSE等で高速化するにはどうすればよいですか?
自動ベクトル化してくれるように、ベクトル化するように明示的に指示すればよいのか、
それとも、そもそもこういったループはベクトル化できないのかアドバイスをください。
>>960 ベクトル化されるが,
loop長が3だったらベクトル化しないで,手でloop unrollingする方が良い。
ベクトル化したいならマニュアルのコンパイルオプションの項をよく読めば分かる。
この手の演算はメモリーへの書き込み速度がボトルネックになるので,積和演算ほどは高速化されない。
私は,以下のようにしてる(Pentium4 Northwood用)
FFLAGS=-tpp7 -xW -unroll16 -O3 -prefetch -scalar_rep -prec_div -auto -fno-alias -fno-fnalias -ip -lib_inline -nobss_init -Zp8 -lowercase -Vaxlib -vec_report3 -V
EM64T付きXeon、ついにリリースされましたね。Intel compilerももう対応してるんでしょうか?
巨大メモリ空間が魅力で、数値計算用にOpteron*2を検討してたけど、
Noconaがえらく早い&安いで登場しちゃって困惑してます。
>>885-887 と若干かぶりますが、今から非クラスタ構成な数値計算マシンを導入
するなら、「ちょい待ち」を差し引いてもコンパイラの観点でNocona有利なのでしょうか?
それとも初物ということで見送りが吉?
識者の方々の御意見を伺いたく存じます。
>>964 お、うちもほぼ同じ状況(^^;で、うちはもうちょっと新Xeon関係のベンチが出揃うまで待ちとなりますた。
個人的にはOpteron希望なんですが、数値計算関係でガチで比較してるサイトがあったら教えてください。
966 :
login:Penguin:04/07/02 03:21 ID:iy/dn6d5
AMD64 を 32bit モードの環境で使用している人に尋ねたい。
インテルのコンパイラで何か不自由がありますか?
性能はインテルの物よりも落ちますか? (CPUクロックが同等の場合)
967 :
957:04/07/04 12:44 ID:LOPpPOnO
>>959 ありがとうございます.なんと御礼を申してよいものやら...
さっそくに,コピペして送ります.
多謝
MKL v7.0に追加されたPARDISO(sparce matrix direct solver)を試した人はいますか?
試した人がいたら情報をお願いします。極めて高性能ならMKLを導入してみようと思います。
969 :
名無しさん@そうだ選挙に行こう:04/07/11 16:09 ID:v7VsnVj5
すみません、少々お聞き致します。
現在製品版「Intel Fortran Compiler 8.0 for Linux」と
「Intel c++ Compiler 8.0 for Linux」のインストールをしております。
XLSOFTの日本語マニュアルにはライセンスはCD-ROMの中についているとありますが、
それぞれのコンパイラの付属マニュアルにはWebで登録してライセンスを取得して
ください、とあります。
C++のインストールの際、実際CD-ROMの中のライセンスらしきファイル
(CTA EULA for Linux C Compiler (8_x).RTF)では
インストール途中のライセンス認識させる画面で弾かれてしまいました。
やはりWebからユーザ登録してライセンスを取得しなければいけないのでしょうか?
インストール経験者の方などいらっしゃいましたら、どうかお教えください。
970 :
969:04/07/11 16:10 ID:v7VsnVj5
すいません、sage忘れました。
ご容赦ください。
製品版なら発売元に聞けば?
ライセンスのファイル名は
l_cpp_xxxxxxxx.lic
l_for_xxxxxxxx.lic
の様な感じだった気がする。
>>969 >Webからユーザ登録してライセンスを取得しなければいけないのでしょうか?
うん
>>971-973 ありがとうございました。
確かにオンライン登録してから送られてくるライセンスが必要でした。
本当に助かりました。
fftw3 を icc,ifc でコンパイルしているのだが、lib*so ができない
a はできるんだがなあ、何が悪いんだろう
--with-shared-libsとか--with-static-libsみたいなのを忘れてるとか
977 :
975:04/07/16 12:52 ID:Ef8V7ImJ
>>976 ./configure --enable-shared --enable-threads CC=icc F77=ifc
なんだけどね、gcc,g77 じゃできるので、不思議。でも
checking for Fortran 77 libraries... -lm" -L/usr/local/intel/compiler70/ia32/lib -lm -L/usr/lib -lintrins -lIEPCF90 -lF90 -limf -lirc -lcxa -lunwind
checking for dummy main to link with Fortran 77 libraries... unknown
configure: WARNING: *** Couldn't figure out how to link C and Fortran; switching to --disable-fortran.
ってあるのが、心配。
autotoolsがiccでのPICの作り方を知らないから。
libtool-1.5で作り直さないと。