>>761 > P4 vs AthlonXP 時代からそうなのですが、
> 自分でプログラム (科学技術計算系) を作ると AMD の方が高速になってしまいます。
> C2E6600 vs A64X2 4800+ (両者 2.4GHz) でも後者が約 10% 高速。
> gcc でも VC でも傾向は大差なし。
に対する自己レスだから、
「自分で作ったプログラムを gcc-4.2でコンパイルしたところC2Dで 25%ほど高速化して
k8と比較しても 10% 早い結果を得た」
ということであって、
「gccのコンパイル時間が短くなった」とはどこにも書かれていない。
単純に浮動小数点演算中心のプログラムをコンパイルすると、FPU性能に優れるK8が早くなるが、
最適化オプションでSSE3を指定してやると、SSE3ユニットが倍ほどの性能を持つC2Dのほうが圧倒的に早くなる。
CPUアーキテクチャ毎に対する最適化オプションは今のところ
i386 / i486 / i585(or pentirum) / i686 / pentium2 / pentium3 /
pentium4(or pentium4m) / prescott / nocona /
k6 / k6-2(or k6-3) / athlon(or athlon-tbird) /
athlon-4(or athlon-xp or athlon-mp) / k8(or opteron or athlon64 or athlon-fx) /
winchip-c6 / winchip2 / c3 / c3-2
しかなく、残念ながらまだCoreMA用の最適化ルーチンはない。
通常はそれでもC2DのがK8より早いはずだけど、K8のほうが早い処理も存在するし、
gcc自身がその一例だってこと。