【PPC970】 PowerPC970 【PPC970】Part9
わーいG5最速
>>651 >Benchの結果は、SpecInt/fp = 1317/1293
>G5も結構離されているなぁ。
この結果は ICC で SSE2 を使って最適化してると思われるが、
Apple の発表した値は Altivec は使ってないからなぁ。
IBM の発表してたのは 1.8GHz で 937/1051 だっけ?
>>653 >>7 OpteronはSSE2使うよりもFPU使った方が速いのだが。
655 :
653:03/08/08 00:26 ID:2Xxgim2z
>>654 >OpteronはSSE2使うよりもFPU使った方が速いのだが。
単純なベンチマークならそうだが、ICC のオプションによってはベクトル演算に展開して SSE2 を使った方が速いと思われ。
>>655 うーん、今まで見たベンチではSSE2使って速かったものは一つも見たこと無い。
Pen4ならSSE2使った方が速いけどね。
OpteronのFPUの実装が優秀なのか、SSE2の実装がヘタレなのかのどちらか
と言われてる。
>>657 そのベンチだと
Opteron : SSE2scalar > FPU > SSE2 packed★
Pen4 : SSE2packed★ > SSE2 Scalar > FPU
OpteronのSSE2が遅いと言われる由縁は、SSE2 Packed(=vector)の致命的な遅さだね。
>>658 >そのベンチだと
>Opteron : SSE2scalar > FPU > SSE2 packed★
Pen4 と比較しても意味ないので、Opteron 242 で比較すると、
SSE2 scalar 2260.76MFLOPS
SSE2 packed 2210.03MFLOPS
FPU 1335.31MFLOPS
と読めるのですが。
つまり、Opteron における ScienceMark での行列演算では、
scalar と packed(vector) には大きな差異はなく、FPU は遅い、と。
>>653 Altivecで倍精度演算やってみせてくれよ。