団子ってプログラマーだったん?
ちょっと調子にのっただけなんで許してあげて
おう許してやるよよしよし
1.4にあがってスレッド間で使えるようになったな
OpenMPっぽい問題は解けそう
937 :
デフォルトの名無しさん:2009/03/13(金) 22:37:55
1.4って、何が?
CUDAのCompute Capabilityのことかと
おぃぃ?NVIDIAは新製品のサンプルくらいよこすべきだと思うんだが?
未だに8600GTでやらされてるんだが。
今日の話題で1.4ならATI Streamの方だろ。
Brook+強化されてもなぁ・・・OpenCLマダー?
CALはTUがまともに動くようになったのとX2正式サポートとバグ直しか。
CAL ILの資料はドライバの中身さらけ出し度がさらに上がった感があるな。
>>939 GTX295ですら1.3で、下段ガードを固めて無かった俺には隙はあった。
勘違いしたのは確定的に明らか。
int8使えるけど遅いな
943 :
デフォルトの名無しさん:2009/03/14(土) 02:36:19
>>941 昨日のボクシングの試合は、久々に見所が有ったよな。
ところでウチのマシンでCUDA動かしてたら、マシンが超遅く
成って戻らない。超重いんだけど、落ちはせずに動き続けてる。
何が起こったんだか? 今週末は東京出張だからもう寝よ。
結局1.4云々はATi Streamの方なのか?
CUDA2.1のドキュメントにもCompute Cap. 1.3までしか記述はないが
SDKじゃなくてCCのVerUPが来たらここだけじゃなくnVidiaのニュースリリースに出てるだろ
>>947 まぁそりゃそうだわな
ATi Stream見てみたら、v1.4が出たのな
What's up見る限り、CUDAで言うところの共有メモリをBrook+から扱えるようになったってことか?
Brook+をアップデートされてもな
>>948 CALの項で共有メモリ扱う方法書いてあると
思うが?
>>949 Significant feature enhancements to Brook+:
* Access to thread-level data sharing.
Brook+から扱えるって事じゃねえの?SDK User Guideの2-40
これまでのBrook+はほぼCの構文だけだったけど
1.4でC++のテンプレートを使ったプログラミングが出来るようになったな
ドキュメントだとLegacyとNew APIっていう比較でコードの長さも一長一短だが
共存は出来ないんだろうか?
GTX 280だと、doubleで90GFlopsぐらいまで落ちた気がするからそれだけみるとすごいな
ただ、実際問題として頭からケツまでdouble精度が必要なソフトがあんま無いってのと
floatの性能が芳しくないからそこがネックだな
GeForceは1SMあたり、単精度MAC8器(SP)、特殊演算ユニット(SFU)2器、倍精度(DP)1器の構成。
単精度性能は8Way積和算+4Way乗算×2で24、倍精度は1Wayの積和算で、2
つまり単精度:倍精度のスループットの比率は12:1
RadeonはGeForceのSPに相当する部分を5WayのVLIWで構成し、そのうち1Wayで倍精度も実行できるようにしてる。
んで、スループットの比率は5:1なわけだけど、どっちが優れてるかは一概には言い難い。
VLIWは演算対象によって実効性能がガクっと落ちる(倍精度はもともと1Wayなので関係ないが)
ただ、倍精度演算ユニットを倍増するくらいの拡張は将来のGeForceにもできるだろうから
今は我慢のとき。
Larrabeeは16Wayの単精度と8Wayの倍精度で演算ユニットを共有することになるから
理屈の上では2:1になる。まあ、ケチってくるかもしれないけどね。
>>955 1Wayで倍精度じゃないよ。
5Way分の演算器使って1Way分のDMADが実行できる。
ただし同時に1Way分の整数演算ならできる。
>>956 倍精度は4つだけしか使わない。
Trans Unitで出来ないのはX,Y,Z,W Unit4つ同時使用が前提の命令とアドレスレジスタに触る命令だけ。
だからX,Y,Z,W Unit使ってDP1つ、その上でTrans Unitが残ってるからSP or INT1つも同時に出来るよ。
>>970 を踏んだら、次スレ立ててね。
テンプラ募集。
↓
,.、,、,..,、、.,、,、、..,_,,_ /i
;'`;、、:、. .:、:, :,.: ::`゛:.::'':,'.´ -‐i
'、;: ...: ,:. :.、... :.、.:: _;... .;;.‐'゛ ̄  ̄
ヽ(´・ω・)ノ
| /
UU
catalyst9.3が出たが「XPだとCALがうまく動かない」とさ
Folding@Homeに付いてきたamdcalrt.dll 6.14.10.103は動くっぽい。
待て屋のディレクトリに放り込んだらちゃんと動いたんで多分大丈夫。
CALのDLLをFolding@Homeに最適化しようとして、最適化しようとして、
XP版だけ間に合わなかったか
Clarkdaleとか出たら
GPUメモリに高速アクセスできるようになるんですか
1.4からマルチGPUに対応とかになってたから
仮想化のもんだいか
catalystを入れ替えるときにチップセットドライバも更新しようと思って
software uninstall utilityで全ソフトの削除を選んだらstream sdkまで
消されたw
Web PAMが削除されることを知っていた俺にとっては想定の範囲内。
>>963 GMA、それに限らず非オンボード・オンチップGPUはメインメモリ共有です><
そもそもGMAはGPGPUに対応してないんですけどね。
968 :
963:2009/03/21(土) 17:38:23
ここまで全部だんごやさんの自演だよ
さて、アイちゃんが立てたスレは放置して新しく立て直すか・・・
一応貼っとくか
ttp://www.techpowerup.com/index.php?88739 AMD to Demonstrate GPU Havok Physics Acceleration at GDC
ATI's Terry Makedon, in his Twitter-feed has revealed that AMD would put forth its “ATI GPU Physics strategy.”
He also added that the company would present a tech-demonstration of Havok technology working in conjunction with ATI hardware.
The physics API is expected to utilize OpenCL and AMD Stream.
結局分立のまま並走かよ。
BulletがCUDAとStreamの両方に対応する事を祈るしかないか。
だんごトリップなしかよ
発言のキモさでわかるだろ
><
FireStorm製品ではなくてグラボとしてのRadeon-HD4870+ATI Stream SDK で倍精度計算は可能ですか?
「DP計算はできないように機能を殺してある」/「RV670(<ーFireStormのこと?)でSDK入れたら計算できた」と言う
矛盾するような内容の書き込みが存在するのですが。
979です。
Thanks!
>>980 FireStormではなくてFireStreamでしたね(^_^;;)