GPGPU#2

このエントリーをはてなブックマークに追加
932デフォルトの名無しさん:2009/02/27(金) 11:19:28
団子ってプログラマーだったん?
933,,・´∀`・,,)っ-○◎●:2009/02/27(金) 19:44:05
団子(だんご)は、米の粉に水やお湯を加えてこねて、蒸したり茹でたりしてできた餅を小さくまるめた菓子である。
http://ja.wikipedia.org/wiki/%E5%9B%A3%E5%AD%90
934デフォルトの名無しさん:2009/02/27(金) 20:24:10
ちょっと調子にのっただけなんで許してあげて
935,,・´∀`・,,)っ-○◎● :2009/02/28(土) 06:43:02
おう許してやるよよしよし
936デフォルトの名無しさん:2009/03/13(金) 22:09:32
1.4にあがってスレッド間で使えるようになったな
OpenMPっぽい問題は解けそう
937デフォルトの名無しさん:2009/03/13(金) 22:37:55
1.4って、何が?
938,,・´∀`・,,)っ-○◎●:2009/03/13(金) 22:43:51
CUDAのCompute Capabilityのことかと

おぃぃ?NVIDIAは新製品のサンプルくらいよこすべきだと思うんだが?
未だに8600GTでやらされてるんだが。
939デフォルトの名無しさん:2009/03/13(金) 23:00:11
今日の話題で1.4ならATI Streamの方だろ。
940デフォルトの名無しさん:2009/03/13(金) 23:05:40
Brook+強化されてもなぁ・・・OpenCLマダー?
CALはTUがまともに動くようになったのとX2正式サポートとバグ直しか。
CAL ILの資料はドライバの中身さらけ出し度がさらに上がった感があるな。
941,,・´∀`・,,)っ-○◎●:2009/03/13(金) 23:09:31
>>939
GTX295ですら1.3で、下段ガードを固めて無かった俺には隙はあった。
勘違いしたのは確定的に明らか。
942デフォルトの名無しさん:2009/03/13(金) 23:14:39
int8使えるけど遅いな
943デフォルトの名無しさん:2009/03/14(土) 02:36:19
>>941
昨日のボクシングの試合は、久々に見所が有ったよな。

ところでウチのマシンでCUDA動かしてたら、マシンが超遅く
成って戻らない。超重いんだけど、落ちはせずに動き続けてる。
何が起こったんだか? 今週末は東京出張だからもう寝よ。
944デフォルトの名無しさん:2009/03/14(土) 05:57:09
>>938
新製品って何?
945デフォルトの名無しさん:2009/03/14(土) 06:00:23
http://developer.amd.com/gpu/acmlgpu/Pages/default.aspx
AMD Core Math Library for Graphic Processors (ACML-GPU)

なにげにgpu対応版acmlが出てるのね
946デフォルトの名無しさん:2009/03/14(土) 19:55:25
結局1.4云々はATi Streamの方なのか?
CUDA2.1のドキュメントにもCompute Cap. 1.3までしか記述はないが
947デフォルトの名無しさん:2009/03/14(土) 20:01:44
SDKじゃなくてCCのVerUPが来たらここだけじゃなくnVidiaのニュースリリースに出てるだろ
948デフォルトの名無しさん:2009/03/14(土) 20:04:42
>>947
まぁそりゃそうだわな

ATi Stream見てみたら、v1.4が出たのな
What's up見る限り、CUDAで言うところの共有メモリをBrook+から扱えるようになったってことか?
Brook+をアップデートされてもな
949デフォルトの名無しさん:2009/03/14(土) 20:20:01
>>948
CALの項で共有メモリ扱う方法書いてあると
思うが?
950デフォルトの名無しさん:2009/03/14(土) 20:28:11
>>949
Significant feature enhancements to Brook+:
* Access to thread-level data sharing.

Brook+から扱えるって事じゃねえの?SDK User Guideの2-40
951デフォルトの名無しさん:2009/03/14(土) 20:32:13
これまでのBrook+はほぼCの構文だけだったけど
1.4でC++のテンプレートを使ったプログラミングが出来るようになったな
ドキュメントだとLegacyとNew APIっていう比較でコードの長さも一長一短だが
共存は出来ないんだろうか?
952デフォルトの名無しさん:2009/03/15(日) 21:53:50
ttp://forum.beyond3d.com/showthread.php?t=52990
ACML gpu benchmark numbers

>170 gflops for DP and 380 gflops for SP.
>Remember to run your CPU at full speed (i.e. disable powersave)!!

DPのわりにSPが速くないような
(RV770ってDP/SP=1/5だったように思うが)
953デフォルトの名無しさん:2009/03/15(日) 22:08:06
DP結構凄いな。SPは駄目駄目な気もするが
CUDAでもあんま変わらないような。

http://www.gpgpu.ru/articles/sgemm-7.html
なんかボトルネックがあるのかね?
954デフォルトの名無しさん:2009/03/15(日) 23:12:21
GTX 280だと、doubleで90GFlopsぐらいまで落ちた気がするからそれだけみるとすごいな
ただ、実際問題として頭からケツまでdouble精度が必要なソフトがあんま無いってのと
floatの性能が芳しくないからそこがネックだな
955デフォルトの名無しさん:2009/03/16(月) 11:47:25
GeForceは1SMあたり、単精度MAC8器(SP)、特殊演算ユニット(SFU)2器、倍精度(DP)1器の構成。
単精度性能は8Way積和算+4Way乗算×2で24、倍精度は1Wayの積和算で、2
つまり単精度:倍精度のスループットの比率は12:1

RadeonはGeForceのSPに相当する部分を5WayのVLIWで構成し、そのうち1Wayで倍精度も実行できるようにしてる。
んで、スループットの比率は5:1なわけだけど、どっちが優れてるかは一概には言い難い。
VLIWは演算対象によって実効性能がガクっと落ちる(倍精度はもともと1Wayなので関係ないが)

ただ、倍精度演算ユニットを倍増するくらいの拡張は将来のGeForceにもできるだろうから
今は我慢のとき。

Larrabeeは16Wayの単精度と8Wayの倍精度で演算ユニットを共有することになるから
理屈の上では2:1になる。まあ、ケチってくるかもしれないけどね。
956デフォルトの名無しさん:2009/03/16(月) 18:59:48
>>955
1Wayで倍精度じゃないよ。
5Way分の演算器使って1Way分のDMADが実行できる。
ただし同時に1Way分の整数演算ならできる。


957デフォルトの名無しさん:2009/03/16(月) 23:38:14
>>956
倍精度は4つだけしか使わない。
Trans Unitで出来ないのはX,Y,Z,W Unit4つ同時使用が前提の命令とアドレスレジスタに触る命令だけ。
だからX,Y,Z,W Unit使ってDP1つ、その上でTrans Unitが残ってるからSP or INT1つも同時に出来るよ。
958デフォルトの名無しさん:2009/03/17(火) 01:34:43
>>970 を踏んだら、次スレ立ててね。
テンプラ募集。
959デフォルトの名無しさん:2009/03/17(火) 10:16:34
 ,.、,、,..,、、.,、,、、..,_,,_  /i
;'`;、、:、. .:、:, :,.: ::`゛:.::'':,'.´ -‐i
'、;: ...: ,:. :.、... :.、.:: _;... .;;.‐'゛ ̄  ̄
   ヽ(´・ω・)ノ
     |  /
     UU
960デフォルトの名無しさん:2009/03/19(木) 20:12:50
catalyst9.3が出たが「XPだとCALがうまく動かない」とさ
961デフォルトの名無しさん:2009/03/19(木) 21:36:57
Folding@Homeに付いてきたamdcalrt.dll 6.14.10.103は動くっぽい。
待て屋のディレクトリに放り込んだらちゃんと動いたんで多分大丈夫。
962デフォルトの名無しさん:2009/03/19(木) 21:44:53
CALのDLLをFolding@Homeに最適化しようとして、最適化しようとして、
XP版だけ間に合わなかったか
963デフォルトの名無しさん:2009/03/19(木) 21:53:12
Clarkdaleとか出たら
GPUメモリに高速アクセスできるようになるんですか
964デフォルトの名無しさん:2009/03/19(木) 22:19:50
1.4からマルチGPUに対応とかになってたから
仮想化のもんだいか
965デフォルトの名無しさん:2009/03/20(金) 09:58:49
catalystを入れ替えるときにチップセットドライバも更新しようと思って
software uninstall utilityで全ソフトの削除を選んだらstream sdkまで
消されたw
966デフォルトの名無しさん:2009/03/20(金) 12:10:07
Web PAMが削除されることを知っていた俺にとっては想定の範囲内。
967,,・´∀`・,,)っ-●◎○:2009/03/21(土) 16:19:09
>>963
GMA、それに限らず非オンボード・オンチップGPUはメインメモリ共有です><
そもそもGMAはGPGPUに対応してないんですけどね。
968963:2009/03/21(土) 17:38:23
>>967
だんごさん
ありがとうございました!
969デフォルトの名無しさん:2009/03/21(土) 18:46:32
>>970次スレよろ
970,,・´∀`・,,)っ-○◎●:2009/03/21(土) 19:18:35
971,,・´∀`・,,)っ-○◎●:2009/03/21(土) 19:35:44
ここまで全部だんごやさんの自演だよ
972デフォルトの名無しさん:2009/03/21(土) 20:42:38
さて、アイちゃんが立てたスレは放置して新しく立て直すか・・・
973デフォルトの名無しさん:2009/03/21(土) 21:31:32
 
974デフォルトの名無しさん:2009/03/21(土) 21:54:42
一応貼っとくか
ttp://www.techpowerup.com/index.php?88739
AMD to Demonstrate GPU Havok Physics Acceleration at GDC

ATI's Terry Makedon, in his Twitter-feed has revealed that AMD would put forth its “ATI GPU Physics strategy.”
He also added that the company would present a tech-demonstration of Havok technology working in conjunction with ATI hardware.
The physics API is expected to utilize OpenCL and AMD Stream.
975デフォルトの名無しさん:2009/03/21(土) 22:03:14
結局分立のまま並走かよ。
BulletがCUDAとStreamの両方に対応する事を祈るしかないか。
976デフォルトの名無しさん:2009/03/21(土) 22:19:14
だんごトリップなしかよ
977デフォルトの名無しさん:2009/03/22(日) 06:31:58
発言のキモさでわかるだろ
978,,・´∀`・,,)っ-○◎●:2009/03/22(日) 06:33:22
><
979デフォルトの名無しさん:2009/03/22(日) 08:52:36
FireStorm製品ではなくてグラボとしてのRadeon-HD4870+ATI Stream SDK で倍精度計算は可能ですか?
「DP計算はできないように機能を殺してある」/「RV670(<ーFireStormのこと?)でSDK入れたら計算できた」と言う
矛盾するような内容の書き込みが存在するのですが。

980デフォルトの名無しさん:2009/03/22(日) 10:09:50
981デフォルトの名無しさん
979です。
Thanks! >>980

FireStormではなくてFireStreamでしたね(^_^;;)