1 :
デフォルトの名無しさん :
2007/08/29(水) 17:08:58
イチオツ
人がいまだに固定シェーダでうろうろしてる間に、Cで叩けるようになっていたなんて。 あまりにも話がCUDA
CUDAはCから手軽に移植できて、割と簡単にGPUに計算させることができて便利ではある。 しかし、いざチューニングしようとするとどこをどう調整すればいいのか判り難くて困る。 ってことで、理想速度が出せれば別だけどそうでないならWoodcrestの方が大抵速くて余り役に立たない。 尤も、CPUがある程度遅いとなるとこれはかなり強力なツールと言えよう。 なんせ、Woodcrestより遥かに安い(8600GTS搭載ボードなら3万弱)わけだし。 一方CBEと較べてみても、(8600GTでさえ)PS3のメインメモリと同じだけのメモリをボード上に積んでいるわけだ。 おまけにSPEで動くプログラムは作るだけでも結構手間が掛かる。それを考えると、もうPS3はどうでもいいやw
CellBEの方が遥かに自由度が高い,っつーか GPGPUは当にアクセラレータでしかないだろ
超越関数が使えないのがなぁ。只のアクセラレータでしかないGPUでさえ使えるのに。 それだけで、移植の手間が随分違ってしまう。
7 :
デフォルトの名無しさん :2007/09/02(日) 05:40:54
晒しage
8 :
デフォルトの名無しさん :2007/09/02(日) 11:55:53
ぜんぜん伸びねぇなwww
9 :
デフォルトの名無しさん :2007/09/02(日) 17:36:39
おーっし、俺がGPU利用したアプリ書いてやる 今からパソコン屋行ってフレームバッファ買ってくるから、ちょっと待ってろ
10 :
デフォルトの名無しさん :2007/09/02(日) 17:41:22
どっかにCUDAのサンプルソースの森とか、CにおけるK&R みたいな入門書無いの〜?
>>11 CUDAのSDKについてくるサンプルソースじゃダメか?
あれはある意味、宝の山だぞ。
まぁ、私程度でよければ知りたい内容によってはここで回答しても構わんが。
CUDAでの基本をまとめてくだしあ
>>13 ・元のプログラムがあるなら移植前にきちんと整理
・GPU上で動く関数からはメインメモリを参照できない。どのデータをGPUに渡すか熟考すべし
・変数名に工夫するなどして、CPU側メモリかGPU側メモリか常に意識するように
・仮令GPUボードを持っていようとも、馴れないうちはエミュレータも活用しよう
・その為にもデバッガを含めて開発環境にも慣れておこう
・サンプルからノウハウまで、それなりに資料はそろっているからきちんと読めば途は拓ける
>サンプルからノウハウまで、それなりに資料はそろっている URLをお願い
CUDAなんかやってもMUDA
CUDAできるカードCUDAさい。 ていうか、どの型番のカード(GPU)からCUDAできるの?
>>18 GeForceならこの辺。
--
Core Clock (MHz) Memory Clock (MHz) Auxiliary Power Connectors Number of Slots
GeForce 8800 Ultra 684 1161 2 2
GeForce 8800 Ultra 612 1080 2 2 ←リファレンス
GeForce 8800 GTX 575 900 2 2 ←リファレンス
GeForce 8800 GTS 540 840 1 2
GeForce 8800 GTS 500 800 1 2 ←リファレンス
GeForce 8600 GTS 710 1000 1 1
GeForce 8600 GTS 675 1000 1 2
GeForce 8600 GTS 675 1000 1 1 ←リファレンス
GeForce 8600 GT 590 900 0 1
GeForce 8600 GT 540 700 0 2
GeForce 8600 GT 540 700 0 1 ←リファレンス
GeForce 8500 GT 450 400 0 1
GeForce 8500 GT 450 400 0 1 ←リファレンス
--
QuadroFXは忘れた。
で、お値段は8600GTSで3万弱、8600GTなら1.5万くらいからメモリ増強版の2.5万程度まで。
それより上にしても並列数は増えるけどクロックは速くならないからピーク性能を狙わないなら
コストパフォーマンス的にもサイズ的にも8600GTS/GTでいいかと。
尚、電源に余裕がなくて補助電源コネクタからの供給ができないなら8600GT以下で。
CUDAらん! 実にCUDAらん!
個人的には >ていうか、どの型番のカード(GPU)からCUDAできるの? っていう質問が出てくること自体、凄く不思議なんだが。 おもいっきり、プログラミングガイドにかいてあるけど。
プログラミングガイドを読んでないから出てくるんだろ 何が不思議なんだよ
英語って時点でばっくれる奴がいることも忘れんでください 致命的だけどな
>>23 英語だからよく判らないってのは納得できるのだけど、
全体眺めるだけでAppendixAにスペック書いてあるの位は目に留めてほしいなぁ。
英語→うわっめんどくせ→2chで聞いたほうがはえーや という奴だろうな 似たような奴が研究室にいて 「なー、この関数の使い方教えてよ」 とググれば済むことまで効いてくる。俺が必死こいて組んでるときに それで一度ケンカになったが ググれば済むことを効いてくるやつの神経わかんねーぐちすまね
ぐぐるのも面倒いんだろうきっと
B型?
血液型と性格に関係はありません。 それはそうと、CUDAでBitslice DES実装したのないかな。
>>28 そうとも言えないよ。アイザック・アジモフに拠れば、「そういうもんだ」という環境で育てばそうなるそうだから。
B型だと思ったらA型でしたー でもそんなの関係ねぇ!
血液型信仰(笑)
ベクトルプロセッサというのが良く分からん マルチプロセッサと何が違うの?
ベクトルプロセッサは同時に複数のデータを並列して処理するプロセッサ それに対して一つのデータを処理するのがスカラープロセッサ マルチプロセッサは一つのコンピュータ内にプロセッサを複数搭載している事
っ[SIMD]
SIMDはプロセッサ内におけるベクトルプロセッサ的な要素
>>33 >ベクトルプロセッサは同時に複数のデータを並列して処理するプロセッサ
>それに対して一つのデータを処理するのがスカラープロセッサ
>マルチプロセッサは一つのコンピュータ内にプロセッサを複数搭載している事
こんな夜中にレス付いて吹いた
スカラープロセッサ*マルチプロセッサ=ベクトルプロセッサ
にはならないの?
>>34 >SIMD
Single Instructionってどのくらいまでならsingleなの?
50行くらいの関数までならsingleなの?
まさか、addとかmovとかxorというレベル?
>スカラープロセッサ*マルチプロセッサ=ベクトルプロセッサ >にはならないの? ならない >まさか、addとかmovとかxorというレベル? うん
あらかじめ大量のデータを用意しておいて、 その大量のデータを別の大量のデータに変換する事が一発で出来るという事? うーん、逐次処理には向かないのかなぁ?
まぁ大体そういう事だね。 最近のほとんどのパソコンのプロセッサにはスカラーとベクトル両方の仕組みが搭載されていて、 適材適所で使い分けられるようになってる。
8192bit VLIWとかならベクトル処理も並列処理も同じアーキテクチャで 実現できるな。並べる命令が同じものならベクトル処理、違うものなら 並列処理。
GPUでzip解凍すればよくね?
違う命令が並べられるならMIMD
GPGPUはSPMD
うへぇ、CUDAの文法がまるっきりCのそれだからつい、騙されて梃子摺ったぜ。 デバイス側のメモリを巧く使うのは難しいな。 しかも、それが動かしてみないと判らないし、エラーメッセージもunspecified failureだし……
昨日の洗脳集会に参加した人は素直に挙手しなさい。
行きたかったけど行けませんでした。 資料ください
>>46 申し込んだのに定員オーバーで断られた俺が来ましたよ
tokyo-uのやつ?どんな話だったん?
>>45 kwsk
資料がプログラミングガイドしかないからどんな情報でも欲しい。
53 :
デフォルトの名無しさん :2007/09/14(金) 00:20:58
日本語ではワープでもいいんじゃないか。
OS/2でも笑えるんじゃないか。うらやましいヤツメ
ヲープ(笑)
まぁ外人相手にワープと言ってもハァ?な顔されるだろうな
トレッキーに通じないわけが無かろうが。
CUDAって結局8800以外に何で使えるの? この後出る予定の8700とか対応するんだろうか。話題ぜんぜん出てこないし
個人的には >CUDAって結局8800以外に何で使えるの? っていう質問が出てくること自体、凄く不思議なんだが。 おもいっきり、プログラミングガイドにかいてあるけど。
俺もそれ見たけど、8600では使えないと書いてるところがあった
CUDAはそもそも研究者のオナペットなんだから8800くらい買えよ、安いもんだろ まさかCUDAが一般に普及するとでも思ってるとか?ねーよw
8800だけならすぐ廃れるのか
66 :
19 :2007/09/15(土) 01:25:26
正直、8800GTXの消費電力と占有スペースを考えたら8600GTSか、いっそ補助電源も要らない8600GTでいいと思う。 #テストするだけならね。コストパフォーマンスも高いことだし。 勿論、チャンピオンデータ狙いなら8800Ultraで頑張ればいいと思うが。 つーか、このスレにも一覧書いておいたのになぁ……
67 :
19 :2007/09/15(土) 01:26:52
って>63や、どこに8600はダメと書いてあったのかね?
69 :
19 :2007/09/15(土) 08:36:22
>>68 ドキュメントに基づいた情報。
実際に動かしたのは次のボード。
--
ELSA 988GTX
ELSA 988GTS
ELSA 786GTS
ELSA 786GT
--
ちなみにTeslaボードも入荷次第テストする方向。
常駐者だったのか。つか、ここ何人くらいで回ってるんだろうw
71 :
19 :2007/09/15(土) 13:51:44
常駐というより、巡回しているだけだけどね。 折角だから、nvccの出力(ptx)でも張ってみようか。先ずはソース。 -- #include <cstdio> // WIN版だとリンクにvcを使う所為かiostreamを巧く使えない const int NofThreads = 256; // 32以下なら1warp内で完結、最大512 const int NofBlocks = 256; // 物理ブロック数をオーバーしたら時分割処理される // device側コード #include <cuda_runtime.h> __device__ float dVals[NofBlocks * NofThreads]; // >45も書いている、device側のメモリ __global__ void foo(float ratio) { float vs, vc; unsigned offset = blockIdx.x * blockDim.x + threadIdx.x; // この右辺の変数で何番目のデータスレッドか判る __sincosf(offset * ratio, & vs, & vc); // sincosf()の組み込み命令版 dVals[offset] = vs * vs + vc * vc; } // host(CPU)側コード const float M_PI = 3.14159265358979323846f; int main() { foo<<<NofBlocks, NofThreads>>>(M_PI / (NofBlocks * NofThreads)); // ここで並列起動 float hVals[NofBlocks * NofThreads]; // host(CPU)側メモリ // この場合はcudaMemcpyFromSymbol()を使用(cudaMalloc()した場合はcudaMemcpy()) cudaMemcpyFromSymbol(hVals, dVals, sizeof(* hVals) * NofBlocks * NofThreads); for (unsigned ic = 0; ic < NofBlocks * NofThreads; ++ic) { printf("%g ", hVals[ic]); } fputchar('\n'); return 0; } // 所要時間はCore2Duo 6320 @ 1.86GHzで1秒掛からない程度 // シンプルすぎて時間測定には不向きなので要注意
72 :
19 :2007/09/15(土) 13:53:50
んで、こっちがnvcc -ptx -O3した出力の抜粋 -- .global .align 4 .b8 dVals[262144]; .entry foo { .reg .u32 $r1,$r2,$r3,$r4,$r5,$r6,$r7,$r8; .reg .f32 $f1,$f2,$f3,$f4,$f5,$f6,$f7; .param .f32 __cudaparm_ratio; .loc 12 10 0 $LBB1_foo: .loc 12 15 0 cvt.u32.u16 $r1, %ctaid.x; // cvt.u32.u16 $r2, %ntid.x; // mul.lo.u32 $r3, $r1, $r2; // cvt.u32.u16 $r4, %tid.x; // add.u32 $r5, $r4, $r3; // cvt.rn.f32.u32 $f1, $r5; // ld.param.f32 $f2, [__cudaparm_ratio]; // id:31 __cudaparm_ratio+0x0 mul.f32 $f3, $f2, $f1; // cos.f32 $f4, $f3; // sin.f32 $f5, $f3; // mul.f32 $f6, $f5, $f5; // mad.f32 $f7, $f4, $f4, $f6; // mov.u32 $r6, dVals; // mul.lo.u32 $r7, $r5, 4; // add.u32 $r8, $r6, $r7; // st.global.f32 [$r8+0], $f7; // id:32 dVals+0x0 exit; // } // foo -- # 解説要るなら言っとくれ
8800だと、128の演算が並列で行われるのでしょうか?
cudaで遊ぼうとしてまして、8400GSでサンプルを動かして速さを実感したのですが、 cudaを使ったフリーソフトとかソフトを集めてるサイトとかありませんか? 手始めにmp3エンコーダーのlameのDCT部分をCUFFTで置き換えられないかなと 勉強中なのですが、すでに誰かやってそうで。 公式フォーラムで、Diracデコーダーを実装した人が20倍速くなったと書いてるのでわくわく
あー、8400GSでも動くのか。 しかし、WoodcrestXeonだと恐らく速くなりそうもない罠。
79 :
デフォルトの名無しさん :2007/09/25(火) 01:08:16
PS3でリアルタイムレイトレーシング、デモアプリ公開
IBM:Interactive Ray Tracer for Cell Broadband Engine
http://www.alphaworks.ibm.com/tech/irt IBMより、Cell Broadband Engineで動作するインタラクティブ レイトレーシングのデモアプリがリリースされました。
PS3もしくはIBM QS20 Cell blade上のLinuxで動作します。
リアルタイムレイトレーシングのデモ動画はすでに4月に公開されていたものですが、今回デモアプリが公開されたことで、家庭のPS3でも(Linuxの知識があれば)手軽?に試すことが出来るようになりました。
パフォーマンスは、QS20 1台で1080p 1.6M Triangles時にフレームレート2.7fps程度、QS20を7台使って17fpsとなっています。
ということはPS3を1台使用した場合のフレームレートは1.0fpsぐらいでしょうか、公開されている動画ではPS3を3台使用しています。
http://pocketnews.cocolog-nifty.com/pkns/2007/09/ps3_b71c.html
今後数年以内に産業資本主義自体が滅びるからcudaとかps3とか無駄
Larrabeeの行く末ってCellが示してる気がするわ。 描画は遅くて使えない FahじゃX1650XTにも勝てない
>>80 PS3を3台ってどうやってデータ渡してんの?
先を予測して時分割でやってんのか。
最近CUDAで遊び始めた者です。 ひとつの変数に複数のスレッドから値を足し込むことをうまくやりたいのですが、 スレッド間の同期が取れていないためか、おかしな値が出てしまいます。 ( 例えば C = A[ty][tx] * B[tx][ty] ) for文を使うとうまくいくのですが、このfor文がボトルネックになってしまい 困っています。 何かうまい方法を知っている方いれば教えていただきたいです。
85です。 例に挙げた式、間違ってました。 C += A[ty][tx] * B[tx][ty] でした。申し訳ない。 for文を使う場合は for(i=0;i<BS;i++) C += A[ty][i] * B[i][ty]; こんな感じです。 iはint型変数、BSはブロックサイズです。 for文を使わないと、各スレッドがそれぞれのタイミングでCの値を参照し、計算結果 を足しこんでいるのでしょうか、Cの値が毎度おかしなものになります。 AとBはReadOnlyです。 86さんの誘導先に似たような事例がありましたので参考にしようと思います。 それにしても、スレッドの並列処理に比べてfor文があまりにも遅くて驚きました。
すいませんCgのことでちょっとお聞きしたいのですが 3次元テクスチャを使ってデータをやりとりしてるのですが どうもメモリが解放されていなくて、徐々にメモリ使用率が上がっていってしまいます 普通CPUで3次元テクスチャを使った場合はメモリ使用量は一定なので GPU側の問題と踏んでいるのですが 同じような症状の方いましたら、解決方法教えてください
すいません↑のは 普通にCPUで〜 です nvidiaのサンプル(opengl two texture sample)を実行してみたところ animationをさせるとメモリが増加していきました。。。 これは仕方が無いのでしょうか…
>>87 Cが一箇所だとどうしても並列動作できないねぇ。
もしできるのであれば乗算の結果を(その場で積算せず)リニアにグローバルメモリに保存しておき、
別の関数でその値をまとめるとかいっそ、CPUに転送してCPUで集計するとか。
ぶっちゃけ、そういう積算が必要なくなるようにアルゴリズムを見直すのが一番だけどね。
# どうせなら誘導先に書いて欲しかった。
二分木で足しこんで行く手はある
GF8500GT-P256H使うか
CUDA 1.1betaが会員に公開されたみたいね。 x64をサポート、しかしVistaはまだだそうだ。
Linuxは?できれば*BSDもサポートして欲しいが。
GPUつかって 描画と物理演算の二つをやりたいのですが、可能でしょうか。 GPUで物理演算したものを、GPUレイキャスで行う という感じなのですが Cgで片方・片方は出来たのですが、それを同時にするのって見当がつかなくて
AMDの3800シリーズのデモ(PingPong)では玉の動きを物理処理させつつ高度な光源処理を行っています。
>>98 そのサンプルとかありますか?
実際にどう実装しているのか。まだvertex fragmentのシェーダー一つを扱うのにいっぱいいっぱいで
CUDA 1.1 beta が表に出てきましたよ。 x64サポートされてますよ。 Vis未サポートですよ。
102 :
デフォルトの名無しさん :2007/12/08(土) 12:30:19
ゲフォ8kって、AGPは無くてPCI-eに移行しないといけない のな。すると連動してS-ATAに移行させられてdebian系が 起動しない罠。 FreeBSDでCUDAしたい…。
>debian系が 起動しない罠。 いつの時代の人?
woodyでも使ってんのかね
vistaだとランタイムたりねぇって怒られる・・
べつにハード的な統合は一番最後で構わんのだし CALとBrook+が出たことで、今後将来的なAMD GPUでもサポートされる 今はこっちを一般的にするほうが課題だな
次世代(nVIDIA、AMDどっちでも良い)は、奮発して高いGPU買いたいよね。
あけおめ、CUDAのWorldCommunityGrid Boincクライアント用のアプリを誰か書いてくれ
113 :
デフォルトの名無しさん :2008/02/05(火) 09:17:50
流れが止まったな
今だから聞きたいんだが、 お前らAMDとNvidiaのどっちが優れている、又はスタンダードになると思う? GPUのシェーダー性能はAMDが優れていて、開発環境としてはNvidiaのCUDAのほうが普及している。 DX10.1対応で先行しているAMD、今度Phsixを買収するNvidia。 ぱっと見、抜きつ抜かれつでいい勝負しているように見えるが、どうなんだろうか。
犬VidiaがCPUも開発すれば良いよ。 犬糞動けば良いんだからさ。
ゲーム屋からみると、開発リソースはnVidiaが勝っているように思えるな。 結局今は様子見しかない。 GPGPU か、 hyper parallel coprocessor かは、先が見えるまでに何年もかかるんじゃない?
extern __shared__ int shared[]; でsharedメモリを使えますが、複数の配列を使いたい場合はどのようにすればよいのでしょうか?
もうさ、GPUを直接プログラミングしたほうが早くね?
公開されていれば…
いや、こんなしょぼいの公開されてもやる気茄子
結局ハード仕様書がないことにはAPIの速度は測れても どの部分がどの程度動くかを定量的に測るのは難しいってことだろう。
GPGPUの研究ってどこの機関が一番進んでるの? 企業名とか機関名とか教えて 大学でGPGPUやってたけど大学レベルはどこもダメだった
駄目ならむしろチャンスなんじゃないのか。 設備的にもパソコン程度で済むものだし個人のアイデアレベルでも世界に出られるぜ、素養は必要だけどさ
cutCreateTimerなどタイマー関係のリファレンスってどこにあるの?
>>127 CUDAについては隔離スレがあるからそちらで。
cutなんちゃらはドキュメントが無かったと思うけど、大したことしていないからソースを読めばいいよ。
>>124 大学で結構真面目に取り組んでいるところもあるよ。
今度産学共同でやることになるかもしれないから名前は出さないけど。
普通にstanfordが一番進んでるだろ
AMD(旧ATI)のカードは何でプログラムを書けばいいの?CUDAみたいのはないの?
CALとBrook+を使うんじゃないかな?
GeForce 9600 GTは64ビット計算できますか?
出来ません
改良するんじゃなかったっけ?
口先だけのfudです
FireStreamは倍精度が使えるらしいけど、HD38x0で使えなきゃ意味がないよな。
意外かもしれないが、限定条件付で64ビット実数もCUDAで計算できる罠。 それはさておき、9600GTでCUDAが使えると言うアナウンスが未だないんですが。
あれ、両社とも倍精度実装するんじゃないんか? 現世代買わずに待ってたのに。
Brook+でdouble使おうとしたらストリームデータとしては使えませんと言われたよ。
それは「Brook+」とやらが対応していないと言うことだろ。GPUが対応しているかどうかとは別の問題だ。
>>128 灯台のK塚研?
あそこってK塚さんよりも、その他の学生・助手の天才が
GPUを扱ってるんでしょ?
あの大学の産学プロジェクトは、でかい花火をばーっと揚げて
中身が伴わないから好かん。
つーか、GPGPUやGPUを扱うためのTIPが少ない…
JAPANは当然だけど、海外の論文も上っ面だけで
いざ実装の部分がまったくない。
周りも聞けないのばっかだし、みんなどこで情報得てるんだ?
142 :
128 :2008/02/26(火) 23:44:10
>>141 どことは言えないけれど、そこじゃないよ。
どことは言わないけれどCUDAを使った高速化を商売にしている会社があるんだけど、
そこが組んだロジックよりも私が組んだロジックの方が速かったりする事実。
どこも苦労しているんだろうねぇ。
どこも暗中模索・切磋琢磨してるんだねぇ つーか大学の研究室じゃなくて 今、それをやってる研究者を知りたいわ 教授レベルじゃなくて、学生・ドクター・助手レベルで 論文も数が少ないし、ノウハウなんて個人が所有してるのしか無い 仲が悪くなれば、脱走して終了なんていくらでもあるしなぁ というか128のロジックをうpってくれw
144 :
128 :2008/02/27(水) 00:13:21
>>143 CUDAスレに、断片くらいなら載せてたかも知れず。
まぁ、落ち着いたら一般化できるノウハウはまとめるかも知れないけれど。
>>142 とあるシンポジウムに来ていたあの企業かしら…
146 :
128 :2008/02/28(木) 11:51:55
>>145 私のことなら違いますよん。なんせ私はシンポジウムに出てないし、
私のつとめる会社でCUDAをまともに使えるのは私だけだし。
これはwwwww
さて明日はCUDA祭ですね
なんで?
CUDA プログラミングガイドの日本語訳版が出たけど 急いで作ったんだなぁというのがよく分かるなこれ… とりあえず乙ということで
どこ?どこ?
ttp://www.sei.buaa.edu.cn/alta08/ Workshop on Architectures and Languages for Throughput Applications
Program Committee
Carmean Douglas Intel Corporation
Tom Conte North Carolina State University
Mike Houston AMD
Michael McCool RapidMind Inc.
Michael Garland Nvidia
Sun Chan Simplight Nanoelectronics
Xiaohua Shi Beihang University
カンファレンス行ってきました 受付のお姉さん方皆様綺麗でスタイル良くて大満足でした
宣伝しないと言ってましたがやっぱり少しだけ宣伝入ってましたね
宣伝は仕方ないかなって感じかなぁ vista対応はいつすんだ?の質問はわらた
158 :
デフォルトの名無しさん :2008/03/07(金) 04:23:49
マルチ・コアが非常に高いメモリ帯域幅によって動作されている状態で、今日のGPUはグラフィックスと非グラフィックス処理の両 方のための信じられないリソースを提案します。 なんじゃこりゃ
Mike Houstonか
誰かGeForce 9800 GX2買った?
えーと、8800GTS*2?
9600GTを買おうと思っている。 Geforce 9 って公式にはCUDAはまだサポートされていないけれど 使おうと思えば使えるの?
フォーラムには使えるような事が書いてあったきがす
俺は 9800GTX 狙い。 期待はずれな気もするけど・・・
G90世代を買うなら、8800GTか8800GTS(512MB)でいい希ガス。 そろそろ在庫処分だから値段も崩れると思うし。 と言うのも、夏にはG100世代が待っているからなんだけど。 プロセッサ数も然ることながら、倍精度も来るようだしね。
AMD Stream SDK v1.0 beta XP 32bit版/64bit版
168 :
デフォルトの名無しさん :2008/03/22(土) 16:14:34
>>166 それだと、ComputeCapabilityが1.0だろ
どうせなら、1.1のやつを選んだほうがいいよ
もうすぐ、1.5がでるという噂もあるけど
170 :
デフォルトの名無しさん :2008/03/23(日) 23:49:59
>>167 ソース、キボンヌ。
てかLinux版は無いの?
171 :
デフォルトの名無しさん :2008/03/24(月) 01:33:47
このスレの住人なら知っていますね、あの糞開発ツールのことを ・自分のプログラムのバグなのかコンパイラのバグなのかわからない ・他の仕事に応用できない糞開発ツールの独自世界を必死に学習している ・テキストエディタで書いたほうが効率的なのに糞UIツールを懸命に使っている ・糞開発ツールを批判すると「性格が悪いから糞ツールを批判するんだ」と言われる 糞だけど、政治的な理由で無理やり使わされているんですよね。 もう、あんな厨の作った糞ツールを我慢して使うのはやめましょう。 ・糞開発ツールを部下に押し付ける上司の命令は無視しましょう。 上司は糞開発ツールが使われる実績を作ることであの会社のごきげんをとっているのです。 ・糞開発ツールを使わせる上司の下では働けません、と上司の上司に直訴しましょう。 ・あの糞開発ツール提供会社には「おたくの糞開発ツールは話にならない」と突き放しましょう。 バグレポートなどしてはいけません。改善要求などもってのほかです。 あの会社はあなたたちのことをテスター/モルモットとしか思っていません。 ・あの会議で「糞開発ツールを使ったら生産性がxx%アップしました」 なんて話が出たら力強く机を叩き、会議室を出ましょう。 あの人たちは糞開発ツールをマンセーすることで立場を確保しているのです。 糞な開発ツールを糞だと言える、そんな当たり前の環境をみんなの力で取り戻しましょう。
知らんがな
マ板のコピペだろ。 統合開発環境なんて、どれもあてはまりまくりだが。
>>168 CUDAスレに載ってる一覧表参照。
少なくとも、8800GTは1.1。使用チップが同じと言う点からの類推で8800GTS(512MB)も同様。
# 8800GTSは、320MB/640MBがG80なのでそちらは1.0だから要注意。
1.5がもうすぐって言ってもなぁ。少なくとも数ヶ月は先な悪寒。
閑話休題、CUDAスレの件の一覧表見て、「手元の一覧表を更新できる♪」と思ったら
どうも内容に見覚えがある。出所はどう見ても私です。本当にありg(ry……(:;
Dominik の GPGPU tutorial 読んで重力相互作用シェーダ(fp40用)を書いたん だが、2つ問題があった。 * for { for { 相互作用計算 } } ループで 128 x 128 など大きな値にすると 途中で抜ける →各テクスチャブロック 64 x 64 ごとの ping-pong (swap) 技で解決 * ブロックを 4 x 4 = 16 回など swap を増やすと計算結果が変になる→ swap時 に glFinish() 待ちで解決 glFinish を glFlush に変えると全然だめだった。計算順序が守られてかつ glFlush みたいに軽い方法ないかな
ttp://folding.stanford.edu/English/FAQ-ATI2 > The client runs on all hardware supported by the AMD Compute Abstraction Layer (CAL),
> The client runs on Windows XP 32-bit/64-bit and Vista 32-bit/64-bit.
どうやらVista対応は間違いなさそうだ
radeonじゃ動かないかね?
2400以上なら動くよ
そういやR600向けFah来てたな
CAL1.00.2 beta、RV670で倍精度演算でけたよー
CUDA 2.0 beta来たね。Vistaで動いてるそうな。 CALもFAH GPU2でVista対応のDLLがおまけで付いて来るから これ使うと1.00.2 betaのサンプルが動いたりする。 両社ともあとは正式公開を待つばかりだ。 で、Linux版CALはまだですか? Catalyst来月号でfglrxが大きく変わるって話だけどこいつですかね?それともCrossFire?adlってなんぞー
CUDA2.0 for Linuxはドコー??
187 :
デフォルトの名無しさん :2008/04/21(月) 19:17:28
2.0になって何が新しくなったとか言うドキュメントはないの?
情報THX! CUDAスレにも転載させてもらいま。
AMD Stream SDK v1.0 ってドキュメントどこにあるの? 概念情報しか載ってなくて困ってる あとWindowsしか対応しとらんの?
> ってドキュメントどこにあるの? インストールしろ。まずはそれからだ。 > あとWindowsしか対応しとらんの? いまんとこそう。
>>191 何それって感じだなw
CUDAですら当初からLinuxサポートしてたのに
> CUDAですら CUDAとCTM以外になにかあったっけ?
GCC,spice
CTMのLinux版出すのか問い合わせたけど ドライバの問題で無理って回答を貰った 半年後はどうかと聞いたがそこまで先の ことは言えないっぽいw
CTMなんて、もう作ってないが?
良いスレsage
sage
199 :
デフォルトの名無しさん :2008/05/09(金) 15:48:49
AMDのStreamSDKをVista x64で使えたって人います?
Folding@HomeのGPUクライアントに付いて来るCALのDLL使えばいける
Linux版のSDKもそろそろ出るとさ
202 :
199 :2008/05/09(金) 18:23:54
Windows: V6 Beta GPU2 (ATI 26xx, 3xxx, and later) clients の 6.11 beta3を入れてみたけど dllファイルは一切なかったです。以前と変わったのかな… Stream SDKにあるサンプルをプロンプトで実行してみたんだけど、エラーは出ないのだけど 結果も何も出ないから実行できてるのかどうかよく分からない。
一度実行するとWUと一緒にDLLがダウンロードされる。 スタートメニューにデータフォルダへのショートカットがあるから開いてみ。
見つかりました。こんなところにあったとは… しかし、CALのlibフォルダにFolding@Homeのdllつっこんで AMDのデモ実行したらamdcalcl.dllが見つからないと言われちゃった。 (ってことは、ちゃんと今までは実行できていたってことか?) う〜ん難しいな〜 βだからこんなものなのだろうか…
それもセットでDLされてない? 俺がやった時はついてきたんだがな。
ああいや、付いて来てたのかな。 だとしたらamdcalclだけか、両方とも実行ファイルと同じ ディレクトリにたたき込んでみ
207 :
デフォルトの名無しさん :2008/05/11(日) 19:49:19
ノートPCでCUDAに向いてる機種って何? 浦島太郎なので、グラフィックchipの型番 とかワカンネ。 出張用に、軽くて携帯性と電池の持ちが良い 方が嬉しいけど。 あっ、もちろんLinux動くこと。
>>207 軽くて大きくなくて消費電力も少なめで、できればNVIDIAのGeForce8600MGS以上のVGAを搭載している機種。
>VGAを搭載している機種。 そんなスペック作ってネーヨ
VideoGraphicAdapterですね。
Acceleratorとも言う
212 :
199 :2008/05/12(月) 14:22:56
Folding@Homeのdllではなぜか駄目で元のsdkについてきたものに戻すと、 とりあえずエラーはでないみたいです。 VisualStudioでx64としてBrook+のGuideにあるサンプル(Sum.br)をコンパイルすることはできているのですが、 実行をしてもプロンプトが一瞬現れるだけでなんの結果も得られない状況です。 (他の元から入っているサンプルの.exeを実行しても同じ) printfの結果さえプロンプトに表示されていないので、どう見ても実行されていないように見えるのですが どうなんでしょうか…
プロンプトが一瞬現れるのなら、結果も一瞬現れているのではないか? ダブルクリックで起動せずに、コマンドプロンプトから実行してみては?
214 :
199 :2008/05/12(月) 14:40:22
コマプロ上からもやってみたのだけれど、一切のエラー・警告もなく静かに終わるんです。 Sum.br内のreturn 0; の前にprintf("test"); を入れてるのでちゃんと実行されてるなら 最低testが表示されるはずなのにされないんですよ。 ドウナッテルノ?
Brook+の中かCALの中でexitでも呼んでるんでしょ。 俺のやった方法は以下の通り 1.64ビット版Vista SP1をセットアップ,ドライバインストール 2.F@Hをインストール 3.F@Hを起動してamdcalrt.dll,amdcalcl.dllがDLされていることを確認したら終了する 4.適当にディレクトリを作成してXP64にインストールしたSDKからサンプルのバイナリ,Brook+のdllをコピー (VistaにSDKは入れてない) 5.F@Hのamdcalrt.dll,amdcalcl.dllもコピー 6.実行
216 :
199 :2008/05/12(月) 19:07:05
4.の(VistaにSDKは入れてない)というところが違う所ではあるのですが、 Vista x64 SP1にSDKをインストールして、後はそこから1〜6に沿ってやってみましたが 真っ黒なプロンプトが一瞬立ち上がるだけで前と変わらないみたいです。 (コマンドプロンプト上から実行しても同じ) 手詰まりなので、正式版でるまでしばらく待ってみます。 アドバイスして頂き、ありがとうございます。
>>216 多分SDKをインストールすると環境変数を頼りにSDKのdllを参照しに行かされてるんじゃないかなぁ。
コマンドプロンプトから
>set CALROOT=
>hoge.exe
でやってみたらいけそうな匂いがするけど。もしくはSDKの方のdllをリネームしておくとか。
あとはCatalystのバージョンくらいか。役に立てずすまんね。
218 :
199 :2008/05/12(月) 22:43:37
インストールフォルダのlib中にあるdllファイルをF@Hのものに置き換えると dllが見つからないというエラーがでるようになったので駄目な気がします。 >217 のようにしてプロンプトから実行してみましたがやはり駄目でした… Catalystは現最新の8.4なのですが、どうでしょう。 ちなみに、VisualStudio上から強引にCPUエミュレートでコードを走らせるように設定したら 想定どうりの動きをしたのでコードの間違いや.brファイルの変換までは問題ない と思われます。たぶん ムゥ〜
うーん、何で俺の環境だと動いてんだろ。むしろこっちがおかしいのか? なんか特別なことやったかなぁ。
>>214 問題の切り分けがヘタだな。
printf() だけなら表示されるのか?ダメならそれ以前の問題。
printf() を先頭に持っていって表示されるか?されないならちょっと面倒かも。
表示されるなら、printf() の位置を移動して、表示されなくなる境界を探すとその近辺に(間接的かもしれないが)問題がある。
221 :
199 :2008/05/13(火) 14:34:48
>220 printf()のみソースに記述した場合も変数宣言直後にprintf()をした場合ともに、状況は 変わらないようでした... CPUエミュの場合と、GPUの場合とでログをとってみました、こんな感じです。 CPU: Runtime::CreateInstance((null), 0000000000000000, 1) Brook Runtime starting up Runtime::Runtime() stream::stream(000000014001C228, ...) Runtime::GetInstance((null), 0000000000000000, 0) Runtime::GetInstanceRef() CPURuntime::CreateStream(1, 000000000027A360, 2, 000000000027A440, 0) CPUStream::CPUStream(1, 000000000027A360, 2, 000000000027A440) StreamInterface::getElementSize() CPUStream::getFieldCount() ........続く GPU: Runtime::CreateInstance((null), 0000000000000000, 1) Brook Runtime starting up CALRuntime::create(0000000000000000) Runtime::Runtime() CALRuntime::CALRuntime() CALContext::create(0000000000000000) CALContext::CALContext() CALContext::initialize(0000000000000000, 0) これだけ GPUの方は、初期化処理で止まってしまっていたので、やはり環境面で何かありそうな感じです。 CPUStream::getIndexedFieldType(0) getElementSize(1)
222 :
199 :2008/05/13(火) 14:38:46
>221 の下の2行はミスです。 ちなみに、GPUはRadeon HD3470を使っています。(Vista HomePremium x64 SP1)
brook+ってなんでLinuxじゃ使えないの?
Brook+のrelease-notes-mar-08.txtより > Compiler Support > ---------------- > > We only support Visual Studio 2005 (for Windows builds) and gcc 4.1.2 (for > Linux builds).
cudaはGeforce8xxx以上だよ 8系でオンボードチップってあるんかいな
何でこのご時世にMP3・・・ せめてAACにしろよ
コンテストってことは 最適化か何かかね めざせUS$5,000.00 と思ったら人種差別化ね Resident in the United States or Canada
>>226 オンボードかどうかは知らんが、GeForce8系を積んだノートPCなら腐るほどある。
>>227 既にhydrogenaudioのスレでも指摘されてるけど、LAMEで大半の時間を食ってるのは
ベクトル化の難しい心理音響解析であって、最適化の効果が大きいFFTやらMDCTではないんだよな
あまり最適化に向いた問題じゃない
>>226 8100と8200のチップセットが出たがな
233 :
デフォルトの名無しさん :2008/05/22(木) 23:17:04
月刊Catalyst2008年5月号では現行のAMD Stream SDK、F@HのCAL共に動きません。 気をつけましょう。
Catalyst腐りすぎ だんだんコード悪くなってる なぜNvidiaが金出してコンサル してやるって言うのに応諾しねーのよ?
Vistaじゃ動くそうだよ。 > だんだんコード悪くなってる お前はAMDの中の人なのか?w
fahはvistaだと問題ないな8.5は
AMD Stream SDK v1.1-betaきてた
Linuxまだ対応してねーよ もうAMDなんていらねーから 業界標準をCudaにしろ
Linux向けSDK公開されてますけど?
キターーー LinuxキタけどこれDebianはいらねーじゃん AMD shitだな
>>243 どうもありがとう
debian 4
ubuntu 7.10
ubuntu 8.04
knopix 最新版
この4つならとりあえずインストールまで行く
Xenの上でも動く?
debian用のパッチ作ったぉ だれもいらんよね
まぁ待て、煽るんじゃない。 でも俺も要らんわ。
要る
252 :
デフォルトの名無しさん :2008/05/27(火) 11:43:25
AMDの方言語って CUDAと比較して半端じゃなく 使い勝手悪くない?
いやゼンゼン
言語はAMDが作った仕様ってわけじゃないんだよな
AMDの奴ってなんていうか 学生向け言語って感じで 実用性まったくない言語 になってるね もともとが学生向けのおもちゃ 言語をベースにしているのが原因かもしれないけど
同じ問題を解いた時ほぼ100% CUDAに負けるね Radeon 3870と Geforce 9800GTXでやってるけど Radeon遅すぎてお話にならない
必死な奴が常駐してるな
N社の工作員なの?
こんなとこでやっても見てるやつがどれだけいることやら・・
価格帯違うGPUで比べたらそりゃ遅いわな
CUDAとAMDのSDKってどっちが 簡単ですか? OpenMPみたいにらくらくにできますか?
AMD Stream SDKのv1.1betaって登録しないと落とせないの? 不便だなぁ
は?
普通に落とせるよ
普通に落とせるよ
>>262 OpenMPが楽だと思うのなら、CUDAへの移植も楽だと思うよ。
チューニングしだすと面倒だけど。
>>268 そうなんですか
再来週Radeonを買い付けにいくので
AMDの方の使い勝手も知りたいのですが
どうなんでしょうか?
CALを生で使う根性があればAMDの方は自由度高いし面白いと思うよ。 グローバルバッファとか使えるし、適用できる問題の幅も広い。 ただCAL側のリソースをテクスチャにしたり頂点バッファにするみたいな DirectXやOpenGLとの協調はまだ未実装だから、完全に計算しか出来ないけど。 Brook+ははっきり言ってまだ使い物にならない。CPUコード吐かせると 数値リテラルが全部floatになって生成されたcppファイルがコンパイルできないとか。 CALコードだけにすればまぁ何とか使えなくもないけど、CUDAの方が実用的。
>>270 CALちょっといじったことあるけど
あれ使うのは大変だったなぁ
Brook+はやっぱダメなのかぁ。上に
釣りで学生のおもちゃとか書いてあったけど
どうやら本当なんだね
まぁ機能すらフルに実装されていないβVerだから速度に期待するのは酷だね
速度やバグあるのはまぁCUDAも 0.xxxははんぱねぇw状態だったから 別段いいんだけど Brook+の自由度がどの程度なのか いまいち図りきれないのが残念 すぐコンパイルエラーばっかり
>>271 まぁちと言い過ぎだけどね。
言語としてはシンプルでそれほど悪いわけじゃないし(でも3DAPIと協調するときどーすんだって気はする。ドキュメントにすら記載ないし)
CALコードだけならとりあえず動くコードは吐いてくれる。遅いけど。
v1.1-betaなんてバージョンにしちゃったから印象が悪いわけで、実際のところは熟成待ち。
>>373 秋葉原で3850が1万チョイって話もあるし、とりあえず3xxx1枚買ってbrcc -p calオススヌ。
CALバックエンドなCUDAコンパイラを誰かが作ってくれないもんかねぇ
おっと、書き込んでから思い出した。 ドキュメントにはないけどVC用のusertype.datにこんな文字列があったんだった。 streamToD3D streamFromD3D streamToGL streamFromGL 一応Brook+と3DAPIのやり取りを実装する気ではいる様だ。いつになるか知らないけどw
>>274 今買うより10日に新板でるからそれ
待ってから買った方がいいと思ってます。
4850は18日
ときに次のPhotoshopがGPU使うそうですが。
みんなCUDAで200Wとか280W 電力消費すれよw
>>279 β版の開発環境でプラグイン作るなんてAdobeもATiも迷惑だろ
CUDAは上位互換が保障されてます
CUDAは全ての変更が上位と将来版で 継承されることが保障されている Computexで聞いてきたがAMDの方は 1.5からまた全く違う内容になる。 CLIの実装方式が変更されるから意味 ないんだよな
つまり大幅なハードの変更がある訳かね?
また変な改行の人か
この流れでいくとCUDAが圧勝するわけだけど そうなると当然対応ソフトの多さによってnVidiaカードのシェアが伸びる 下手すれば完全に独占してしまうかもしれない AMDはCUDAに対応させるために改造するのだろうか そうなるとnVidiaがすべての仕様をこれから先ずっと作っていくことになってしまう 使い勝手の悪いものが出来たり、上位互換を自分勝手に切り捨てたりするかもしれん ISOのような公式な機関が介入出来る情勢でもないし 混沌としてきそうで嫌だね 洗練された仕様がどのメーカーのVGAでも一様に動作するというのが ユーザーとしては最も望ましいわけだけど このままだとそれは永遠に無いかもね
>>286 いやそれは無い。もう、Intel互換のチプセトも
AMD互換のチプセトも作らせて貰えない可能性
高い。本業のグラボも1のつの巨大コアで全部
ぶん回す旧世代のアーキテクチャだよ
弱ったら買い叩かれるのがオチだよ
だから今余裕のあるうちに逃げ道を探して奔走してる訳だね
>本業のグラボも1のつの巨大コアで全部 >ぶん回す旧世代のアーキテクチャだよ 新世代のアーキテクチャのグラボはどれですか?
Streaming Computing用途の性能なら 単精度で2倍あるはずだしな。
Stream SDKは1.0β→1.1βまで2か月しか掛かってないし、 4870X2が出る予定の8月までには完成できるんじゃないかな
4870X2ってただのCrossFire接続だろ? 新世代なんて程のもんじゃ無いな。
>>293 1枚の板に2つのGPUコア
ただのCrossFire接続だったら誰だって4870やGTX280を2枚買うわw
いや、ただのCrossFireだって・・・ 二重にメモリ積んでるし。
>>295 メモリ共有でソフト側からは1GPU扱いという話だったが、
メモリ2枚積みのソースは?
俺らでCLIの開発してやるから ATI仕様さらせよ 今Linux版解析してるが 実装がヒドイこれやばいだろってもんじゃないなぁ
800SPの1.2Tflopsだってさ4870 あと4870X2がオンボードCFなのかどうかは不明 PLXじゃない専用ブリッジを乗せるとのうわさもある
>>300 それあってねーよ騙されるな
おめぇ一度自作板に勉強しに来いよ
つまり今まで一番もっともらしく出回ってた 480SPってのが単なる妄想スペックだったわけだ
実製品のFLOPSが妄想スペックを20%近く上回るとか… 逆にこっちの方がフェイクじゃないかと思ってしまうな
フェイクだったりして
4850とりあえずもう予約したから 初日にベンチしてやるから 何やってほしいか晒せ
308 :
デフォルトの名無しさん :2008/06/07(土) 21:13:07
>>302 よくここまで仕様を隠し通してたなw
NVIDIAの方がとっくに発表されてたのに
まぁ、フェイクとしても4870はいずれ1Tflops超えか
AでもNでもどっちでもいいからはよH.264エンコーダ作ってクレー
どうでもいいけどラデはム板的に意味なし
CALがあるじゃない
いっこうにCALの話題が無いw 誰かが試したという報告すら聞かない CUDAはかなり普及してきてる
ところでDX10はストリーム演算が出来るとか聞くけど サンプルとかぜんぜん見当たらないんだけど DX9と比較して何がどう違うの? DX10を使ったフレームワークとかあるの?
4870X2のCFで4.8Tflopsとかわけわかんねぇ パフォーマンス
X2で1.2TF 48レーンのPCI-EXってかなり 限定されるな
いや、多分そうはならない
CALのドキュメントどれ読めばいいの?
ProgrammingGuide.pdfとcal_platform_spec.pdfとil.pdf
Linuxはどうなるのさ?
何そのいらない子
結局11が出るまで何も普及しないし実験に付き合わされただけかw
ATIの10.1とかもう何の為にあるのかさえ分からんw ATI詐欺にまた引っかかったなそこの君www
Windowsの方がどんな場合でも 処理性能300%上なのになぜ Linuxなんて存在するんだろう
OpenCLってどうよ?
>>325 きみはビル・ゲイツの処理能力の0.0000000000000000000000000001%なのに
同じ人間として存在してるほうが不思議だろ。
10.1は知らんけど、Stream SDKが死産になりそうな感じではあるな
Intelの奴が2009年の始めにでるけど それは1枚のカードで4TFらしいね
Intel()笑
なんだその関数
void intel() { delete palestinian; }
AMDはhavokか
またAMD詐欺か
どうでもいいがこのまま消費電力増え続けると地球と家計が爆発するぞ
詐欺も何もCCCにはR600のころから物理処理に関するヘルプが入っていて havokがintelに買収されてから延々と活かされないままになっていた
俺のRadeon4870がねぇええええ 悪SKせいだ
343 :
デフォルトの名無しさん :2008/06/12(木) 22:46:01
vistaにcuda2.0入れてサンプルを試しているんだけど simpleD3Dでコンパイルエラーが起きます。 エラーメッセージは以下です。 1>------ ビルド開始: プロジェクト: simpleD3D9, 構成: Debug Win32 ------ 1>カスタム ビルド ステップを実行しています。 1>simpleD3D9_kernel.cu 1>C:\Program Files\Microsoft SDKs\Windows\v6.0\Include\winnt.h(11241): warning: 1> expression has no effect 1>C:\Program Files\Microsoft SDKs\Windows\v6.0\Include\winnt.h(12857): warning: 1> expression has no effect 1>C:\Program Files\Microsoft SDKs\Windows\v6.0\Include\objbase.h(240): error: 1> identifier "IUnknown" is undefined 1>1 error detected in the compilation of "C:\Users\ookawara\AppData\Local\Temp/tmpxft_000016a8_00000000-6_simpleD3D9_kernel.cpp1.ii". 1>ビルドログは "file://c:\Program Files\NVIDIA Corporation\NVIDIA CUDA SDK\projects\simpleD3D9\Debug\BuildLog.htm" に保存されました。 1>simpleD3D9 - エラー 1、警告 2 ========== ビルド: 0 正常終了、1 失敗、0 更新、0 スキップ ========== 誰か教えてください。
>>343 まさかとは思うが、VC6なんぞを使ってはいないだろうな。つーか、CUDAスレに逝け。
割れ物のVSだとなるようなw おっといけね
>>344 、345
vs2005expressです。
>>346 だから、ちゃんと隔離用に作ってあるんだからCUDAスレに逝け。
TESLA、Firestreamといったボードは、3DCGでレンダーファームとして今すぐに利用できるのでしょうか?
AMDのHD4850が2万5千円だって ゲフォの次のやつは7万円だって CUDAの一人勝ちかと思ったけどそうでもないかもw
HavokがAMD対応を発表しててFireStream 9250が第3四半期… その頃にはさすがにSDKもβが取れてるだろうからどうなるか分からんね Photoshop CS4も10月頃だから年内にRadeon対応ソフトが現れたらそれほど差は付かない
まぁ、安いのはいいことだよなぁ 貧乏学生多そうだしな!w
値段はともかく発熱量を下げてもらわんと、 ラック当たりの計算量が上がらない。
FireStream 9250は値段半額で発熱同じ、性能2倍じゃん
ゲロビディア氏ね
GPU2 6.12 beta 6 for ATIに付いて来るCALランタイムで 今までのドキュメントとは異なるDirectX協調用拡張関数確認。 calD3D9UnmapTexture calD3D9MapTexture calD3D9UnmapVertexBuffer calD3D9MapVertexBuffer calD3D9Associate(これは今まで通り) 引数が判らないしDisassociateはどうしたとツッコミ入れたいけど、とりあえず実装したみたい。
http://pc.watch.impress.co.jp/docs/2008/0620/kurouto.htm RadeonHD 4850/4870 22,980円/34,980円
6月20日より順次発売
RadeonHD 4870
160sp * 2issue * 750MHz = 240GFLOPS
RadeonHD 4850/FireStream 9250
160sp * 2issue * 625MHz = 200GFLOPS
Tesla C1060
30sp * 2issue * 1500MHz = 90GFLOPS
GeForceGTX 280
30sp * 2issue * 1296MHz = 78GFLOPS
GeForceGTX 260
24sp * 2issue * 1242MHz = 60GFLOPS
何その変な計算
謎だな つーか、800SPだよな
倍精度だろ
単精度で800だよ
だから
>>358 の算式は倍精度のパフォーマンス出す式だろ
PowerDirectorがAMDのビデオカードに対応するらしいから、モノ自体はあるんだろうけどね 開発環境も早く公開してくれるといいなぁ、倍精度考えると性能は段違いなんだから
CALのIL.PDFもってる人どこか うぷっていただけませんか? リンク切れててとれない
SDKに入ってるからインスコしろ。
>>367 そうなのかありがとう
ちょっとRadeon4850もう2枚買ってくる
CALのためだけに Radeon4850買ってきますた
マゾだなぁ
ふひひwありがと
AMDの奴って専用ドライバ入れないと開発できないんだな めんどいな Nvidiaは別になんもいらんのにしょぼい
逆ですよ。
CALってなんで ATI Catalyst? 8.6では動かないの?
しかもCALってドキュメント全部VisualStudio用なんだな やる気なさ杉だな AMDつぶれねーかなぁまじで
しかもCALのILドキュメントの記法がISOの 記述を遵守していない。ここの会社はドキュメントの 書き方もしらんのか?
このスレ監視してるラデ房うぜーなぁ ほんとATIの奴等ってキモイ
元NDIVIAユーザーですが、なんだか情けなくてしょうがない。 そんなに必死になるなよ。 考えが偏ってて、客観的に見て痛いぞ。 性能の良い製品を使えばいい。ただそれだけ。
下らんアオリしてないでプログラムの話しろよ
>>380 どこが?
AMDつぶれろとか言ってる人よかマシじゃない?
考えが偏ってるからそんなことしか言えないんじゃない?w
宗教レベルな信者ですね。考えが偏るわけですね、わかります。
本当にnVidia工作員は醜いな 自作PC板以外のスレを荒らす前に小売店の損失を補償してやれ
>>384 良いこと言った。
ってかNVIDIA工作員マジUZEEEE
性能が良く、コストパフォーマンスの取れるグラボを買うべきだろ?ふつうならな。
現状のNDIVIAで2.6万以下で4850よか良い製品俺に勧めてくれ。
>>385 9800GTX+来週買えばいいだろボケw
以後荒らしと工作員はスルーで
>>386 予価30K超える訳だが?
IDつけばNG出来るのに、ほんと工作員ウザイな
>>388 ゆとりちょっと消えてくれないか?
平行輸入品が26980円だが?
PCショップに勤めてるから、9800GTX+も9800GTXも刺して動かしたよ。 もうNVIDIA内で自爆するような製品の出し合いやめれw 一応感想だけど、9800GTX+は9800GTXとそんなにベンチマークしても思ってた通り、すばらしくなかった その点値段的にも性能的にも4850は良かった。ファンだけ交換すれば申し分ないかな。 NVIDIAさん、店が損した分返してください
>>390 つーか自作板から流れてくるなよ屑どもが
cal_platofrm_spec.pdfが24ページしか無い件についてw さすが半導体メーカの中でもっとも屑と言われたAMDの 仕事ですねw
GT200がコケたせいで、まだ正式リリースされていない開発環境の ドキュメントに不備があると叩かなきゃならないほどに追い詰められてんのか…
いろいろなスレ見ちゃ悪いのか? 良い製品が違うメーカーから出て嫉妬してんじゃねーよ。 ATIをそんなに罵倒したいならNVIDIAがもっと良い製品出せよw それからだなw じゃあな
GPGPU的にはATIは無いわwww
>>393 CALなんて絶対正式版リリースできないでしょう
CUDAは前回のバージョンから半年以内に2.0Βがでた
しかもその完成度はものすごいのに
まぁAMDは技術力ないから無理だろうけどねぇw
次はGT200+ですね、判ります。
4850がコスパや3D性能的に良いようだから、ATiのGPGPU環境とやらのドキュメントちょっと見てみたがなんか分かりづらいな Brook+のドキュメントにのってるサンプルコード見た感じじゃ、まだシェーダ言語から脱却し切れてないようだし 演算器がVLIWってのもな。最適化面倒くせえぞあれ 個人的にはATi好きだし頑張って欲しいんだが、GPGPUとしてはまだ当分nVidia一択だな
いままでのNVIDIAの実力 昔:ATI新製品高性能→ゲフォ性能更新→ATIすぐ負ける 現在:ゲフォ新製品→ゲフォマイナーチェンジ(9800GTX+)で自爆→4850トドメ→ゲフォ新製品→ATIがまた出してゲフォ死亡
>>399 違うよ、AMD2万ドル、Adobe出資0で共同開発しているから
出してるだけ。まじな話Adobeの開発者が対応したのは
CUDAだけ、CALは金もらったからやるっていってるだけ
で対応するとはAdobe自身から一切発表は無い
2週間前だったらGPGPUはnVidiaの圧勝だろうと胸を張って言えたけど、 ここに来てAdobeのAMD製GPU対応とnVidiaの自爆が重なってどうなるか分からない模様になってきたな… 少なくとも信者論争とは無関係のスレで 他社製品を執拗に叩くのを営業戦略と勘違いしてる所は負けるだろうけど
>>399 まぁAdobeの事だし、どっちにもだすんじゃないか
それに開発環境はともかくとして、現状のGPU市場はnVidia/ATiの二強なんだし
ATiのに対応しないってのはさすがにデメリットがでかい
>>375 動くよ
>>376 VCに依存してないドキュメントの方が多いよ
>>377 ISOの記法って何?バックエンドでしかないCALをISOに承認させるわけ?
>>392 1ページ1関数のCudaReferenceManual.pdfを詰めて、3DAPIとの協調用関数をなくして、
ILの機能にあたる部分を削除して、CALでは分ける必要のない関数をまとめれば似たようなものになるね。
>>403 AdobeのnVidia対応はとっくに既出だよ
AMDのStreamSDKはまだ完成してないし、
このままCUDAが標準化するんじゃないか?と思われていた矢先にこの発表
2万ドルももらって出しませんとは本当でも言えんよな ほんとうAMDってなりふりかまわず汚いですね
>>405 Adobeが対応するからといって、CUDAの優位は揺るがないだろw
確かにATiのはまだβ段階でしかないが、それを差し引いてもちょっと使いづらい
まぁ使う側としてはどっちでもいいからとっとと統一して貰いたいもんだが
トランスレーター作るっていうのでもいいけど
プログラマーが環境を選ぶんじゃなくて、 与えられた環境で組むのがプログラマーだろ それを理解できないからと言ってだだをこねるのはタダの無能
お前ら自作板から援軍派兵するのやめろよw
>>407 CALは史上最悪の出来だぞ?
ハードの性能もベンチのみで実際のゲームはまともに
動作しないしな
nVidiaが勝てるように作られたVantageで負けちゃ世話無いわな
>>398 Brook+はBrookGPUをちょっと改造しただけの代物だから使いにくいよ。
未実装な部分が残ってたりでコンパイラがASSERTで落ちたりする。OpenCLが出ればそっちに統一でしょ。
VLIWはHLSLコンパイラの蓄積があるから差ほど大変じゃない。
今はBrook+ -> 独自拡張版HLSL -> CAL ILでコンパイルしてる。
>>401 Adobeからの「発表」であればCUDAを使うとは一言もなかったりする。
単にデモでGeForceを使っていて多分CUDAで書いたんだろうというだけ。
後はNVIDIAからの発表。
>>410 CALを使ったゲームが実際にあるなら教えてくれ。
OpenCLはAMD不参加だし Intelから絶対参加することは認めないと 通告されてるしなw まぁ捏造ベンチで喜ぶラデ房は本当おめでたいよw
頼みの綱はうんこCUDAだけか
>>415 嘘じゃねーだろ、ATIのときの失敗で
Appleから未だに無視され続けてるの知らないのか?
IntelとAppleから絶対に参加させないって言われてるんだぞ?
妄想もココまでくると病気だな
>>416 ATiが嫌いなのはよく分かったから、後は日記帳にでも妄想書いとけ
Intel の誰が,Apple のどんな立場の人間がそんなこと言ってるんだ?w
>>416 クロノスに投げてオープン規格目指してるのに拒否とかw
クロノスのプレスリリースでちゃんとIntelもAMDもNVIDIAもワーキンググループ入ってますよ。
今のMACに搭載されているVGA調べてみろ どっちのVGAが載ってる?ん?
ここはム板なので、それ以上は自作PC板でやってくれ。 まぁ、元々プログラミングの話なんてほとんど出てないけどな。
CALなんてそもそも存在しないし
CUDA最強だなやっぱりCALなんてゴミもいいところ 所詮ATiの残党が作ったゴミ
理解もすごい進むしいい資料だ
ああ、誤訳だらけで鬱になれるね。 英語版を訳しながら読む方が未だましだし、それも前提となる知識があってのことだ。 それでも、ないよりはずっと有り難いのだけれどね。
>>429 >428のようにまともに日本語も扱えないような香具師には読んだ積もりになれるという点で丁度いいのだろ。
「エラー!ブックマークが定義されていません。」が多すぎてワロタ こりゃAMDどころかどこも真似できんわw これで正式版wwwww
>>427 更新されたよ。ちょっと前まではフォーラムへのリンクだけだった。
>>431 NVIDIAの日本語PDFにはよくあること。
どうせOpenCLになるんだろうし、どっちでもよかろうに・・・ 今の乱立状態がユーザーにとってもデメリットしかないってのは確かなんだから 歓迎すべき事だと思うんだけどなぁ、各社の参加は
「OpenCLにはMicrosoftが加わっていない」 「DirectX11でGPGPUをサポートするらしい」 とかでOpenCLはOpenGLみたいな立場になるとか言われてるみたいd
問題は現状のリソースがそのまま利用出来るのか 買い替えが必要なのかだな
Microsoftは独自にDirectX用のCLを作るよ OpenGLみたいに誰も使わない規格を使う 理由がないからねぇ
Radeonの存在意義も解らないよね?
ID出ない板だとほんと特定個人が暴れ放題だな… そんなに必死になっても現実はNVのシェアが落ちていく一方ですよっと
>>438 FUD流して何面白いの?頭おかしいにもほどがあるな
これだからATI厨は困る・・・ 捏造までして叩くのか・・・
アチは本当すぐ捏造するしねぇ チートドライバ作り出すし
おまいら頼むから自作板のvsスレでやってください。
ベンチスコアは捏造。ドライバは糞。字も書けない。 ATI最悪!
>>442 俺らは悪くないニダ
悪いのはAMDニダ
Nvidiaさん、ボイド復帰型何よこれ?
>>444 当たり前だろ
ATIが4000シリーズを出さなきゃ、9800シリーズの値下げもなかった。
消費者もショップも被害はなかった。全てATIが原因。
nVidia工作員を装ったATi信者を装ったnVidia工作員を装ったATi信者を装った…(ry 以下無限ループ
ここの人間にとっては、描画性能では明らかに劣っているnVIDIAのカードが 描画性能相応に暴落してくれる、というのは非常にありがたい状況だな。 市販のHD 4xxxは倍精度演算を殺してるし、開発環境もnVIDIAの方が整っている。 他の板ではどんどんnVIDIAを叩いてほしい。 が、ここでは邪魔だから止めてね。
GPUで整数演算がしたいです。
整数演算ってどうやってするの?
別にnVIDIAの話は専用にスレあるからここではいくら暴れてくれも平気だよ
>>453 それRV670でも同じこと言われてたけど、結局FireStream化どころか何もせずにHD3xxxで倍精度演算できるよ。
456 :
455 :2008/06/28(土) 12:59:07
GTX280ってあんだけ高いのに8800GTより性能低いのか… 買う価値無いな
その記事の誤差のところのHD3650どうなってるんだろ? これって繰り返し計算の累積誤差じゃなくて、1回計算しただけの誤差かな? 赤と緑のグラフの意味もその記事じゃ分からんな。 (ググってみたら最大誤差と平均誤差らしい) AMDがGPGPUに消極的だったのは、この辺が関係してそうだね。
とりあえずGeforce最強これは紛れも無い事実 そしてRadeonは捏造ベンチ+精度落とした偽造 ドライバ利用が確定した
とりあえず GPGPUやってない奴は消えろ
やってるよー 倍精度も計算できない糞Radeonなんて使いませんがwwww
だから出来るってば。
できねーよ。ソース出してみろやw 嘘つくのやめてほしいなぁ
ほら出てこないw
出来ないソースを出す方が先だろ
画像なんて合成できるしねぇ おっと用事思い出した
はいさようなら。邪魔だからもう来なくていいよ。
これfloatで出してるだけじゃねーかw 危うく騙されるところだった
は?
そのうさんくせーサンプルで小数点7桁まで 出してみろやwでねーだろ?謝っちまえよ?
> そのうさんくせーサンプルで小数点7桁まで ソース読んだのならツッコミどころ間違ってると思うよ。
久しぶりに声出して笑えた ありがとう
>>475 printfの内容は%fじゃないよな?
これだからNV厨はダメだね
CAL書きやすくね?とか思う俺は変態?
バイナリアンか何かですか?
まあどうせDX11までGPGPUは日陰の存在
焼き直しで古い論文実装するだけで 予算も付くし美味しいんだけどね
484 :
デフォルトの名無しさん :2008/06/29(日) 01:38:29
画像処理目的でAMDのStream SDKを触り始めたんだけど 1ピクセル=8ビット でWidth x Heightみたいなデータを扱う事って出来ないのかな?? なんかBrook+を使う時点で32ビット縛りで、CALを見てみたら非常に難しくて・・・
Cg≒HLSL見たいに上手く良くか
intelが横槍入れそうだな
Nvidiaの最高経営責任者(CEO)であるJen-Hsun Huang氏は先週インタビューで、
AppleにはWWDCを盛り上げるための一環として、NvidiaのCUDAテクノロジに関する計画があるかもしれないことを示唆した。
Huang氏は、「AppleはCUDAについて熟知している」と述べ、
同社が、Macでのグラフィックスチップの活用をより簡単にするため、
このNvidiaの技術を正式に採用する準備が整っている可能性を示唆した。
Appleは同技術を実装する際、「CUDAとは呼ばず、別の呼び名を付けるだろう」とHuang氏は、
4日にNvidiaの本社で行われたインタビューで述べた。
http://japan.cnet.com/news/ent/story/0,2000056022,20374870,00.htm Apple社,「Mac OS X」の次期バージョン「Snow Leopard」も公開,GPGPUに対応へ
GPUで汎用計算を行うアプリケーション・ソフトウエアの開発には,
C言語を拡張した新しい言語「OpenCL(open computing language)」を利用する。
http://techon.nikkeibp.co.jp/article/NEWS/20080610/153055/ Khronos Groupが「Compute Working Group」を設置,メーカー非依存のGPGPUを目指す
Khronos Groupは既に米Apple Inc.が,さまざまな用途でGPUとマイクロプロセサの
計算資源を活用するためのC言語に基づくプログラミング言語
「Open Computing Language(OpenCL)」を提案済みであることを明らかにした。
http://techon.nikkeibp.co.jp/article/NEWS/20080617/153397/ ハードウェアベンダーと繋がり無くGPGPU対応は難しいから
MS単独で変な言語作ることはないだろう
AMDはOpenCLをバックアップしてるから
あとはCtを提唱してるintelがどうなるかだけ
MSがintelと組んだらややこしくなる
IntelはLarrabeeでMSと組んで汎用GPU言語作るだろ IntelもMSもOpenなんちゃらって儲けが薄くならないと やらないし
このスレ住人にとっては驚きの週末だなぁ。
急に沸いてきたな
Folding@HomeのGPU版をしている人居ます? PS3の280GTXは6倍以上をこなしているようですが。 ベータ版が公開されているが時間がなくてまだ何もしていない(困った。)
>>485 噂レベルだけどMSは.NET上に
GPU用のIL言語構築するみたい
JATで最適化かけて走らせるイメージを
持っているみたいだよ。
基本的に今のワーキンググループとは
まったく発想がことなってるらしいね
>>491 MSの講習会とかでJIT関係やってる人に
話聞いてみなよ教えてくれる人もいるから
CALでreduction bufferってどう使うの? scratch bufferは名前だけはドキュメントに載ってるし サンプルみるとdcl_indexed_temp_arrayでx#っぽいけど、 reduction bufferはさっぱりわからん。ISAで書かないと無理?
brccのコードでreductionFactorってあるけどあれが 何吐くか見てみれば?
Brook+のreductionってreduction buffer使ってないんだよ。 だから参考にならないんだ。
>>495 じゃあ自分で書くしかないよ
BBS見てみるといいよreductionで検索かけて
497 :
デフォルトの名無しさん :2008/06/30(月) 23:44:51
brookのscatter/gatherの使いどころが判らないんだけど、誰か詳しい人いますか?
>>497 今がんばって勉強してるから一緒に勉強しないかい?
>>498 ここで日本語のログ置いとくと後々、参照する時楽なんで一緒に勉強&情報交換できると助かります。
私はとりあえず付属のBrook周りのドキュメントは読んだんですが。。。
今までになく最悪な英語でムキーってなってるところです。
>>499 じゃあ何かおいておきます
こっちは、Linux上のクライアント+Radeon 4870
WindowsXP64bit + Radeon 3870で開発を始めてみました。
現在、付属のヘッダやサンプルなどの解析をかけているところです。
CALランタイムってVistaじゃ完全に使えないの? サンプルを実行したら初期化エラーが出るんだが 今更XP64を入れる気にはならんし…
fahについてくるやつは?
>>503 俺のところはこんな感じ
Locking assertion failure. Backtrace:
#0 /usr/lib/libxcb-xlib.so.0 [0xb751e767]
#1 /usr/lib/libxcb-xlib.so.0(xcb_xlib_lock+0x2e) [0xb751e81e]
#2 /usr/lib/libX11.so.6 [0xb7562518]
#3 /usr/lib/libX11.so.6(XFreeGC+0x26) [0xb753e9d6]
Avail Local RAM 488MB
Avail Uncached Remove RAM 114MB
Avail Cached Remove RAM 59MB
Local GPU RAM 512 MB
Uncached Remote RAM 191 MB
Cached Remote RAM 59 MB
GPU Clock 337 MHz
Memory 625 MHz
Wavefront 64
SIMD 10
Double Precision Artithmetic : YES
Reserved1 : YES
Reserved2 : NO
Reserved3 : YES
Reserved4 : YES
MemExport : YES
Device Type : R770
Maximum width of one-dimensional resource 8192
Maximum width of two-dimensional resource 8192
Maximum height above rail level of two-dimensional resource 8192
The system has one device
CAL Runtime version 1.1.1
>>504 そういえばLinuxで試すの忘れてました。
それ何で表示させてるんですか?
>>503 CALdeviceattribsのengineClockとmemoryClockの
表示逆じゃないかな?俺が違う?
あーしまった。CALdevicestatusをリアルタイム更新できるように弄った名残がそのままでした。 お目汚し失礼。
>>508 calExtGetVersionの返り値の解釈ってこれでいいの?
一応calExtSupportedはOKを返してるみたいだけど
>>510 PDFには両方共にCAL_RESULT_NOT_SUPPORTは拡張非対応って記述があるんで困り者です。
実際に帰ってくるバージョンは0.0だし、果たしてどう解釈するべきやら。
>>511 googleでCAL_EXT_D3D9を検索すると
現状未サポートみたいだよ
ただ、関数だけ実装してあって空の結果が
返ってきているみたいだよ
売ってることに驚いた
>>513 年間3億、計15億で浪費した駄作と
RadeonやGeforce比べるなよw
重力多体以外解けるというが微妙だぞ高いし
GPUなら単年度予算で備品扱いで買えるけど
これはそうもいかんだろ
>>516 そんなどこぞのチラ裏日記見せられてもw
>>516 牧野は8800が出たとき降参宣言してたはずだが。
GPUにしか興味ないんだからね
GPU Gems 3 日本語版 今週出るねでもやっぱ値段はるな
ここで聞いてみてもいいのか解らないんだが CALとBrook2つ存在する理由ってなんなのでしょうか
CAL = API Brook+ = オープンソース・フリーで提供される開発言語の1つ
>>521 .NET Frameworkも中間アセンブリを弄れるわけだが
AMDの中の人に なんでCAL作ってるのさ LLVMしろよゴルァってメールしたら めっさ怒られました。 AMDの中の人ごめんなさい
予算5万ドルじゃこれが限界だと思うけどね
CALってCUDAと比べて10倍以上遅くね? 4870とGe8600が同じぐらいなんだが? 汎用処理は全然できないっぽいな
そりゃまぁ、グラフィックスに特化したVLIWだしな・・・ コンパイラの最適化でも限界がある罠。
chrome400に比べればみんな遅い
どこぞの糞CPUメーカみたいに 消費電力言い出す奴は大抵糞だw
はぁ?
今消費電力の事を語らないメーカーなんて存在するのかな
あMD
消費電力を一番問題だと思っているのは利用者だろ
つまり利用者のことを考えないメーカ?
48xxが出てから急にこのスレに必死な人が増えたね
不思議なことに、何か良い新製品が出ると、自分が偉くなった と思い込む変な人がいっぱい湧くよな。 不思議だ。
勝ち負けに興味ある人隔離スレとして機能してくれるならそれはそれで。
NV使っている奴よりATI使っている俺の方が偉い
ゲロビディアは小売店を潰そうと画策した糞会社だ
なんでGPGPUスレに沸くんだ
GPGPUでは、nVidiaがAMDに勝ってると思ってるんだろ。 いわゆる、語るに落ちるって奴w
実際ATIのVLIWは汎用処理では 遅くて使い物にならないけどね 理論値倍精度で500Gが4、5G程度しか でなくなっちゃうからねぇ まぁ3Dでは高速だがGPGPUではゴミだ
倍精度の理論値は短精度の1/5じゃないの? 倍精度だと倍精度積和+整数演算の組み合わせしかできないから VLIWコンパイラの不出来の所為で性能が落ちる部分は少ない。 整数演算使わなきゃ殆どスカラプロセッサだし。
あのー質問してもいいでつか?
>>551 いや、そんなことより俺の質問を聞いてくれ。
お兄ちゃんたちってどうして変な臭いがするの???
俺はおじさんだヴォケ
カレー臭がするのか
そうそう最近脱いだ服が臭くてな。
おや汁対策で、俺の服だけ別に洗濯機回されてる。
>>558 最近の洗剤なめんなw お前が嫌われてるだけだw
しかし、NL-MeansはCUDA遅くて使い物にならなかったみたいだね 得意不得意がハッキリしてて面白いね
ここでやるな、よそでやれ
正直nVidiaの超スカラプロセッサ化は、面白味に欠けるなぁ GPUはあくまでベクトルプロセッサであって欲しいが
>>563 超同意だけど、グラフィック用途でも粒度が細かくなりつつあるので仕方ないと思う。階層化シャドウマップとか、その半影とか、双半球環境マップとか。
今朝の日経産業新聞で読み仮名が「CUDA(クーダ)」だった。 彼らは専門知識が無くてもインタビューとかするだろうし、こっちが正しいんだよな?
>>566 大分まえからクーダだが。。今までなんて呼んでたの?
アニメのキャラみたいだな、クーちゃん
読み方ネタなんかでスレ消費するのはやめてくーださい
【審議拒否】
ヌーダだろ
クター
きゅうううううううううううううううううううううううううううううううううううううううううううううううううううううううううううううううだぁ だろ
Geodeじゃないんだから
管
/\ ,r‐''''" ~'~"''-、 〈 /,!,!,' ./, r‐i'i~'、 >,'./:/,' / i i、 i, ',i ヽ,_!,!'、 _,,,_ くi'./ /ii、,!!,' '、!、!,、ャ , ,!,,!、,! \ ~'‐、i'、_ レ',',!'i:|了5 'iテヤ, i i:;:;::ヽ, つ、. | "'''i-!,,!,,!、゙'''',_,,--、''イ. i i:;:;::',、ヽ, 問おう、 ~‐'、| 'i, : :~"''‐'--、,!'~'、. i i:;:;:::',ヽヽ, あなたがわたしのおにいちゃんか '! /: : : : . : : : . . :~"'ヽ;:i: !,::;::ヽヽ,`ヽ、_ フ''フ'''' フ''‐、--;,;,; : : : : : /, !, ヽ;:::::ヽ,`ヽ、'、''''''‐‐、 / /,'i /'i ll i〉: : !: :"'''-.,,_';;ヽヽ;: ヽ、:::`ヽ、 ヽヽ 'i / ヽ,i.'/ ‐‐'、!/: : ∞: : : : i:/:;;:;:'i ::;i:::::,,_..ヽ::::ヽ し、_ ( / !(',_ /: : :.∞ : : : :/',:::;:/ ::/'、::::;:ヽ,!::::ノ、 !,,_ )( !, ,、''-/: : : :∞: : : :(;:',:::/__::ヽ `ヽ::::);:::l し、 . ' ) /, ,!)/ : : : :.∞ : : : : ヽ,i' 7/ !::',, ',,!、 ! ( "'/: : : : : : i: : : : : : '、_、 ξ ζ く く,;,;,;_: : : : l : : :_;,;-'"\ く ~"'''''"''i''".__ / /"'-、,_,,,,-‐' ̄\ ̄ '、 / /. \. \ / / \ ヽ / / i二ニi_,,, i'i'" ,__ / ...................,,!_∞_ニ、i|:::........ _! 'ヽ! ~'i ...............::::::::::::( ‐-‐''i=ヽ::: .l、lヾ_,,,∞(i,,:::::::::::::::::::::::::::::::::::::"=====''' し、<、/、三ニ'、;:::::::::::::::::::::: `ヽ、_,,,,,,,,,,-i;::::::::::::::::....
なんの誤爆だw
誰かBlenderでCUDA使ったレンダ作ってくれ ほめられるよ
自分でやるかちゃんと金払え
あんな汚いソースじゃ移植したくない
レンダ部分のソースの範囲だけ教えてくれれば みなくもない
ヒントつオープンソース
ヒントツ・オープンソース
解析するのめんどうだから レンダの部分だけここにソースリストあげて それくらいしてくれてもいいよね?
まぁ、他人に頼むのならそれくらいしてもいいよな
WME対応してくれないかな・・・
F@H落として動かしてるのにamdcalcl.dllとamdcalrt.dllがDLされないぞ… まさかスタティックリンクになったのか…
見るフォルダ間違ってるとか。 そもそも最近のはインストーラに付いてくる。
3DCGのレンダリングには向いてない?
レイトレやるならアリだろ。
じゃあ
>>588 のソース改変してCUDA対応きぼん
>>596 少なくとも6.12b8まではインストールした時点でスタートメニューのdata filesで開くフォルダに入ってる。
6.20はシラネ
Vista用のGPU2クライアント落とせば入ってるよ
599 :
596 :2008/08/05(火) 22:19:22
DLページをもう一回見たらVistaマークのzipから落とせた\(^o^)/ でも当然だがこのDLLじゃ64bit版のサンプルは実行できないな…(´・ω・`) どうせ2GB超えるようなプログラムは作ってないし素直に本家更新待つか
CPUで流体シミュレーションやって遊んでるけど ぶっちゃけGPGPUと速度変わりませんwwww プログラムを最適化したらむしろ早いかもwwww
つまりショボイプログラムなんですね 分かります
601の言い方は悪いが同意。俺も詳しくは無いがそこらの記事から察するに、 今のCPUだって遅いわけではないんだから 複数のオブジェクトに対して或る程度の高負荷がかかる処理でないと 差が出ないと思うんだが。
ちらっと触って思ったこと。 計算は速いけど、なんかデータのCPU<->GPU間転送が超遅い。 んで、大体の人が期待しているGPGPU使用のh.264エンコって現実味がない気がしてきた。 入力がまず間違いなく、1フレームごとに発生するわけだからその分のデータ転送は必須。 普通にCPUのSIMD使ったほうが早いかと。
まあ一口にH264と言っても自由度高いし、と言うかいろんな圧縮処理が規格化されてるんだっけ、 この記事のやつはどの位圧縮できるんだろうね
>>604 使いこなせないのが全て実装側にあるって考えはどうも嫌です。
道具を使う側が、使いにくいと思う場合はやっぱり道具側を改善すべきかと。
いまだにGPGPU向け言語とゆうか、インターフェースとゆうかそれが不十分な気がします。
CUDAはまだ使いやすいほうだけど。。。
だって教えてくれた記事が4月なのに、まだ現物ソフトないじゃん
明後日から始まるSIGGRAPHにElemental Technologiesが出展するみたいだね
これで公開時期が発表されなかったり
>>604 より速くなってなかったら…
デモで3倍程度だと現実はどうなんだろうって気はするね。
まあ、俺はC#しかできないから
>>490 の言うように
.NETのJITが対応するのを待つだけだけど。
まぁIntelが金注ぎまくるまで待っていても いいと思うけどね
>使いこなせないのが全て実装側にあるって考えはどうも嫌です 痛い,痛過ぎる
半年後にはOpenCA出るしDirectCA(仮称) そろそろ発表されるのにCUDAに縛られる 意味無いなぁ
まーねー、俺みたいにぬるいプログラマは DirectXくらい楽になってくれるとうれしー
>>605 圧縮率についてはBaselineって時点であきらめた方がいい。XvidやDivxの方がまだマシってレベル。
速度面でもアセンブラ最適化されたx264とかと比べると劣る。
今GPGPUやっても仕方がないきがしてならん Intelの発表見ると微妙過ぎる気がしてならん
>>615 分野によってドチラがコストパフォーマンスが高いかが違うので、やっても仕方ないかどうかは、分野による。
分野と言うか目的が一番問題だろうな
>>613 それってかなりがっかりなお知らせなんじゃ…つかなんのためのGPGPUよ
しかもBaselineプロファイルなんてBないから圧縮率悪いし、わざわざ、GPU最適化して作る意味ないです。。。
そうでなく、そのプロファイルでの報告だってのが、ってことじゃね
GPUを用いた映像のリアルタイム手ぶれ補正ソフトウェアの開発 いいなGPU使うだけで税金おりるのって
マルチする奴って馬鹿だな、まで読んだ
CUDA2正式版が出たな それに対してAMDは4850が出てから一度も…
4850以前に3000シリーズもStream SDKのドキュメントに出てないぞ
>>624 全然汎用的に使えないから、いいんじゃない?
CUDAとCALに両方対応するプリコンパイラを誰か作らないのか
>>626 抽象度が違うから無理だし、作ったって使いやすいものじゃない。
そもそも、なぜこのスレ?
CUDA最強だね AMDはBroadcomに身売りしたし終わりだね
今の時点でCUDA最強なんて言ってるのを、10年後の人間に見せたら 牛乳吹くぞきっとw
現時点じゃCUDA(笑)だもんな。 インテルがGPGPUは失敗するって言ってたけど今のままじゃ その通りになりそうだし。
ゲーム屋(の一部)から言わせて貰えば、GPGPUはとても魅力的。 巨大な配列に適当な関数を map するような用途は沢山あるから。 だから逆に、あんまりCPUよりになって欲しくないね。
GPGPUって今どういう状態? 1.GPUメーカーが必死に煽って、好き者PGだけが遊びでいじってる状態? 2.先進的PGが名もなきゲームや特殊なソフトで、こっそり実用する奴がいる状態? 3.先進的なメーカーが、名もなきゲームや特殊なソフトで使う事もある状態? 4.ゲームや特殊なソフトでは、たまに使ってるソフトもある位の状態? 5.有名実用ソフトがみんな当たり前のように使用している状態? 6.Windowsのカーネルも含めてほとんどのソフトがGPUで動いてる状態?
2じゃね
カーネルが動いたらむしろCPU要らない気がするw
それは、もうGPUじゃない。
このスレだと微妙にスレ違いなネタなんだけど 物理シュミレーションスレ誰か立ててくれませんか?
自分で立てろや
立てられないんです
>>635 photoshopや有名エンコーダで利用されるようになったら、晴れて一般技術の仲間入りって所か?
"一般技術"って何だ?
電話が使えるとか電卓が使えるとかそういう技術の事ジャマイカ?
646 :
デフォルトの名無しさん :2008/09/06(土) 23:20:29
っつーか、それ以前に、そんな日が本当に来るのかよ。
来ません
AthronとNvidia好きな俺にとっちゃ
Athron Athron Athron Athron Athron Athron Athron Athron Athron Athron Athron Athron Athron Athron
ソフトウェア環境が整う速度よりも CPUのコア数が増える速度の方が早いでしょ GPUをCPU並みに複雑な処理に対応させるって それって単にマルチコアなCPUを作るだけでしょって話なわけで 結局メーカーの入れ替わりなんかが発生するかもはしれんけど 行き着く先はCPUとGPUの統合なわけ プログラムはマルチスレッドなものを作っとけばいいだけ CUDAだのCALだのは要らない
単純にMAP関数アクセラレータとして使えるくらい GPUがCPUに近くなればいいんだよ。 stlっぽくunordered_for_eachにkernel関数渡せば ハードに合った並列処理されるみたいな。
pentium-mクラスの256コアCPU速く出ないかなぁ
バカだから並列プログラムできません>< と素直に言えばいいのに
並列プログラミングできないって、それが理解できないですよ。 単にコア分のスレッド使って、処理を分ければ良いだけのことでしょ?
>>650 いるいる。
現状CPUのSIMDだってコンパイラはまともに最適化してくれなくて
自分で専用のコード書かなきゃいけない。
マルチスレッドだってOSによってAPIが当然違うし同期とか面倒くさい。
CUDAだろうがその他の開発環境だろうが構わないが
もっと並列性の高い言語を用意してくれなきゃ
多くのヘタレPGが書いたコードは現状のCPUだって1/10くらいしか性能が出てない。
手続き型の記述法がアホ臭いことが結構あるだろ。 forループでわざわざどうでもいい処理順序まで記述した挙句 OpenMPのプラグマで実は並列に処理できますよとヒント書くとか。 並列構文作って無意味な制御変数のデータ依存省いた 本当に必要な依存だけ記述されたRTLをコンパイラに素直に渡せないから 人間は無駄に処理順序を記述する羽目になり、 コンパイラは無駄に不完全な並列化解析することになる。
フォトショやエンコーダのCUDAに対応するのがあるよ 3DCGレンダで対応するのが出るのは時間の問題じゃねーか
AMDの新しいSDK出るのって今週の予定だったな。
密かにftpサーバに新版アップされているな。
vista用も用意されてるね
1.2.βの更新日が7月23日? 今週の新版は1.3βなのかついに正式版なのか
1.2βですじゃ
ぱっとドキュ見てみたけど、相変わらずCALの方が。。。 フォーラムでも叩かれてたのに、見た目綺麗でも中身変わらず。。。。
余裕で出来るwww
>>666 いやそれ、300万円だよな??
じゃぁもれは赤目補正をGPUでやりますから。控えめに100万円ください。
性能と価格と消費電力次第だけど、数が出ないだろうからGPUに比べてとても割に合わなそう。 いつぞやの物理演算プロセッサの路線。
5000-10000円程度か、対応ソフトウェアにバンドルして発売すればそこそこ需要はあるかと。 まぁSD解像度を主眼に置いている時点でワゴン逝き確定。ワゴンに行ったら救出しまつ。
初物だから10万くらいするんじゃないか?
やっとVista対応か これでXP64消せる
HD3450(Cat8.8)でBrook+のサンプルは動くのに CALのサンプルが Current hardware does not support this kernel. やら This program cannot be run on the present graphics hardware. Exiting! と表示されて全然動かないなぁ Brook+の方はNLM_Denoise.bmpも出力できるからCALのバージョンチェックが厳しいだけだろうな 明日4850の方でも試してみよう
>>675 Brook+の方はちゃんとGPUで動いてるの?CPUエミュになってない?
>>676 NLM_Denoiseも一発で出力されてるけど、
これそんなに軽い処理だっけ?
というか1.1の時は動いてたし
>>675 単にMEM_EXPORTの機能がないカード使ってるだけだろ?
Stream SDK 1.2になったけど なんか変わった?ドキュメントがさらにカオスに なった以外変更ないみたいなんだが
shader analyzerで見る限り brook+のreduceで高速化のためか 複数のILプログラム出力しているみたい。
>>635 自分が使うプログラムは自分で書かなければ
どこにも存在しない研究者が、
課金されずに使えて値段の割に速いから喜んでいる状態
なにげにクイックソートライブラリとか探せばごろごろすぐに使えるものがある
684 :
デフォルトの名無しさん :2008/09/17(水) 11:50:31
初心者ですみません。 一般的なスペック高めのPC(現状ではC2D E8x00系,GeForce 9800系あたりを想定)で、 現状、あるいは今後のロードマップで、 CPUでやるより最大で何倍位の性能出るんでしょうか? もちろん、課題に大きく依存すると思いますが、とりあえず最大(GPGPUに適した課題)で。 あと、性能を大きく上げる手軽な増設・改造などありますでしょうか。
685 :
684 :2008/09/17(水) 11:53:46
あ、別にnVidiaでなくてもPCショップで普通に買えるものならどこのでも良いです。
GPGPUがらみですが、ちょっと離れてしまう話でもあり でもどこで聴けばいいのかわからないので、ここで聞かせてください。 セカンドディスプレイを繋ぐ2つ目のDVIから GPUで処理したデータをデジタル出力(映像ではないです)させたいのです。 どちらのディスプレイからデータを出力させるか や どこのピンからどんなデータを出すか。 などの資料は、無いでしょうか? そういう制御が無理な気もしますし、少なくともATiとnVIDIAでは別な気もしますし。
>>684 そもそも適した課題というのが少ないからな
単純なものほど並列化しやすくて早いけど
単純なものほど処理が単純でCPUでも我慢できる範囲だったりw
たとえば音声認識とか。
CALの場合悩みは結局 痛nium2と同じだしな CUDAは結局SSEの延長
>>690 itanium2と同じってどゆこと??
CUDAって今年の流行だろ?
去年はCell 今年はCUDA 来年は?
OpenCL
Larrabee
>>692 去年はx86
今年はx86
来年もx86
NVIDIA製GPUが「Photoshop」「After Effects」「Premiere Pro」の最新版「CS4」アクセラレーションをサポート。
http://www.4gamer.net/games/032/G003263/20080925009/ >Adobe Photoshop CS4はQuadroとGeForceのどちらでも利用可能だが,
>残る二つはQuadroのみが認証&推奨されている――を搭載したシステムでは,自動的に有効化されるとのことだ。
Geforceで動くAE、Premiereプラグインを開発して売り出せば(ry
ぬか喜びしてるのか色んなところにコピペしまくってるね君
GPGPUでDSP作って ディスプレイ繋いでない方のDVI端子にDVI->COAXIAL出力つけて サウンドカード化とか、ちょっと妄想してみた。 DViだったら、多chも余裕な気もする。
それHDMIじゃダメなん?
HDMI端子の普及率はまだそこまで高くないでしょ。 どうせGPGPUを使うなら、コンセプト的には、あまった●●で××を・・・ って感じだろうから、もう1個のDVI端子を何か有効に使いたい所。
>>698 SLI2でそうゆうことするよ
アホかって思うけどね
なんでもSLI前提とかありえねーし
702 :
デフォルトの名無しさん :2008/10/10(金) 01:20:34
>>696 このプラグインインスコフォルダからぱくってきて
他のソフトで使う事ってできる?
結局、CS4もCUDAじゃなくてOpenGLだったわけだけど 何で今頃DX9のSM3.0対応のソフトが増えてるんだろ? 誰かわかる人教えてくれw
NVIDIA社員が打ち合わせに来た際に言った台詞: -- ボードメーカさんのボードは部品の品質も低いし検査もろくにしていない。 業務で使うのならそんなアキバ的発想はやめてQuadroFXを使うべきです。 -- その場にいたボードメーカさんの苦笑が忘れられない。 # GeForce8800GT vs. QuadroFX3700だけどね。
>>703 それはOpenGL2.1がSM3.0相当しかサポートしないから
OpenGLを採用したのは、Windows以外のOSも考慮したから
いつの間にかStreamSDKの1.2.1が出てたんだな Radeon4xxxシリーズがOpenCloseDeviceでUnknownだったのがちゃんとR700系として認識されるようになった
>>705 おまいさんの仕事がなんなのかすんごい気になる
709 :
705 :2008/10/21(火) 22:35:39
>>708 あっしはしがない出入りのSEでござんす。
件のNVIDIAの営業氏、なかなかの好人物ではある。
同じ石なのに値段がどれだけ違うんだ、と思っていた時期が俺にもありました。 もう変わったらしいので当てはまらなくなっただけだが。 どちらにしろ利益率からいったら売れるところには売りたいのは当然だわな。 アキバ的発想で予備買ってもおつりがくるよな。
NVIDIAはブランド詐欺専門だからな いっぱいあっても現役チップは3種類程度w
さすがに3世代またいでリネームされると、ちょっとNV見限りたくなってきてるw
CUDAのVS2008対応は年末か
そんなことより、先にFreeBSDに対応してくれよ。 できればamd64で。
717 :
デフォルトの名無しさん :2008/11/04(火) 22:39:56
キタ━━━━(゚∀゚)━━━━!!
最近何か情報ないのかね? 相変わらずプログラム作りにくくて難儀なんだけどさ
NVIDIAがシェーダデバッガを期間限定割引販売してるけど GPGPU的には関係ないのかな。
開発ツールアホみたいに高く売るのは バカ会社の典型だな ゲロビディア潰れろ
非業務用は無償じゃん なに切れてんだ?
AMDのシェーダデバッガは無料会員登録で手に入るな
724 :
デフォルトの名無しさん :2008/11/13(木) 20:25:38
今度こそGPUアクセラレートなAVIVO Converterが出るのか。 本当に出るのか心配だが、期待はしておこう。 COBRAとAVTはどこ行っちゃったのかよくわからんし、 *の文が小さい上に肝心のスライドは転載されてないのはアレだがw
AMD Stream対応のプログラムって CAL直書きなの? それともなんか違うもの使ってるの?
>>724 これで年内にStream SDKの正式版が出なかったら怒るぞ
出なくてもいいけどもっとまともに プログラム作れるようにしてくれよw
キャッシュの小ささはどうにもならない。 CUDAですらDirectXでできることと大して変わらん。
>>726 確かBrook+が使えるんじゃなかった?
731 :
デフォルトの名無しさん :2008/11/15(土) 06:33:39
>>725 いま在るAVIVO ConverterもCOBRA使ってるよ
今回変わったのはCOBRAがCAL使うようになったこと
>>731 ソース下さいよw
Avivo Video Converterが出たのは2005年、COBRAの発表が2007年なんですけどw
ATI Stream正式発表っていってるけど 糞ドキュメントと仕様不備だらけ
逆に今までのなんだったんだよって感じ
あの言語仕様で汎用的に使えるのって SSEの置換程度だしついでに出たフォーラムで 言った正式リリース時には一定の制約はあるものの FPGAのような汎用ソリューションにするっていうのは まるっきり嘘だったな やっぱりIntelに期待するしかないな
CUDAの糞っぷりでみんな懲りてるからなぁ 先駆者が大失敗した影響はでかいな ホント、DirectXに組み込まれるまで手を出せない感じ
俺、CUDAの仕様は結構気に入ってるんだけどな。まぁ慣れただけなのかもしれんが
Pthreadみたいに使えないといらんよ
>>733 中身のDLLのバージョン変わってないけどね。
>>736 > あの言語仕様で汎用的に使えるのってSSEの置換程度だし
SSEの置換なんて出来るわけない。使ったことないだろ?
で、COBRA使ってるってソースはまだですか?
Cobra 9.15.0.20713
ごめんなさいずっとCORBAのtypoだと思い込んでましたw
XPIDLの元になったやつか
GPUについて半分質問な感じだけど、聞いてくれ。 nVIDAのグラボの発熱量+消費電力が気になったんだが、 ATIの奴らでも似たようなもん? 昔はATIは省エネ的な感じで、コスパ良かった気がしたんだが 近頃ノートパソコンばっかり使ってて、グラボの良し悪しや どれが最新のハイエンドで、どれが普及品で、どいつらが省エネタイプか さっぱり分らんので、ご教授願いたい。 GPGPUでガリガリと計算させ続けようと考えてて、 さすがに、下手な発熱量と消費電力は抑えられれば抑えられる方が好ましいと思ってるんだが、 現状ではまだ、CUDA以外はダメぽな感じ? もしも、ATIの方が電力抑えめでこっち使いたいなら、DirectX11待ちが正解そう?
753 :
751 :2008/12/02(火) 17:51:38
世代ごとにターンが入れ替わってる。 コストから言うと、別スレで挙げられてる HP ML115 +GF8400GSがぶっち切りで安上がり じゃないかな。
まあCUDAにしろStreamSDKにしろOpenCL用のライブラリ作ればそれまでなわけで
OpenCLなんて持ち上げてるのはマカーだけだよ。 XcodeがWindowsやLinuxで提供されてないのと同じレベルで、Snow Leopard専用言語。 「C#」や「C++/CLI」だって言語処理系自体はECMA標準規格だが事実上Windows .NET専用だろ? どのみちCUDAの言語処理系に酷似してるなら簡単に移植できるだろうけど。
OpenCLはGPUだけをターゲットにしたものじゃないのだが
CPUのコードも生成できるって言いたいんだろ?知ってるよ。 CUDAもホストCPU用のコード生成できるようになるよ。 OpenCLは、少なくとも当面「Snow Leopardだけをターゲット」だけどな。
いつもどおりMSがDirectXでWindows上のデファクトスタンダードを打ち出して普及を阻害するんだよな。 OpenGLがそうであったように。
>>761 でもそれは元々OpenGLがとっつきづらくて普及進んでなかったんじゃ。
CUDA(笑)
今のOpenGLは自滅してない?
NVIDIA自体は特にこだわりは無いそうだ。 MSあたりがデファクトスタンダードを作ってくれるならそれでいいと。 CgをベースにHLSLが生まれたように。 CUDAはGPGPU用言語処理系としては頭一つ抜けてると思うが。 現時点で「使える」という点でね。 そんなに普及してないじゃないかって思うだろうけど、GPGPU自体がそんなもんだよ
でも、糞
ハード屋はどこもそんなもんだと思うよ ソフト屋もどこもそんなもんだと思うよ 自分とこの製品買ってくれるならなんでもいいわけで
まぁ、このままだと下手したらIntelに全部もっていかれかねないんだから
ぶっちゃけ、Intelに全部もっていかれるのが一番いいなぁ。
Intelが全部持ってっちゃうと企業努力しなくなるだろ
CUDA類似の奴が他のチップ(まぁATiだけど)でも使えるようになるという点でOpenCLには期待してる まぁ何でもいいから使いやすいデファクトスタンダードを早く作ってくれ
まあMacOS上のデファクトスタンダードは間違いないだろうが それ以上でもそれ以下でもないな。 OpenCLワーキンググループはにはNVIDIAもIntelも名を連ねてるが 結局はAppleは自社製品買ってくれる上客だからなわけで。 当然ながらMSは不支持。メリットが無いから。 となると、Windows用の「OpenCL」公式ランタイム環境をどこの会社が用意する? ベンダーごとに用意する? それじゃOpenGLのgdgdの二の舞だな。 DX11 Compute ShaderとOpenCL、どっちかを選べと言われたら NVIDIAもAMDもIntelも圧倒的に前者を選ぶだろうよ。 それとは別にCUDAなりCALなりCtなり各ベンダープロプライエタリな処理系は並行して サポートしていくだろうし。 MacOS専用同然になる公算はでかいわ。 まあ、MacもデスクトップではLinux以上には影響力あるしデザイン業界には 相変わらず強いからそれなりには支持されるかもしれないけどさ。
DirectCAの開発資金が200億円 OpenCAの開発資金が8億円 絶対OpenCAは流行らないし潰れる
>>772 >それとは別にCUDAなりCALなりCtなり各ベンダープロプライエタリな処理系は並行してサポートしていくだろうし。
これって使う側(プログラマとしてのな)からすりゃ鬱陶しいだけなんだよ
MacなんてゴミOSはどうでもいいから、最低WinとUnix/LinuxについてはこれがGPGPUの標準ってのを作ってくれなきゃこれ以上広まらんぞ
なんだかんだで 糞MSのデファクトスタンダードって対応早いしトータルで見ると良いと思うんだよね OpenGLだけならここまで進まなかったでしょ、実際
Linuxはサポートする必要ないだろ 糞リーナスのオナチラOSなんて不要だろw
>>776 常時稼働させる演算用鯖(GPUGRIDとか)としてや、GPUクラスタとしてLinuxは必要
>>777 Windows 2003 Serverがあれば不要
Linuxを無理でも勧めようとするのはよくない
Linuxの方が軽いだろう。それにクラスタを構成する全ノードに一々Win鯖入れんのか? 保守もそうだし、入れる手間を考えたらLinuxの方が遥かに楽
MSCS入れた方が管理楽だろ Linuxでまともにクラスタ管理できるソフトなんてみたことないけどなw 釣りだと思うが、あったら教えてくれよw
Windows 95の頃はOpenGLって割とメジャーだったんだけどね。 OpenGLなスクリーンセーバーが標準で入ってたりした。 Visual Studioで標準でサポートされてたのも大きい。 MSがOpenCLをサポートすらしないとなると、事実上Windows環境からは捨てられたも当然。 CUDA 3.0がOpenCLの言語機能に準拠する可能性もあるが、ハードベンダー頼りになっちゃうと 好き勝手に拡張して分裂の流れなんだよな。OpenGLのそれみたいな。 ハードウェア非依存の処理系が成功するにはどこかしら独裁やってくれるリーダーが必要だ。 MSは十分強いが、Appleは弱すぎる。 DX11はWindow 7からって言われてたけどCompute Shaderは従来OSでも使えるようにする 方針打ち出した(DirectX10の機能も実はXPでも使えましたって落ちだったし) 一方でOpenCLは、当のAppleすらSnow Leopardの目玉機能としてる(旧OSユーザーは無視?)
>>780 SCoreで十分。それにWin鯖使うとしてライセンスどんだけ必要になると思ってんだ
つーか、「Linuxを無理でも勧めようとするのはよくない」とか言ってるお前こそ
Windowsを無理でも勧めようとしてるんだろうが
>>782 LinuxなんてOSがタダってだけでしょう
安かろう悪かろうで大学や大企業などの
公益性の高いところでLinux利用するのは
まずいだろう
バグだらけでMyrunetとか未だに動かないSCoreの
名前出されるなんて思ってもみなかったけどw
大学は安くてナンボだろ。慶應みたいな大学ですらPS3を何台も買いあさったりしてるわけで。
Myrinet使えないって何言ってんだ。現にSCore+Myrinetで稼働してるクラスタあるだろう それに784も書いてるように、湯水の如く研究予算あるわけじゃねえんだから、クラスタのOSにWin鯖なんて導入できる訳ねえだろ
>>784 どこの大学とは言わないけど
金なさげなフリして結構飲み代多かったり
卒業生が勤めている会社から研究費出してもらって
自分の権力的な実績作りにご執心だったりと
講義は休講が多かったり内容スカスカだったりと
どこの国公立大学でもありがちだな。 金は上から振ってくるから年度末までに昇華しないといけないって考え。
まずはFreeBSDに対応してくれ
禿同。 デス鳥乱立で互換性の取れないLinuxに 完成度の低いToolkit乱れ撃ちするのに 無駄な労力使ってないで、FreeBSD/amd64 に対応してくれ。5.xに対応すれば、6.x, 7.xにも自動的に対応するのに。
だいぶ淘汰されてDebian系:Ubuntu、RPM系:Fedora/Redhatで纏まりつつあるけどな
とゆうかDebian系、RHEL系以外のディストリってほぼ使われてないだろ
ミラクソLinuxの中の人間が 痛すぎるあいつ等人間として生き恥を晒しながら 生き続けることに疑問を感じないのだろうか
suseは?
ミラクルのおっさんが賞取ったからって嫉妬すんなや。
月刊Catalyst12月号の早売りでCALのランタイムが6.14.10.103から6.14.10.145にジャンプアップしてた。 dllの構成も変わって、今までのamdcalrt.dllとamdcalcl.dllは中身がすっからかん。 amdcaldd.dllが実際の処理を担当するみたい。 amdpcom32/64.dllはよくわからないけど、DXVAとDirectXに関連するっぽい。
>>783 フランスは政府が中心になって Ubuntu を推進してるが?
linux嫌われすぎだな
>>796 アメリカ以外の多くのEU加盟国から
度々公式見解で、アホ政府呼ばわりされている
フランスなんかの行動は見習う必要ないだろw
あのアホ政府はサブプライムでかなりやらかしたしw
>アメリカ以外の多くのEU加盟国から ???
政府をアホ呼ばわりすると賢く見えるライフハックですね。わかります。
☆ チン マチクタビレタ〜 マチクタビレタ〜 ☆ チン 〃 ∧_∧ / ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ヽ ___\(\・∀・) < NVIDIAとAMDと東芝のインプリメントまだ〜? \_/⊂ ⊂_ ) \__________________ / ̄ ̄ ̄ ̄ ̄ ̄ /| | ̄ ̄ ̄ ̄ ̄ ̄ ̄| | | 愛媛みかん |/
PDF読むとAMD, Apple, Intel, NVIDIAは凄い人数投入してるけど 東芝は入って無いんだよな。 強いて言うとSonyが一人だけ。
>>804 東芝は社員が個人的にOpenCLに対応させようとがんばってるだけじゃなかったっけ?
じゃあ俺はATi用インプリするから
>>804 はNvidiaヨロ〜
>>805 どっかで読んだね。
そいつ、えらすぎだろ・・・
は??? AVIVO Video Converter出したのにまだβかよ しかもまた旧Verをアンインストールしないとインストールできない糞インストーラかよ
当然じゃないか SDKとかも上書してんのかおまえはw
むしろ不用意に上書き出来ない方が安心できるな
>>810-811 今時インストーラが旧Verを削除してくれるのが普通だろ
上書きも共存も出来ず「コンパネから消せよ馬鹿」とか何年前のインストーラかと
ただのソフトならともかく、SDKみたいなもんについては勝手に消して欲しくないから 自分で消せって方式の方が良い。少なくとも俺はな
今時 普通 何年前 お薬飲んだ?
OpenCLって将来的には コンソーシアム加盟員だけが商業ビジネスできる ようにするんだな。それも1ライセンス1000ドルから5000ドルって高すぎだろ
貧乏人はMSに期待しろ 結局それが一番堅い
CALでASCIIだけは 処理できそうなんだけど うまくいかねぇw 詰めが甘いんだよなぁ うーん
StreamSDK 1.3 完全にDebianでは動かなくなった Debian見捨てたなこりゃ
それ以前にDebianだとfglrxが随分前からインストール出来ないだろ。 experimentalですら11月に10月号が出てそのまま足踏みって時点でDebian側も投げてる。 つまりは素直にUbuntuにしろって事だ。
「ATI Stream SDK 1.3」の大幅な機能強化をベースとするバージョン1.4は、 より細分化されたデータタイプのサポート、グラフィックスAPIの相互運用性、 マルチGPUのサポート、Brook+へのスレッドレベルのデータ共有を追加できるよう設計されています。 このほか、「ATI Radeon HD 4870 X2グラフィックス」へのサポートの向上や、 複数の「ATI FirePro 3Dグラフィックス・アクセラレータ」のサポートなどの機能強化が図られています。 「ATI Stream SDK」のバージョン1.4の公開は2009年第1四半期中を予定しています。 1.4でようやくマルチGPU対応か サイドポートも有効になるか?
マルチGPUのサポートと4870X2のサポート向上を別表記してるんだからやってくれるだろう。 本当にサイドポートという機構が存在すればの話だが。
結局マルチコアCPUで落ち着きそうだな
結局4670でもDP対応しているようだな。
だってVLIWの問題だもの どうにでもなる
なんか、CUDAもAMD Streamもスルーして、OpenCLに絞った方がいいのかなぁ 開発リソースが有り余ってる訳じゃないし…
専用ので作った方がピークパフォーマンスは高いかもしれないけど ATiもヌビもOpenCLに全面対応すると言ってるんだからそう違いはないだろうな。
OpenGLでQuadroとFireGLが既にやっているように、 FireStreamやTeslaを売るためにGeForceやRadeonでOpenCL対応が制限されそうで嫌だ 結果的にDirectXのComputeShaderの方が遥かにアベレージパフォーマンス良かったりしてな
>>829 > OpenGLでQuadroとFireGLが既にやっているように、
FireStreamとRadeonってどこが違うのって聞かれたAMDの中の人は
サポート(供給期間の保証とか)が違うだけだよって普通に言っちゃってたよ。
>>830 VRAMの容量が4Gが出るのはFSのみだって
行ってたよ。
09末までに2Gは両方で出るようだけど
9600GTで2GBのネタみたいな仕様のカードあったな。 Tesla代わりに使えるんじゃないかと思ったもんだ。 VRAM大容量=64ビット専用と認識してるが
AMDのサイトで"R6xx Family Instruction Set Architecture"読んでるんだが、 普通のプロセッサの資料と勝手が違って違って読みにくい。 なんか、アーキテクチャの概略がわかる資料とか知ってる心やらしい人がいたら 教えてください。
1つのストリームプロセッサエレメントがX, Y, Z, W, Transからなる5-WayのALUがぶら下がったVLIWで構成されてる。
>>834 cpがcfを解釈するようになったので、cfの説明とaluに対するopsのフォーマットだけだな、r600isaは。
まずプログラミングマニュアルの方を見た方がいいと思う。
>>835 thx
でも、さすがにそれはネットメディアの解説記事で知ってたw
>>836 thx
早速読んでみる。
しかし、ブロックダイアグラムだけ見ると癖の強いアーキテクチャだな>R6xx
演算器の間の連携手段が小容量のR/Wキャッシュだけってのはこの規模の
SIMDマシンとしてかなり弱い気がする。
PV、PSあたりの仕様を見ると ALU Clauseの存在意義が分かって面白い。
GSが入った所にDmaCopyってのが入ってるけどなんか厄介そうだな。 ジオメトリシェーダーって全然ノータッチなのだが、結構面倒なのかな? this program type is optionalなので意味分からない時は無視するが勝ちかorz
ILじゃなくてISAで何を作ろうとしてるのかね?
ネイティブアセンブラじゃね? 俺もCUDAのPTXが嫌いなんだが
amdのstream kernelanalyzerて走らせるのにstream sdk以外になんかいる? もらってきた実行ファイル叩いてもコンソールが数秒開く以外反応がないんだが。
コンソールアプリなら、コンソールで使えよ。
amdユーザなんて所詮このレベルw
>>844 どこからどうみても、一番レベルの低いレスをどうも。
よくわからんのだけども、折角だから流行りそうなの勉強したいなと思ったんですが 調べてみて -AMD- CTM Havok -NVIDIA- CUDA Physx -他- BrookGPU PeakStream RapidMind こんんあ感じかな? 今のところCUDAが流行ってるんですか? あと、今後PhysxとかHavokとかの物理エンジンがCUDAやCTMなんかに統合されるとかいう可能性とか あったりするんでしょうか?
今年はIntelもメニーコアの汎用GPUを出すし先のことは分からない Intelはx86命令セットを実装するからたぶんこれが生き残る 現状一番扱いやすくて普及してるのがCUDAとphysx AMDは資料もろくにないし言語仕様もぐちゃぐちゃで使い物にならない
つ[OpenCL]
ハードよりの資料はAMDの方が充実しているだろ。 Brook+が微妙なだけでCALの仕様はまとも。 まあ、CALはほぼアセンブリだから、高級言語で記述したいなら Brook+でどうにかするしかないのが最大の難点だが。
>>847 Larrabeeは確かにx86命令+αを実装するみたいだが、果たして普及するかは別問題だぞ
パフォーマンスが出ないんじゃHPC分野からは見向きもされない
そもそもアセンブリレベルでコーディングなんてしないわけで、CUDAなりBrook+なりの高級言語使うのが当たり前になってるんだから
結局はどこまでLarrabee用の言語を構築できるかでしょ
Intelは言語レベルではなく、OpenMPのようなライブラリっぽいものでLarrabeeサポートしていく方針だったかと。 で、同じコードでマルチCPUやなんかにも対応させるようなことを言ってたような希ガス。
Larrabeeがどうなるかは知らないけどIntelは独自言語も作ってるし、OpenCLにも対応する予定だよ。 ま、開発はどうにかなるとしてもLarrabeeは消費電力気にしてキャッシュを 強化する代わりに絶対的なメモリ帯域が足りないっぽいのがなあ。 実際のコードはそんなに局所性が高くないものも多いんだよ。
別に流行ってないよ。 マニアのみ。
Larrabee 300W アホだろw
>>852 実はリアルタイムレイトレーシングに最適化されてるとか。
キャッシュの利用によって外部バスの負荷を軽減することで、結果的に省電力化を図れる
みたいな話で、このへんはイスラエルのキャッシュ大容量CPUの設計思想のフィードバックだよ。
メモリコントローラに帯域を狭くするなんて言ってない訳だが、誰が言ったんだ?
しかし、メモリ云々はGeForceあたりでも切実な問題じゃないの?
SMあたりのレジスタファイル倍増したかわりにGeForce8なんかと比べてメモリ帯域減らしてるじゃないの。
>>852 「ハイエンドでも300W以内に収める」とは言ってるが300Wになるなんて誰も言ってないだろ
480SPのGTX295が300一歩手前の状態だから上位はそんなもんだろ
Larrabeeは16Way SIMDユニット搭載だから、32コアでGT100/200換算512SP程度。
まあWindowsがlarrabeeにカスタマイズされただ嫌でも買うでしょ
857 :
デフォルトの名無しさん :2009/01/19(月) 05:19:28
3Dゲームしている時以外は GPUパワー余っているから 今こそ分散コンピューティングの時
858 :
842 :2009/01/22(木) 21:02:05
stream Kernelanalyzerだが動いた。 もらってきたファイルの拡張子が.exeだったんでそのまま走らせるのかと思ってたら、実は.MSI形式だった。 恥ずかしい。
859 :
デフォルトの名無しさん :2009/01/27(火) 09:29:34
OpenCLはマルチコア対応でしかもSSEなんかで最適化されてるから GPUよりクアッドコアCPUのが早いというw
手軽に複数枚増設できるgpuに対して、cpuを複数つけることは難しいだろう。 それに行き詰まってるcpuよりは、gpuのほうがまだまだ速くなるし、 計算/表示まで1つのハードウェア内で完結したほうがいいだろう? cpuの仕事ってioと制御だけでもいいくらい。
GPUメモリからシステムメモリへの転送が早ければなあ
GPUからプロセッサキャッシュへ直接転送できればいいのにな。
>>計算/表示まで1つのハードウェア内で完結したほうがいいだろう? それこそCPU有利じゃないかw
4亀のGPGPU記事、突っ込みどころが多すぎてもうどうしたものやら。 誰か頼むわ。
ざっと流し読みした限り、そんなに変な箇所は無かったように思うが ゲーマー向けのGPGPU解説ならあんなもんじゃねーの?
870 :
デフォルトの名無しさん :2009/02/07(土) 16:54:42
>>869 「標準的なプラットフォームの登場」という要望に答えたCUDAって書き方してるのは笑うしかないでしょ。
こことかも
> しかも,CUDAソフトウェアのパフォーマンスは,GPUの世代やモデルに応じてスケーラブルとなるため,
> 開発者もプログラム側も,「動作対象となる GPUがGeForce 8800 GTXなのか,(中略)」といったことを気にする必要がない。
気にしなければ確かにスケーラブルだけどパフォーマンスはでないわけで。
CUDAアプリの殆どがGPUの仕様に合わせてガチガチに最適化してるのを黙ってるのはどうかと。
PTXトランスレータがGPUの個数を考慮してるってのは完全に嘘だ。
NVIDIA PhysXのRadeon制限も自分の妄想語るのに夢中でさっぱり忘れてるみたいだし。
ATI Streamに関してもCTMとCAL ILとHDシリーズのISAをごっちゃにした解説をしてる。
絵の説明のところでATI Stream解禁の本質がCALをドライバに含めることだと正しく説明してるのは評価できるけどね。
CSとOpenCLに関しては、3DAPIとリソースの共有が出来ることが重要なポイントだというのなら
CUDAが両APIのリソースを扱えるってことを説明しないとまずいでしょ。
OpenCL 1.0の仕様はもう公開されてるのに仕様確定が09年6月ごろとかは意味不明だ。
MOTIONDSPで検索したらモザイク消しの話題があった それは思いつかなかったw 確かに超解像はモザイクが消せるw
前後のフレームを参照してモザイクを消そうなんて プログラムのプの字も知らなかった小学生の頃に思いついたけどな。 みんなそんなもんだろ?
>>872 所詮ユーザー向けのバラ色セールストークなんだから気にするなよ。
>>874 は?思いつかなかったしそんなの
その発想が出てるだけでもう俺より才能あるし
>>872 ユーザー向けとしてはその程度でいいだろ
確かに普段書いてるCUDAプログラムなんて、使ってるGPU毎にブロックサイズとかを全部最適化し直してるけど
一般ユーザーにそこまで説明する必要はない
とりあえずGPGPUすげーなって程度の認識を持たせれば十分でしょ
逆にそこまで説明しちゃうと「なんだ役にたたねーじゃん」って印象を与えかねない
まぁ実際問題としてはまだアカデミックな用途がほとんどだけどな
実行ポインタやら実行コンテキストはgpuだけで自律制御できるようになったのかな? その辺の理解がもっと深まればintelやamdの変態cpuを待つ必要がなくなると思うんだけど。
被写体を3Dモデル化して全フレームからテクスチャを合成して 無限に超解像とか出来る日が来る
>>877 > 逆にそこまで説明しちゃうと「なんだ役にたたねーじゃん」って印象を与えかねない
現状では実際そうだからちゃんと説明しろっていいたいんだが。
>>862 普通に4コアで4way, 安いWSで4コア2CPUの8way, ちょっと金積めば4コア4CPUの16wayの
共有メモリ並列が実現できる。
GPUは16枚もさせない。
882 :
テスラは捨てら :2009/02/16(月) 11:45:58
1個のGPUの中にSPUが数百個入ってるワケだが。 更にそういう使いかたしたいならテスラ買え、ってことでは? 普通にブレードサーバ買った方が安いけどw
ここは、ものを比較する際に電力効率とかコストパフォーマンスで相対化することもできないインターネッツですね
軸が足りないと批判する人間も実は軸が足りなかったりするからねぇ。
コストパフォーマンス? テスラもAMDのなんちゃら言う奴も馬鹿高いじゃないか。 下手すりゃブレードの方が安いぞ。
メニーコアCPUには性能面でも価格面でも適わないという結論になりました
何をもって高い安いって言ってるの?性能の指標は何?w ブレードなんて熱密度の関係から敬遠されてるじゃんwww たとえば単精度1TFLOPS弾き出すのにXeonやOpteronだとキロワット単位ですが。
ブレードサーバって設置スペースを削減したい場合に有効だが冷却コストとかの問題で結局高コストなんだよね。 導入コストだけみて運用コストを考えないのはおこちゃま
光CPUはどうなったんだ?
量子CPUのが先に実用化されるんじゃないの?
量子のほうは似非科学だから永遠に実用化などされない
通信時間0msの通信装置が作れるかもしれんがコンピュータには使えない
CPU内の配線に使えないかな?
>>887 GPUで単精度1TFLOPSを引き出せるようなアプリがどれだけあるのかと。
コード書くつもりの話でないのだったらゲハなり自作なりでやれ。ム板でやるな。
量子コンピュータって重要な部分は量子のもつれという特異な現象だけ 現状では量子状態は参照しか出来ないから 極端な話同じ動作を繰り返すからくり人形使ってっていいんだよ あとは机上の空論の世界で、0と1の両方があるので答えは0〜1なので正解とか言ってるだけ
唯一実用化された量子暗号も量子もつれを利用しただけのもの 同じ動作を繰り返す量子ペアを別経路で発送して 途中で誰かが参照したらペアが壊れるので傍受されましたって それだけw
たかだがアインシュタインもびっくりした現象たった1つを ここまで壮大な妄想の一科学分野にまで発展させて研究資金を搾り取ってるのはすごいなw もはや宗教の域に達してるw
そりゃ分かるってことは信者になるってことだからな
信者とか信者じゃないとかいう話じゃないからなぁ 「現状では量子状態は参照しか出来ない」 とか 「0と1の両方があるので答えは0〜1なので正解とか言ってるだけ」 というのが、わかってなさを表してる。
>>881 並列度の話になったら現状のCPUはどう頑張っても現状のGPUに勝てない。
コアの数や並列実行スレッド数を云々し始めても同様。
4コアでSSE128bitでさらに4倍の16コアあるのと同じこと しかも3GHzとかで動いてる
SSE使っても処理が煩雑になるし思ったほど性能上がらんし・・・
思ったほど性能上がらんのはGPUも同じだがな。
SSEは使い方知らんと性能上がらんのよ 普通にプログラミングしても駄目よ
GPGPUは使い方知らんと(ry Cellは使い方知らんと(ry SpursEngineは使い方知ってても(ry
高速計算できるよってやつは本当にクセが強いな カリカリにチューンできるようになるころには次のが来るもんなあ
SSE使うにはアセンブラ使わんとだめだよね?
つ「組み込み関数」
最近はC#からでも使えるよ
最近は便利になってたのか・・・。 ちょいと調べてみるよ。
>>912 もしかしたコンパイルのプラットフォームターゲットの事?
>>912 直接は使えない。
文字通りのSIMDを使うにはターゲット毎にアンマネージド(ネイティブ)なC/C++などで
コード書いてDLL化し、その関数を呼ぶ形でしかアクセスできない。
ハッキリ言ってめんどい。
浮動小数をSSEスカラに使うならCPU機能を判断して自動的に使われるようだけど
どのみち性能は出ないので期待しないほうがいい。
Mono.Simdなんて変態があるけどなー ターゲット依存なので使いように困るわけだが。
SSLの計算にGPUをつかうのか・・・
カッコイイが誰も使わないな・・・
もうちょい速ければね。 SSLって案外計算量馬鹿にならないし。 SSLアクセラレータ代わりに安価なGPUが使えるならそれもアリかもしれない・・・
GPU使う場合のレイテンシは問題にならないのかね?
それが問題だね・・・ そのレイテンシカバーできるくらいの、 大きなbit数でエンコードするとか?
P4の頃ですら大してメリットなかったのに、i7とかの時代にどうしろとw
padlockでおk
IntelプロセッサにAES支援がつくのはWestmereからだから今は我慢だ
団子を自作板以外で初めてみたわ
プログラム板にもそこらじゅう張り付いてるぞ おまえさん見る範囲狭すぎ
このスレだけでもかなり頭の方から粘着してるな
だって和スイーツ(笑)だもの。 今更気づいたんだがCUDAってさ、 x64用のToolkit, SDKを入れると 32bit用バイナリがビルドできなくね? cutilsは32と64の両方のlibがあるのに>< せめてlib32とlib64に分けるとかしてくれよ
団子ってプログラマーだったん?
ちょっと調子にのっただけなんで許してあげて
おう許してやるよよしよし
1.4にあがってスレッド間で使えるようになったな OpenMPっぽい問題は解けそう
937 :
デフォルトの名無しさん :2009/03/13(金) 22:37:55
1.4って、何が?
CUDAのCompute Capabilityのことかと おぃぃ?NVIDIAは新製品のサンプルくらいよこすべきだと思うんだが? 未だに8600GTでやらされてるんだが。
今日の話題で1.4ならATI Streamの方だろ。
Brook+強化されてもなぁ・・・OpenCLマダー? CALはTUがまともに動くようになったのとX2正式サポートとバグ直しか。 CAL ILの資料はドライバの中身さらけ出し度がさらに上がった感があるな。
>>939 GTX295ですら1.3で、下段ガードを固めて無かった俺には隙はあった。
勘違いしたのは確定的に明らか。
int8使えるけど遅いな
943 :
デフォルトの名無しさん :2009/03/14(土) 02:36:19
>>941 昨日のボクシングの試合は、久々に見所が有ったよな。
ところでウチのマシンでCUDA動かしてたら、マシンが超遅く
成って戻らない。超重いんだけど、落ちはせずに動き続けてる。
何が起こったんだか? 今週末は東京出張だからもう寝よ。
結局1.4云々はATi Streamの方なのか? CUDA2.1のドキュメントにもCompute Cap. 1.3までしか記述はないが
SDKじゃなくてCCのVerUPが来たらここだけじゃなくnVidiaのニュースリリースに出てるだろ
>>947 まぁそりゃそうだわな
ATi Stream見てみたら、v1.4が出たのな
What's up見る限り、CUDAで言うところの共有メモリをBrook+から扱えるようになったってことか?
Brook+をアップデートされてもな
>>948 CALの項で共有メモリ扱う方法書いてあると
思うが?
>>949 Significant feature enhancements to Brook+:
* Access to thread-level data sharing.
Brook+から扱えるって事じゃねえの?SDK User Guideの2-40
これまでのBrook+はほぼCの構文だけだったけど 1.4でC++のテンプレートを使ったプログラミングが出来るようになったな ドキュメントだとLegacyとNew APIっていう比較でコードの長さも一長一短だが 共存は出来ないんだろうか?
GTX 280だと、doubleで90GFlopsぐらいまで落ちた気がするからそれだけみるとすごいな ただ、実際問題として頭からケツまでdouble精度が必要なソフトがあんま無いってのと floatの性能が芳しくないからそこがネックだな
GeForceは1SMあたり、単精度MAC8器(SP)、特殊演算ユニット(SFU)2器、倍精度(DP)1器の構成。 単精度性能は8Way積和算+4Way乗算×2で24、倍精度は1Wayの積和算で、2 つまり単精度:倍精度のスループットの比率は12:1 RadeonはGeForceのSPに相当する部分を5WayのVLIWで構成し、そのうち1Wayで倍精度も実行できるようにしてる。 んで、スループットの比率は5:1なわけだけど、どっちが優れてるかは一概には言い難い。 VLIWは演算対象によって実効性能がガクっと落ちる(倍精度はもともと1Wayなので関係ないが) ただ、倍精度演算ユニットを倍増するくらいの拡張は将来のGeForceにもできるだろうから 今は我慢のとき。 Larrabeeは16Wayの単精度と8Wayの倍精度で演算ユニットを共有することになるから 理屈の上では2:1になる。まあ、ケチってくるかもしれないけどね。
>>955 1Wayで倍精度じゃないよ。
5Way分の演算器使って1Way分のDMADが実行できる。
ただし同時に1Way分の整数演算ならできる。
>>956 倍精度は4つだけしか使わない。
Trans Unitで出来ないのはX,Y,Z,W Unit4つ同時使用が前提の命令とアドレスレジスタに触る命令だけ。
だからX,Y,Z,W Unit使ってDP1つ、その上でTrans Unitが残ってるからSP or INT1つも同時に出来るよ。
>>970 を踏んだら、次スレ立ててね。
テンプラ募集。
↓
,.、,、,..,、、.,、,、、..,_,,_ /i ;'`;、、:、. .:、:, :,.: ::`゛:.::'':,'.´ -‐i '、;: ...: ,:. :.、... :.、.:: _;... .;;.‐'゛ ̄  ̄ ヽ(´・ω・)ノ | / UU
catalyst9.3が出たが「XPだとCALがうまく動かない」とさ
Folding@Homeに付いてきたamdcalrt.dll 6.14.10.103は動くっぽい。 待て屋のディレクトリに放り込んだらちゃんと動いたんで多分大丈夫。
CALのDLLをFolding@Homeに最適化しようとして、最適化しようとして、 XP版だけ間に合わなかったか
Clarkdaleとか出たら GPUメモリに高速アクセスできるようになるんですか
1.4からマルチGPUに対応とかになってたから 仮想化のもんだいか
catalystを入れ替えるときにチップセットドライバも更新しようと思って software uninstall utilityで全ソフトの削除を選んだらstream sdkまで 消されたw
Web PAMが削除されることを知っていた俺にとっては想定の範囲内。
>>963 GMA、それに限らず非オンボード・オンチップGPUはメインメモリ共有です><
そもそもGMAはGPGPUに対応してないんですけどね。
968 :
963 :2009/03/21(土) 17:38:23
ここまで全部だんごやさんの自演だよ
さて、アイちゃんが立てたスレは放置して新しく立て直すか・・・
一応貼っとくか
ttp://www.techpowerup.com/index.php?88739 AMD to Demonstrate GPU Havok Physics Acceleration at GDC
ATI's Terry Makedon, in his Twitter-feed has revealed that AMD would put forth its “ATI GPU Physics strategy.”
He also added that the company would present a tech-demonstration of Havok technology working in conjunction with ATI hardware.
The physics API is expected to utilize OpenCL and AMD Stream.
結局分立のまま並走かよ。 BulletがCUDAとStreamの両方に対応する事を祈るしかないか。
だんごトリップなしかよ
発言のキモさでわかるだろ
><
FireStorm製品ではなくてグラボとしてのRadeon-HD4870+ATI Stream SDK で倍精度計算は可能ですか? 「DP計算はできないように機能を殺してある」/「RV670(<ーFireStormのこと?)でSDK入れたら計算できた」と言う 矛盾するような内容の書き込みが存在するのですが。
979です。
Thanks!
>>980 FireStormではなくてFireStreamでしたね(^_^;;)