【GPGPU】くだすれCUDAスレ part6【NVIDIA】
IntelがきっちりCPU向けに並列化したコードならxeonも速いよ、GPUメーカーの圧倒的数字は幻想だよせいぜい2倍だよ、みたいな主張をphiの宣伝時にやってて首を傾げたな
その理屈ならxeon倍積みましょう、って宣伝すりゃええやろと
結局、極端なオーダーではやっぱりGPUやphiの方が有利なケースがあるんだろうなと理解したけど
やっぱこの人たちすごいな。
久々に見て回ったらK40の新機能のGPU Boostが他で使えるとか見つけてしまった。
水冷化してないけど試してみるか。
もしかしなくても、
また面倒くさいことこの上ない初期設定をしないといけないのか。
インストールとVS2012で拡張子変えて保存するだけで動くようになって欲しいよ。
エラーがでると、どの設定がミスったのかバカには分からんのですよ。
>>842 自分が使ってるVSは2008 Pro SP1, 2010 Pro, 2012 Pro UP4 だけど、
CUDA Toolkit 入れた後、
新規プロジェクトなら「NVIDIA -> CUDA X.X」だけで、
既存のプロジェクトなら古いCUDA Tookkitと新しいのを両方入れて
プロジェクトを右クリックで「ビルドのカスタマイズ(B)...」すれば動くよ。
少なくとも CUDA Toolkit 4.x -> 5.0 -> 5.5 RC -> 5.5 -> 6.0RC -> 6.0 はこの方法でできた。
>>843 VS ExpressだとNsight入らないんじゃない?
大して変わってないくせに開発環境変えるなよな
これまで開発したプログラムをmaxwellアーキテクチャーで動作させるには
5.5までのtoolkitでptxを吐かせるのか、6.0に移行するしかない模様。
>>846 3月末に、カーネルを15種類連続実行するプログラムを、
CUDA Toolkit 5.5でFermi(CC=2.0/2.1)用コンパイルした物、
Kepler(CC=3.0/3.5)用にコンパイルした物、
CUDA Tooklit 6.0でMaxwell(CC=5.0)用にコンパイルした物の3つで、
GeForce 750 + NSIGHT Visual Studio Editonで「All」でプロファイル採ってみた。
いずれの場合も、ほとんど速度が変わらなかったよ。
だから、無理にMaxwell(CC=5.0)用にする必要は無いかも。
>>848 >>846 で合ってると思う。
Gxx→FermiやFermi→Keplerのときも、
新アーキテクチャ非対応な古いToolkitで作ったcubinは使えなかったはず。
Jetson買った人いる?
Jetsonってなんだと思ってぐるぐるしたら、NvidiaのRasPiか
RasPiより性能大分良いんだろうが、でも、2万超えは高いな
自動車用じゃん。スレチだろ
べつに限定されてはいない
組み込み用といだけ
この手の奴にBTデフォでついてんのみたことない
今後の組み込みの方向性的に必須なのに
CUDA Tooklit を6.0にしたらGPU稼働率が下がったんだけど気のせい?
>>855 Ver変えたら能率が大きく違ったりするのはよくあることだからなあ……
CUDA Tooklit を5.0から6.0にしたら
数値計算プログラムの挙動がおかしくなったorz
おんなじような事になった人いますか?
連投すんません。数値計算上の安定化を入れたら解決しました。
浮動少数演算の癖がこれまでと違うのかも・・・。
安定化って何したんですか?
>>859 非線形最小二乗法のプログラムで、
一回の反復で更新する解の量を少し減らしたら安定しました。
CPUプログラムよりもGPUプログラムの場合に、
初期値からとんでもなく離れていってしまう場合が多いように感じます。
>>860-862 サンクス
誤差の拡大を抑えるってことなんですね
でもCUDAバージョンの違いで問題が出るってなんだろ?
へんな最適化がされてしまってるのかなあ
演算の挙動が論理的に変わるような変更ってあったっけ?
866 :
デフォルトの名無しさん:2014/06/02(月) 06:58:55.56 ID:/UMjeXQW
はじめて CUDA いじってるんだけど、
cu のコンパイルって こんなに時間がかかるものなの?
ホスト側の修正しかしてないときでも
一分近くかかってる。そういうもんなのかな。。。
nvcc にも /MP スイッチみたいなのがあるのですか?
ちなみにソースは正味100行足らずの試験的なもので、ビルドに40秒。そんなもん?
コンパイル環境は
[email protected], メモリ16GB
Visual Studio 2012 Express
ソースもコンパイラもSSDにおいてある。
ホスト側とデバイス側と極力分離してみては如何でしょう。
VisualStudioでどう設定するのか知らんけど。
コンパイラにverbose出力ないのん
870 :
デフォルトの名無しさん:2014/06/02(月) 20:51:44.01 ID:S9gNSwt5
とりま、使うデバイス以外のcompute capablityはオフにしとけば。
GPGPU良いな。一部のプログラムには革命的な変化じゃないか?
そう、"一部の"プログラムにはな・・・
…それは分かるけど、面白味が薄くなるような…
ピーキーすぎて俺には無理だよ
876 :
デフォルトの名無しさん:2014/06/10(火) 22:38:52.85 ID:QBeTFx/V
Windows 上で CUDA と MPI を組み合わせる場合、
お勧めの実装は?
IntelMPI は大学でライセンス持っているので自由に使えるけど
他でも使いたいならMSのほうがいいの?
CUDA SDK 付属の simpleMPI は、HPC Pack SDK 2008
入れろとコメントにあるけど。
>>876 openmpi
intelやmpich2系はlocalonlyオプションつけないと動かない。
878 :
デフォルトの名無しさん:2014/06/14(土) 12:36:19.80 ID:yTlFq1Bu
>>877 thanks! でも Windows サポートが不安だなぁ。
binary support for a Microsoft Windows Open MPI build has been discontinued
MS の MPI じゃダメなのかかな?とりあえず HPC Pack SDK 2008
入れて CUDA SDK 付属の simpleMPI を動かしてみます。
cuda fortranについて初歩的な質問なのですが、
PGI workstationで、-cublasとオプションを付けてコンパイルしようとすると、
『fatal error LNK1104: cannnot open file 'libcublas.lib'』とエラーが出てしまいます。
この場合、どうしたら良いですかね?
どなたか教えてくださると助かります。
すいません。スレチでした。
超初心者用のスレで質問します。
>>875 driverはもう6.5なんだね
第二世代maxwellが近いのか?
CUDA Device Query (Driver API) statically linked version
Detected 1 CUDA Capable device(s)
Device 0: "GeForce GTX 750 Ti"
CUDA Driver Version: 6.5
CUDA Capability Major/Minor version number: 5.0
Total amount of global memory: 2048 MBytes (2147483648 bytes)
( 5) Multiprocessors, (128) CUDA Cores/MP: 640 CUDA Cores
GPU Clock rate: 1163 MHz (1.16 GHz)
Memory Clock rate: 2750 Mhz
Memory Bus Width: 128-bit
L2 Cache Size: 2097152 bytes
>>882 マーケットが広がるのはよい事だね。
CUDAに還元されると折りがたい。
6.5 RCきたぞ。ようやくVS2013対応か。
vs2008はまだサポートされるの?
なくなった