【トリップ検索】CUDA SHA-1 Tripper【GeForce】 902 :
きら ◆Kira.u9zNc :2012/09/18(火) 16:56:58.52 ID:g5RalNWRP
>>712 です
ありがとうございます。
試してみます。(今更)
>>901 個人的にはGUIは必要を感じないけど、どんなGUIになるかは楽しみ(*‘ω‘ *)
自分はbatファイル作ってやってるなぁ
batファイルうp "git bisect -h"
>>905 え、そんなうpするまでもない低レベルなことしかしてないよ。
------------------------------------------------
CUDA_SHA-1_Tripper_MERIKENs_Branch.exe -x 224
------------------------------------------------
たとえばこんな風にテキストファイル保存して
拡張子をbatに書き換えてこいつを同じフォルダに入れて起動するだけ。
試したい設定の数だけ作って保存しとけばいいし楽。
907 :
616 :2012/09/18(火) 20:46:39.19 ID:aj94xEuT0
開発お疲れ様です。 うちのQuadro FX 3800でもBeta1は無事動作しました。最適数検索は1分位で終了し、-x 16でした。速度は・・・それなりですが。 今後の希望として、計算途中結果の保存機能を実装して頂けると助かります。 どうしてもPCをシャットダウンする必要が有り、その度に再実行だとなかなかトリップが見つかりません。
GT640ユーザーですが新バージョンどうもです 0.04 Beta 1をWin7 SP1 x64 + 306.23でデフォルトターゲット("TEST/")で試してみたところ 12桁GPU検索(オプションなし)と10桁GPU検索(オプション -l 10)で それぞれ10分間動かして以下のような結果になりました 12桁GPU検索 ====== CUDA0: 106.1M TPS, 160 blocks/SM 0.063T tripcodes were generated in 0d 0h 10m 00s at: 109.05M tripcodes/s (current) 104.50M tripcodes/s (average) On average, it takes 7.1 seconds to find one match at this speed. 10桁GPU検索 ====== CUDA0: 7.4M TPS, 96 blocks/SM 0.004T tripcodes were generated in 0d 0h 10m 00s at: 7.47M tripcodes/s (current) 7.30M tripcodes/s (average) On average, it takes 1.7 minutes to find one match at this speed. 12桁GPU検索は0.04 Alphaと同じくらいの速度ですが 10桁GPU検索は0.04 Alphaでは約2.8Mでしたので(数値自体は相変わらずしょぼいですが)かなり高速化してます なお12桁GPU検索の方は約8分後・10桁GPU検索の方は約6分後に[optimizing...]が消えました あとGT640は12桁GPU検索でブロック数が32〜64くらいまでは常時約105Mあたり安定してますが それ以上では約110Mと約100Mが10秒毎に交互に切り替わって平均約105M、みたいな挙動になってるみたいです
>>903 とりあえずGUI化してまっさきに付けたい機能は検索の一時停止です。
ちょっと作業する度に検索を停止するのはめんどくさいので…
>>907 報告ありがとうございます。検索速度も教えていただけると非常に助かります。
トリップ検索は数分の一秒ごとに乱数で計算を全てやり直しているので、
再実行しても効率は全く変わりません。ひたすら待ちましょう。
>>908 詳しく報告していただいて大変参考になりました。
自動設定はちゃんと動いているみたいですね。
10桁検索は…まあ頑張っているほうでしょうw
>>910 名前はMERIKEN Tripperでもいいんじゃないですか(適当)
メリーケーンon my mind♪
メリーケーン♪
あれから色々いじってウィンドウのサイズが可変になりました。
いやー、Visual Studioは便利ですねえ。「検索設定」のタブのデザインは
出来上がったので、あとは「検索スレッド」のタブを仕上げたら
本格的にC#のプログラミングを始めます。
>>911 "tripper"という単語は英語の意味がちょっとあれなのでやめておきました。
検索する→高速なのでいいのががんがんヒットする→のうじるだだもれ トリッパーでおk。www
torippa-!
917 :
名無しさん@お腹いっぱい。 :2012/09/19(水) 12:17:54.24 ID:YxVeUwKT0
頭にス付けるといいと思う
ストリッパー!
919 :
名無しさん@お腹いっぱい。 :2012/09/19(水) 14:12:25.19 ID:KaiQthBt0
うーむどのverでもCould not create a new key containerが出るんだが何なんだろう・・・
>>919 それはおかしいですね。OSのバージョンは何ですか?
Win7x64でGTX480 cuda_sha1tripperは各ver動いたんだけどなぁ
>>921 ちょっとテストバージョンを用意するので待って下さい。
thx, it works now :)
>>924 awesome! thank *you* for the bug report!
プロセス間通信についてちょっと調べたんですけど、 標準出力のリダイレクトとシグナルを使ってやればGUI化は わりと簡単にできそうな感じです。案ずるより産むが易しというやつですね。
927 :
616 :2012/09/19(水) 22:17:40.60 ID:HKqLB+Uf0
>>909 乱数でしたか。Orz
10分間の検索速度は以下の通りです。
QuadroFX3800
Xeon
[email protected] WinXP64SP2
0.04β1
12桁
-c -g -x 16
305.93
238.23M tc/s
"/TEST"
238.91M tc/s (current)
GPU:171.13M tc/s
CPU: 67.78M tc/s
>>927 ありがとうございます。CPUが凄いことになっていますね。
6コア12スレッドのようですが、素晴らしい数字です。
GUIのほうですが、6行コードを書いたらCUI版の呼び出しに成功しました。 C#簡単すぎワロタw とりあえず検索パターンの一覧を一時ファイルに書きだして CUI版に渡すようにします。あとはオプションの設定かな。
>>915 いや、本業で薬中・アル中の患者さんを診ることが多いので洒落にならないんですよ…
じゃあ新しい名前はTrip Doctorで決まりですね
>>931 せっかく考えていただいた名前ですけど、もう決めてしまったもので…
あと自分にとってプログラミングは息抜きなので、なるべく本業のことは思い出したく
ないんです。
さて、一応GUIフロントエンドからテンポラリファイルを使って 検索プロセスにターゲットを渡すことに成功しました。 しかしC#はめちゃくちゃ楽ですね。昔Cでせっせとウィンドウイベントの処理してた ころが嘘のようです。あと残っている作業は、 ・検索プロセスのオプションの指定 ・CPUとGPUの情報の取得 ・検索結果のリダイレクト ・検索プロセスのシグナルの処理 ぐらいかな。難しいことはなにもないので次スレを立てる前までに形にしておきたい ところですが、どうなるかな…
C#簡単だよね GTX480で520M tc/s〜出てるけど発熱酷過ぎワロス これは冬になったら暖房がてら稼働するか
550M tc/s〜 だった大して変わらんか
期待してます。 MERIKEN's Tripcode Finder 0,05 opが沢山できますように。 とりっぷキーが カタカナ ひらがな 漢字 数字 記号 英大文字 英小文字 顔文字 絵文字 ナドナドお願いします。
おつかれさまー
>>934-935 結構出てますね〜 580が2枚だと排熱で死にそうです…
>>936 いつもありがとうございます。キーの種類はある程度選べるといいですね。
ただあまり細かくするとトリップが見つからなくなってしまうので
バランスが必要ですが…
「検索設定」タブと「詳細設定」タブの処理の実装はほぼ完了しました。 GUIから正規表現を含むパターンの設定をしたり、オプションを指定したり 出来るようになりました。あとは肝心のプロセス間通信の実装か…
CPUとGPUの情報の取得も出来るようになりました。 CUI版を最初に1回走らせて、CUDAデバイスの一覧を標準出力に出させてから、 C#のほうでそれを処理しています。これでGUI版からもGPUが選べるようになりました。 これでリダイレクトのやり方も分かったからあともうちょっとです。
>>937 お疲れ様。
===========
CUDA Device Count: 1
Device No.: 0
Device Name: GeForce GTX 4
Multiprocessor Count: 7
Clock Rate: 1400MHz
Compute Capability: 2.1
CPU
===
Number of Processors: 8
Number of Search Threads: 7
STATUS
======
Performing a forward-matching search for 32
with 10 characters on CPU and GPU(s):
CUDA0: 273.0M TPS, 192 blocks/SM
0.164T tripcodes were generated in 0d 0h 9m
300.55M tripcodes/s (current)
GPU: 280.79M tripcodes/s
CPU: 19.76M tripcodes/s
287.79M tripcodes/s (average)
安定版完成おめでとうございます
>>908 と同じ環境で0.04を10分間動かしてみた結果です
12桁GPU検索
======
CUDA0: 106.2M TPS, 192 blocks/SM
0.063T tripcodes were generated in 0d 0h 10m 00s at:
110.73M tripcodes/s (current)
104.17M tripcodes/s (average)
On average, it takes 7.1 seconds to find one match at this speed.
10桁GPU検索
======
CUDA0: 7.5M TPS, 128 blocks/SM
0.004T tripcodes were generated in 0d 0h 10m 00s at:
7.34M tripcodes/s (current)
7.32M tripcodes/s (average)
On average, it takes 1.7 minutes to find one match at this speed.
最適化の結果が変わってますが
0.04 Beta 1でも動かす毎に12桁は160〜192、10桁は96〜128あたりで変わってましたので
挙動や速度に特に変化はない模様です
動作も安定してます
ちなみにこのPCのCPUはC2D E7400ですのでこちらもあまり戦力にならず
12桁検索で約9.6M、10桁検索に至っては約0.66Mと誤差の範囲?です
心の中での応援としょぼい環境での人柱くらいしかできなくてすみませんが
新バージョンの開発もがんばってください
通常のプロセス間通信の実装はほぼ終わりました。残っているのはこれぐらいです。 明日までに終わらせたいけどどうかなあ ・ファイルからの読み込みとファイルへの保存。 ・エラー処理。 ・一時停止の処理。 あ、そうそう、OpenGLへの移植の準備をしようと思って以前組み立てたPCに 以前買ったHD 5770を入れてAMDのSDKをインストールしようとしたんですけど、 肝心のSDKがXPに対応してませんでした。結局Windows 7をもう一つ買うことに なってしまいました。とほほほほ…
OpenGLじゃなくてOpenCLでした。中途半端だの何だの言われてる規格みたいですけど、 実際のところどうなんでしょう…
複数PCにWindowsのライセンス用意するんだったら、場合によっては Technetの方が安くすんだりしないですか?
ATI Stream(Brook+)ならXPでもGPGPUがいけるしHD2000以降でも動いたような(HD3800以降でないと倍精度非対応だけど)
つかRADEONは最上位じゃないとネイティブで倍精度に対応してなかったりするから注意ね 上のHD5770とかはハードウェアでの対応は単精度のみだったりする
前から欲しかった検索の一時停止の機能ですけど、Windows自体にSIGSTOPと SIGCONTに相当する命令がないことが判明し、実装がとんでもなく面倒になりそう だったので、今回は見送ることにしました。まあGUI化によって検索の実行と再開が かなりお手軽に出来るようになったので、一時停止の機能自体それほど必要なくなった、 というのもあります。 というわけで残りの作業はファイルの入出力とエラー処理の実装だけです。 他にも実装したい機能は色々あるのですが、とりあえず次スレまでに次の開発版を 間に合わせることを最優先することにします。
>>951 > 実装がとんでもなく面倒になりそう
(*‘ω‘ *)?
>>952 あ、これはCUI版に新しくWin32のメッセージ処理のルーチンを追加したくなかった
だけです。シグナルが使えればかなりお手軽にできたんですけどね〜
>>951 つ「SuspendThread」
待て屋リミッターはこれとかを使って実現してる。w
>>954 検索スレッドで時間の経過を測定してるので、有無をいわさずスレッドを止めると
支障が出てしまうのです…
>>955 WindowsではPOSIXシグナルの一部は使えないんですよ。
>>957 ありがとうございます。一時停止の機能を実装するときに参考にさせていただきます。
さて、検索プロセスのエラーをようやくGUIのほうで処理できるように なりました。検索プロセスの側でstderrにエラーコードと詳細情報を 流させるようにして、それをリダイレクトしてGUI側で拾うようにしています。 さすがにエラー処理をしている部分にいちいちエラーコードを追加する 作業にはうんざりさせられましたが、一番面倒くさそうなところだったので、 終わって一安心といったところです。あとはGUI内部のエラー処理と ファイルの入出力ですが、これらは割と単純なのでなんとかなるでしょう。
パターンの読み込みの処理の実装を完了。ついでにパターンに使えない文字を 入力の段階で弾くようにしました。やることはわかってるのでひたすらコードを 書いていくだけなんですけど、C#は初めてなので思ったより時間がかかりました。 まあでもあともうちょっとです。なんとか次スレまでには間に合うかな。
不具合報告です。 ^\.*ABC\.*$ ^ABC\.\. このような組み合わせを記述した場合、後者が一切ヒットしなくなります。
>>962-963 動作報告ありがとうございます。
VCの再頒布可能パッケージの話は以前にも出てましたね。説明を追加して
おきます。
>>963 の不具合はこちらでは再現できませんでした。
GUI版とCUI版、どちらをお使いですか? CUI版ではpatterns.txtの
最後の行にパターンを記述することはできないので注意して下さい。
作者様 要望があります。 ものすごいスピードで検索してなおかつGUIもつけてくれて すごいと思います。 GPUを利用している性質上、検索中はCPUはアイドルでも マウスがカクカクになるほどGPUを使っているようです。 トリップ検索の優先度の設定とかできないでしょうか? タスクマネージャでプロセスの優先度を下げてもあまり変化は ないようです。
>>964 GUI版とCUI版、両方で動作確認しております。
ターゲットが少ない場合にはヒットしていますが、合計500行ほど記述している場合にヒットしない現象が発生しています。
>>965 -x 8で、普段は動かしてます。
README読んだ?
>>967 すみません、そのオプション知らなかったです。
確認してみます。
>>965 >>968 GUI版なら「詳細設定 -> 1SMあたりのブロック数」でも設定できますよ。
グラボを2枚差して一枚を画面表示に、もう一枚をトリップ検索に使うという
手もあります。
>>966 了解しました。お手数ですが、問題の発生するpatterns.txtを
こちらにメールで送っていただくことはできますか?
[email protected] ぜひ直したいので、よろしくお願いします。
>>969 ありがとうございます。
用事のため明日になりますが、必ずメールします。
DLさせて頂きました。ありがとうございます&お疲れ様です。
化けるのかな?
◆ABC../Sp93vy #cBsョソVBKr汢ォ (63 42 73 AE BF 56 42 4B 72 9F 89 AB)
ikuraは、おkでanagoがだめなだけ?
それは不思議ですね…
ぉおおおおおおおおオオオオオオオオオオオオオオオオ デケタ
^\.*ABC\.*$ ^ABC\.\. 下しか出ませんけど。 あるいみれあですか? ◆ABC..K.KEk #4エy資Dラ/犖 (34 B4 79 8E 91 44 D7 2F E0 B6) (.)(.)(.)(.)、速度表示がすごく落ちますね
>>980 そんな感じでした。 半角なんてキライダ
?もつかえたらなって・・
>>981 "?"って「前の文字が1文字あるかないか」でしたっけ? あとで入れておきます。
>>972 ありがとうございます。ぜひGUI版の感想を聞かせてください。
2chの使われないメール欄ってなんのためにあるんだろうか
>>982 おねがいします。
使ってみたい
?*
?+
??
GUIいい感じですね 10桁CPU検索の最適化と高速化に期待
Win7x64 295.73で8800GTX+GT520のDual環境ですが MERIKENsTripcodeFinder_0.05_Alpha_1のMERIKENsTripcodeFinder.exeだと 単体では8800GTX、GT520共にに動くのですが 使用するGPU:をすべて使用にしてしまうと落ちてしまうのです やはりCompute Capabilityのサポートに違いがあるGPUの 同時使用はマズイという事なんでしょうかね
あと10桁検索だと8800GTXはエラーで落ちてしまうみたいです
>>987-988 Compute Capabilityが違うこと自体は問題ないはずです。
エラーメッセージが出ているなら、その内容と(もしあれば)エラーコードを
お願いします。あと、「詳細設定 -> 1SM当たりのブロック数」を1にして
エラーが起きるかどうか試してみて下さい。
>>986 それはよかった。頑張った甲斐がありましたw
10桁検索はかなり頑張って高速化したのでこれ以上伸びるかどうかは
微妙なところですね〜
エラーコードは出ずに落ちるので分かりませんでした ブロック数は指定しても状況は変わらないみたいです あとCUI版はデフォルトだと落ちずにデバイスが二つ 認識されている状況でもGT520の片方のみ動いてしまい 直接[-d 0]で8800GTXを指定しない限りは動かないようです 10桁の計算は8800GTXの場合は0.00M tripcodes/sと そもそも動いてない模様です
>>991 それはかなり謎な挙動ですね。8800GTXのCCが1.0、GT520が2.1ですか…
CCが違うカードが混在した環境でテストしたことがないので
ちょっとよくわかりませんが、おそらくCCの違いが影響しているんでしょうねえ。
とりあえず注意書きを追加して、いずれテスト用に別のカードを買って
試してみたいと思います。貴重な報告、ありがとうございました。
>>991 よく考えてみたらどこかでエラー処理をしそこなっているような挙動ですねえ…
ちょっと調べてみます。
>>991 エラーチェックに漏れがないか調べてみましたけど、
それらしい場所はありませんでした。やっぱりテスト用にもうちょっと
色々なカードを揃えたほうがいいのかな…
>>970 メール受け取りました。早速調べてみます。
>>880 のCPU検索の高速化はどれぐらい速くなるのかな?
楽しみ
>>996 12桁の目標は倍、10桁は10倍が今のところの目標です。
CPU検索だけでも使い物になるプログラムにしたいですねえ。
mtyだとCPU検索は64bitWinで64bit版を動かすと32bit版に比べて2割くらい高速だったけど あれは単純に64bitでビルドするだけじゃなくて64bit最適化みたいなこともしないと駄目なのかな あとmty_calのGPU検索部分は32bit版と64bit版でほとんど同レベルだったから GPU検索が64bit版で高速化しないようなら64bit版を作る意味もあまりないかもしれないけど もし64bit版が簡単に作れて速度も上がりそうなら64bit版も希望
>>998 今自分が使っている環境が64bitなのでいずれ64bit版もぜひ作ってみたいですね。
SSEだけでなくAVXも是非試してみたいです。
1001 :
1001 :
Over 1000 Thread このスレッドは1000を超えました。 もう書けないので、新しいスレッドを立ててくださいです。。。