【トリップ検索】MERIKEN's Tripcode Finder PW[]の実装はすんなりいったので、あとはP[]を計算するだけです。 しかし本当にうまくいくのかいな、これ。
P[]じゃなくてW[]だった。こっちも終わったので、あとはソースをもう一回 チェックしてから動作確認します。うまく動くといいけど、どうかな〜
やっぱりというか最初の試行ではうまくいきませんでしたorz 速度はかなり出ているので期待大ですが、これデバッグするの大変なんだろうな…
よく見たら元のソースにはW[75]までしか載ってないぞ。わざとやってんのか… これでは正しい結果が出る訳ありません。しょうがないのでW[76]〜W[79]までを でっち上げることにします。
W[76]〜W[79]をとりあえず最適化なしで計算してやったら、なんとちゃんと
動くようになりました。
>>916 や
>>927 と同じ条件で112M TPS出ています。
>>916 の約2.6倍、
>>927 の1.16倍なので上出来でしょう。
これでCUDA版とOpenCL版の12桁トリップ検索を高速化出来る目処が立ったのも
大きいです。
>>857 のリンク先にあったPerlスクリプトを動かして、W[76]〜W[79]の計算を
最適化してやったら119.6M TPS出るようになりました。
これで速度は
>>916 の2.83倍、
>>927 の1.23倍になったことになります。
いや〜、しかし今回のアップデートは達成感があるなあ。
>>58-88 あたりで行き詰っていたのが嘘のようですw
959 :
名無しさん@お腹いっぱい。 :2013/01/19(土) 23:33:00.58 ID:xlNsLPWt0
MTF圧倒的大勝利!!!!!
AVX版も作ったらもっと速くなる予感
いや〜、どうもどうもw あのあといろいろいじって、無効なトリップが生成される
確率もかなり引き下げることが出来ました。現在は4%で安定しているので
上出来でしょう。ついでにGPU検索の無効なトリップの割合を引き下げることまで
出来ました。こんなにうまく言っていいのかしらん。
>>960 AVXだとビットシフトが出来ないのでAVX2待ちですねえ。Xeon Phiだとさらに
同時処理できるビット数が上がっているのでこちらも実に楽しみです。
乙
なお、Alpha 2をPhenom II X6 1100Tでも試してみたところ、不思議なことに Alpha 1よりも遅くなるのが確認されました。 次の開発版ではAMDのCPUが検知されたらAlpha 2の最適化を自動的に切るようにする 予定ですが、いかんせんデータが足りないので、AMDのCPUを持っている方に Alpha 1とAlpha 2のCPU検索の速度を比較していただけると有難いです。 (Alpha 1はウェブサイトに残しておきました)
AMDは持ってないから協力できなかった… だが今回してるマシンは300M超えそう
というわけでCPU検索の速度の測定をやり直してみました。
>>927 や
>>957 に比べるとかなり速くなっています。
個人的には120M TPSを超えることが出来たので、非常にすっきりしましたw
【CPU】Intel Core i7-3770K @ 4.3GHz (OC)
【OS】 Microsoft Windows 7 64bit SP1
【バージョン】MERIKEN's Tripcode Finder 0.08 Alpha 2
【トリップの種類】12桁
【CPU検索スレッドの数】自動(8)
【その他のオプション】なし
【10分間の平均速度】120.15M tripcodes/s
【GPUの平均速度】N/A
【CPUの平均速度】120.15M tripcodes/s
【その他】CPUのみ。5完1タゲ。
>>965 Dual Xeonの方ですか? 報告を楽しみにしています。
【GPU】Xeon E5-2687W×2 【OS】Windows8 Pro 【バージョン】MERIKEN's Tripcode Finder 0.08 Alpha 2 【トリップの種類】12桁 【その他のオプション】解凍したまんまで 【CPUの10分間平均速度】 321.75tripcodes/s あとは誰かAMDの物理32コアの報告を待つだけ
テンプレ集の日本人の限界のページにあるリンクは、 やたらime.nuに飛ばされるけど何か意味はあるのかしら
>>968 う〜ん、素晴らしい数字です。CPUでは間違いなく最速ですね。
しかしAMDのCPUはSSEの性能はいまいちみたいですね。
SSEなしだとPhenom II X 1100TはCore i7-3770Kより少し速いぐらいだったのですが、
SSEありだと速度は半分といったところです。AMDのBulldozerアーキテクチャで
どれぐらい性能がでるか非常に興味深いところです。
>>969 どのページですか? アドレスを張っていただければあとで確認しておきます。
おっと、そろそろ次スレを用意しないと… 食事を食べ終わったら立てておきます。
>>973 報告ありがとうございます。早速直しておきました。
しかし全然気づかなかったな…
【GPU】GeForce 610M
【CPU】Intel Core i5-3210M @ 2.5GHz
【OS】Windows 7 Ultimate SP1 64bit
【バージョン】MERIKEN's Tripcode Finder 0.08 Alpha 2
【トリップの種類】12桁
【1SMあたりのブロックの数(CUDA)】256
【その他のオプション】なし
【10分間の平均速度】 79.20Mtripcodes/s
【GPUの平均速度】 48.81Mtripcodes/s
【CPUの平均速度】 30.40Mtripcodes/s
【その他】5完1タゲ
>>928 に比べて4%ほどの速度上昇(CPUは8%)、か
【GPU】GeForce 610M
【CPU】Intel Core i5-3210M @ 2.5GHz
【OS】Windows 7 Ultimate SP1 64bit
【バージョン】MERIKEN's Tripcode Finder 0.08 Alpha 2
【トリップの種類】12桁
【1SMあたりのブロックの数(CUDA)】256
【その他のオプション】なし
【10分間の平均速度】 79.20Mtripcodes/s
【GPUの平均速度】 48.81Mtripcodes/s
【CPUの平均速度】 30.40Mtripcodes/s
【その他】5完1タゲ
>>928 に比べて4%ほどの速度上昇(CPUは8%)、か
新スレに貼ろうと思ったら2度も誤爆したんだぜorz
【CPU】Intel Core i7-620M @ 2.67GHz 【OS】Microsoft Windows 7 64bit SP1 (DSP版) 【バージョン】MERIKEN's Tripcode Finder 0.08 Alpha 2 【トリップの種類】12桁 【CPUの10分間の平均速度】28.07Mtripcodes/s 【部屋の温度】20℃ 【その他】MTF0.07から使い始めている初心者ですが、CPUの命令セットを x64+SSE2にすると「0xc000007b」のエラーが出て終了してしまいます。 x86+SSE2は正常に検索してくれます。PCのスペックの問題でしょうか?
【CPU】AMD Phenom II X6 1090T @ 3.2GHz 【OS】 Microsoft Windows 8 64bit 【トリップの種類】12桁 【CPU検索スレッドの数】自動(6) 【その他のオプション】なし 【バージョン】MERIKEN's Tripcode Finder 0.08 Alpha 1 【CPUの平均速度】59.90M tripcodes/s 【バージョン】MERIKEN's Tripcode Finder 0.08 Alpha 2 【CPUの平均速度】50.51M tripcodes/s 確かに遅くなってるね
12桁トリップのCPU検索がだいぶはやくなったけどこの技術は10桁トリップのCPU検索の高速化には活かせないのかな?
>>980 やっぱりPhenom IIだと遅くなりますね。実行時に自動的に最適化を切るように
しておきます。
>>981 10桁トリップのCPU検索はSSE Intrinsicsで出来ることは全部やってしまったので、
これ以上はアセンブラで書きなおさないと難しいでしょうね。またいずれ取り組む
予定です。
985 :
名無しさん@お腹いっぱい。 :2013/01/20(日) 18:58:05.02 ID:/IyUB2p70
【CPU】i7-3970x(OC 5.04GHz) 【OS】 Microsoft Windows 7 64bit 【トリップの種類】12桁 【その他のオプション】全てDL時のまま 【バージョン】MERIKEN's Tripcode Finder 0.08 Alpha 2 【CPUの平均速度】185.67M tripcodes/s はええwww 速くて面白くてOCが捗ったwww
Webブラウズしながら裏で測定したので参考程度に 【CPU】AMD A10-5800Kデフォルト TurboCore ON 【OS】Windows 8 Pro 64bit 【トリップの種類】12桁 【その他】5完1タゲ 【その他のオプション】デフォルト 【バージョン】MERIKEN's Tripcode Finder 0.08 Alpha 2 【CPUの10分間平均速度】 36.93Mtripcodes/s 【バージョン】MERIKEN's Tripcode Finder 0.08 Alpha 1 【CPUの10分間平均速度】 38.59Mtripcodes/s 【バージョン】MERIKEN's Tripcode Finder 0.07 【CPUの10分間平均速度】 18.45Mtripcodes/s でもやっぱりVer0.08 Alpha 2は、Alpha1よりちょっと遅いことは間違いないと思ふ
>>982 そのソフトウェアでは無理です。同じエラーが出てしまいます。
Norton360のインストールも失敗していまして、これはサポートチャットにて、
ダウングレードインストール(6.4.0.9 => 6.3.0.14)で解決できました。
恐らく一部(俺)のPCではx64-SSE2は対応していないということでしょうね。
あきらめも肝心なので、x86-SSE2で暖をとることにします。
>>987 いわゆるDLL地獄ってやつだな。
dependency walkerで調べりゃどれが原因かわかるとは思うが、シロウトには無理か。
>>987 > 恐らく一部(俺)のPCではx64-SSE2は対応していないということでしょうね。
多分他のソフトウェアが悪さしているはずなので、クリーンインストールして
地道に調べれば解決できるはずですけど、そこまでは流石になかなかできない
ですよねえ。
>>986 やっぱりAPUでも遅くなりましたか… 次のバージョンではオプションで
速い方を選べるようにしておきました。
>>988 ののたんさん、助言ありがとうございます。dependency walkerで調べたところ、
エラー:異なるCPUの種類が搭載されたモジュールが見つかりました。
警告:少なくとも1つのモジュールは遅延ロードに依存するモジュールで
不足しているエクスポート機能により、未解決のインポートを持っています。
ということです・・・。
>>989 検索用にF社OEM中古PC(Win7Pro32bit)を購入したあと、HDDのOEM管理領域を残したまま
Win7Pro64bit(DSP版)をインストールしたのがまずかったんでしょうか?
HDDをフォーマットしてからWin7Pro64bitをインストールしてみようと思います。
>>991 OpenCL.dll の名前を変えてみてもだめかな?
OpenCL.dll.dist とかに。
つか、CPU のとこに x86 と x64 が混在してないか?
?
は
どの
GUIの方で設定した内容はCUIで引き継げるのか 検索速度も少し上がる、これは有り難い
999 :
名無しさん@お腹いっぱい。 :2013/01/23(水) 09:54:33.29 ID:wpmoX/Ea0
1000!
1001 :
1001 :
Over 1000 Thread このスレッドは1000を超えました。 もう書けないので、新しいスレッドを立ててくださいです。。。