【トリップ検索】MERIKEN's Tripcode Finder その5

このエントリーをはてなブックマークに追加
1 ◆Meriken//XXX
こちらはMERIKEN's Tripcode Finderの本スレです。動作報告・質問・要望等は
こちらでどうぞ。

Meriken's Tripcode Finderは2013年8月現在で最速の12桁トリップ検索ツールです
(最高速の記録は11112.48M tripcodes/s)。CUDA対応のNVIDIAのビデオカード、
もしくはHD 5xxx以降のAMD Radeonシリーズのビデオカード等のOpenCL対応デバイスを
使用すれば非常に高速に検索を行うことができます。特徴は以下の通りです。

・ビデオカードのGPUによる超高速検索。
・CPUによる高速検索。
・GUIとCUIの両方に対応した柔軟なユーザーインターフェース。
・強力な正規表現による検索パターンの指定。
・漢字等のShift-JIS文字を含むキーの探索。
・ヒット率、ヒットまでの平均時間等のさまざまな情報の表示。
・検索パターンの数の制限の撤廃。
・10桁トリップ検索への対応。
・検索速度の実行時の最適化。
・配布パッケージに同梱された検索ルーチンのソースコード。

■入手先
◆MERIKEN4.kのウェブサイト
http://www.meriken2ch.com/programming/merikens-tripcode-finder

■前スレ
【トリップ検索】MERIKEN's Tripcode Finder その4
http://anago.2ch.net/test/read.cgi/software/1373110438/
2 ◆Meriken//XXX :2013/09/15(日) 12:33:10.50 ID:yp7r3EBt0
3 ◆Meriken//XXX :2013/09/15(日) 12:35:55.96 ID:yp7r3EBt0
■最高速の記録
> 139 : ◆MERIKEN4.k :sage :2013/07/20(土) 13:00:49.05 ID:FlwZiche0!
> 5ヶ月振りの新記録キタ━━━━(゚∀゚)━━━━!!
> 【診断の種類】検索速度(1パターン)
> 【Meriken's Tripcode Finderのバージョン】0.10
> 【OS】Microsoft Windows 7 64bit SP1
> 【ディスプレイドライバ】Catalyst 13.5 Beta2
> 【検索デバイス】GPUのみ
> 【使用するGPU】すべて使用
> 【GPU0】DIAMOND 6990PE54G Radeon HD 6990 4GB @ 910MHz (OC)
> 【GPU1】Gigabyte GV-R799D5-6GD-B Radeon HD 7970 @ 1130MHz (OC)
> 【GPU2】VisionTek Radeon HD 7990 @ 1100MHz (OC)
> 【CPU】AMD Phenom II X6 1100T (定格)
> 【1CUあたりのワークアイテムの数(OpenCL)】自動
> 【1WGあたりのワークアイテムの数(OpenCL)】自動
> 【1GPUあたりの検索プロセスの数(OpenCL)】1
> 【1検索プロセスあたりの検索スレッドの数(OpenCL)】2
> 【検索プロセスの優先度】通常
> 【GUIフロントエンドの優先度】通常
> 【トリップの種類】12桁
> 【キーに使用する文字】すべて
> 【検索パターン】 10文字完全前方一致1個
> 【10分間のGPU検索の平均速度】11112.48M tripcode/s
> 【GPUの使用率】93〜99%
> 【GPUの温度】80〜97℃
> 【その他】Power Limit (6990): +15%, Power Limit (7990): +5%, Fan Speed: 100%
http://anago.2ch.net/test/read.cgi/software/1373110438/139n
4 ◆Meriken//XXX :2013/09/15(日) 12:37:42.95 ID:yp7r3EBt0
テンプレは以上です。このスレでもよろしくお願いします。
5 ◆Meriken//XXX :2013/09/16(月) 10:55:31.85 ID:qZcMxCLl0
新しい開発版をうpしました。

MERIKEN's Tripcode Finder 1.1 Free Edition Alpha 3
http://www.meriken2ch.com/programming/merikens-tripcode-finder

Alpha 2からの主な変更点は以下の通りです。

・全角文字をキーに使用したときのヒット率の向上。
・キーに使用する文字の種類の追加。
・12桁トリップのCPU検索の速度向上。
・10桁トリップのOpenCL版のGPU検索の速度向上。
6 ◆Meriken//XXX :2013/09/16(月) 11:15:29.67 ID:qZcMxCLl0
あ、あとこれを>>5にたしとくのをわすれてましたw

・破損した設定ファイルを自動的に修復する機能の追加。
7やんやん ◆yanyan/Pails :2013/09/16(月) 11:56:10.30 ID:p7PA/eiR0
おお、お疲れさまです。試してみますね。
8 ◆Meriken//XXX :2013/09/16(月) 15:53:52.35 ID:qZcMxCLl0
さっそくAlpha 3にバグがorz
Radeonを使っててGPUが複数あると、検索がいつまでたっても始まりません。
原因はわかっているのですが、これどうやって修正しようかな…
9 ◆Meriken//XXX :2013/09/16(月) 17:09:07.51 ID:qZcMxCLl0
一応修正は出来ました。これから配布パッケージを用意します。
10名無しさん@お腹いっぱい。:2013/09/16(月) 17:09:42.52 ID:okVXgfDbP
この前α1とα2で速度に差が出ると言っていた者です

α3はα1のときの速度になりました
(21MT/sです)
11名無しさん@お腹いっぱい。:2013/09/16(月) 17:10:54.81 ID:okVXgfDbP
12桁の方も戻ってました

85MT/sです
12 ◆Meriken//XXX :2013/09/16(月) 17:34:07.90 ID:qZcMxCLl0
新しい開発版をうpしました。

MERIKEN's Tripcode Finder 1.1 Free Edition Alpha 4
http://www.meriken2ch.com/programming/merikens-tripcode-finder

Alpha 3からの主な変更点は以下の通りです。

・Radeonのビデオカードを使用していてGPUが複数あると検索できない
 不具合の修正。
13 ◆Meriken//XXX :2013/09/16(月) 17:35:12.77 ID:qZcMxCLl0
>>10-11
摩訶不思議ですね〜
いずれにせよ戻ってて安心しました。
14名無しさん@お腹いっぱい。:2013/09/16(月) 17:44:07.15 ID:okVXgfDbP
修正おつかれさまです

α4も大丈夫でした
15 ◆JouJaku.IYSv :2013/09/16(月) 18:26:02.56 ID:E6LpH9zS0
>>8

バグでしたか。モロそのバグに引っかかって悩んでました。
今Alpha 4で動作を確認しました。
16 ◆Meriken//XXX :2013/09/16(月) 18:40:29.99 ID:qZcMxCLl0
>>15
いや〜申し訳ないです… そろそろプロセス間通信周りを綺麗に書き直したいんですが、
デバッグの手間を考えるとなかなか踏ん切りがつきません。
17名無しさん@お腹いっぱい。:2013/09/16(月) 23:59:46.48 ID:Hbh3MH0b0
質問すみませんが
Alpha 4の「キーに使用する文字」の
「半角と全角」と「すべて」の違いは何でしょうか?
Alpha 4のデフォルトですと「すべて」ではなく「半角と全角」が選択されるようですが
Alpha 2以前の「すべて」に相当するのは
Alpha 4の場合は「半角と全角」になるのでしょうか?
18名無しさん@お腹いっぱい。:2013/09/17(火) 01:08:10.52 ID:cQ7VTAce0
上で質問した者ですが
各種診断を使ってみましたところ
1.1FE Alpha 4で「キーに使用する文字」が「半角と全角」の場合は

> 【キーに使用する文字】1バイト文字のみ

になって「すべて」の場合は

> 【キーに使用する文字】すべて

になっているようですので
1.1FE Alpha 2以前の「すべて」と同じ設定にするには
1.1FE Alpha 4でも「すべて」にしないといけないということでしょうか

実はこちらで12桁検索に使っているPCが
Core2 Duo E7600+Radeon HD6850の古いPCなのですが
1.1FE Alpha 2→1.1FE Alpha 4に入れ替えましたところ
12桁の検索速度が落ちてしまいましたので
「キーに使用する文字」が原因がどうかを知りたかったのです
長くなりますが以下診断の結果を張っておきます
OSはWin7 x64+Catalyst 13.5beta2です

※こちらの環境ではCatalyst 13.6beta以降(〜13.10betaまで)を使うと
MTFのバージョンに関係なく12桁のGPU検索速度が落ちてしまうので13.5beta2を使っています
19名無しさん@お腹いっぱい。:2013/09/17(火) 01:09:10.52 ID:cQ7VTAce0
・1.1FE Alpha 2で「キーに使用する文字」が「すべて」の場合

【診断の種類】検索速度(1パターン)
【Meriken's Tripcode Finderのバージョン】1.1 Free Edition Alpha 2

【検索デバイス】GPUとCPU
【使用するGPU】すべて使用

【1CUあたりのワークアイテムの数(OpenCL)】自動
【1WGあたりのワークアイテムの数(OpenCL)】自動
【1GPUあたりの検索プロセスの数(OpenCL)】1
【1検索プロセスあたりの検索スレッドの数(OpenCL)】2
【CPUの命令セット】x64 + SSE2/AVX
【CPU検索スレッドの数】1
【SHA-1ハッシュ値生成の最適化(CPU)】最大
【検索プロセスの優先度】通常以下
【GUIフロントエンドの優先度】通常

【トリップの種類】12桁
【キーに使用する文字】すべて
【検索パターン】 10文字完全前方一致1個

【10分間の平均速度】 819.11M tripcode/s
【GPU検索の平均速度】 805.41M tripcode/s
【CPU検索の平均速度】 13.70M tripcode/s
20名無しさん@お腹いっぱい。:2013/09/17(火) 01:10:13.06 ID:cQ7VTAce0
・1.1FE Alpha 4で「キーに使用する文字」が「半角と全角」の場合

【診断の種類】検索速度(1パターン)
【Meriken's Tripcode Finderのバージョン】1.1 Free Edition Alpha 4

【検索デバイス】GPUとCPU
【使用するGPU】すべて使用

【1CUあたりのワークアイテムの数(OpenCL)】自動
【1WGあたりのワークアイテムの数(OpenCL)】自動
【1GPUあたりの検索プロセスの数(OpenCL)】1
【1検索プロセスあたりの検索スレッドの数(OpenCL)】2
【CPUの命令セット】x64 + SSE2/AVX
【CPU検索スレッドの数】1
【SHA-1ハッシュ値生成の最適化(CPU)】最大
【検索プロセスの優先度】通常以下
【GUIフロントエンドの優先度】通常

【トリップの種類】12桁
【キーに使用する文字】1バイト文字のみ
【検索パターン】 10文字完全前方一致1個

【10分間の平均速度】 817.08M tripcode/s
【GPU検索の平均速度】 802.93M tripcode/s
【CPU検索の平均速度】 14.16M tripcode/s
21名無しさん@お腹いっぱい。:2013/09/17(火) 01:11:01.48 ID:cQ7VTAce0
・1.1FE Alpha 4で「キーに使用する文字」が「すべて」の場合

【診断の種類】検索速度(1パターン)
【Meriken's Tripcode Finderのバージョン】1.1 Free Edition Alpha 4

【検索デバイス】GPUとCPU
【使用するGPU】すべて使用

【1CUあたりのワークアイテムの数(OpenCL)】自動
【1WGあたりのワークアイテムの数(OpenCL)】自動
【1GPUあたりの検索プロセスの数(OpenCL)】1
【1検索プロセスあたりの検索スレッドの数(OpenCL)】2
【CPUの命令セット】x64 + SSE2/AVX
【CPU検索スレッドの数】1
【SHA-1ハッシュ値生成の最適化(CPU)】最大
【検索プロセスの優先度】通常以下
【GUIフロントエンドの優先度】通常

【トリップの種類】12桁
【キーに使用する文字】すべて
【検索パターン】 10文字完全前方一致1個

【10分間の平均速度】 814.97M tripcode/s
【GPU検索の平均速度】 800.87M tripcode/s
【CPU検索の平均速度】 14.11M tripcode/s
22名無しさん@お腹いっぱい。:2013/09/17(火) 01:12:47.88 ID:cQ7VTAce0
ということで1.1FE Alpha 4で確かに12桁のCPU検索速度は上がっているのですが
逆にGPU検索速度が落ちてしまっていて
全体としては1.1FE Alpha 2の方が検索速度が上になります
検索デバイスをGPUのみにしても傾向は変わりません

あと診断ですと差はわずかですので無視してもよかったのですが
実際にYggdrasilに参加した状態では

・1.1FE Alpha 2での場合GPU検索速度が約675MTPS〜約700MTPSの間で変動(約700MTPSの場合が優勢)
CPU検索速度は約13MTPSでほぼ一定

・1.1FE Alpha 4の場合は「キーに使用する文字」が「半角と全角」の場合でも「すべて」の場合でも
GPU検索速度が約650MTPS〜約675MTPSの間で変動(ほぼ均等)
CPU検索速度は約13MTPS〜約13.1MTPSの間で変動

となって平均検索速度で言えば1.1FE Alpha 2の方が30MTPS程度上になります

まあこれでも誤差の範囲と言われればそうなると思いますが
Free Editionが出て以降ほぼ変わっていなかった12桁の検索速度が1.1FE Alpha 4で落ちてしまいましたので
一応ご報告しておきます
23 ◆Meriken//XXX :2013/09/17(火) 04:36:22.46 ID:7sJN/t4X0
>>17
> 「半角と全角」と「すべて」の違いは何でしょうか?

「半角と全角」の場合は全角文字の一部は使用されませんが、
「すべて」の場合は全部使用されます。
その代わり、「すべて」を選ぶとヒット率が3%ほど落ちます。

> Alpha 2以前の「すべて」に相当するのは
> Alpha 4の場合は「半角と全角」になるのでしょうか?

Alpha 2以前の「すべて」は、Alpha 4の「すべて」と同じです。
24 ◆Meriken//XXX :2013/09/17(火) 04:55:34.82 ID:7sJN/t4X0
>>18
あ〜診断の表示を変更するのを忘れてましたorz 診断の結果は正しいはずです。

>>19-22
詳しい報告有り難うございます。HD 5xxx/6xxxだとOpenCLコンパイラのバックエンドが
あまり賢くないせいか、ちょっとコードを変更するだけですぐに速度が落ちちゃうんですよね。
速度を戻すことが出来ないか試してみますが、難しいかもしれません。
25 ◆Meriken//XXX :2013/09/17(火) 11:23:18.74 ID:7sJN/t4X0
>>18
5770ではほぼ元の速度を出せるようになりました。
6850と5770のアーキテクチャは同じVLIW5なので、多分大丈夫でしょう。
26やんやん ◆yanyan/Pails :2013/09/17(火) 11:31:20.26 ID:VA97SuCR0
TITANでalpha4を試したところ、
1500M tripcode/s
いきました。
27 ◆Meriken//XXX :2013/09/17(火) 20:30:57.15 ID:7sJN/t4X0
>>26
お、こっちは速くなってますね。
しかしTITANももっと速くてもいいぐらいなんですけどね〜
自分でいじれないのがちと歯がゆいです。
28 ◆Meriken//XXX :2013/09/17(火) 21:13:17.75 ID:7sJN/t4X0
12桁トリップのCPU検索をアセンブラを使って書き直せないか現在思案中。
多分SSE2だけでも数割速くなるだろうし、AVX/AVX2ならさらにそこから
上乗せ出来そうなんですけど、どうかなあ。

というわけでちょっと調べたら、VecTripperに再利用出来るアセンブラのコードが
あったので、これを使うことにしました。ライセンス的にも問題ないようです。
1から書くのはなかなかしんどそうなので、ありがたいことです。
29 ◆Meriken//XXX :2013/09/17(火) 21:24:16.96 ID:7sJN/t4X0
そういやSHA-1のルーチンはかなり最適化してたから、
このままじゃ使えないんだよなあ。どうしたものか。
30 ◆Meriken//XXX :2013/09/17(火) 21:40:56.67 ID:7sJN/t4X0
SHA-1のルーチンをじっと眺めていたら、
キーの長さをSHA-1のブロックのサイズにあわせて64文字に
することによって、更に最適化出来そうなことに気づいてしまいましたw
今のままでも工夫してやればラウンドを2つループの外に追い出せそうです。
31 ◆Meriken//XXX :2013/09/17(火) 22:16:20.98 ID:7sJN/t4X0
あ、448bitだから64文字じゃなくて54文字か。
で、最大で最初の13個のラウンドを追い出せるわけね。
80個のラウンドのうちの13個ってかなり大きいよな。
単純に考えれば2割ほど高速化できる計算です。
だけど2chで56文字のキーなんて使えるのかしらんw
32 ◆Meriken//XXX :2013/09/17(火) 22:40:57.21 ID:7sJN/t4X0
54文字じゃなくて56文字だった。
56文字のキーは2chで普通に使えました。
でもMTFを56文字のキーに対応させるのは
さすがに手間が大きすぎるような…
まあこのネタは取っておいて、とりあえずアセンブラで書き直そうっと。
33名無しさん@お腹いっぱい。:2013/09/18(水) 07:15:46.99 ID:OzF80bCr0
>>23-25
どうもありがとうございます

アーキテクチャの違うハードを
それぞれ最適な性能が出るようにサポートするというのは
ものすごく手間のかかることと思います
お手数をおかけして申し訳ありませんでした
34やんやん ◆yanyan/Pails :2013/09/18(水) 08:38:51.53 ID:mB6Net9h0
>>27
どうもです。余分なグラフィックを切ってなかったり、
TITANのくせにPCI-Express2.0接続だったりするので、
TITANとしては遅いかもしれません。
GPGPUコンピューティンの時にはPCI-Expressバスの問題は
どうせCudaMemcopyなどは最小限にしてるでしょうから
関係ない気もしますが。
35名無しさん@お腹いっぱい。:2013/09/18(水) 17:03:41.23 ID:5Sc3kbYV0
MERIKENsTripcodeFinder_1.1_FE_Alpha_2 だと全く問題ないのに、
MERIKENsTripcodeFinder_1.1_FE_Alpha_4 だとエラーで動かないのは
何が原因と考えられますか?
36 ◆Meriken//XXX :2013/09/18(水) 17:16:42.94 ID:0UI9u6yeP
>>35
エラーの種類とか、出現条件とか、もうちょっと詳しくおながいします。


■ バグ報告用のテンプレ

バグを報告する際には下のテンプレを使ってなるべく詳しく
具体的に報告して下さい。

【症状】
【バージョン】MERIKEN's Tripcode Finder x.xx
【トリップの種類】12桁・10桁
【GPU】
【CPU】
【OS】
【Display Driver】
【その他】
37名無しさん@お腹いっぱい。:2013/09/18(水) 18:01:45.41 ID:VtUincUUP
12桁のトリップのYggdrasilでの分散探索についてですが

2chは64文字より長いトリップキーが使えるということは

SHA1で1ブロック目の計算はサーバーでやって

1ブロック目で使われる最初の64文字のキーはクライアントに送らずに
2ブロック目以降で必要になる1ブロック目から計算される情報だけをクライアントに送り

クライアントは2ブロック目以降をランダムに生成してトリップを探索する

こうすれば1ブロック目のキーはサーバしか分からないからリバースエンジニアリングされてもクライアントに漏洩されずに済む


こんなのを考えたんですがどうでしょうか
38名無しさん@お腹いっぱい。:2013/09/18(水) 18:03:53.95 ID:VtUincUUP
発見されるトリップのキーが常に64文字以上になるのが欠点ですが
39 ◆Meriken//XXX :2013/09/18(水) 18:50:04.20 ID:0UI9u6yeP
>>33
いや〜これ気づかずに放置するところでした。ありがとうございました。
MTFはトリップ検索ツールの決定版を目指しているので、
まだまだこれからですw ちょっとまとまったお金が入りそうなので、
物欲に任せてi7-4770Kとマザボを買おうかどうか迷っているところです。
40 ◆Meriken//XXX :2013/09/18(水) 19:07:56.67 ID:0UI9u6yeP
>>37-38
これは非常に面白いですねえ。キーの漏洩が原理的に不可能というのは
かなり美味しいです。キーの長さは実際どうなんでしょうねえ。
試しに遊びで56文字モードを付けてみようかしらん。
41名無しさん@お腹いっぱい。:2013/09/18(水) 20:07:49.89 ID:f7vVWxxs0
>>40
非常に面白いけど、メッセージの途中までを依頼側が制御できてしまうってのは色々アレですね。
SHA-1で署名されてるメッセージのラスト以外を捏造したSHA-1中間状態で依頼して…みたいな。
MD5で衝突させた実験はいくつかあったけどSHA1でやれるとちょっと面白い(では済まない?)かも。
42 ◆Meriken//XXX :2013/09/19(木) 02:49:03.85 ID:sTJqqQfeP
>>41
私はクラッキングには興味が無いですけど、クラッキングに分散処理を利用するというのは
ありなのかもしれませんねえ。Bitcoinマイナーみたいなのにそういうコードを
入れといてもわからないでしょうからね。
43 ◆Meriken//XXX :2013/09/19(木) 03:23:02.42 ID:sTJqqQfeP
一応>>30-32をまとめておきます。

・トリップのキーの長さをSHA-1のブロックの大きさに合わせて56文字にすることで、
 12桁トリップ検索をさらに2割ほど高速化出来る。

・ループの内部ではW[13]に対応するキーの53文字目から56文字目のみを変化させる。

・SHA-1の最初の13個のラウンドはW[13]に依存しないので、
 あらかじめループの外で計算しておく。

・この方法はJens Steube氏のSHA-1ハッシュ値生成の最適化の手法と
 組み合わせることも可能。その際はW[0]ではなくW[13]を中心にして計算を行う。
 http://passwords12.at.ifi.uio.no/Jens_Steube/Jens_Steube_Passwords12.pdf

鳥屋氏はこのことに気づいていたみたいですが、なかなかにコロンブスの卵的な発想です。
44 ◆Meriken//XXX :2013/09/19(木) 04:55:49.99 ID:sTJqqQfeP
これ、こちらにも貼っておきますね。

> 24 : ◆Meriken//XXX : sage : 2013/09/19(木) 04:54:27.08
> そうそう、そろそろYggdrasilのAPIを新鯖に一本化したいので、バージョン1.0 (FE)以前の
> MTFをお使いな方はバージョン1.0.1 (FE)以降に更新をお願いします。
45 ◆Urotsuki/1Ca :2013/09/19(木) 07:23:10.54 ID:Ywt2cZ170
次のα版に乗り換えるかな…
46 ◆Meriken//XXX :2013/09/19(木) 07:46:53.91 ID:sTJqqQfeP
>>45
結構いろいろ改善されているのでぜひどうぞw
>>43の実装がいつになるのかはちょっと分かりませんが…
47 ◆Meriken//XXX :2013/09/19(木) 07:56:24.04 ID:sTJqqQfeP
現在VecTripperのSHA-1のアセンブラのコードをせっせとMTFに移植中です。
とりあえずAVXで最初の14個のラウンドが動作することを確認しましたが、
かなり速いです。さすがです。これはかなり期待できそうです。
48 ◆Meriken//XXX :2013/09/19(木) 09:55:12.24 ID:sTJqqQfeP
20回目のラウンドまで変換出来ました。
かなり最適化されたコードみたいで期待大ですが、
気を使う作業なのでとにかく疲れます。
続きは明日以降にしておきます。
49やんやん ◆yanyan/Pails :2013/09/19(木) 13:04:17.26 ID:yhS2wnZ30
アセンブラまで手を出していたのですね。おつかれさまです。
50 ◆Meriken//XXX :2013/09/19(木) 14:09:31.68 ID:sTJqqQfeP
アセンブラでないと限界まで速度を出せないですからね〜
10桁は書き換えたので次は12桁というわけです。
51 ◆Meriken//XXX :2013/09/19(木) 15:17:00.67 ID:sTJqqQfeP
ご飯を食べて元気が出たので、素のSHA-1のルーチンを一気にAVXで書き換えてしまいました。
結果は上々で、2割ほど速度が上がっています。もうちょっといじれば3割まで行きそうな
感じです。

ここまではわりとすんなりと行きましたが問題はこれからで、今度は特殊な最適化を施してある
SHA-1のルーチンを書き換えなければなりません。これは1から書くしかないので、
少しづつ進めていくことにします。
52 ◆Meriken//XXX :2013/09/19(木) 18:40:13.43 ID:sTJqqQfeP
あれから素のSHA-1のルーチンの関数呼び出しのオーバーヘッドを
削って、合わせて27%の速度向上となりました。
VecTripperのルーチンは命令を削れるだけ削ってあるという印象です。
素晴らしいです。

最適化済みのルーチンもこんなふうに自分で書き直せればいいけど、
どうでしょうねえ〜
53 ◆JouJaku.IYSv :2013/09/19(木) 19:10:47.14 ID:SvlqUu4y0
>>39
AVX2対応キターーー! ヽ(´Д`)ノ

AVX2が目的でHaswellを選ぶなら、高いK付きを選ぶ必要は無いと思います。
HaswellはAVXを使うと極端にOC耐性が落ちます。更に殻割り+液体金属必須です。
K無しを定格で使うのが良い、とK付きで殻割りOCまで試した私は思います。
54 ◆Meriken//XXX :2013/09/19(木) 19:52:17.36 ID:sTJqqQfeP
>>53
確かにK付きはいらないですねえ。開発機の3770KもOC切っちゃったし…
その代わりにマザボを奮発してQuad CrossFireが出来るのにしようかな。
AVX-512がコンシューマー市場に下りてくるのは当分先でしょうしね。
55 ◆Meriken//XXX :2013/09/19(木) 19:53:29.45 ID:sTJqqQfeP
最適化されたルーチンをじっと眺めてたらなんだか出来そうな気がしてきたぞ。
56 ◆Meriken//XXX :2013/09/19(木) 22:14:58.88 ID:sTJqqQfeP
おもむろに少し書き換えてみたらうまくいきましたw
こりゃ思ったよりずっと簡単かも。
57 ◆Urotsuki/1Ca :2013/09/19(木) 22:45:49.09 ID:Ywt2cZ170
開発が進んでいるようで何よりです
自分はPCの計算力を提供するぐらいしかできませんけど…
58 ◆Meriken//XXX :2013/09/20(金) 04:43:57.64 ID:PXGklweqP
いやいや、それだけで十分すぎですw
うろつきさん、めちゃ速いですしね。
59 ◆Meriken//XXX :2013/09/20(金) 04:50:36.76 ID:PXGklweqP
最適化済みのSHA-1のルーチンのアセンブラでの書き換えは
半分終わりました。既に元のSSE2 Intrinsicsでの実装より大分速くなっています。
思い切って手を付けてみて正解でした。
60 ◆Meriken//XXX :2013/09/20(金) 11:51:06.76 ID:PXGklweqP
x64版のAVXでの書き換えは一応終了。
最適化されたルーチンは15%ほど速くなりました。
もうちょっと命令を削れそうな感じです。
61名無しさん@お腹いっぱい。:2013/09/20(金) 12:28:27.30 ID:rdeXteVM0
>>54
Z87のマザーだと、ASUS MAXIMUS VI EXTREMEがPCIe 3.0(x8/x16/x8/x8)駆動で最大だからQuad CrossFireするには勿体無さそうに思うけどな。
ttp://www.asus.com/jp/Motherboards/MAXIMUS_VI_EXTREME/#specifications

Quad CrossFireがPCIe 3.0(x16/x16/x16/x16)で動作保障してくれるマザーってあるんだっけ?
62 ◆Meriken//XXX :2013/09/20(金) 12:39:25.81 ID:PXGklweqP
>>61
MTFでつかうぶんにはPCIeの帯域はほとんど関係ないので問題なしです。
買うとしたら検索君1号用なので他の用途には使わないですしね。
もうちょっと安いのでもいいんですけど、スロットの配置がいいのが
ないんですよね〜
63 ◆Meriken//XXX :2013/09/20(金) 12:52:41.54 ID:PXGklweqP
命令を2つばかり削ってちょびっと速くなりました。
さすがに疲れたのこのへんにしときます。
後はこれをSSE2に移植して、32bit版を作らなきゃいけないんだよなあ。
まあのんびりやろうっと。

とりあえずAVX2対応の準備はできたので十分でしょう。
CPUだけで250M TPS出せるかもしれません。ぐへへへへ…
64 ◆Meriken//XXX :2013/09/20(金) 17:44:03.41 ID:PXGklweqP
SSE2版を作って命令を2オペランド化してみたらかえって元のより遅くなったぞorz
たくさん作ってもメンテするの大変だし、アセンブラのルーチンは
64bit AVX/AVX2専用にしちゃおうかなあ。

…と、ここまで考えてから試しにVecTripperの真似をしてvmovdqaをmovaps に
変えたら、それだけでもとより速くなりましたw なぜだ…
65 ◆JouJaku.IYSv :2013/09/20(金) 20:53:24.14 ID:BxgeVqsj0
>>61
ブリッジ挟んだなんちゃって仕様ならコレ。Haswellではありませんが。
ttp://www.asus.com/jp/Motherboards/P9X79E_WS/
なんちゃってなので、グラフィック用です。
大量のデータ転送を同時に行うGPGPU用途には使えません。

Nativeならこれくらい逝かないと無理です。
ttp://www.supermicro.com/products/motherboard/Xeon/C600/X9DRG-QF.cfm
66 ◆Meriken//XXX :2013/09/21(土) 01:51:06.93 ID:axiLYME3P
>>65
今回の購入のメインはHaswellなので、やっぱりASUSのM6Eですかね〜
いやあ、楽しみだなあ。
67 ◆Meriken//XXX :2013/09/21(土) 02:05:15.56 ID:axiLYME3P
最適化されたルーチンのSSE2への移植は完了しました。かなり速いです。
今まで58M TPSしか出ていなかったPhenom II X6で92M TPSでました。
Visual C++、効率が悪すぎだろう…
68 ◆Meriken//XXX :2013/09/21(土) 02:41:57.42 ID:axiLYME3P
というわけで、64bit版は最適化されたルーチンに
一本化することにしました。これで大分すっきりとしました。
あと32bitだとxmmレジスタの数が足りなさすぎなので、
アセンブラで書きなおすのはやめにしました。
これで後は念の為にもう一回テストするだけです。
69 ◆Meriken//XXX :2013/09/21(土) 02:55:33.92 ID:axiLYME3P
あ、でも最適化されたルーチンだけならレジスタ周りはそんなに厳しくないのか。
せっかくだから32bit版も書きなおそうかな。そうすれば大分すっきりするし…
70 ◆YSRKEN.ceVZZ :2013/09/21(土) 10:51:27.68 ID:oxIT9/ma0
>>67
>Visual C++
iclですらない……そりゃ徹底的にアセンブラしたら速いでしょうねw
これで私もCPUのみで15MTPS逝きそうですな……
71 ◆Meriken//XXX :2013/09/21(土) 14:05:50.24 ID:axiLYME3P
>>70
お、お久しぶりです。
Intelのも一応試してみたけどほとんど速度は変わりませんでしたよ。
まあそんなにうまい話は転がってないですね。
限界まで性能を出したいならコンパイラに頼らずに自分でやるしかないですね。
72最近アマガミをオールクリアしました ◆Ayatsuji/uFC :2013/09/21(土) 18:39:07.87 ID:oxIT9/ma0
>>71
>お久しぶりです
すみません、実は久しぶりというわけでもないのです。
うろつき ◆Urotsuki/1Caさんに見つけてもらったこの酉で最近はレスしてました。
諸事情により最近はノーパソをぶん回したまま放置ということができなかったので、レベルが上がりようがないという悲しみ……

ところで、複数PCで同じアカウントでログインしてゆぐちゃんに参加するとポイント(゚д゚)ウマーなんですよね?
73 ◆Meriken//XXX :2013/09/22(日) 01:22:54.37 ID:PJsMgXLsP
>>72
そういえばそうだったw そのトリップを見たのが久しぶりだったのでうっかりしてしまいました。
経験値はちゃんと加算されますよ。
74 ◆Meriken//XXX :2013/09/22(日) 05:48:35.29 ID:PJsMgXLsP
新しい12桁トリップのCPU検索のルーチンの32bit版も出来ました。
手元のCore 2 Duoで試したら4割近く速度が上がっています。
やっぱコンパイラの最適化は当てにならないなあ。
とにかく検索ルーチンのアセンブラでの書き直しは終わったので、
明日あたりにGUIの修正と最終テストを行って、新しい開発版をうpします。
75やんやん ◆yanyan/Pails :2013/09/22(日) 06:06:23.54 ID:RUJc3/SX0
wktk
76 ◆Urotsuki/1Ca :2013/09/22(日) 07:42:38.57 ID:B2mxp/B40
wktkですねこれは
しかし相変わらずの化け物じみた速度…
自分は契約Aの問題でこれ以上速度あげられないんだよなぁ
77 ◆shiexn/ngc :2013/09/22(日) 07:50:16.88 ID:XeDsKN+sP
同一トリップ 別キー なんてのもちゃんと出てくるんですな
78 ◆Meriken//XXX :2013/09/22(日) 09:52:31.01 ID:PJsMgXLsP
TITANより速いとか、これはもう買うしかないのではなかろうか。
発表は25日か〜

http://wccftech.com/amd-hawaii-r9290x-gpu-volcanic-islands-benchmark-results-exposed-fastest-gpu-planet-1020-mhz-clock-speed/=
79 ◆Meriken//XXX :2013/09/22(日) 10:39:11.32 ID:PJsMgXLsP
>>76
7970 CFにしては抑え気味だなと思ってたんですけど、
そういうことだったんですね。私もこれで結構ギリギリで、
しょっちゅうブレーカーを飛ばしていますw
80 ◆Meriken//XXX :2013/09/22(日) 10:41:44.63 ID:PJsMgXLsP
81 ◆Meriken//XXX :2013/09/22(日) 11:16:46.05 ID:PJsMgXLsP
>>72
あ、そうそう。私はアマガミはモジャ子で挫折しましたw
梨穂子ちゃんと先輩はなかなか良かったです。
82 ◆Meriken//XXX :2013/09/22(日) 13:39:01.91 ID:PJsMgXLsP
新しい開発版をうpしました。

MERIKEN's Tripcode Finder 1.1 Free Edition Alpha 5
http://www.meriken2ch.com/programming/merikens-tripcode-finder

Alpha 4からの主な変更点は以下の通りです。

・12桁トリップのCPU検索のAVXへの対応。
・12桁トリップのCPU検索の高速化。

CPUによってはかなり速くなっているようです。
診断の結果や前のバージョンとの比較を報告していただけると助かります。
83 ◆Meriken//XXX :2013/09/22(日) 17:15:27.23 ID:PJsMgXLsP
現在Meriken's Tripcode Engineの英語版を作成中。
プログラムに変更はすぐに終わったけど、
ドキュメントの翻訳が超めんどくさいです。
84 ◆MOYASIMaXI :2013/09/22(日) 17:54:35.42 ID:B1RUuJ9x0
>>82
お疲れ様です。
12桁検索(CPUのみ)の速度を見てみました。
検索パターンは、先頭一致6完一つと特殊の純8連です。

【OS】Win7 Pro 64bit SP1
【CPU】Core i5 3570
【CPU検索スレッドの数】4

検索開始10分後の平均速度
MTF 1.1 FE Alpha4 74.21M tripcode/s
MTF 1.1 FE Alpha5 91.94M tripcode/s

めっちゃ高速化してます。
85 ◆Meriken//XXX :2013/09/22(日) 18:58:57.07 ID:PJsMgXLsP
>>84
いい感じに速度が上がっていますね〜
AVXがかなり効いてるのかな?
i7-3770Kより差が大きいのはおいしすぎですね。
86 ◆Urotsuki/1Ca :2013/09/22(日) 19:02:33.93 ID:B2mxp/B40
おー新しいのきましたか
CPU関連の効率化だけかなー?
GPUメインにはあまり縁がないかなー…
取り敢えず測定してみようっと
87 ◆Meriken//XXX :2013/09/22(日) 19:14:24.81 ID:PJsMgXLsP
ぜひお願いします。CPUによってほんとに速度の変化がバラバラなんですよね。
88 ◆Urotsuki/1Ca :2013/09/22(日) 19:24:33.69 ID:B2mxp/B40
CPUの冷却が不安なので長い時間ぶん回せませんね…
取り敢えず結果です

【OS】Windows7 Pro 64bit SP1
【CPU】Intel Core i7-3930K(自動的に3.9GHzまでOC)
【CPU検索スレッドの数】12
【検索中の温度】 46〜59度(簡易水冷)
【検索パターン】先頭一致10完 1つ

検索開始5分後の平均速度
MTF 1.1 FE Alpha4 129.19M tripcode/s
MTF 1.1 FE Alpha5 160.65M tripcode/s

速度がかなり上がりました
OCしているので定格だとどうなるかわかりませんが上がり幅は同じだと思います
89 ◆JouJaku.HzIz :2013/09/22(日) 20:09:04.92 ID:vk+5V6ZE0
【診断の種類】検索速度(1パターン)
【MERIKEN's Tripcode Finderのバージョン】1.1 Free Edition Alpha 4, 5
【OS】Microsoft Windows 7 Ultimate 64bit SP1
【検索デバイス】CPUのみ
【CPU】Intel Core i7 [email protected]
【CPU検索スレッドの数】8 (HTon)
【検索プロセスの優先度】通常
【トリップの種類】12桁
【キーに使用する文字】すべて
【検索パターン】 10文字完全前方一致1個
【10分間のCPU検索の平均速度】104.66(a4) → 122.57(a5) M tripcode/s
【その他】MTEngine64 -c -t 8 -l 12

2割近く速度が上がってますね。AVX2対応が楽しみです。
90名無しさん@お腹いっぱい。:2013/09/22(日) 20:28:27.32 ID:Nb3CcrYX0
Win7 x64 / C2Q Q9650定格(3GHz)CPUのみ / 4スレッドでの
1.1FEα2 / 1.1FEα4 / 1.1FEα5の各バージョンの12桁検索の「各種診断」の実行結果です
共通
【診断の種類】検索速度(1パターン)
【検索デバイス】CPUのみ
【CPUの命令セット】x64 + SSE2/AVX
【CPU検索スレッドの数】自動 ※4スレッド
【SHA-1ハッシュ値生成の最適化(CPU)】最大 ※1.1FEα2 / 1.1FEα4のみ
【検索プロセスの優先度】通常以下
【GUIフロントエンドの優先度】通常
【トリップの種類】12桁
【検索パターン】 10文字完全前方一致1個

1.1FEα2
【キーに使用する文字】すべて
【10分間のCPU検索の平均速度】 53.94M tripcode/s

1.1FEα4
【キーに使用する文字】1バイト文字のみ ※半角と全角
【10分間のCPU検索の平均速度】 55.22M tripcode/s
【キーに使用する文字】すべて
【10分間のCPU検索の平均速度】 55.17M tripcode/s

1.1FEα5
【キーに使用する文字】半角と全角
【10分間のCPU検索の平均速度】 62.22M tripcode/s
【キーに使用する文字】すべて
【10分間のCPU検索の平均速度】 62.20M tripcode/s

結果
・1.1FEα4 / 1.1FEα5の【キーに使用する文字】の「半角と全角」と「すべて」の検索速度の違いはわずか
・1.1FEα2→1.1FEα4:約2.5%UP 1.1FEα2→1.1FEα5:約15.3%UP 1.1FEα4→1.1FEα5:約12.7%UP
91名無しさん@お腹いっぱい。:2013/09/22(日) 20:32:12.34 ID:K2dEp/NJ0
すいません、MTF1.1FEのalpha2〜4はどこかでDL出来ますでしょうか?
手違いで消してしまいましたw
92名無しさん@お腹いっぱい。:2013/09/22(日) 20:34:35.19 ID:TkU21XXd0
リンク先のファイル名を変えるだけで落とせたと思う。
93名無しさん@お腹いっぱい。:2013/09/22(日) 20:36:50.06 ID:K2dEp/NJ0
あ、なるほど気が付きませんでした
無事落とせました
94名無しさん@お腹いっぱい。:2013/09/22(日) 22:59:02.04 ID:K2dEp/NJ0
【検索デバイス】GPUとCPU
【OS】 windows7 HP 64bit SP1
【使用するGPU】AMD Radeon HD 5570/5670 (OpenCL)
【1CUあたりのワークアイテムの数(OpenCL)】自動
【1WGあたりのワークアイテムの数(OpenCL)】自動
【1GPUあたりの検索プロセスの数(OpenCL)】1
【1検索プロセスあたりの検索スレッドの数(OpenCL)】2
【CPUの命令セット】x64 + SSE2/AVX
【CPU検索スレッドの数】自動
【SHA-1ハッシュ値生成の最適化(CPU)】最大
【検索プロセスの優先度】通常以下
【GUIフロントエンドの優先度】通常

【トリップの種類】12桁
【キーに使用する文字】すべて
【検索パターン】 10文字完全前方一致1個
α2
【10分間の平均速度】 366.70M tripcode/s
【GPU検索の平均速度】 340.43M tripcode/s
【CPU検索の平均速度】 26.27M tripcode/s
α4
【10分間の平均速度】 366.74M tripcode/s
【GPU検索の平均速度】 340.08M tripcode/s
【CPU検索の平均速度】 26.66M tripcode/s
α5
【10分間の平均速度】 364.47M tripcode/s
【GPU検索の平均速度】 340.61M tripcode/s
【CPU検索の平均速度】 23.86M tripcode/s

計測報告は初めてですがこんな感じでいいのでしょうか?
因みにα3はバグがあるとスレの初めに話題になってたようなので除外しました
95名無しさん@お腹いっぱい。:2013/09/22(日) 23:11:48.99 ID:K2dEp/NJ0
診断ではα5のCPU効率が若干低下してますが
検索実測でもα5はα2、4に比べてGPUCPU共
似たような効率低下傾向があるようです
96名無しさん@お腹いっぱい。:2013/09/22(日) 23:14:16.64 ID:K2dEp/NJ0
あ、これだとCPUが載ってないですね
CPUは intel core i5-750 2.66GHz定格使用です
97名無しさん@お腹いっぱい。:2013/09/23(月) 00:19:21.07 ID:s2zOHAYz0
>>17-22を書いた者ですが
1.1FE Alpha 5で1.1FE Alpha 2と同等以上の検索速度になりました
どうもありがとうございました

・1.1FE Alpha 5の各種診断で「キーに使用する文字」が「半角と全角」の場合
【トリップの種類】12桁
【キーに使用する文字】半角と全角
【検索パターン】 10文字完全前方一致1個

【10分間の平均速度】 820.98M tripcode/s
【GPU検索の平均速度】 805.08M tripcode/s
【CPU検索の平均速度】 15.90M tripcode/s

・1.1FE Alpha 5の各種診断で「キーに使用する文字」が「すべて」の場合
【トリップの種類】12桁
【キーに使用する文字】すべて
【検索パターン】 10文字完全前方一致1個

【10分間の平均速度】 820.92M tripcode/s
【GPU検索の平均速度】 805.02M tripcode/s
【CPU検索の平均速度】 15.90M tripcode/s

・Yggdrasilに参加して検索開始10分後の平均検索速度
1.1FE Alpha 2: 694.95MTPS (GPU: 681.99M, CPU: 12.96M)
1.1FE Alpha 4: 665.13MTPS (GPU: 652.14M, CPU: 12.99M)
1.1FE Alpha 5: 695.23MTPS (GPU: 680.68M, CPU: 14.56M)
98shirawa@mmo ◆GTExxuWcjk/9 :2013/09/23(月) 05:07:53.88 ID:jhI3+7LxP
【診断の種類】検索速度(1パターン)
【Meriken's Tripcode Finderのバージョン】1.1 Free Edition Alpha 4 → Alpha 5

【検索デバイス】GPUとCPU
【使用するCPU】Intel Core i7-3770 CPU @ 3.40GHz
【使用するGPU】NVIDIA GeForce GTX 660 (CUDA)

【1SMあたりのブロック数(CUDA)】自動
【CPUの命令セット】x64 + SSE2/AVX
【CPU検索スレッドの数】自動
【SHA-1ハッシュ値生成の最適化(CPU)】最大
【検索プロセスの優先度】通常以下
【GUIフロントエンドの優先度】通常

【トリップの種類】12桁
【キーに使用する文字】すべて
【検索パターン】 10文字完全前方一致1個

【10分間の平均速度】 622.09M tripcode/s → 635.74M tripcode/s
【GPU検索の平均速度】 535.55M tripcode/s → 534.50M tripcode/s
【CPU検索の平均速度】 86.54M tripcode/s → 101.25M tripcode/s
99累計 ◆wop.8OO8.qow :2013/09/23(月) 05:25:17.49 ID:J8box9ZP0
【診断の種類】検索速度(1パターン)
【Meriken's Tripcode Finderのバージョン】1.1FEα5/1.1FEα4/1.0.1(安定版)

【検索デバイス】CPUのみ (i7 M620 @2.67GHz)

【CPUの命令セット】x64 + SSE2
【CPU検索スレッドの数】自動
【検索プロセスの優先度】アイドル
【GUIフロントエンドの優先度】アイドル

【トリップの種類】12桁
【キーに使用する文字】半角(※1バイト文字のみ)
【検索パターン】 10文字完全前方一致1個

【10分間のCPU検索の平均速度(TPS)】

  1.1FEα5  1.1FEα4  1.0.1(安定版)
------------------------------------
1)  27.84M   30.51M   31.67M
2)  27.80M   30.50M   31.77M
3)  27.69M   30.58M   31.67M
4)  27.85M   30.54M   31.68M
5)  27.83M   30.54M   31.64M
100 ◆Meriken//XXX :2013/09/23(月) 05:48:41.37 ID:PDVnzk32P
皆さん詳しい報告を有り難うございます。
どうもNehalemだけ遅くなっているようですね。難しスギィ!
101 ◆LoveNico9g :2013/09/23(月) 06:02:36.35 ID:f6HE7yZK0
【診断の種類】検索速度(1パターン)
【Meriken's Tripcode Finderのバージョン】1.1 Free Edition Alpha 3 -> 1.1 Free Edition Alpha 5
【OS】Windows 7 Professional SP1

【検索デバイス】GPUとCPU
【使用するGPU】すべて使用
【GPU】GeForve GTX 650
【CPU】Ibtel Core i3-3220 CPU @ 3.30Ghz

【1SMあたりのブロック数(CUDA)】8
【CPUの命令セット】x64 + SSE2/AVX
【CPU検索スレッドの数】1
【SHA-1ハッシュ値生成の最適化(CPU)】最大
【検索プロセスの優先度】アイドル
【GUIフロントエンドの優先度】アイドル

【トリップの種類】12桁
【キーに使用する文字】1バイト文字のみ
【検索パターン】 10文字完全前方一致1個

【10分間の平均速度】 215.90M tripcode/s -> 221.77M tripcode/s
【GPU検索の平均速度】 205.58M tripcode/s -> 207.19M tripcode/s
【CPU検索の平均速度】 10.32M tripcode/s -> 14.58M tripcode/s


すごい改善率
102 ◆Meriken//XXX :2013/09/23(月) 06:25:27.19 ID:PDVnzk32P
>>101
こりゃ凄いですねw 結構さがでるもんですね〜
103 ◆Meriken//XXX :2013/09/23(月) 06:38:01.05 ID:PDVnzk32P
■Alpha 3/4とAlpha5の12桁トリップのCPU検索の速度の比較

>>67 +58% Phenom II X6 AMD K10
>>101 +41% i3-3220 Ivy Bridge
>>84 +24% i5-3570 Ivy Bridge
>>88 +24% i7-3930K Sandy Bridge
>>89 +17% i7-4770K Haswell
>>98 +17% i7-3770 Ivy Bridge
>>90 +13% C2Q Q9650 Core
>>97 +12% C2D E7600 Core
>>99 -9% i7-M620 Nehalem
>>94 -11% i5-750 Nehalem

やっぱNehalemだけ遅くなってますねえ。残念…
VC++ 2010はNehalemに合わせて最適化されていたのかしらん。
まあでも他のアーキテクチャでは順当に速度が上がっていますね。
Hyper Threadingはないほうが効果がはっきり出るみたいです。
104 ◆Meriken//XXX :2013/09/23(月) 09:20:51.29 ID:PDVnzk32P
英語版を作って本家Slashdotにストーリーを投稿してみました。
ぜひVote Upをよろしくお願いいたしますw

Meriken's Tripcode Engine English 0.01 Released
http://slashdot.org/submission/2986003/merikens-tripcode-engine-english-001-released

Meriken's Tripcode Engine English
http://www.meriken2ch.com/programming/merikens-tripcode-engine-english/index.html
105名無しさん@お腹いっぱい。:2013/09/23(月) 09:21:02.61 ID:X4S3sHdy0
1.1FEα5の鯖との定期通信の間隔は
・検索開始3分後までが10秒ごと
・以降3分ごと
でよろしいでしょうか?
106 ◆Meriken//XXX :2013/09/23(月) 09:25:06.77 ID:PDVnzk32P
>>105
そうで〜す。このパラメーターはサーバー側で調整できるので、
サーバーが重くなってきたら増やすかもしれません。
107名無しさん@お腹いっぱい。:2013/09/23(月) 09:40:34.70 ID:rVyLE6uw0
【診断の種類】検索速度(1パターン)

【検索デバイス】CPUのみ
【CPU】Ibtel Core i7-980X CPU @ 4Ghz

【CPUの命令セット】x64 + SSE2/AVX
【CPU検索スレッドの数】自動
【SHA-1ハッシュ値生成の最適化(CPU)】最大
【検索プロセスの優先度】通常以下
【GUIフロントエンドの優先度】通常

【トリップの種類】12桁
【キーに使用する文字】1バイト文字のみ
【検索パターン】 10文字完全前方一致1個

【Meriken's Tripcode Finderのバージョン】1.1 Free Edition Alpha 4
【10分間のCPU検索の平均速度】 148.51M tripcode/s

【Meriken's Tripcode Finderのバージョン】1.1 Free Edition Alpha 5
【10分間のCPU検索の平均速度】 129.78M tripcode/s

結構落ちますね。 -15%弱ってところでしょうか。
108 ◆Meriken//XXX :2013/09/23(月) 10:18:13.77 ID:PDVnzk32P
>>107
これもWestmere-EPだからNehalemの仲間ですね。
うまい具合にNehalemだけ検出できないかなあ。
109 ◆Meriken//XXX :2013/09/23(月) 10:42:19.95 ID:PDVnzk32P
WikipediaにCPUIDが載ってたけど、これほんとに当てになるのかな〜

> 0x0206e6, 0x0106a4, 0x0106a5, 0x0106e4, 0x0106e5
http://en.wikipedia.org/wiki/Nehalem_(microarchitecture)

> 0x0206f2, 0x0206c2, 0x020652, 0x020655
http://en.wikipedia.org/wiki/Westmere_(microarchitecture)

> 0x0206c0, 0x0206c1, 0x0206c2, 0x0206c3, 0x0206c4,
> 0x0206c5, 0x0206c6, 0x0206c7, 0x0206c8, 0x0206c9,
http://en.wikipedia.org/wiki/Gulftown
110 ◆YSRKEN.ceVZZ :2013/09/23(月) 11:16:32.76 ID:R2WGY9Wb0
>>81
棚町(と七咲)は☆獲得に会話イベントでアタック成功させないと駄目な娘なので……
順番を見るに、WikiのFAQを読みながらやったパターンですかね?
>>82
乙です。早速ベンチしてみますね。
>>108
前に「GPU毎に処理方法変える為にデータベース作るか」と言われていたことを思い出しました……
111名無しさん@お腹いっぱい。:2013/09/23(月) 11:25:52.53 ID:FllI0LcA0
こんな情報がありました

Intel Architecture and Processor Identification With CPUID Model and Family Numbers
ttp://software.intel.com/en-us/articles/intel-architecture-and-processor-identification-with-cpuid-model-and-family-numbers

Nehalem / Westmere世代は

[45nm]
Bloomfield / Nehalem-EP : 0x106Ax
Lynnfield / Clarksfield / Jasper Forest : 0x106Ex
Nehalem-EX : 0x206Ex

[32nm]
Clarkdale / Arrandale : 0x2065x
Gulftown / Westmere-EP : 0x206Cx
Westmere-EX : 0x206Fx

あたりでしょうか
112やんやん ◆yanyan/Pails :2013/09/23(月) 11:37:42.83 ID:BVWtjWSi0
【診断の種類】検索速度(1パターン)
【Meriken's Tripcode Finderのバージョン】1.1 Free Edition Alpha 5

【検索デバイス】CPUのみ
【CPU】Intel Xeon W5590 ×2 (3.33GHz)

【CPUの命令セット】x64 + SSE2/AVX
【CPU検索スレッドの数】自動
【検索プロセスの優先度】通常以下
【GUIフロントエンドの優先度】通常

【トリップの種類】12桁
【キーに使用する文字】すべて
【検索パターン】 10文字完全前方一致1個

【10分間のCPU検索の平均速度】 84.98M tripcode/s
113 ◆Meriken//XXX :2013/09/23(月) 12:30:59.59 ID:PDVnzk32P
>>112
やっぱりNehalemだと駄目ですね〜

>>111
これで正解ですね。助かります。
Nehalemを検出したら元のルーチンを使うように修正しておきました。
時間のあるときに次の開発版をうpします。
114 ◆YSRKEN.ceVZZ :2013/09/23(月) 13:28:13.13 ID:R2WGY9Wb0
【診断の種類】検索速度(1パターン)
【Meriken's Tripcode Finderのバージョン】1.1 Free Edition Alpha 4→5

【検索デバイス】GPUとCPU
【使用するGPU】すべて使用

【1SMあたりのブロック数(CUDA)】256
【CPUの命令セット】x64 + SSE2/AVX
【CPU検索スレッドの数】4
【SHA-1ハッシュ値生成の最適化(CPU)】最大
【検索プロセスの優先度】通常
【GUIフロントエンドの優先度】通常

【トリップの種類】12桁
【キーに使用する文字】1バイト文字のみ
【検索パターン】 10文字完全前方一致1個

【 5分間の平均速度】 96.97→102.79M tripcode/s
【GPU検索の平均速度】 64.32→64.30M tripcode/s
【CPU検索の平均速度】 32.64→38.49M tripcode/s

※CPUのみだと36.95→42.76M tripcode/s。ちなみに当方はi5-3210M=Ivy Bridge。
115名無しさん@お腹いっぱい。:2013/09/23(月) 14:06:20.22 ID:C6NktFR4P
core i7 2700K 定格 HTオン 8スレッド

84Mから105Mに上がりました
116名無しさん@お腹いっぱい。:2013/09/23(月) 16:21:00.62 ID:L5Ap3lnA0
>>104
> 英語版を作って本家Slashdotにストーリーを投稿してみました。
って事は、これからは外人さんも参加してくれる?
一気に人数が増えるといいな。
117名無しさん@お腹いっぱい。:2013/09/23(月) 19:43:23.12 ID:dFD9pehG0
>>106
ご回答ありがとうございました
118 ◆Meriken//XXX :2013/09/23(月) 20:09:33.41 ID:PDVnzk32P
>>114
>>115
やっぱりNehalem以外では速くなってるんですよねえ…
コンパイラの吐いたコードを調べてみようっと。
119 ◆Meriken//XXX :2013/09/23(月) 20:12:23.78 ID:PDVnzk32P
新しい開発版をうpしました。

MERIKEN's Tripcode Finder 1.1 Free Edition Alpha 6
http://www.meriken2ch.com/programming/merikens-tripcode-finder

Alpha 5からの主な変更点は以下の通りです。

・Nehalem系のCPUで12桁トリップのCPU検索が遅くなる不具合の修正。

引き続き前のバージョンとの速度の比較を報告していただけると助かります。
120 ◆Meriken//XXX :2013/09/23(月) 20:36:25.71 ID:PDVnzk32P
コンパイラの吐いた無駄だらけのコードを見てたら、movapsの代わりに
movdqaを使っていました。まさかこれが原因じゃあるまいな…
121名無しさん@お腹いっぱい。:2013/09/23(月) 21:10:26.07 ID:zKQ1y1q50
古いバージョンもあると比較しやすいのかな?
122107:2013/09/23(月) 21:39:06.57 ID:rVyLE6uw0
【Meriken's Tripcode Finderのバージョン】1.1 Free Edition Alpha 6
【10分間のCPU検索の平均速度】 148.50M tripcode/s

とりあえず、戻ったようです。
12394:2013/09/23(月) 21:52:01.56 ID:AdWli9Lo0
α6試してみました
条件は>>94と同一です

【10分間の平均速度】 366.80M tripcode/s
【GPU検索の平均速度】 340.25M tripcode/s
【CPU検索の平均速度】 26.55M tripcode/s

α4の水準に戻ったようです
中身的には暫定的にNehalemを検出してα4のプログラムで
処理してる感じでしょうか?
共通プログラムで全CPUを網羅するのは
なかなか難しいのですね
124累計 ◆wop.8OO8.qow :2013/09/23(月) 23:33:54.95 ID:J8box9ZP0
条件は>>99と変わらず、1.1FEα6のみ検索速度(1パターン)を診断

【10分間のCPU検索の平均速度(TPS)】

   1.1FEα6  1.1FEα5   1.1FEα4  1.0.1(安定版)
----------------------------------------------
1)  31.89M   27.84M   30.51M   31.67M
2)  31.88M   27.80M   30.50M   31.77M
3)  31.97M   27.69M   30.58M   31.67M
4)  31.88M   27.85M   30.54M   31.68M
5)  31.89M   27.83M   30.54M   31.64M

よかったよかったw
125 ◆Urotsuki/1Ca :2013/09/23(月) 23:47:40.78 ID:fLgQz4cK0
修正お疲れ様ですー
明日以降入れとこう…

そろそろ本気だす
126 ◆Meriken//XXX :2013/09/24(火) 03:05:07.93 ID:SuYpLKhoP
ちゃんとNehalemを検出できているようですね。かったよかった。

Nehalemを使っている人(Alpha 5で遅くなった人)は
ぜひこちらも試してみてください。

http://www.meriken2ch.com/files/2013-09-23-Nehalem.zip

元のファイルに上書きすれば使えます。
あくまでも実験なので、元のファイルは取っておいてください
127 ◆Meriken//XXX :2013/09/24(火) 03:06:37.34 ID:SuYpLKhoP
>>125
> そろそろ本気だす

おお、期待してますよw
128 ◆Meriken//XXX :2013/09/24(火) 03:12:46.79 ID:SuYpLKhoP
と書いたあとでゆぐちゃんの速度見たら凄いことになってたw
うろつきさんもさすがですし、◆QZshizo.ptHさんもおひさしぶりですね〜
129 ◆Meriken//XXX :2013/09/24(火) 06:44:32.39 ID:SuYpLKhoP
これ、こっちにも貼っておこうっと。

> 43 :◆Meriken//XXX :sage :2013/09/24(火) 06:42:26.23
> ゆぐちゃんの紹介のために、今度は日本語版のSlashdotにストーリーを
> 投稿してみました。採用されるように、是非評価を上げてやってくださいw
>
> http://slashdot.jp/recent
>
> GPGPUによる分散トリップ検索サービス「Meriken's Tripcode Yggdrasil」
> http://slashdot.jp/submission/52745
http://toro.2ch.net/test/read.cgi/esite/1379214816/43n
130 ◆Meriken//XXX :2013/09/24(火) 08:00:59.39 ID:SuYpLKhoP
>>123
> 中身的には暫定的にNehalemを検出してα4のプログラムで
> 処理してる感じでしょうか?

その通りです。

> 共通プログラムで全CPUを網羅するのは
> なかなか難しいのですね

実際かなり難しいですね。試せる環境が手元にないのが大きいです。
>>126のバージョンでは新しいルーチンに手を入れてるので、
Nehalemでも高速化できるかもしれません。
131名無しさん@お腹いっぱい。:2013/09/24(火) 12:09:59.10 ID:aK0ZMOZo0
Yggdrasilで検索中のPC一覧で見ることの出来る「名前」の項目のデータは編集できますか?
13294:2013/09/24(火) 12:11:45.67 ID:XhDzCs6d0
お疲れ様です
>>126を試してみました
条件は>>94です

【10分間の平均速度】 370.88M tripcode/s
【GPU検索の平均速度】 340.61M tripcode/s
【CPU検索の平均速度】 30.27M tripcode/s

診断ではCPUの効率向上
実測でもCPU24.54→27.47Mt/sという結果でした
133 ◆Meriken//XXX :2013/09/24(火) 12:29:58.12 ID:SuYpLKhoP
>>132
キタ━━━━(゚∀゚)━━━━!! やっぱりmovapsが原因だったんですね。

他のCPUだとSSE2でmovapsを使ったほうが速いのに、
Nehalemだけmovdqaを使ったほうが速いようです。
こんなの普通わからないっちゅうねん。
なんにせよ助かりました。次の開発版に取り込んでおきます。
134やんやん ◆yanyan/Pails :2013/09/24(火) 13:55:53.22 ID:yDbtGzZA0
>>126でα5からの性能向上を確認
Before
【Meriken's Tripcode Finderのバージョン】1.1 Free Edition Alpha 5
【10分間のCPU検索の平均速度】 84.98M tripcode/s
After
【Meriken's Tripcode Finderのバージョン】>>126 のNehalem用
【10分間のCPU検索の平均速度】 97.66M tripcode/s
135 ◆Meriken//XXX :2013/09/24(火) 14:22:53.52 ID:SuYpLKhoP
>>131
MTFの「分散処理」タグで編集できますよ。次からはゆぐちゃんスレでお願いします。

【分散トリップ検索】Meriken's Tripcode Yggdrasil
(p)http://toro.2ch.net/test/read.cgi/esite/1379214816/
136 ◆Meriken//XXX :2013/09/24(火) 14:24:13.91 ID:SuYpLKhoP
>>134
ありがとうございます。ようやくこれで安心して寝られますw
137 ◆Urotsuki/1Ca :2013/09/24(火) 15:36:32.45 ID:hElffOfN0
電気料金の関係で当分稼働できそうにない…
すみません…
138やんやん ◆yanyan/Pails :2013/09/24(火) 16:26:07.84 ID:yDbtGzZA0
On some (but not all) micro-architectures, there are timing differences due to "domain crossing penalties".
For this reason, one should generally use movdqa when the data is being used with integer SSE instructions,
and movaps when the data is being used with floating-point
instructions. For more information on this subject,
consult the Intel Optimization Manual,
or Agner Fog's excellent microarchitecture guide.
Note that these delays are most often associated with register-register moves instead of loads or stores.

だそうな、integerだったらmovqdnなんだと。マニアックすぐるw
139 ◆Meriken//XXX :2013/09/24(火) 16:37:03.17 ID:SuYpLKhoP
>>138
ところがNehalem以外だとintegerでもmovapsのほうが
movdqaよりも速いんですよねえ…
VC++ 2010はマニュアル通りにmovdqaを使ってましたけど、
それだとうまくいかないようです。
140 ◆Meriken//XXX :2013/09/24(火) 16:39:21.48 ID:SuYpLKhoP
>>137
電気料金は大きな壁ですよねえ…
今までお疲れ様でした。またいつでもお越しください。
141名無しさん@お腹いっぱい。:2013/09/24(火) 19:22:40.85 ID:HJd6RTmw0
>>139
何となくですが、
http://2chnull.info/r/jisaku/1326108518/338-354
これの347辺りからの話が、ヒントになりそうな?
これ以上は、各アーキ毎の最適化マニュアルの比較と、
マイクロアーキテクチャ自体の変更情報を全部追わないと、どこがネックになってるのかは
分からない気がするw

ちなみに>>107の環境で>>126を回した結果
【10分間のCPU検索の平均速度】 146.58M tripcode/s

あれ・・・あまり変わってない・・・なんでだろ。
142 ◆Meriken//XXX :2013/09/25(水) 15:05:37.51 ID:Q0OWgfvvP
>>141
> これ以上は、各アーキ毎の最適化マニュアルの比較と、
> マイクロアーキテクチャ自体の変更情報を全部追わないと、
> どこがネックになってるのかは分からない気がするw

リンク先の話は非常に興味深いですねえ。なかなか奥が深いです。

> あれ・・・あまり変わってない・・・なんでだろ。

同じNehalem系でもGulftown(Westmere-EP)は違うのかな?
難しすぎですねw
143 ◆Meriken//XXX :2013/09/25(水) 16:18:00.34 ID:Q0OWgfvvP
新しい開発版をうpしました。

MERIKEN's Tripcode Finder 1.1 Free Edition Alpha 7
http://www.meriken2ch.com/programming/merikens-tripcode-finder

Alpha 6からの主な変更点は以下の通りです。

・Nehalem系のCPUでの12桁トリップのCPU検索の高速化。
・10桁トリップのCPU検索の高速化。

>>126の成果を取り込んだついでに、10桁トリップ検索でもmovapsを使うように
しました。AVXに対応していない、Nehalem系以外のCPUでは、10桁トリップの
CPU検索は少し速くなっているはずです。
前のバージョンとの速度の比較を報告していただけると助かりますです。
144 ◆YSRKEN.ceVZZ :2013/09/25(水) 16:21:29.38 ID:HNdGVGJA0
>>143は私(x64+SSE2/AVX、Ivy Bridge)でも10桁が高速化するのでしょうか?
145 ◆Meriken//XXX :2013/09/25(水) 16:23:53.73 ID:Q0OWgfvvP
この週末に彼女が日本から遊びに来るので、開発はしばらくお休みです。
次の更新はHaswell購入後のAVX2対応になる予定です。
146 ◆Meriken//XXX :2013/09/25(水) 16:26:41.10 ID:Q0OWgfvvP
>>144
Ivy BridgeはAVXに対応しているので今回は速くなりません。
AVX版はまた今度書きなおす予定です。
147 ◆e7m8FSZy3U :2013/09/25(水) 19:34:02.12 ID:CggXwBge0
/.Jから飛んできました。
ちょっと面白そうなのでしばらく回してるかもです・・・
148 ◆e7m8FSZy3U :2013/09/25(水) 19:58:17.69 ID:CggXwBge0
あぁこれって何か。分散のみに参加するって出来ないのね
それはつまらんなぁ。
149 ◆Meriken//XXX :2013/09/25(水) 20:04:12.63 ID:Q0OWgfvvP
9文字ぐらいの適当な長いパターンをローカルで1つだけ指定してやれば、
分散のみに参加しているのと変わりないですよ。
150 ◆Meriken//XXX :2013/09/25(水) 20:42:15.70 ID:Q0OWgfvvP
Linux版を作っていた◆znjnB.IJwZLUさん、最近見かけないなあ。
忙しいのかしらん。AVXに最適化されたS-Boxをぜひ見せてもらいたかったんだけど、
自分でやったほうが早いのかな。

まあやることといったら全部レジスタで回すようにして、なるべく2バイトのVEX Prefixを
使うようにするだけだからなあ。でも言うのは簡単だけど、実際にやるのは大変そうだorz
151 ◆Meriken//XXX :2013/09/25(水) 20:56:27.53 ID:Q0OWgfvvP
定格のi7-3770Kだと10桁トリップのCPU検索の速度はこんなんです。

mty_win_x64_20071012: 21.72M TPS
MTF (AVX): 25.56M TPS

大分速くなったけど、もうちょっといけそうなんだよなあ…
152 ◆Meriken//XXX :2013/09/25(水) 20:59:08.78 ID:Q0OWgfvvP
6番目のS-Boxにvmovdqaが6個も残ってるぞ…
まずこいつらからやっつけないと。
153 ◆Meriken//XXX :2013/09/25(水) 22:23:57.84 ID:Q0OWgfvvP
vmovdqaを2つに減らすことが出来ましたが、一時変数が1つ増えて
速度は横這いです。難しすぎる…
154 ◆LoveNico9g :2013/09/26(木) 02:43:02.74 ID:sJOvmiPd0
【診断の種類】検索速度(1パターン)
【Meriken's Tripcode Finderのバージョン】1.1 Free Edition Alpha 5 -> 1.1 Free Edition Alpha 7
【OS】Windows 7 Professional SP1
【ディスプレイドライバ】320.57

【検索デバイス】GPUとCPU
【使用するGPU】すべて使用
【GPU】GeForve GTX 650
【CPU】Ibtel Core i3-3220 CPU @ 3.30Ghz

【1SMあたりのブロック数(CUDA)】8
【CPUの命令セット】x64 + SSE2/AVX
【CPU検索スレッドの数】1
【検索プロセスの優先度】アイドル
【GUIフロントエンドの優先度】アイドル

【トリップの種類】10桁
【キーに使用する文字】ASCII
【検索パターン】 10文字完全前方一致1個

【10分間の平均速度】 11.49M tripcode/s -> 11.68M tripcode/s
【GPU検索の平均速度】 9.20M tripcode/s -> 9.24M tripcode/s
【CPU検索の平均速度】 2.29M tripcode/s -> 2.44M tripcode/s
155 ◆Meriken//XXX :2013/09/26(木) 04:07:26.63 ID:6FvOHAWcP
>>154
報告有り難うございます。やっぱりちょこっとだけ速くなっていますね。
動的書き換えを行っているコードをいじるのに結構神経を使ったんですが、
6.5%の速度向上だから上出来なのかな?
156 ◆HwAeH9HsBC.d :2013/09/26(木) 04:34:59.26 ID:b6mTXvYaP
中間ステートを利用したら受け渡し所がなくても2ch上だけで安全にキーの交換ができるのか

80文字くらいのキーのテスト
157 ◆Meriken//XXX :2013/09/26(木) 06:00:51.07 ID:6FvOHAWcP
なかなか面白い発想ですけど、キーの一部が依頼ごとに違ってくると
複数の依頼を同時に検索することが出来ないので、ちと現実的ではないですねえ。
158名無しさん@お腹いっぱい。:2013/09/26(木) 06:35:44.10 ID:b6mTXvYaP
たしかに個人に依頼する場合はやっぱり一度に一人からの依頼しか処理できなくなりますが、Yggdrasilを使うなら大丈夫ですよね?
Yggdrasilに参加しながら自分の設定した文字列も検索する場合それの結果のキーまで64文字以上になっちゃいますが
あと自分のPCで発見した場合でもサーバから64文字を受け取らないといけなくなります

このときサーバが全クライアントに同じ64文字を使ってたら困るのは
サーバはクライアントごとにキーの最初の64文字を別のにして探索してもらえばよさそうです

あと依頼を1個解決した場合最初の64文字を切り替えないと次に他の依頼を解決したときに2人の別の人に同じ64文字が流出するので
依頼を解決するごとにサーバから新しい最初の64文字を受け取る必要があります

で、OpenCLの1回のワークのまとまりに全部同じ中間状態を最初に渡すことになりそうですが、
1回のワークで複数の依頼を解決しちゃった場合どれか1個しか使えなくなります(同じ最初の64文字が2人以上に使われることになるので)
これの解決法は思いつきませんでした
159名無しさん@お腹いっぱい。:2013/09/26(木) 06:36:45.74 ID:b6mTXvYaP
最初の64文字を依頼人が指定するんじゃなくてYggdrasilがランダムに生成するって方式です
160 ◆Meriken//XXX :2013/09/26(木) 09:06:01.86 ID:6FvOHAWcP
>>158
2ちゃんねる受け渡しを行うのはちょっと無理がありますが、ゆぐちゃんでは
ありでしょう。あ、あと私は最初に間違えてしまっていたのですが、
SHA-1のブロックの長さは64バイトですがメッセージの長さを格納するのに
8バイト必要なので、キーの長さは56文字が最適になります。

実装する際にはW[12]までの途中経過(A, B, C, D, E)を検索開始時に
クライアントに渡してやればいいだけです。最初の依頼を解決した時点で
検索をやり直すようにしてやればセキュリティ上の問題もないでしょう。
161累計 ◆wop.8OO8.qow :2013/09/26(木) 09:10:52.97 ID:BeI6EFic0
条件は>>99と変わらず、1.1FEα7のみ検索速度(1パターン)を診断

【10分間のNehalem系のCPU検索の平均速度(TPS)】

   1.1FEα7  1.1FEα6  1.1FEα5   1.1FEα4  1.0.1(安定版)
---------------------------------------------------------
1)  31.47M   31.89M   27.84M   30.51M   31.67M
2)  31.49M   31.88M   27.80M   30.50M   31.77M
3)  31.50M   31.97M   27.69M   30.58M   31.67M
4)  31.48M   31.88M   27.85M   30.54M   31.68M
5)  31.51M   31.89M   27.83M   30.54M   31.64M
162 ◆Meriken//XXX :2013/09/26(木) 09:28:13.49 ID:6FvOHAWcP
>>161
Nehalem系でも新しいルーチンの効果に結構差がでますね。
1.0.1に比べて微減なのでまあここらへんが落とし所ですね。
報告していただいて本当に助かりました。
163 ◆Meriken//XXX :2013/09/26(木) 09:34:36.24 ID:6FvOHAWcP
VEX Prefixの謎はstackoverflowで怒られながらヒントを貰って
ある程度解決することが出来ました。

Which AVX registers should I use to avoid 3-byte VEX prefixes?
http://stackoverflow.com/questions/19016174

なるべくソースオペランドにxmm0〜xmm7を使ってやればいいようですが、
それだけではないみたいですね…

----

176 %line 611+1 Source Files\CPU10_x64_AVX.asm
177 000000F0 C5F96FFC vmovdqa xmm7, xmm4
178 %line 611+0 Source Files\CPU10_x64_AVX.asm
179 000000F4 C5D9DFE0 vpandn xmm4, xmm0
180 000000F8 C551EBD2 vpor xmm10, xmm5, xmm2
181 000000FC C569EFE8 vpxor xmm13, xmm2, xmm0
182 00000100 C551EFDF vpxor xmm11, xmm5, xmm7
183 00000104 C559EFF3 vpxor xmm14, xmm4, xmm3
184 00000108 C44111DFE3 vpandn xmm12, xmm13, xmm11
185 0000010D C44111DBEA vpand xmm13, xmm10
186 00000112 C521EFFA vpxor xmm15, xmm11, xmm2
187 00000116 C511EFC3 vpxor xmm8, xmm13, xmm3
188 0000011A C44109DFC8 vpandn xmm9, xmm14, xmm8
189 0000011F C511EBED vpor xmm13, xmm5
190 00000123 C5D1EBE8 vpor xmm5, xmm0
191 00000127 C539DFC7 vpandn xmm8, xmm7
192 0000012B C44101DFFE vpandn xmm15, xmm14
193 00000130 C44111EFEF vpxor xmm13, xmm15
194 00000135 C4C151EBF5 vpor xmm6, xmm5, xmm13
195 0000013A C5D1DFEB vpandn xmm5, xmm3
164やんやん ◆yanyan/Pails :2013/09/26(木) 09:42:28.26 ID:rTRwfDJk0
コードの動的書き換えまでやってるんだ。頑張るなぁ
165 ◆Meriken//XXX :2013/09/26(木) 10:03:07.79 ID:6FvOHAWcP
>>164
速くするためにできることは全部やるつもりですw
10桁トリップのCPU検索だと2〜3M TPS違ってくるので、かなり大きいです。
166 ◆Meriken//XXX :2013/09/26(木) 10:21:16.12 ID:6FvOHAWcP
3オペランドの命令を2-byte VEX Prefixになるように
書き換えたら遅くなったぞ。なぜだ…
167 ◆Meriken//XXX :2013/09/26(木) 11:03:10.06 ID:6FvOHAWcP
うーん、やっぱりわからん…
まあいいや、また今度にしよっと。
168 ◆Meriken//XXX :2013/09/26(木) 12:42:38.98 ID:6FvOHAWcP
290Xが噂通りの性能なら、検索君1号の6990をリプレースしたいところですが、
どうなんでしょうねえ〜

AMD,新世代GPUシリーズ「Radeon R9」「Radeon R7」を発表
http://www.4gamer.net/games/234/G023455/20130926001/
169 ◆YSRKEN.ceVZZ :2013/09/26(木) 21:45:53.97 ID:dy4WW+LZ0
>>168
絶対に値段がヤバそう、かと思いましたがそれほどでもないのかな>R9 280X(のメーカー想定売価)は299ドル
170名無しさん@お腹いっぱい。:2013/09/26(木) 22:52:10.88 ID:K0nbDP0R0
AMDがMantleとかいう新しいLow Level APIも発表したが
使えるのグラフィック用途だけなのかな
171 ◆znjnB.IJwZLU :2013/09/26(木) 23:28:01.94 ID:6DsB6fP10
>>151
お久しぶりです。
日々の仕事をこなしつつトリップ検索のための正規表現エンジンのためのJITコンパイラを作るという作業にエタってました。

DESのS-Boxですがmovdqaが2個あるくらいなら速度差は出ないでしょう。
AVXでターゲットをSandy以降とする場合、ベクタ整数Logicは3op/cycleです。
従って速度を稼ぐには常に3命令を供給できるようにコードを書かなければなりません。
命令フェッチが16Byte/cycle、デコードが4op/cycleなので2ByteVEX(レジスタ間で4Byte)、3ByteVEX(レジスタ間で5Byte)
のどちらでも達成可能ですし、数個のメモリオペレーションはOoOのキューで隠蔽されます。
ただし、メモリオペレーションを含む場合はLodeポートが2本、Storeポートが1本で命令長が多くの場合4Byteほど長くなることを意識する必要があります。
これはメモリオペレーションを含む論理演算は2ByteVEXの場合で2op/cycle、3ByteVEXの場合は1op/cycleしか命令を供給できないということですので、
間にレジスタ間演算を入れて供給命令数を維持するかループにしてuOPキャッシュを当て込むか、そういうものだと諦めるかしなければなりません。

2ByteVEXにすること自体は簡単で、VEX prefixのフォーマットを見るとわかりますが
AVXop dist,src1,src2
という場合src2をxmm0〜xmm7に制限するだけです。
distとsrc1にはxmm0〜xmm15までの全てのレジスタを指定可能です。
まあ、レジスタ割付は面倒になります。
172 ◆Meriken//XXX :2013/09/27(金) 01:05:59.70 ID:8wnFvcpWP
>>171
なるほど、そういう頭が必要なんですね。道理でなかなか速くならなかったわけだ。
実に勉強になりますです。

> 日々の仕事をこなしつつトリップ検索のための正規表現エンジンのための
> JITコンパイラを作るという作業にエタってました。

MTFの正規表現のルーチンもC#で綺麗に書きなおそうと考えてたんですけど、
この発想は斬新ですねw 流石です。
173 ◆Meriken//XXX :2013/09/27(金) 01:11:08.04 ID:8wnFvcpWP
>>170
Mantleからだと直接GCNを叩けるみたいですね。
オープンソースになるという噂もあるみたいです。
GCNは性能的に化物としか言い様がないので、wktkが止まらないですw
174名無しさん@お腹いっぱい。:2013/09/27(金) 01:17:32.97 ID:lkqItC0o0
>>172
maleで拙作のavxDESを送ったので時間があれば見てみてください。
あまり参考にならないかもしれませんが
175 ◆znjnB.IJwZLU :2013/09/27(金) 01:18:39.25 ID:lkqItC0o0
>>174
トリわすれてました
176 ◆Meriken//XXX :2013/09/27(金) 01:42:29.83 ID:8wnFvcpWP
>>174-175
わざわざ有り難うございます。さっきまで送っていただいた
S-BoxをMTFに実際に組み込んで動かしていたんですが、確かに速くなっていますね。
素晴らしい出来です。
177 ◆YSRKEN.ceVZZ :2013/09/27(金) 01:59:44.23 ID:3xFrfLPD0
  `¨ − 、     __      _,. -‐' ¨´
      | `Tーて_,_` `ー<^ヽ
Meriken .|  !      `ヽ   ヽ ヽ znjnB
      r /      ヽ  ヽ  _Lj
 、    /´ \     \ \_j/ヽ
  ` ー   ヽイ⌒r-、ヽ ヽ__j´   `¨´
           ̄ー┴'^´
178名無しさん@お腹いっぱい。:2013/09/27(金) 02:20:44.90 ID:0ZtIGcs50
maleで送ったとか・・・






アッー!!!
179 ◆znjnB.IJwZLU :2013/09/27(金) 02:35:31.94 ID:lkqItC0o0
>>176
何の説明もなく失礼しました。
cryptのつくりが全く違うのにすんなり対応されて流石です。

拙作ではS-Boxの最適化は>>171で述べた通りですが、cryptに関しては
キャッシュの最適化を目論んだつくりになっています。
MTFではkey[56]をexpandedKeySchedule[0x300]に展開していますが、
expandedKeySchedule[0x300]で12kBのL1Dキャッシュを占有します。
これはハイパースレッディングで2スレッド走らせる場合、L2キャッシュへのアクセスが生じると
大きなペナルティになりえます。
それでなくても12kB分のstoreはコストが高いのです。
というわけでkeySchedulは命令のほうに展開しています。

最終転置とblock初期化もcrypt関数内に隠蔽してあります。
従ってcrypt関数にはblock[64]をわたして、帰ってきたのをそのまま使えます。

saltはMTFと同じ手法で0x7FFFFFFFがシグネチャになっているのでここを変えればそのまま使えると思います。

>>187
mailだった
180 ◆Meriken//XXX :2013/09/27(金) 06:52:13.34 ID:8wnFvcpWP
>>179
> これはハイパースレッディングで2スレッド走らせる場合、
> L2キャッシュへのアクセスが生じると大きなペナルティになりえます。

ああなるほど、それでL1Dキャッシュが潰れて遅くなっていたんですね。
前スレでスレッドの数ごとに速度の比較を行われていたのにも合点がいきました。

KSを命令のほうで展開するやり方はOpenCL版では使っていたんですが、
CPUでは試していませんでした。ただ、STFの展開の仕方は随分独特で
スッキリしているように見えます。できることはまだまだたくさんありますねえ。
明日から1週間ほど家を空けるので、AVX2版の実装と一緒に試してみます。
いや〜、楽しみだなあ。
181混沌 ◆Chaos/geeeIV :2013/09/28(土) 19:26:50.26 ID:3+QdwiIO0
よくわかっていないのですが、MTFでの検索パターンとのマッチング処理ってどういう風になっているのかな
1トリップ生成する毎にマッチング処理ですか?
182名無しさん@お腹いっぱい。:2013/09/29(日) 19:57:56.89 ID:puciZRd6P
MERIKENさんの彼女って美人さんかな
183名無しさん@お腹いっぱい。:2013/09/29(日) 20:29:14.46 ID:Er9GkfO70
400年生きてるけど容姿は14歳くらいの
押しかけ女房という設定でよろしくお願いします
184 ◆AAAAAIgElTYM :2013/09/29(日) 21:09:53.00 ID:puciZRd6P
MERIKENさんのOpenCLのカーネルを参考に作ったら

MTFで900MHash/s出るGPUで590MHash/s出せた

900M目指す
185名無しさん@お腹いっぱい。:2013/09/29(日) 21:30:42.42 ID:puciZRd6P
と思ったら900Mは簡単に出せた

ただしキーの判定がA,B,C,D,EのAが0かどうか、だけですが
186名無しさん@お腹いっぱい。:2013/09/29(日) 21:32:17.66 ID:puciZRd6P
MERIKENさんのカーネルすごいなー
187名無しさん@お腹いっぱい。:2013/09/29(日) 21:33:58.75 ID:UQDnvd/B0
>>183
ロリババアじゃねえか……最高だな
188名無しさん@お腹いっぱい。:2013/10/02(水) 09:12:18.65 ID:c9bt88M30
質問です
自分が見つけたトリップのキーが既に割れているかどうか調べる方法ってあります?
トリップでググってみたけど出てこなかった

◆WWmMMmWmmM
◆mmmmMMWmmM
189名無しさん@お腹いっぱい。:2013/10/02(水) 12:12:15.95 ID:RmatBROi0
ぐぐって出てこないなら割れてないんじゃないかな
キーが割れてるか調べるならキーでぐぐれば良いかと
別キー同トリは酉でぐぐってみるしかないですねぇ

あとはデータベース調べるくらい?
ttp://trip2ch.net/
190 ◆YSRKEN.ceVZZ :2013/10/02(水) 12:29:57.48 ID:rovLnW6/0
例の流出騒動で割れた(けどネット上でまだ使われていない)人もいるしなぁ……
俺のように
191名無しさん@お腹いっぱい。:2013/10/02(水) 12:38:17.05 ID:HrAyM4RZ0
自分が見つけた、ということなので未使用前提のレスなのら
自分が使ってないなら誰かが先に見つけて、晒したり使用したりしていない限り
割れていることはないからね
192やんやん ◆yanyan/Pails :2013/10/02(水) 13:54:06.66 ID:V6M1LhCI0
別キー同トリって、ハッシュの衝突ということだよね?
SHA-1ってそんなに衝突起きてたっけ?
193 ◆MONEY///WQoK :2013/10/02(水) 13:58:55.21 ID:c9bt88M30
>>189-191
個人で使うこんな感じで↑一般的なものなら神経質にはなりませんが、
最長や最短のように変わったトリップは他にも使っている可能性もあるので、
調べてみようと思いました
データベースとグーグルを活用したいと思います

ありがとうです m(_ _)m

12Mt/s程度のPCには8完9完はきついです
見つかる気がしませんw
194名無しさん@お腹いっぱい。:2013/10/02(水) 14:06:57.14 ID:ntU3OB+00
>>193
8完程度なら他の人が見つけてくれることもあるよ
それがクラスターの良いところ

#今日は気温が上がってしまったので落ちまくりw
195名無しさん@お腹いっぱい。:2013/10/02(水) 16:30:36.74 ID:J0NS89z00
>>192
SHA-1をBASE64にした先頭12文字らしいから、
160bitのうち6bit×12文字で72bitしか使わない計算だからねぇ…
有効空間で309485009821345068724781056分の1、かな。
誕生日のパラドックスで衝突率を求めると…どうなるんだ?
196名無しさん@お腹いっぱい。:2013/10/02(水) 19:41:47.15 ID:c9bt88M30
>>194
なるほど
確かに分散処理が出来ましたね
197 ◆Urotsuki/1Ca :2013/10/02(水) 19:46:03.89 ID:7dIRUU6o0
金さえあれば3Way CFXしてブン回せるのに…うぐぐ
198 ◆LoveNico9g :2013/10/02(水) 21:39:36.99 ID:ElaEz5OR0
あなたは10桁トリップを発見しました。プラチナ貨8192枚が支払われます。 (19時間前)

文字数がないということは特殊なトリップかな?

あなたは8文字一致の10桁トリップを発見しました。プラチナ貨4096枚が支払われます。 (3ヶ月前)
あなたは9文字一致の10桁トリップを発見しました。プラチナ貨262144枚が支払われます。 (3ヶ月前)

8文字超、9文字未満の報酬ね
199 ◆YSRKEN.ceVZZ :2013/10/03(木) 00:57:15.45 ID:5JFild+E0
妙な質問ですが、
http://tripcode.net/yggdrasil/screensaver.php
って1920x1200に最適化しているんですか?
HTML Screensaverで表示させると12桁トリップのグラフと上位数名のリストしか表示されませんorz
(1366x768のノートパソコンでの話)
200名無しさん@お腹いっぱい。:2013/10/03(木) 01:01:16.51 ID:6er0tSp20
>>199
893 : ◆Meriken//XXX :2013/09/08(日) 07:55:22.82 ID:9LBqP7z/0 (2/2)
スクリーンセーバー用のページを新しいグラフに合わせて変更してみました。
これでPCの台数が増えてもしばらくは安心です。相変わらず1920x1080専用です。

http://tripcode.net/yggdrasil/screensaver.php

スクリーンセーバーはこちらがお勧めです。

HTML Screensaver
http://myweb.tiscali.co.uk/djmclean/htmlscreensaver.html
201名無しさん@お腹いっぱい。:2013/10/03(木) 01:27:20.09 ID:JxzZIhR00
>>198
過去ログにも出てるけどそれは準10連を見つけた場合の報酬
純10連だと6815744枚もらえるらしい

ところで昨日10/2の11:00頃に12桁のmaxが66.3G TPSになってるのは一体…
202混沌 ◆Chaos/geeeIV :2013/10/03(木) 05:39:39.07 ID:FzkRfayB0
どっかの大学か専門学校あたり教室から誰か遊んだのかなw
203 ◆YSRKEN.ceVZZ :2013/10/03(木) 08:54:27.00 ID:5JFild+E0
>>202
まあでもグラフを見る限りでは50GTPSは上がってるしな……
一台あたり100MTPSでも500台は牛耳らないとああはならないはず

バグである可能性もあるが
204名無しさん@お腹いっぱい。:2013/10/03(木) 09:58:21.96 ID:vduEdb0k0
>>203
そういうところだとPXEブートしてたりする。
PXEサーバへの線を切って起動後即アプリ起動するイメージ持ったPXEサーバを設置すれば、
後は片っ端から電源入れるだけで利用できるから、100台くらいは案外乗っ取れるかと。
あとはGPUの相性次第?
205混沌 ◆Chaos/geeeIV :2013/10/03(木) 10:19:02.54 ID:FzkRfayB0
>>204
参加者の中でばかっ速いのはほんの数人、実質Merikenさんだけで半分以上稼いでるようなもんだけどw
うちの1年くらい前の普及価格帯GTX660ですら、開発版MTFならGPUのみ単体でも400Mtpsくらいでるから
ちょっといいグラボ乗せていそうなところだったら教室1つで行けそうな気がするよw
206shirawa@mmo ◆GTExxuWcjk/9 :2013/10/03(木) 12:18:13.19 ID:1mbRumHzP
1人で数百台所有してる方も見かけますし、あながち団体とも言い切れないのがおそろしいところw
案外、海外の方とかもありえる?
207 ◆LoveNico9g :2013/10/03(木) 20:04:17.29 ID:2EEzR2Fi0
>>201
なるほどなるほどー
使うためには将来実装されるフリマ?バザー?で買い戻すしかないのかな?
しかし見つけたトリップが何かわからないからそれもかなわないのだけど…

そういえば有償版は"参加しない"設定はあるけど"参加するけどトリップは提供しない"設定は無理なのかしら?
依頼と手元の検索対象が被った場合に、手元を優先して提供しないみたいな
208混沌 ◆Chaos/geeeIV :2013/10/03(木) 21:21:24.21 ID:FzkRfayB0
今は丁度留守だけど
ユグドラの機能絡みの話はあっちのスレでやった方が話題を共有できるしMerikenさんもノリやすいと思うよーw
209名無しさん@お腹いっぱい。:2013/10/03(木) 22:55:31.53 ID:PVFODAuA0
AMD Catalyst? Display Driver for Windows Vista 32-bit って、最新版は 13.4 なんですか?
検索しても、13.10 が見つからない・・・
210 ◆Meriken//XXX :2013/10/03(木) 23:48:31.78 ID:hGyYsSenP
ようやくアリゾナへの小旅行から戻ってきました。
セドナっていうインディアンの古い聖地に行ってきたんですけど、
岩山が並ぶ景観が素晴らしかったです。
地元の人達も面白い方が多かったので、またぜひ行ってみたいですねえ。

>>183-184
彼女はころっとしてて愛嬌のある感じです。
無事に日本に辿り着ければいいんですが…
211名無しさん@お腹いっぱい。:2013/10/03(木) 23:54:23.91 ID:yymlo581P
MERIKENさんおかえり!!
212 ◆Urotsuki/1Ca :2013/10/03(木) 23:57:23.45 ID:Z2ZCk0070
おかえりー!行ってみたいなぁ…
213名無しさん@お腹いっぱい。:2013/10/04(金) 01:03:55.19 ID:9T4g2abG0
>>210
> 無事に日本に辿り着ければいいんですが…
ヒッチハイクで帰国したとか??
214 ◆Meriken//XXX :2013/10/04(金) 04:41:05.93 ID:iHUDZBAdP
どもどもw

>>213
彼女、ロスの空港で1人で乗り継ぎだったんですけど、
英語が殆どできないんですよね… まあ大丈夫だとは思いますが。
215 ◆Meriken//XXX :2013/10/04(金) 04:54:13.15 ID:iHUDZBAdP
>>184
検索エンジンのソースコードはGPLで公開されているので、
じゃんじゃん使ってやって下さいw
216 ◆Meriken//XXX :2013/10/04(金) 05:01:23.10 ID:iHUDZBAdP
>>197
電気代は盲点でしたね〜
私ももうちょっとお金があったら専用電源を備えたPC専用の部屋が
欲しいところですけど、先は長いですねえ。
217 ◆Meriken//XXX :2013/10/04(金) 05:08:24.51 ID:iHUDZBAdP
>>207
これどうしようかかなり迷ったんですけど、
参加していただく以上は条件を揃えておきたかったので
こんな風になっています。
218名無しさん@お腹いっぱい。:2013/10/04(金) 05:39:22.35 ID:OK0SaK/c0
誰も怒らねえからまんどくさいのでと正直に言えよw
219やんやん ◆yanyan/Pails :2013/10/04(金) 05:44:19.39 ID:mM382Oj10
60A契約だと不足気味になるから、75Aにしようかと思ったりしたり。
220 忍法帖【Lv=2,xxxP】(3+0:8) ◆Meriken//XXX :2013/10/04(金) 05:48:05.07 ID:iHUDZBAdP
R9 290Xがもう少しで発売ですね。いや〜、楽しみだなあ。

しかし旅行から帰ってきたら2chの規制が更に厳しくなっていますね。
忍法帳のレベルを上げないとリンクも貼れないとか、どうかしてます。
海外規制は相変わらずだし、流出事件以降VPNも規制されて、
●で規制を回避できなくなっちゃったし…
これで公式p2も海外規制されたらどうしようかしらん。
221 忍法帖【Lv=40,xxxPT】(1+0:8) 【東電 59.6 %】 :2013/10/04(金) 06:05:56.81 ID:rrTSneEoP
てすと
222 忍法帖【Lv=2,xxxP】(3+0:8) ◆Meriken//XXX :2013/10/04(金) 06:07:02.04 ID:iHUDZBAdP
>>218
実装自体は判定の処理の順番を入れ替えるだけなので、
そんなにめんどくさくないですw
経験値は非常に重要な指標なので、
を獲得するための条件は同じにしておきたいんですよね。
223 忍法帖【Lv=2,xxxP】(3+0:8) ◆Meriken//XXX :2013/10/04(金) 06:17:55.03 ID:iHUDZBAdP
>>219
いいですね〜 ほんとに検索速度の限界は電気の供給によって決まってきますね。
224名無しさん@お腹いっぱい。:2013/10/04(金) 06:22:44.72 ID:rrTSneEoP
半導体プロセスが28nmから20nmになったら同じ電力で倍の速度出せるようになるかな
225 忍法帖【Lv=2,xxxP】(1+0:8) ◆Meriken//XXX :2013/10/04(金) 07:07:47.87 ID:iHUDZBAdP
さすがにそこまではいかないでしょうけど、
確実にワットあたりの性能は上がるでしょうね。
R9 290Xが7970と比べてどれぐらい性能が上がっているのか、
非常に気になるところです。
226 忍法帖【Lv=2,xxxP】(2+0:8) ◆Meriken//XXX :2013/10/04(金) 07:43:28.35 ID:iHUDZBAdP
>>180の続きですが、STFのS-Boxを使わせていただいた結果、
速度は26.05M TPSまで上がりました。>>151の数字より確実に
良くなっていますが、key scheduleを命令のほうに展開してやれば
更に速くなりそうです。取りあえずMTFのルーチンで展開を試してみてから
送っていただいたSTFのルーチンを移植してみることにします。
227 忍法帖【Lv=2,xxxP】(1+0:8) ◆Meriken//XXX :2013/10/04(金) 14:49:48.68 ID:iHUDZBAdP
現在せっせAVXのルーチンを書き換え中。
動的書き換えを行っているルーチンを修正するのは結構大変です。
うまくいくかな〜
228名無しさん@お腹いっぱい。:2013/10/04(金) 18:27:11.06 ID:rrTSneEoP
ttp://www.fileformat.info/tool/hash.htm?hex=1dc72653c09d8eb383671d18bcca2d02470a3c6b43ea547bafb69c4227188498

ビットコインのクライアントのRPCを使ってブロックのハッシュ値を列挙して連続する0のビットが一番多いハッシュを探した後、

ビットコインのハッシュはSHA256(SHA256(key))なのでブロックのヘッダをblockexplorerで持ってきて
SHA256(header)を計算して 1dc72653c09d8eb383671d18bcca2d02470a3c6b43ea547bafb69c4227188498 を出して

これをHEX表示としたバイナリのSHA256ハッシュが実際に00が連続することを確認した

ちなみに73ビット0が連続する もし2chのトリップのSHA1で72ビット以上0が連続したら12連の"AAAAAAAAAAAA"になる
229名無しさん@お腹いっぱい。:2013/10/04(金) 18:30:52.37 ID:rrTSneEoP
でもBitcoinは先頭と末尾が逆だった(連続する0ビットの位置の)
230名無しさん@お腹いっぱい。:2013/10/04(金) 19:41:03.52 ID:QT5wWxXa0
特にエラーも出てないのに、GPU 検索が止まってる事があるけど、
エラーが出ないので情報を提供出来ない・・・
231 ◆MOYASHI/Go :2013/10/04(金) 21:14:55.45 ID:Ohb6dumk0 BE:4454085877-2BP(7)
お、Merikenさんおかえりなさい。

>>220
2ch書き込み規制等の場合は、したらばのMerikenさんの掲示板の辺りへ移動かな?
でも、したらばって12桁トリップ使えないんでしたっけ?う〜ん…

>>230
環境や状況等を詳しく書いた方がいいかも。
232 忍法帖【Lv=3,xxxP】(1+0:8) ◆Meriken//XXX :2013/10/05(土) 01:03:32.26 ID:V671iDXLP
>>230
こういう場合はまずハードウェアがらみなんですけど、
エラー処理を見なおしたほうがいいかもしれませんね。
ハードウェアの構成を教えていただけると助かります。
233名無しさん@お腹いっぱい。:2013/10/05(土) 01:07:57.88 ID:R6g1pM6d0
7970の場合だと90℃を超えた辺りで不安定領域
95℃まで行ったらまずGPUが脱落する
保護回路かな?
動作保証のあるメーカー品でも強烈な連続負荷が掛かるので油断出来ない
234 忍法帖【Lv=3,xxxP】(1+0:8) ◆Meriken//XXX :2013/10/05(土) 01:39:01.21 ID:V671iDXLP
>>231
緊急時にはとりあえずしたらばに移動ですね。
2ちゃんねるVPNを使えば海外規制は回避できるんですが、
有料だし不便なのでできれば避けたいところです。
235 忍法帖【Lv=3,xxxP】(1+0:8) ◆Meriken//XXX :2013/10/05(土) 03:21:44.19 ID:V671iDXLP
とうとう4770とM6Eをポチってしまいました。
これで思う存分AVX2をいじれます。ぐへへへへ…
236名無しさん@お腹いっぱい。:2013/10/05(土) 04:34:59.02 ID:R6g1pM6d0
私はFX-9370をポチってしまいました
TDP200Wゴクリw
237 ◆Meriken//XXX :2013/10/05(土) 04:55:00.35 ID:V671iDXLP
AMDのCPUもきちんと書いてやれば>>67のようにちゃんと速度が出ますしね。
何より独立したコアが8個あるのは魅力的です。楽しみですね〜
238 ◆Meriken//XXX :2013/10/05(土) 09:10:12.59 ID:V671iDXLP
1日かけてAVXのルーチンのkey scheduleをコードに展開してみました。
で、うまく動いたのは良かったのですが、速度はかえって落ちてしまいましたorz
やはりSTFみたいにDES crypt(3)の二種類のラウンドを畳み込んでやらないと
今度はコードがキャッシュから溢れてしまうようです。
239やんやん ◆yanyan/Pails :2013/10/05(土) 09:29:04.34 ID:V9+sfTd+0
最近のCPUは投機的実行したりパイプライン深かったりだから、
アセンブラレベルでの高速化って大変そうだな。
240 ◆Meriken//XXX :2013/10/05(土) 11:05:48.38 ID:V671iDXLP
確かにかなり難しいですねえ。畳み込みも試してみましたが、それでも書き換え前の
速度には届きませんでした。アセンブラのルーチンはほとんどSTFと
おなじになってしまったので、>>179で教えていただいたとおりに
やってるはずなのに速くならないのはかなり謎です。
241 ◆Meriken//XXX :2013/10/05(土) 11:17:38.50 ID:V671iDXLP
まあいいや、また今度STFのルーチンを試してみようっと。
そうすれば少なくとも問題の切り分けはできるはず…
242 ◆JouJaku.IYSv :2013/10/05(土) 15:26:49.76 ID:TQdt57zm0
>>235
おぉ、遂にですね。
アマゾンで購入する時には極力ゆぐ経由で注文していたのですが、少しは足しになりましたかね?

M6Eの一番下のPCIeに、2若しくは1.5スロット幅のカードが刺さるかどうか教えて下さい。
Z87 Extreme 9を使っているのですが、一番下のPCIeはスイッチケーブル等が干渉して水枕付きの7990が刺さらないのです。
243 ◆Meriken//XXX :2013/10/05(土) 18:24:43.38 ID:V671iDXLP
>>242
確実に足しになっていますよ。ありがとうございます。
写真を見る限りでは干渉するようですが、一応届いたら確認してみます。
検索君1号でも干渉しているのですが、R.O.G.シリーズのマザボは
電源ボタンが別に付いているので私は普段はそれを使っています。
244 ◆Meriken//XXX :2013/10/05(土) 18:46:04.08 ID:V671iDXLP
あれからいろいろ実験してみたのですが、>>179のようにL1Dキャッシュを
有効活用するためにはキー生成とヒット判定のルーチンに相当手を入れないことが
いけないことが分かりました。◆znjnB.IJwZLUさんはかなり色々工夫されているようです。

まあでも原因がわかったので、取りあえずこの件は置いておくことにして、
AVX2対応の準備を勧めることにします。
245 ◆Urotsuki/1Ca :2013/10/06(日) 22:27:59.59 ID:on3hVRef0
着々と高速化されていて期待する日々
ちょっとだけぶん回す
246名無しさん@お腹いっぱい。:2013/10/06(日) 22:59:18.76 ID:vgIX48Ma0
熱と電気代の壁を乗り越えて頑張ってください
247 ◆QZaw55cn4c :2013/10/06(日) 23:07:39.77 ID:tfHzXDW00
熱はこれからの季節ではともかく電気代の壁には参っております,いつ脱落してもおかしくない‥‥
248 ◆Urotsuki/1Ca :2013/10/07(月) 00:02:30.75 ID:jF8JVd0Q0
電気代のほうが深刻です
1〜2時間フル稼働が限界かも
249名無しさん@お腹いっぱい。:2013/10/07(月) 00:24:06.99 ID:dlpjmzEs0
ラスボス:電気代
250 ◆Meriken//XXX :2013/10/07(月) 02:29:43.10 ID:kkyn89W/P
ハイエンドのグラボを2枚使って24時間稼働させると
電気代は月10000円前後なのでたしかに痛い出費ですねえ。
長い目で見たら1枚だけ使って電気代を抑えたほうがいいのかもしれません。
7970 1枚だけでも現在のゆぐちゃんでは十分トップクラスですしね。
私としては無理の無い範囲で長く続けていただきたいところです。
251名無しさん@お腹いっぱい。:2013/10/07(月) 17:32:57.57 ID:/IUR/xz60
嫌な感じだな。

そこまでして・・
252 ◆Meriken//XXX :2013/10/07(月) 19:16:23.56 ID:kkyn89W/P
まあもともと本格的なトリップ検索にはお金がかかりますしね。
他にもっとお金のかかる趣味なんていくらでもあるし、
人の趣味にケチを付けるのは無粋というものです。
253名無しさん@お腹いっぱい。:2013/10/07(月) 19:49:49.65 ID:T8R7cFdS0
GPU を使う場合はともかく、最近の CPU は一杯コアがあるし、
PC の電源が入っている間は、一部のコアでずーっと検索させてても
全く何の問題もないよね。
2つ位コア開けておけば、通常の使用に影響出ないし。
254SilentPC ◆SilentPCIePC :2013/10/07(月) 19:51:37.30 ID:YIb5KFv+0
まあだからこその、分散処理なんですよね。
自分一人で1垓のトリップの中から好きなトリップ1個を探し出すのにかかる電気代と、
50人で1垓のトリップの中から好きなトリップをそれぞれ探し出すのにかかる電気代では、
単純計算で前者の50分の1の電気代で済むわけですからね。
皆で協力する事で必要経費も人数分の一に分散出来て、それでいて人数分の一の時間で必要なものも見つけられる。
お互いが得する大変良い仕組みだと思います。
開発頑張って下さい。
255名無しさん@お腹いっぱい。:2013/10/07(月) 19:58:08.91 ID:T8R7cFdS0
ところで、検索は完全にランダムにやってるんだと思うけど、何故か、頻繁に見つかるトリップと、
全く、一切、全然、ちっとも見つからないトリップがあって、かなり偏るんだよね。不思議だ。
256 ◆YSRKEN.ceVZZ :2013/10/07(月) 22:05:18.86 ID:XMrah83C0
>>255
短い回数だと乱数が偏ったように見えることはよくあること

ところで、前にも聞きましたが、この状態だと検索時間が16倍速なんですよね?
ttp://up3.viploader.net/net/src/vlnet016276.png
257名無しさん@お腹いっぱい。:2013/10/07(月) 22:17:15.13 ID:ruVVZ61g0
16・倍・速! 16・倍・速!
258 ◆Meriken//XXX :2013/10/07(月) 22:28:15.09 ID:kkyn89W/P
>>256
なんか妙に台数が増えてた時間があったのはYSRKENさんだったんですねw

> この状態だと検索時間が16倍速なんですよね?

違います。同時に何台稼働しても検索時間は一緒です。
259 ◆YSRKEN.ceVZZ :2013/10/07(月) 22:32:53.07 ID:XMrah83C0
>>258
なん、だと……!?

まあこのキャプ撮りたいがために16台を一時的に乗っ取ったのですがw
260 ◆Meriken//XXX :2013/10/07(月) 22:35:08.34 ID:kkyn89W/P
>>254
分散トリップ検索は長い間あたためてきたアイディアなので、
実現できて結構嬉しいですw トリップ検索はパターンの数が増えても
速度は急に落ちないので、実に分散処理向きといえます。
261名無しさん@お腹いっぱい。:2013/10/07(月) 22:44:56.42 ID:8uRwwq3r0
17時前後の青グラフと"max: 31"があなたの仕業ですかー!
ttp://up3.viploader.net/net/src/vlnet016277.png
262 ◆YSRKEN.ceVZZ :2013/10/07(月) 22:55:15.52 ID:XMrah83C0
>>261
そうでーすw

トライして気がついたのですが、これってWeb上では同じ「4MTPS」でも、
ソートする際は小数点以下も含めているんですか?
263 ◆Meriken//XXX :2013/10/08(火) 02:44:29.87 ID:Be50s5DTP
>>262
そうですよ。
264 ◆YSRKEN.ceVZZ :2013/10/08(火) 02:59:16.21 ID:hGdMdaDn0
>>263
良かったです。このソフトでは小数点以下を切り捨てているわけじゃなかったんだね!
265 ◆Meriken//XXX :2013/10/08(火) 06:16:31.85 ID:Be50s5DTP
今日あたりHaswellが届いているはずだけど、ちょっと見に行ってみるか。
266名無しさん@お腹いっぱい。:2013/10/08(火) 08:12:07.30 ID:uiAIodMh0
>>256
> 短い回数だと乱数が偏ったように見えることはよくあること
いや24時間365日検索してるんだけど・・・
267ねこ ◆TheWorld.o :2013/10/08(火) 08:59:54.97 ID:wwRsWuFO0
ロト7を毎週1年買っても当たらないようなものです
268SilentPC ◆SilentPCIePC :2013/10/08(火) 11:37:45.44 ID:ruHOMK/b0
>>266
トリップってA-Za-zの26*2文字+0-9の10文字+./の2文字=64文字で構成されているんだろ?
12桁ならそれが64^12のパターン数、64^12=(2^6)^12=2^72=(2^10)^7.2≒(10^3)^7.2=10^21.6
10垓(ガイ)=Z(ゼタ)の単位の数の中から、ちょっと取り出した程度で偏りが無くなるわけないじゃないか。
例え1京(ケイ)=10P(ペタ)パターンのトリップを発見したとしても、それは全体の万分の一以下の数でしかない。
269 ◆Meriken//XXX :2013/10/08(火) 14:50:47.22 ID:Be50s5DTP
>>255
もうちょっと具体的に書いてもらえれば詳しいことがわかると思いますよ。
MTFのバグという可能性もありますしね。
270名無しさん@お腹いっぱい。:2013/10/08(火) 15:54:01.93 ID:U2rkGsnVO
例えば9桁完全一致トリップが欲しいとして、
12桁で検索するのと10桁で検索するのでは、
どちらが確率が高いのでしょうか?
271 ◆YSRKEN.ceVZZ :2013/10/08(火) 19:37:18.73 ID:hGdMdaDn0
>>270
確率は同じだが普通は前者の方が高速に検索できるからお勧め
ユーYggdrasil に依頼しちゃいなYO
272名無しさん@お腹いっぱい。:2013/10/09(水) 00:11:52.59 ID:qMpebiGr0
ゆぐちゃんの実績から言っても12桁ですよねー

ttp://tripcode.net/yggdrasil/
平均検索時間(12桁):13.9日(9文字)
平均検索時間(10桁):1.4ヶ月(9文字)
273 ◆Meriken//XXX :2013/10/09(水) 01:07:35.35 ID:lCvxi2JOP
YSRKENさん、ときどき名無しで書き込んでますね。
274 ◆Meriken//XXX :2013/10/09(水) 01:18:50.00 ID:lCvxi2JOP
Haswellが届いたことは確認済みなので、これから取ってきます。
今日はちょっと用事があるので組み立ては明日あたりかな。
275 ◆YSRKEN.ceVZZ :2013/10/09(水) 01:31:41.77 ID:hjmT6Azw0
>>273
えっと、はいそうです。とは言っても、
「専ブラでコテハン記憶しているはずなのになぜか消えてて面倒になった」
というのが主な理由ですが。
>>274
遂にMerikenさんがHaswellに挑戦するんですね……ドキドキ
276 ◆Meriken//XXX :2013/10/09(水) 01:47:33.39 ID:lCvxi2JOP
>>275
そうですか。まあ何事もほどほどに、ね。
277 ◆QZschizo.ptH :2013/10/09(水) 03:59:47.55 ID:lS/PIDax0
>>270
12桁の方がトリップ生成速度が格段にはやいし(環境によるけど)、なんだか12桁ってあんまり「安全」じゃないような気がしてきた‥‥
278名無しさん@お腹いっぱい。:2013/10/09(水) 04:35:29.68 ID:wuthnGWj0
>>277
前方数文字が同じで「ぱっと見で似ている」トリップ探すなら12桁の方が危険かもしれないけれど、
完全一致なら空間的にも時間的にも12桁の方が安全性は高いと思うよ。
検索速度が何倍で、トリップ数が何倍か計算してみよう。
トリップ数ではなく使用可能な鍵空間で計算してみても良い。

あーでも捻ってないからレインボーテーブル的なアプローチには弱いかも。
279 ◆Meriken//XXX :2013/10/09(水) 04:37:19.41 ID:lCvxi2JOP
検索速度は12桁のほうが数倍速いですけど、10桁トリップのキー空間の狭さを考えたら
12桁トリップのほうがはるかに安全ですよ。12桁トリップの数は2^72個ですけど、
10桁トリップはキーが56bitだから最大で2^56個しかありません。
キーがShift-JISの場合はさらに少なくなります。
280 ◆Meriken//XXX :2013/10/09(水) 04:55:24.64 ID:lCvxi2JOP
>>378
2^34TPS (≒16G TPS)で検索しても12桁トリップをすべて出すには
最低で2^38秒(≒87世紀)かかるのでまあ大丈夫でしょう。
281 ◆Meriken//XXX :2013/10/09(水) 04:56:51.56 ID:lCvxi2JOP
>>280>>278さん宛でした。
282 ◆QZschizo.ptH :2013/10/09(水) 04:57:40.03 ID:lS/PIDax0
確かに鍵空間的に2^16 違うのであれば、不安がる根拠はありませんね、いろいろ教えていただきありがとうございます
283名無しさん@お腹いっぱい。:2013/10/09(水) 08:12:00.69 ID:c6EX+6rR0
時代は12桁
284 ◆YSRKEN.ceVZZ :2013/10/09(水) 08:15:12.78 ID:hjmT6Azw0
>>278
>前方数文字が同じで「ぱっと見で似ている」トリップ探すなら12桁の方が危険かもしれない
前に「いや先頭合ってるだけで誤解されかねないからそれはそれでマズい」って声があったような……
でもまあ完全一致や全桁対象の酉(例:全数、二構)だと10桁の方が断然見つけやすいんですけどね
285 ◆Meriken//XXX :2013/10/09(水) 08:51:52.85 ID:lCvxi2JOP
>>283
そのかわりきれいなトリップは10桁のほうが断然出しやすいですけどね。
一長一短といったところです。
286混沌 ◆Chaos/geeeIV :2013/10/09(水) 09:19:45.48 ID:P0BLzLC00
>>285
10桁酉の場合、最後に使える文字が16種類しかないってのが
きれいな酉を探すにはネックになるかもしれないですけどねw
287 ◆Meriken//XXX :2013/10/09(水) 12:06:51.46 ID:lCvxi2JOP
>>286
でも12桁で最後まで揃っているトリップを出すのは至難の業ですからねえ。
もうちょっと速度を向上させたいところです。
288 ◆Meriken//XXX :2013/10/09(水) 13:19:42.59 ID:lCvxi2JOP
Haswellちゃんが届いたのでさっさと検索君1号にインストールしてしまうことに
しました。マザボとCPUを交換してから試しに立ち上げてみたら平然と動いていますw
OSを再インストールしなくていいのには助かりました。うまく行けば今日中に終わるかな。
289 ◆Meriken//XXX :2013/10/09(水) 15:06:43.48 ID:lCvxi2JOP
試しにi7-4770で10桁トリップのCPU検索を動かしてみましたが、
定格の3770Kよりちょびっと遅いぐらいです。
しかしなぜか3枚目の7970が認識されません。むぐぐ…
290 ◆Meriken//XXX :2013/10/09(水) 15:13:29.70 ID:lCvxi2JOP
システムもイマイチ安定しなかったので結局OSを再インストール
することにしました。やっぱりサボろうとするといけませんねえ。
291 ◆QZschizo.ptH :2013/10/09(水) 18:33:25.41 ID:lS/PIDax0
>>251
keyword: 浪漫
292名無しさん@お腹いっぱい。:2013/10/09(水) 18:44:03.56 ID:rG8iFpjW0
男のマロン
293名無しさん@お腹いっぱい。:2013/10/09(水) 19:00:49.17 ID:gUimoTt50
中々
ttp://www.youtube.com/watch?v=_rzNFvJIF28
良い歌だよね。
294混沌 ◆Chaos/geeeIV :2013/10/09(水) 19:37:13.05 ID:P0BLzLC00
8bit機が現役でどんどん新作でていた頃 はっきりしないけど25年も昔だろうか・・w
HDDが20Mで20万とかした記憶があるw
1Tあたりに換算すると100億くらいか・・

今のHDDは1Tあたり4000円程度
容量単価で250万分の1くらいw

12桁トリップ全保存計画を実行しようとすると
2^72の空間でキーとトリップのペアが24バイト
2^72*24

2^40が1Tで、その1000億倍くらいw 4,000,000,000,000,000 =4000兆円
日本の国家予算の10倍くらいかなw
でも容量単価が250万分の1になれば・・・

2^40 * 2^32 * 24
100,000,000,000 / 2,500,000 = 1,000,000/25 = 40,000 今の1Tハードディスク4万個分くらいの予算
4000*40000=1億6千万円

25年後 1億6千万円分のHDD容量で12桁のキーとトリップのペアを全部保存できる?
計算合ってるかな?
どこかの自治体のプロジェクト予算って感じか・・・w

さらに25年後 250万分の1の値段になると
160,000,000 / 2,500,000 = 1600 / 25 = 64円 www

2ちゃんねるが出来てから、既に14年たっているんだよねー
月日が立つのは速いw
295名無しさん@お腹いっぱい。:2013/10/09(水) 19:38:14.38 ID:sMw4vpEq0
リアルではかなえられないような夢や冒険に憧れる気持ちを込めて、
「男のロマン」などということもあります
296混沌 ◆Chaos/geeeIV :2013/10/09(水) 20:29:50.05 ID:P0BLzLC00
>>294

>2^40が1Tで、その1000億倍くらいw 4,000,000,000,000,000 =4000兆円

ここで桁間違えているな 400兆円だな
そうすると、25年後は1600万円か

物好きな小金持ちの年寄りでも出来ないことはない感じか・・・w
297 ◆YSRKEN.ceVZZ :2013/10/09(水) 20:50:39.62 ID:hjmT6Azw0
でも、保存しようにも計算が追っつかない気が……真面目に計算してないからよく分からないけど
298名無しさん@お腹いっぱい。:2013/10/09(水) 21:05:58.94 ID:LbcdLs8/0
ずっと前にどこかで似たような話を見たと思ったら
http://anago.2ch.net/test/read.cgi/software/1205766220/529
だった
299混沌 ◆Chaos/geeeIV :2013/10/09(水) 21:22:42.31 ID:P0BLzLC00
>>297
現状では、検索パターンに指定したパターン以外は全て捨てて
新たにパターンを探す時は最初から検索しなおしているわけだけど
保存計画は、計算済みのトリップをかたっぱしから保存していくので
計算済みのトリップならばデーターベースに検索命令入れるだけで1発で取り出せることw

とはいえ、高速ループで生成し続けるトリップを、生成する速度で未保存トリップか否かをチェックして未保存なら保存していく処理はスタンドアロンでは難しそう
こういうことにこそ、分散処理が威力を発揮しそうですよね

分散処理でトリップ範囲を分担し
ループで計算しながら、挿入ソートでメモリ展開しつつ、担当範囲の分担PCに計算済みトリップを分配していく



>>298
既出の話題でしたか^^;
300 ◆Urotsuki/1Ca :2013/10/09(水) 21:26:31.44 ID:NxgWXisV0
結構夢があっていいですねー
SSDがもっと早くなってかつ低価格化すれば実現可能性は十分あります
現状のネックである消費電力と速度を打開してくれるのがSSDですから 価格面ならHDDですけど
301名無しさん@お腹いっぱい。:2013/10/09(水) 21:30:18.36 ID:wuthnGWj0
>>294>>296
そこでレインボーテーブルのアプローチですよ。
始点トリップ+終点トリップで72*2/8=18byte
長さ2^20(1MTrip)で(2^72/2^20)*18=72PiB
トリップの頭20bit=0(平均長さ1M)を終点にして残りをオフセットとして読めば
始点トリップ=9byteで9*2^(72-20)=36PiB
1Tあたり4000円で計算するなら1億4745万6000円
20MTPSくらいは出てるようだし平均1分の1GTPSを目標にすれば
始点トリップ=9byteで9*2^(72-30)=36TiB
1Tあたり4000円で計算するなら144万4000円……うん、中々現実的な範囲じゃない?

テーブル作成に掛かる時間は普通に全トリップ計算に掛かる時間(…を超える?)なので、そっちで死にますがww
302混沌 ◆Chaos/geeeIV :2013/10/09(水) 21:54:48.06 ID:P0BLzLC00
>>301
む〜ん、レインボーテーブルが理解できない><
ウィキペディアみてみたけどちんぷんかんぷんでした><

1回総当りでテーブル作るって事はわかるんだけど
なんでその時作ったテーブルが、別のハッシュから結果を取り出すことに使えるのか想像できないw

そこでつまづくから、その先の容量削減とかチェイン化とかちんぷんかんぷん
(っていうか、微積とか行列とかの記号出てくると、そっちでお手上げw)
303SilentPC ◆SilentPCIePC :2013/10/09(水) 22:21:49.95 ID:K2oUYBuJ0
トリップと遂になるハッシュ値を保存して行く時に、トリップ12桁全部をDBに保存せずにトリップ最初4文字でソート+ハッシュで保存していくとか?
残り8文字はDBから取り出したハッシュ群から計算して探す。12桁の残り8文字一致だけなら結構速く計算出来ると思う。
そうすると1トリップに付き8文字分データを減らせる。
304混沌 ◆Chaos/geeeIV :2013/10/09(水) 22:26:10.85 ID:P0BLzLC00
>>303
あーーっw
言われてみれば、トリップは保存しないでもアドレスから一意に決まる事に出来ますね
ディスクは半分で済みそうです

トリップから一意に決まるアドレス位置に そのトリップを計算するのに使ったキーを保存していけばいいのね
305SilentPC ◆SilentPCIePC :2013/10/09(水) 22:32:50.29 ID:K2oUYBuJ0
ああ、更に削る方法もあるかな?
例えば最初1文字までにして、2文字目は大文字か小文字か数字か記号で4パターン(00:01:10:11の2ビット)に分ける。
更に3文字目も同じく分ける。更に4文字目も…
そうやってトリップを区分分けする事で、残りの文字列のパターンを分類し、探すハッシュの数を絞っていくとか?
306混沌 ◆Chaos/geeeIV :2013/10/09(水) 22:42:47.54 ID:P0BLzLC00
>>305
トリップ ◆AAAAAAAAAAAA のトリップキーはアドレス0に保存
トリップ ◆AAAAAAAAAAAB のトリップキーはアドレス1に

こんな感じで、トリップから一意に決まる保存アドレスにキーだけを保存していく感じで良さそうw
307名無しさん@お腹いっぱい。:2013/10/09(水) 22:46:57.59 ID:wuthnGWj0
>>302
自分も全容や応用までは把握はできてないのですが…
まずH(key)→hashなハッシュ関数(SHA-1関数の先頭72bit)と、C(hash)→keyな変換関数(仮にBASE64関数)を準備。
適当な始点hashから「H(C(hash))→hash」を複数回チェインして終点hashを得るってのを沢山やって終点hash→始点hashのテーブルを作って保存しておく。
検索時は「H(C(hash))→hash」な処理を延々繰り返して、記録済みの終点hashと一致するまで検索を続ける。
一致する終点hashを見つけたら対応する始点hashから「H(C(hash))→hash」を繰り返して、H(C(hash))が目標と一致したらそのときのC(hash)が目的の値。
…ってのがレインボーテーブルの概要だったはずです。終点hash→始点hashのペア情報だけでチェイン回数分のハッシュを代用できるのが利点ですね。

C(H())チェインがキレイに全ハッシュ空間が一周するC()を組めれば繰り返し長を固定して探索時間の保障が出来ますが、
H(C())の鎖が短い繰り返しで一周してしまう部分とかをテーブルに含ませる(または検索時にループを発見する)必要もあり、
C()の出力鍵空間内でH()が衝突すると鍵空間<ハッシュ空間になって全てのハッシュを網羅できなくなる問題もあり、
その辺の工夫とかが多分レインボーテーブルのキモになるところだった筈です。
ハッシュ衝突とかは…異なるC()を使ったテーブルで補完するとかでしたっけ。

>>304
ちな301で書いた「トリップの頭20bit=0(平均長さ1M)を終点にして残りをオフセット」ってのもそれです。
↑に書いてるC(H())チェインが短くて頭20bit=0等が出ないと悲しい事になりますorz…ケチらず72TiB使うべきか。
>>305
単純にハッシュの頭nbitを削るだけでも行けそうですね。
308名無しさん@お腹いっぱい。:2013/10/09(水) 23:36:27.79 ID:MTyJscGe0
>>306
似たようなことコンテストの重複チェックルーチンでやったー懐い
FDDの物理アドレスだからエラーになったらおしまいという綱渡り・・・若かった
脇からすまそ
309混沌 ◆Chaos/geeeIV :2013/10/10(木) 00:25:16.04 ID:2gxQn/T50
>>308
まぁ何もOSのFAT管理を無視してトラックセクタ直指定するわけでも
ましてやトラックのギャップにデーター入れるわけでも(笑)ないので
単に、巨大なデータファイル(別に単一ファイルじゃなく適当な大きさのファイル郡でいいのですが)に
先頭からのオフセットで位置を決定するっていうだけなのでw
トリップ文字列からキーの保存オフセットに変換する関数を1つ用意するだけで
知りたいトリップのキーを保存するオフセットアドレスをトリップから直接得ることが出来るですよw
310 ◆Meriken//XXX :2013/10/10(木) 03:26:47.92 ID:1qnGPo+xP
盛り上がってますね〜
私はいまだに検索君1号の調整中です。
これ、ちゃんと使えるようになるのかな…
311 ◆Meriken//XXX :2013/10/10(木) 06:11:07.20 ID:1qnGPo+xP
MTFを起動しようとするとatimpag.sysでBSOD(0x00000116)が発生。
やっぱGPUが5個もあるのがいけないのかなあ。弱った弱った。
312 ◆Meriken//XXX :2013/10/10(木) 06:36:09.28 ID:1qnGPo+xP
いろいろいじってたらいつの間にか動くようになりましたw
後は微調整だけど、取りあえず動作確認は出来たので一安心です。
313名無しさん@お腹いっぱい。:2013/10/10(木) 06:43:37.09 ID:wd4utxMC0
何て贅沢で羨ましい悩み。w
314 ◆Meriken//XXX :2013/10/10(木) 07:05:19.03 ID:1qnGPo+xP
さすがにちょっとやり過ぎかもしれませんw
あれからまた安定しなくなったのでもっと調整が必要なようです。
実に難しいですねえ。
315混沌 ◆Chaos/geeeIV :2013/10/10(木) 07:38:15.24 ID:2gxQn/T50
おはようございます
いい感じに設定作業が進んでいそうですねー
316やんやん ◆yanyan/Pails :2013/10/10(木) 08:18:22.69 ID:9IgIyU1y0
Linux版の予定ってありますか?
317 ◆Meriken//XXX :2013/10/10(木) 08:42:56.48 ID:1qnGPo+xP
>>315
いやあ、それが結局あれから全然安定しなくて、とりあえず
7970をはずしちゃいました。残念なことにM6Eだと5GPU以上だと
安定しないようです。これまで使ってたCrosshair V Formula-Zが
特別だったのかもしれません。

ちょうどAVX2の次はGCNのアセンブラに取り組もうと考えてたので、
7970は開発機に移してしまうことにします。GCN版はかなりの長丁場になりそうなので、
まあ妥当なところでしょう。
318 ◆Meriken//XXX :2013/10/10(木) 08:43:40.37 ID:1qnGPo+xP
>>316
私自身がLinux版を作ることはないで〜す。
319 ◆Meriken//XXX :2013/10/10(木) 10:14:48.60 ID:1qnGPo+xP
7970を外してもまだ調子が悪いので、今度は7990だけにしてみました。
6990が原因だとまだ助かるんだけど、マザボの初期不良というのだけは勘弁して欲しいなあ。
320名無しさん@お腹いっぱい。:2013/10/10(木) 12:08:33.38 ID:LHshhmTP0
皆様お疲れ様です

すいませんが質問させて頂きます
トリップの回文と双連の違いは何でしょうか?

宜しくお願いします。
321名無しさん@お腹いっぱい。:2013/10/10(木) 12:37:06.54 ID:jg8QWjDo0
回文 abcdeffedcba
双連 aabbccddeeff
322混沌 ◆Chaos/geeeIV :2013/10/10(木) 12:48:04.01 ID:2gxQn/T50
現時点で12桁トリップ全てを保存するのは非現実的ってのはわかったけれど
現実問題として、計算しながら、計算した分をどんどん保存していくということを考えた場合どうなるのか・・・

現時点でユグが調子いい時で20GTpsくらいかな
1年スパンで考えた場合

20G=2^30*20
1年=311万秒≒2^20*3
(2^30*20)*(2^20*3) = 2^50*60

とりあえず計算しやすいってことと、速度増加見込みってことで4倍の速度 80GTpsを見込めると仮定して
2^50*2^6 = 2^56

80GTpsで1年間ぶん回すと2^16 T = 65536Tのトリップを生成


うーん、分散処理で実現するには容量以外にもネットワーク負荷の事や
>>294の用に全空間分容量のHDDに記録していくわけじゃないので
ハッシュインデックス化する必要があり、それを記録分担する仕組みを考えるとか
色々課題はあるものの
1年で65536T*12 のトリップキー容量とハッシュインデックス化に必要なインデックス容量考えただけで
現時点ではまだ厳しそうですね・・・w
323名無しさん@お腹いっぱい。:2013/10/10(木) 13:02:30.82 ID:hf+1FSU2P
HDDに1か所保存とか分散だと失われる可能性高そう

1キーでも失われたらそれを再びみつけるのはものすごく大変だろうなー
324名無しさん@お腹いっぱい。:2013/10/10(木) 13:14:55.98 ID:LHshhmTP0
>>321
分かりやすい説明
ありがとうございますm(_ _)m
325 ◆Meriken//XXX :2013/10/10(木) 14:43:28.90 ID:1qnGPo+xP
せっかく買ったM6Eですが、カードの選り好みが非常に激しく
なかなか性能を出せません。とりあえずうまく動いた7990と7970の
組み合わせで10桁トリップ検索専用にしておきました。
まあもともと種類の違うグラボを挿すこと自体かなり特殊なのですが、
この展開は完全に予想外です。やっぱり実際にやってみないとわかりませんねえ。
326 ◆Meriken//XXX :2013/10/10(木) 14:55:16.83 ID:1qnGPo+xP
まあいいや。今後どうするかはAVX2版の開発が終わってから考えようっと。
327 ◆JouJaku.IYSv :2013/10/10(木) 19:09:27.72 ID:56mjdoXX0
>>325
ご愁傷様です。
私も同じZ87チップセットですが、7990とTITANx2の混在で何も問題無くさくっと動きました。
謎ですねぇ。グラボと配線が干渉するので、これ以上追加して試すことは出来ません。

しかし、7990+TITANx2より7990+7970の方が速いって・・・。
328名無しさん@お腹いっぱい。:2013/10/10(木) 19:25:36.93 ID:QtlpUHtc0
Maxwell世代でMTFでもGeForceがRadeonに逆転したりしなんですかね
329 ◆Meriken//XXX :2013/10/10(木) 22:08:10.37 ID:1qnGPo+xP
>>327
7990を一番上のスロットに挿さないとまともに動かないし、
これまで使っていたPCIeの延長ケーブルとM6Eの相性も良くないようです。
AMDのドライバも最新のものでないと動きませんでした。不思議なもんです。
330 ◆Meriken//XXX :2013/10/10(木) 22:31:07.18 ID:1qnGPo+xP
そうか、M6Eは開発機にまわして、検索君1号はこれまで通りでもいいのか。
時間かかるけどそうしよっかな。
331 ◆Meriken//XXX :2013/10/10(木) 23:42:11.44 ID:1qnGPo+xP
今調べたら電源のPCie用のケーブルの端子の先が少し溶けてました。
どうも不安定だった原因の一部はこれにあるようです。
やっぱり無茶させすぎですね。新しいのを注文することにします。
これでうまく行けばかなりおいしいけどどうかな〜
332 ◆Meriken//XXX :2013/10/10(木) 23:47:34.88 ID:1qnGPo+xP
>>327
>>328
現在CUDA版の10桁トリップ検索のボトルネックになっているのは共有メモリの量なので、
これが増えない限りは速度は上がらないはずです。TITAN用に書き直せば
もちろん話は別ですが…
333 ◆Meriken//XXX :2013/10/11(金) 01:40:41.48 ID:oMuOOsM+P
電源のPCIe用のケーブルを開発機から持ってきて取り付けたら
ようやく検索君1号が12桁トリップ検索でも安定して動くようになりました。
7990を一番上に乗っけているので見た目は前よりさらにやばくなりましたが、
前より冷えるようになったので速度は上がっています。
これで心置きなくAVX2対応の作業を始められます。
334 ◆Meriken//XXX :2013/10/11(金) 06:38:50.63 ID:oMuOOsM+P
あれからまた不安定になったので、今度は7990+6990+6990の組み合わせを
試してみましたが、今までで一番安定して動いています。
M6Eはなるべくビデオカードの種類を揃えてやると安定して動作するようです。
すんなり動かなくてエライ目に遭いましたが、もう大丈夫でしょう。
335名無しさん@お腹いっぱい。:2013/10/11(金) 07:00:31.48 ID:kG6nG+a40
コネクタが溶けるとかどんだけw
336混沌 ◆Chaos/geeeIV :2013/10/11(金) 10:16:34.06 ID:7L8VTn8Q0
337 ◆Meriken//XXX :2013/10/11(金) 15:01:05.83 ID:oMuOOsM+P
7990は化物ですw 空冷だと12桁トリップ検索で本気を出しきれないのが
残念ですが…
338 ◆Meriken//XXX :2013/10/11(金) 15:14:10.87 ID:oMuOOsM+P
AVX2対応のためにコードを見直してたのですが、
12桁トリップ検索はすぐに対応できそうです。楽しみだな〜
339混沌 ◆Chaos/geeeIV :2013/10/11(金) 15:31:38.11 ID:7L8VTn8Q0
自作なんてしたのも、もう遥か昔のことで最近のPC事情とか、全然ついていけない話になっているのですがw
「グラボ」にメモリ6Gってなんじゃそりゃwww って感じですよw
340SilentPC ◆SilentPCIePC :2013/10/11(金) 16:20:48.16 ID:vXaPX/w40
341 ◆YSRKEN.ceVZZ :2013/10/11(金) 16:37:10.98 ID:kAO/Va9a0
もはや電子レンジクラス
342SilentPC ◆SilentPCIePC :2013/10/11(金) 16:45:35.62 ID:vXaPX/w40
>>341
なるほど、つまり電子レンジで中のものを温めながら、同時にファンで中のものが熱くならないよう冷やしているのがHD7990なんだね。
拷問の域だな…(;´д`)
343混沌 ◆Chaos/geeeIV :2013/10/11(金) 17:08:53.79 ID:7L8VTn8Q0
暖めながら冷やすって言ったって
空冷だろうと水冷だろうとたとえ油冷であってもw
換気するか冷房でもしない限り、冷ました熱は全て部屋にたまるわけでして・・・

1年中強力ハロゲンヒーター部屋の中で動かしてるようなものですよねw
344名無しさん@お腹いっぱい。:2013/10/11(金) 17:19:47.06 ID:21WqkArR0
液体窒素の中に沈めて冷却する選択肢
345 ◆YSRKEN.ceVZZ :2013/10/11(金) 17:29:51.23 ID:kAO/Va9a0
>>342
自分で言っててアレだが、レンジとかオーブンって1000W↑が普通だからちょっと違うかも
(ハロゲンヒーターとか電気ポットとかの方が近い)

その辺の冷蔵庫で250kWhぐらい(一日700Wh)だからそれより断然金が掛かるって……
346 ◆Meriken//XXX :2013/10/11(金) 17:30:20.53 ID:oMuOOsM+P
>>343
6990も2枚あるから、ヒーターは3台ですw
7990はともかく、6990のうるさいのなんのって…
347混沌 ◆Chaos/geeeIV :2013/10/11(金) 17:30:31.68 ID:7L8VTn8Q0
いや、だから同じですってw
クーラーだって、室外機を部屋に持ち込めば、コンプレッサ動かしている分立派な暖房ですしw
冷蔵庫が部屋の中にあれば、冷蔵庫の中身は冷えても部屋の温度は上がるしw
液体窒素だって、液体窒素自体を冷やす装置が室内にあったら、冷やしたい部分を効果的に冷やす事はできても
部屋全体の温度はどんどんあがって・・・w
348 ◆Meriken//XXX :2013/10/11(金) 17:31:34.76 ID:oMuOOsM+P
>>345
検索君1号だけで1300W超えてますw
349混沌 ◆Chaos/geeeIV :2013/10/11(金) 17:32:03.99 ID:7L8VTn8Q0
あw >>347は >>344にですw
350 ◆Meriken//XXX :2013/10/11(金) 17:35:32.84 ID:oMuOOsM+P
とりあえずAVX2を検知するルーチンを追加しました。
まあ時間はたっぷりあるのでのんびりやることにします。
351名無しさん@お腹いっぱい。:2013/10/11(金) 17:52:36.25 ID:zZdEZh+x0
冷蔵庫inで、検索。
352SilentPC ◆SilentPCIePC :2013/10/11(金) 17:59:12.22 ID:vXaPX/w40
もういっそ、豪快にアメリカらしくガレージに検索君を置いて、水冷モーターは排水ポンプ用のを使って、ラジエーターは自宅のプールに沈めるのが良いのかもね…
日本なら逆にエコを意識して、発熱で発電をしてその電気で冷却をする装置を開発し、電気代を節約とか。
普通のPCの発熱程度じゃ無理でも、それぐらいの消費電力になれば流石にいくらか還元は出来ないものか?
何か良い発電装置のアイデア無いですか?
353混沌 ◆Chaos/geeeIV :2013/10/11(金) 18:37:11.10 ID:7L8VTn8Q0
冷蔵庫in、検索してみたら想像してたのと全然違ったw


冷蔵庫搭載PC
http://weekly.ascii.jp/elem/000/000/093/93313/
http://weekly.ascii.jp/elem/000/000/093/93292/120610_com_omoshirocaseimg09_cs1e1_1000x.jpg

とか
冷蔵庫の中にマザー入れちゃって冷やすやつとか

そーいうのを想像してたのに、最近流行りのアレだったのね・・・w
354名無しさん@お腹いっぱい。:2013/10/11(金) 19:00:32.74 ID:fckT3S+N0
新生検索君1号大勝利!!!!!
355名無しさん@お腹いっぱい。:2013/10/11(金) 23:27:37.53 ID:r5Pqdip00
>>347
とりあえず最終的な廃熱を室内空気じゃなくて外気に捨てるところからですね。
>>352
温度差で発電すると発電機が熱抵抗になっちゃいますからねぇ…
温度差発電による稼動効率補助つきDCの噂は聞いたことありますが、
発電電力による冷媒循環での効率上昇が発電の熱抵抗を上回れるかどうか。
>>353
冷蔵庫/冷凍庫は温度差が稼げるだけで熱交換速度が遅いから、
断熱性のお陰で逆に蒸し風呂になるってアレですねww
356名無しさん@お腹いっぱい。:2013/10/12(土) 05:04:23.90 ID:BCrjFCBd0
664 :名無しさん? [↓] :2013/10/11(金) 23:58:53.30 ID:???
AMD Catalyst 13.11 Beta Driver for Windows
http://support.amd.com/en-us/kb-articles/Pages/latest-catalyst-windows-beta.aspx
357 ◆Meriken//XXX :2013/10/12(土) 10:00:12.64 ID:Oyi47z8vP
>>356
15日に発表のR9 290Xは対応カードの一覧には入っていませんね。
発表の日が楽しみです。
358 ◆Meriken//XXX :2013/10/12(土) 10:17:44.74 ID:Oyi47z8vP
とりあえずAVX2で12桁トリップ検索を動かしてみました。
CPU(i7-4770)だけで209M TPS出てます。

http://www.meriken2ch.com/files/2013-10-11-AVX2-1.png

ただ、リテールクーラーでは冷却が追いつかないようで、
しばらくしたらCPUがスロットルダウンして速度が下がってしまいました。

http://www.meriken2ch.com/files/2013-10-11-AVX2-2.png

まあでも実際に倍近い速度が出せたのでまずまずの成果と言っていいでしょう。
359 ◆YSRKEN.ceVZZ :2013/10/12(土) 10:29:55.29 ID:RMpLDz7l0
>>358
CUI画面がすごく懐かしく感じる……あれ、
無料版でもCUI実行で検索できましたっけ?
360 ◆Meriken//XXX :2013/10/12(土) 10:32:37.37 ID:Oyi47z8vP
>>359
出来ませんよ。開発用に有効にしてるだけです。
361 ◆Meriken//XXX :2013/10/12(土) 10:52:01.12 ID:Oyi47z8vP
32bit AVX2版も作ってみたのですが、こっちでは検索開始直後に
230M TPS出ています。かなり謎です。キャッシュの使い方とか、
OoO向けの最適化とか、工夫の余地はまだ大分ありそうです。
362 ◆QZschizo.ptH :2013/10/12(土) 12:27:39.22 ID:zonN9MYx0
5970x2ですがやっぱりデバイス判定に時々失敗します.
再現性をみるのにどこから手をつけたらいいですか?
363 ◆Meriken//XXX :2013/10/12(土) 12:34:44.55 ID:Oyi47z8vP
CPUのクロック周波数を3.5GHzまで落としたらようやく熱ダレを起こさなくなりました。
速度はこんなかんじです。

64bit版: 186.84M TPS
32bit版: 209.06M TPS

同じ条件でのDayトリッパーの速度は次になります。

DayTripper2101: 154M TPS

MTFはかなりの速度を出しているのですが、
64bit版のほうが32bit版より遅いことの説明がつきません。
やっぱりCで書いたルーチンを見なおした方がいいのかな…
364 ◆Meriken//XXX :2013/10/12(土) 12:41:52.14 ID:Oyi47z8vP
>>362
それはおかしいですね。とりあえず開発版のMerikensTripcodeEngine.exeを
動かして、デバイス判定の失敗したときに"OPENCL DEVICE"の"Name"の部分に
何が表示されているか調べてみて下さい。ドライバのバグの可能性が高いので、
ドライバを変えてみるのもいいと思います。
365 ◆Meriken//XXX :2013/10/12(土) 13:50:51.64 ID:Oyi47z8vP
64bit版が遅くなっていた理由がわかりました。
yasmのビルトインマクロであるsave_xmm128が
vmovdqaではなくmovdqaを使っていました。
まったく、油断も隙もあったものではありませんw
これで速度差は妥当なものになりました。やれやれです。

64bit版: 211.96M TPS
32bit版: 209.06M TPS
366 ◆Meriken//XXX :2013/10/12(土) 15:02:59.99 ID:Oyi47z8vP
キャッシュに乗りやすいようにテーブルの一部を関数ローカルにコピーしてやったら、
それだけで2〜4M TPSほど速度が上がりました。結構まだ工夫の余地がありますねえ。

64bit版: 216.11M TPS
32bit版: 210.78M TPS
367名無しさん@お腹いっぱい。:2013/10/12(土) 15:12:32.49 ID:UKFSL8z80
>>353
VAX Barで通った道なのに今更感が強いですね、これ
368 ◆Meriken//XXX :2013/10/12(土) 15:42:11.41 ID:Oyi47z8vP
>>352
一軒家に住んでたら間違いなく検索君1号はガレージ行きですねw
自室に置いているのは、我ながら正気の沙汰ではありません。
冬に暖房が全く必要ないのは助かりますが…
369 ◆JouJaku.IYSv :2013/10/12(土) 15:59:07.38 ID:SgElHHWv0
>>366
お疲れ様です。
同じCPUで定格(3.7GHz)だと約120MTPSなので、ほぼ倍のスピードが出ていますね。
水冷だとサーマルスロットリングは起きないだろうから、楽しみです。
370混沌 ◆Chaos/geeeIV :2013/10/12(土) 17:28:36.27 ID:+NNdeoDL0
>>367
VAXを知らない畑にいたわけじゃないけど
直接端末に触れた事はほとんどない・・・
ただ、あいつがあるコンピュータルームってのは肌寒くてねぇ・・・w

触れたこともほとんどないから、VAX Barなるものもはじめて聞いたんだけどググってみたよw
感想は、メリケン野郎の考えることはクレイジーだぜw って感じw

メリケンさんに引っ掛けたけど、別に罵倒でも卑称でもないのであしからずですw
っていうか、メリケンさんの名前 ハンドルはその意味から取ってて、今住んでるのもソッチのほうなんだろうけど日本人ですよね?
371名無しさん@お腹いっぱい。:2013/10/12(土) 19:44:19.02 ID:XeWEbd3E0
VAX って、VAX/VMS の事??
それなら懐かしいな・・・
372混沌 ◆Chaos/geeeIV :2013/10/12(土) 20:41:37.86 ID:+NNdeoDL0
>>371
ですですw
373名無しさん@お腹いっぱい。:2013/10/13(日) 01:11:31.43 ID:KYI8bH6i0
今更なことですが、検索文字列がヒットしたら、該当する依頼を無効にする
(ゆぐちゃんではなくローカルでの話)機能って付けられますかね?
374名無しさん@お腹いっぱい。:2013/10/13(日) 01:34:02.23 ID:xoBD38890
グラボごとの速度をまとめたWikiとかってどっかにありますか?
375混沌 ◆Chaos/geeeIV :2013/10/13(日) 04:58:52.86 ID:fqcxyF9L0
ローマ字っぽい4文字を適当に作ってみる正規表現の超適当版
^[KSTNHMRGZDBP][aiueo]([kstnhmrgbp][aiueo]){3}/
こんな感じで検索回してみたものの・・・


確かにローマ字なんだけど、まともな単語が出来る確率の低さにがっかりw
376磯の良い石 ◆ISONOIIISI :2013/10/13(日) 05:20:16.81 ID:KYI8bH6i0
>>375
昔、ローマ字のみで意味が通るトリップを生成するための正規表現を自作したことがある
1文字の類(母音)、2文字の類(母音以外の1文字カナ)、3文字の類(拗音を含む類)を
長さが12桁(or10桁)になるように並べたデータをプログラム組んで用意して、
patterns.txtに書き込んで回したもんだ……展開が物凄いことになったがな!

で、上に出ている酉がその成果の一つだったり……
377名無しさん@お腹いっぱい。:2013/10/13(日) 05:35:30.40 ID:KYI8bH6i0
>>374
データの蓄積自体は相当量ありますが、なにせアップグレードでガンガン速度向上しますもので……
このスレだけ見ると、
「HD6990+HD7970+HD7990≒11.1GTPS」(>>3、Ver.0.10)
「HD6850≒805MTPS」(>>19,Ver.1.1FEα2)
「HD 5570/5670≒340MTPS」(>>94,Ver.1.1FEα5)
「GTX660≒536MTPS」(>>98,Ver1.1FEα4)
「GTX650≒207MTPS」(>>101,Ver1.1FEα5)
「GeForce610M≒64.3MTPS」(>>114,Ver1.1FEα5)←参考記録
「GTX650≒9.24MTPS」(>>154,Ver1.1FEα7)←!?
といった感じですかね。他は前スレを当たることをお勧めします
378名無しさん@お腹いっぱい。:2013/10/13(日) 05:44:41.91 ID:JeVY24vu0
>>377
> 「GTX650≒9.24MTPS」(>>154,Ver1.1FEα7)←!?
これは10桁ですよ
379名無しさん@お腹いっぱい。:2013/10/13(日) 05:46:37.71 ID:KYI8bH6i0
>>378
あ、本当だテヘッ
380名無しさん@お腹いっぱい。:2013/10/13(日) 05:54:58.91 ID:+cbnuJwL0
>>377
グラボ、ドライバ、バージョン、設定値・・・手集計はミスが怖いし、
ゆぐちゃんでグラボと速度の情報とって公開してくれたら面白そう
381 ◆Meriken//XXX :2013/10/13(日) 09:04:25.37 ID:EU+GIsqgP
>>370
日本人ですよ〜
382 ◆Meriken//XXX :2013/10/13(日) 11:34:03.90 ID:EU+GIsqgP
10桁トリップ検索のAVX2への対応がなかなかうまく行きません。
ぐぬぬぬぬ…
383 ◆Meriken//XXX :2013/10/13(日) 13:53:21.35 ID:EU+GIsqgP
一応AVX2対応の10桁トリップ検索のルーチンは動くようになったのですが、
なかなか思ったような速度が出てくれません。

AVX(8スレッド): 23.95M TPS
AVX2(8スレッド): 37.98M TPS
AVX2(4スレッド): 35.09M TPS

まあそれなりに速くはなっているのですが、L1Dキャッシュが潰れているみたいで、
倍の速度にはなりませんでした。ちなみに8スレッドから4スレッドにても
あまり速度は落ちていません。やはりキャッシュの使い方を工夫するしかないですねえ。
384混沌 ◆Chaos/geeeIV :2013/10/13(日) 14:31:17.44 ID:fqcxyF9L0
>>376
10桁の方はまだマシなんですが、12桁だと特に
ちょっと無茶なパターンを作ると、すぐに展開サイズがシャレにならない事になって
MTFで検索開始しても、パターンを展開中・・・ まではまだ何とか動いても
そのあとのパターンを処理中で帰ってこなくなってw
帰ってきても、なぜかその後のユグと通信に失敗して何分後に再通信しますとなって、その時間になると展開から再開になって繰り返すのよねw
なんかエラーのアラート窓が出た時もあったな・・w 10秒くらいでその窓消えちゃったから内容確認できなかったけど・・w

まぁそんな感じで、パターンは展開後のサイズがあんまりでかくなり過ぎないように気をつけているのと
パターン定義の入力欄、一応長い定義も書き込めるみたいだけど入力窓あんまり大きくないし、どうせ表示も表示窓の横幅までだから
あんまり複雑な定義もなーって思ってたけど
patterns.txtに直接かーw
patterns.txt って、相当長くなってしまってもしっかり読み込んでくれるのかな(使用可能なメモリの上限チェックとかもろもろ、そういう処理コミコミで)
というか、上記のエラーとか不安定だったのはグラボのメモリの制限なのかなって、自分のグラボを今更ながらみてみたら2Gもメモリあるのね・・・w
7990が6Gも積んでて信じられんとおもったけど、2Gでも十分に信じられないレベルだったw

閑話休題

古い人間なもので、「グラフィックシステム」でユーザープログラムを動かす なんていうと
FM-7のグラフィックサブシステムにYAMAUCHIコマンドで数バイトの共有メモリを使ってプログラムを転送して・・・w
なんてイメージが湧いてきちゃうのですよw(「YAMAUTIコマンド」はググると出てくるはずw)

とはいえ、今のグラボにユーザー処理させるってのも、やっぱり転送して走らせるとかするのでしょうね
動かすプログラムは・・・・・・・むむっ・・・w うーん、スレみてるとアセンブラに置き換える話がでてきてるのはわかるんだけど
GPUに対応したコード吐くコンパイラとかあるって事なのか・・


うーん、我ながら話が飛びまくったわけのわからんレスに・・・w
385名無しさん@お腹いっぱい。:2013/10/13(日) 14:58:50.97 ID:KYI8bH6i0
>>384
昔書いた展開用コードを引っ張りだしてみました。
まず、ローマ字でカナを表現すると、
・アルファベット1文字 ([aiueo]|n)
・アルファベット2文字 ([kstnhmyrwgzjdbp][aiueo]|sh[aiuo]|ts[aiuo]|ch[aiuo]|fu|oh)
・アルファベット3文字 ([kstnhmrwgzjdbp]y[aiueo]|kwa|gwa)
となります。流石にこのままだとハズレ率が半端なくなるので、実際には
[aiueon]と([kstnhmr][aiueo]|y[auo])と[kstnhmr]y[auo]に限定していましたが。
後は「3322」「13231」など長さ「のみ」記述したデータをループ回しで全生成し、
数字部分を上記正規表現文字列に置換すれは完成です。
ちなみに今適当に回したら10桁用で1760行ありました……。

まあこれですらハズレまくるのは目に見えている(感覚としては砂金採りに近い)ので、
あらかじめ豚辞書(フリーの単語リスト)データから「文字の組み合わせ」情報を抽出し、
それに当てはまらないような文字列(日本語っぽくならなさそうなもの)を弾くコードを別に書いて篩に掛けました。
最終的には、ヒットした結果の文字列ファイルを用意すると、
ワンクリックでかな変換→篩に掛けて出力までしてくれるようなものまで作った思い出があります。

結論:HSP様々。なんならお手軽検索キットでも送りましょうか?w
386 ◆Meriken//XXX :2013/10/13(日) 15:24:46.07 ID:EU+GIsqgP
皆さん私が考えてもみなかったような使い方をされてますね。
かなり新鮮ですw
387 ◆Meriken//XXX :2013/10/13(日) 15:27:45.22 ID:EU+GIsqgP
キャッシュを潰さないためにお蔵入りになったルーチンを引っ張り出してきました。
AVXだけだと微妙に遅くなるのですが、このさい文句はいってられません。
これをAVX2で書き直せばそれなりの性能が出るはずです。
388混沌 ◆Chaos/geeeIV :2013/10/13(日) 15:51:14.32 ID:fqcxyF9L0
>>385
ローマ字じゃなく
英文生成もどきみたいなのも、ちょっと考えてみようとしたんですけどねw

(名詞A|名詞B|名詞C)(動詞A|動詞B|動詞C)(名詞D|名詞E|名詞F) とか
適当な構文と品詞の組み合わせで・・・w

そんな風に考えたんだけど、既に検索中の正規表現だけでも
たとえば
^i[il][il][iIl][iIl][iIl][iIl][iIl][iIl][il][il]i$ とか
^[.]*[vwW]+[.]*$  とか
これでもあんまりサイズがでかくなり過ぎないようにセーブしながら作ってはいるんだけど
それでも地味に容量食うパターンが大量にあって気軽にパターンを増やせない状況になってて英作文正規表現はおあずけ中ですw
389 ◆znjnB.IJwZLU :2013/10/13(日) 17:43:41.60 ID:J8269aFW0
>>387
Haswell導入おめでとうございます。

DESですが私のほうではあのcryptをそのまま256bit化して素直に倍の50MTPS出てます。
まあもともと256bit化したときにキャッシュに乗り切るようにあんな構造にしたので。

それよりもSHA-1で躓いてます。
アセンブラで書いてみたのはいいんですがハイパースレッディングがある状況ではあまり恩恵がありません。
イントリで書いてコンパイラに投げても同じ速度が出ます。
まあ、HT切るとスレッドあたり3MTPS差が付くんですが、HTがあると実行ポートを埋めきってしまえるみたで
107MTPSあたりで頭打ちになります。

アセンブラのほうは一週間かけてバイトコードと睨めっこしながら手動パイプライン化までしたのに・・・泣。
390名無しさん@お腹いっぱい。:2013/10/13(日) 20:07:00.46 ID:2IRlbwYd0
>>372
> ですですw
あれって、何かバッチファイル的な言語があったよね。
あれで擬似ログアウト画面を作って、色んな人のユーザ名とパスワードを集めまくった思い出が・・・
VAX/VMS 上でのクロス開発はかなりやったので、本当に懐かしいわ。
391名無しさん@お腹いっぱい。:2013/10/13(日) 20:25:28.75 ID:KYI8bH6i0
:::::::::::.: .:. . ∧_∧ . . . .: ::::::::     引っ張りだしたコードを元に、自動生成した
:::::::: :.: . . /彡ミ゛ヽ;)ヽ、. ::: : ::   patterns.txtを食わせてみたらメモリ不足で落ちた……
::::::: :.: . . / :::/:: ヽ、ヽ、i . .:: :.: :::.  ttp://up3.viploader.net/desktop/src/vldesk007817.jpg
 ̄ ̄ ̄(_,ノ  ̄ ̄ヽ、_ノ ̄.     左のタイマは検索実行と同時な。4GBほどメモリ食ってから
                         落ちたことからして、よほど工夫しないと検索不可能かもorz

参考までにpatterns.txtをば:http://www1.axfc.net/u/3057287.txt
392混沌 ◆Chaos/geeeIV :2013/10/13(日) 20:49:06.63 ID:fqcxyF9L0
>>390
フィッシング詐欺の手法のハシリみたいなかんじですなw
今となっては、セキュリティとかパスワードとか、色々そういう考え方が社会的に認知されてきたりしているけど
そもそも一般の人は銀行の暗証番号以外、パスワードで何かを守るなんてこと自体がなかったような時代だし
根本的に考え方が違ってた気がしますねぇw
393名無しさん@お腹いっぱい。:2013/10/13(日) 22:44:36.72 ID:r9Dbzyno0
>>391
いろいろと酷い
394混沌 ◆Chaos/geeeIV :2013/10/13(日) 23:00:40.77 ID:fqcxyF9L0
>>391
展開後のパターンじゃなく、途中まで展開した正規表現群みたいな感じですねw
12桁でこれを全パターンやったら、そりゃキますわw
[AIUEO]{12} これだけでも 約2^28 ですよw
これに加えて、1文字目から12文字目まで母音が入るパターンまで加えたらそりゃ大変なことにw
395名無しさん@お腹いっぱい。:2013/10/13(日) 23:26:46.46 ID:2IRlbwYd0
>>391
壁紙が気になる・・・
396名無しさん@お腹いっぱい。:2013/10/13(日) 23:29:37.53 ID:KYI8bH6i0
>>394
>[AIUEO]{12} これだけでも 約2^28 ですよw
一応、元々のコードでは「母音か拗音組が三連続したら弾く」というルーチンが
含まれていたので、そいつを組み込んだら行数が半分以下に。ただ、それでも
メモリ食い過ぎで検索できないのは変わらず。念のため、

[aiueo][aiueon][kstnhmr][aiueo][aiueon][aiueon][kstnhmr][aiueo][kstnhmr][aiueo]

だけ書き込んで回してみると、展開に4分ほど掛かった末にメモリを720MBほど消費しましたw
そりゃ無理ゲーだわ、と言うか確か最初に作った時(今年の1月始め)は待て屋で回してたような……
397名無しさん@お腹いっぱい。:2013/10/13(日) 23:29:47.39 ID:oUFnliXQ0
「ロリ・義母
ンデレ・孕ま
398名無しさん@お腹いっぱい。:2013/10/13(日) 23:34:55.01 ID:KYI8bH6i0
>>395
http://www.pixiv.net/member_illust.php?mode=medium&illust_id=12189369
ですね。
>>397
勘違いしないでよね! 全体のフォルダ名は
「ロリ・義母・ツンデレ・孕ませ・寝取られ・・・すべての萌えは源氏物語が産んだ!」
http://blog.livedoor.jp/geek/archives/50949346.html
なんだから!!
399名無しさん@お腹いっぱい。:2013/10/13(日) 23:46:02.97 ID:KYI8bH6i0
:::::::::::.: .:. . ∧_∧ . . . .: ::::::::     ちなみに、>>396で書いたパターンを待て屋で回したら
:::::::: :.: . . /彡ミ゛ヽ;)ヽ、. ::: : ::   メモリ消費量僅か5MB……現実は非情である
::::::: :.: . . / :::/:: ヽ、ヽ、i . .:: :.: :::.
 ̄ ̄ ̄(_,ノ  ̄ ̄ヽ、_ノ ̄
400名無しさん@お腹いっぱい。:2013/10/13(日) 23:47:17.62 ID:B/E+227R0
待て屋ってソース公開されてたっけ?
それなら、メモリ消費の少ないその方法を採用してみるとか。
401混沌 ◆Chaos/geeeIV :2013/10/14(月) 00:06:18.79 ID:HNICMWPj0
>>400
自分は ずっと前のトリッパーをちょこちょこ使っていた程度で、待てやとかも使ったことはないんですが
ただ、展開するから高速にマッチ出来るんじゃないかと思うw
このスレの過去ログとかほとんど見てないけど、初期はパターン数制限あったのがある時期に制限がなくなったってのが

たぶんその時に、パターンを展開して(おそらくはマッチする法のトリップも相当数メモリに展開してからまとめて)
アルゴリズム検索(2分検索みたいな?)を取り入れたんじゃないかと予想

メモリ展開して最適化するからこその、大量検索パターンを高速にマッチできてるんだと思いますよw
402名無しさん@お腹いっぱい。:2013/10/14(月) 02:51:29.17 ID:Ehj1Nv8O0
一応、パターン作成+結果からトリップ抽出+ローマ字変換+篩い掛けできるセットを配布しておきます。
ソースコードも添付しますので、参考までにどうぞ。

ttp://www1.axfc.net/u/3057797.zip
403 ◆ISONOIIISI :2013/10/14(月) 02:52:29.66 ID:Ehj1Nv8O0
あ、私はID:KYI8bH6i0です。
404名無しさん@お腹いっぱい。:2013/10/14(月) 03:17:32.75 ID:a2gerbx00
>>391
>>> 正規表現の場合、展開数で制限を設ける方式ですか?
>> おおまかに言えばそうですね。
>> 厳密に言えばハッシュ値の数で決まります。
> http://toro.2ch.net/test/read.cgi/esite/1379214816/100-101
なんかもう全部展開しちゃってる感じ?

>>401
先にメモリに展開する場合、展開したテーブルがキャッシュやメモリから溢れると思いっきりロスしそう。
展開数が一定範囲を超えたら正規表現とのマッチ処理をJITするのが最速なのかな・・・
405 ◆Meriken//XXX :2013/10/14(月) 04:18:18.49 ID:cHLdpSNUP
MTFではパターンの一部(5文字)からハッシュ値を作成していて、
ハッシュ値の生成に必要な分は最初に全て展開しています。
この方法だと非常に強力な正規表現が使える代わりに
メモリの消費量は大きいです。

正規表現の部分は2年前に作ってからほとんどいじっていないので
改善の余地がかなりあります。待て屋のマッチングのアルゴリズムは
かなり特殊なのですが、これについては鳥屋氏にいろいろ教えて
いただいたので、ぜひMTFに取り込みたいところです。
406 ◆Meriken//XXX :2013/10/14(月) 04:22:38.64 ID:cHLdpSNUP
>>369
どもども。10桁トリップ検索のAVX2対応の作業がおわったら新しい開発版を
うpするのでお楽しみに。
407 ◆Meriken//XXX :2013/10/14(月) 04:34:56.58 ID:cHLdpSNUP
>>389
> まあもともと256bit化したときにキャッシュに乗り切るようにあんな構造にしたので。

なるほど、そういうことだったんですね。流石です。

> 107MTPSあたりで頭打ちになります。

これはおかしいですねえ。ちょっとMTFがどうなってるか調べてみます。
408 ◆Meriken//XXX :2013/10/14(月) 05:17:58.05 ID:cHLdpSNUP
10桁トリップのAVX2対応のルーチンがようやく動きました。

AVX(8スレッド): 23.65M TPS
AVX2(8スレッド): 43.44M TPS
AVX2(4スレッド): 39.04M TPS

>>383よりだいぶましになりました。
CPUを定格に戻せば48.40M TPS出る計算です。
HTの効きは今ひとつなので、まだキャッシュの使い方に
改善の余地がありそうです。
あとは最終転置やキー生成の処理の見直しですね。
409 ◆Meriken//XXX :2013/10/14(月) 05:39:05.79 ID:cHLdpSNUP
>>389
12桁トリップ検索はこんな感じです。速度が出ないのはなかなか謎ですねえ。

AVX(8スレッド): 117.31M TPS
AVX2(8スレッド): 215.71M TPS
AVX2(4スレッド): 184.12M TPS
410 ◆Meriken//XXX :2013/10/14(月) 08:45:16.44 ID:cHLdpSNUP
キー生成のルーチンを見なおして、10桁トリップ検索の速度が
少し上がりました。

AVX2(8スレッド): 43.44M TPS -> 46.02M TPS

定格で51.28M TPS相当なので、まずまずといったところでしょう。
もうちょっと搾り取れそうな気もしますが、かなり疲れたので
取りあえず休憩することにします。
411 ◆Meriken//XXX :2013/10/14(月) 12:17:57.42 ID:cHLdpSNUP
しかしこうなるときちんと定格で動かしてみたくなりますねえ。
これ買ってHaswellと7990を一緒に冷やそうかしらん。

http://koolance.com/ex2-755-exos-2-v2-liquid-cooling-system-aluminum
412 ◆JouJaku.IYSv :2013/10/14(月) 12:46:18.97 ID:AyB6J17g0
>>411
120x2では7990フルパワーの発熱を受けきれないと思います。
4770K+7990+TITANx2では、120x5でギリギリ耐えきれませんでした。発熱の大半は、7990のはずです。
今120x7にして何とか12桁検索も定格で出来る状態です。

あと出来ればKOOLANCEは避けた方が良いかと。
413 ◆JouJaku.IYSv :2013/10/14(月) 12:56:50.26 ID:AyB6J17g0
この様な出来合の物は、今の所簡易型(≒おもちゃ)しか有りません。
GPGPU用途で耐えられる様な物は、自分でパーツを買い集めて組み立てるしか有りません。
幸い米国だとパーツの入手性は日本よりずっと良いので、お勧めです・・・というか羨ましい(笑)。

ポンプ、ラジエータ、ヘッダーをホースで繋いで車やバイクのクーラントを流すだけです。簡単ですよ!
414 ◆Meriken//XXX :2013/10/14(月) 13:20:20.30 ID:cHLdpSNUP
なるほどなるほど。もうちょっとまじめに考えた方がよさそうですねえ。
こういうのが出来合いであればいいんですけど…

http://i11.photobucket.com/albums/a190/Fuganater987/DIY%20Radiator%20Stand/DSC02337.jpg
http://www.techpowerup.com/forums/showthread.php?t=166624
415名無しさん@お腹いっぱい。:2013/10/14(月) 13:23:54.29 ID:B+11Ym8s0
416 ◆Meriken//XXX :2013/10/14(月) 13:24:25.58 ID:cHLdpSNUP
AVX2対応が終わったつもりでいたんですが、10桁トリップ検索の32bit版がまだでしたw
一応作っておきますが、Haswellで32bit版を使う人なんているのかしらん。
417 ◆Meriken//XXX :2013/10/14(月) 13:28:40.24 ID:cHLdpSNUP
>>415
お金があったら間違いなくそれを買っていますw
418混沌 ◆Chaos/geeeIV :2013/10/14(月) 14:13:50.76 ID:HNICMWPj0
>>405
全部展開しているわけじゃないんですねー


なんで5文字なんだろうって、なんとなしにぐぐりながら、
「はー、ソースの名前についてたshaとか生成アルゴリズムの名前なのね」とか
その先まで追ってみようと思ったけど、もう頭がついていかなくなってるや ざんねんw
419 ◆Meriken//XXX :2013/10/14(月) 14:37:31.59 ID:cHLdpSNUP
ハッシュが5文字なのは、トリップの一文字が6bitで表せるので、
5文字だと30bitになって32bitワードに収まるからです。

ソースはある程度予備知識がないとちょっと追うのは厳しいかもしれません。
昔Knuth先生のLiterary Programmingを読んで非常に面白いなと思ったんですけど、
いつかあんな形でソースコードの解説を書きたいですね。
420 ◆Meriken//XXX :2013/10/14(月) 14:40:22.42 ID:cHLdpSNUP
Knuth先生のはLiterate Programmingでした。
421 ◆Meriken//XXX :2013/10/14(月) 14:57:14.16 ID:cHLdpSNUP
10桁トリップ検索の32bit AVX2版もえいやっと作ってしまいました。
AVX版の8割増の速度で動いているので、まあいいことにしておきます。
今日はここまでにして、明日以降にひと通りテストして新しい開発版を用意する予定です。
422 ◆JouJaku.IYSv :2013/10/14(月) 18:04:05.68 ID:AyB6J17g0
>>415
650EURなら安いじゃないと思ったけど、今円安でしたね・・・ってそう言う問題じゃ無い(笑)。

>>414
出来合には期待できませんね。ニッチすぎて市場規模が小さすぎます。
そこまで細かい所まで自作しなくても大まかなパーツなら有るので、自分で組み立てるしか!
ttp://www.performance-pcs.com/catalog/index.php?main_page=product_info&products_id=36764
ttp://www.performance-pcs.com/catalog/index.php?main_page=product_info&products_id=33261
423 ◆ISONOIIISI :2013/10/15(火) 02:37:30.79 ID:bSVdQBIE0
>>402の更新版です。
・ローマ字文生成用パターン作成ソフト
・検索結果からトリップのみを抽出するソフト
・文字列をローマ字変換するソフト
・文字列を文字列長・文字コードでソートするソフト
・平仮名を篩に掛けるソフト(旧版とMecab利用の改良版)
・検索結果を利用して、検索ワードを自動削除するソフト
(通常の大量検索用)
・普通の単語リストを検索タゲ用に整形するソフト

以上のソフトの袋詰めです。
http://www1.axfc.net/u/3058958.zip
424 ◆Meriken//XXX :2013/10/15(火) 03:15:02.72 ID:rwfcxvozP
>>422
なかなか良さげなパーツですねえ。もうちょっといろいろ調べてみます。
425 ◆Meriken//XXX :2013/10/15(火) 04:09:44.35 ID:rwfcxvozP
>>423
YSRKENさん、前にも言ったと思いますが自作のプログラムの話は
よそでお願いします。
426名無しさん@お腹いっぱい。:2013/10/15(火) 04:22:43.60 ID:t/zceNBD0
空回り間凄いし空気読めよとは思うけど、
いちおうMTF用ユーティリティらしいし、スレチかっていうと微妙な気が
427 ◆Meriken//XXX :2013/10/15(火) 04:44:14.88 ID:rwfcxvozP
この手の話もほどほどなら一向に構わないんですけど、
延々とひっぱられるのはちょっと…
428 ◆ISONOIIISI :2013/10/15(火) 08:35:23.88 ID:bSVdQBIE0
了解しました。しばらくROMります。
429 ◆Meriken//XXX :2013/10/15(火) 11:16:41.21 ID:rwfcxvozP
そこまでする必要はないですけど、前にもこういうことがあったので、
気をつけていただけると助かります。
430 ◆Urotsuki/1Ca :2013/10/15(火) 12:15:22.76 ID:GSYOykRK0
ソフト開発できる人全員を尊敬します
431 ◆Meriken//XXX :2013/10/15(火) 16:18:36.95 ID:rwfcxvozP
水冷のパーツ、やっぱり結構高いですねえ。
取りあえずCPUだけで試してみようかな。
432混沌 ◆Chaos/geeeIV :2013/10/15(火) 20:16:08.52 ID:H7NXv38z0
関係ないけど、磯のいい石さんってアクアリウムが趣味?
433 ◆ISONOIIISI :2013/10/15(火) 20:41:17.41 ID:bSVdQBIE0
>>432
いや、意味が繋がる中で一番面白そうなものを挙げただけです。
他に「◆IENOHUKUYA」「◆MENMASENSI」などをストックしています。
434混沌 ◆Chaos/geeeIV :2013/10/15(火) 20:58:23.18 ID:H7NXv38z0
>>433
なるほど 了解ですw
435名無しさん@お腹いっぱい。:2013/10/16(水) 01:25:01.00 ID:MwIaTI110
メンマ戦士www
436 ◆shiexn/6.A :2013/10/16(水) 01:51:59.38 ID:0GaJqXDa0
やだーメンマ戦士のほうが面白いじゃないですかー
437 ◆Meriken//XXX :2013/10/16(水) 03:56:37.90 ID:3xAaW0NuP
メンマ先生はちょっと面白いですねw
438 ◆Meriken//XXX :2013/10/16(水) 04:16:44.70 ID:3xAaW0NuP
とうとう水冷用のパーツをポチってしまいました。
取りあえずCPU用だけですが、ラジエーターとポンプは
よさげなのを買ったのでうまくいったらグラボ用の水枕を
追加する予定です。当面の生活費がちと心配ですが、
まあなんとかなるでしょうw
439 ◆JouJaku.IYSv :2013/10/16(水) 07:48:44.17 ID:GEyEc77Y0
>>438
遂に逝かれましたか。GPGPUでフル回転させるには避けて通れない道なので頑張って下さい。
水冷は高価ですがパーツの流用が効きますので、後々無駄にはなりません。
12桁検索を回した時、水温が上がりすぎてリザーバーの内圧が上がり、リザーバーが裂けてしまいました。
安定するまではリザーバーの内圧を逃がす様にしておいた方が無難です。
リザーバーに圧力逃がし弁を付けるのが確実ですが、蓋を緩めておくだけでもとりあえずは十分だと思います。

宜しければどんなパーツを選んだのか教えて下さい。私は以下のパーツです。
ポンプ: Laing D5
リザーバ: Bitspower円筒タイプ
ラジエータ: EK CoolStream 120x4, Black Ice Xtreme III 120x3
CPU: Alphacool NexXxoS XPI Light
GPU: EK (TITAN & 7990)
440 ◆JouJaku.IYSv :2013/10/16(水) 08:00:12.53 ID:GEyEc77Y0
R9 290の温度が公開されていました。
ttp://videocardz.com/images/2013/10/R9-290X-baidu-1.png

コア温度が90℃を超えているとするとVRMは一体何度なのか・・・怖くて想像出来ません。
Fire Strikeでこの温度だと、空冷で12桁検索検索は絶望的ですね。
441 ◆MENMASENSI :2013/10/16(水) 08:22:54.84 ID:YPXYXvXx0
メンマ戦士がそこまでウケるとは……
>>440
き、きききき93度Σ(゚д゚`)・・・!?
それでなぜ壊れないんですかっ!?
442 ◆Urotsuki/1Ca :2013/10/16(水) 09:04:50.73 ID:Zi9R7pZ30
R9 290Xは温度の耐久性が上がったと考えていいのか?
いずれにせよ水冷パーツ出るまで待機
443やんやん ◆yanyan//jacp :2013/10/16(水) 11:42:46.11 ID:/DarGwcX0
Xeon W5590x2 Geforce GTX TITAN, Geforce GTX 690
でやってみました。電源がヤバイですw
【診断の種類】検索速度(1パターン)
【Meriken's Tripcode Finderのバージョン】1.1 Free Edition Alpha 7
【1SMあたりのブロック数(CUDA)】自動
【CPUの命令セット】x64 + SSE2/AVX
【CPU検索スレッドの数】自動
【検索プロセスの優先度】通常以下
【GUIフロントエンドの優先度】通常

【トリップの種類】12桁
【キーに使用する文字】すべて
【検索パターン】 10文字完全前方一致1個

【10分間の平均速度】 2243.59M tripcode/s
【GPU検索の平均速度】2133.68M tripcode/s
【CPU検索の平均速度】 109.91M tripcode/s
444混沌 ◆Chaos/geeeIV :2013/10/16(水) 11:52:06.41 ID:MtVC8RTS0
冷却関連・・
よくわかってないんだけども・・・

外付けラジエターだけ単体で買って、水冷のシステムに繋いでしまうってことなのだろうか

外部のラジエターにつなぐなら、車の廃品ラジエターとかではダメなのだろうか・・w
っていうか、筐体開いて扇風機が最強な気も・・w
445 ◆Meriken//XXX :2013/10/16(水) 11:55:55.92 ID:3xAaW0NuP
水冷用のパーツはこんなんです。とりあえずファンは9個注文しました。
これで7990もちゃんと冷えてくれるといいんですけどね〜
18個のファンはあまり想像したくありませんw

ポンプ: Alphacool VPP655 Variable Speed Pump - HF Top Edition - Acylic
リザーバ: EK-MultiOption RES X3 250
ラジエータ: Phobya G-Changer XTREME Nova 1080 120x9
CPU: EK Supremacy Universal CPU Liquid Cooling Block - Plexi
446 ◆Meriken//XXX :2013/10/16(水) 12:10:00.83 ID:3xAaW0NuP
>>443
なかなか頑張ってますねw
「1SMあたりのブロック数」を128か192に設定するともうちょっと速くなりますよ。
それにしてもこれだとかなり電源には厳しいでしょうねえ。
うちでも電源に結構無理をさせているのでちと心配です。
447 忍法帖【Lv=13,xxxPT】(2+0:8) ◆Meriken//XXX :2013/10/16(水) 12:18:00.35 ID:3xAaW0NuP
>>441
93度だったら7970でもギリギリ大丈夫です。
6990なら100度でも普通に動きますよ。
448 ◆JouJaku.IYSv :2013/10/16(水) 12:51:08.06 ID:GEyEc77Y0
>>444
市販の「冷却のシステム」に碌な物が無いので、「冷却のパーツ」を買ってきて自分で組み立てるしか無いのです。
ラジエータに車の物を流用するのは有りです。実際にやっている人も居ます。
ラジエータと冷却系のホースを繋げるフィッティングを自作できて、尚且つ巨大なラジエータを置く場所が確保できるならお勧めです。
私も一時期本気で解体屋から買ってこようかと悩みました。

MTFレベルでGPGPUをぶん回すと、幾ら裸扇風機でも冷却が間に合いません。
冷媒が気体と液体では熱伝達率が全然違いますから。

>>445
情報ありがとうございます。
Techpowerupのアレにかなり影響を受けていますね(笑)。大は小を兼ねますから、ラジに奮発するのは良いと思います。
EKのCPUブロックは今までダメだったけど新型は違うと聞きました。組み上がったら効果の程を聞かせて下さい。
449名無しさん@お腹いっぱい。:2013/10/16(水) 12:52:40.55 ID:cIwV6D5y0
まあGPUの配線だってリフローでやるのを考えれば
100度程度で壊れたら全滅ですしね
450名無しさん@お腹いっぱい。:2013/10/16(水) 13:06:12.83 ID:rZhKh3Qz0
気温はどんどん下がっているのに何て熱いスレだ!
451 ◆Meriken//XXX :2013/10/16(水) 13:15:56.37 ID:3xAaW0NuP
AVX2対応版の配布パッケージを準備中。
やっぱり10桁トリップのCPU検索で50M TPS近く出ると
テンションが上りますねw
はやく定格で動かしてみたいな〜
452 ◆Meriken//XXX :2013/10/16(水) 13:58:18.00 ID:3xAaW0NuP
>>448
もちろんですw 将来的にはぜひ6990の爆音ファンx2とも
おさらばしたいところです。
453 ◆Meriken//XXX :2013/10/16(水) 14:45:44.04 ID:3xAaW0NuP
新しい開発版をうpしました。

Meriken's Tripcode Finder 1.1 Free Edition Alpha 8
http://www.meriken2ch.com/programming/merikens-tripcode-finder

Alpha 7からの主な変更点は以下の通りです。

・AVX2対応によるCPU検索の大幅な高速化。

前のバージョンとの速度の比較を報告していただけると助かります。
454 ◆JouJaku.IYSv :2013/10/16(水) 16:15:56.65 ID:GEyEc77Y0
試してみました。

【診断の種類】検索速度(1パターン)
【Meriken's Tripcode Finderのバージョン】1.1 Free Edition Alpha 8
【OS】Windows 7 Ultimate SP1 64bit
【検索デバイス】CPUのみ
【CPU】Core i7 4770K
【CPU検索スレッドの数】8
【検索プロセスの優先度】通常以下
【GUIフロントエンドの優先度】通常
【キーに使用する文字】半角と全角
【検索パターン】 10文字完全前方一致1個
【その他】水冷

【トリップの種類】10桁
【CPUの命令セット】x64 + SSE2/AVX → x64 + SSE2/AVX/AVX2
【10分間のCPU検索の平均速度】 24.97M → 47.87M tripcode/s
【CPUの温度】45〜51℃ → 46〜54℃

【トリップの種類】12桁
【CPUの命令セット】x64 + SSE2/AVX → x64 + SSE2/AVX/AVX2
【10分間のCPU検索の平均速度】 122.06M → 224.74M tripcode/s
【CPUの温度】43〜50℃ → 45〜53℃

8〜9割増しですね。ここまで速くなると、十分CPUも戦力になります。
AVX2の発熱が大きいですが、水冷だと問題ありません。
455 ◆YSRKEN.ceVZZ :2013/10/16(水) 16:16:34.86 ID:YPXYXvXx0
>>450
GTPS級の猛者になると暖房要らずだそうで……
456混沌 ◆Chaos/geeeIV :2013/10/16(水) 17:05:17.75 ID:MtVC8RTS0
冬に暖房がいらない熱源がある部屋の夏・・・ 恐ろしいw
457 ◆Urotsuki/1Ca :2013/10/16(水) 17:07:52.22 ID:Zi9R7pZ30
そんなPC組んでみたい…
458shirawa@mmo ◆BOINC/MMOEXx :2013/10/16(水) 17:13:44.68 ID:YjxeQOxX0
欲しかったトリップを見つけていただきました
ありがとうございます

さっそくですが試してみましたので貼り

【診断の種類】検索速度(1パターン)
【Meriken's Tripcode Finderのバージョン】1.1 Free Edition Alpha 7 → Alpha 8

【検索デバイス】GPUとCPU
【使用するCPU】Intel Core i7-3770 CPU @ 3.40GHz
【使用するGPU】NVIDIA GeForce GTX 660 (CUDA)

【1SMあたりのブロック数(CUDA)】自動
【CPUの命令セット】x64 + SSE2/AVX
【CPU検索スレッドの数】自動
【検索プロセスの優先度】通常以下
【GUIフロントエンドの優先度】通常

【トリップの種類】12桁
【キーに使用する文字】すべて
【検索パターン】 10文字完全前方一致1個

【10分間の平均速度】 616.58M tripcode/s → 633.56M tripcode/s
【GPU検索の平均速度】 515.53M tripcode/s → 534.46M tripcode/s
【CPU検索の平均速度】 101.06M tripcode/s → 99.10M tripcode/s
459shirawa@mmo ◆BOINC/MMOEXx :2013/10/16(水) 17:18:07.44 ID:YjxeQOxX0
しばらく再起動かけてないからかちょっと不安定だったかもしれません
参考までに前回測ったAlpha7の数値>>98
460shirawa@mmo ◆BOINC/MMOEXx :2013/10/16(水) 17:19:14.24 ID:YjxeQOxX0
ごめんなさい>>98はAlpha5でした
でもあまり速度は変わってない気がします
461 ◆JouJaku.IYSv :2013/10/16(水) 17:20:15.56 ID:GEyEc77Y0
12桁検索をフルパワーで実行すると、消費電力が1200W前後。電源容量が1200W・・・。
やばいです。
部屋の窓を全開にしても、風が無いと室温があっという間に30℃を超えます。

電気代は見なかったことに。
462名無しさん@お腹いっぱい。:2013/10/16(水) 17:22:37.45 ID:YEO/3xk60
1.1FEα8+AVX2圧倒的大勝利!!!!!
463 ◆YSRKEN.ceVZZ :2013/10/16(水) 17:44:36.54 ID:YPXYXvXx0
私もテストしてみました。Ivy世代なのに性能が微妙に上がっているのはなんでだろう……

【診断の種類】検索速度(1パターン)
【Meriken's Tripcode Finderのバージョン】1.1 Free Edition Alpha 7 → Alpha 8

【検索デバイス】GPUとCPU
【使用するCPU】Intel Core i7-3770 CPU @ 3.40GHz
【使用するGPU】NVIDIA GeForce GTX 660 (CUDA)

【1SMあたりのブロック数(CUDA)】256
【CPUの命令セット】x64 + SSE2/AVX → x64 + SSE2/AVX2
【CPU検索スレッドの数】4
【検索プロセスの優先度】アイドル
【GUIフロントエンドの優先度】通常

【トリップの種類】12桁
【キーに使用する文字】半角と全角
【検索パターン】 10文字完全前方一致1個

【 5分間の平均速度】 106.68M tripcode/s → 109.24M tripcode/s
【GPU検索の平均速度】 74.75M tripcode/s → 74.10M tripcode/s
【CPU検索の平均速度】 31.93M tripcode/s → 35.14M tripcode/s
464名無しさん@お腹いっぱい。:2013/10/16(水) 19:08:00.47 ID:6rTdZcgA0
i7 980X 4GHz + HD7970 1GHz
ようやく涼しくなってきて、サファリテールのファン50〜55%固定で
80度超えなくなってきた。
90度って怖いスクショも出てたけれど、>>443をHD7970 1枚でぶち抜ける事を考えると、
R9 290X全開で回したら、どうなっちゃうんでしょ・・・w

【診断の種類】検索速度(1パターン)
【Meriken's Tripcode Finderのバージョン】1.1 Free Edition Alpha 8

【1CUあたりのワークアイテムの数(OpenCL)】自動
【1WGあたりのワークアイテムの数(OpenCL)】自動
【1GPUあたりの検索プロセスの数(OpenCL)】1
【1検索プロセスあたりの検索スレッドの数(OpenCL)】2
【CPUの命令セット】x64 + SSE2/AVX/AVX2
【CPU検索スレッドの数】自動
【検索プロセスの優先度】通常以下
【GUIフロントエンドの優先度】通常

【トリップの種類】12桁
【キーに使用する文字】すべて
【検索パターン】 10文字完全前方一致1個

【10分間の平均速度】 2805.95M tripcode/s
【GPU検索の平均速度】2664.54M tripcode/s
【CPU検索の平均速度】 141.41M tripcode/s
465名無しさん@お腹いっぱい。:2013/10/16(水) 20:27:54.37 ID:J93qBCTi0
めりけんさんに素朴な質問です
MTFのXP対応はいつまでと考えていますか?

余ったパーツで1台組んで、使わなくなってたXPで
MTFを回そうと考えたのですがXPサポート切れるのが
来年の4月上旬というのを思い出して、漠然とどうするのかなー
と思いまして

心構え的なものとして一応知っておきたい気分になりました
466 ◆Meriken//XXX :2013/10/16(水) 20:59:28.16 ID:3xAaW0NuP
>>454
>>461
順当に速度が上がってますね。検索君1号の電源容量も完全に足りなくなったので、
とうとう電源を追加しました。マザボとその他(PCIeを含む)で分けましたが、
今のところうまく動いているようです。
467 ◆Meriken//XXX :2013/10/16(水) 21:03:44.97 ID:3xAaW0NuP
>>458
なかなかきれいなトリップでよかったですねえ。
3770は残念ながらAVX2には対応していません。
CPU検索が微妙に遅くなっているのは
GPU検索の効率が上がったためだと思われます。
468 ◆Meriken//XXX :2013/10/16(水) 21:05:24.45 ID:3xAaW0NuP
>>463
12桁もいじったかもしれませんが、よく覚えていませんw
469 ◆Meriken//XXX :2013/10/16(水) 21:07:56.18 ID:3xAaW0NuP
>>464
確か性能は40%増しだったはずです。
290Xの4枚差しとかぜひやってみたいですw
470 ◆Meriken//XXX :2013/10/16(水) 21:11:29.55 ID:3xAaW0NuP
>>465
どうなんでしょう。当分の間開発環境を変えるつもりはないので、
今のところ使えなくなる理由は見当たりません。
471 ◆YSRKEN.ceVZZ :2013/10/16(水) 21:23:56.18 ID:YPXYXvXx0
ところで今、短めの検索ワードをちょくちょく流しているのですが、
トリップキーを「まとめて」受け取れないものでしょうか。

複数のトリップを取得するのに、いちいち一つづつページを開いてボタンを押すのは大変です。
だったらとタブブラウザで開きまくったら、ボタンを押した時に
「不正なリクエストです。サポートに連絡してください。」と表示されたり、
いつの間にかログアウトされたりしてしまいます。
472 ◆Meriken//XXX :2013/10/16(水) 21:38:51.29 ID:3xAaW0NuP
>>471
ゆぐちゃんの話はなるべくこちらのスレでお願いします。

【分散トリップ検索】Meriken's Tripcode Yggdrasil
http://toro.2ch.net/test/read.cgi/esite/1379214816/
473 ◆Meriken//XXX :2013/10/16(水) 21:42:17.43 ID:3xAaW0NuP
>>471
トリップの一覧で受け取りたいトリップを選択して
「受取」ボタンを押せばまとめて受け取れますがな。
474 ◆YSRKEN.ceVZZ :2013/10/16(水) 21:56:17.27 ID:YPXYXvXx0
>>472
あ、そうでした。ごめんなさい。
>>473
乙です。
475 ◆Meriken//XXX :2013/10/16(水) 21:59:50.39 ID:3xAaW0NuP
いや、まとめて受け取る機能は最初からついてますが…
476 ◆Meriken//XXX :2013/10/16(水) 22:05:59.31 ID:3xAaW0NuP
まあでもよく考えたらゆぐちゃんにはマニュアルすらなかったですねw
MTFを含め、いろいろドキュメントを整備したいところです。
477 ◆YSRKEN.ceVZZ :2013/10/16(水) 22:06:16.67 ID:YPXYXvXx0
いえ、「教えて下さりありがとうございました」の意味で言いました。
478 ◆Meriken//XXX :2013/10/16(水) 22:17:13.46 ID:3xAaW0NuP
>>477
了解しました〜
479 ◆Meriken//XXX :2013/10/16(水) 22:18:26.31 ID:3xAaW0NuP
検索君1号に電源を追加したら、消費電力が数十W下がりました。
やっぱり容量ギリギリで運用していると効率が悪いみたいです。
これで安心して水冷化して思う存分ファンを追加できますw
480名無しさん@お腹いっぱい。:2013/10/16(水) 23:36:42.85 ID:wYPjGTBP0
>>449
部品が焼けなくても温度が上がると熱雑音が増えますから、
クリティカルな部分で信号が乱れたら止まるしかないかとー
>>461
ダクト的なものつけて廃熱を直接外に捨てないと!
481 ◆MOYASHI/Go :2013/10/16(水) 23:46:35.62 ID:vX72EKEb0
>>453
お疲れ様です。
診断&通常使用に比較的近い条件での速度を見てみました。

【Meriken's Tripcode Finderのバージョン】1.1 Free Edition Alpha 7 → Alpha 8
【OS】Win7 Pro 64bit SP1
【CPU】Core i5 3570
【CPUの命令セット】x64 + SSE2/AVX/AVX2
【CPU検索スレッドの数】4
【CPU温度】72℃位

・診断
【キーに使用する文字】半角と全角
【検索パターン】 10文字完全前方一致1個

【トリップの種類】10桁
【10分間のCPU検索の平均速度】 21.39M tripcode/s → 21.06M tripcode/s
【トリップの種類】12桁
【10分間のCPU検索の平均速度】 104.52M tripcode/s → 104.10M tripcode/s

・通常の使用に比較的近い検索条件の方(普段は、もっと検索パターン数多いです)
検索パターン、先頭一致6完一つと特殊の純8連。

【トリップの種類】10桁
【10分間のCPU検索の平均速度】 19.71M tripcode/s → 19.34M tripcode/s
【トリップの種類】12桁
【10分間のCPU検索の平均速度】 91.56M tripcode/s → 90.91M tripcode/s

うちのIvy環境では、やはり僅かに速度低下しています。しかしIvyで速度アップの報告も有るのかw
それにしても、HaswellのAVX2の効果凄まじいですね。報告を見たスレ住人の何人位が触手を
うねらせている事やらw
Yggdrasilの方にもかなり好影響が有りそうだ。
482 ◆Meriken//XXX :2013/10/17(木) 06:31:39.49 ID:S7HlxkcJP
>>481
あっちを立てればこっちが立たずでなかなか難しいですねえ。
AVX2はそのままにして、AVX版だけもとに戻そうかなあ。
483 ◆Meriken//XXX :2013/10/17(木) 08:15:06.38 ID:S7HlxkcJP
>>481
AVX2はかなりおいしいことが分かってたんですけど、実際に今までCPUでは
ありえなかった速度が出ると結構嬉しいですねw
あと、10桁トリップ検索では◆znjnB.IJwZLUさんの助けが実に大きかったです。
次のバージョンのREADMEでその功績が讃えられることでしょうw
484 ◆Meriken//XXX :2013/10/17(木) 10:01:15.91 ID:S7HlxkcJP
う〜ん、検索君1号に電源を追加してしばらく動かしてみたけど、
やっぱり安定しませんねえ。別の電源で稼働させるのはポンプとファンだけに
しておきます。
485 ◆JouJaku.IYSv :2013/10/17(木) 20:13:43.93 ID:4BU70Qij0
R9 290Xのベンチ結果が出ています。
ttp://northwood.blog60.fc2.com/blog-entry-7149.html

グラフィック性能はどーでも良いのですが、280Xと比べて消費電力と温度がかなり高いです。
これを4枚差しは、かなりきつそう。

GTX 780は値下げされるだろうから、メリケンさん買いませんか? (ボソッ)
486 ◆YSRKEN.ceVZZ :2013/10/17(木) 20:20:28.79 ID:wHIkWLNH0
さすがAMD、某220Wに続いて爆熱伝説を残そうとしているのか……!?
487 ◆MOYASHI/Go :2013/10/17(木) 20:22:27.08 ID:s3xnhPKk0
>>482
現在(MTF 1.1 FE Alpha8)のルーチンとは別に、Alpha7のルーチンも内部に持つという事でしょうか?
もしそうだとすると、今後のコード修正や動作テスト等のMerikenさんの手間が増え過ぎてしまって、
得策では無い様な気がします(ソフト開発の事をよく知らないので、的外れだったらすいません)

>>483
スレ内にコード最適化等の話をできる人が数人?居るのが凄いw
MTFユーザーとしても有り難いです。
488 ◆MOYASHI/Go :2013/10/17(木) 20:26:04.72 ID:s3xnhPKk0
>>485
Merikenさんの部屋が、ますます暑くなるな…
489 ◆Meriken//XXX :2013/10/18(金) 01:22:37.82 ID:VkBbKYxnP
検索君1号が不安定になっていた理由は電源ではなくて熱でヘタれた6990でした。
不安定なコアだけ電圧を戻したらちゃんと動くようになりました。
もう一回電源を2個にして稼働させてますが、今のところ問題はでていません。
電源を2個にできるとかなりおいしいので、このまま安定して動作してほしいものです。
490 ◆Meriken//XXX :2013/10/18(金) 01:56:59.26 ID:VkBbKYxnP
>>485
こりゃ冷やすの大変ですねw 電源も工夫しないと4枚は無理ですねえ。

> GTX 780は値下げされるだろうから、メリケンさん買いませんか? (ボソッ)

その発想はなかったw グラボの水枕を買ってお金が余ったら考えます。
491 ◆Meriken//XXX :2013/10/18(金) 02:04:03.97 ID:VkBbKYxnP
>>487
AVX用のルーチンは元に戻しておきました。他の部分が最適化されているので
微妙に速くなっているはずです。もともとAVXとAVX2は別扱いなので手間が
増えるわけではないです。
492 ◆MOYASHI/Go :2013/10/18(金) 08:34:05.37 ID:vuGx3GRb0
>>491
手間が増えてしまうわけでは無いんですか。
ちょっと気になっていたので安心しました。
493 ◆JouJaku.IYSv :2013/10/18(金) 18:38:06.32 ID:msjyTM+T0
AMDがAVX2をサポートするそうです。
ttp://northwood.blog60.fc2.com/blog-entry-7150.html

鬼が笑うというやつですね。それよりもStreamrollerコアのFXをはよう。
494名無しさん@お腹いっぱい。:2013/10/18(金) 19:04:26.84 ID:bXvj6bH30
ゲーム用に組んだはいいが全然使ってないPCで起動してますが上位の方には適いませんね
あまり起動しませんがよろしくです。
495名無しさん@お腹いっぱい。:2013/10/18(金) 19:30:00.93 ID:xALfO4El0
GTPS超えの方々は電気代の怒涛のボディーブロー攻撃を堪え忍んで長時間稼働がんばって下さい
496SilentPC ◆SilentPCIePC :2013/10/18(金) 19:46:15.77 ID:q+cMDhL90
>>493
temashコアのA6-1450ちゃんなら10桁検索で頑張ってくれてます。
手ごろなモバイルノートをと思って買ったAcerのノートPCですがお買い得でした。

>>495
酒も煙草も博打もしない健やかな体にはこの程度の攻撃、効かぬわ〜!!
497混沌 ◆Chaos/geeeIV :2013/10/18(金) 23:55:29.69 ID:9DWYe/UN0
なんか・・・・w

【笑い者】Windowsのパスワードは、たった6分で突破が可能と判明
http://kohada.2ch.net/test/read.cgi/pcnews/1355233376/
498混沌 ◆Chaos/geeeIV :2013/10/19(土) 01:21:16.54 ID:dUKgemVU0
http://gigazine.net/news/20121211-gpu-brute-force-attack/

>このシステムは5つのサーバーで構成されており、25個のAMD Radeonのグラフィックカードを搭載。
>LinuxベースのOpenCLクラスタ・プラットフォームを使用し、複数のグラフィックカードが
>あたかも単一のコンピューター上で動作しているようにふるまうことが可能です。


英文の元記事はこっちか
http://arstechnica.com/security/2012/12/25-gpu-cluster-cracks-every-standard-windows-password-in-6-hours/


なんかグラボが8枚乗っているようにみえるし
記事でも単一システムにグラボ8枚までって書いてあるみたいだけど
5サーバーで25GPUってどういうことだろ

http://cdn.arstechnica.net/wp-content/uploads/2012/12/radeon_city.jpg
見てどのGPUかわかる?
499名無しさん@お腹いっぱい。:2013/10/19(土) 01:36:59.90 ID:JmTTCMIm0
>>498
耐障害性のため、3枚は予備になってるとか?
500名無しさん@お腹いっぱい。:2013/10/19(土) 04:18:54.45 ID:at7RB7UR0
写真に写ってる4台のサーバー見ると
GPU3枚のサーバーが3台とGPU8枚のサーバーが1台見えてるから
3+3+3+8+8の5台構成なんじゃない?
501 ◆Meriken//XXX :2013/10/19(土) 04:31:37.48 ID:S0ywv3u4P
>>492
なんせアセンブラで書かれたトリップ生成のルーチンが
16個ありますからねえw まあでももう慣れちゃったので大丈夫です。
AVX2の次のAVX-512が出てもすぐに対応できるようにしておきました。
しかし何年後になることやらw
502 ◆Meriken//XXX :2013/10/19(土) 04:34:52.11 ID:S0ywv3u4P
>>498
これHashcatで記録を出したやつでしょう。夢のようなシステムですw
503 ◆Meriken//XXX :2013/10/19(土) 04:40:42.40 ID:S0ywv3u4P
>>494
どもども、よろしくお願いしま〜す。
504 ◆Meriken//XXX :2013/10/19(土) 04:44:39.09 ID:S0ywv3u4P
>>493
AMDも頑張りますねえ。AM3+のCrosshair V Formula-Zがあるので
いつでもばっちこいですw
505名無しさん@お腹いっぱい。:2013/10/19(土) 05:14:18.57 ID:J1CDksNJ0
アッー!!!
506 ◆Meriken//XXX :2013/10/19(土) 10:05:15.77 ID:S0ywv3u4P
どうも新しいマザーボードはビデオカードを同じ種類ので揃えないと
起動時に安定しないみたいだし、このままだとやっぱり消費電力が心配なので、
思い切って余っているビデオカードを全部売って、そのお金で新しく7990を
もう1枚買うことにしました。これで水冷化も多少楽になるはずです。
507SilentPC ◆SilentPCIePC :2013/10/19(土) 10:38:43.42 ID:2BZDEnV50
おお、思い切ったことだけど私もそれで正解な気がする。
何かそのうち>>498を本当に作ってしまいそうでな道ではあるけどw
508 ◆JouJaku.IYSv :2013/10/19(土) 11:53:01.26 ID:XtcOXMfM0
>>506
ebayを見ると、7990は$600前半まで落ちていますね。
水枕代等考えると、それで正解だと思います。
もうプログラムに必要なデータ取は終わったでしょうし。
509名無しさん@お腹いっぱい。:2013/10/19(土) 13:04:35.11 ID:LjDlAE1K0
これMTFに使えませんかね
http://akizukidenshi.com/catalog/g/gM-06926/
510 ◆Meriken//XXX :2013/10/19(土) 15:20:59.44 ID:S0ywv3u4P
>>507
>>508
ですよね〜 せっかく水冷にしてもシステムが不安定じゃ意味ないですしね。
消費電力が少ない10桁トリップ検索なら7990 3枚でも十分いけますよw
511 ◆znjnB.IJwZLU :2013/10/19(土) 15:59:22.82 ID:TXAGN85b0
>>509
使えることは使えますがメリットがあるかというと怪しいですね。
以前試算しましたが、このゲート規模だとSHA-1で50MTPSあたりがいいとこで、アクセラレータとしては微妙な数字です。
Radeon HD 7750あたりをつんだ方がよっぽどスピードが出て安くて汎用性があります。
唯一の取り柄としてはワットパフォーマンスですかね。
FPGAによるアクセラレートは電気代(電力容量)というランニングコストでは優秀ですが
如何せんイニシャルコスト(FPGAボードの値段)が高くなりがちで、トータルのライフサイクルコストで見るとGPGPUのほうがよかったり。

ただ、昨今では電力バジェットが演算上限を規定し始めているのでGPGPUの限界の先を目指すなら
避けては通れない道でしょう。

つーか私はFPGAをLinuxマシンにつなげるためにSTFを書き始めたんですが・・・
そろそろ本来の目的に進まないといけませんね
512 ◆Meriken//XXX :2013/10/19(土) 17:20:17.08 ID:S0ywv3u4P
>>511
BitcoinマイナーではSpartan 6-150が3個で7970相当の速度が出ていたみたいですね。
それで消費電力が30Wだからおいしすぎです。やっぱりGPGPUの次はFPGAかなあ。
私は当分の間はGCNのアセンブラに取り組む予定なので、STFが出来るのを楽しみに
しています。
513 ◆znjnB.IJwZLU :2013/10/19(土) 18:32:44.29 ID:TXAGN85b0
>>512
GCNのアセンブラは一時期検討しましたが、微妙によくわからんとこが多くて投げましたw

OpenCLでコンパイルしたGCNのバイナリは、LLVMを使ってるだけあって結構いいところまで最適化されています。
問題はメモリアクセスの部分で、GPGPUの場合どうしてもプロセッサあたりのメモリ帯域が狭くなるので、
変数をいかにベクタレジスタに割り付けるかが勝負どころだと思っています。

CPUに慣れた身としては演算器ごとに16kBのL1Dキャッシュが欲しくなってきます。
そういう向きにはXeon Phiの方が向いているんでしょうが如何せんお高いので。
514 ◆QZschizo.ptH :2013/10/19(土) 18:37:40.82 ID:QwWx8abN0
富豪達が語らうのを傍目に,今日も電気代のボディーブローをひしひしと感じつつ,ユグちゃんを起動するのであった……
祝ゴールド勲章!
515名無しさん@お腹いっぱい。:2013/10/19(土) 18:49:58.17 ID:+Ezb7ViW0
作業の負担にならない程度だと1600Mが精一杯かー
AMD軍団には適いません
516 ◆Urotsuki/1Ca :2013/10/19(土) 18:52:26.96 ID:qJV7XbTH0
久々の参戦
290Xは買うべきか悩む…
517名無しさん@お腹いっぱい。:2013/10/19(土) 19:17:53.39 ID:2v9/lfAL0
検索速度上位の皆さんがんばれ!
518SilentPC ◆SilentPCIePC :2013/10/19(土) 19:26:35.88 ID:eMunP5SQ0
>>514
おめ!
でも2〜5位は団子状態で油断できないですね。
私も頑張ってそのうち参戦します!

>>516
あれ?スコア的にCFX効いてないような?
519 ◆YSRKEN.ceVZZ :2013/10/19(土) 19:32:30.61 ID:UBETnc9P0
>>517
感謝しきれません。私も今更検索時間を伸ばしてみているのですが、
14日経過でまだレベル6……道のりはまだ遠いようです
520 ◆Urotsuki/1Ca :2013/10/19(土) 19:33:20.31 ID:qJV7XbTH0
>>518
…CFXケーブルつけ忘れてました ハイ
521SilentPC ◆SilentPCIePC :2013/10/19(土) 20:20:53.44 ID:eMunP5SQ0
>>519
自分のペースで無理のない程度にまったり行けばいいんですよ。
コツコツ参加していけば登録できるトリップも増えますから、それで運よく良いトリップが見つかれば後々実装予定の
オークションで一攫千金も狙えます。
私もつい先ほど、◆CrossFireA/Xや◆SilentCFXer0のような面白いトリップを見つけて頂きました。
かっこいい英/ドイツ語等や印象深い固有名詞を登録していけば自力でトリップを発見せずとも、ほかの人が羨ましがる
トリップを手に入れることは出来ると思いますので、頑張っていきましょう♪

>>520
機器の故障とかじゃなくて幸いでした。
522 ◆YSRKEN.ceVZZ :2013/10/19(土) 20:29:14.00 ID:UBETnc9P0
>>521
検索に参加するメンバーには一体何がウケるんですかね……?
まあネタは一応ある(現在Jargonを検索リストにして洗っているところ)のですが
523SilentPC ◆SilentPCIePC :2013/10/19(土) 21:17:30.75 ID:eMunP5SQ0
>>522
10桁12桁にどんな意味を込めるかその人のセンスが問われるところだから、オークション実装まではお楽しみですね。
個人的には英語力が無いから、花言葉や諺を上手くまとめてくれたものとか憧れますね。
LoveIsBlind.(恋は盲目)とか?
524 ◆Meriken//XXX :2013/10/20(日) 02:01:53.63 ID:7jG0RSPBP
>>513
> 変数をいかにベクタレジスタに割り付けるかが勝負どころだと思っています。

これはその通りだと思います。特にBitslice DESはregister pressureが
大きいので、手作業でレジスタ割り付けを工夫すればかなりoccupancyを引き上げることが
出来るはずです。今のレジスタの数から見て数割の高速化は堅いでしょう。

> LLVMを使ってるだけあって結構いいところまで最適化されています。

でもAMDのドライバって結構酷いバグが残ってるんですよね〜
バグでローカル変数が吹っ飛んでたのには本当に参りました。
カーネルのビルド時のオプションで最適化は切っておいたほうが良いなんて話もありました。
今のOpenCLの実装はバグを避けるために妥協しているところもあるので何とかしたいですね。

> そういう向きにはXeon Phiの方が向いているんでしょうが如何せんお高いので。

Xeon PhiのAVX-512はぜひ試してみたいですねえ。そのためにはもっと稼がないと…
525 ◆Meriken//XXX :2013/10/20(日) 02:04:28.37 ID:7jG0RSPBP
>>514
とうとう来ましたね。おめでとうございます!
結構ランキングも接戦になってきましたね〜
526 ◆Meriken//XXX :2013/10/20(日) 12:46:36.92 ID:7jG0RSPBP
>>516
お、戻ってきましたね。
290Xは私も欲しくてしかたがないんですけど我慢してますw
527混沌 ◆Chaos/geeeIV :2013/10/21(月) 01:10:12.93 ID:brVjjjib0
全然関係ないことなのですが、スレタイの Tripcode を見るとどうしても
往年の無料ホームページサービスだった Tripod に見えて仕方ありませんw
528 ◆YSRKEN.ceVZZ :2013/10/21(月) 01:13:16.04 ID:TKf3fYcC0
>>527
「Tripper」表記を避けた結果似てしまうという偶然……!

ところで、スレタイが「MERIKEN's」のままなのは検索を考慮してですか?
529 ◆Meriken//XXX :2013/10/21(月) 03:09:48.20 ID:VpXq/IMgP
昨日は気分転換にLISPの方言のClojureで遊んでました。
Java VMで動作するんですけど、なかなか面白いです。
これでMTFのGUIを書き直したら別のプラットフォームにも
移植できるだろうけど、どうかなあ。
530 ◆Meriken//XXX :2013/10/21(月) 03:11:24.81 ID:VpXq/IMgP
>>528
まあそんなところです。次スレでは「Meriken's」にしておきます。
531名無しさん@お腹いっぱい。:2013/10/22(火) 09:16:21.55 ID:KH3Sk6w70
CPUだけだとレベル10が果てしなく遠い
GPU積むべきか…?!!!!
532混沌 ◆Chaos/geeeIV :2013/10/22(火) 12:45:01.87 ID:kzpR1Ayd0
>>531
レベルだけが目的ならGTX660だと常時稼動でも12桁経験値レベルが時間レベルを超えるのは難しいレベルです
経験値レベルが時間レベルを超えたいならそれ以上のGPUを使うか複数マシン起動をw

あとユグの話はなるべくユグスレにしましょう レスもしにくいのでw
http://toro.2ch.net/test/read.cgi/esite/1379214816/
533名無しさん@お腹いっぱい。:2013/10/22(火) 14:49:51.23 ID:UZsL91/n0
AMD,CPUとGPUの深い連携を可能にする新要素「hQ」発表。HSAの姿が見えてきた?
http://www.4gamer.net/games/147/G014731/20131021024/

次世代のAPUは面白くなってきそうだな
534名無しさん@お腹いっぱい。:2013/10/22(火) 15:55:13.08 ID:A5tD65KK0
恐ろしい

Bitcoinマイニングはまさに軍拡競争、素人お断りの現状とは?
http://gigazine.net/news/20131021-bitcoin-mining-as-arms-race/
535 ◆YSRKEN.ceVZZ :2013/10/22(火) 16:49:50.90 ID:2LXpRCBC0
>>534
ん、Bitcoinってバブル弾けたんじゃありませんでしたっけ?
はたしてそこまでハードウェアをつぎ込むほど儲かるのかどうかよく分かりませんな……
536 ◆shiexn/6.A :2013/10/22(火) 22:08:05.59 ID:EkYuG4190
>>534
なんかものすごいミステリアスで面白そうに見えてくる
537名無しさん@お腹いっぱい。:2013/10/23(水) 04:50:50.03 ID:w+eTPUq2P
ttp://www.youtube.com/watch?v=Smc7ZvnVFzk

Mac Pro
浮動小数点で7TFLOPSならトリップ検索でどれくらい出るのかな

放熱はすごくよさそうに見えるんだけど
538名無しさん@お腹いっぱい。:2013/10/23(水) 05:01:14.69 ID:w+eTPUq2P
新生検索君1号は12TFLOPSだったか・・・
539 ◆JouJaku.IYSv :2013/10/23(水) 06:09:06.97 ID:sR6mL6Hx0
>>442
まだ290Xが発表されていないのに、既に水枕が開発されました。
相変わらずEKの仕事早いな。
http://www.ekwb.com/news/407/19/EK-FC-R9-290X-for-AMD-Radeon-R9-290X-makes-it-s-debut/
540 ◆Meriken//XXX :2013/10/23(水) 09:19:08.09 ID:yzJDaOq2P
どうもAlpha 8にはバグが残っているようです。
こちらでも確認しました。表示された検索速度は落ちていないのに
GPUのうちのひとつが使用率0%になってしまいます。
Radeonのグラボで起きるみたいです。
このバグに遭遇された方は是非詳しい報告をお願いします。

> 135 :名無しさん@お腹いっぱい。 :sage :2013/10/22(火) 22:09:40.38
> α8にしてからたまに検索が止まってるような気がする
> クライアントは動き続けてるんだけどその間の検索がされてないような
【分散トリップ検索】Meriken's Tripcode Yggdrasil
http://toro.2ch.net/test/read.cgi/esite/1379214816/135
541 ◆Meriken//XXX :2013/10/23(水) 09:27:45.94 ID:yzJDaOq2P
>>539
やっぱり水冷化が必須ということなんですかねえ。
だれか290XでMTFを動かす勇者はいないものだろうか。
542 ◆Meriken//XXX :2013/10/23(水) 09:39:00.39 ID:yzJDaOq2P
CPUを水冷化するための部品が届きました。
巨大なラジエーターのせいかめちゃでかい箱ですw
今ちょっと忙しいので少しづつ組み立てることにします。
543 ◆Meriken//XXX :2013/10/23(水) 09:40:33.01 ID:yzJDaOq2P
>>540
どうも私の見つけたバグは報告されたものとは違うようですorz
詳しく調べないと…
544 ◆Meriken//XXX :2013/10/23(水) 09:42:04.29 ID:yzJDaOq2P
アプリじゃなくてドライバやハードウェアの可能性もあるので
切り分けがかなり面倒ですねえ。まぎらわしすぎですw
545名無しさん@お腹いっぱい。:2013/10/23(水) 10:10:45.35 ID:xM2hJxnE0
巨大なラジエーターってこれじゃないのか
http://shop.aquacomputer.de/product_info.php?products_id=2965
546 ◆Urotsuki/1Ca :2013/10/23(水) 17:00:46.59 ID:muAYXSlM0
>>539
もうできたのか…
資金がたまったらやってみたい

>>542
いよいよ水冷ですね 期待します
547 ◆Meriken//XXX :2013/10/24(木) 06:24:41.19 ID:UVVhvqF3P
CPUブロックをマザボに取り付ける前に仮組みしてループを稼働させてみたんですけど、
いきなりEKのポンプから水漏れして超ビビリましたw ポンプのねじを締め直したら
収まりましたが、これは相当慎重にやらないと駄目みたいですね…
548 ◆Meriken//XXX :2013/10/24(木) 11:48:31.29 ID:UVVhvqF3P
水冷化したCPUはちゃんと動いているようです。
定格のi7-4770での速度は次のとおりです。

10桁トリップ検索: 51.70M (CPUコアの温度: 43〜52℃)
12桁トリップ検索: 239.15 (同上: 41〜47℃)

静音ファンが9個ついてる割には温度が高い気がしますが、
なにせ水冷化は初めてなのでさっぱりわかりませんw
これでMaltaを2枚冷やせるといいんだけど、どうかな〜
549名無しさん@お腹いっぱい。:2013/10/24(木) 15:02:47.99 ID:rxmB5PJ10
Radeon R9 290シリーズ「Hawaii」のアーキテクチャを丸裸にする
http://www.4gamer.net/games/234/G023455/20131021060/
「Radeon R9 290X」レビュー。シェーダプロセッサ2816基を統合した“モンスター”の実力はいかに
http://www.4gamer.net/games/234/G023455/20131023061/
550名無しさん@お腹いっぱい。:2013/10/24(木) 15:59:18.40 ID:+cZQq1/Y0
暖房器具ですね。
551名無しさん@お腹いっぱい。:2013/10/24(木) 17:06:31.82 ID:q78fbLEv0
水冷というのはやはり同じ熱を空冷で冷やそうとするのに比べると電力がかさむもんなんでしょうか
552名無しさん@お腹いっぱい。:2013/10/24(木) 18:05:11.00 ID:z8FbpTSB0
>>551
同じ熱を、同じ廃熱先に、同じ廃熱装置で捨てる場合はポンプ分+αで嵩むだろうけど、
水冷にすることで廃熱装置を離して設置したり大型化したりできるから比較できないと思う。
大型のヒートシンクに繋げば冷却ファンを省エネにしたり排除できるし、
廃熱場所を屋外や屋外直結のダクトや水源まで延長して温度差を維持して効率上げたりもできる。
553 ◆Meriken//XXX :2013/10/24(木) 18:27:54.48 ID:UVVhvqF3P
R9 290Xが$579.99とは随分お買い得ですね。でも我慢我慢…

SAPPHIRE 100361BF4SR Radeon R9 290X 4GB GDDR5 PCI Express 3.0 BattleField 4 Game Edition Video Card $579.99
http://www.newegg.com/Product/Product.aspx?Item=N82E16814202058
554 ◆JouJaku.IYSv :2013/10/24(木) 18:55:19.06 ID:w5Muod0H0
>>549
Fire Strikeの90℃超えは、「良く訓練された90℃超え」だったみたいですね(笑)。

>>553
BF4のプレミア無しなら$549。780はこれより安くなるだろうから、両方IYHしませんか!
555SilentPC ◆SilentPCIePC :2013/10/24(木) 19:00:20.15 ID:JeGB1EFV0
R9 290XからCF用のケーブルが不要になったのは大きいですね。
今後はヒートシンクの自由度も少し上がりそうです。
いっそMacProみたいにケーブルの代わりにヒートシンクを繋げていく形にして、
VGA正面とPCIスロット背面に吸排気のファンを取り付けられるようにしてくれれば
空冷でもかなり冷却能力を稼げそうで面白そうなんですけどね。
ttp://www.apple.com/jp/mac-pro/
556 ◆Urotsuki/1Ca :2013/10/24(木) 19:03:32.35 ID:fhnNv0xF0
R9 290Xの性能は結構期待できるますね。
水冷化するとしてどれぐらいの冷却力が必要なのかが気になるなぁ…
現状の冷却系統を流用していいのかちと疑問。発熱量がよくわからない。
557 ◆JouJaku.IYSv :2013/10/24(木) 19:05:56.37 ID:w5Muod0H0
>>551
ここのスレで話している水冷は、空冷では間に合わないGPGPUの発熱への対処なので、比較はできません。

静音化のための水冷(簡易水冷キットとか)なら比較が成り立つでしょうが、興味無いので分かりません。
ポンプ分の電力が必要だから、水冷の方が消費電力が大きいんじゃ無いのでしょうか?
558 ◆JouJaku.IYSv :2013/10/24(木) 19:12:25.52 ID:w5Muod0H0
>>548
>>454に書いてある私の場合の温度と変わらないので、問題ないかと。
ラジエーターで冷媒を冷やすのであれば室温を下回ることは無いので、あとはCPUの発熱量と熱伝達で決まります。
ラジの容量は十分なはずなので、Malta二枚なら余裕かと。
ダメならファンを高回転させれば対処できると思います。

Haswellを殻割り液体金属にしたかどうか、教えて頂けませんか?
559名無しさん@お腹いっぱい。:2013/10/24(木) 23:27:33.98 ID:YTi2YTo40
「生成されたトリップの累計」がようやく「京」の桁まで行きました
次は「累計検索時間」に「年」が出るまでがんばろうと思います
560 ◆YSRKEN.ceVZZ :2013/10/24(木) 23:40:09.62 ID:B+5VN8P30
>>559
ユーザー名が気になります
常時1GTPSでも4ヶ月ほど動かさないと「京」の桁は出ないから、
例のランキングでは間違いなく上位ランカーなはずなのですが……
561名無しさん@お腹いっぱい。:2013/10/25(金) 03:46:07.87 ID:N2YbxzhD0
大勢で集団分散検索して総合的な検索スピードも早いし、
殆ど10文字ばっかり登録してるんだけど、流石に全然出ないね。
9文字でも、たまーに見つかる程度だし。
562混沌 ◆Chaos/geeeIV :2013/10/25(金) 03:57:40.40 ID:alQn2+Ah0
ユグの方は検索速度は当然高いわけだけど、前方完全一致の指定だから難しいですねー
ローカル指定は各自のマシンの速度しかでませんが正規表現を駆使したパターン指定を数多く登録することで
何かしら見つけるっていう意味ではユグより発見の敷居は相当下がりますね

10文字クラスになると特にねw
563 ◆YSRKEN.ceVZZ :2013/10/25(金) 08:09:48.08 ID:ifmC6IXG0
>>562
例えば、ユグのほうで
「^MIKISAYAKA」
「^MikiSayaka」
「^Mikisayaka」
「^mikisayaka」
と登録していて、ローカルの方に
「^[Mm][Ii][Kk][Ii][Ss][Aa][Yy][Aa][Kk][Aa]」
と登録していたとします。
前者を10GTPS(12桁)・500MTPS(10桁)で回すと、発見予定時間は
それぞれ7.7ヶ月・51年です。ですが、後者を同じぐらいの時間で
出すにはせいぜい39MTPS・970kTPSぐらいで十分なんですよね……。
これは極端な例ですが、展開後検索パターンが多ければ、
ローカルが遅くとも勝負になるということです。
564猫 ◆catpedias. :2013/10/25(金) 09:51:59.72 ID:WI/Yp3AM0
ユグでは12桁メイン、自分は10桁メインの運用が効率
565名無しさん@お腹いっぱい。:2013/10/25(金) 09:53:57.96 ID:1FJvpjemP
さやかちゃんさやさや
566混沌 ◆Chaos/geeeIV :2013/10/25(金) 13:58:32.65 ID:alQn2+Ah0
ここに来るようになって覚えた単語だけど
誕生日のパラドックスって奴ですね〜
567 ◆Meriken//XXX :2013/10/25(金) 18:05:20.06 ID:gpZK0Dy2P
昨日は指導教授との面談があって、博士論文の資料の作成でくたくたでした。
ここしばらくはトリップ検索で遊びまくってたけど、
本業のほうも忘れないようにしないとw
568 ◆Meriken//XXX :2013/10/25(金) 18:33:36.95 ID:gpZK0Dy2P
2枚目の7990が届いたので水枕が届くまで
空冷で10桁トリップ検索をさせることにしました。
ゆぐちゃんに接続して560Mほど出ているので上出来でしょう。

7990を水冷化したら空冷の7970をもう1枚足して
10桁トリップ検索の最高速の記録を狙う予定です。
mtyでの700M TPSがこれまでの最速の報告のはずなので、
問題はないはずです。
569SilentPC ◆SilentPCIePC :2013/10/25(金) 18:36:16.14 ID:8ggwa7th0
>>567-568
お疲れ様です。
新システムを組むのは色々ワクワク感がたまりませんね♪
570名無しさん@お腹いっぱい。:2013/10/25(金) 18:39:09.80 ID:GKClUqnA0
7970CFXですがPCI周辺温度が60℃を超えるので空冷の限界を感じつつ
M/Bの痛みが気になるこの頃
571名無しさん@お腹いっぱい。:2013/10/25(金) 19:03:02.12 ID:GKClUqnA0
因みにMerikenさん同様、PCI-E6ピンケーブルを燃やしてしまいました
セッティング中に電圧を上げすぎたのが敗因orz
572SilentPC ◆SilentPCIePC :2013/10/25(金) 19:11:07.44 ID:8ggwa7th0
>>570
諦めるな!!
空冷大好きな私としては、付属をファンは取り外して自分のお気に入りのファンを増設しまくればまだまだ行けないかな〜と思います。
サイズ KAZE-JYUNIスリムは厚さ12mmなので、Ainex FST-MAG-Bに取り付ける際に薄さを生かしてゴムワッシャとナットで角度を付ければPCIスロット背面に風を誘導できます。
更にVGA正面とPCIスロット背面にファンを取り付ければVGA正面からの風を効率的にPCIスロットから排気出来ます。
通常使うファンはNoctua NF-F12 PWMが二重反転ファンの仕組みをファンガードに取り入れているので静音性を保ちながら静圧を確保するにはお勧めです。
静音性を多少無視していいのなら、XINRUILIAN RDL1225S(12LN)とサイズ 隼120 PWM SY1225HB12SH-Pの組み合わせが既存のPC用ファンで可能な範囲の静音性を保った静圧を
最も強く発揮できる組み合わせだと思います。

通常のファンより高い静圧を得られる二重反転ファンの資料については以下のリンクを参考にどうぞ。
ttp://www.mitsubishifan.com/catarog2009/280.html
ttp://www.youtube.com/watch?v=BYTwrdpUHBs
573名無しさん@お腹いっぱい。:2013/10/25(金) 19:19:14.32 ID:GKClUqnA0
>>572
既にGPU正面にはRDL1238S-PWMを装備しております
これ以上となると予備のBW-1238B-PWMも御座いますがさすがにこれは・・・
574名無しさん@お腹いっぱい。:2013/10/25(金) 19:35:15.21 ID:yd2RpqWZ0
まぁ電流的には十分ありえるんだけどほんと最近のGPUは猛獣かなんかみたいでワロエナイw
575 ◆Urotsuki/1Ca :2013/10/25(金) 19:47:04.89 ID:IF8FcwWU0
HD7970をCFXして検索していると時々止まるなぁ…
水冷だから冷却には問題ないし電源も足りてる…うーむ
576名無しさん@お腹いっぱい。:2013/10/25(金) 19:51:49.76 ID:GKClUqnA0
>>575
GPUは1GHzでしたっけ
止まるのは電圧ちょい上げで防げます
発熱とのトレードオフですが
577 ◆YSRKEN.ceVZZ :2013/10/25(金) 20:44:55.02 ID:ifmC6IXG0
>>568
wktkしながら待ってます。ついでに12桁最高速も更新ですか?
578 ◆Urotsuki/1Ca :2013/10/25(金) 20:46:15.76 ID:IF8FcwWU0
>>568
期待してますー
10桁やってみるかなぁ…

>>576
電圧上げてみたら少し安定してきました
様子見してみます
579 ◆kwkkkkkkkk :2013/10/26(土) 00:29:18.08 ID:Fi861jVJ0
>>560
すみません
>>559は◆kwkkkkkkkkです

MTFで12桁の検索を始めたのはYggdrasilサービス開始前の5/10(10/24の167日前)で
平均約700MTPSで動かしてローカルでの稼働率98.75%ですので

700*10^6*60*60*24*167*0.9875≒10^16

ということで大体計算通りと思います

5ヶ月半くらいがんばれば12桁は自力で「京」まで行けそうな感じでしたので
「京」の桁を見るのを当面の目標にしてました
580 ◆YSRKEN.ceVZZ :2013/10/26(土) 00:37:52.80 ID:lAKN/5fI0
>>579
◆kwkkkkkkkkさんでしたか。
(「お知らせ」を見ながら)ユグではよくお世話になっております。
不幸なマシントラブルに見舞われないことを祈ります。
581名無しさん@お腹いっぱい。:2013/10/26(土) 00:52:18.61 ID:xBfqcGuK0
変なフラグ立てんじゃねーよ
582 ◆Urotsuki/1Ca :2013/10/26(土) 01:14:28.41 ID:UP7QH+5I0
フラグはへし折るものですよ
583名無しさん@お腹いっぱい。:2013/10/26(土) 05:34:26.57 ID:ZhpHKXHl0
Win8.1へアップデートしたところ検索速度がダウンしました
5500Mtrips/s→5000Mtrips/s
OSの制約によるものかRadeonのドライバが熟れていないのか・・・
584 ◆Meriken//XXX :2013/10/26(土) 06:43:46.37 ID:NaW2S5VRP
>>554
> BF4のプレミア無しなら$549。
> 780はこれより安くなるだろうから、両方IYHしませんか!

水枕を買ったら軍資金は完全に底をつきましたw
水冷化は効果は抜群ですけど、やっぱりお金がかかりますねえ。
780は気になっているので次にまとまったお金が手に入ったら買うことになると思います。
585 ◆Meriken//XXX :2013/10/26(土) 06:49:30.07 ID:NaW2S5VRP
>>558
なるほどなるほど。それでは安心して水枕の到着を待つことにします。
Haswellには特別なことはしていません。EKのCPUブロックについてきた
サーマルペーストをそのまま使っただけです。
586 ◆Meriken//XXX :2013/10/26(土) 06:53:38.49 ID:NaW2S5VRP
>>559
>>579
◆kwkkkkkkkkさん、頑張ってますからね〜
これからもぜひよろしくお願いします。
587 ◆Meriken//XXX :2013/10/26(土) 07:26:56.32 ID:NaW2S5VRP
>>570-573
なかなか苦労されてますねえ。
まあでも7970 CFXなら空冷でも問題ないはずです。
Maltaだと空冷で12桁トリップ検索は厳しいですが…
588 ◆Meriken//XXX :2013/10/26(土) 07:31:55.72 ID:NaW2S5VRP
>>569
水冷化は初めてなので結構おっかなびっくりですけどねw
まあでもCPUでの効果は期待通りだったので、
?GPUの水冷化が楽しみです。
589 ◆QZschizo.ptH :2013/10/26(土) 09:13:53.75 ID:DXNhQSHV0
>>582
名言ですね
590 ◆Meriken//XXX :2013/10/26(土) 09:17:35.95 ID:NaW2S5VRP
>>540>>543の問題は無事に解決できました。
が、今度は新生検索君1号で表示に使っているGPUの使用率が徐々に下がる
謎の現象が発生。どうせまたドライバの問題なので
今日うpされたCatalyst 13.11 BetaV6を試してみることにします。
591 ◆Meriken//XXX :2013/10/26(土) 10:16:24.16 ID:NaW2S5VRP
う〜ん、新しいドライバにしたら速度が40M TPSほど落ちちゃいました。
これは痛いですねえ。まあでもこれで安定してくれるならやむを得ないです。
早くGCNのアセンブラで書きなおしたいところですね。
592 ◆Meriken//XXX :2013/10/26(土) 10:23:07.98 ID:NaW2S5VRP
>>583
これもドライバの問題のような気がします。
なかなか頭がいたいですねえ。
593 ◆Urotsuki/1Ca :2013/10/26(土) 10:24:36.97 ID:UP7QH+5I0
相変わらずドライバの問題が出てますね…
AMDはさっさとこういう所どうにかして欲しいです
594名無しさん@お腹いっぱい。:2013/10/26(土) 13:14:43.84 ID:8fvKP9zt0
検索君来ましたね
595 ◆Meriken//XXX :2013/10/26(土) 15:37:22.86 ID:NaW2S5VRP
あれからいろいろ試してみて、Catalyst 13.9では速度が遅くなるものの安定して
動作することが確認できました。で、これまで使ってた13.5 beta2がASUSのマザボ用の
ユーティリティと相性が悪いことが判明。現在アンストールして様子見中です。
596 ◆Meriken//XXX :2013/10/27(日) 03:10:04.08 ID:GLIFvHUSP
>>577
7990x2+7970で12桁トリップ検索をさせると1200Wの電源だとギリギリですねえ。
10分だけなら大丈夫でしょうけど、24時間稼働はちときびしいです。
597 ◆Meriken//XXX :2013/10/27(日) 04:53:33.85 ID:GLIFvHUSP
MTFの内部構造で色々気になる部分が目につき始めたので、
次のバージョンで大幅に刷新することにしました。
検索デバイスを動的に変更したり、12桁トリップ検索でキーを
56文字にして速度を2割増にする機能をつけたりする予定です。

というわけでバージョン1.1での機能の追加はこのへんにして、
近いうちにBeta 1をうpします。
598やんやん ◆yanyan//jacp :2013/10/27(日) 05:08:51.43 ID:6pkfn6H10
期待
599 ◆Meriken//XXX :2013/10/27(日) 20:03:06.26 ID:GLIFvHUSP
新しい開発版をうpしました。

Meriken's Tripcode Finder 1.1 Free Edition Beta 1
(p)http://www.meriken2ch.com/programming/merikens-tripcode-finder

Alpha 7からの主な変更点は以下の通りです。

・10桁トリップのGPU検索が停止する不具合の修正。

10桁トリップのCPU検索も微妙に速くなっているはずです。
600やんやん ◆yanyan//jacp :2013/10/27(日) 21:30:32.09 ID:6pkfn6H10
乙です。TITANさんが時々落ちる不調です。無理させちゃったかなー
601 ◆YSRKEN.ceVZZ :2013/10/27(日) 21:34:08.72 ID:Y5ZrXy7x0
TITANは犠牲になったのだ……古くから続くトリップ検索の伝統……その犠牲にな……
602 ◆Meriken//XXX :2013/10/27(日) 22:08:43.32 ID:GLIFvHUSP
>>600
OCしていると結構グラボも普通にへたりますからねえ。
なかなか難しいところです。電圧をちょびっと盛るか、クロック周波数を
下げてやれば直るかもしれません。24時間稼働させるなら
ギリギリまでOCするのではなく心持ち余裕を持たせておくと良いようです。
603 ◆YSRKEN.ceVZZ :2013/10/27(日) 23:08:20.32 ID:Y5ZrXy7x0
:::::::::::.: .:. . ∧_∧ . . . .: ::::::::  >>599で10桁検索を試してみたら、
:::::::: :.: . . /彡ミ゛ヽ;)ヽ、. ::: : ::  全体的には微妙に遅くなってしまいました……
::::::: :.: . . / :::/:: ヽ、ヽ、i . .:: :.: ::: GPU4.54M/CPU8.37M(1.1a8)→4.67M/7.30M(1.1b1)
 ̄ ̄ ̄(_,ノ  ̄ ̄ヽ、_ノ ̄
604混沌 ◆Chaos/geeeIV :2013/10/28(月) 02:19:54.22 ID:dSrDJMko0
12桁をα8で動かしたまま
10桁のほうをβにしてみたのですが、βで動かしている10桁検索がユグに表示されないみたい
605混沌 ◆Chaos/geeeIV :2013/10/28(月) 02:20:58.92 ID:dSrDJMko0
>>604
検索中のPCで表示される検索中PCの一覧の話です
606混沌 ◆Chaos/geeeIV :2013/10/28(月) 02:24:52.10 ID:dSrDJMko0
>>605
ごめん 10桁に設定してなかったです><
607 ◆Meriken//XXX :2013/10/28(月) 02:33:30.28 ID:iwOwmbfYP
>>603
CPUは何ですか? Haswell/Ivy Bridge向けの最適化なので、
他のアーキテクチャだと遅くなるかもしれませんねえ。
CPU検索のスレッドの優先度も下げたのでそのせいかも…
CPU検索だけでの速度も教えていただけますか。

>>604-605
あ〜、びっくりしたw
608 ◆Meriken//XXX :2013/10/28(月) 02:56:32.95 ID:iwOwmbfYP
>>603
まあでも多分CPU検索のスレッドの相対的な優先度を下げたのが
効いてるんでしょうねえ。う〜ん、どうしようかなあ。
609混沌 ◆Chaos/geeeIV :2013/10/28(月) 03:04:16.15 ID:dSrDJMko0
βで幾つかパターン設定して
10桁検索、特殊設定に準8連、二構、最短を設定して検索を開始すると

http://kie.nu/1rVa


特殊設定から二構をはずしたら普通に動きました
必要なら環境その他説明します
610 ◆Meriken//XXX :2013/10/28(月) 03:04:27.27 ID:iwOwmbfYP
>>603
あ、そうそう。「CPU検索スレッドの数」を目一杯上げてやれば速くなるかもしれません。
自動設定の値も変えておいたほうがいいのかな。
611 ◆Meriken//XXX :2013/10/28(月) 03:08:20.16 ID:iwOwmbfYP
>>609
二構はCUDAの10桁トリップでは元から動かなかったような…

> 必要なら環境その他説明します

お願いします。
612混沌 ◆Chaos/geeeIV :2013/10/28(月) 03:18:20.44 ID:dSrDJMko0
>>611

【OS】Win7 Pro 64bit SP1
【CPU】Core i7-3770K
【CPUの命令セット】x64 + SSE2/AVX/AVX2
【CPU検索スレッドの数】4
【CUDA1SMあたりのブロック数】4

GeForce GTX 660
ドライバのバージョン 327.23


とりあえずこれくらいあればいいでしょうか
613混沌 ◆Chaos/geeeIV :2013/10/28(月) 03:19:29.37 ID:dSrDJMko0
>>611
>二構はCUDAの10桁トリップでは元から動かなかったような…

10桁の特殊設定は今回はじめて設定したので、もとからなのかもしれないですー
614 ◆Meriken//XXX :2013/10/28(月) 03:21:29.89 ID:iwOwmbfYP
>>612
ありがとうございます。Alpha 8で二構は検索できていましたか?
615 ◆Meriken//XXX :2013/10/28(月) 03:23:23.76 ID:iwOwmbfYP
>>613
了解しました。二構についての注意書きを足しておいたほうがいいのかもしれませんね。
616混沌 ◆Chaos/geeeIV :2013/10/28(月) 03:33:00.18 ID:dSrDJMko0
>>614
今、α7にて、同一のpattern.txt、同一特殊設定(準8連、二構、最短)での正常起動を確認しました

α8にて、同一のpattern.txt、同一特殊設定(準8連、二構、最短)での正常起動を確認しました
が・・・、正常にパターン展開を終え検索開始を確認してからα8を終了させたらなぜかFireFoxがクラッシュ^^;
617混沌 ◆Chaos/geeeIV :2013/10/28(月) 03:34:36.07 ID:dSrDJMko0
>>616
βを入れていろいろ試している最中、先ほどのドライバクラッシュとともにFireFoxのエラー再起動も何度も起きていたので
その影響かも・・
618 ◆Meriken//XXX :2013/10/28(月) 04:35:25.47 ID:iwOwmbfYP
>>616
CUDAのほうはいじってないのでおかしいですねえ。
取りあえずCPU検索スレッドの優先度は元に戻しておくことにします。
619shirawa@mmo ◆BOINC/MMOEXx :2013/10/28(月) 07:11:11.27 ID:+tBLnnhMP
とりあえず試したので貼っておきます

【診断の種類】検索速度(1パターン)
【Meriken's Tripcode Finderのバージョン】1.1 Free Edition Alpha 8 → Beta 1

【検索デバイス】GPUとCPU
【使用するGPU】NVIDIA GeForce GTX 660 (CUDA)
【使用するCPU】Intel Core i7-3770 CPU @ 3.40GHz

【1SMあたりのブロック数(CUDA)】自動
【CPUの命令セット】x64 + SSE2/AVX/AVX2
【CPU検索スレッドの数】自動
【検索プロセスの優先度】通常以下
【GUIフロントエンドの優先度】通常

【トリップの種類】12桁
【キーに使用する文字】すべて
【検索パターン】 10文字完全前方一致1個

【10分間の平均速度】 623.67M tripcode/s → 620.78M tripcode/s
【GPU検索の平均速度】 525.63M tripcode/s → 522.63M tripcode/s
【CPU検索の平均速度】 98.04M tripcode/s → 98.16M tripcode/s

【トリップの種類】10桁
【キーに使用する文字】すべて
【検索パターン】 10文字完全前方一致1個

【10分間の平均速度】 45.82M tripcode/s → 46.43M tripcode/s
【GPU検索の平均速度】 25.91M tripcode/s → 25.84M tripcode/s
【CPU検索の平均速度】 19.91M tripcode/s → 20.60M tripcode/s
620 ◆YSRKEN.ceVZZ :2013/10/28(月) 23:07:36.17 ID:QaQ6xfiQ0
>>607-608,610
CPUはいつもの通りi5-3210M(Ivy)ですよ。
もう遅いかもですが、真面目に測り直してみました。
設定は、「256block/SM(GPU)+4thread,64bit,AVX(CPU)」です。
結果、Alpha 8→Beta 1で、12.43M(G4.61+C7.81)→12.01M(G4.67+C7.34)となりました。
ちなみにCPUだけだと、9.57M→9.72Mでした。
621 ◆MOYASHI/Go :2013/10/29(火) 01:13:14.28 ID:ZXeakMtP0
>>599
お疲れ様です。
診断機能(CPU検索のみ)の結果報告です。

【Meriken's Tripcode Finderのバージョン】1.1 Free Edition Beta 1
【OS】Win7 Pro 64bit SP1
【CPU】Core i5 3570
【CPUの命令セット】x64 + SSE2/AVX/AVX2
【CPU検索スレッドの数】4

【診断の種類】検索速度(1パターン)
【キーに使用する文字】半角と全角
【検索パターン】 10文字完全前方一致1個

【トリップの種類】10桁
【10分間のCPU検索の平均速度】 21.42M tripcode/s
【トリップの種類】12桁
【10分間のCPU検索の平均速度】 104.46M tripcode/s

最近は10桁(CPU検索)をしている事が多いので、これは嬉しい。
622名無しさん@お腹いっぱい。:2013/10/29(火) 02:36:43.41 ID:fV8pJreX0
>>90と同じWin7 SP1 x64 / C2Q Q9650定格(3GHz)CPUのみ / 4スレッドのPCでの
1.1FEα7 / 1.1FEα8 / 1.1FEβ1の各バージョンの12桁 / 10桁それぞれの「各種診断」の実行結果(各3回測定)です

【診断の種類】検索速度(1パターン)
【検索デバイス】CPUのみ
【CPUの命令セット】x64 + SSE2/AVX/AVX2 ※1.1FEα7は x64 + SSE2/AVX
【CPU検索スレッドの数】自動 ※4スレッド
【検索プロセスの優先度】通常以下
【GUIフロントエンドの優先度】通常
【キーに使用する文字】半角と全角
【検索パターン】 10文字完全前方一致1個

【10分間のCPU検索の平均速度】
【トリップの種類】12桁
1.1FEα7: 62.71M 62.57M 62.69M
1.1FEα8: 61.80M 61.80M 61.86M
1.1FEβ1: 61.85M 61.97M 61.88M
【トリップの種類】10桁
1.1FEα7: 12.54M 12.51M 12.52M
1.1FEα8: 13.05M 13.00M 13.04M
1.1FEβ1: 13.03M 13.02M 13.02M

12桁は1.1FEα7→1.1FEα8/1.1FEβ1で微減(-1.3%)
逆に10桁は1.1FEα7→1.1FEα8/1.1FEβ1で微増(+4%)といったところです

ちなみに10桁に関して同じPCでmty_win_x64_20071012.zipの64XMMフォルダのmty.exeを使った場合は
target.txtを作らない「勝手にベンチマークモード(128ビット級)」の状態で起動10分後の平均検索速度は13434ktrips/s
mty_cal_20081222.zipのmty_cal_x64.exeを
Catalyst13.11beta v6からaticalcl64.dllとaticalrt64.dll(どちらもバージョン6.14.10.1848)を取り出して
それぞれamdcalcl64.dllとamdcalrt64.dllにリネームして同じフォルダに入れてCPU検索のみで使った場合は
同じ「勝手にベンチマークモード(128ビット級)」で起動10分後の平均検索速度は13.896Mtrips/sでした
623やんやん ◆yanyan//jacp :2013/10/29(火) 04:47:01.92 ID:D6iGZtya0
TITANさんが増えました。
GPUがちと遅くなったのは何故だろう?
【診断の種類】検索速度(1パターン)
【Meriken's Tripcode Finderのバージョン】1.1 Free Edition Alpha 8 → Beta 1

【検索デバイス】GPUとCPU
【使用するGPU】NVIDIA GeForce GTX TITAN (CUDA) x2
【使用するCPU】Intel Xeon W5590 ×2
【1SMあたりのブロック数(CUDA)】自動
【CPUの命令セット】x64 + SSE2/AVX/AVX2
【CPU検索スレッドの数】自動
【検索プロセスの優先度】通常以下
【GUIフロントエンドの優先度】通常

【トリップの種類】12桁
【キーに使用する文字】すべて
【検索パターン】 10文字完全前方一致1個

【10分間の平均速度】 2778.09M tripcode/s → 2308.74M tripcode/s
【GPU検索の平均速度】 2668.57M tripcode/s → 2203.67M tripcode/s
【CPU検索の平均速度】 109.52M tripcode/s → 105.07M tripcode/s
624 ◆Meriken//XXX :2013/10/29(火) 05:32:57.82 ID:lW9/jYvqP
報告有り難うございます。なるべく安定したバージョンを出したいので
助かりますです。

>>620
>>621
やっぱり10桁トリップのCPU検索だけ見れば
ちょこっとはやくなっているようですね。

>>622
C2Qあたりだとまだmtyのほうが速いのかなあ。
それともベンチマークモードではヒット判定を省略してるのかしらん。

>>623
これはちょっとどころではないですねえ。
何でCPU検索スレッドの優先度を下げたらGPU検索が遅くなるんだろう…
ちゃんとCC3.5用のバイナリも生成されてるし、ソースコードの差分も
チェックしたけど怪しいところは見つかりませんでした。
今日中にBeta 2をうpするので、そちらも試していただけると助かります。
625 ◆Meriken//XXX :2013/10/29(火) 06:46:28.30 ID:lW9/jYvqP
新しい開発版をうpしました。

Meriken's Tripcode Finder 1.1 Free Edition Beta 2
http://www.meriken2ch.com/programming/merikens-tripcode-finder

Beta 1からの主な変更点は以下の通りです。

・CPU検索スレッドの優先度の調整。

これでTITANでの速度低下は直っていればいいのですが…
626shirawa@mmo ◆BOINC/MMOEXx :2013/10/29(火) 08:07:48.95 ID:g0WNC3KyP
環境>>619から変化なし
【Meriken's Tripcode Finderのバージョン】1.1 Free Edition Alpha 8 → Beta 1 → Beta 2

【トリップの種類】12桁
【10分間の平均速度】 623.67M tripcode/s → 620.78M tripcode/s → 620.04M tripcode/s
【GPU検索の平均速度】 525.63M tripcode/s → 522.63M tripcode/s → 520.77M tripcode/s
【CPU検索の平均速度】 98.04M tripcode/s → 98.16M tripcode/s → 99.27M tripcode/s

【トリップの種類】10桁
【10分間の平均速度】 45.82M tripcode/s → 46.43M tripcode/s → 43.67M tripcode/s
【GPU検索の平均速度】 25.91M tripcode/s → 25.84M tripcode/s → 23.01M tripcode/s
【CPU検索の平均速度】 19.91M tripcode/s → 20.60M tripcode/s → 20.66M tripcode/s
627 ◆Meriken//XXX :2013/10/29(火) 08:26:36.58 ID:lW9/jYvqP
>>626
う〜ん、これはおかしいですねえ。
やっぱりスレッドの優先度を変えたときの速度への影響は
環境によってかなり差があるんでしょうねえ。
CPUの速度を上げたらGPUの速度が下がるなんて予想してませんでした。
こりゃどうしようかな。
628shirawa@mmo ◆BOINC/MMOEXx :2013/10/29(火) 08:39:53.12 ID:g0WNC3KyP
あ、忘れていましたがGPU回りといえば
今朝にGeForce R331 Game Ready Driver (WHQL) Ver.331.65へアプデしてました
その影響とかもあるかも…?
629 ◆JouJaku.IYSv :2013/10/29(火) 08:41:16.39 ID:JC0DLGjX0
>>627
CPUのスレッド数をギリギリまで増やしているため、GPUがストールしたとかは考えられませんか?
630 ◆Meriken//XXX :2013/10/29(火) 09:20:33.85 ID:lW9/jYvqP
>>628
その可能性は大いにありますね。私のところではドライバは
320.57のままなんですが、速度低下は見られませんでした。
念のためもう一度測定してみます。

>>629
スレッド数の自動設定のルーチンはいじっていないので、
スレッド数は変わっていないはずなんです。不思議なもんですね。
631 ◆YSRKEN.ceVZZ :2013/10/29(火) 09:29:42.22 ID:CFH97Nix0
Alpha8→Beta2で、>>620と同じ設定で動かしてみると、
12.01M(G4.66+C7.35)→12.10M(G4.68+C7.43)となりました。
速度低下が無くなったようです。ありがとうございました。
632 ◆Meriken//XXX :2013/10/29(火) 09:52:30.41 ID:lW9/jYvqP
【診断の種類】検索速度(1パターン)
【Meriken's Tripcode Finderのバージョン】1.1 Free Edition Beta 2
【OS】Microsoft Windows 7 English
【ディスプレイドライバ】NVIDIA Display Driver 320.57

【検索デバイス】GPUとCPU
【使用するGPU】すべて使用
【GPU】NVIDIA GeForce GTX 580 @ 830MHz (OC)
【CPU】Intel Core i7-3770K (定格)

【1SMあたりのブロック数(CUDA)】192
【CPUの命令セット】x64 + SSE2/AVX/AVX2
【CPU検索スレッドの数】自動
【検索プロセスの優先度】通常以下
【GUIフロントエンドの優先度】通常

【トリップの種類】10桁
【キーに使用する文字】半角と全角
【検索パターン】 10文字完全前方一致1個

【Meriken's Tripcode Finderのバージョン】1.1 Free Edition Alpha 8
【10分間の平均速度】 81.95M tripcode/s
【GPU検索の平均速度】 59.09M tripcode/s
【CPU検索の平均速度】 22.87M tripcode/s

【Meriken's Tripcode Finderのバージョン】1.1 Free Edition Beta 2
【10分間の平均速度】 82.55M tripcode/s
【GPU検索の平均速度】 59.09M tripcode/s
【CPU検索の平均速度】 23.46M tripcode/s
633 忍法帖【Lv=22,xxxPT】(2+0:8) ◆Meriken//XXX :2013/10/29(火) 09:54:26.54 ID:lW9/jYvqP
測定してみましたけど、やっぱりBeta 2のほうが速度が上がっています。
なんかやっぱりドライバが怪しいですねえ。
FermiよりKeplerのほうがドライバの負荷が大きいのかしらん。
速度低下がひどいようならCPU検索スレッドの数を下げるのも手かもしれません。
634shirawa@mmo ◆BOINC/MMOEXx :2013/10/29(火) 10:00:05.49 ID:g0WNC3KyP
数カ月ぶりに再起動して余計なものを起動させずに測定しなおしてみました
【診断の種類】検索速度(1パターン)
【Meriken's Tripcode Finderのバージョン】1.1 Free Edition Beta 1 → 2
【トリップの種類】10桁
【10分間の平均速度】 48.25M tripcode/s → 48.37M tripcode/s
【GPU検索の平均速度】 26.18M tripcode/s → 26.19M tripcode/s
【CPU検索の平均速度】 22.07M tripcode/s → 22.18M tripcode/s
635名無しさん@お腹いっぱい。:2013/10/29(火) 14:10:53.99 ID:t2Twjfya0
ttp://pc.watch.impress.co.jp/docs/column/kaigai/20120322_520640.html

Kepler世代ではハードウェアスケジューラをシンプルにして、
一部をドライバで行うようにしたらしいので、Fermiと比べるとCPU負荷が大きいのだと思います。

GK110でもそのあたりの特徴は共通しているのではないかという話もあるようですし、
KeplerはやはりGPGPUでは処理によって向き不向きが大きそうですね。
636 ◆JouJaku.IYSv :2013/10/29(火) 15:02:39.87 ID:6FImJTb80
a8とb2でディスプレイドライバを変えて走らせてみました。

【診断の種類】検索速度(1パターン)
【Meriken's Tripcode Finderのバージョン】1.1 Free Edition Alpha 8 → Beta 2
【OS】Windows 7 Ultimate SP1 64bit
【検索デバイス】GPUのみ
【使用するGPU】すべて使用
【GPU0】GeForce GTX TITAN
【GPU1】GeForce GTX TITAN
【CPU】Intel Core i7 4770K
【1SMあたりのブロック数(CUDA)】256
【検索プロセスの優先度】アイドル
【GUIフロントエンドの優先度】通常
【トリップの種類】12桁
【キーに使用する文字】半角と全角
【検索パターン】 10文字完全前方一致1個
【その他】画面表示にはCPU内蔵GPUを使用

【ディスプレイドライバ】GeForce 331.58
【10分間のGPU検索の平均速度】 3884.68M → 3873.72M tripcode/s

【ディスプレイドライバ】GeForce 331.65
【10分間のGPU検索の平均速度】 3876.84M → 3870.58M tripcode/s

誤差の内でどの条件でも変わらない様に見えます。
637 ◆Meriken//XXX :2013/10/29(火) 15:34:01.48 ID:lW9/jYvqP
>>636
やっぱりGPU検索だけだと遅くはならないですね。安心しました。
まあ手を付けてすらいないから当然なんですけど…

恐らく問題になっていたのはCPUとGPUで同時に検索した場合で、
CPU検索スレッドとNVIDIAのドライバとのあいだで
スケジューリングの問題が発生していたものと思われます。
638 ◆Meriken//XXX :2013/10/29(火) 15:37:04.67 ID:lW9/jYvqP
>>634
いや〜、遅くなるはずがなかったので、この報告でホッとしましたw
639名無しさん@お腹いっぱい。:2013/10/29(火) 16:12:17.28 ID:0G58/s0a0
Catalist13.11betav7は検索遅くなりますね
Win8.1系のドライバに置き換わっている様子です
まぁ、動くなら別に開発するコストは無駄ですから仕方ないですね
今後もこの方針で行くことでしょう
640名無しさん@お腹いっぱい。:2013/10/29(火) 16:38:11.25 ID:0G58/s0a0
あれ、錯覚だった
641shirawa@mmo ◆BOINC/MMOEXx :2013/10/29(火) 16:53:43.87 ID:g0WNC3KyP
>>638
普段からゲームサーバーとしてMTFと並行で常時稼働してるPCなので
ゲームのオンライン人数に相関して速度が微妙に変わってくる気がしてきました

次からは再起した直後に測ろう…
642名無しさん@お腹いっぱい。:2013/10/29(火) 17:13:41.79 ID:nl+8LYTq0
これだけVerUpでの速度低下を気にしなければいけないのなら、
検索ルーチンを過去数種類分を最初から内蔵させておいて、
ベンチ取って最も速いのに自動切り替えとか出来ないのかな。
検索ルーチンを返すIFに簡易JIT(アセンブラモドキ)持たせて、
CPU別movaps/movdqa選択を始め、パラメータ最適化の夢も。
643名無しさん@お腹いっぱい。:2013/10/29(火) 17:27:33.07 ID:Hr5ZH/w+0
ベンチ取りながら勝手にチューニングしてくれるモード作ろう()
644 ◆YSRKEN.ceVZZ :2013/10/29(火) 19:19:21.62 ID:gpav0F540
>>642
なんのために「自動」設定があると……
645 ◆Meriken//XXX :2013/10/29(火) 19:51:33.45 ID:lW9/jYvqP
>>642
ただでさえ検索ルーチンが多すぎでメンテとテストの手間が大変なのに
これ以上増やすのはありえないですw 今でも23個もあるんですからね。
見つけにくいバグが紛れ込んだら収拾がつきません。

>>644
動的に最適化してるのはCUDAのブロック数だけですよ。

>>643
動的な最適化はいろいろ試してみたんですけど、動かしてる時の状況で
速度が全く違ってくるので全然安定した結果が出ないんですよね。
646名無しさん@お腹いっぱい。:2013/10/30(水) 02:42:15.08 ID:OyFqPW6o0
更新おつかれさまです
CPUのみということもあって特に変化はないようですが
>>622に1.1FEβ2の結果を追加しておきます

【OS】Win7 SP1 x64
【CPU】C2Q Q9650定格(3GHz)
【診断の種類】検索速度(1パターン)
【検索デバイス】CPUのみ
【CPUの命令セット】x64 + SSE2/AVX/AVX2 ※1.1FEα7は x64 + SSE2/AVX
【CPU検索スレッドの数】自動 ※4スレッド
【検索プロセスの優先度】通常以下
【GUIフロントエンドの優先度】通常
【キーに使用する文字】半角と全角
【検索パターン】 10文字完全前方一致1個

【10分間のCPU検索の平均速度】

【トリップの種類】12桁
1.1FEα7: 62.71M 62.57M 62.69M
1.1FEα8: 61.80M 61.80M 61.86M
1.1FEβ1: 61.85M 61.97M 61.88M
1.1FEβ2: 61.83M 61.95M 61.93M

【トリップの種類】10桁
1.1FEα7: 12.54M 12.51M 12.52M
1.1FEα8: 13.05M 13.00M 13.04M
1.1FEβ1: 13.03M 13.02M 13.02M
1.1FEβ2: 13.02M 13.01M 13.01M
647 ◆Meriken//XXX :2013/10/30(水) 07:48:43.21 ID:K/3M4y9GP
ありがとうございます。これで特に問題がなければ
Beta 2を次の安定版にすることにします。
648 ◆JouJaku.IYSv :2013/10/30(水) 11:38:07.82 ID:bEZ5UzGT0
予想通りGTX780の値下げが「米国で」来ました。
やはり市場競争はこうでなくては。
ttp://northwood.blog60.fc2.com/blog-entry-7180.html

一方、九十九は在庫処分と称してHD7990を11万越えで売り出しました・・・
649 ◆Meriken//XXX :2013/10/30(水) 12:56:45.47 ID:K/3M4y9GP
7990は何故かアメリカでも値上げされてましたよ。
一時期neweggで$599で買えてたのが$769になってます。
いずれにせよ11万は高すぎですけど…
650 ◆Meriken//XXX :2013/10/30(水) 22:45:22.40 ID:K/3M4y9GP
7990とM6Eの水枕が金曜日に届くんですけど、もう待ちきれないお…
まあそれまでおとなしくゆぐちゃんの相手をすることにします。
651 ◆Meriken//XXX :2013/10/31(木) 06:05:40.36 ID:k/KXHtRTP
新しいドライバが来ましたね。

AMD Catalyst 13.11 Beta8
http://support.amd.com/en-us/kb-articles/Pages/latest-catalyst-windows-beta.aspx
652名無しさん@お腹いっぱい。:2013/10/31(木) 09:56:52.72 ID:4lzfwyGD0
24コア/48スレッド・・・これだとどんぐらい速度出るんだろ・・・
http://weekly.ascii.jp/elem/000/000/181/181422/
653名無しさん@お腹いっぱい。:2013/10/31(木) 10:03:29.14 ID:Aqo+U2sL0
>>652
>>548で、4コア8スレッドのi7-4770では51.70M/239.15Mらしいので、
その6倍の310M/1435Mぐらいは行くんじゃないですかね(小並感)
654 ◆MOYASHI/Go :2013/10/31(木) 19:30:17.91 ID:sQlx81X50
更新乙です。
Beta2の診断(CPU検索10桁&12桁)、通常の検索共にBeta1と変わらず快調です。

>>652-653
それって、中身はIvy(AVX2非対応)じゃなイカ?
655名無しさん@お腹いっぱい。:2013/10/31(木) 20:13:18.77 ID:a+ufxGoA0
・MTFでの同一クロック/同一スレッド数のIvy(AVX2非対応) vs Haswell(AVX2使用)≒1:2
・12コア/24スレッド vs 4コア/8スレッド=3:1
・定格クロック 2.7G(12コア全ブースト時最大3G) vs 3.4G(4コア全ブースト時最大3.7G)
と考えると
Xeon E5-2697 v2(AVX2非対応)はCore i7-4770(AVX2使用)比で推定0.5*3*2.7/3.4(3/3.7)≒1.2倍
デュアルで約2.4倍
CPUのみで10桁120MTPS/12桁575MTPSくらい?
656 ◆MOYASHI/Go :2013/10/31(木) 21:55:15.48 ID:sQlx81X50
10桁の方は、もうちょい速度出そうな気がするけど実際はどうなんだろう?

しかし62万円って金額も凄いが、タスクマネージャーの画像w
http://weekly.ascii.jp/elem/000/000/181/181414/20131030ippei_jisaku06_cs1e1_1000x.jpg
657名無しさん@お腹いっぱい。:2013/10/31(木) 22:13:35.10 ID:Aqo+U2sL0
>>656
        Λ_Λ     とりあえず、前にIYHスレに貼られてた画像貼っておきますね
        (´∀` )-、    .http://anago.2ch.net/test/read.cgi/jisaku/1379787364/664
       ,(mソ)ヽ   i    ttp://up3.viploader.net/desktop/src/vldesk007857.jpg
       / / ヽ ヽ l
 ̄ ̄ ̄ (_,ノ ̄ ヽ、_ノ ̄
658 ◆MOYASHI/Go :2013/10/31(木) 23:40:27.28 ID:sQlx81X50
>>657
(;゚д゚)ゴクリ……これはIYHerの鑑だ。
だが、このPCをナニに使っているのかが気になるw
659名無しさん@お腹いっぱい。:2013/11/01(金) 00:29:12.44 ID:rDJCYjow0
>>658
> だが、このPCをナニに使っているのかが気になるw
いやトリップ検索以外の何に使うのかと・・・
660混沌 ◆Chaos/geeeIV :2013/11/01(金) 04:34:38.83 ID:ws/H9/0b0
>>498のようなパスコード突破とか
Team2chとか
トリップ検索とか

個人的には、クラック方面の事でも、人の役に立つ(とされる)事でも、どっちにもいいイメージはもっていないな
何の役にも立たないトリップ検索が最高w



どーでもいいけど、Windowsの(に限らないけど)パスワードアタックを
無制限に最高速でアタックし続けられるような認証システムなんて現存してるのかな?w
661 ◆MOYASHI/Go :2013/11/01(金) 23:48:30.26 ID:6i7Fh6+w0
トリップ検索は、趣味・嗜好性が高い感じがいいねぇ。
特徴的な文字列を持つトリップを見ただけでニヤけてしまう変態(俺)としては、
高速でトリップが生成・発見されていく様は垂涎ものだw
662混沌 ◆VVvVVVVvvvw. :2013/11/02(土) 04:13:45.22 ID:eDGT8Oye0
はっはっは
擬似準12連きたw
663 ◆Meriken//XXX :2013/11/02(土) 08:40:32.61 ID:hjt5gJusP
>>654
こんどこそ大丈夫なようですね。
もう1週間ぐらい待ってから安定版をうpすることにします。
664 ◆Meriken//XXX :2013/11/02(土) 08:49:45.93 ID:hjt5gJusP
>>656
62万あったらXeon Phi 7120Pが買えますよ。
1.238 GHz, 61 coreでAVX-512が使えます。
いつかいじってみたいなあ。
665 ◆Meriken//XXX :2013/11/02(土) 08:52:40.32 ID:hjt5gJusP
トリップ検索は意外性があるのが面白いですね。
今使ってるトリップが出たときには驚いたもんですw
666 ◆Meriken//XXX :2013/11/02(土) 08:54:00.66 ID:hjt5gJusP
水枕が届いたのでこれから取付作業に入ります。
うまくいくといいけど…
667猫 ◆catpedias. :2013/11/02(土) 15:24:19.26 ID:/tp2oL+70
自分も壊れてしまったグラボ買い換えたいです
先立つものはないですけどね!
668 ◆Meriken//XXX :2013/11/02(土) 22:27:45.63 ID:hjt5gJusP
ここしばらく12桁トリップ検索で見ないと思ってたら壊れてたんですね。
ご愁傷様です… これはなにか考えないといけないな。
669 ◆Meriken//XXX :2013/11/02(土) 22:39:32.66 ID:hjt5gJusP
新生検索君1号の水冷化は無事に成功したようです。
7990 2枚を1100MHzまでOCしてもGPUの温度は57〜61℃に抑えられています。
ゆぐちゃんに接続して10.5G TPSでるわ、音はほとんどしないわ、
熱はうまく逃げてくれて部屋は涼しくなるわでいいことずくめですw
670 ◆Urotsuki/1Ca :2013/11/02(土) 22:48:07.00 ID:cuto0G2V0
おめでとうございますー
水冷化の効果絶大で何より
こちらもPCの修理をさっさとして再開せねば
671名無しさん@お腹いっぱい。:2013/11/02(土) 23:49:05.78 ID:cuYHudqx0
もはや他の追随を許さないほど水冷化新生検索君1号大勝利!!!!!
672 ◆Meriken//XXX :2013/11/03(日) 19:12:29.99 ID:yfGFBJgeP
ブログを久しぶりに更新しました。写真付きです。

世界最速のトリップ検索専用PC「新生検索君1号」http://www.meriken2ch.com/blog/archives/135
673累計 ◆wop.8OO8.qow :2013/11/03(日) 19:32:29.70 ID:tFvOhSfd0
>>672
早速ブログを拝見しました。ブルーのファンがかっこいいですね。
3枚目の画像はちょっとピンボケですけど、緊張していたんでしょうかw
674名無しさん@お腹いっぱい。:2013/11/03(日) 20:17:27.27 ID:PdzNx+5k0
>>672
お疲れ様です。
本格水冷はかなりインパクトありますね。

最近、朝晩は冷えるようになってきて、検索に参加しようかと思っていたところなので、
次回予定の手引きが楽しみです。
675名無しさん@お腹いっぱい。:2013/11/03(日) 21:43:32.18 ID:PReZ1B3kP
新生検索君一号を作るにはいくらかかりますか?
676名無しさん@お腹いっぱい。:2013/11/03(日) 21:44:39.85 ID:PReZ1B3kP
かっこよすぎる・・・・・・
677名無しさん@お腹いっぱい。:2013/11/03(日) 21:58:33.30 ID:PReZ1B3kP
やっぱり注水とかも自分でやるんですか?
678 ◆Urotsuki/1Ca :2013/11/03(日) 22:10:12.47 ID:C6TrMZsn0
水冷はあまり水足す必要はない気が
蒸発はするけど微々たるもんだし
679 ◆QZschizo.ptH :2013/11/03(日) 22:16:08.12 ID:GlPgCSKZ0
>>672
完動おめでとうございます。
680名無しさん@お腹いっぱい。:2013/11/03(日) 22:19:39.54 ID:PReZ1B3kP
>>678
最初作った時に注水してポンプ動かして徐々に全体に通って行くところが楽しそうでした
681名無しさん@お腹いっぱい。:2013/11/03(日) 22:29:51.66 ID:tCgGrX0T0
少しでも速度を上げようと、ドライバを最新のにしたいんだが、インストーラが途中で止まってしまう。
じゃぁってんで、アンインストールしてから新規に入れようとしたが、アンインストールも途中で止まってしまう。
何か、手動で新規インストールと同じ状態でインストール出来る方法ないですかね・・・
もう面倒臭いから、C:\Program Files\ATI Technologies 以下をセーフモードで全部消すか・・・
682ののたん ◆KiwamonoL. :2013/11/03(日) 23:12:48.86 ID:GllCR+2O0
>>681
昔はドライバクリーナーでやってた。
最近やったことないから今もこの方法が有効なのかはわからん。
ttp://www.guru3d.com/files_details/display_driver_uninstaller_download.html
683 ◆MOYASHI/Go :2013/11/04(月) 01:19:12.74 ID:qRNWVWxe0
>>669,672
おお、無事に完成しましたか!見た目も格好いいし、効果も凄いですね。
そして検索君がリミッター解除状態になっててワロタw

>>665
トリッパーが発見してくれた大量のトリップの山の中から、純度の高めな美しい
トリップや面白い感じのトリップを見つけ出した時の喜びってのは、いいものですね。
レアアイテムを入手した様な、なんかそんな感覚。
684 ◆Meriken//XXX :2013/11/04(月) 03:14:05.71 ID:F0Mv3GSYP
>>672の記事が結構好評だったようで何よりですw
記事に水冷化のためのパーツの一覧を追加しておきました。
ピンぼけだった写真も差し替えておきました。
685 ◆Meriken//XXX :2013/11/04(月) 03:54:33.90 ID:F0Mv3GSYP
現在新生検索君1号に空冷の7970を追加して記録を測定中です。
電源にかなり無茶をさせてますが、平気で動いています。さすがAX1200。
686名無しさん@お腹いっぱい。:2013/11/04(月) 04:05:37.14 ID:AXna9wos0
>>682
> ttp://www.guru3d.com/files_details/display_driver_uninstaller_download.html
これで消したけど、新しいカタリストはインストール出来なくて、
結局グラボ添付のやつ (13.1) を入れたら、MTF が GPU を
見つけてくれなくて、GPU 検索が出来なくなってしまった。
カタリストの 13. 幾つからサポートしてるんだっけ?
まぁ、「最新を使え」とは書いてあるけど・・・
687 ◆Meriken//XXX :2013/11/04(月) 07:24:18.08 ID:F0Mv3GSYP
>>686
13.1だったら動くはずですよ。デバイスマネージャのディスプレイアダプタの項目には
どのように表示されていますか? こういう場合はデバイスマネージャから直接
グラボを有効にしたりドライバを更新したりすると解決できることが多いんです。
688 ◆Meriken//XXX :2013/11/04(月) 07:39:05.38 ID:F0Mv3GSYP
12桁トリップ検索の記録に挑戦したらブレーカーが落ちまくったので
取りあえず10桁トリップ検索の記録を測定することにしました。
検索の立ち上がりが遅いので1時間の平均速度を使う予定ですが、
これまでの記録である700M TPS超は確実です。いやあ、長かったなあ。
689 ◆JouJaku.IYSv :2013/11/04(月) 07:39:11.29 ID:j/J3PBwn0
>>684
中々立派な水冷ですね。部屋が広くて羨ましいです。
透明なクーラントを使うのは珍しいですね。
透明だとじわじわ漏れる場合に気付きにくいので、私は色付きのクーラントを使っています。
ちなみに私が使っているのは、YAMAHAの青いクーラントです(笑)。
690 ◆Meriken//XXX :2013/11/04(月) 09:10:03.80 ID:F0Mv3GSYP
【診断の種類】検索速度(1パターン)
【Meriken's Tripcode Finderのバージョン】1.1 Free Edition Beta 2
【OS】Microsoft Windows 7 64bit SP1 English
【ディスプレイドライバ】Catalyst 13.11 Beta6

【検索デバイス】GPUとCPU
【使用するGPU】すべて使用
【GPU0】VisionTek Radeon HD 7990 @ 1100MHz (OC)
【GPU1】Gigabyte Radeon HD 7990 @ 1100MHz (OC)
【GPU2】Gigabyte GV-R799D5-6GD-B Radeon HD 7970 @ 1100MHz (OC)
【CPU】Intel Core i7-4770 (定格)

【1CUあたりのワークアイテムの数(OpenCL)】自動
【1WGあたりのワークアイテムの数(OpenCL)】自動
【1GPUあたりの検索プロセスの数(OpenCL)】1
【1検索プロセスあたりの検索スレッドの数(OpenCL)】2
【CPUの命令セット】x64 + SSE2/AVX/AVX2
【CPU検索スレッドの数】6
【検索プロセスの優先度】通常以下
【GUIフロントエンドの優先度】通常

【トリップの種類】10桁
【キーに使用する文字】半角と全角
【検索パターン】 10文字完全前方一致1個

【60分間の平均速度】 711.22M tripcode/s
【GPU検索の平均速度】 665.16M tripcode/s
【CPU検索の平均速度】 46.06M tripcode/s

【GPUの使用率】92〜99%
691 ◆Meriken//XXX :2013/11/04(月) 09:11:12.63 ID:F0Mv3GSYP
【診断の種類】検索速度(1パターン)
【Meriken's Tripcode Finderのバージョン】1.1 Free Edition Beta 2
【OS】Microsoft Windows 7 64bit SP1 English
【ディスプレイドライバ】Catalyst 13.11 Beta6

【検索デバイス】GPUのみ
【使用するGPU】すべて使用
【GPU0】VisionTek Radeon HD 7990 @ 1100MHz (水冷OC)
【GPU1】Gigabyte Radeon HD 7990 @ 1100MHz (水冷OC)
【GPU2】Gigabyte GV-R799D5-6GD-B Radeon HD 7970 @ 1100MHz (空冷OC)
【CPU】Intel Core i7-4770 (定格)

【1CUあたりのワークアイテムの数(OpenCL)】自動
【1WGあたりのワークアイテムの数(OpenCL)】自動
【1GPUあたりの検索プロセスの数(OpenCL)】1
【1検索プロセスあたりの検索スレッドの数(OpenCL)】2
【検索プロセスの優先度】通常以下
【GUIフロントエンドの優先度】通常

【トリップの種類】12桁
【キーに使用する文字】半角と全角
【検索パターン】 10文字完全前方一致1個

【10分間のGPU検索の平均速度】13250.59M tripcode/s

【GPUの使用率】99%
【GPUの温度】58〜62℃(7990) 81℃(7970)
692SilentPC ◆SilentPCIePC :2013/11/04(月) 09:18:20.45 ID:4bHJpkPO0
>>690-691
うおおおおおおぉぉぉぉぉぉぉ
おめ〜〜〜〜〜!!!!!
693 ◆Meriken//XXX :2013/11/04(月) 09:19:04.31 ID:F0Mv3GSYP
というわけで新しい記録は次になります。まあ上出来でしょう。
これ以上は電源を買い替えてもう一枚7990を買わないと無理ですねw

12桁トリップ検索: 13250.59M tripcode/s ( >>691 )
10桁トリップ検索: 711.22M tripcode/s ( >>690 )
694やんやん ◆yanyan//jacp :2013/11/04(月) 09:20:40.53 ID:EVUoV6of0
すげぇ世界だw
695 ◆Meriken//XXX :2013/11/04(月) 09:30:03.01 ID:F0Mv3GSYP
>>689
水冷化できたのはJouJakuさんの後押しがあったからですw
バイク用のクーラントとはさすがですね。新生検索君1号の冷媒は蒸留水で、
銀製のKill Coilをリザーバに入れています。
最初の一時間はへばりついて監視してましたw
696 ◆Meriken//XXX :2013/11/04(月) 09:34:30.41 ID:F0Mv3GSYP
>>692
>>695
どもどもw 限界への挑戦はこれからも続きます。
697名無しさん@お腹いっぱい。:2013/11/04(月) 09:50:24.89 ID:AXna9wos0
>>687
> どのように表示されていますか? こういう場合はデバイスマネージャから直接
正常に表示されています。

> グラボを有効にしたりドライバを更新したりすると解決できることが多いんです。
駄目でした。
13.11 が正式リリースされたらまたやってみます。
698!omikuji ◆JouJaku.IYSv :2013/11/04(月) 09:59:27.94 ID:j/J3PBwn0
>>695
蒸留水だと微量の漏れに気付きにくいですね。
数週間後にホースがクーラントの自重でゆがんでフィッティングの部分から微量に漏れたりします。
特にKoolanceのクイックリリースは漏れやすいので気をつけて下さい。
699 ◆Meriken//XXX :2013/11/04(月) 10:03:32.58 ID:F0Mv3GSYP
>>697
う〜ん、残念… ドライバ周りは本当に難しいんですよねえ。
700名無しさん@お腹いっぱい。:2013/11/04(月) 10:04:10.92 ID:LpHpP0LJ0
>>692,696
初期の頃の記録を貼っておきますね

【トリップ検索】CUDA SHA-1 Tripper【GeForce】
http://anago.2ch.net/test/read.cgi/software/1311428038/
16 名前:1[sage] 投稿日:2011/08/01(月) 01:38:03.10 ID:QqRMCqFa0 [1/3]
GTX 580を951/1902/2203にオーバークロックして808.54M tripcodes/sが
出ました。

もともと772/1544/2004だったのでかなり無理をしています。
ファンは85%でこれ以上はMSI Afterburnerでは上げられないようです。
GPUの温度は68℃なので問題ないはずですが、ファンが掃除機のようです…

166 名前: ◆MERIKEN4.k [sage] 投稿日:2011/08/13(土) 16:16:02.74 ID:qrBcmYtV0 [8/10]
というわけで>18、>>30>>62に続けて最高速の測定をしてみました。

> Searching for 1 pattern with 7 characters.
> 0.096T tripcodes were generated in 0.032 hours at:
> 831.07M tripcodes/s (current)
> 845.02M tripcodes/s (maximum)
> 836.98M tripcodes/s (average)
> No matches were found yet.

最高速がやたらと大きいのは測定の間隔を短くしたためですが、
平均を>>62と比べても微妙に速くなっています。
やはり1タゲだとかなり無茶ができます。
明日配布パッケージをまとめて、うpしよっと。
701 ◆Meriken//XXX :2013/11/04(月) 10:07:39.85 ID:F0Mv3GSYP
>>698
なるほどなるほど… 朝晩まめにチェックすることにします。
702 ◆Meriken//XXX :2013/11/04(月) 12:16:56.42 ID:F0Mv3GSYP
>>700
あの頃はまさか速度が2年で15倍になるなんて考えてもみませんでしたからねえ。
思えば遠くへ来たものですw
703SilentPC ◆SilentPCIePC :2013/11/04(月) 22:08:20.09 ID:DRRQ6f410
>>698-701
何か、水冷って敷居がそれほど高くも無いのかな?っと思った瞬間に叩き落された気分です。
読んでいるこっちが液漏れしてPCを駄目にしてしまわないか心配で胃が痛くなりそうw
自分は取りあえずまだまだ空冷で良いかな?
704名無しさん@お腹いっぱい。:2013/11/04(月) 22:25:21.29 ID:fL+UlGSO0
Win8.1にアップデートしてRadeonの検索速度が500Mも低下し悲しんでいたのですが
解決策が見つかりました
CPUにも2スレッド検索を割り当てたところ(CPU40M)
5000M→5700Mへと上昇しました

うーん、AMD環境ですけどCPUが本気出さないとドライブ能力が落ちるんですかね?
Win8.1ふしぎ!
705 ◆automatic. :2013/11/04(月) 22:28:53.11 ID:igPEEqO50
インフレに追いつけない!
706名無しさん@お腹いっぱい。:2013/11/04(月) 22:30:42.75 ID:AXna9wos0
水冷って、車みたいに特殊な液体なの?
それとも、普通の水?
707 ◆Urotsuki/1Ca :2013/11/04(月) 22:33:24.93 ID:Jtjc4NtB0
水冷は精製水とか使います
専用の水も売られているので調べてみたらどうでしょう
708名無しさん@お腹いっぱい。:2013/11/04(月) 22:35:43.13 ID:oxAGjx6e0
>>706
 >>695 バイク用のクーラント 蒸留水
709名無しさん@お腹いっぱい。:2013/11/05(火) 00:11:42.55 ID:UhkNAlDs0
>>699
> う〜ん、残念… ドライバ周りは本当に難しいんですよねえ。
グラボの検出って、どうやってるのですか?
例えば何かの関数コールだったら、その部分だけを実行して、
どんなエラーコードが返ってるのか見てみたい・・・
710名無しさん@お腹いっぱい。:2013/11/05(火) 00:31:13.40 ID:8MNcB+/70
>>709
とりあえずclinfoしてGPUがOpenCLとして認識されるか見てみてはどうだろうか。
あと自分も同じように認識されなかったときは、GPU-ZしてみたらOpenCLのバグがどうたら言われたので、
これ参考にOpenCLを再インストールしたら直った
http://ameblo.jp/crazyhand/entry-11146554730.html
711名無しさん@お腹いっぱい。:2013/11/05(火) 00:56:36.28 ID:UhkNAlDs0
>>710
> とりあえずclinfoしてGPUがOpenCLとして認識されるか見てみてはどうだろうか。
clinfo ってのが見当たらないので実行出来なかったけど、

> あと自分も同じように認識されなかったときは、GPU-ZしてみたらOpenCLのバグがどうたら言われたので、
GPU-Z では正常に認識しました。

> http://ameblo.jp/crazyhand/entry-11146554730.html
後はこれか・・・
712 ◆Meriken//XXX :2013/11/05(火) 01:17:13.60 ID:i5/8s8SxP
>>703
まあ組み立てはかなり気を使ってやったので大丈夫だと思いますよw
水冷化でグラボの温度を全く気にしなくても良くなったのは大きいです。
またなにかあったらここで詳しく報告するので是非参考にして下さい。
713 ◆Meriken//XXX :2013/11/05(火) 03:16:18.97 ID:i5/8s8SxP
>>709
グラノの検出の処理はごく簡単で、clGetPlatformInfo()とclGetDeviceIDs()を呼び出している
だけです。グラボが検出されないときにはCL_DEVICE_NOT_FOUNDが返ってきているので、
それ以上アプリケーションの側で出来ることはないのです。「難しい」と書いたのは、
ドライバの問題はアプリケーションの側から解決することは難しい、という意味です。
714 ◆shiexn/6.A :2013/11/05(火) 04:30:43.37 ID:33jH6ICg0
【科学】東大、コンピューター消費電力を1万分の1以下にできる技術を開発
http://uni.2ch.net/test/read.cgi/newsplus/1383587175/
715 ◆Meriken//XXX :2013/11/05(火) 05:14:27.61 ID:i5/8s8SxP
>>704
それはよかった。相変わらずAMDのドライバの挙動はワケがわかりませんねえ。

>>705
だんだんドラゴンボール的な何かになってきましたねw
716 ◆looser/TQF01 :2013/11/05(火) 05:20:07.88 ID:0HVquxTc0
>>715
AMDはMSのほうで省電力関係の実装が変わったのでしょう
C'n'Qを切ってしまえば問題なくなると思いますが
人は検索のみに生きるにあらず(^^;
717 ◆Meriken//XXX :2013/11/05(火) 07:29:33.82 ID:i5/8s8SxP
>>675
> 新生検索君一号を作るにはいくらかかりますか?

色々買い足していったので二昔前ぐらいのPCが買えるぐらいになってます。

> やっぱり注水とかも自分でやるんですか?

もちろんです。リザーバ(真ん中の透明な筒)に蒸留水を溜めてから、
ポンプを動かしてやります。何回か繰り返せばループが水で満たされます。
718 ◆Meriken//XXX :2013/11/05(火) 07:31:43.70 ID:i5/8s8SxP
>>716
ははあ、なるほど。こういうのって実に紛らわしいですねえ。
719混沌 ◆VVvVVVVvvvw. :2013/11/05(火) 08:08:08.34 ID:iALMGJey0
>>717
アクアリウムの外部濾過器を連想しちゃいますねw
720混沌 ◆Chaos/geeeIV :2013/11/05(火) 08:09:22.05 ID:iALMGJey0
トリップ戻すの忘れてたw
721猫 ◆catpedias. :2013/11/05(火) 10:44:42.26 ID:nv/iJqMw0
自分もアクアリウムやってるんですけど
外部ろ過で水流を回して”水槽内にグラボを設置"するのもアリかなと思いました。
だれかが水冷PC上部で金魚飼ってたので可能なのかなとw
722 ◆AAAAAL48eog1 :2013/11/05(火) 13:04:37.17 ID:pvLWThV3P
テスト
723名無しさん@お腹いっぱい。:2013/11/05(火) 17:46:41.97 ID:pvLWThV3P
>>717
PC98のころの1台30万円みたいな感じですかね

他の人が注水をやっているところの動画を見たんですが
子供のころにやった水遊びを思い出してすごく楽しそうに見えましたww
724名無しさん@お腹いっぱい。:2013/11/05(火) 19:30:33.94 ID:b02Mh8BB0
>>327とか見るとTITANはCUDA(OpenCL)がかなり弱いみたいな感じだけど、下の記事みたいにDPフルスピードに切り替えてもnVIDIA系は速くなれないの?
ttp://www.4gamer.net/games/204/G020420/20130220002/
725 ◆JouJaku.IYSv :2013/11/06(水) 00:36:29.09 ID:FjE00hkN0
>>724
トリップ計算は整数演算なので、DPオンにしても早くなりません。むしろ遅くなります。
MTFがRadeonと比べてTITANで遅いのは、前の世代のFermiに最適化されていているのも大きいと思います。
726 ◆Meriken//XXX :2013/11/06(水) 02:18:44.12 ID:hHuGEUHwP
>>725
> MTFがRadeonと比べてTITANで遅いのは、前の世代のFermiに
> 最適化されていているのも大きいと思います。

これ、確かに10桁トリップ検索についてはその通りなんですけど、
比較的単純な12桁トリップ検索の場合だとちょっとよくわからないですねえ。
実際12桁トリップ検索のCUDA版とOpenCL版はほとんど同じで、
アーキテクチャ毎の最適化の余地は殆ど無いものと思われます。
727 ◆JouJaku.IYSv :2013/11/06(水) 10:50:16.82 ID:taRe37j80
>>726
> 実際12桁トリップ検索のCUDA版とOpenCL版はほとんど同じで、
> アーキテクチャ毎の最適化の余地は殆ど無いものと思われます。

これ、前から不思議に思っていました。
以前、GPGPUへの移植を手掛けるソフトウェアハウス数社に聞き取り調査を行いました。
全ての企業が、Teslaを使う場合はOpenCLよりCUDAの方が早いと言っています。(nvidiaバイアスがかかっている可能性有り)
これは、メリケンさんの手作業最適化が凄いのか、整数と倍精度で違うのか、その他の要因が有るのか、よく分かりません。
私は、メリケンさんが凄いのだろうと何となく思っています。

MTEのソース、早く読まないと。(涙)
728 ◆looser/TQF01 :2013/11/06(水) 11:12:17.21 ID:n71oooZt0
OpennCLにしろCUDAにしろハードを叩くソフトウェアレイヤーなわけで
徹底的に最適化すれば性能はハード依存になるのではないのかな?
メリケンさんがそこまで到達しているのでしょう

#AMD環境でのWin8.1で本気出さない問題はC1Eを有効にすることで最終的解決を見ました
これでOSに拠らずCPU側の省電力機能を使ってくれるようになります
729名無しさん@お腹いっぱい。:2013/11/07(木) 13:08:23.31 ID:YJnEIwoX0
Radeonと比べてTITANで遅いのは単に整数演算が遅いからでは無いでしょうか?
スループットの表なんかを見た感じではGeForceは整数が遅そうです
730 ◆Meriken//XXX :2013/11/07(木) 17:12:59.66 ID:zjlEilSBP
GCNなRadeonからはまだかなり搾り取れそうですけどね〜
今年いっぱいは本業が忙しいので、来年から本格的にGCNのアセンブラに取り組む
予定です。
731 ◆MOYASHI/Go :2013/11/07(木) 22:28:13.09 ID:ER578bpQ0
GCNな環境になったので動作報告を。

【診断の種類】検索速度(1パターン)
【Meriken's Tripcode Finderのバージョン】1.1 Free Edition Beta 2
【OS】Win7 Pro 64bit SP1
【CPU】Core i5 3570
【GPU】RADEON HD 7790(1030MHz動作)
【ディスプレイドライバ】Catalyst 13.9
【検索デバイス】GPUのみ

【トリップの種類】12桁
【キーに使用する文字】半角と全角
【検索パターン】 10文字完全前方一致1個

【1CUあたりのワークアイテムの数(OpenCL)】自動
【10分間のGPU検索の平均速度】 735.20M tripcode/s

【1CUあたりのワークアイテムの数(OpenCL)】5120
【10分間のGPU検索の平均速度】 1008.71M tripcode/s

【1CUあたりのワークアイテムの数(OpenCL)】10240
【10分間のGPU検索の平均速度】 1043.68M tripcode/s

【1CUあたりのワークアイテムの数(OpenCL)】20480
【10分間のGPU検索の平均速度】 1062.77M tripcode/s

【1CUあたりのワークアイテムの数(OpenCL)】32768
【10分間のGPU検索の平均速度】 1067.86M tripcode/s


1CUあたりのワークアイテムの数を極端に大きな数値にした方が
速度が出ます。うちのPC環境がなんか変なんだろうか?w
732 ◆MOYASHI/Go :2013/11/07(木) 22:31:09.64 ID:ER578bpQ0
続いて10桁トリップ検索です。
環境等は、>>731と同一です。

【トリップの種類】10桁
【キーに使用する文字】半角と全角
【検索パターン】 10文字完全前方一致1個

【1CUあたりのワークアイテムの数(OpenCL)】自動
【10分間のGPU検索の平均速度】 45.63M tripcode/s

【1CUあたりのワークアイテムの数(OpenCL)】512
【10分間のGPU検索の平均速度】 38.72M tripcode/s


こちらは自動が一番速いです。
(512に設定するとGUI周りが軽くなるので、通常はこちらを使用しています)

GCNだと10桁トリップ検索をできるのが(・∀・)イイ!!
733名無しさん@お腹いっぱい。:2013/11/07(木) 23:08:10.41 ID:Leg7ZRtL0
GCN大勝利!!!!!
734名無しさん@お腹いっぱい。:2013/11/07(木) 23:33:54.99 ID:lUZKM0CG0
うちのA6-1450も「初のクアッドコアSoC」とか初の「GCN搭載APU」なKabini/Temash世代なんだけど、
全部を1チップに収めるのには成功したけど、メモリ空間はまだCPUと内臓GPUで別々なせいか、
同じ10桁検索でもCPUと内臓GPUで別々のプログラムで探索させた方が速度が出るんだよね。
また、APU本体の消費電力が8WでもノートPC全体では22Wに増えてしまうのはワッパに対してどうなんだろうですが…

これが次のKaveri世代になるとバーチャルメモリ空間をCPUと内臓GPUで同じにするというらしい。
この辺の詳細は11月11-13日のAPUサミットで語られるというので楽しみですね。
ttp://developer.amd.com/apu/
製品自体は来年の2月頃との事ですので、安くてよさげなら買ってA6-1450と比べてみたいです。
ttp://northwood.blog60.fc2.com/blog-entry-7176.html
735SilentPC ◆SilentPCIePC :2013/11/07(木) 23:34:28.17 ID:lUZKM0CG0
あ、トリップ忘れてた…失礼。
736 ◆Meriken//XXX :2013/11/08(金) 05:45:30.14 ID:DagCrmWaP
>>731
>>732
7790は新しい世代のGCNなので違うのかもしれませんねえ。
「各種診断」の「デバイス診断」の結果を貼っていただけたら
次のバージョンでパラメータを調整しておきます。
737 ◆Meriken//XXX :2013/11/08(金) 06:00:59.34 ID:DagCrmWaP
>>732
7790でも結構速度が出ますねえ。これは290Xにはかなり期待できそうです。
738 ◆Meriken//XXX :2013/11/08(金) 06:05:34.31 ID:DagCrmWaP
>>734
ようやくAPUにもGCNが下りてきたんですね。

> メモリ空間はまだCPUと内臓GPUで別々なせいか、
> 同じ10桁検索でもCPUと内臓GPUで別々のプログラムで
> 探索させた方が速度が出るんだよね。

ちょっとこれは不思議ですね。CPU検索スレッドの数をめいっぱいあげれば
1つのプログラムで同じ速度が出るかもしれません。
739 ◆Meriken//XXX :2013/11/08(金) 06:14:28.32 ID:DagCrmWaP
朝起きたら新生検索君1号が止まってて再起動してもGPUを全部認識して
くれなくてかなり焦りました。が、片方の7990を無効にしたりして何回か
再起動を繰り返してたらもとに戻りました。

原因がはっきりしなかったので、とりあえず電圧を少し盛って1250mVに
しておきました。これでも問題が出るようならクロック周波数を落とす予定です。
やっぱり構成をいじると安定稼働させるのにかなり時間がかかりますねえ。
740SilentPC ◆SilentPCIePC :2013/11/08(金) 08:36:09.92 ID:rqYT14d/0
>>738
内臓GPUというのが関係しているのか解りませんが、A6-1450はOpenCLの設定の変化でCPUの速度までも変化するんですよ。
結果「GPUとCPU」で内臓GPUの性能を上げるとCPU性能が下がってしまい、CPUのみと変わらないスコアに…
だから個別のプログラムでCPU用の設定と、GPU用の設定を施すと両方の最大性能が引き出せるという…
良く解りませんねorz
741 ◆Meriken//XXX :2013/11/08(金) 08:47:25.35 ID:DagCrmWaP
うーん、また止まってしまった… やっぱり7990を1100MHzにしての常時稼動には
ちょっと無理があったみたいです。電圧を戻して1050MHzまで下げてみました。
今度はどうかな〜

>>740
スレ的にはこの手の実践的な知識を蓄積するのは大事ですね。
新生検索君1号も体を張って貢献してくれていますw
742 ◆RcPJ/cMKV. :2013/11/08(金) 09:10:19.89 ID:zjK4A53Q0
初心者ですが今、インストールしました。
使い方などを教えてくれませんか?
初歩的な質問ですみません
743 ◆Meriken//XXX :2013/11/08(金) 09:13:40.06 ID:DagCrmWaP
>>742
まずREADME.txtを読んで下さい。
744 ◆Meriken//XXX :2013/11/08(金) 09:16:39.94 ID:DagCrmWaP
うーん、まだ安定しないなあ。新しいドライバを試してみようかしらん。
745 ◆RcPJ/cMKV. :2013/11/08(金) 09:20:25.76 ID:zjK4A53Q0
>>743
解凍は出来ています。
色々検索したところ私の使っているPCはx32の為、開けないようです。
この場合、このソフトを使うのは無理なんですかね?
746 ◆Meriken//XXX :2013/11/08(金) 09:27:19.12 ID:DagCrmWaP
>>745
どんな環境で何をしたらどうなったかを具体的にお願いします。
ちゃんとREADME.txtに書かれている手順には従いましたか?
747 ◆RcPJ/cMKV. :2013/11/08(金) 09:31:34.66 ID:zjK4A53Q0
>>746
README.txtを調べたのですが解凍ソフトしか出てきません。。。
win7、x32で、ダウンロードしたMERIKEN's Tripcode Finderを開こうとした結果、x68かx84のどちらか確認のうえ開発者に問い合わせしてくださいと表示されました。
748 ◆looser/TQF01 :2013/11/08(金) 09:35:00.82 ID:XgjmkW8L0
>>747
README.txtというのは解凍して出来たフォルダの中に入っているものですよ
解凍出来ないということですか?
749 ◆RcPJ/cMKV. :2013/11/08(金) 09:42:33.05 ID:zjK4A53Q0
>>748
一般ブラウザで検索できるんですね
解決しましたありがとうございました。
750名無しさん@お腹いっぱい。:2013/11/08(金) 09:43:31.38 ID:d8EN2jde0
>>747
zip形式だから、Windows標準の方法で開けるはず(Vista以降とXPとで方法は違うが)
……ひょっとして今まで拡張子が「.exe」のソフト(インストーラ形式)しかダウンロードしたことがない?
751名無しさん@お腹いっぱい。:2013/11/08(金) 09:47:44.00 ID:d8EN2jde0
ああ、配布されてるMERIKEN's Tripcode Finderは拡張子が「.zip」、
要するにデータが圧縮されてるから、ファイル解凍ソフトを使えば解凍できるってことね。
(親切にもzip形式なら別途ソフトをダウンロードしなくてもExplorer付属のソフトで解凍できる)
XP:http://www.rescueme.jp/support/faq/00017.html
Vista以降:http://faq.epsondirect.co.jp/faq/edc/app/servlet/relatedqa?QID=010809
752 ◆looser/TQF01 :2013/11/08(金) 09:48:19.12 ID:XgjmkW8L0
よくわからないけど
ファイルを右クリックから展開ですよー
753 ◆Meriken//XXX :2013/11/08(金) 10:04:15.66 ID:DagCrmWaP
>>749
これはゆぐちゃんのことなんだろうか…
754 ◆Meriken//XXX :2013/11/08(金) 12:43:32.16 ID:DagCrmWaP
検索君が不安定になっていた原因が分かりました。
またPCIeの電源ケーブルが溶けていたという笑撃の結果でしたw
取りあえずケーブルを交換してGPUの電圧を下げて対処することにしました。
次からはまっさきに疑わないといけないですね。
水漏れの心配もあったので心臓に悪すぎでしたけど、
簡単に解決できる問題でよかったです。
755名無しさん@お腹いっぱい。:2013/11/08(金) 12:56:57.40 ID:rpWHUt0u0
電源ケーブルを溶かす程の圧倒的パワー恐るべし!
756 ◆looser/TQF01 :2013/11/08(金) 13:05:32.98 ID:XgjmkW8L0
>>754
ケーブルはPowerLimitを20%とかに上げているとヤバいです
私の経験上7970だと1.2Vを超えた辺りから過電流の危険、コネクタ溶けます
うちの7970はこんな感じに落ち着きました(各種ベンチが通る電圧)

http://uproda11.2ch-library.com/e/e00008027-1383883488.png
757 ◆Meriken//XXX :2013/11/08(金) 13:38:20.02 ID:DagCrmWaP
>>756
かなり盛ってますね〜
PowerLimitは0%だったんですが、7990の電圧がデフォルトで1200mVと高めに
設定してあったらしく、1100MHzで稼働させてたらやられてしまいました。
Afterburnerのバージョンを上げて電圧がいじれるようになったので、
1120mVに設定しておきました。消費電力はかなり下がったのでもう大丈夫でしょう。
758名無しさん@お腹いっぱい。:2013/11/08(金) 18:02:16.25 ID:5pmmGRD/0
MTF1.1FEβ2を使っています。
睡眠時に検索を停止するのを忘れ実行したまま
ハイバネートし、帰宅後PC立ち上げました。
するとMTFの検索時間が18時間となっておりハイバネートしていた時間も含まれていました。
累計時間はTMF上では1日12時間で
ユグドラシル上では21時間となっています。

おそらくですが開始時刻と現在時刻の差を
検索時間としているのではないかと考え
仕様かなとは思いますがお伝えします。
759 ◆MOYASHI/Go :2013/11/08(金) 20:29:06.64 ID:4ylI4JO60
>>736
すいません。デバイス診断というのが見当たらないのですが、検索デバイス一覧でしょうか?

OPENCL DEVICE
=============
Vendor: Advanced Micro Devices, Inc.
Name: Bonaire
Number of Compute Units: 14
Clock Frequency: 1030MHz
Global Memory Size: 1024M bytes
Max. Work Group Size: 256
Version: OpenCL 1.2 AMD-APP (1268.1)
Driver Version: 1268.1 (VM)

CPU
===
Processor Info: 0x0306a9
Number of Logical Cores: 4
Number of Search Threads: 2


あと、気になって過去ログを検索してみたのですが、7790の12桁トリップ検索(設定は自動)で
普通に速度が出ている方も居る様です。

【トリップ検索】MERIKEN's Tripcode Finder その3
http://anago.2ch.net/test/read.cgi/software/1362648003/774
760 ◆Meriken//XXX :2013/11/08(金) 22:52:34.61 ID:DagCrmWaP
>>758
たしかにこれはありますね。検索君は24時間稼働が基本なので全く気づきませんでしたw
次のバージョン(1.2)で修正できないか検討してみます。

>>759
それのことです。同じカードで違う結果が出ているのは不思議ですねえ。
CPU検索の有無が関係してるんでしょうか。
761 ◆MOYASHI/Go :2013/11/09(土) 00:53:12.59 ID:Hg8s+kEB0
>>760
CPUとGPUの同時検索を試してみましたが、GPU検索速度は同様でした。
あと、キーに使用する文字で”すべて”を試してみましたが、変化は有りませんでした。

なんか、こちらの固有の現象っぽい様な感じがw
762,,・´∀`・,,)っ-○○○<のたんぺおるんぺ?:2013/11/09(土) 22:08:57.02 ID:xOa414Ci0
SkyLake世代のAVX-512は楽しみですね。
SHA-1のアクセラレーション命令も別途載るので、どっちが速いのか
(あるいは併用できるのか)は興味が尽きません。
763 ◆Meriken//XXX :2013/11/10(日) 03:59:24.99 ID:QQ2EaO1lP
検索君の画面が映らなくなってかなりビビったのですが、
原因はディスプレイ用の変換アダプタの故障でした。
やれやれです。しかしこのPC、心臓に悪すぎるだろう…
764 ◆automatic. :2013/11/10(日) 04:02:43.66 ID:7vM2T/o7P BE:2380266274-S★(500000)
酷使しているといつ
765 ◆automatic. :2013/11/10(日) 04:04:10.47 ID:7vM2T/o7P BE:1275142853-S★(500000)
途中で送信してしまった…
酷使しているといつガタがきてもおかしくないですからね
何か起こるとヒヤッとします
766 ◆Meriken//XXX :2013/11/10(日) 04:18:19.29 ID:QQ2EaO1lP
ほんとにそうですよね〜
水冷化して保証が効かなくなったのでスリル満点ですw
767 ◆automatic. :2013/11/10(日) 04:52:01.34 ID:7vM2T/o7P BE:680076342-S★(500000)
水冷化して温度の問題が解決しても油断禁物ですね
768 ◆Meriken//XXX :2013/11/10(日) 05:00:14.20 ID:QQ2EaO1lP
>>762
AVX-512は本当にメインストリームに下りて来るんですかねえ。
まあでもyasmさえ対応してくれればMTFは拡張可能なようにしてありますけど…
769名無しさん@お腹いっぱい。:2013/11/10(日) 05:04:02.51 ID:Ao6tONujP
AVX-512ってまた浮動小数点演算だけ前回と同じテクニック(256ビットの整数パイプを使う)でできるようになって
AVX2みたいに次のマイクロアーキテクチャで整数もできるようになる
みたいな感じなのかな
770 ◆Meriken//XXX :2013/11/10(日) 05:06:14.49 ID:QQ2EaO1lP
>>767
まあかかってる負荷が滅茶苦茶ですからねえ。
以前ブログで7990x4を試してみたいなんて書いちゃいましたけど、
2枚だけでもえらいことです。
771 ◆Meriken//XXX :2013/11/10(日) 05:09:14.99 ID:QQ2EaO1lP
>>769
今回は出し惜しみは勘弁してほしいところですw
772 ◆Meriken//XXX :2013/11/10(日) 05:11:29.52 ID:QQ2EaO1lP
>>761
ドライバの違いかもしれないし、ちょっとよくわからないですねえ。
GCN2.0の環境も揃えたいところです。
773,,・´∀`・,,)っ-○○○<のたんぺおるんぺ?:2013/11/10(日) 09:38:13.07 ID:0eajDBSB0
>>768
AVX,AVX2だってメインストリームPC向けのほうがXeonDPより
1年先行してたし、XeonとCore*は共通設計なので、
意図的に無効にしない限りは使えるものかと。

SHA-1アクセラレーションサポートに至ってはARMv8でも
標準機能として組み込まれてますし。

>>769
319433-015.pdfの
> Figure 2-1. Procedural Flow of Application Detection of AVX-512
> Foundation Instructions
を見る限り特に整数用と浮動小数点用でフラグが分かれてるような
記載も無いので、

AVX512FのFってなんだって思ったけど、正式名称が「AVX-512 Foundation」なんです。
じゃあFoundation(基本)じゃないAVX-512って何なんだって思うわけだけど。。
(Knights CornerのSIMD命令は公式名称らしい名前がないけどあれがそれにあたるのかなと)
774,,・´∀`・,,)っ-○○○<のたんぺおるんぺ?:2013/11/10(日) 09:52:17.20 ID:0eajDBSB0
YASMはでかすぎてソース読んでないけどXbyak程度ならちょっと改造すれば
512対応できますよ。というかXeon Phiの命令セット仕様書読んで
なんとなく書きなぐったコードが手元にあったり。

C++で{}は演算子として使えないので()か[]で代用することになりますが・・・
775,,・´∀`・,,)っ-○○○<のたんぺおるんぺ?:2013/11/10(日) 10:53:58.88 ID:0eajDBSB0
ああそうだ。これを言わないと。

>>28
1〜5ラウンド目は初期値が定数なのでほんの少しショートカットできますよ。
というか、キーの変更方法をちょっと弄るだけでぶっちゃけ
10ラウンド目くらいまではショートカットできてしまいます。

DESクラックも実効10ラウンドまで削れるという論文が出てたけど
あれはStandard DESの場合で、16ラウンド×25の400ラウンドなので
せいぜい394ラウンドのショートカットになる程度です。
(salt処理を考慮すすと実際にはここまでは削れません)
776,,・´∀`・,,)っ-○○○<のたんぺおるんぺ?:2013/11/10(日) 11:57:47.74 ID:0eajDBSB0
あと今更だけどVecTripperのこれが気になりました。

> いまさらAVXに対応してみた (12桁のみ)
> 3オペランド化で余計なmovdqaを消して、VEXエンコーディングで命令長が
> 削れるものを削った程度なのですが、何故かSSE版と比べて25%ぐらい
> 高速です。16bytes/clkのフェッチ帯域がクリティカルだったのだろうか。

SSEのコードだとぱっと見2000命令軽く超えてるのでそれだけで
μOPs cache流しちゃってますね(AVX*でギリギリ?)
SHAコアのコードを分割して何十個か単位でまとめてループ処理させると
μOPs cacheの利用効率あがるんじゃないかと思ったり。


ああ、おいらはこっちには復帰しませんけどね
777 ◆Meriken//XXX :2013/11/10(日) 12:23:54.59 ID:QQ2EaO1lP
あ、2chに書き込めるようになったんですね。いらっしゃいませ〜

>>773
なるほどなるほど。しかしSHA-1専用命令ってそんなに効率がいいんですか。
f1, f2, f3やROTLを処理してくれるのかな? AVX-512より速いわけ無いと
思ってましたけど、興味が出てきました。
778,,・´∀`・,,)っ-○○○<のたんぺおるんぺ?:2013/11/10(日) 12:43:28.98 ID:0eajDBSB0
こんにちは。

SHA-1拡張は複数

16並列

> f1, f2, f3やROTLを処理してくれるのかな? AVX-512より速いわけ無いと
> 思ってましたけど、興味が出てきました。

SHA-1はAVX-512の命令セットマニュアルのChapter8に載ってますが
専用回路が載るっぽいですね。
SHA1RNDS*とSHA1NEXTEの組み合わせで各ラウンドを処理できるようになってます
理屈上160命令+α程度でSHA-1の80ラウンドを処理出来てしまいます。

AVX-512による16並列処理とどっちが速いかといえば、16並列のほうが
スループットは稼げる気はしますが
命令発行ポートの制約さえなければ両方を同時に動かすことだって
おそらく可能なわけで、割と気になる命令です。
779,,・´∀`・,,)っ-○○○<のたんぺおるんぺ?:2013/11/10(日) 12:44:06.08 ID:0eajDBSB0
上にノイズが載りましたが気にしないでください
780ののたん ◆KiwamonoL. :2013/11/10(日) 14:02:39.25 ID:me5+veG40
>>778
SHA-1専用回路なんだからきちんと全部計算するんだよな。
それだったらトリップ用に削りまくった自作処理のほうが高速かもよ。
インテルコンパイラのSHA-1関数とかそんなに速くなかったし。
781,,・´∀`・,,)っ-○○○<のたんぺおるんぺ?:2013/11/10(日) 14:39:08.22 ID:0eajDBSB0
俺の嫁ktkr

>SHA-1専用回路なんだからきちんと全部計算するんだよな。

いや、AESと同様に、各ラウンドを2命令でこなせる命令を追加するだけよ。
VIAのPadLockみたいなレジスタにセットして1命令発行したらハイ完了
みたいなインターフェースではない。
どのみちAESほどには並列化できるところがないからそれほど速くなんない
と思われ。

差分解読法はSSEだろうがAVXだろうがOpenCLだろうが使えるテクだけど。
前半を事前計算してキー変更の差分だけ計算するにしても、70ラウンド程度はかかるでしょ。
数学的にエレガントなショートカット方法があるなら俺も知りたい。
(どのみちSHA-3がアナウンスされてるご時勢にSHA-1はオワコンな気がするけど)

> インテルコンパイラのSHA-1関数とかそんなに速くなかったし。
ソフト処理じゃんあれ。
ハード超えられるわけが無いよ
782 ◆Meriken//XXX :2013/11/10(日) 15:36:48.45 ID:QQ2EaO1lP
>>774
XbyakのJITアセンブラのアプローチはなかなか面白そうですねえ。
これってMTFで使って効果あるものなのかしらん。
783 ◆Meriken//XXX :2013/11/10(日) 15:59:03.38 ID:QQ2EaO1lP
>>775
> 1〜5ラウンド目は初期値が定数なのでほんの少しショートカットできますよ。

ははあ、なるほどなるほど。ちょっとあとで計算してみます。
キーの生成方法はもうちょっと工夫できそうですねえ。
precomputed W[]もJens Steube氏のを借りるんじゃなくて
自分で計算したほうがいいみたいですね。
784 ◆Meriken//XXX :2013/11/10(日) 16:10:33.18 ID:QQ2EaO1lP
>>778
> 命令発行ポートの制約さえなければ両方を同時に動かすことだって
> おそらく可能なわけで、割と気になる命令です。

これが本当だとしたらおいしすぎです。
しかしなかなか面白い話が沢山ありますねえ。
まだ当分楽しめそうですねw
785ののたん ◆KiwamonoL. :2013/11/10(日) 17:11:14.38 ID:me5+veG40
>>781
>ソフト処理じゃんあれ。
速くなかった、ってのはそういう観点の問題じゃなくて。
インテルがてめぇで作った『高速ライブラリ』でさえ、トリップ用に削ったおれおれ関数よりも遅かったぜという自慢だ。w

むか〜し、ハード実装の某CPUがって話をしたことあるけど、あれとはかなり違うんだな。
786 ◆Meriken//XXX :2013/11/10(日) 17:40:16.45 ID:QQ2EaO1lP
>>785
Intelの開発者がSHA-1のルーチンのソースコードを公開してましたけど、
あれはあんまり速くなかったですね。まあ汎用のルーチンだから
しかたがないんですけど…
787 ◆Meriken//XXX :2013/11/10(日) 17:57:54.98 ID:QQ2EaO1lP
バターン一覧にないゴミトリップが大量にヒットするバグが発生。
一応ドライバのバージョンを落としてみたけど、
MTFのバグの可能性が高いので頭が痛いところです。
多分正規表現の展開の処理に問題があるんだろうけど…
同じ問題がでた方が見えたら是非報告をお願いします。
788名無しさん@お腹いっぱい。:2013/11/10(日) 18:21:31.12 ID:mpp3ebus0
まさかこの時期に正規表現のバグが出るとは……
789 ◆Meriken//XXX :2013/11/10(日) 18:59:58.24 ID:QQ2EaO1lP
まあ今まで見つからなかったごくまれにしかでないバグみたいだから、
再現できないようなら取りあえずそのままにしておいて、
次のバージョンで正規表現の処理を1から書きなおしてもいいぐらい
なんですけどね。でも実際ほうっておくのは気持ち悪いので
詳しく調べてみます。
790 ◆Meriken//XXX :2013/11/10(日) 20:24:26.56 ID:QQ2EaO1lP
取りあえず検索君のMTFを内部情報を保存する設定にしておきました。
これでバグについてもうちょっと分かるようになるでしょう。
791ののたん ◆KiwamonoL. :2013/11/10(日) 23:30:27.07 ID:me5+veG40
>>787
Radeon かな ?
待て屋の時にもごく希におかしなことになってたな。
多分ハードウェアの問題だろう。
792 ◆Meriken//XXX :2013/11/11(月) 03:51:48.66 ID:LzpKaJNtP
>>791
MTFはCPUでトリップの検算するようになっているのでRadeonのハードウェアの
問題だったらこうはならないはずなんですよね。いずれにせよ再現待ちですけどね。
793 ◆Meriken//XXX :2013/11/11(月) 05:08:26.38 ID:LzpKaJNtP
検索君がブルスクで落ちたのでGPUの電圧を1160mVまで引き上げました。
まあ1200mVでは過電流以外の問題は発生していなかったので、
少しづつ電圧を引き上げればいずれ安定するでしょう。
やっぱりこの速度で常時稼働させるのは楽ではないですねえ。
794 ◆Meriken//XXX :2013/11/11(月) 07:41:59.37 ID:LzpKaJNtP
>>791
まあでもビデオカードへの負荷が原因でその他のハードウェアが
不安定になってるということもありえるんですかねえ。
不思議なこともあるもんです。
795 ◆Meriken//XXX :2013/11/11(月) 19:46:02.31 ID:LzpKaJNtP
あれから検索君は安定して動作しています。
やっぱり>>787はハードウェアの問題だったのかなあ。
あと1週間ほど様子を見て問題ないようだったら
次の安定版を公開することにします。
796名無しさん@お腹いっぱい。:2013/11/11(月) 20:28:47.83 ID:L27l9vEt0
今は
>ドライバ パッケージのバージョン 12.104-130328a-155980C-ATI
>Catalyst? バージョン 13.4
>2D ドライバ バージョン 8.01.01.1295
>Direct3D バージョン 9.14.10.0969
>OpenGL バージョン 6.14.10.12217
これで動かしてますが、どれかをバージョンアップしたら速度も上がりますか?
797 ◆Meriken//XXX :2013/11/11(月) 20:41:39.04 ID:LzpKaJNtP
>>796
>Catalyst? バージョン 13.4

上がるとしたらこれですね。
実際に試してみないとわかりませんが…
798 ◆automatic. :2013/11/11(月) 20:47:14.00 ID:yZwIgwVqP BE:1700190645-S★(500000)
13.9や13.11betaに上げたら速度落ちました(白目)
前のバージョン番号を忘れたため仕方なくこのまま運用…
799名無しさん@お腹いっぱい。:2013/11/11(月) 21:07:54.14 ID:FuhquiTu0
どれかをバージョンアップというか
Catalyst 13.4の"ドライバパッケージバージョン"が"12.104-130328a-155980C-ATI"であって
Catalyst 13.4をインストールした時に実際にインストールされるドライバの各バージョンが
2Dドライバ: 8.01.01.1295 / Direct3D: 9.14.10.0969 / OpenGL: 6.14.10.12217 だから
Catalyst 13.4以外のバージョンをインストールすれば
ドライバパッケージ / 2Dドライバ / Direct3D / OpenGLの各バージョンは基本的に全て連動して変わる
(違うバージョンのCatalystに同じバージョンのドライバが含まれていることもある)

逆にどれかのバージョンだけを部分的に入れ替えるというのは
普通にCatalystをインストールしただけではできない
800SilentPC ◆SilentPCIePC :2013/11/11(月) 21:27:05.76 ID:0cNFjD9Z0
自分の場合はWindows8.1に13.11beta8にしたら性能が上がりましたね。
HD7850CFX定格で2000M届かなかったのが、今は超えてます。
801SilentPC ◆SilentPCIePC :2013/11/11(月) 21:33:01.15 ID:0cNFjD9Z0
AMDのGPUは一部他のベンチでもWindows8.1でスコアが結構伸びたという報告があるので、
OSがXPだったりWindows8の人はこの機会に8.1にしてみるのも良いかもしれません。
802 ◆Meriken//XXX :2013/11/12(火) 18:17:59.45 ID:sR8jo6mpP
またPCIeの電源ケーブルが溶けましたw
仕方がないのでGPUの設定を1100MHz、1160mVから
1080MHz、1120mVに落としました。
いくらなんでももう大丈夫だと思うけど…

予備のケーブルが無くなっちゃったので新しいのを
注文しなくちゃいけません。値段はおんなじだから
いっそマザボの色に合わせて赤いのにしようかなw
803SilentPC ◆SilentPCIePC :2013/11/12(火) 18:51:34.95 ID:143b6De20
>>802
う〜ん、全く想像のつかないハイエンドならではの問題だけど、そこまで頻発するのって電源に何らかの問題がありそうで怖い。
電源が壊れると他の機器を巻き込む可能性もあるから慎重になった方が良い気がする。
いっそこの機会に80PLUS PLATINUM認証電源に乗り換えることも検討されてみたらどうでしょうか?
ttp://www.links.co.jp/item/hcp-1000-platinum/
ttp://www.links.co.jp/item/epm1350ewt/
804名無しさん@お腹いっぱい。:2013/11/12(火) 18:53:35.96 ID:cmjKsW+B0
見ろ!ケーブルが蝋燭のようだ!
805名無しさん@お腹いっぱい。:2013/11/12(火) 18:54:17.07 ID:EN8Jig3N0
AMD APU向けにSDKやらライブラリがいろいろ出たらしい
806名無しさん@お腹いっぱい。:2013/11/12(火) 19:02:36.16 ID:oqK62XJ80
これですかね
developer.amd.com/community/blog/2013/11/11/check-out-amds-latest-heterogeneous-tools-sdks-and-accelerated-libraries/
807名無しさん@お腹いっぱい。:2013/11/12(火) 19:03:58.15 ID:4tkr464U0
電源ケーブルも冷やすようにしたらどうだw
808 ◆Meriken//XXX :2013/11/12(火) 19:16:06.74 ID:sR8jo6mpP
>>803
紹介していただいた電源はかなり魅力的なんですが、
電源ケーブルが溶けてるのは明らかにPCIeの規格の上限を超えた量の
電流が流れてるせいで、予想の範囲内なので大丈夫です。

だいたい7990はTDPが375Wということになってますけど、
新生検索君1号の場合は明らかに1枚あたり600W前後までいってます。
次のデュアルGPUカードでは電源コネクタを3つに増やしてほしいものです。
809名無しさん@お腹いっぱい。:2013/11/12(火) 19:27:54.97 ID:aAASyy0C0
より線は熱を持つと熔け易いね
810 ◆Meriken//XXX :2013/11/12(火) 19:48:51.84 ID:sR8jo6mpP
>>809
私の書き方がちょっと足りなかったんですが、溶けてるのは電源ケーブルのプラグの
プラスチックの部分です。GPUをOCするとこの部分がやられやすいんですよね。
811ののたん ◆KiwamonoL. :2013/11/12(火) 20:29:31.47 ID:C2Ma6+R50
>>810
プラグのとこの問題なら、メス側を締めて接点復活剤でも使えばいいんじゃね?
812 ◆looser/TQF01 :2013/11/12(火) 20:31:50.25 ID:bw1VkPwb0
どうもあのプラグは構造的に接触が甘いような気はする
813 ◆Meriken//XXX :2013/11/12(火) 20:40:23.30 ID:sR8jo6mpP
>>811
プラスチックが溶けてメス側の中に詰まっちゃってるのでちょっとそれは難しそうです。
まあ仕方ないですね。
814 ◆YSRKEN.ceVZZ :2013/11/12(火) 21:33:24.18 ID:sy08fRoA0
いっそ銀ロウか何かで固めようぜw
815 ◆Urotsuki/1Ca :2013/11/12(火) 22:13:15.46 ID:ob6SZ1MP0
ケーブルを冷却のために水の中に放り込むとか…
816名無しさん@お腹いっぱい。:2013/11/12(火) 22:38:37.26 ID:6P4yjBJP0
接触抵抗が大きくて溶けちゃってんだから、
いっそのことコネクタ付け替えちゃえば・・・・w
817 ◆Meriken//XXX :2013/11/13(水) 02:18:05.63 ID:6WDh0arJP
これ、空冷だとちゃんとファンの風がプラグとコネクタに当たるから
そこまで問題にならないんでしょうねえ。これ以上ケーブルを溶かすのも
馬鹿らしいからファンを取り付けてもいいんだけど、どうしようかなあ。
818名無しさん@お腹いっぱい。:2013/11/13(水) 02:33:25.11 ID:3/b+UoO70
いよいよ液体窒素での極冷化か
ドキドキ
819 ◆Meriken//XXX :2013/11/13(水) 17:13:41.40 ID:6WDh0arJP
>>816
ははあ、こういうことですか。こりゃ溶けるのも無理ないですね。
こればっかりは少しずつパラメータを変えて試してみるしかないのかな。

> コネクターの温度上昇は通過する電流値の2乗に比例します。
http://www.materion.jp/alloy/tech_lit/may01.pdf
820名無しさん@お腹いっぱい。:2013/11/13(水) 19:31:39.96 ID:hEwWidmR0
直結最高!
821名無しさん@お腹いっぱい。:2013/11/13(水) 19:34:56.66 ID:hEwWidmR0
ゆるいと熱を持ち

抵抗(線が挟まれる)などでも発熱。

ゆるいのは許せない。
822名無しさん@お腹いっぱい。:2013/11/13(水) 20:09:22.65 ID:4Q1rwY0m0
何か、物理法則って二乗に比例とか多いよな。
823 ◆YSRKEN.ceVZZ :2013/11/13(水) 20:33:38.14 ID:1zuFVsZH0
比例、二乗に比例、三乗に比例……四乗に比例(空洞放射、ねじれの力など)までは知ってる
824名無しさん@お腹いっぱい。:2013/11/14(木) 00:19:15.18 ID:+OiVXVfr0
人類って、両手の指が10本だから10進法を使ってるのか?
825 ◆Meriken//XXX :2013/11/14(木) 06:34:42.80 ID:ZV5OX6rCP
これ以上プラグを溶かすのも何なので、ファンをグラボの上に乗っけて
冷やすことにしました。これで安定して動いてくれればいいんですが…
826,,・´∀`・,,)っ-○○○<のたんぺおるんぺ?:2013/11/14(木) 11:05:01.65 ID:oXA6jW2E0
>>782
SHA1ではあんまりいじるところはなさそうだけど
たとえばDES版ならSaltを展開できてしまいますね。
逆にこれくらいしか使えませんが。
(各ループでLoadが24回減る程度なので、Loadユニットやコードサイズが
ネックになってない限りはそれほど有効性はないと思います)

あとパターンマッチで使うとか。
たとえばDESなら少ないマッチ文字数なら128/256並列でvpand/vpandnを
並べてvptestで比較とかやれば一気に削れます。

もちろんORでマッチさせたい文字列数が増えるとバラしてTrieで判定した
ほうが有利です。
(経験から言うとAho-Corasick法は初期化コストとかメモリ容量とかの問題で
あんまり実用的じゃない気がしました)

正規表現エンジンをx86ネイティブコード化するみたいなことを試みてる
人もいるので一定の有効性はあるかもしれません。
827 ◆Meriken//XXX :2013/11/14(木) 22:13:54.93 ID:ZV5OX6rCP
>>826
SHA-1とBitslice DESだとあまり恩恵がなさそうですねえ。
現在のMTFのマッチング処理はあまり効率が良くないので
ここらへんはもっと工夫してみたいところです。
二構とかの特殊トリップの検索速度が上がればなかなかおいしいですねえ。

そういえば◆znjnB.IJwZLUさんが>>171でJITコンパイラを作っていると
書いてましたね。私ももうちょっとスキルを上げてから挑戦してみたいです。
828名無しさん@お腹いっぱい。:2013/11/14(木) 23:11:28.14 ID:9Z0FzEVD0
>>825
無いよりはマシでしょうけど、コネクタの規格以上の大電流が流れている場合、
付け焼き刃になる可能性も。

こう言うのがあるから、低電圧・高電流回路は色々大変なのですよ。
根本的な解決は、やはりコネクタを変えるしか、無いんじゃないですかねぇ。
829,,・´∀`・,,)っ-○○○<のたんぺおるんぺ?:2013/11/15(金) 01:19:32.70 ID:x1FMpbsr0
PS4ってLinux入れられればそこそこ安いトリップ検索マシンになりそうな・・・
830 ◆Meriken//XXX :2013/11/15(金) 01:22:49.39 ID:jGPo4l/cP
>>828
> 付け焼き刃になる可能性も

そうだったみたいです。また溶けちゃいましたw
電源コネクタを付け替えるのは私にはちょっと荷が重いので、
クロック周波数を大幅に下げて運用することにします。
水冷化して熱の問題が無くなったと思ってたので思わぬ伏兵でしたね〜
やっぱりこういうことはやってみないとわからないですねえ。
831 ◆Meriken//XXX :2013/11/15(金) 01:28:39.89 ID:jGPo4l/cP
>>829
間違いないですね。入れて起動するだけで自動的にYggdrasilに接続して検索してくれる
ディスクなんてのも出来そうです。
832 ◆Meriken//XXX :2013/11/15(金) 01:36:27.49 ID:jGPo4l/cP
クロック周波数を落として消費電力が大分減ったので、
検索君1号にもう1枚シングルGPUのビデオカードを追加できそうです。
取りあえず追加のPCIeケーブルを入手して余っている7970を差す予定です。
833 ◆YSRKEN.ceVZZ :2013/11/15(金) 08:40:06.66 ID:dwtwRnp80
検索君1号にはもはや剣山の如くGPUが刺さっている……
これが華道(稼働)というものか
834SilentPC ◆SilentPCIePC :2013/11/15(金) 10:42:22.68 ID:AOge1kpR0
AMDのMantleに対抗してか、nVIDIAもCUDA6を発表してきましたね。
ttps://developer.nvidia.com/cuda-toolkit

また、AMDものFirePro S10000 12GBを発表。
ttp://www.techpowerup.com/194502/amd-announces-first-supercomputing-server-graphics-card-with-12-gb-memory.html

Merikenさん達開発者にとっては新しいソフトウェアは覚えるのが大変でしょうが、良い意味でAMDもnVIDIAも切磋琢磨して新しいものを創り上げてきてますね。
ハードウェア的にGPUコアを増やすのは消費電力の壁がどうしても突破できなさそうですが、ソフトウェア方面で処理速度を特定の環境に係らず劇的に改善して貰えるならこれ以上の事は無いですね。
835名無しさん@お腹いっぱい。:2013/11/15(金) 18:09:30.21 ID:5I+NKEPW0
ASUSの安いノートでK52Nトリプルコア使ってるんだけど
このノートってビデオカード無くてこのソフト使えないの?
836名無しさん@お腹いっぱい。:2013/11/15(金) 18:18:52.32 ID:QFsPP1Dl0
GPUが対応してなくてもCPU検索はできるだろ
837混沌 ◆Chaos/geeeIV :2013/11/15(金) 18:30:01.75 ID:Tf5GZgBg0
検索パターンの255文字制限を緩くするのは難しいでしょうか

(AAA|BBB|CCC|・・・以下略) の羅列を増やしていくとついつい長くなりがちで・・・^^;
838名無しさん@お腹いっぱい。:2013/11/15(金) 18:40:40.24 ID:5I+NKEPW0
「コンピューターにOpenCL.dllがないため、プログラムを開始できません。
この問題を解決するには、プログラムを再インストールしてみてください。」

って出て先に進めないよ。
839名無しさん@お腹いっぱい。:2013/11/15(金) 18:49:14.12 ID:vUKH+Uog0
>>838
これの ZIP の中に入ってると思うけど・・・
840名無しさん@お腹いっぱい。:2013/11/15(金) 18:59:29.84 ID:QFsPP1Dl0
>>838
.NET Framework 4やVC++2010ランタイムはインストールしたのか?
たしかそのエラーはVC++2010ランタイムをインストールせずに
GPU検索しようとした時に出たような気がする
841名無しさん@お腹いっぱい。:2013/11/15(金) 19:06:05.76 ID:5I+NKEPW0
このファイルを開けません
ファイル: OpenCL.dll

このファイルを開くには、そのためのプログラムが必要です。インターネットで自動的にプログラムを検索するか、
またはコンピューターにインストールされたプログラムの一覧から手動で選択してください。

動作を選択してください。
◎Webサービスを使用して正しいプログラムを探す(W)
〇インストールされたプログラムの一覧からプログラムを選択する(S)
[  OK  ] [ キャンセル ]


入ってるけどこんなメッセージが出て進まないよ
842名無しさん@お腹いっぱい。:2013/11/15(金) 19:31:21.43 ID:5I+NKEPW0
どうもENGINEの方を開こうとしてたのがダメだったみたい
Finderを開いたら上手くいった感じ

的外れな操作エラーだったのに親切なレスをいただいてありがとう
843名無しさん@お腹いっぱい。:2013/11/15(金) 22:43:45.87 ID:i9oSBBxC0
Win8 64bitでRadeon HD 7950の環境で、12桁版はGPUを利用して検索できていますが、
10桁版の検索を行おうとすると検索プロセスが異常終了してしまいます。

Visual C++ 2010の再頒布可能パッケージはx64版のみでx86版は入っていませんが、
x86版も必要であったりするのでしょうか?

ドライバはCatalyst 13.4ですが、これが悪かったりするのでしょうか?
844名無しさん@お腹いっぱい。:2013/11/16(土) 00:53:14.27 ID:pTB8KY4Y0
http://wccftech.com/amd-dual-gpu-hawaiixt-card-codenamed-vesuvius-coming-r9-290x-x2/#ixzz2kiwOHYlo
記録更新のための兵器が出るそうだよ
Radeon R9 290X X2だって
845名無しさん@お腹いっぱい。:2013/11/16(土) 01:23:30.29 ID:BvbFBe0I0
そう言えばR9 290X/290でのMTFの速度レポってまだ出てないんでしたっけ
今買ってる人達はみんなゲーム専用なのかな
846名無しさん@お腹いっぱい。:2013/11/16(土) 02:01:06.17 ID:6OM3vn1C0
そういえば、R9 290シリーズは倍精度の単精度比の性能が下げられているという話もありますが、
倍精度だけの変更なのか、それとも整数演算等にも影響があるのか気になります。
847 ◆Meriken//XXX :2013/11/16(土) 05:02:06.82 ID:zKj6f+rtP
>>843
恐らく問題はCatalyst 13.4でしょう。
新しいドライバをインストールすることをおすすめします。
848 ◆Meriken//XXX :2013/11/16(土) 05:03:24.91 ID:zKj6f+rtP
>>833
【審議中】
    ∧,,∧  ∧,,∧
 ∧ (´・ω・) (・ω・`) ∧∧
( ´・ω) U) ( つと ノ(ω・` )
| U (  ´・) (・`  ) と ノ
 u-u (l    ) (   ノu-u
     `u-u'. `u-u'
849 ◆Meriken//XXX :2013/11/16(土) 05:11:13.45 ID:zKj6f+rtP
>>834
CUDA6でMTFの速度が落ちたりしないといいんですけどねえ。
MantleはGPGPUでも使えるみたいなので超楽しみです。
850 ◆Meriken//XXX :2013/11/16(土) 05:16:12.10 ID:zKj6f+rtP
>>837
多分すぐに出来るはずです。バージョン1.2で修正します。
851混沌 ◆Chaos/geeeIV :2013/11/16(土) 07:54:09.19 ID:Dn7va3Vn0
>>850
ありがとうです
852 ◆Meriken//XXX :2013/11/16(土) 10:08:31.38 ID:zKj6f+rtP
ラジエーターの入り口と出口に温度計をつけたら
室温が29℃で水温は45℃と43℃でした。
現在のシステム全体の消費電力は1100Wぐらいです。
まだもうちょっと余裕がありそうです。

>>844
290X X2が発売されたら1枚足して低電圧・低クロックで
高ワットパフォーマンスを追求してみるのも面白いかもしれませんね。
電源を1500Wのものに替えれば大幅な記録の更新が期待できそうです。
まあでもそんなお金はどこにもないので当分先の話ですけどねw
853,,・´∀`・,,)っ-○○○<のたんぺおるんぺ?:2013/11/16(土) 10:35:51.55 ID:vjMZgOPS0
CUDAはしばらく離れてたけどうちも久しぶりに触ってみようかしら・・・
CUDA6のメモリ空間共有はたぶん来年のTegra5を睨んだものだと思いますが
デバイスメモリのコピーをホスト側空間にマッピングして更にそれを
ノンテンポラルロードで一気に読んで・・・とかの部分が割りと面倒だったので
そのへんが楽になってるといいですね。

個人的にはBroadwellも気になるところです(デスクトップ向けには当分でない見込みですが)
http://semiaccurate.com/forums/showpost.php?p=195107&postcount=25
eDRAMのサイズはHaswellに比べて大きくはなってないけど小さくもなってないので
それほどコストが下がってない可能性もあります。
ただノートクラスでGPGPUやるには十分すぎる性能を持ってるので(ゲームでは低評価ですが)
使いこなしてみたいですねえ。
854SilentPC ◆SilentPCIePC :2013/11/16(土) 10:41:39.36 ID:q+B4dVJA0
>>852
>ラジエーターの入り口と出口に温度計をつけたら
>室温が29℃で水温は45℃と43℃でした。

水冷って詳しくないのですが、そんなもんなんですかね?
消費電力1100Wのシステムを通過して帰ってきた水温が+2℃、9個のファンで冷やした結果が-2℃で安定って事ですよね?
大量の水が本来一か所に留まると100℃を軽く超える熱量を、存分に吸収し均一化させているって感じなのかな?
ラジエーターだけじゃなく経路のチューブからも自然放熱があると思うので、基本45℃のちょい熱めのお風呂が部屋に付いているだけなイメージ?
理論上は流れる水量を倍に増やすと、室温と水温の間の37℃ぐらいまで下がるのかな?更に倍で33℃?
モーターもそれなりに強力な奴に付け替えることになりそうだけど、巨大水槽を設置したら見た目的にも温度的にも色々楽しめそうな気がしますね。
855名無しさん@お腹いっぱい。:2013/11/16(土) 11:26:55.31 ID:mqtYvs580
22 :名無しさん? [↓] :2013/11/16(土) 10:10:59.17 ID:???
アークで7990が69800だったから衝動買いしてしまった……
電源も買い換えなきゃ足らないな おねがいカード払い
856名無しさん@お腹いっぱい。:2013/11/16(土) 13:16:32.19 ID:6OM3vn1C0
>>847
ドライバの問題ですか。
現在の推奨バージョンは13.9でしょうか?

メインの作業用とは別にもう1台マシンが欲しくなってきます・・・

>>849
Mantleはグラフィック用のAPIだと思っていましたが、hQなども含まれているのでしょうか?
Radeonの人気が上がるのはうれしいですが、争奪戦や実売価格の高止まりが不安ですw
857 ◆Meriken//XXX :2013/11/16(土) 19:29:29.59 ID:zKj6f+rtP
>>854
ループ内の熱は拡散するので、水温の場所による変化はそれほどないはずです。
ポンプはACアダプタ(12V 2A)につなげて使えるものの中では最も強力なのを
使っています。ΔT(水温と室温の差)を下げるには結局ループ内の熱を
逃さなきゃならないので、ファンを交換・追加するかラジエーターを追加するしか
ないでしょうねえ。でもGPUだけならあと300Wぐらいなら十分許容範囲内でしょう。
858SilentPC ◆SilentPCIePC :2013/11/16(土) 20:36:47.52 ID:xobAUtET0
>>857
ふむふむ。
水槽(リザーバー)が大きいと見た目は楽しいけど、放熱を考えるならラジエーターの大型化が良いのかなるほど…
普通の大型観賞用水槽に上手い事ラジエーターをオブジェとして沈められると一石二鳥になれないかな?
部屋の湿度管理も必要になっちゃうか?
859名無しさん@お腹いっぱい。:2013/11/16(土) 23:15:39.80 ID:pTB8KY4Y0
梅雨の時に大型ラジエーター冷やしすぎて結露したことあるので
冷やし過ぎもご注意
860 ◆Meriken//XXX :2013/11/17(日) 07:51:04.44 ID:psfjJrseP
>>853
こうやって少しずつGPUとCPUの融合が進んでいくんでしょうねえ。
GPGPUも早くメインストリームに取り込まれるといいですねえ。
私は新しいCUDAのほうにはなかなか手とお金が回らないので、
またぜひ美味しい話を聞かせて下さいw
861 ◆Meriken//XXX :2013/11/17(日) 08:00:57.60 ID:psfjJrseP
>>858
そうすると今度は水槽内に熱が溜まっちゃいますからね〜
部屋の温度管理のために二連の換気扇を窓に取り付けてますけど、
部屋全体の消費電力が2000Wを超えているのでなかなか厳しいところです。

>>859
結露は怖いですねえ。私の部屋の湿度は15%なのでまず大丈夫だとは思いますが…
862SilentPC ◆SilentPCIePC :2013/11/17(日) 08:16:34.66 ID:e+g9jXUI0
>>861
>湿度は15%

日本とは全く気候が違いますね…びっくりです。
湿度は40%以上は無いと乾燥し過ぎで風邪ウイルスの発生や機械の大敵な静電気が発生しやすいそうなのでお気を付けください。
そちらの気候だと結露の心配は全くなく、むしろ加湿器でも用意してガンガン湿度を上げないと逆に問題が発生し易そうですね。
863 ◆Meriken//XXX :2013/11/17(日) 14:02:13.32 ID:psfjJrseP
>>862
いえ、湿度が低いのは私の部屋だけですw 湿度計が壊れてるのかな…
864名無しさん@お腹いっぱい。:2013/11/17(日) 17:48:43.76 ID:yuhOQ03Q0
10桁の10完と12桁の10文字一致って、同じ確率なのでしょうか?
本当は12完が欲しいけど、絶対無理なので10文字としても、
12桁だと後ろ2文字がいい感じになる事はまずないし。
865名無しさん@お腹いっぱい。:2013/11/17(日) 18:10:14.11 ID:SZzBIlND0
>>864
暗号化や暗号用ハッシュの出力は一様ランダムが期待できて、同じ条件で検索するなら出現確率は同じになる。
で、12桁の前10文字と10桁では10桁の最終桁の情報量が少ない分10桁の方が最終桁の分ヒット率が高い…はず。

しかしそもそも計算速度が違うので、ヒット率よりもヒット率×検索速度で考えたほうが良い
866混沌 ◆VVvVVVVvvvw. :2013/11/17(日) 18:41:34.36 ID:lhspUXBh0
>>864
確率・・・、とはちょっと違うお話ですが
10桁では最後の1文字は16種類【.26AEIMQUYcgkosw】の文字しかないので
10桁10完トリップは16種類しかない(トリップキーがいくつあるのかは別)
12桁トリップでは1文字目から10文字目までa-zA-Z0-9./の64文字使えるので64種類
大文字小文字が混ざっていてもいいのなら相当パターン数は増えますが(アルファベットの10連が使えるアルファベットの種類数*2^10)
10連に使えるアルファベット種類が4倍ある点は変わらないので4倍近いパターン数があるのは変わりないですね
ただし、計算に要する時間は12桁トリップのほうが短いので検索速度は12桁のほうが相当早いです 環境次第でしょうが20倍くらい違うのかな


MTFの無料版では大文字小文字混ざりの10桁準10連、大文字小文字が揃っての10桁純9連と
12桁準12連、純11連はシステムに召し上げられてユーザは取得できません
なのでそれを見つけたいならMTFを購入しましょう

無料版では上記の制限がありますが、見た目がそれに近いものなら
正規表現を使ったりすることで色々方法がありますよ
末尾や先頭に見た目がほとんど気にならない「.」にしたり
0(ゼロ)とO(アルファベットのオー)を混ぜてみたり

この私のトリップも見方によってはVの12連っぽく見えますしw
867 ◆NnnnnNnNNNmN :2013/11/17(日) 21:34:04.64 ID:Q0xpV7LV0
これも準連もどきの仲間に入りますかね?
868SilentPC ◆SilentPCIePC :2013/11/17(日) 22:27:39.57 ID:e+g9jXUI0
>>867
おお〜何か間違え探しみたいで面白いね。
でも一回そういうの見つけて使い始めちゃうと、より良いものが見つかってもオークション用に取ってべきか今のから乗り換えるか迷っちゃうねw
869累計 ◆wop.8OO8.qow :2013/11/17(日) 23:32:19.21 ID:3w+aiUKW0
買い物中に「あっ!!」と思って、撮ったんよw
http://i.imgur.com/Njfw4dc.jpg
870混沌 ◆WwwMVMVvVw :2013/11/18(月) 04:38:32.56 ID:ijVsNhCR0
>>868
>オークション用

ユグは先頭完全一致のパターンしか登録できないので
ユグでこういうのを見つけるのはちょっと難しいと思うw
ユグで見つけないとオクに出せるようになるかどうかわからないし難しいんじゃないかな

自分も色んなパターンローカルで登録して変なのをたくさん記録しているけど
自分で使ったことがあるものと無いものの区別があやふやになってきちゃいますw

>>869
www
871 ◆Meriken//XXX :2013/11/18(月) 05:34:59.08 ID:L7zo04uwP
>>862
湿度計はちゃんと動いていたようです。私の部屋だけ湿度が低いのは謎ですねえ。
872 ◆Meriken//XXX :2013/11/18(月) 07:32:24.99 ID:L7zo04uwP
>>869
う〜ん、この既視感はいったいなんだろうw
873 ◆Meriken//XXX :2013/11/18(月) 07:48:58.99 ID:L7zo04uwP
新生検索君1号は10.1G TPSで絶賛安定稼働中です。
GPUの電圧を1100mVまで下げているのでまず大丈夫でしょう。
安定稼働させるまで2週間かかったけど、これで一安心です。

あ、あと>>787の症状はやっぱりハードウェアが不安定だったのが
原因のようで、あれから1度も再現されていません。
というわけでそろそろ次の安定版と有料版を用意することにします。
874混沌 ◆Chaos/geeeIV :2013/11/18(月) 07:59:37.79 ID:ijVsNhCR0
湿度が低すぎると静電気がおきやすかったり
住まいなどは木材のひび割れがおきやすかったりするそうですね
GPUの上にやかんを置いてお湯を沸かしてみるってのはどうでしょうか・・・w

>私の部屋だけ
大量に結露するような何かが部屋に設置してあるとかですかねぇ
875SilentPC ◆SilentPCIePC :2013/11/18(月) 21:04:56.57 ID:HkfttU4l0
>>871
今の外の気温で他のお部屋の湿度はどのぐらいなんでしょうか?
PCの熱は石油ヒーターと違って石油を燃やして水蒸気を発せなせない、電気ヒーターに分類されると思うので、
24時間常時電気ヒーターを使っている状態のMerikenさんの部屋の湿度が他の部屋より低いのは当然だと思います。
加湿器を使わなくとも、洗濯物を室内干しすると良く乾くし湿度も上がるし良いかもしれません。
876 ◆Meriken//XXX :2013/11/19(火) 05:29:32.77 ID:st0Kx+iiP
電気ヒーターに例えると分かりやすいですねw
他の部屋で測ったら46%でした。洗濯はアメリカだと
みんな乾燥機を使ってるんです。
まあしょうがないですねえ。
877 ◆looser/TQF01 :2013/11/19(火) 11:27:38.08 ID:aKPH3kJ00
電源がへたってきて負荷を掛けていなくても謎の再起動などが起こるようになったということで
紹介されていたENERMAXの電源を導入してみました
この電源、保護回路が付いていて過電流だとシャットダウンするんですね
やはり無理させていたようで少しクロックと電圧を下げました
これでコネクタが溶けたり電源が火を噴くなどの不安からは解放されました
878 ◆Meriken//XXX :2013/11/20(水) 06:39:08.60 ID:BLTqITmCP
>>877
お疲れ様です。このような実際に使用してみた上での報告は参考になりますね。
私ももうちょっと容量の大きい電源に変えたいところです。
変えるとしたらR9 290X X2が出るタイミングですかねえ。
879 ◆Meriken//XXX :2013/11/21(木) 09:30:39.63 ID:GIM/Kg47P
新生検索君1号ですが、やっぱりまだ微妙に不安定で2、3日に1回ぐらいの
頻度で止まります。電圧を下げてるせいなんでしょうけど、上げると
またケーブルが溶けかねないので難しいところです。

7990はデフォルトの電圧が1200mVとかなり高めだったり、
冷却ファンの性能がいまいちだったりと、あまりGPGPUに向いている造りでは
ないようです。まあ完全に想定外の使い方をしているので当然なのですが…
電源ケーブルが届いたら7970を追加して7990のクロック周波数をちょっと
下げてみます。
880 ◆Meriken//XXX :2013/11/23(土) 16:30:11.40 ID:XRLKrmSsP
電源ケーブルが届いたので検索君に7970を追加しました。
取りあえず12G TPSで安定動作するように調整中。
881 ◆QZschizo.ptH :2013/11/25(月) 19:36:37.17 ID:mA/n7hkr0
5970 1台が壊れてしまった(; ;) ので,C2070 を指しています.

ところが,
1.0 FE β1 までは cuda/radeon 混在でも cuda device を認識しますが,
1.1 FE α1 からは cuda/radeon 混在では cuda device を認識しません.

詳細設定の「使用するGPU」ドロップダウンリストでも,各種診断→検索デバイス一覧でも同じ結果です.
以上報告まで
882 ◆Meriken//XXX :2013/11/25(月) 19:37:39.16 ID:Iy5uf9plP
検索君は未だ微調整中。構成を変えると安定させるための
条件も変わってくるのでなかなか難しい…
まあクロック周波数を下げれば簡単なんですけど、
なんとか12G TPSは維持したいところです。
883 ◆Meriken//XXX :2013/11/25(月) 19:44:13.00 ID:Iy5uf9plP
>>881
ご愁傷さまです… よく働いてくれましたからねえ。(-人-) ナムナム

> 1.1 FE α1 からは cuda/radeon 混在では cuda device を認識しません.

恐らく開発環境をCUDA 4.0からCUDA 5.5に変えたせいでしょう。
思った以上に影響がありますね。安定版ではCUDA 4.0でビルドしたEngineも
おまけで付けようかしらん。
884 ◆Meriken//XXX :2013/11/25(月) 20:18:02.24 ID:Iy5uf9plP
やっぱりおまけで付けるのは面倒くさすぎる…
バージョン1.0.1を残す方向で調整しようっと。
885 ◆QZschizo.ptH :2013/11/25(月) 23:18:20.20 ID:mA/n7hkr0
>>884
I see...
886 ◆Meriken//XXX :2013/11/25(月) 23:27:12.11 ID:Iy5uf9plP
>>885
メールを頂ければバージョン1.1をCUDA 4.0でビルドしたバイナリを
送りますよ。パッケージに含めるのは手間がかかり過ぎるのです。
887 ◆Meriken//XXX :2013/11/25(月) 23:28:28.02 ID:Iy5uf9plP
新しい安定版をうpしました。

Meriken's Tripcode Finder 1.1 Free Edition
http://www.meriken2ch.com/programming/merikens-tripcode-finder

バージョン1.0.1 FEからの主な変更点は以下の通りです。

・GCN搭載のAMD Radeon HDシリーズのビデオカードでの10桁トリップ検索に対応。
・AVX/AVX2対応によるCPU検索の大幅な高速化。
・CPU検索の高速化。
・開発環境のCUDA 5.5への変更。
・CUDA用のsm_30とsm_35のバイナリの添付。
・全角文字をキーに使用したときのヒット率の向上。
・キーに使用する文字の種類の追加。
888 ◆QZschizo.ptH :2013/11/25(月) 23:42:36.02 ID:mA/n7hkr0
>>886
ああ,いえいえ,お気になさなないでください
open-cl/cuda のテキストをkindleに落としたところです
889 ◆Meriken//XXX :2013/11/26(火) 05:19:05.59 ID:FtP/M8LjP
>>888
了解しました。GPGPUは面白いですよ〜 摩訶不思議な世界ですw
890名無しさん@お腹いっぱい。:2013/11/26(火) 07:10:32.77 ID:MMoXICC80
C2070ってTeslaって奴ですか?
たしかTITANとかがかわいく思えるくらいものすごくお値段高かったような…
このスレは本当にすごいハード使ってる人多いですねー
みなさんがんばって下さい!(他力本願)
891 ◆Meriken//XXX :2013/11/26(火) 12:04:13.81 ID:FtP/M8LjP
7990の電圧が勝手にデフォルトにリセットされてしまう問題が発生したのですが、
Afterburnerのオプションで"Disable ULPS"をチェックすることで
解決出来ました。本当にいろいろありますね〜
892SilentPC ◆SilentPCIePC :2013/11/26(火) 19:54:10.34 ID:HbQZBTKV0
>>887
安定板UPお疲れ様です。
有料版の方のUPもお待ちしています。
寄付もかねて二つは買おうと思っていますが、アカウント毎とかPC単位とか有料版に使用制限はありますか?
893 ◆Meriken//XXX :2013/11/26(火) 20:05:05.07 ID:FtP/M8LjP
ありがとうございます。購入者本人が使用する限り特に使用制限は
ありません。
894 ◆Meriken//XXX :2013/11/26(火) 20:13:44.09 ID:FtP/M8LjP
う〜ん、検索君がすごい見た目になってしまった…

http://www.meriken2ch.com/files/2013-11-26-Kensakukun.jpg
895SilentPC ◆SilentPCIePC :2013/11/26(火) 20:25:09.18 ID:HbQZBTKV0
>>893
どもです。
AVX2とGCN対応もあるので、私のアカウントのものは全部有料版に移行しますかね。

>>894
5GPUや水冷システムよりも目立っちゃってますねw
896 ◆YSRKEN.ceVZZ :2013/11/26(火) 21:10:33.75 ID:mnJTxThI0
>>894
中央の物凄く長い赤ケーブルは一体……
897 ◆Meriken//XXX :2013/11/26(火) 21:17:00.66 ID:FtP/M8LjP
>>896
それはPCIeの電源ケーブルです。
898名無しさん@お腹いっぱい。:2013/11/26(火) 22:27:32.04 ID:c8YEnWECP
なんというか機能美を感じます
899名無しさん@お腹いっぱい。:2013/11/26(火) 22:44:26.33 ID:szeizD270
で、どの線を切ったら時限爆弾のタイマーが止まるんです?w
900名無しさん@お腹いっぱい。:2013/11/26(火) 23:05:20.71 ID:30sMJI620
>>899
赤いコードの左から○○本目と右から△本目、××本目を同時にだ・・・・・・
間違えるなよ・・・・・・
901 ◆Meriken//XXX :2013/11/26(火) 23:40:11.03 ID:FtP/M8LjP
新しい有料版をうpしました。

Meriken's Tripcode Finder 1.1
http://www.meriken2ch.com/programming/merikens-tripcode-finder

バージョン1.0.1からの主な変更点は以下の通りです。

・GCN搭載のAMD Radeon HDシリーズのビデオカードでの
 10桁トリップ検索に対応。
・AVX/AVX2対応によるCPU検索の大幅な高速化。
・CPU検索の高速化。
・開発環境のCUDA 5.5への変更とCUDA用のsm_30とsm_35のバイナリの添付。
・全角文字をキーに使用したときのヒット率の向上。
・キーに使用する文字の種類の追加。

今後の開発のためにもぜひご購入をお願いします。
902 ◆Meriken//XXX :2013/11/26(火) 23:55:10.49 ID:FtP/M8LjP
>>892
ページの更新中にメールが届いてびっくりしましたw
実に助かりますです。
903 ◆automatic. :2013/11/27(水) 21:27:50.61 ID:ePnMWJu4P BE:680076342-S★(500000)
さすがに古いGPUは10桁で速度が出ませんでした。

【診断の種類】検索速度(1パターン)
【Meriken's Tripcode Engineのバージョン】1.1
【OS】Windows 7 Home Premium 64bit SP1
【ディスプレイドライバ】Catalyst 13.9

【検索デバイス】GPUのみ
【使用するGPU】すべて使用
【GPU0】Radeon HD 5870 (850MHz)
【GPU1】Radeon HD 5870 (875MHz)
【CPU】Core i7-2600K

【1CUあたりのワークアイテムの数(OpenCL)】自動
【1WGあたりのワークアイテムの数(OpenCL)】自動
【1GPUあたりの検索プロセスの数(OpenCL)】1
【1検索プロセスあたりの検索スレッドの数(OpenCL)】2
【検索プロセスの優先度】通常以下
【GUIフロントエンドの優先度】通常

【トリップの種類】10桁
【キーに使用する文字】半角と全角
【検索パターン】 10文字完全前方一致1個

【10分間のGPU検索の平均速度】 4.88M tripcode/s
904SilentPC ◆SilentPCIePC :2013/11/27(水) 21:51:56.86 ID:wGBfjqhI0
>>903
世代の違いでここまで違うものなのかな?
何か納得いかないけど、そういうものなのか…

ハワイベースのデュアルGPUグラフィックスカードコードネーム ”ベスビオ”
ttp://www.techpowerup.com/195038/hawaii-based-dual-gpu-graphics-card-codenamed-vesuvius.html
消費電力の関係で純粋にR9 290Xを2GPUという事には成らないらしい?
Merikenさんが実際HD7990で苦労してますからね。
でもこれで8GPU環境とか組めれば恐ろしい性能を発揮しそうな予感がしますね。
905 ◆Meriken//XXX :2013/11/27(水) 22:13:20.54 ID:RlYzL2X+P
>>904
>>905
5870のアーキテクチャはVLIW5でGCNとは完全に別物ですからねえ。
mtyの使ってた古いドライバのAPIはとっくに無くなってるし、
やむなしといったところです。
906名無しさん@お腹いっぱい。:2013/11/28(木) 00:57:32.03 ID:pEABngLM0
非GCNのHD6***以前のRadeonを10桁検索で活用しようとしたら
今のところmty_calを使うしかないですね
907名無しさん@お腹いっぱい。:2013/11/28(木) 01:11:41.94 ID:Q8zBM2kl0
HD3xxx/HD2xxx系でもmty_calは動くから古い環境でも意外と重宝するかもな
まあ手元のHD3870X2 CFX (4GPU)でもかなり遅かった気がするけど…
908 ◆YSRKEN.ceVZZ :2013/11/28(木) 01:19:26.96 ID:0ska3AwR0
>>905-907
でも、そもそもグラボのドライバが新しい奴だと対応してないから探す必要が……
http://yy43.60.kg/test/read.cgi/tripageruo/1274911652/368-370
909 ◆Meriken//XXX :2013/11/28(木) 01:55:30.48 ID:gvYc/g6JP
>>904
290Xの消費電力自体は7970とそれほど変わらないらしいので、
Vesuviusは7990と同じように電圧を上げてニコイチにするんじゃないでしょうか。
でもこれだと電圧をいじれないと水冷でも危なくてGPGPUでは使えないですねえ。

あと8GPUで本来の性能を出そうとおもったら、電源が必ず2つ必要になるので
難易度は更に上がります。いつか挑戦してみたいけど、当分先の話ですね。
910名無しさん@お腹いっぱい。:2013/11/28(木) 13:02:20.52 ID:mDq8NDMU0
次はいよいよコンセントが悲鳴上げそうだ・・・w
911名無しさん@お腹いっぱい。:2013/11/28(木) 16:36:07.62 ID:F6XPT2o/0
次はいよいよ財布の中身が・・・
912 ◆Meriken//XXX :2013/11/28(木) 16:50:16.41 ID:gvYc/g6JP
財布はすでにすっからかんです。皆さんMTFを買ってやって下さいw
913 ◆Meriken//XXX :2013/11/29(金) 10:38:09.82 ID:xW68R27zP
この電源、1500Wで+12Vを単一レールに出来るらしいです。
次に買うならこれだな。

EVGA SuperNOVA NEX 1500
http://www.newegg.com/Product/Product.aspx?Item=N82E16817438009
914SilentPC ◆SilentPCIePC :2013/11/29(金) 20:48:50.43 ID:tMzlMgpv0
>>913
値段的には魅力的だけど、個人的にもしMerikenさんのような構成をするとしたら、
以前おすすめした「HCP-1000 Platinum」2台構成の方が安定しそうな気がするんですけどね。
ttp://www.links.co.jp/item/hcp-1000-platinum/
ttp://www.gdm.or.jp/review/2013/0330/24498
電源ユニット連結機能「OC Link」で、2つの電源ユニットを合計した大出力を供給できるとの事です。
1本@12V*40A=480Wの構成だし、未発売の1300Wモデルが出たら最大2600W、+12V出力217A。
高いのが難点ですが、80PLUS PLATINUM認証で電力効率が良い点も、
長い目で見たら電気代という形で還って来てくれそうな気もします。

まあ実際に買う時には、これらよりもずっと良い電源が新発売されているかもしれませんけどね。
915 ◆Meriken//XXX :2013/11/30(土) 07:23:02.96 ID:/wSt6OLsP
>>914
HCP-1300 Platinumはアメリカでは販売されてますよ。
https://www.google.com/shopping/product/1869200640867818718
ただこのシリーズの電源を2つ揃えると、ケースも買い換えなきゃいけないので
やっぱり値段的にちょっと厳しいです。8GPU構成に挑戦するときまでおあずけですね。
916 ◆Meriken//XXX :2013/11/30(土) 07:31:46.79 ID:/wSt6OLsP
塩漬け君の電源(Corsair HX850)が逝ってしまった模様です。
AX1200に比べてやわすぎだろう… 来月には日本に規制するので
復旧は当分先になりそうです。
917名無しさん@お腹いっぱい。:2013/11/30(土) 09:19:10.54 ID:k65879WV0
逝ってしまったわ……電源の理に導かれて
918 ◆Meriken//XXX :2013/11/30(土) 18:23:59.02 ID:/wSt6OLsP
電源が原因で起動できなくなっていた塩漬け君ですが、
なぜか1日放っておいたら何事もなかったかのようにまた動き始めましたw
やっぱりたまには電源を切って休ませたほうがいいみたいですねえ。
919 ◆Meriken//XXX :2013/11/30(土) 19:10:17.29 ID:/wSt6OLsP
あれから30分ほど動かしたらまた止まってしまいました。
しょうがないのでやっぱりPSUを修理に出すことにします。
920SilentPC ◆SilentPCIePC :2013/12/01(日) 21:40:39.77 ID:KGcsbOPn0
>>919
ご愁傷様ですが、保証期間内だったのは幸いでしたね。
所でAmazonでの買い物はサイトに従い利用させてもらっていますが、表示される広告クリックやそこから買い物もそれなりに還元はあるのでしょうか?
しっかり自分が見たことのあるサイトの広告が表示される辺り、広告会社に個人情報収集されぐわいが認識出来て便利なのやら怖いのやら…
google本当にその辺の情報収集・解析能力凄いですよね…
921 ◆Meriken//XXX :2013/12/02(月) 05:15:33.67 ID:5xJm/IC8P
>>920
塩漬け君はあれから色々いじったら直ってしまいましたw 不思議なものです。

> 所でAmazonでの買い物はサイトに従い利用させてもらっていますが

ありがとうございます。詳しいことはかけませんが、ゆぐちゃんの広告はクリック毎に
報酬が発生します。Googleのサービスは本来コンテンツ連動型広告なので
ゆぐちゃんにはあんまり向いていないんですけど、なんとかサーバー代ぐらいは
稼ぎたいものです。Googleは広告のデータ解析とか本当に徹底していますね。さすがです。
922 ◆Meriken//XXX :2013/12/03(火) 08:48:14.19 ID:PbaokZ/LP
しかしゆぐちゃんやMTFの開発に協力してくださる方には
頭が上がりませんね。ありがたや、ありがたや…
923やんやん ◆yanyan//jacp :2013/12/03(火) 14:29:26.00 ID:RCFqozCy0
ああ、GPU用補助電源の実験をまだしてません、すみません。
12Vで300Wぐらいの電源がヤフオクで格安で出ています。
補助電源を使う方法がうまくいけば、
鬼のように高い高出力の電源を買う必要がなくなります。
試し次第報告しますね。

それと、1.1の正式版は、1.0.1とは別にまた購入するのでしょうか?
924名無しさん@お腹いっぱい。:2013/12/03(火) 20:00:17.31 ID:J6RBk9C60
>>923
そうじゃないの?

http://anago.2ch.net/test/read.cgi/software/1373110438/
325 自分:名無しさん@お腹いっぱい。[sage] 投稿日:2013/08/03(土) 15:18:30.61 ID:wlmpiwQb0
>>321-322
これは凄い……
ところで、今1000円払って安定版(ローカル検索可能Ver)を購入すると、
v1.0有償版が無料で提供されるとサイトに書いてあったのですが、
これはv1.1になったらその分は追加でお金を払う必要があるんですか?

326 返信: ◆MERIKEN4.k [sage] 投稿日:2013/08/03(土) 17:32:50.21 ID:p0/j/y0Y0 [8/11]
>>323-324
こればっかりはやってみないとわかりませんねえ。
まあ頑張りますw

>>325
そうで〜す。軍資金が全く足りてないので、バージョン1.0以降からは
バージョンアップは全て有償にする予定です。
925 ◆Meriken//XXX :2013/12/04(水) 06:36:13.27 ID:n06/VoicP
926 ◆Meriken//XXX :2013/12/04(水) 06:39:34.81 ID:n06/VoicP
>>923
ぜひ報告をお願いします。検索君1号に電源を追加しても
負荷をかけた途端止まっちゃうんですよねえ…
927 ◆Meriken//XXX :2013/12/04(水) 06:42:14.83 ID:n06/VoicP
>>923
あ、それと1.1は別に購入という形になります。
こちらもぜひよろしくお願いします。
928やんやん ◆yanyan//jacp :2013/12/04(水) 07:20:35.28 ID:IfHsNoyp0
>>926,927
了解しましたー
929名無しさん@お腹いっぱい。:2013/12/05(木) 04:31:54.39 ID:hTety7Ha0
全く同じトリップが発見されたので、をぅ!と思ったら、キーも全く一緒だった。
こんな事ってあるんだな。・・・って、もしやそんな珍しくないのか?
930 ◆Meriken//XXX :2013/12/05(木) 08:16:30.01 ID:ALVsuFkvP
>>929
MTFの最新のバージョンならそれは非常に珍しいです。
>>36のテンプレを使って報告していただけると助かります。
931名無しさん@お腹いっぱい。:2013/12/05(木) 12:17:32.12 ID:AYHeguHa0
10桁酉なら最後2バイトだけ違うのはけっこう多いな
有効8バイトだけど見つけてくる酉は10バイトやから
932名無しさん@お腹いっぱい。:2013/12/05(木) 20:05:04.51 ID:ojfzW6CU0
>>930
> MTFの最新のバージョンならそれは非常に珍しいです。
あっ、同じバージョンで2つ見つかった訳じゃないです。
前回見つかったのはかなり前で、相当古いバージョンなので・・・
933名無しさん@お腹いっぱい。:2013/12/05(木) 21:44:17.85 ID:7iLLiEv/0
>>932
二つ目の方が最新版だったなら、本気で乱数が衝突したって事のような。
「非常に珍しい」の言葉通り珍しい現象だと思う。
934名無しさん@お腹いっぱい。:2013/12/06(金) 01:37:03.15 ID:RfM8fqLG0
ASRockがマイニングに特化したマザーを出したみたいだけど
x1スロットばっかりでGPGPUには問題ないんですかね
http://www.asrock.com/mb/Intel/H81%20Pro%20BTC/index.jp.asp

大丈夫そうならトリップ検索にも良さげなマザーっぽいですけど
935名無しさん@お腹いっぱい。:2013/12/06(金) 01:45:27.25 ID:Dma6e7YE0
>>934
計算に必要なデータや計算で得られるデータが大量で無ければ問題ないかと。
GPGPUといいつつGPUで計算した出力をCPUで処理しなきゃならない場合は少し微妙……
とはいえx1でも250Mbyte/secも転送できるから余程大量にデータ吐かない限り問題なさげ?
936名無しさん@お腹いっぱい。:2013/12/06(金) 07:02:47.62 ID:eAzcko0R0
今更気付いたのですが、10 桁の場合、最後は「.26AEIMQUYcgkosw」だけですが、
これ以外の文字で 10 と 12 桁両方登録してたら、何か問題が出ますか?
10 桁の方では単に絶対に出ないだけで、12 桁の方の 10 桁だけで登録したのと
全く同じ扱い??
937 ◆Meriken//XXX :2013/12/07(土) 22:11:11.03 ID:8EO94J99P
>>936
まったく問題ないはずです。
938 ◆Meriken//XXX :2013/12/07(土) 22:17:45.03 ID:8EO94J99P
>>934
トリップ検索だったら大域的には全く問題ないはずです。
延長ケーブルを使うことになるんでしょうけど、
ビデオカードの固定が面倒そうです。

https://50btc.com/images/articles/6cards/image001.jpg
https://50btc.com/images/articles/6cards/image005.jpg
https://50btc.com/en/article/bitcoin_hardware_mining
939 ◆Meriken//XXX :2013/12/07(土) 22:20:04.06 ID:8EO94J99P
>>938は「帯域的には」でした。
940 ◆Meriken//XXX :2013/12/07(土) 22:22:41.90 ID:8EO94J99P
>>932
これって10桁トリップ検索の話ですよね?
キー生成は乱数で行っていて偏りは無いはずなので、
やっぱりかなりまれな現象です。
941 ◆Meriken//XXX :2013/12/08(日) 02:22:42.58 ID:eGsVS9qSP
>>921を書き込んだあとでGoogleの広告のクリック数が増加したんですが、
その結果Google AdSenseのアカウントが停止されてしまいました。
私もかなり不注意だったのですが、今後はYggdrasilの広告は
本当に興味が有る場合だけクリックしてくださるようお願いします。
942名無しさん@お腹いっぱい。:2013/12/08(日) 22:23:39.33 ID:TJsqAVku0
>>940
> これって10桁トリップ検索の話ですよね?
はい。

> やっぱりかなりまれな現象です。
よし、年末ジャンボを買ってみるか・・・
943名無しさん@お腹いっぱい。:2013/12/11(水) 02:36:01.57 ID:HBHKr7jb0
たまたま気がついたのですが、MTFの画面を(フリーソフトで)最前面指定していると、
「特殊パターンの設定」ウィンドウが後ろに隠れてしまって押せなくなる現象が起きます。
「特殊パターンの設定」ウィンドウのボタンを押せないと復帰できないので、
このウィンドウを最前面表示するようにしてくれると嬉しいです。
944名無しさん@お腹いっぱい。:2013/12/13(金) 05:56:37.39 ID:tqXdDVPi0
>>941
ROMな人は書き込みの10倍から100倍はいますからね。
登録ユーザが3桁なら、ここ見てる人はもう一つ桁が上かと
945 ◆vWwwWvWWWw :2013/12/13(金) 21:02:12.41 ID:z2722EuO0
擬似準10連ゲット
946 ◆QZaw55cn4c :2013/12/13(金) 21:04:48.26 ID:hXPbB4ks0
947 ◆vWwwWvWWWw :2013/12/13(金) 21:48:49.39 ID:z2722EuO0
>>946
ちょwww難しすぎワロスwwww

ちなみに擬似準10連は約1/1.1兆なのでwwww
10[MTPS]あれば約21時間でみつかるwwwww
948 ◆Meriken//XXX :2013/12/13(金) 23:22:06.35 ID:sNQjHvwNP
>>943
> このウィンドウを最前面表示するようにしてくれると嬉しいです。

このようにしてしまうと他の人達が困ってしまうので、
残念ながらこのような変更はできません。
949 ◆Meriken//XXX :2013/12/13(金) 23:25:34.37 ID:sNQjHvwNP
>>944
登録ユーザーが三桁でもアクティブユーザーの数は
そこまで多くないんですよね。ウェブサイトのアクセスログを見る限りでは
このスレを見ている人はそこまで多くない気がします。
950名無しさん@お腹いっぱい。:2013/12/13(金) 23:58:31.43 ID:46s1ys9t0
>>949
増えるわかめちゃんしてる人が多いのかもしれませんね。
もっと冒険に出かける勇者が増えて欲しいですね。
951名無しさん@お腹いっぱい。:2013/12/14(土) 21:56:58.53 ID:+gyc5oiR0
ここの人たちは一度コインでも掘ってみたらいいんじゃないでしょうか
GPUを活かそう
952 ◆YSRKEN.ceVZZ :2013/12/14(土) 22:05:50.68 ID:I6+AO/r20
>>951
記念にコイン掘ってみたいんだけど、
ググっても掘り方がよく分からないんだよなぁ……
953名無しさん@お腹いっぱい。:2013/12/14(土) 22:24:08.14 ID:ruUEXHqP0
手持ちのリソースを全てトリップ検索につぎ込むのがこのスレの正義
954 ◆shiexn/6.A :2013/12/14(土) 22:42:20.50 ID:1TYDQxVZ0
1BTC10万円とか聞いたから簡単には出ないと悟ってぐぐりすらしなかった
955名無しさん@お腹いっぱい。:2013/12/14(土) 23:42:49.25 ID:rVrZvOmA0
よくしらないけど報酬は演算量で分割じゃなかったっけ
よ〜するに単なるGPU複数枚挿しだと小数点以下のごく僅かな報酬だから
消費電力の方が高くなって無駄
956名無しさん@お腹いっぱい。:2013/12/15(日) 00:02:52.31 ID:Lm0zW4kA0
>>943
「特殊パターンの設定」も最前面になるように設定しとけ。
WinTとか自動でやれるソフトもあるから。
957名無しさん@お腹いっぱい。:2013/12/15(日) 00:03:37.32 ID:XJfjVbeS0
BitcoinのASICもってるよ 8Gh/s
Amd 6850で200Mh/s
もうグラボじゃ電気代が無駄なくらいしか掘れない
958名無しさん@お腹いっぱい。:2013/12/15(日) 01:04:00.76 ID:FW7/TyXw0
マイナーコイン掘って交換すればGPUレベルなら採算はとれるかな
959名無しさん@お腹いっぱい。:2013/12/15(日) 01:41:40.87 ID:4HZaJ98J0
コインのマイニングで稼げるうちに稼いで、その資金でハイエンドのRadeonグラボや電源ユニットを購入して
トリップ検索に戻ってくるのもまた正義かな?w
960名無しさん@お腹いっぱい。:2013/12/15(日) 09:50:14.64 ID:535Pvs8a0
このスレ的には超マイナーコインのユグちゃん金貨が、何時の日かRMT出来る日を夢見て掘っておくべきじゃね?w
961 ◆YSRKEN.ceVZZ :2013/12/15(日) 22:30:05.23 ID:ScGZ+iPL0
自分のノートPCでもMSI Afterburnerが効くことがつさっき判明したので、
ベンチマーク結果を貼っておきます。……さすがに常用はしませんが。

【診断の種類】検索速度(1パターン)
【Meriken's Tripcode Finderのバージョン】1.1 Free Edition Beta 2
【OS】Windows 7 Ultimate SP1 64bit
【ディスプレイドライバ】R331(331.82)

【検索デバイス】GPUとCPU
【使用するGPU】すべて使用
【GPU】NVIDIA GeForce 610M
【CPU】Intel Core i5-3210M

【1SMあたりのブロック数(CUDA)】256
【CPUの命令セット】x64 + SSE2/AVX/AVX2
【CPU検索スレッドの数】4
【検索プロセスの優先度】通常
【GUIフロントエンドの優先度】通常

【トリップの種類】12桁
【キーに使用する文字】半角と全角
【検索パターン】 10文字完全前方一致1個

【 5分間の平均速度】 114.46M→131.98M tripcode/s
【GPU検索の平均速度】 74.48M→91.32M tripcode/s
【CPU検索の平均速度】 39.99M→40.66M tripcode/s

【GPUの使用率】99%
【GPUの温度】79℃→86℃
【その他】機種:ASUS K55VD-SX3210B
        CoreClockを200MHz上げた結果が矢印右。Memory Clockを上げると不安定になる謎
        http://i.imgur.com/wUTC2qu.png
962名無しさん@お腹いっぱい。:2013/12/16(月) 00:27:13.07 ID:TlyawlhA0
>>960
1兆ゆぐちゃん金貨=1日本円くらい?
963 ◆Meriken//XXX :2013/12/16(月) 10:30:54.02 ID:WQn/1Bm9P
>>951
> ここの人たちは一度コインでも掘ってみたらいいんじゃないでしょうか
> GPUを活かそう

GPUでのマイニングはとっくの昔に時代遅れになってますよ。
私もちょっと前までほってましたけど、もう完全に採算が合わないですね。
964:2013/12/16(月) 12:45:47.43 ID:8pMndqbo0
GPUでクラウド領域を掘るサービスがあったらまだ採算取れるかもしれないですね
965名無しさん@お腹いっぱい。:2013/12/16(月) 14:30:48.24 ID:2wT4zsuB0
そんなあなたにインフィニットコイン
966 ◆precureSZ. :2013/12/18(水) 03:02:40.37 ID:uDTb5BGo0
#!//aH6y' の8バイトで足りているのですけど、10バイトで回してるのは何か意味があるんですかね?

◆precureSZ. #!//aH6y'6I (21 2F 2F 61 48 36 79 27 36 49)
◆precureSZ. #!//aH6y'9q (21 2F 2F 61 48 36 79 27 39 71)
967 ◆Meriken//XXX :2013/12/18(水) 09:05:46.68 ID:eX4lSY0sP
>>966
9バイトで回すと8文字目に全角文字が使えるのでキー空間が少し広がるのです。
10バイトにしているのは単にキリがいいからです。
968名無しさん@お腹いっぱい。:2013/12/18(水) 19:30:11.88 ID:uDTb5BGo0
なるほど
ありがとうございます
969 ◆TTMMMTTTTM :2013/12/19(木) 10:13:28.66 ID:o+C9XmQw0
二構イヤッホウ!
970 ◆Meriken//XXX :2013/12/19(木) 18:58:06.80 ID:EVyYHSvfP
検索君1号が再起動時にスタートアップ修復を実行するように
なってしまい、インターネット経由での遠隔操作ができなくなって
しまいましたorz というわけで、検索君1号は1月中旬までお休みです。

ウェブカメラで監視したり、電源をリモート制御できるようにしたりと
いろいろ準備したんですけど、前回の帰省の時より稼働時間が
かなり短くなってしまいました。
どうもまた電源ケーブルが溶けたみたいだし、
今回のシステムの安定運用はほんとうに難しいです。
971 ◆Meriken//XXX :2013/12/19(木) 19:09:53.30 ID:EVyYHSvfP
ちなみにWindowsの起動時のスタートアップ修復は管理者権限で
次のコマンドを実行すれば切れます。

bcdedit /set {default} recoveryenabled No
bcdedit /set {default} bootstatuspolicy ignoreallfailures

元に戻すには次のコマンドを実行するだけです。

bcdedit /set {default} recoveryenabled Yes
bcdedit /set {default} bootstatuspolicy displayallfailures

塩漬け君はモニタがついていないので切っておいたんですけど、
検索君のは切ってなかったんですよねorz まあケーブルが溶けてたら
どのみち遠隔操作での復旧は無理ですが…
972名無しさん@お腹いっぱい。:2013/12/19(木) 19:24:30.81 ID:oy7s2YJp0
>>971
お疲れ様です
マシンも人も正月はゆっくり休みましょう
973名無しさん@お腹いっぱい。:2013/12/19(木) 20:24:09.58 ID:wDMjZ6Fr0
不在時にケーブル溶けるなんて怖い・・
974名無しさん@お腹いっぱい。:2013/12/19(木) 22:50:23.25 ID:dyVH/YVf0
一歩間違えれば出火だよね…
975 ◆Meriken//XXX :2013/12/20(金) 04:31:36.63 ID:jWprxp88P
ケーブルが溶けるって言ってもコネクタの先のプラスチックが
ちょこっと溶けて接触が悪くなるだけですよ。
いつものことなのでもう慣れてしまいましたw
976 ◆YSRKEN.ceVZZ :2013/12/21(土) 02:24:32.07 ID:i/xAMah10
        Λ_Λ
        (´∀` )-、   廃棄予定だったPCを最近引き取ったので、早速検索ベンチしてみました。
       ,(mソ)ヽ   i   ちょい古な割にHD5870なんて積んでたりして結果にwktkしていたのですが、
       / / ヽ ヽ l   予想以上にGJな結果に。これで私もGTPS勢に……!
 ̄ ̄ ̄ (_,ノ ̄ ヽ、_ノ ̄ http://i.imgur.com/rJaHaQv.png (壁紙はケースが白かったため。雪歩はかわいいなあ)

:::::::::::.: .:. . ∧_∧ . . . .: ::::::::
:::::::: :.: . . /彡ミ゛ヽ;)ヽ、. ::: : ::  なんでLANケーブル差してるのにネットに繋がらないの……?
::::::: :.: . . / :::/:: ヽ、ヽ、i . .:: :.: ::: 繋がってもゆぐ参加時の電気代が怖いorz
 ̄ ̄ ̄(_,ノ  ̄ ̄ヽ、_ノ ̄

より設定を詰めた結果は後日報告します
977 ◆shiexn/6.A :2013/12/21(土) 04:09:41.77 ID:VhrOZj+L0
診断の方法に今はじめて気づいた
978名無しさん@お腹いっぱい。:2013/12/21(土) 13:53:38.30 ID:t5YCZ+qN0
GTPS級のPCを電気代をものともせず長時間稼動させてこそ真の勇者
979名無しさん@お腹いっぱい。:2013/12/22(日) 03:02:35.69 ID:Uj85g2yp0
はむはむはむむ
980名無しさん@お腹いっぱい。:2013/12/22(日) 03:04:37.94 ID:Uj85g2yp0
しゃきーん。
981SilentPC ◆SilentPCIePC :2013/12/22(日) 14:46:16.24 ID:3QEs+Pan0
>>978
冬場は暖房費を考えるとむしろお得なような気がしてきた。
灯油代結構高いけど、GPUを24時間稼働させているとピンポイントでしか暖房要らないんだよね。
982名無しさん@お腹いっぱい。:2013/12/23(月) 12:18:18.90 ID:Br/I3wB80
次スレは?
983名無しさん@お腹いっぱい。:2013/12/24(火) 02:13:29.23 ID:F1yn+puf0
hoshu
984名無しさん@お腹いっぱい。:2013/12/24(火) 16:26:42.87 ID:AC60xR/U0
hage
985 ◆YSRKEN.ceVZZ :2013/12/24(火) 22:27:42.33 ID:QSE4RjwJ0
結局290Xでのベンチ結果は次スレになるんですかね……?
986名無しさん@お腹いっぱい。:2013/12/24(火) 22:42:33.03 ID:ziIbMXmJ0
オリファンか水枕が来ないとなぁ
987名無しさん@お腹いっぱい。:2013/12/25(水) 15:48:05.03 ID:DvxHLCCK0
【トリップ検索】MERIKEN's Tripcode Finder その6
http://anago.2ch.net/test/read.cgi/software/1387954016/
988 ◆shiexn/6.A :2013/12/25(水) 23:26:41.29 ID:Gc/4YL+h0
おつ
989混沌 ◆Chaos/geeeIV :2013/12/26(木) 06:14:33.42 ID:C8tXLCtZ0
>>987 おつ
テンプレつけてみたけど、あれで合ってるかな
990 ◆YSRKEN.ceVZZ :2013/12/26(木) 08:31:07.21 ID:ohvmVbyx0
        Λ_Λ   スレ立てって毎回Merikenさんがするものとばかり思ってました……
        (´∀`;)-、  と言うか、「Meriken's」じゃないんですね(>>530参照)。
       ,(mソ)ヽ   i  改題は次々スレから、ということでしょうか。
       / / ヽ ヽ l  
 ̄ ̄ ̄ (_,ノ ̄ ヽ、_ノ ̄>>987さんスレ立て乙です
991混沌 ◆Chaos/geeeIV :2013/12/26(木) 11:35:05.28 ID:C8tXLCtZ0
そう思ってたけど、立ったからテンプレ付けないとなーって思ってw
992名無しさん@お腹いっぱい。:2013/12/27(金) 01:01:24.53 ID:E/WfPkYa0
【診断の種類】検索速度(1パターン)
【Meriken's Tripcode Finderのバージョン】1.1 Free Edition
【検索デバイス】GPUのみ
【使用するGPU】AMD Hawaii (OpenCL)
【1CUあたりのワークアイテムの数(OpenCL)】自動
【1WGあたりのワークアイテムの数(OpenCL)】自動
【1GPUあたりの検索プロセスの数(OpenCL)】1
【1検索プロセスあたりの検索スレッドの数(OpenCL)】2
【検索プロセスの優先度】通常以下
【GUIフロントエンドの優先度】通常
【トリップの種類】12桁
【キーに使用する文字】半角と全角
【検索パターン】 10文字完全前方一致1個
【10分間のGPU検索の平均速度】 1559.27M tripcode/s
--
10桁 【10分間のGPU検索の平均速度】 121.14M tripcode/s
--
ワークアイテムの数 1024/CU 128/WG
12桁 【10分間のGPU検索の平均速度】 2317.47M tripcode/s
【その他】
GPUは290でX無し947Mhz、メモリクロック150Mhzから動かない
ファンが早くならずワークアイテム指定したときはクロック結構落ちた
8192/CU 128/WGで現在の検索速度2900程度を見れた
993 ◆Meriken//XXX :2013/12/27(金) 11:41:04.22 ID:R2aVUqi5P
>>987
日本に帰ってから結構バタバタしてたので助かりました。
早めに片付くと思ってた仕事がなかなか片付かないんですよね〜
994 ◆YSRKEN.ceVZZ :2013/12/27(金) 14:31:37.49 ID:yra3xF+80
>>993
お久しぶりです。では、スレ埋めついでにPC-Yukihoのベンチ結果をば。
【診断の種類】検索速度(1パターン)
【Meriken's Tripcode Finderのバージョン】1.1 Free Edition Beta 2
【OS】Windows 7 Ultimate 64bit
【ディスプレイドライバ】13.251-131206a-165817C-ATI

【検索デバイス】GPUとCPU
【使用するGPU】すべて使用
【GPU】Radeon HD 5870
【CPU】Intel Core i7-960

【1CUあたりのワークアイテムの数(OpenCL)】自動
【1WGあたりのワークアイテムの数(OpenCL)】自動
【1GPUあたりの検索プロセスの数(OpenCL)】1
【1検索プロセスあたりの検索スレッドの数(OpenCL)】2
【CPUの命令セット】x64 + SSE2
【CPU検索スレッドの数】自動
【検索プロセスの優先度】通常以下
【GUIフロントエンドの優先度】通常

【トリップの種類】12桁 / 10桁
【キーに使用する文字】半角と全角
【検索パターン】 10文字完全前方一致1個

【10分間の平均速度】 1570.15M tripcode/s / 16.80M tripcode/s
【GPU検索の平均速度】1501.37M tripcode/s / 2.44M tripcode/s
【CPU検索の平均速度】 68.78M tripcode/s / 14.36M tripcode/s

【GPUの使用率】100.0%
【GPUの温度】78.5℃
【その他】DELL Studio XPS 9100
995 ◆Meriken//XXX
>>992
Hawaiiでの報告は初めてですね。有難うございます。
設定を詰めれば性能通りの速度が出るみたいですね。
290X欲しいなあ。