952 :
○○○:2008/04/05(土) 16:28:31 ID:EbaI/hAY0
うへ
ああ、ごめんな、ニュース速報VIP板の検索をしてくれた人。
残念だけど、yutori.2ch.net鯖は「y」で始まるからクロールは当分先なんだ。すまない。
そこまで行くまでにディスクがあふれたら、ごめんな。
takatyanがすごいものを作ってくれたよ
956 :
●:2008/04/05(土) 22:45:22 ID:riz0wYMI0
>>955 問題は何が先に壊れるか、です。
・私のやる気
・私の時間(実は火曜日試験なんですよね)
・鯖のHDD(今のところあと50GBぐらいですかね)
・MySQLのテーブルサイズ上限(281474976710655バイト=262144ギガバイト)、まず大丈夫
・Sennaのレコード数上限(268,435,455 (約2億6千万)レコード=268,435,455 (約2億6千万)スレッド) これのために
>>951を書いたんだ。
>>956 ごめんな、リロードバーボンがごく最近復活したんだよな。それのせいなんだ。
それがなければもっと高速に・・・いけるなじゃないかなぁ。
鯖検索式はともかく、板検索式は板ディレクトリ名「operate」とかじゃないとだめなんだ。
50GB・・・難しいな
ちなみにdatをすべて保管する形だったら3〜5TBは必要と思われ
試験がんばれw
>>958 残念、鯖、板、鍵、タイトル、レス数の5つを、スレッドごとに格納するだけだ。
960 :
動け動けウゴウゴ2ちゃんねる:2008/04/06(日) 00:14:52 ID:/6u5OKsN0
でっていう
961 :
動け動けウゴウゴ2ちゃんねる:2008/04/06(日) 00:58:49 ID:gNPaqc6O0
パスがわからなくなったんでメール出したんだが、返事がこない
もう一回出しても返事がこない
ここのサポートってほんとに存在すんのか?
土日は休みだろ常考
963 :
動け動けウゴウゴ2ちゃんねる:2008/04/06(日) 07:29:05 ID:gNPaqc6O0
出したのは先週だ
昨日ニュース速報VIP板の検索をしてくれた人のために
yutori.2ch.net/news4vipを優先してクロールしたぞー
どれどれ・・・
「格納スレッド809531のうち、news4vipのスレッド779480、つまり96.2%がVIPのスレだお( ^ω^)」
。 。
/ / ポーン!
( Д )
>>965 Linuxでも動くようにしてくれたらやる!
Win鯖はこの前電源が逝ってしまいますた
>>964 そりゃVIPはスレが異常な多さだからね
そういえばリストに隠し板が含まれていないねえ
ニュース速報板「news」で検索してくれた人がいるんだけど、
ニュース速報VIP板「news4vip」が検索結果に含まれてしまう模様。
どーしたものか。。。
隠し板はいるでしょ
あとは・・・PINKやまちBBS・・・
ここvip臭いです(931,200)が出てうぜえ
>>970 PINKは年齢的問題からできません><
まちBBS?何それ、食(ry
・・・まちBBSは過去ログの仕組みがよく分からないです
事実、●持ちご用達ツール兼●販促ツールであり、
隠し板は考慮に値すると思うんだが・・・
私が隠し板は壁とアラスカしか知らない。
まぁ、ググればいくらでも出てくるとは思うが・・・。
とりあえず、非隠し板のクロールが終わってからね。
隠し板「机」希望
973 :
動け動けウゴウゴ2ちゃんねる:2008/04/06(日) 15:33:42 ID:uHI85pQ+0
>>971 ヒント:隠し板一覧は、Wikipediaの隠し板にある
どうやらバーボン食らったみたい
しばらく休み
59 BBON.ex21.666 220.147.246.148 (ntnigt048148.nigt.nt.ftth.ppp.infoweb.ne.jp) 1
>>979 対応しました。
そのうちデータ収集に行きます。
乙
それと次スレ立てておk?
>>983 乙
スーパーフリー板って過去ログ倉庫あるの?
調べたらdat落ちしない設定になってら
一番下のスレ2488番www
>>985 これは収集する価値があるか疑問ですねぇ・・・
というわけでsuperfree板をクロールしたことにしておいた
おつー
ふーむ、170万スレッドのデータを収集した今、検索データと実データを含むすべてのデータ量はおよそ半ギガ。
0.5ギガバイト / 170万 * 2億
とやると58.8235294 ギガバイトとなることから、仮に2億スレッドスレッド格納してもハードディスクの
領域としては何とかなりそうだ。
問題は検索性能。
2億スレッド、それもそれらのスレッドはタイトルの長さはせいぜい20文字程度。
普通に検索ワードを入れるだけでは結果が万単位になるだろう。
その他の絞り込み機能が必須だな。
990 :
●:2008/04/06(日) 20:24:52 ID:ScVyHXTP0
これならPINK+まちBBS+鯖移転前のスレを入れても大丈夫かも
>>990 受けてもいいんだ、受けてもいいんだ、
システム的には今すぐクロール開始もできる。
だがここでそれを受けると以下どこそこのデータ収集始めてくださいレスで埋まるかもしれない。
それを避けるためにすまんがもう少し待ってほしい。といってももう3日目なのに、
まだこのくらいではもうしばらくかかりそうだ。
・・・リロードバーボンめ・・・。除外申請したら通るだろうか?
この検索システムの話題をするのにもっと適切な板、スレはないだろうか・・・。
>>991 PINK、まちBBSは今のところやる気なし。
・・・完全に別で、もうひとつ同じシステムを立ち上げてやる可能性はある。
にしても、2ちゃんねるの収集がほぼ終わって、システムが完成に近づいてから、ね。
994 :
●:2008/04/06(日) 20:34:51 ID:ScVyHXTP0
>>993 ∧_∧
( ・∀・) <待ってます。
( ∪ ∪ <●餅だけなら●板でする?人いなさそうだけどw
と__)__) <PCカテのどっかの板のほうがいいのかな?
>>994 それまでにHDDが尽きたらごめんね。でも、HDDは増設できそう・・・。
●板かなぁ。
でも・・・●を買う動機づけになってほしいと思っているのでできれば・・・
昔板とかか?「過去ログをねたにして、モリアがロー」とあるし、ここがいいか?
すごい過疎のような・・・
>>996 できれば2ch内が・・・
>>1000ならtakatyanがリロードバーボン除外申請したらすんなり通る
1001 :
1001:
このスレッドは1000を超えました。
もう書けないので、新しいスレッドを立ててくださいです。。。