関連キーワードをなんとかしようスレ

このエントリーをはてなブックマークに追加
373ノtasukeruyo
>>184の件はどこに頼めばいいのでしょうか。わりと不便なのですが・・・・・・。
Opera/9.10 (Windows NT 5.1; U; ja)
374動け動けウゴウゴ2ちゃんねる:2007/02/15(木) 22:09:58 ID:fPCSIy270 BE:74249322-PLT(27453)
2度あることはタントアールだろ
375 株価【1100】 △ ◆cZfSunOs.U :2007/02/15(木) 22:37:47 ID:gXwQFdVg0
まぁ,振り込め詐欺とかに遭っても,忘れるぐらいなら被害に遭わなくていいですねw

>>373 read.html の表示は大丈夫ですか?
http://life8.2ch.net/test/read.html/lifesaloon/1168772138/l50
376ノtasukeruyo:2007/02/15(木) 22:51:51 ID:VTJ0C/uE0
>>375
どうもです。
read.htmlだと問題無いですね。
read.cgiにすると上のカウンターと重なってしまいクリックできなくなります。
Opera/9.10 (Windows NT 5.1; U; ja)
377 株価【1100】 △ ◆cZfSunOs.U :2007/02/15(木) 22:56:37 ID:gXwQFdVg0
>>376 じゃあ,当該部分のタグを read.html のと同じのにすればいいのかな......
378動け動けウゴウゴ2ちゃんねる:2007/02/15(木) 23:17:00 ID:MDUqOD6a0
379 株価【1200】 △ ◆cZfSunOs.U :2007/02/15(木) 23:37:11 ID:gXwQFdVg0
>>377 をやろうと思ったけど,>>378 が出てきたのでちょっと様子見で......
380動け動けウゴウゴ2ちゃんねる:2007/02/15(木) 23:44:29 ID:VTJ0C/uE0
>>377-379
どうもです。

できれば2chの側で対応していただけるとありがたいのですが。
Operaで2chを利用する人の全てがcssを設定するわけではないでしょうし。
381動け動けウゴウゴ2ちゃんねる:2007/02/15(木) 23:45:16 ID:VTJ0C/uE0
まぁ、全ての板がread.htmlへ切り替えられるようになれば
話は早いのかもしれませんが。
382動け動けウゴウゴ2ちゃんねる:2007/02/15(木) 23:47:01 ID:OKbEZRpT0
わけわからn会話してるな
383動け動けウゴウゴ2ちゃんねる:2007/02/15(木) 23:49:23 ID:fWbvdxfT0
>>378
これでも良いんだけど、サーバーごとに設定しないといけないのがなんとも。
384動け動けウゴウゴ2ちゃんねる:2007/02/15(木) 23:55:37 ID:/FGSj+5x0
漢字のキーワードの挙動がおかしい
385 株価【1200】 △ ◆cZfSunOs.U :2007/02/15(木) 23:59:22 ID:gXwQFdVg0
とりあえず dso でやってみた.
http://dso.2ch.net/test/read.cgi/myanmar/1106799809/l50


>>384 どこのスレですか?
386動け動けウゴウゴ2ちゃんねる:2007/02/16(金) 00:01:05 ID:LpEtGD2H0
>>385
90.2でおk
387ノtasukeruyo:2007/02/16(金) 00:03:52 ID:XnaxH7Tl0
>>385
重なることなくクリックできています。
Opera/9.10 (Windows NT 5.1; U; ja)
388 株価【1200】 △ ◆cZfSunOs.U :2007/02/16(金) 00:07:45 ID:cIKZ8NCe0
では配布で >>385
389動け動けウゴウゴ2ちゃんねる:2007/02/16(金) 01:12:07 ID:aJ0E/d2N0
ひろゆき!応援しているから
山本一郎が訴えた民事訴訟には絶対に勝ってくれ!

夜勤や井上もひろゆきに協力よろしく


まとめサイト「キャッチミーイフユーキャン」 切込隊長@山本一郎は嘘つきなのか?
http://blog.goo.ne.jp/catchme_2005/

私家版:切込隊長を客観的に検証するスレッド まとめサイト
http://g0aw66ngc6.seesaa.net

キーワード - 切込隊長経歴疑惑?(ソーシャルブックマークフロッグ!)
http://www.flog.jp/labelinfo.php/%90%D8%8D%9E%91%E0%92%B7%8Co%97%F0%8B%5E%98f%81H

デル株は1株2ドル40セントでは買えなかった。
http://www.geocities.jp/kirikomi1973/Dell/index.html

切込隊長@山本一郎と扶桑社
http://fusoshatokiri.seesaa.net/

切込隊長@山本一郎辞典
http://blog.livedoor.jp/kirik_0104/

切込隊長/山本一郎語録別館
http://k569.hp.infoseek.co.jp/

扶桑社が紹介している切込隊長の経歴
http://www.fusosha.co.jp/senden/2004/048188.html

切込隊長@Wikipedia
http://ja.wikipedia.org/wiki/%E5%88%87%E8%BE%BC%E9%9A%8A%E9%95%B7
390動け動けウゴウゴ2ちゃんねる:2007/02/16(金) 02:31:48 ID:5TtZfvjp0
1億以上収入有るんだから50年分ぐらい振り込めよ
391動け動けウゴウゴ2ちゃんねる:2007/02/16(金) 10:32:37 ID:E2gX0sqdO
検察に気をつけてねー
392讃岐フォアンフォアン▲ ◆SANUKI/VII :2007/02/16(金) 10:51:18 ID:Gnp6zGs8O
textでA B C D Eだけにしてよ

html解析めんどい
393動け動けウゴウゴ2ちゃんねる:2007/02/16(金) 11:07:20 ID:X0vKb2di0
おいおい、XMLのパースもできないのかよw
394 株価【1200】 △ ◆cZfSunOs.U :2007/02/16(金) 11:25:00 ID:cIKZ8NCe0
データのパースをするなら,個人的には JavaScript 版の方がおすすめです.
http://p2.2ch.io/getf.cgi?qb5.2ch.net+operate+1166328527

var keywords = { "keyword1":"encodedKeyword1", "keyword2":"encodedKeyword2", ... };

の行だけ抜き出して,他の行は捨てる.で,キーワードの中には記号が
入ることはないので,単純に , や : でちょん切って前後の " を消せばおk.
395▲ ◆SANUKI/VII :2007/02/16(金) 11:32:53 ID:SrcEbV7/P BE:36693599-PLT(33433)
その作業がめんどい
396 株価【1200】 △ ◆cZfSunOs.U :2007/02/16(金) 11:58:54 ID:cIKZ8NCe0
Perl ならこんな感じじゃ?

sub extract_keywords {
    my @kw;
    $_[0] =~ /^var keywords = { ((?:"[^"]+":"[^"]+"(?:, )?)+) };$/m
        or return;
    foreach (split(/, /, $1)) {
        /^"([^"]+)":/ or next;
        push(@kw, $1);
    }
    @kw;
}
397▲ ◆SANUKI/VII :2007/02/16(金) 12:00:41 ID:SrcEbV7/P BE:10873038-PLT(33433)
わがままいったのにやさしくしてくれるsunosさん好き
398動け動けウゴウゴ2ちゃんねる:2007/02/16(金) 12:01:02 ID:LpEtGD2H0
すのす
399動け動けウゴウゴ2ちゃんねる:2007/02/16(金) 14:14:03 ID:Gv2LZx+i0
これと同じようなインターフェースでおすすめ2ちゃんねるも呼び出せるようにしてほしい。
400動け動けウゴウゴ2ちゃんねる:2007/02/17(土) 12:51:34 ID:rbTTlVzI0
まろゆき、振り込んでこいさっさと。鯖は俺の鯖を貸してやる
401 株価【1290】 △ ◆cZfSunOs.U :2007/02/17(土) 13:42:48 ID:tFdnFmdq0
>>399 http://qb5.2ch.net/operate/i/1166328527.html

read.js が動いてる鯖ではこんな I/F もありますが......
http://life8.2ch.net/test/readinfo.so?lifesaloon+1171014733
402動け動けウゴウゴ2ちゃんねる:2007/02/17(土) 15:55:07 ID:hVA6QFAM0
>>401
おお。
下の奴しか知らなかったので、上でやってみる。
403動け動けウゴウゴ2ちゃんねる:2007/02/17(土) 21:49:44 ID:RVm512sw0
>>385
今は直ってるみたい
そのときは二文字のが一文字だけになったり後ろが化けたりしてた
404 株価【1290】 △ ◆cZfSunOs.U :2007/02/17(土) 22:16:36 ID:tFdnFmdq0
>>403 そうですか...... MySQL は cp932 で動いてるし,ヘンなバイトシーケンスが
そのまますり抜けるってことはないとは思いますが,またあったら知らせて下さい.
405 株価【1290】 △ ◆cZfSunOs.U :2007/02/17(土) 22:53:35 ID:tFdnFmdq0
あ......ひょっとして↓を入れないとデータ化けが起こる可能性もなきにしもあらず?
静かな時間帯にでも入れ替えておこう<DBD::mysql

--- DBD-mysql-4.001/dbdimp.c
+++ DBD-mysql-4.001/dbdimp.c
@@ -3750,19 +3773,11 @@
                  "Error happened while tried to clean up stmt",NULL);
         return 0;
       }
+      /* to avoid SIGSEGV when reusing this statement handle */
+      imp_sth->stmt->bind_result_done= 0;
     }
(ry


# これも含めパッチ投げて反応待ちだったり.
# http://bugs.mysql.com/bug.php?id=26388
406動け動けウゴウゴ2ちゃんねる:2007/02/18(日) 22:01:39 ID:qfY4A8BA0
407stream ◆PNstream2s :2007/02/18(日) 22:09:21 ID:XzsEMgbQ0
>>406
2ch検索側がおかしいと思う
408stream ◆PNstream2s :2007/02/18(日) 22:13:20 ID:XzsEMgbQ0
%83%7D マ
%83%89 ラ
%83%5C ソ
%83%93 ン

%5C \

%83%83 ャ
409動け動けウゴウゴ2ちゃんねる:2007/02/18(日) 22:19:53 ID:ZJ8NfgfI0
>>406-408
http://find.2ch.net/ のPerlスクリプトの正規表現マッチさせてるところに \Q いれれば解決
410動け動けウゴウゴ2ちゃんねる:2007/02/18(日) 22:33:55 ID:ZJ8NfgfI0
>>409
URIいじってみたけど、少し違ってたみたい。
getf.cgi で %5C をふたつ重ねるようにすればいいのかな?<こちらは動作確認
http://find.2ch.net/?BBS=ALL&TYPE=TITLE&ENCODING=SJIS&STR=%83%7D%83%89%83%5C%5C%83%93
411stream ◆PNstream2s :2007/02/18(日) 22:51:03 ID:XzsEMgbQ0
%5Cを重ねればいいんだろうけど、そもそも find.2ch.net の中を直さなきゃ。
412動け動けウゴウゴ2ちゃんねる:2007/02/18(日) 22:59:08 ID:ZJ8NfgfI0
>>411
find.2ch.net の方は EUC で処理してるっぽいのに、getf.cgi の出力が SHIFT_JIS で
発行されてる部分が多分食い違いの原因。
気を使うべき正規表現を扱ってる find.2ch.net の中を修正するのが筋なのは確かかも
413動け動けウゴウゴ2ちゃんねる:2007/02/19(月) 00:38:36 ID:Qm35+Bmi0
>>290に回す
414なぽ:2007/02/19(月) 02:07:40 ID:KxOYQz7X0 BE:4925344-2BP(2)
>>412
修正しますた。
エンコーディング変換前になぜかstripslashes()が。なんでだろ。
415動け動けウゴウゴ2ちゃんねる:2007/02/19(月) 08:46:54 ID:kfF0dg9s0
>>412
もう解決してるっぽいけど、Shift_JISの2バイト目のバックスラッシュの取り扱いの問題だね。
データのエンコーディングの扱いが曖昧だとハマる。
416動け動けウゴウゴ2ちゃんねる:2007/02/19(月) 08:57:09 ID:dFaVY2iE0
stripslashes ってことはPHPなのかな?
PerlでShift_JISの2バイト文字を含む文字から安全に \ を取り除きたい場合は
$strings =~ s/([\x81-\x9f\xe0-\xfc][\x40-\xfc])|\x5c(\x5c)?/$1$2/g;
\\ と二つ並んだものは \ ひとつに。それ以外の単独の \ は全部除去されます。
どのように \ でエスケープされてるかを正しく把握しないと余分な処理しそうなのでご注意
417動け動けウゴウゴ2ちゃんねる:2007/02/19(月) 11:12:32 ID:CkwXuHW70
read.cgiの関連キーワード、MacのSafariでみるとiframeがスクロールバーで埋まって
なんにも見えないんですがどうにかなりませんかね^^;。。
ttp://up.spawn.jp/file/up3382.gif
418動け動けウゴウゴ2ちゃんねる:2007/02/19(月) 13:01:54 ID:pBEvSMZ10
どこでもトンファー
419 株価【1200】 △ ◆cZfSunOs.U :2007/02/19(月) 16:59:40 ID:Pug69+aE0
>>417 read.js なら iframe 使わないからそういう問題は起きないです
......と言おうと思ったら,そもそも Safari だと read.js 自体ちゃんと動かないんですね.
う〜む......
420おふぃす:2007/02/20(火) 01:03:00 ID:EBLhrkLWP
スレ読まずに
誰かの案は採用されたのかい?まだアイディア出しの段階?
421動け動けウゴウゴ2ちゃんねる:2007/02/20(火) 10:46:59 ID:vxB49Y9b0
Safari での read.cgi の表示直ってました。対応ありがとうございます。m(_ _)m
422ひろゆき@どうやら管理人 ★:2007/02/21(水) 23:37:01 ID:???0 BE:94853-DIA(103130)
誰かの案?
423動け動けウゴウゴ2ちゃんねる:2007/02/22(木) 00:11:20 ID:qlrx2fQN0
>>422
何が?
424動け動けウゴウゴ2ちゃんねる:2007/02/22(木) 00:19:08 ID:wmcK2NTs0
>>420でしょ
425ひろゆき@どうやら管理人 ★:2007/02/22(木) 00:37:16 ID:???0 BE:88272-DIA(103130)
あいあい。>>420です。
426動け動けウゴウゴ2ちゃんねる:2007/02/22(木) 01:30:14 ID:CIG1Pa+z0
このスレの

キーワード【 rw InnoDB urls id words cgi ch 】
427動け動けウゴウゴ2ちゃんねる:2007/02/25(日) 01:39:09 ID:ha5BeV2q0
スレ内もだけどスレタイから抽出したのがないと
次スレ追っかける時面倒な場合がある
(キーワードが本文であまり使われてない場合とか)
428おふぃす:2007/02/25(日) 06:13:46 ID:+aZFC3xFP
ごめんごめん。
雑談2007に書いたつもりが誤爆ったのさ♪
429 株価【961】 △△ ◆cZfSunOs.U :2007/02/25(日) 13:06:47 ID:7wLnfKZR0
スレタイもキーワード抽出対象にはなってますが,重要度計算で上位に来ないと
入らないこともありうる,と(スレタイは本文の2倍のウェイトで計算してはいますが).
430動け動けウゴウゴ2ちゃんねる:2007/02/26(月) 00:33:04 ID:cBYEeqLc0
>>388
tv11鯖ではまだ、ページヘッダのリンクに触れない気がします w/Opera9
快適になって安心していたのですが、まだ全鯖対応ではありませんでしたか?
431 株価【1100】 △△ ◆cZfSunOs.U :2007/02/26(月) 06:31:21 ID:BnRSSGp20
>>430 tv11 は banana3102 つまり T-bananaですね.
今は T-banana とそれ以外で read.cgi のソースが統一されておらず,
その作業と併せて行った方が効率的なので,それまでしばらくお待ち下さい.
432動け動けウゴウゴ2ちゃんねる:2007/02/26(月) 23:50:24 ID:0DZUXpKj0
理解しました。確かにサーバのタイプで乗ってるもの違いますしね。ありがとうございます。
433動け動けウゴウゴ2ちゃんねる:2007/02/27(火) 01:20:23 ID:GeMrAsRv0
>>429
別枠化するか
本文が400kbでスレタイが40bなら10000倍換算ぐらいがいいと思う
434動け動けウゴウゴ2ちゃんねる:2007/02/27(火) 01:22:26 ID:GeMrAsRv0
てかスレタイを単語ごとに区切って直接クリックで飛べるようにとかは?
435 株価【1200】 △△ ◆cZfSunOs.U :2007/02/27(火) 08:24:10 ID:pqZRuyro0
スレタイを重視しすぎると,関連キーワードの性質が微妙に変化しそうな気も.う〜む......
436動け動けウゴウゴ2ちゃんねる:2007/02/27(火) 14:17:31 ID:hig0wXqC0
そもそも本質は「そのスレの内容から抽出したキーワード」であるので、
ずれた要望はあんまり気にしない方が良いかと。

第一、次スレ検索を主目的にしようとしてる時点で趣旨が違う。
同じ話題が話されているのが次スレだけとは限らないし、
雑談スレなんかスレ毎にキーワードが違うのが当たり前。

関連キーワード検索は「そのスレの内容と同じ話題のスレを検索」
するのであって、「次スレを検索」は用途としてはあっていない。
(結果的に代用出来る場合もあるだけ)
437動け動けウゴウゴ2ちゃんねる:2007/02/28(水) 01:50:16 ID:u1t4BgBC0
でも関連スレって別板に同じスレタイでたってることが多いし
438動け動けウゴウゴ2ちゃんねる:2007/03/03(土) 08:38:56 ID:tOQK59wa0
ここにサンプルで貼ったスレ結構クリックされてるなw
439動け動けウゴウゴ2ちゃんねる:2007/03/03(土) 11:56:46 ID:oee6jhnS0
半角仮名を関連キーワードに反映させることは出来ませんか?
440 株価【1150】 △△ ◆cZfSunOs.U :2007/03/03(土) 12:52:59 ID:m4T4tan/0
>>439 単語の抽出に利用している MeCab は,半角カナを記号として扱ってしまうようですね.
キーワードとして利用するのは名詞だけなので......


メールボックスパンクするまで爆撃合戦するスレ
メールボックスパンク    記号,一般,*,*,*,*,*
する    動詞,自立,*,*,サ変・スル,基本形,する,スル,スル
まで    助詞,副助詞,*,*,*,*,まで,マデ,マデ
爆撃    名詞,サ変接続,*,*,*,*,爆撃,バクゲキ,バクゲキ
合戦    名詞,サ変接続,*,*,*,*,合戦,カッセン,カッセン
する    動詞,自立,*,*,サ変・スル,基本形,する,スル,スル
スレ    名詞,固有名詞,組織,*,*,*,*
EOS

メールボックスパンクするまで爆撃合戦するスレ
メールボックス  名詞,一般,*,*,*,*,メールボックス,メールボックス,メールボックス
パンク  名詞,サ変接続,*,*,*,*,パンク,パンク,パンク
する    動詞,自立,*,*,サ変・スル,基本形,する,スル,スル
まで    助詞,副助詞,*,*,*,*,まで,マデ,マデ
爆撃    名詞,サ変接続,*,*,*,*,爆撃,バクゲキ,バクゲキ
合戦    名詞,サ変接続,*,*,*,*,合戦,カッセン,カッセン
する    動詞,自立,*,*,サ変・スル,基本形,する,スル,スル
スレ    名詞,固有名詞,組織,*,*,*,*
EOS
441動け動けウゴウゴ2ちゃんねる:2007/03/03(土) 14:43:03 ID:wHf2rjr80
ゆゆきし問題ですね
442動け動けウゴウゴ2ちゃんねる:2007/03/03(土) 17:19:16 ID:yF+lRADQ0
>>440
このあたりの Perl コード欲しいですか? jcode.pl だけでなんとかなるなら不要かもだけど
443動け動けウゴウゴ2ちゃんねる:2007/03/03(土) 17:28:59 ID:yF+lRADQ0
C言語でこのあたりのライブラリってどっかにあるのかな……
444 株価【1050】 △△ ◆cZfSunOs.U :2007/03/03(土) 17:46:33 ID:m4T4tan/0
>>442 いや,正規化しようと思えばできないことはないんですけど,
パーサは c2.2ch.io の処理で一番重い部分なんで(ほとんどは
MeCab によるものですが),さらに重くするのがいいのかどうか,ってとこで.

# 仮に正規化するなら,1-way の変換ではなく MeCab の処理結果を元に戻す,
# ってとこまでやらなきゃならないですし.
445動け動けウゴウゴ2ちゃんねる:2007/03/04(日) 09:51:09 ID:nVnbTany0
半角カナを全角カナに変換して処理すればいいんじゃね
446 株価【1050】 △△ ◆cZfSunOs.U :2007/03/04(日) 19:41:00 ID:98jJiHZT0
>>445 それが正規化ってことですが......ただ,半角で書かれたものを
全角のキーワードとして表示してもいいのならそれだけでもいいんですが,
半角のは半角のまま表示ということになると,いったん全角に変換したのを
半角に戻す処理も必要になって,そうなると処理が複雑になってくると.
不可能ではないんですが,重くなりそうだなぁ,と......
447動け動けウゴウゴ2ちゃんねる:2007/03/04(日) 19:47:14 ID:i3rGGgjT0
半角を全角にしてそのままでいいんじゃないかな
448動け動けウゴウゴ2ちゃんねる:2007/03/04(日) 20:21:29 ID:Qp8jFuR10
2ch検索の方で半角/全角片仮名の同一視が機能しているんなら、全角のままで良いんじゃないかい?
449 株価【1050】 △△ ◆cZfSunOs.U :2007/03/04(日) 22:23:49 ID:98jJiHZT0
半角カナで独特のニュアンスを表現する 2ch の文化(?)を考えると
全角に変換したままってのもどうかなぁ......とも思ってたんですが,
とりあえず全角のままでやってみます.
再クロールは2日周期なんで徐々に反映されるかと.
450動け動けウゴウゴ2ちゃんねる:2007/03/05(月) 13:05:32 ID:ckCgsY7X0
ttsだと逆に全角を半角にして処理してるが
それによる不都合も相当ある
http://pc11.2ch.net/test/read.cgi/esite/1034264315/l50
tGrepは完璧
451動け動けウゴウゴ2ちゃんねる:2007/03/05(月) 18:26:45 ID:D+u/AYgk0
452動け動けウゴウゴ2ちゃんねる:2007/03/05(月) 19:26:23 ID:qjpPIEp90
本文に書かれちゃうとどうしてもねぇ。
453動け動けウゴウゴ2ちゃんねる:2007/03/06(火) 02:56:01 ID:1Igmeu5x0
"ctaAcx"とか本文に出てきてないし
454 株価【1100】 △△ ◆cZfSunOs.U :2007/03/06(火) 12:54:47 ID:Nvn/63930
キーワード収集対象は本文とスレタイだけで,それ以外は対象外ですが......
と思ったら,>>449 の時にミスったようですね,すみません.
これから(再)クロールされる分は正常になるかと.
455動け動けウゴウゴ2ちゃんねる:2007/03/06(火) 18:25:54 ID:RZaN2IVv0
あれ落ちたスレの奴って吹っ飛ぶんだっけ?
前は生きてたと思ったけど
456 株価【1100】 △△ ◆cZfSunOs.U :2007/03/06(火) 21:33:48 ID:Nvn/63930
>>455 データが無限に膨張し続けないように,dat 落ちしたのは消すようになってます.
ただ,再クロールは2日周期なので,落ちてからデータが消えるまでのタイムラグはあると思いますが.
457動け動けウゴウゴ2ちゃんねる:2007/03/08(木) 18:59:20 ID:cMnMtVSa0
それだと次スレ追跡には使いづらいわねえ
458トラックバック ★:2007/03/08(木) 21:08:02 ID:cMnMtVSa0
【トラックバック来たよ】 (ver. 0.11)
[タイトル] スレタイ検索 スレッドタイトル検索サービス♪2find
[発ブログ] ネットサービス@2ch掲示板
http://pc11.2ch.net/test/read.cgi/esite/1173355555/l50
[=要約=]

主要なもの
http://ttsearch.net/ http://www2.ttsearch.net/
http://page2.xrea.jp/tgrep/tgrep2-test.cgi
http://www6.big.or.jp/%7Ebeyond/bbsnews/

公式のサービス
http://find.2ch.net/ http://test.razil.jp/(苦情は向こうで)
http://h.u.la/dance/
http://is.2ch.net/

その他の検索
http://www.google.co.jp/search?&q=site%3A2ch.net
http://www.2chs.net/
http://www.mimizun.com/
http://makimo.to/

こんな風に使ったり http://find.2ch.net/?STR=find

<a href="../test/read.cgi/esite/1173355555/2-30" target="_blank">>>2-30</a>

459動け動けウゴウゴ2ちゃんねる:2007/03/11(日) 20:51:40 ID:L60sUdWe0
>>456
スレ落ち後は次スレ追跡モードに差し替えるとかは?
460 株価【1000】 △△ ◆cZfSunOs.U :2007/03/11(日) 21:52:08 ID:DiueM2R90
>>459 そのためのデータを保持することになれば,結局データが膨張し続けることになるし,
またデータを保持せず on the fly に生成させるとなると,忙しくなりすぎて破綻しそうだし......
いずれにせよ,過去ログ用に別途専用鯖等のリソースを投入するとかでもない限り困難ではないかと......
461ひろゆき@どうやら管理人 ★:2007/03/12(月) 12:41:31 ID:???0 BE:265076-DIA(103258)
過去ログ用に固定テキストをひたすら保存するサーバがあっても
いいような気がしてきました。
つか、memoriesに同居とか。
462動け動けウゴウゴ2ちゃんねる:2007/03/12(月) 12:49:49 ID:Mzo4MlK10
>>461
memoriesそろそろ容量が少なくなってきてるらしいですよ・・・。
まあ、増設できるらしいですが・・・。
前にもらったtigerあまってないんですか?

それとbeのメール機能が時々おかしいので見てもらえるとうれしいです・・・。

463動け動けウゴウゴ2ちゃんねる:2007/03/12(月) 14:54:54 ID:AFyu+OQm0
なんかコストばっか掛かって利が無いような。
datにくっ付けちゃうってのはどうなの?できない?
464動け動けウゴウゴ2ちゃんねる:2007/03/12(月) 20:38:10 ID:rmdcm8FM0
>>460
「次スレ追跡する」ボタンみたいにワンクッションおくとかは?
見たい人だけ使う
465 株価【960】 △△ ◆cZfSunOs.U :2007/03/12(月) 20:51:43 ID:8usXw0FZ0
>>461 なるほど......ただ,memories だと HDD 容量もさることながら
httpd + offlaw.cgi なんかと競合しないかなぁ,とか(MySQL を
ストレスなく動かすには,メモリとかリソース結構食いますし).

>>462 残ってる stiger を専用で使うならリソースの競合とかは心配ないですね.
ただ,そんなに HDD 容量がデカいわけでもないんで...... とはいえ,
単にライブな dat のキーワードをコピーして保存するだけなら,
重要度計算用のデカいテーブル (regwords) は過去ログデータの方では
不要なんで,当面は心配ないかも.中長期的には問題ですが......
もっとも,問題が起きたらその時改めて考えよう,ということにしておけば
2ch らしいかも?w

>>463 dat にそういうデータを付けていいのかどうか,っていう
ポリシーの問題もあるかもですね.あと,dat 落ちを制御してる
F22 はいろいろ亜種ができてるらしいとかで,それぞれの鯖で
個別に F22 を改造しなきゃならないかも,っていうのも......
466 株価【960】 △△ ◆cZfSunOs.U :2007/03/12(月) 20:56:16 ID:8usXw0FZ0
>>464 ワンクッション置いても,データ保存するとすれば
結局データ量が増大することに変わりないですし,
on the fly に生成するにしても,今の p2.2ch.io / c2.2ch.io は
リアルタイムにキーワード抽出する前提で作ってないので
苦しいことには変わりないです.
467動け動けウゴウゴ2ちゃんねる:2007/03/12(月) 21:03:17 ID:AIFnMu+70
難しいかなって思うのもいいけど、がんがん試しちゃうのも吉。
もちろん試すのにいろいろ準備とかあって大変だとは思うけど。
468 株価【960】 △△ ◆cZfSunOs.U :2007/03/12(月) 21:33:42 ID:8usXw0FZ0
試すにしても,ライブ dat のキーワード表示に悪影響を与えると元も子もないんで......
なので,過去ログに対処するなら専用鯖等のリソース投入が前提じゃないかなぁと.
469 株価【960】 △△ ◆cZfSunOs.U :2007/03/12(月) 21:37:20 ID:8usXw0FZ0
まぁ,専用「鯖」でなくとも,今の c2 に過去ログ用にストレージ追加とかでもいいかもですけど.
470動け動けウゴウゴ2ちゃんねる:2007/03/13(火) 20:31:36 ID:rUlVQy5G0
スタートレックをスタートとレックで区切るのやめて欲しい
471 株価【1250】 △△ ◆cZfSunOs.U :2007/03/13(火) 22:58:42 ID:aGhE8Edp0
まぁ,意図してる訳じゃないけど MeCab がそう区切ってるってことで......>>470
472ひろゆき@どうやら管理人 ★:2007/03/14(水) 19:54:38 ID:???0 BE:403788-DIA(103258)
過去ログに関しては、関連キーワードが変更されることがないので、
スレッドkeyのテキストファイルを作って置いておくだけでいいと思うのです。
ってことで、mysqlはいらないかと。
473動け動けウゴウゴ2ちゃんねる:2007/03/14(水) 20:08:28 ID:LYxNhfWe0
しんぷるいずべすと、と。

ところで

>>472
なんかネタ落としてってw

ひろゆきを訴えたGJ会社員(35) 今度は毎日新聞を訴えてひろゆき涙目www
http://news23.2ch.net/test/read.cgi/news/1173860149/
474 株価【1095】 △△ ◆cZfSunOs.U :2007/03/14(水) 20:48:05 ID:e0bdMMl00
>>472 なるほど......となると,あとは memories 等に
どういう形で入れればいいか,またそれをどうやって read.cgi で
表示させるか,ってあたりですか.ぼちぼち考えてみます.
475ひろゆき@どうやら管理人 ★:2007/03/14(水) 21:55:27 ID:???0 BE:265267-DIA(103258)
XMLにしてjavascriptでincludeみたいなのって出来ないんでしたっけ?
476 株価【1000】 △△ ◆cZfSunOs.U :2007/03/15(木) 05:01:15 ID:VWGYvz9I0
>>475 XMLHttpRequest だと同一ドメイン(というか実質同一鯖)の制限がありますが,
JSON ならその制限なしで可能です.というか,read.html 用 I/F では今も JSON 的な
やり方でやってます.ただ,read.cgi だとブラウザ側の JavaScript の処理能力の不安があって......
477root▲▲ ★:2007/03/15(木) 13:05:40 ID:???0 BE:4104959-PLT(23632)
1台、それ用のサーバを用意するかんじですかね。

memoriesのHDDに常時書き込み負荷をかけるのは、
できれば避けたいかも。
478動け動けウゴウゴ2ちゃんねる:2007/03/15(木) 20:08:32 ID:/5nJizMU0
findたまに重いとか話出るけど冗長化しなくて大丈夫なの
ふらだんすに振るとか
479動け動けウゴウゴ2ちゃんねる:2007/03/15(木) 22:40:12 ID:BMqIkGm60 BE:140782032-2BP(112)
UNIX板のスレをOperaで見ると、今も >>184 の現象
| Operaだと関連キーワードやofuda.ccのあれととスレの一番上の全部や掲示板に戻るが重なって
| 掲示板に戻るがクリックできない。
なのですが、>>375-388 のは pc11 鯖には入ってないんでしょうか?
480ひろゆき@どうやら管理人 ★:2007/03/15(木) 22:58:59 ID:???0 BE:151564-DIA(103258)
HDDの速度がはやいハードウェアをどこかから調達するといい感じなんですかね。
T-Bananaサーバーの実験を手伝うって名目でなんとかしてもらうとか、、
481動け動けウゴウゴ2ちゃんねる:2007/03/15(木) 23:01:17 ID:MBGNf4P70
名目て
482ひろゆき@どうやら管理人 ★:2007/03/15(木) 23:04:15 ID:???0 BE:126454-DIA(103258)
大義名分ってやつですよ。えぇえぇ。
483フェンリル ◆Fenrir/gaQ :2007/03/15(木) 23:06:54 ID:Sg/SBOFd0 BE:140839632-PLT(15220)
自己板の規制解除しなさい
484 株価【1000】 △△ ◆cZfSunOs.U :2007/03/16(金) 06:49:26 ID:2y/u3Gvi0
>>479 pc11 = T-banana なので >>431 ということで......

# そろそろ http://qb5.2ch.net/test/read.cgi/operate/1172208065/797
# やってもいい頃じゃないか,って気もしないではないですが......


>>480 さっそく http://qb5.2ch.net/test/read.cgi/operate/1172208065/913 がw
ただ,過去ログ用の HDD でほしいのは速度より容量なんですよね.
# むむむさんの >>477 の真意は,「HDD にダメージを与えず長持ちさせたい」ってことじゃないかと.

T-banana のようにディスク I/O の性能が高く,かつ RAM もたくさん積んであるマシンなら,
むしろ MySQL でデカいデータをがんがん扱う用途の方が向いてそうな気がしますね,個人的には.
485root▲▲ ★:2007/03/16(金) 10:15:40 ID:???0 BE:2280555-PLT(23632)
>>484
> # むむむさんの >>477 の真意は,「HDD にダメージを与えず長持ちさせたい」ってことじゃないかと.

ですね。
memoriesはデータ格納時以外はほぼread onlyで使いたいなと。
486root▲▲ ★:2007/03/16(金) 10:17:32 ID:???0 BE:2463539-PLT(23632)
>>480
HDDの容量が20G台でいいなら、
今使っていないstigerを1台、それ用に割り当ててみるとかですが、
もっと必要なかんじですかね。
487ひろゆき@どうやら管理人 ★:2007/03/16(金) 12:59:57 ID:???0 BE:95235-DIA(103258)
必要なHDD容量の算定からはじめてみますか。

488 株価【950】 △△ ◆cZfSunOs.U :2007/03/16(金) 19:36:54 ID:2y/u3Gvi0
「各スレ単位で必要な容量 x 過去ログ発生速度」で,どれだけの期間持つか,てな感じですか.

データを .js のように直接表示できる形で保存するとサイズは大きくなるが CPU の仕事は少ない,
一方 CSV のような形で保存するとサイズは小さくなるが表示する際の CPU の仕事が増える,と.
まぁ CPU の仕事が増えるといっても,現状 p2.2ch.io 1台で全ライブスレの
getf.cgi 表示させてるぐらいなので,stiger を専用で割り当てるなら問題ないと思いますが.

ただ,各スレ単位でファイル作ると,HDD 消費はバイト単位でなくフラグメントサイズ単位になるんですよね.
HDD スペースの利用効率を向上させるには,1ファイルに複数のスレのデータを書き込んだ方がいいのか.
その代わり,必要なデータを検索する仕事が増えると.1ファイルに書き込みつつ
検索も効率的にするには......結局 MySQL を使うとかなるのかな.
489ひろゆき@どうやら管理人 ★:2007/03/16(金) 22:31:20 ID:???0 BE:152238-DIA(103260)
freebsdのフラグメントサイズってどれくらいなんですか?
490動け動けウゴウゴ2ちゃんねる:2007/03/16(金) 22:52:28 ID:9GMYZRZqP BE:681723397-PLT(35567)
ひーさん2証なんとか汁><。
491root▲▲ ★:2007/03/16(金) 22:58:22 ID:???0 BE:1460328-PLT(23632)
>>489
デフォルトでは16k(16384)ですね。

man newfs
...
-b block-size
The block size of the file system, in bytes. It must be a power
of 2. The default size is 16384 bytes, and the smallest allow-
able size is 4096 bytes. The optimal block:fragment ratio is
8:1. Other ratios are possible, but are not recommended, and may
produce poor results.

4k まで小さくできますが、あんまりおすすめしないかも。
492 ◆Choco52.ko :2007/03/16(金) 23:27:05 ID:qjJyqUxr0
専門な話題なので横槍!
フラグメントサイズはブロックサイズを8分の1したものがデフォルトで使われるので 2k(2048)バイト ではないかと。
newfs -b 16384 -f 2048 のように指定されているはずか、オプションなしのどちらかですね。

man newfs

-f frag-size
ファイルシステムのフラグメントサイズをバイト単位で指定します。
blocksize/8 から blocksize までの範囲の、2 のべき乗である必要があります。
デフォルトは 2048 バイトです。
493root▲▲ ★:2007/03/16(金) 23:48:12 ID:???0 BE:2463539-PLT(23632)
>>492
確かに、フラグメントサイズとブロックサイズは別物ですね。
ご指摘&補足すみませんです。
494ひろゆき@どうやら管理人 ★:2007/03/17(土) 12:36:35 ID:???0 BE:403788-DIA(103270)
過去ログのファイル数ってどれくらいなんすかね。。
495 株価【960】 △△ ◆cZfSunOs.U :2007/03/17(土) 19:55:25 ID:2JLdzq820
各板のライブスレ数は大きく変動しないという前提なら,
過去ログ発生速度≒新スレが立つ速度
なのかなぁ......
496動け動けウゴウゴ2ちゃんねる:2007/03/17(土) 22:31:56 ID:QoCeQg460
これどういうシステムなの?
どうやったら反映されるの?
497動け動けウゴウゴ2ちゃんねる:2007/03/19(月) 11:31:06 ID:DEGsDWtn0
スレ内の全レスから単語抽出、DB化して、一定の条件で最頻と思われる
単語を表示させる。
498動け動けウゴウゴ2ちゃんねる:2007/04/01(日) 17:25:54 ID:azmkmmMB0
>133
多分92のキーワードというのがスレの関連した語句になるので、それの検索は考えています。
自動的に"「74」「SevenFour」"など関連した語句の摘出は、ネタとしては面白いのですが、
難易度が高いというか、スレ名によっては多分バカ検索になるので、やるとしても実験的な機能としての
実装になります。多分正解は134さんが書かれているスレッド検索に正規表現をサポートでしょう。

>135
いろいろ作っていますが、どれも中途半端でして、、、

>136-139
先にも書きましたが、弱いとか、上手くいかないのではなく、元々対応していないというのが正解のようです。
今回版で一応修正しましたので、御報告いただければ助かります。

>141
>●対応って、面倒なの?
有償アカウントが必要なんですよね? いまのところ対応予定無しです。
>それと、まちBBSとかが見れないんだけど
過去ログを見ると2chに完全対応したら対応させる等書かれていましたので、メニューのトップには
表示されていますが、対応していません。対応させたいのですが、他が優先順位が高いので調査等保留状態です。

>142
すみません。ちょっと意味が判りません。

>143
まだ考え中ですが、本体側ではスレへアクセスの時に毎回キーワード取得してデータベースに溜めていきます。
あとキーワードを入力するIFを用意してユーザーからも入力が可能とします。
js側のAPIはデータベースへアクセスするsfSystem.getKeywordsとsfSystem.setKeywordを用意します。
溜められたデーターは検索やスマートボードに使ったり出来ます。
データベース内の削除は必要かなぁ。と 時間がなかなか取れないので、そんな感じで止っています。
499498:2007/04/01(日) 17:29:44 ID:azmkmmMB0
あう、誤爆すまん。
500動け動けウゴウゴ2ちゃんねる:2007/04/01(日) 21:24:12 ID:E7umBdRz0
501動け動けウゴウゴ2ちゃんねる:2007/04/06(金) 19:29:06 ID:vyYNJZL70
同じキーで何回も検索するとヒット数がまちまちになるぞ
ヒットしたりしなかったりするスレがある模様
502nanasi:2007/04/07(土) 17:34:36 ID:fHLFxxU/0
>>60

503動け動けウゴウゴ2ちゃんねる:2007/04/25(水) 18:23:22 ID:0Clz8p7L0
>>497
スレ内に一度も出てない単語はキーワードとして表示されないの?
504 株価【900】 △△ ◆cZfSunOs.U :2007/04/26(木) 08:35:10 ID:Hogck5gy0
>>503 そういうことになってます.
505動け動けウゴウゴ2ちゃんねる:2007/04/27(金) 18:31:25 ID:3Jd+uTfZ0
これもひでえなあ
ろう じろう しま があってしまじろうがないw
http://p2.2ch.io/getf.cgi?http://game11.2ch.net/test/read.cgi/amusement/1163256789/l50
506動け動けウゴウゴ2ちゃんねる:2007/04/28(土) 23:33:49 ID:atmqjoj00
ひらがなとカタカナの2字ははじこうぜ
507動け動けウゴウゴ2ちゃんねる:2007/04/30(月) 01:25:58 ID:2vpscozg0
アイコンスレでアイコって酷くね
http://p2.2ch.io/getf.cgi?http://bubble6.2ch.net/test/read.cgi/2chse/1163082315/701-800
無論無関係なスレばかりヒット&元のスレもヒットせず

リザルトがないのとかあってもまるで関連性のないやつは除外できないんかね
508 株価【780】 △△ ◆cZfSunOs.U :2007/04/30(月) 17:33:19 ID:aNOXlsrQ0
前後の状況によって「アイコン」の区切りはまちまちになるみたいですねぇ<MeCab

【Be】アイコン売買促進スレ★7【icon】
【 記号,括弧開,*,*,*,*,【,【,【
Be 名詞,固有名詞,組織,*,*,*,*
】 記号,括弧閉,*,*,*,*,】,】,】
アイコン 名詞,固有名詞,一般,*,*,*,*
売買 名詞,サ変接続,*,*,*,*,売買,バイバイ,バイバイ
促進 名詞,サ変接続,*,*,*,*,促進,ソクシン,ソクシン
スレ 名詞,一般,*,*,*,*,*
★ 記号,一般,*,*,*,*,★,★,★
7 名詞,数,*,*,*,*,*
【 記号,括弧開,*,*,*,*,【,【,【
icon 名詞,固有名詞,組織,*,*,*,*
】 記号,括弧閉,*,*,*,*,】,】,】
EOS

2ちゃんねる beアイコン サイト
2 名詞,数,*,*,*,*,2,ニ,ニ
ちゃん 名詞,接尾,人名,*,*,*,ちゃん,チャン,チャン
ねる 動詞,自立,*,*,一段,基本形,ねる,ネル,ネル
be 名詞,固有名詞,組織,*,*,*,*
アイコン 名詞,一般,*,*,*,*,*
サイト 名詞,一般,*,*,*,*,サイト,サイト,サイト
EOS

アイコン全リスト、販売者登録所、価格情報ほか
アイコ 名詞,固有名詞,一般,*,*,*,アイコ,アイコ,アイコ
ン 名詞,非自立,一般,*,*,*,ン,ン,ン
全 接頭詞,名詞接続,*,*,*,*,全,ゼン,ゼン
リスト 名詞,一般,*,*,*,*,リスト,リスト,リスト
、 記号,読点,*,*,*,*,、,、,、
販売 名詞,サ変接続,*,*,*,*,販売,ハンバイ,ハンバイ
者 名詞,接尾,一般,*,*,*,者,シャ,シャ
登録 名詞,サ変接続,*,*,*,*,登録,トウロク,トーロク
所 名詞,接尾,一般,*,*,*,所,ショ,ショ
、 記号,読点,*,*,*,*,、,、,、
価格 名詞,一般,*,*,*,*,価格,カカク,カカク
情報 名詞,一般,*,*,*,*,情報,ジョウホウ,ジョーホー
ほか 名詞,副詞可能,*,*,*,*,ほか,ホカ,ホカ
EOS

アイコンショッパー
アイコンショッパー 名詞,固有名詞,組織,*,*,*,*
EOS

他板のアイコンスレ(2ちゃんねる検索)
他 接頭詞,名詞接続,*,*,*,*,他,タ,タ
板 名詞,一般,*,*,*,*,板,イタ,イタ
の 助詞,連体化,*,*,*,*,の,ノ,ノ
アイコンスレ 名詞,一般,*,*,*,*,*
( 記号,括弧開,*,*,*,*,(,(,(
2 名詞,数,*,*,*,*,2,ニ,ニ
ちゃん 名詞,接尾,人名,*,*,*,ちゃん,チャン,チャン
ねる 動詞,自立,*,*,一段,基本形,ねる,ネル,ネル
検索 名詞,サ変接続,*,*,*,*,検索,ケンサク,ケンサク
) 記号,括弧閉,*,*,*,*,),),)
EOS
509動け動けウゴウゴ2ちゃんねる:2007/05/03(木) 16:13:12 ID:X+h1qUif0
カタカナやひらがなで直後にンが来る語句は
ンの直前で区切っちゃいけないんじゃないの
510動け動けウゴウゴ2ちゃんねる:2007/05/13(日) 23:52:21 ID:MYLVfRHs0
あと拗音とか促音の直前で区切るのも
http://anime2.2ch.net/test/read.cgi/anime3/1164732724/l50
511 株価【900】 △△ ◆cZfSunOs.U :2007/05/14(月) 00:28:23 ID:m8V1KKDb0
まぁ,単語の区切りは http://mecab.sourceforge.net/ に依存してますからねぇ......
512p3084-ip01kyoto.kyoto.ocn.ne.jp:2007/05/15(火) 16:20:44 ID:lac4/GYb0
syosinsya
513動け動けウゴウゴ2ちゃんねる:2007/05/16(水) 02:45:21 ID:hDvpyprTO
とまと
514動け動けウゴウゴ2ちゃんねる:2007/07/03(火) 00:54:54 ID:jUIBhvnj0
515動け動けウゴウゴ2ちゃんねる:2007/07/11(水) 19:21:02 ID:YcnBJDt20
メンテ予告とかメンテ中の表示とかすこしは工夫すればいいのに
516 ◆0Two/OnDrg :2007/07/19(木) 06:18:32 ID:oNNrBCU9O
だね
517':2007/07/26(木) 13:46:00 ID:SSKwDJ+BO
ぴろゆきどこにいるんですか??
518動け動けウゴウゴ2ちゃんねる
あのさクリックされたのとか実際に検索で使われてるやつの優先度あげない?