1 :
名無しさん@ディストリいっぱい :
2001/05/07(月) 05:02 この板の過去ログを検索したくても不便です。
そこでnamazuを使って検索用のサーバーを立てようと思います。みんなのために。
namazuのインストールは終了しました。動作もばっちりです。
ただログを収集するのが大変です。
自動的にログを収集してくれるスクリプトってないですか?
っていうかそんなの持ってる人いたらください。
あと
http://cocoa.2ch.net/linux/dat/ ↑ここからログを拾うとdatファイル形式なのでhtmlで表示されません。
ログはどこから拾ってくればいいんでしょうか?
html形式で保存されているほうが何かと便利なんですけど。
2 :
名無しさん@ディストリいっぱい :2001/05/07(月) 05:07
なければつくる
4 :
名無しさん@ディストリいっぱい :2001/05/07(月) 05:14
5 :
名無しさん@お腹いっぱい。 :2001/05/07(月) 05:24
6 :
名無しさん@お腹いっぱい。 :2001/05/07(月) 11:32
7 :
名無しさん@お腹いっぱい。 :2001/05/07(月) 11:33
>>3 そりゃそうなんだけど、せっかくlinux板のための建設的な意見を
出してくれているんだから、なければおまえがつくれ、ではなくて、
ここでみんなでスクリプトを作っちゃえ!というくらいの勢いが
あってもいいかもしれない。
応援age
9 :
名無しさん@お腹いっぱい。 :2001/05/07(月) 11:35
agaってなかった、、再age
10 :
名無しさん@お腹いっぱい。 :2001/05/07(月) 11:38
>>4 まさか、収集するのは Windows のマシンではないだろうから、
そのソフトを使うのは無理では。shell とか C とか perl
とか、なんでもいいけど普通にスクリプトで動かせる dat2html
って、まだ誰も作ってないのかな。
誰かつくりません?
11 :
名無しさん@お腹いっぱい。 :2001/05/07(月) 11:49
datファイルから直接 index を作成するためには、
1.
http://cocoa.2ch.net/linux/dat/ から dat ファイルを拾う
2. 1. で拾ったファイルを、***.dat といったファイルから
*** というファイル (.html はいらない)へ、dat2html で
html 変換する(別ディレクトリへ)
3. 変換されたファイルに対して、mknmz
4. その index から、.namazurc にて
REPLACE REPLACE $indexdir/
http://cocoa.2ch.net/test/read.cgi?bbs=linux&key= といった変換をすればよい
過去ログ倉庫から index を作成するのは、そのまま wget,
mknmz のみで一発でいける。
問題は、両者を統合した index を作るときだけど、namazu
をよく調べれば、こういった場合の .namazurc の書き方は
おそらくあるはず。詳しい人、さらにフォロー頼む。
12 :
名無しさん@お腹いっぱい。 :2001/05/07(月) 12:00
super age
13 :
名無しさん@お腹いっぱい。 :2001/05/07(月) 12:36
>>10 実際、ここでログを過去ログ倉庫送りする際に、dat2htmlスクリプトを
使っているはずなので、2chのサーバーのどこかに dat2html が存在して
いることはたしかです。それがどこにも公開されていないとすれば、
プログラムがある程度できる人ならばそんなに難しいスクリプトでは
ないでしょうから、作ってしまった方がいいかもしれませんね。
誰か、dat2htmlを作ってここに書きこんでくださる方はいませんか。
適当だが
>>13 $cnt=1;
# ここで適当なHTMLヘッダを出す
$fff=shift;
open(TH,$fff) || die "open error\n";
$_=<TH>;
chop $_;
$num=@dat=split(',',$_);
print "<title>".$dat[4]."</title>\n";
print '</HEAD>'."\n";
print '<BODY TEXT="#000000" BGCOLOR="#FFFFFF" link="#0000FF" alink="#FF0000" vli
nk="#660099">'."\n";
print $cnt.":".$dat[0]."(";
print $dat[1].") ";
print "date:".$dat[2]."<br>\n";
print $dat[3]."<br><br><br>\n";
$cnt++;
while(<TH>){
chop $_;
$num=@dat=split(',',$_);
print $cnt.":".$dat[0]."(";
print $dat[1].") ";
print "date:".$dat[2]."<br>\n";
print $dat[3]."<br><br><br>\n";
$cnt++;
}
print '</body></HTML>'."\n";
15 :
名無しさん@お腹いっぱい。 :2001/05/07(月) 13:02
16 :
名無しさん@お腹いっぱい。 :2001/05/07(月) 13:45
age
namazuの開発が沼津で行われてたってのは実話?
19 :
名無しさん@お腹いっぱい。 :2001/05/07(月) 14:06
支障のオナニースレと三流大スレとrh叩きスレの下にあるのは言語道断。 この板で今生きている唯一の良スレだ。常に上にあるべき。age
20 :
14 :2001/05/07(月) 14:26
>>17 その辺は修正してくれ、10分で書いたやつだからと言い訳
21 :
名無しさん@お腹いっぱい。 :2001/05/07(月) 14:47
テストランしてないけど、
#!/bin/sh
export dat2html=/usr/local/bin/dat2html.pl
export workdir=/home/2ch
export wgetdir=$workdir/wget
export datdir=$wgetdir/linux/dat
export namazudir=$workdir/namazu
cd $wgetdir
wget -m -I linux/dat
http://cocoa.2ch.net/linux/dat/ for i in `ls $datdir`
do
j=`echo i | sed -e 's/.*\.dat//'`
cat $datdir/$i | $dat2html > $wgetdir/'cocoa.2ch.net/test/read.cgi?bbs=linux&key='$j
done
rm -rf $wgetdir/linux/dat
wget -m I linux/kako
http://cocoa.2ch.net/linux/kako/ cd $namazudir
mknmz -eU $wgetdir/
22 :
名無しさん@お腹いっぱい。 :2001/05/07(月) 14:48
こんな感じのスクリプトを動かせば、
REPLACE $wgetdir
http:// で動くかも。
23 :
名無しさん@お腹いっぱい。 :2001/05/07(月) 15:10
>>21 typoを2箇所発見。diff とるまでもないので、修正したスクリプトを
そのまま貼りつける。
# 今、Linuxが手元にないので、誰かテスト頼む
#!/bin/sh
export dat2html=/usr/local/bin/dat2html.pl
export workdir=/home/2ch
export wgetdir=$workdir/wget
export datdir=$wgetdir/linux/dat
export namazudir=$workdir/namazu
cd $wgetdir
wget -m -I linux/dat
http://cocoa.2ch.net/linux/dat/ for i in `ls $datdir`
do
j=`echo $i | sed -e 's/.*\.dat//'`
cat $datdir/$i | $dat2html > $wgetdir/'cocoa.2ch.net/test/read.cgi?bbs=linux&key='$j
done
rm -rf $wgetdir/linux/dat
wget -m -I linux/kako
http://cocoa.2ch.net/linux/kako/ cd $namazudir
mknmz -eU $wgetdir/
24 :
名無しさん@お腹いっぱい。 :2001/05/07(月) 15:15
25 :
名無しさん@お腹いっぱい。 :2001/05/07(月) 15:24
>>20 実際にソースを書いて晒している。とても偉い!
この板で偉くても自慢にならないところが珠に傷か
26 :
名無しさん@お腹いっぱい。 :2001/05/07(月) 15:24
27 :
名無しさん@お腹いっぱい。 :2001/05/07(月) 15:32
おお、なんだかすごいことになりそうな予感。
ここまでくれば、実際に
>>1 にテストしてもらって、
不具合があればここでわいわいやればあっという間に
出来そう。
>>1 サーバーの負荷がはたしてどこまで
耐えられるか。この板だけならば、それほどでもないかな。
28 :
名無しさん@お腹いっぱい。 :2001/05/07(月) 15:44
>>23 私もちょっとテストしてみましたが、
j=`echo $i | sed -e 's/.*\.dat//'`
のところは
j=`echo $i | sed -e 's/\.dat//'`
の誤りのようです。
最新バージョン
#!/bin/sh
export dat2html=/usr/local/bin/dat2html.pl
export workdir=/home/2ch
export wgetdir=$workdir/wget
export datdir=$wgetdir/linux/dat
export namazudir=$workdir/namazu
cd $wgetdir
wget -m -I linux/dat
http://cocoa.2ch.net/linux/dat/ for i in `ls $datdir`
do
j=`echo $i | sed -e 's/\.dat//'`
cat $datdir/$i | $dat2html > $wgetdir/'cocoa.2ch.net/test/read.cgi?bbs=linux&key='$j
done
rm -rf $wgetdir/linux/dat
wget -m -I linux/kako
http://cocoa.2ch.net/linux/kako/ cd $namazudir
mknmz -eU $wgetdir/
29 :
名無しさん@お腹いっぱい。 :2001/05/07(月) 16:43
その前に1は生きてるのか?
30 :
1 :2001/05/07(月) 17:55
死にました
32 :
名無しさん@ディストリいっぱい :2001/05/07(月) 20:09
うおっ!!!こんなにレスがついてる!!朝は放置されてたのにーーー しかも!!スクリプト完成してる!!!カンドー でも・・僕のような初心者にこれは・・・どこか遠くに逃げたい・・
>>32 1か?本当に1か?ちゃんとやるんだろうな?
まさか見通しも立てないでただスレ立てたんじゃないよな?
だとしたら逝け。いや、マジで。リアルで逝け。
34 :
名無しさん@お腹いっぱい。 :2001/05/07(月) 20:26
とりあえず落ち着け。難しいことは書いてないぞ。 スクリプトまでできてるんだから、あとは動かすだけだ。
35 :
名無しさん@お腹いっぱい。 :2001/05/07(月) 20:29
シェルスクリプトの環境変数くらいはいじっておくように。
36 :
名無しさん@ディストリいっぱい :2001/05/07(月) 20:39
僕が今やったこと。
>>14 さんのdat2htmlをdat2html.plにリネームして/usr/local/bin/に入れた。
>>28 さんのスクリプトを2ch.shにリネームして/home/2ch/に入れた。
両方のパーミッションを755にした。
意気揚揚としてコマンド打った。
2ch.sh!!!!
し〜ん。
僕・・・この場から逃げたい・・・
37 :
名無しさん@ディストリいっぱい :2001/05/07(月) 20:45
反応がない・・もしかしてみんな・・僕を変な目で見てる??? あ〜逃げたい〜
38 :
名無しさん@ディストリいっぱい :2001/05/07(月) 20:46
まさかこんなに盛り上がると思わなかったよ〜〜〜 責任が重い・・
39 :
名無しさん@お腹いっぱい。 :2001/05/07(月) 21:01
し〜んって、エラーメッセージもなにも表示されず? プログラムは終了したのか、それとも固まったのか? それから、wget はインストールされてるか? 反応がないって、そりゃ6分間で反応が返ってくるとは 限らないぞ。気長に待て。
40 :
名無しさん@お腹いっぱい。 :2001/05/07(月) 21:03
それから、date2html.pl の先頭に #!/usr/bin/perl (パスは直して) を加えて、 chmod +x /usr/local/bin/date2html.pl をすることも忘れずに。スクリプトを、perl $date2html と直してもどちらでも可能。
41 :
名無しさん@お腹いっぱい。 :2001/05/07(月) 21:13
なにも反応がないというのが気にかかるのだけど、あとかんがえられると したら、wget とか mknmz のパス設定かな?/usr/local/bin あたりに インストールされていると、スクリプトをフルパスで指定するように 書き換えないといけない。wget -> /usr/local/bin/wget, mknmz -> /usr/local/bin/mknmz などと、フルパスで書き換えて みるといい。環境変数で設定しておく方がきれいだけど、動けば良し。
42 :
名無しさん@ディストリいっぱい :2001/05/07(月) 21:20
>>39 さん
bash:2ch.sh: command not found
で止まります。さっきまでは
bash:
し〜ん
だったのに・・さっきまでのほうがまだよかったのかなあ・・
>>40 さん
#!/usr/bin/perl
ですね・・
#!/usr/local/bin/perl
って書いてました・・ありがとうございます。
43 :
名無しさん@お腹いっぱい。 :2001/05/07(月) 21:23
2ch.shにパスが通ってないとか。 /home/2ch/2ch.sh で実行できない?
44 :
名無しさん@ディストリいっぱい :2001/05/07(月) 21:51
>>41 さん
wget と mknmz は /usr/bin/ にインストールされてました。
>>43 さん
それでもダメです・・・
んで、しょうがないから dat2hmtl.pl を /usr/bin/ に移動して 2ch.sh の
export dat2html=/usr/local/bin/dat2html.pl
の行を
export dat2html=/usr/bin/dat2html.pl
に書き換えました。問題ないですよね?
考えます。悩みます。せっかくみんなが作ってくれたんだから頑張ります。
45 :
名無しさん@ディストリいっぱい :2001/05/07(月) 22:03
走った!!!走りました!!!すごいっす!!!全自動!!!これでいけるぞー!! sh 2ch.sh だったんですね・・・すみません・・お騒がせしました・・
46 :
名無しさん@ディストリいっぱい :2001/05/07(月) 22:08
ありゃ?datファイルを全てダウンロードしたところで止まった・・ コピペした時に変なところに改行が入ったのかなあ・・また悩まなきゃ・・
47 :
名無しさん@お腹いっぱい。 :2001/05/07(月) 22:10
おお、動きましたか、良かったですね。 ところで、私も、今テストしてみましたが、2ch.shから dat2htmlを呼び出すところで、標準入力ではなく ファイル名指定となっているようで、 $dat2html $datdir/$i > $wgetdir/'cocoa.2ch.net/test/read.cgi?bbs=linux&key='$j と書きなおさないといけないようです。 あとは、適宜 mkdir -p とか入れておくといいですね。
48 :
名無しさん@お腹いっぱい。 :2001/05/07(月) 22:13
かぶりましたね。
>>47 に書いたような次第です。
ちなみに、コンバートにはある程度時間がかかりますよ。
一応、ちょこっといじらせていただいたので、コピーします。
#!/bin/sh
export dat2html=/usr/bin/dat2html.pl
export workdir=/home/2ch
export wgetdir=$workdir/wget
export datdir=$wgetdir/cocoa.2ch.net/linux/dat
export namazudir=$workdir/namazu
mkdir -p $wgetdir/cocoa.2ch.net/test
cd $wgetdir
wget -m -I linux/dat
http://cocoa.2ch.net/linux/dat/ for i in `ls $datdir`
do
j=`echo $i | sed -e 's/\.dat//'`
$dat2html $datdir/$i > $wgetdir/'cocoa.2ch.net/test/read.cgi?bbs=linux&key='$j
done
rm -rf $wgetdir/linux/dat
wget -m -I linux/kako
http://cocoa.2ch.net/linux/kako/ mkdir -p $namazudir
cd $namazudir
mknmz -eU $wgetdir/
49 :
名無しさん@ディストリいっぱい :2001/05/07(月) 22:28
'ch.sh: syntax error near unexpected token 'do 'ch.sh: 2ch.sh: line 14: 'do で、やっぱり止まります・・・僕だけですか???
50 :
名無しさん@お腹いっぱい。 :2001/05/07(月) 22:38
doでとまるとは摩訶不思議。 その上の for あたりがおかしいのか、いったいどういう ことなんだろう?
51 :
名無しさん@ディストリいっぱい :2001/05/07(月) 23:00
元々ある2chというフォルダと別に新しく2chというフォルダができてしまうのですが これは一時的にファイルを保存するためのフォルダですか? 同じ名前のフォルダができるのでややこしいです・・・ do で止まっちゃう・・doしよー!!
52 :
名無しさん@お腹いっぱい。 :2001/05/07(月) 23:01
for の構文って、これでいいんだっけ。 for i in `ls $datdir` do j=`echo $i | sed -e 's/\.dat//'` $dat2html $datdir/$i > $wgetdir/'cocoa.2ch.net/test/read.cgi?bbs=linux&key='$j done といった感じで、do の後に1行に書かない? どうだったかと思って試してみたら、行を分けても分けなくても、 どちらでも動きましたが。(^^;
53 :
名無しさん@ディストリいっぱい :2001/05/07(月) 23:01
ていうかまさか3回目やると3個できて4回やると4個とかにならないですよね? ていうかやってみればいいのか。やってみます・・・
54 :
名無しさん@ディストリいっぱい :2001/05/07(月) 23:07
>>52 そういう構文になるんですね。止まった原因がなんとなくわかりました。
僕はここのカキコをコピペして秀丸に貼り付けてるんですけど各行の後ろに
一文字分空白が入ってしまうのでそれを全て削除してました。
do の後ろの空白も。たぶんそれが原因だったかもしれません・・
55 :
名無しさん@ディストリいっぱい :2001/05/07(月) 23:13
2ch.sh: line24: syntax error: unexpected end of file 今度は24行目で止まっちゃいました・・一難去ってまた一難。 ていうか html の書き出しをやってくれてないような気が・・んー。 3つ目の 2ch フォルダは生成されなかったです。あーよかった。
56 :
名無しさん@ディストリいっぱい :2001/05/07(月) 23:28
24行目で止まったのは終わったから止まったみたいでした・・すみません。僕はアホです・・ また明日続きをやってみようと思います。どうもありがとうございました。 お昼に盛り上げてスクリプト作ってくれた方々もありがとうごさいました。 では寝ます。おやすみなさい。
57 :
名無しさん@お腹いっぱい。 :2001/05/08(火) 00:45
うまくいくといいな。
58 :
名無しさん@お腹いっぱい。 :2001/05/08(火) 10:21
,まわり,用,テスト,でーた,,,,, ,
60 :
名無しさん@お腹いっぱい。 :2001/05/08(火) 11:32
ソースはEUCに変換してから使ってね $cnt=1; print '<HTML><HEAD>'."\r\n"; print '<META HTTP-EQUIV="Content-Type" CONTENT="text/html; CHARSET=EUC-JP">'."\n"; $fff=shift; open(TH,"/usr/local/bin/nkf -e $fff |") || die "open error\n"; $_=<TH>; chop $_; @dat=split(',',$_); print "<TITLE>".$dat[4]."</TITLE>\r\n"; print '</HEAD>'."\n"; print '<BODY TEXT="#000000" BGCOLOR="#FFFFFF" link="#0000FF" alink="#FF0000" vlink="#660099 ">'."\r\n"; print $cnt.":".$dat[0]."("; print $dat[1].") "; print "date:".$dat[2]."<BR>\r\n"; print $dat[3]."<BR><BR><BR>\r\n"; $cnt++; while(<TH>){ chop $_; @dat=split(',',$_); $dat[0]=~s/,/,/g; $dat[1]=~s/,/,/g; $dat[3]=~s/,/,/g; print $cnt.":".$dat[0]."("; print $dat[1].") "; print "date:".$dat[2]."<BR>\r\n"; print $dat[3]."<BR><BR><BR>\r\n"; $cnt++; } print '</BODY></HTML>'."\r\n";
61 :
名無しさん@お腹いっぱい。 :2001/05/08(火) 12:00
$dat[0]=~s/,/,/g; は '@'+'`'を','に置換するが化けている
62 :
名無しさん@ディストリいっぱい :2001/05/08(火) 20:26
うにゃー。あいかわらずhtmlファイルが生成されないなあ。 でもdatファイルはダウンロードできたからdat2htmlだけ単独で実行すれば 変換されるのかなあ。よくわかんないです・・ unix板のファイルもいただいておこっと。参考にはなるだろうから。
63 :
名無しさん@ディストリいっぱい :2001/05/08(火) 20:38
あーーー!!あったー!! /root/linux に入ってたーーー!! すみません。あいかわらずマヌケで。しかしなんでこんなところに・・ ってことはindexも作成されてるのかなあ。どのディレクトリにあるんだろ・・(^^;;
と思ったらこれは昼間会社で集めて送ったファイルだった・・ もうダメ・・ネボけてるかも・・
65 :
名無しさん@お腹いっぱい。 :2001/05/08(火) 21:01
まさにオープンソースだね! Linuxの本来あるべき姿だよ♪
66 :
名無しさん@お腹いっぱい。 :2001/05/08(火) 21:37
まずは、単独で dat2html の動作確認を。 dat2html.pl datファイルのファイル名 > 出力ファイル名 で、htmlファイルが出力されますか? indexは、/home/2ch/namazu に生成されているはず。
67 :
名無しさん@ディストリいっぱい :2001/05/08(火) 21:40
せっかくみんなに作ってもらったんだから今週末には公開できるように頑張ります!!
68 :
名無しさん@ディストリいっぱい :2001/05/08(火) 21:42
>>66 さん
あ、ありがとうございます。今から動作確認してみます。
69 :
名無しさん@ディストリいっぱい :2001/05/08(火) 21:52
>>66 さん
ちゃんとファイルはできました。
だけど8.2kのdatファイルが422バイトになってたのでうまくは動作してないような
気がします。中身の真っ白だったし・・
70 :
名無しさん@お腹いっぱい。 :2001/05/09(水) 07:21
うまくいくといいな♪
71 :
名無しさん@お腹いっぱい。 :2001/05/09(水) 10:52
サーバが違うと区切り文字が違うので、それに対応 パラメタが区切り文字列、区切り文字列の置換文字列、datファイル名となります Linux板なら /〜/dat2html.pl "," "\xa1\xf7\xa1\xae" foo.dat モナー、ラウンジなら /〜/dat2html.pl '<>' "" bar.datと指定してください $sep=shift; $rep=shift; print '<HTML><HEAD>'."\r\n"; print '<META HTTP-EQUIV="Content-Type" CONTENT="text/html; CHARSET=EUC-JP">'."\r\n"; $fff=shift; open(TH,"/usr/local/bin/nkf -e $fff |") || die "open error\n"; $_=<TH>; chop $_; @dat=split($sep,$_); $dat[0]=~s/$rep/,/g if("${rep}"); $dat[1]=~s/$rep/,/g if("${rep}"); $dat[3]=~s/$rep/,/g if("${rep}"); $dat[4]=~s/$rep/,/g if("${rep}"); print "<TITLE>".$dat[4]."</TITLE>\r\n"; print '</HEAD>'."\n"; print '<BODY TEXT="#000000" BGCOLOR="#FFFFFF" link="#0000FF" alink="#FF0000" vlink="#660099">'."\r\n" ; print "1:".$dat[0]."("; print $dat[1].") "; print "date:".$dat[2]."<BR>\r\n"; print $dat[3]."<BR><BR><BR>\r\n"; $cnt=2; while(<TH>){ chop $_; @dat=split($sep,$_); $dat[0]=~s/${rep}/,/g if("${rep}"); $dat[1]=~s/${rep}/,/g if("${rep}"); $dat[3]=~s/${rep}/,/g if("${rep}"); print $cnt.":".$dat[0]."("; print $dat[1].") "; print "date:".$dat[2]."<BR>\r\n"; print $dat[3]."<BR><BR><BR>\r\n"; $cnt++; } print '</BODY></HTML>'."\r\n"; exit;
クーン (どうしましょ)
73 :
名無しさん@お腹いっぱい。 :2001/05/09(水) 15:44
せっかくならば、UNIX板と同時に検索できるインデックスを作るとかも できますね。とりあえず、Linux板のみで成功するかどうかやって みましょう。 任意の複数板のインデックス作成用スクリプトを作っておけば、他の 板でも使うかも。スクリプト自体は、サーバー名と板名を変数に して、板一覧ファイルから while read server ita とかするだけ なので、ちょこちょこっといじれば終わりそう。
74 :
名無しさん@お腹いっぱい。 :2001/05/09(水) 15:48
頑張れーーー。。(@@;)
75 :
名無しさん@お腹いっぱい。 :2001/05/09(水) 18:02
>>71 バグ見っけた
$dat[0]=~s/$rep/,/g は、
$dat[0]=~s/$rep/$sep/g だな、以下同文
76 :
71 :2001/05/09(水) 18:14
77 :
名無しさん@お腹いっぱい。 :2001/05/10(木) 13:20
78 :
名無しさん@お腹いっぱい。 :2001/05/10(木) 14:01
この死に体と化した板に、こんなスレは似つかわしく ないな。即刻 UNIX 板に移動すべし。
>>79 そうか?
この混沌とした状況が好きだよ
このスレとか質問系のスレは余りあれないから皆判ってやっているんだと思う
81 :
名無しさん@お腹いっぱい。 :2001/05/10(木) 15:53
>>1 もう少しだ頑張れ
つーことで最新版をまとめてみました(ちょい長)
>>48 からの2ch.shのソースに
>>71 のdat2html.plI/F変更を加えたもの
#!/bin/sh
export dat2html=/usr/bin/dat2html.pl
export workdir=/home/2ch
export wgetdir=$workdir/wget
export datdir=$wgetdir/cocoa.2ch.net/linux/dat
export namazudir=$workdir/namazu
mkdir -p $wgetdir/cocoa.2ch.net/test
cd $wgetdir
wget -m -I linux/dat
http://cocoa.2ch.net/linux/dat/ for i in `ls $datdir`
do
j=`echo $i | sed -e 's/\.dat//'`
$dat2html "," "\xa1\xf7\xa1\xae" $datdir/$i > $wgetdir/'cocoa.2ch.net/test/read.cgi?bbs=linux&key='$j
done
rm -rf $wgetdir/linux/dat
wget -m -I linux/kako
http://cocoa.2ch.net/linux/kako/ mkdir -p $namazudir
cd $namazudir
mknmz -eU $wgetdir/
>>71 からのdat2html.plに
>>75 発見のバグ修正を入れたもの
#!/usr/bin/perl
$sep=shift;
$rep=shift;
print '<HTML><HEAD>'."\r\n";
print '<META HTTP-EQUIV="Content-Type" CONTENT="text/html; CHARSET=EUC-JP">'."\r\n";
$fff=shift;
open(TH,"/usr/local/bin/nkf -e $fff |") || die "open error\n";
$_=<TH>;
chop $_;
@dat=split($sep,$_);
$dat[0]=~s/${rep}/${sep}/g if("${rep}");
$dat[1]=~s/${rep}/${sep}/g if("${rep}");
$dat[3]=~s/${rep}/${sep}/g if("${rep}");
$dat[4]=~s/${rep}/${sep}/g if("${rep}");
print "<TITLE>".$dat[4]."</TITLE>\r\n";
print '</HEAD>'."\n";
print '<BODY TEXT="#000000" BGCOLOR="#FFFFFF" link="#0000FF" alink="#FF0000" vlink="#660099">'."\r\n"
;
print "1:".$dat[0]."(";
print $dat[1].") ";
print "date:".$dat[2]."<BR>\r\n";
print $dat[3]."<BR><BR><BR>\r\n";
$cnt=2;
while(<TH>){
chop $_;
@dat=split($sep,$_);
$dat[0]=~s/${rep}/${sep}/g if("${rep}");
$dat[1]=~s/${rep}/${sep}/g if("${rep}");
$dat[3]=~s/${rep}/${sep}/g if("${rep}");
print $cnt.":".$dat[0]."(";
print $dat[1].") ";
print "date:".$dat[2]."<BR>\r\n";
print $dat[3]."<BR><BR><BR>\r\n";
$cnt++;
}
print '</BODY></HTML>'."\r\n";
exit;
82 :
名無しさん@お腹いっぱい。 :2001/05/10(木) 16:20
1は逃げたな、プレッシャーに耐え切れず。 最初は遊び半分からかい半分でスレ立てて、 出来もしないのに話を盛り立てて、 そんで放置されてたから「次どんなネタすれ立てて暇潰すかなー」 と思ってたところ、しばらく立ったら盛りあがってて、 「おほっ、こいつら馬鹿だなー」とニヤニヤしながら 相手してたら、だんだん自分のレベルを越えた話についていけなくて、 しまいには「頑張れー(@@;)」とか言われて、 だんだん良心も痛んできて、一瞬腕まくりして「やったるか」と 思ってディスプレイに向かってみた物の30分で挫折、 「ま、いいか」と気を取り直して他の板・スレで いつものようにウケもしないネタ書き散らして満足して、 今もちょっとだけ気になってこのスレ見てるけど、 このレスを見て図星過ぎて怖くなって回線を切ろうとしてるな、 まあ待て、その手に握ったマウスをブラウザに映し出された 2ちゃんの書き込みフォームにうつしてみろ、 名前欄にはついさっきまで使ってた「クンクン(壱式)」というハンドルが クッキーで入ってるな、そうだ、それを消して、 「名無しさん@ディストリ」いっぱい、もしくは「1」にして、そう、 それと、メール欄の「河内の物体X屋マンセー」なんだそりゃ、 それも消しなさい、バレちゃいますからね、そう、そうだ、 それじゃあその下の広いフォームにフォーカスをうつして、 よーし、その調子、それじゃあ「ネタスレでした、ごめんなさい」と打ってみよう、 ほら、焦らなくていいから、タイプミスしないようにな、ゆっくり、 そう、もうちょっと、あー、ほら、BSで消して、n,a,s,a,i、と、 よし、じゃあreturnして、あとは書き込むボタンをクリックだ、よし。 ■■■■■■■■■■■■終了■■■■■■■■■■■■
ネタスレでした、ごめんなさい
85 :
名無しさん@ディストリいっぱい :2001/05/10(木) 18:53
うわっ!!僕の出没時間がバレてる!!!笑 すみません。今からやります。少々しばらくずっと永遠にお待ちくださいませ。
>>1 =85
>うわっ!!こいつらまだやってる!!!笑
>少々しばらくずっと永遠にお待ち下さいませ。ゴルァ
>だから待てっつってんだろ馬鹿ども。
>もーいーよ、やんねー。やってらんねー。ばーか。
>もーこねーよ。死ね糞ども。
ハァ?
87 :
名無しさん@ディストリいっぱい :2001/05/10(木) 19:11
>>81 まとめてくれてありがとうございます!!!うれしいです!!
ちょっとわかりずらくなってきたのでここに書いてみよ。
これは僕の環境での設定です。あまり見ないで・・・
#!/bin/sh
export dat2html=/usr/bin/dat2html.pl
export workdir=/home/httpd/html/
export datdir=/home/httpd/html/cocoa.2ch.net/linux/dat
export namazudir=/usr/share/namazu/index/linux/
mkdir -p cocoa.2ch.net/test
wget -m -I linux/dat
http://cocoa.2ch.net/linux/dat/ for i in `ls $datdir`
do j=`echo $i | sed -e 's/\.dat//'`
$dat2html "," "\xa1\xf7\xa1\xae" $datdir/$i > /'cocoa.2ch.net/test/read.cgi?bbs=linux&key='$j
done
wget -m -I linux/kako
http://cocoa.2ch.net/linux/kako/ mkdir -p $namazudir
cd $namazudir
mknmz /home/httpd/html/cocoa.2ch.net/linux/test/
mknmz /home/httpd/html/cocoa.2ch.net/linux/kako/
ちょっと違ってた・・viで見るよりここで見るほうが見やすいや・・
これでいいはずだけどなあ・・どこか違ってます??
#!/bin/sh
export dat2html=/usr/bin/dat2html.pl
export workdir=/home/httpd/html/
export datdir=$workdir/cocoa.2ch.net/linux/dat
export namazudir=/usr/share/namazu/index/linux/
mkdir -p cocoa.2ch.net/linux/test
wget -m -I linux/dat
http://cocoa.2ch.net/linux/dat/ for i in `ls $datdir`
do j=`echo $i | sed -e 's/\.dat//'`
$dat2html "," "\xa1\xf7\xa1\xae" $datdir/$i > /'cocoa.2ch.net/test/read.cgi?bbs=linux&key='$j
done
wget -m -I linux/kako
http://cocoa.2ch.net/linux/kako/ mkdir -p $namazudir
cd $namazudir
mknmz /home/httpd/html/cocoa.2ch.net/linux/test/
mknmz /home/httpd/html/cocoa.2ch.net/linux/kako/
こうだな。僕の知識ではこれ以上はムリ。笑
やっぱりdatからhtmlへのコンバートがうまくいかない・・なんでだろ・・
それさえクリアできればオッケーっぽいんだけどなあ。
2ch.shのほうはこれでいいだろうから明日dat2htmlのほうを見直してみよっと。
土曜日には完成して日曜日には公開したいなあ。
#!/bin/sh
export dat2html=/usr/bin/dat2html.pl
export workdir=/home/httpd/html/
export datdir=$workdir/cocoa.2ch.net/linux/dat
export namazudir=/usr/share/namazu/index/linux/
mkdir -p cocoa.2ch.net/linux/test
wget -m -I linux/dat
http://cocoa.2ch.net/linux/dat/ for i in `ls $datdir`
do j=`echo $i | sed -e 's/\.dat//'`
$dat2html "," "\xa1\xf7\xa1\xae" $datdir/$i > /'cocoa.2ch.net/test/read.cgi?bbs=linux&key='$j
done
wget -m -I linux/kako
http://cocoa.2ch.net/linux/kako/ mkdir -p $namazudir
cd $namazudir
mknmz $workdir/cocoa.2ch.net/linux/test/
mknmz $workdir/cocoa.2ch.net/linux/kako/
91 :
名無しさん@ディストリいっぱい :2001/05/10(木) 21:22
過去ログが落ちてこないなあ・・いちおう過去ログ用のディレクトリ作ってみよっ。
ちょっとずつ前進。でも関係ないかも。
やっぱその前のdat2htmlのところで止まってるから過去ログの部分の処理が
されないのかなあ。んー・・・
#!/bin/sh
export dat2html=/usr/bin/dat2html.pl
export workdir=/home/httpd/html/
export datdir=$workdir/cocoa.2ch.net/linux/dat
export namazudir=/usr/share/namazu/index/linux/
mkdir -p cocoa.2ch.net/linux/test
wget -m -I linux/dat
http://cocoa.2ch.net/linux/dat/ for i in `ls $datdir`
do j=`echo $i | sed -e 's/\.dat//'`
$dat2html "," "\xa1\xf7\xa1\xae" $datdir/$i > /'cocoa.2ch.net/test/read.cgi?bbs=linux&key='$j
done
mkdir -p cocoa.2ch.net/linux/kako
wget -m -I linux/kako
http://cocoa.2ch.net/linux/kako/ mkdir -p $namazudir
cd $namazudir
mknmz $workdir/cocoa.2ch.net/linux/test/
mknmz $workdir/cocoa.2ch.net/linux/kako/
92 :
名無しさん@ディストリいっぱい :2001/05/10(木) 21:41
こうしたほうがいいんだな。きっと。なんとなく。
#!/bin/sh
export dat2html=/usr/bin/dat2html.pl
export workdir=/home/httpd/html/
export datdir=$workdir/cocoa.2ch.net/linux/dat
export namazudir=/usr/share/namazu/index/linux/
mkdir -p cocoa.2ch.net/linux/test
wget -m -I linux/dat
http://cocoa.2ch.net/linux/dat/ for i in `ls $datdir`
do j=`echo $i | sed -e 's/\.dat//'`
$dat2html "," "\xa1\xf7\xa1\xae" $datdir/$i > /'cocoa.2ch.net/test/read.cgi?bbs=linux&key='$j
done
mkdir -p cocoa.2ch.net/linux/kako
wget -m -I linux/kako
http://cocoa.2ch.net/linux/kako/ mkdir -p $namazudir
cd $namazudir
mknmz -eU $workdir/cocoa.2ch.net/linux/
ダメだ・・やっぱわかりやすくしておこ・・
#!/bin/sh
export dat2html=/usr/bin/dat2html.pl
export workdir=/home/httpd/html/
export datdir=$workdir/cocoa.2ch.net/linux/dat
export namazukakodir=/usr/share/namazu/index/linux/kako/
export namazutestdir=/usr/share/namazu/index/linux/test/
mkdir -p cocoa.2ch.net/linux/test
wget -m -I linux/dat
http://cocoa.2ch.net/linux/dat/ for i in `ls $datdir`
do j=`echo $i | sed -e 's/\.dat//'`
$dat2html "," "\xa1\xf7\xa1\xae" $datdir/$i > /'cocoa.2ch.net/test/read.cgi?bbs=linux&key='$j
done
mkdir -p cocoa.2ch.net/linux/kako
wget -m -I linux/kako
http://cocoa.2ch.net/linux/kako/ mkdir -p $namazukakodir
cd $namazukakodir
mknmz $workdir/cocoa.2ch.net/linux/kako/
mkdir -p $namaztestudir
cd $namazutestdir
mknmz $workdir/cocoa.2ch.net/linux/test/
ていうか・・こんなとこをいじってる場合じゃないんだよなあ・・ dat2html!!!!!(;д;)
95 :
名無しさん@お腹いっぱい。 :2001/05/10(木) 22:08
cd $wgetdir は、意図的に消したのですか?それ以外にも、
ディレクトリの関係がかなりめちゃくちゃになっています。
以下のようにしてください。
#!/bin/sh
export dat2html=/usr/bin/dat2html.pl
export workdir=/home/httpd/html
export wgetdir=$workdir/wget
export datdir=$wgetdir/cocoa.2ch.net/linux/dat
export namazudir=/usr/share/namazu/index/linux/
mkdir -p $wgetdir/cocoa.2ch.net/test
cd $wgetdir
wget -m -I linux/dat
http://cocoa.2ch.net/linux/dat/ for i in `ls $datdir`
do
j=`echo $i | sed -e 's/\.dat//'`
$dat2html "," "\xa1\xf7\xa1\xae" $datdir/$i > $wgetdir/'cocoa.2ch.net/test/read.cgi?bbs=linux&key='$j
done
rm -rf $wgetdir/linux/dat
wget -m -I linux/kako
http://cocoa.2ch.net/linux/kako/ mkdir -p $namazudir
cd $namazudir
mknmz -eU $wgetdir/
96 :
名無しさん@ディストリいっぱい :2001/05/10(木) 22:26
>>95 さん
あ、ありがとうございます。
どうもうまく動作しないので試行錯誤してました・・すみません・・ありがとうございます。
やっぱ2ch.shはこれでいいんですね・・もう一度戻してみてやってみます。
97 :
名無しさん@ディストリいっぱい :2001/05/10(木) 23:09
98 :
名無しさん@お腹いっぱい。 :2001/05/10(木) 23:22
99 :
名無しさん@お腹いっぱい。 :2001/05/11(金) 13:20
>>1 ,94
dat2htmlのテストしてみた
Linux環境が無いのでHP上のNetscape/LynxとWin上のIE/Netscapeで確認し、
下記環境で問題無く動作した
OS:HP-UX11.0(ワラ
sh:GNU bash, version 2.04.0(2)-release (hppa2.0w-hp-hpux11.00)
perl:perl version 5.005_02 と version 4.0.1.8
100 :
名無しさん@ディストリいっぱい :2001/05/11(金) 14:51
んー 1:()date: としか表示されないです・・また僕だけですかー???(;д;) 処理してる時も「ヘッダが取得できませんでした」とかいっぱい言われるし・・
101 :
名無しさん@お腹いっぱい。 :2001/05/11(金) 15:03
>>100 dat2htmlのnkfのパスが/usr/bin/nkfとかだとか?
102 :
名無しさん@ディストリいっぱい :2001/05/11(金) 15:53
>>101 さん
・・・そうでした。今修正しました。すると今度は固まってしまいます・・(;д;)
103 :
名無しさん@お腹いっぱい。 :2001/05/11(金) 16:43
>>102 2ch.shの
for i in `ls $datdir` を
for i in `ls $datdir/*.dat | egrep "[0-9]+\.dat"` で
やるとどうなる?
間違った for i in `ls $datdir | egrep "[0-9]+\.dat"` でね
105 :
名無しさん@ディストリいっぱい :2001/05/11(金) 19:02
う・動いた!!!! でも・・今は会社でテストしてるだけ・・・家に帰ったらまた動かないんだろうなあ・・はあ・・
106 :
名無しさん@ディストリいっぱい :2001/05/11(金) 19:03
あ、103さんありがとうございます。 家に帰ってやる時にはそれでやってみます。うおー早く帰りたいー。
>>1 -106
>あ、103さんありがとうございます。
>でも、難しいのでやっぱりこの話は無かった事にして下さいー。(><)
ハァ?責任持ってやれよ馬鹿。
109 :
名無しさん@お腹いっぱい。 :2001/05/12(土) 03:07
あのさー、どっかに dat2html.rb があったよ。 今さらごめん。場所忘れたし。
110 :
名無しさん@お腹いっぱい。 :2001/05/12(土) 09:39
rubyシネ
111 :
名無しさん@ディストリいっぱい :2001/05/12(土) 12:35
112 :
名無しさん@お腹いっぱい。 :2001/05/12(土) 12:49
おー。あと一歩だなー。 頑張れ壱。
>>1 よ
今見たけど、いいところまで言っているな
がんばれ〜
114 :
名無しさん@お腹いっぱい。 :2001/05/12(土) 15:11
ageru
検索したら書式設定ファイルが開けないって出る。 .namazurc のことかな? というか本当にここまでやるとは思わなかったよ。(^^;
116 :
名無しさん@お腹いっぱい。 :2001/05/12(土) 15:40
namazu のインデックスファイルは、
/usr/share/namazu/index/linux/
に生成されているんですよね。その中に、
NMZ.head.ja
NMZ.foot.ja
はありますか?また、namazu.cgi がインストール
されているディレクトリの .namazurc はどうなって
います?
INDEX /usr/share/namazu/index/linux/
REPLACE /home/httpd/html/wget/
http:// LANG ja
くらいで動くと思うんだけど、こんな感じになってますか?
区切りはTABです。
117 :
名無しさん@ディストリいっぱい :2001/05/12(土) 15:56
あ、しばらく見ないうちにいっぱい応援されてる。ありがとうございます。
>>116 さん
/usr/share/namazu/index/linux/ の中にはちゃんと NMZ.head.ja と NMZ.foot.ja は
あります。その上の /usr/share/namazu/index/ に本来デェフォルトでいろいろそういった
ファイルがあったんだけど削除したんでそれが原因でしょうか・・
僕はてっきり以前作成したインデックスのカスかと思って削除してしまいました・・
でもこれは関係ないですよね?
ファイルは今のところこんな感じで設定してます。
http://2ch.dyn.to/settei/namazurc.txt その他もろもろ
http://2ch.dyn.to/settei/
118 :
名無しさん@お腹いっぱい。 :2001/05/12(土) 15:58
いや、dbname のチェックボックスで linux を指定しているという
ことは、やがて unix のチェックボックスも作るわけだし、そう
なると .namazurc の書式も変わったんだっけな。
おそらく、イメージとしては
http://search.luky.org/ こんな感じの検索フォームで複数選択にするのでしょう。
この場合の .namazurc を調べなくては。
119 :
名無しさん@お腹いっぱい。 :2001/05/12(土) 16:00
>壱 2chのLOGだけがこうなるの? 他のデーターでテストしたらどうよ?
120 :
名無しさん@お腹いっぱい。 :2001/05/12(土) 16:02
## ## Template: Set the template directory containing ## NMZ.{head,foot,body,tips,result} files. ## Template /usr/share/namazu/template と設定されているので、/usr/share/namazu/template の下に、もろもろの NMZ.head.ja 等が入っている 必要があります。このあたりはどうなってます?
121 :
名無しさん@ディストリいっぱい :2001/05/12(土) 16:21
お騒がせしました。いろいろご指導ありがとうごさいます。 /usr/share/namazu/index/ にあったファイルを元に戻したら動作しました。 細かいところでいろいろ問題があるようだけどご指摘いただければありがたく思いますので これからもよろしくお願いします。 ♪みんなで作ったみんなのための検索システム♪
122 :
名無しさん@お腹いっぱい。 :2001/05/12(土) 16:28
やったね!
>壱 ある程度出来たなら設定ファイルを見えなくした方が良いんじゃない? あとネットワーク板もキボソ・・
124 :
名無しさん@ディストリいっぱい :2001/05/12(土) 16:30
えっと今の細かな問題点として
1.UNIX板のログもLINUX板のログも /cocoa.2ch.net/test/ 以下に生成されるので
分けて検索することができない、ということでしょうか。
UNIX板のログは wget2 のようなディレクトリを作成してそのディレクトリ以下にファイルを
生成するようにして REPLACE /home/httpd/html/wget2/
http:// をもう一個指定するとか?
REPLACE を二つ指定することはできないのかな?んー。
125 :
名無しさん@お腹いっぱい。 :2001/05/12(土) 16:36
126 :
名無しさん@ディストリいっぱい :2001/05/12(土) 16:58
あれ?これ、よく見たら過去ログ分しか拾ってないや・・・ んーーーーちょっと休憩してきます・・
今マンガ喫茶から動作確認してみたけどふむふむ。いい感じで動いてるかも。 ちょっとここで休憩して気分転換してからまた調整しよっと。
>>116 TAB くぎりの制限は 2.0.x でなくなったはず
本題と無関係なので sage
129 :
名無しさん@お腹いっぱい。 :2001/05/13(日) 01:59
すばらしい!とりあえずおめでとう。 細かい調整については、のんびりやっていけばいいでしょう。 これからも、ぼちぼち応援していくよ。
130 :
名無しさん@ディストリいっぱい :2001/05/13(日) 02:12
>>129 さん
応援ありがとうございます。今ちょっこちょこ調整してます。
>>124 の件もなんとかなりました。
ただ過去ログしか拾ってくれない現状は変わりません・・・
html形式のファイルしか拾ってくれないのかなあ。
>>123 さん
ネットワーク板追加しておきました。ただしこれも過去ログしか拾ってません。笑
131 :
名無しさん@お腹いっぱい。 :2001/05/13(日) 02:14
パッケージ化きぼ〜ん!
こうしないと拾ってくれないんだな。よしよし。着々と前進。
#!/bin/sh
export dat2html=/usr/bin/dat2html.pl
export workdir=/home/httpd/html
export wgetdir=$workdir/wgetlinux
export datdir=$wgetdir/cocoa.2ch.net/linux/dat
export namazudir=/usr/share/namazu/index/linux
export makenmz=$wgetdir/cocoa.2ch.net
mkdir -p $wgetdir/cocoa.2ch.net/test
cd $wgetdir
wget -m -I linux/dat
http://cocoa.2ch.net/linux/dat/ for i in `ls $datdir | egrep "[0-9]+\.dat"`
do j=`echo $i | sed -e 's/\.dat//'`
$dat2html "," "\xa1\xf7\xa1\xae" $datdir/$i > $wgetdir/'cocoa.2ch.net/test/read.cgi?bbs=linux&key='$j
done
rm -rf $wgetdir/linux/dat
wget -m -I linux/kako
http://cocoa.2ch.net/linux/kako/ mkdir -p $namazudir
cd $namazudir
mknmz -a -U $makenmz/test $makenmz/linux/kako
あとは検索結果で 1:名無しさん@お腹いっぱい。() date:2001/03/04(日) ってなる () date の部分が気になるぐらいかな。日付をうまく取得できてないのかなあ。
>>133 うまくいっている
()の中はメアドが入るんだよ
>壱 サンクス あと、ガンバテネ
>>134 さん
>>135 さん
ありがとうございます!これからも頑張ります!!
ここまで下がっちゃうと今さら上げるのが気が引ける。笑
ていうか特に問題点がないから上げる必要もないし。
それほど完成度が高いスクリプトということだーー!!!素晴らしい!!
137 :
名無しさん@お腹いっぱい。 :2001/05/14(月) 12:46
優良スレage
138 :
名無しさん@お腹いっぱい。 :2001/05/14(月) 22:36
それでは、落ち着いてきたので細かい点をいくつか。 あまり気にせずに、ひまなときにぼちぼちと修正してくださいませ。 1. 検索結果から、再び検索すると検索できない これは、検索結果表示欄に Linux板 等のチェックボックスがないため。 対象インデックスのチェックボックス欄をそのまま載せるという方法も ありますし、検索ボックスをなくしてしまうという方法もあると思います。 いずれにしても、NMZ.head.ja をいじるだけです。 2. インデックスの最終更新日が表示されません。表示する必要もないので、 1でいっしょになくしてしまってもいいと思います。 cron で 2ch.sh を動かしてますか?もしも、まだでしたら そろそろ動かしてみてください。ネットワークの負荷を考えると、 そんなに頻繁に動かさなくてもいいとは思います。
139 :
名無しさん@お腹いっぱい。 :2001/05/14(月) 22:37
140 :
名無しさん@ディストリいっぱい :2001/05/15(火) 00:19
>>138 さん
ご指摘ありがとうございます。今から修正してみます。
cronには昨日設定しました。
0 7 * * * /root/linux.sh
0 8 * * * /root/unix.sh
0 9 * * * /root/hack.sh
って感じにしておいてホントに動作するかどうか、朝起きて
パソコンの前でジーッと見てましたが動いている様子はなかったです・・・
裏で動いてるのかなあ・・でもルーターも動いてる様子はなかったし・・
とりあえずログを更新するのは一日一回にしようと思います。
深夜のlinux3時unix4時ネットワーク5時辺りで。
cronの件、自己解決しました・・すみません・・
142 :
名無しさん@お腹いっぱい。 :2001/05/15(火) 00:26
>>140 ルートで実行はやめとけー
変なセキュリティホール作るだけぞな
143 :
名無しさん@ディストリいっぱい :2001/05/15(火) 00:55
>>142 あ、ありがとうございます。じゃあ今からこっそり移動しておきます。
144 :
名無しさん@お腹いっぱい。 :2001/05/15(火) 10:57
過去ログがヒットするように検索すると表示が化けます(例 Slackware
>>1 直し方わかんないけど、症状報告って事で
145 :
名無しさん@ディストリいっぱい :2001/05/15(火) 12:08
>>144 さん
ですよね。自分のパソコンがおかしいのかと思ってたんですがやっぱみんなバケるんですね。あはは。
特に何も変更してないのになあ。昨日 NMZ.head.ja を編集した時に
余分なものまで削除しちゃったかな?んーマズイ。
146 :
名無しさん@お腹いっぱい。 :2001/05/15(火) 14:00
>>1 文字コードを揃えればいいんじゃないかな
kako/を全てEUCにするか、dat2htmlの出力をSJISに変換すればいいと思われ
147 :
名無しさん@ディストリいっぱい :2001/05/15(火) 14:24
>>146 さん
ありがとうごさいます。でも昨日まではちゃんと表示されてたんです。
だから僕が昨日いじってるうちにおかしくなったんだと思います。
すみません。みなさんの手をわずらわすほどのものではないと思います。たぶん。
心配していただいてありがとうございます。(ぺこぺこ)
148 :
login:Penguinさん :2001/05/15(火) 15:41
>>147 色々とやってみなければ、可能性な〜んて解らんだろうから
どんどんやってみよう
>>1 がんばれ〜
>>1
NMZ.head.ja の<title>のところに全角文字を使用したのか原因でした。ふぅ。直った。
あ、決して<title>としたわけじゃないです。 <title>★2ちゃんねる検索★</title>としたわけです。これが原因でした。ふぅ。
151 :
名無しさん@お腹いっぱい。 :2001/05/16(水) 02:11
どんどん完成度が高くなっていきますね。 対象板も増えて、嬉しい限り。 まさか、2ちゃんねるから情報を検索することになろうとは思わなかったが、 色々検索してみると、けっこう面白い。 いや、まじですばらしいっす。
152 :
名無しさん@お腹いっぱい。 :2001/05/16(水) 02:12
MS DOS Version 5.00 (C)Copyright 1981-1991 Microsoft Corp Licensed Material - Property of Microsoft All rights reserved
153 :
名無しさん@お腹いっぱい。 :2001/05/16(水) 02:57
応援ありがとうございます!!!頑張ります!!! とりあえずここまで完成したら後は安泰だ〜。 毎日毎日パソコンの前に続いたからなあ。やっとのんびりできるや。ふぅ。
155 :
名無しさん@お腹いっぱい。 :2001/05/17(木) 00:24
スゲー クワー? (訳:ウットコからリンクして良いきゃ?)
157 :
名無しさん@お腹いっぱい。 :2001/05/17(木) 03:18
完成記念age
158 :
名無しさん@ディストリいっぱい :2001/05/17(木) 10:27
>>156 のクンクンさん
いいですよ。たぶん。たぶんですが。エロサイトとかじゃなければ。怖いサイトじゃなければ。
アングラサイトで「 ♪Linuxのハクり方♪ 」みたいなサイトでなければ。
「たぶん」なので後から「やっぱりダメー」というかもしれません。笑
159 :
名無しさん@お腹いっぱい。 :2001/05/17(木) 12:24
>>158 公開した時点で、リンクされることは覚悟しとかないと。
そのうち google とかに捕まって、ガンガンアクセスが
来ると思うぞ。
160 :
名無しさん@ディストリいっぱい :2001/05/17(木) 12:38
>>159 さん
そうですよね。
よく考えたらここに公開しているぐらいだから他で公開されても平気なような気がしてきました。
ここよりエロくて怖くてアングラで♪Linuxのハクり方♪のようなサイトはないですから。笑
っていうかクンクンさんのサイト・・気になる・・
見せてください!!!見たいです!気になります!!!>クンクンさん
161 :
名無しさん@ディストリいっぱい :2001/05/17(木) 13:02
ダメだ・・やっぱり過去ログ分が文字化けを起こしちゃうや・・ たまに大丈夫でたまに化けるってなんでだろ?悩むなあ・・ 過去ログをEUCに変換するのは大変そうだからdat2htmlのほうを調整して x-sjisで書き出したほうがいいのかな。 nkf -e のところを nkt -s にして CHARSET=EUC-JP を CHARSET=x-sjis に しただけでいいのかなあ。こんな感じですか? 家に帰ったら一回試してみよっ。 #!/usr/bin/perl $sep=shift; $rep=shift; print '<HTML><HEAD>'."\r\n"; print '<META HTTP-EQUIV="Content-Type" CONTENT="text/html; CHARSET=x-sjis">'."\r\n"; $fff=shift; open(TH,"/usr/bin/nkf -s $fff |") || die "open error\n"; $_=<TH>; chop $_; @dat=split($sep,$_); $dat[0]=~s/${rep}/${sep}/g if("${rep}"); $dat[1]=~s/${rep}/${sep}/g if("${rep}"); $dat[3]=~s/${rep}/${sep}/g if("${rep}"); $dat[4]=~s/${rep}/${sep}/g if("${rep}"); print "<TITLE>".$dat[4]."</TITLE>\r\n"; print '</HEAD>'."\n"; print '<BODY TEXT="#000000" BGCOLOR="#FFFFFF" link="#0000FF" alink="#FF0000" vlink="#660099">'."\r\n" ; print "1:".$dat[0]."("; print $dat[1].") "; print "date:".$dat[2]."<BR>\r\n"; print $dat[3]."<BR><BR><BR>\r\n"; $cnt=2; while(<TH>){ chop $_; @dat=split($sep,$_); $dat[0]=~s/${rep}/${sep}/g if("${rep}"); $dat[1]=~s/${rep}/${sep}/g if("${rep}"); $dat[3]=~s/${rep}/${sep}/g if("${rep}"); print $cnt.":".$dat[0]."("; print $dat[1].") "; print "date:".$dat[2]."<BR>\r\n"; print $dat[3]."<BR><BR><BR>\r\n"; $cnt++; } print '</BODY></HTML>'."\r\n"; exit;
このままじゃ活用されないな。 初めて来た人は気づかないだろーし Linux自治スレで要望出す時に一緒に検索エンジンへのリンクを 書き込みフォームの↑にはってもらうとか くだらねえ質問はスレに「まずはここで検索」とかリンクしてもらうとか (新スレ立てる時)
163 :
名無しさん@お腹いっぱい。 :2001/05/17(木) 13:49
>>161 nkfはそのままにしといて2ch.shの書き出しで変換した方がいいよ
$dat2html "," "\xa1\xf7\xa1\xae" $datdir/$i | /usr/bin/nkf -e> $wgetdir/'cocoa.2ch.net/test/read.cgi?bbs=linux&key='$j
みたく。
SJISだと区切り文字の判定を混乱する可能性あり。
164 :
名無しさん@お腹いっぱい。 :2001/05/17(木) 13:52
「データ更新時間は」部分が他の窓に隠れてて Linux4時 Unix5時 だけ見て「どこかにそんなサイトが?」とか 思ってしまいました。ということで頑張れage
165 :
名無しさん@ディストリいっぱい :2001/05/17(木) 14:12
166 :
名無しさん@ディストリいっぱい :2001/05/17(木) 14:19
>>163 さん
あ、ありがとうございます。家に帰ったら早速試してみます。
>>165 問題はnkfが文字コード系を誤解するってとこだと思われ
カナモジの禁止はなっとくいかん
168 :
名無しさん@ディストリいっぱい :2001/05/17(木) 14:48
こちらも失礼。 なんか手が無いか考えてみるよ
170 :
名無しさん@ディストリいっぱい :2001/05/17(木) 16:08
一応
>>161 の方法でうまくいったようなのでしばらくこのまま様子を見てみようと
思います。ありがとうございました。
>>163 さんの方法も後で試してみます。
あとは過去ログヒットした時にバナーの部分が説明文として表示されるのを
回避したいなあ。
>>162 「くだらねえ質問はここに書き込め! 1st」スレの1だが
もし次にヲレが新スレ 「くだらねえ質問はここに書き込め! 2nd」を立てるとしたら
書き込みフォームの注意書きの一環として使わせて貰いたいのじゃ
#前スレはヲレと違う人が立てたので今度は誰が立てるか解らんが
>>170 応援age
http://2ch.dyn.to
172 :
名無しさん@ディストリいっぱい :2001/05/18(金) 00:27
Linux板のトップにリンク貼ってもらうってことはできないの?
174 :
名無しさん@お腹いっぱい。 :2001/05/18(金) 01:58
馬鹿にして見ていたが結構使えるじゃねぇかage
>>173 自治スレで要望出すみたいだからさ、
そん時に一緒に出せばいいじゃん
っていうか俺が自治スレの1だった、、、鬱
177 :
名無しさん@ディストリいっぱい :2001/05/18(金) 11:28
昼に動作確認のために手動で2ch.shを実行するとどうってことが
ないのに深夜に自動的に実行した時には文字化けするのってなんでだろ?
ただの偶然かなあ。まあいいや。
>>176 の師匠さん
クンクンさんではなかったのですね・・すみません。僕には違いが
わからなかったです・・
「河内の物体X屋」も「かわちのぶったいエックスや」と
読んでました。無知ですみません・・
至って普通のサイトですね。ぜひリンクしてください。お願いします。
会社でテスト用として動作させてるのも文字化けしてる・・ 手動で実行すると文字化けしないのに・・なんでだろ・・悩みは深いです・・ まあどうせ毎日いじってるから手動でもたいしたことではないけど。笑
見てるとちゃんとやるけど見てないといいかげんな仕事をするのかなあ。 もしかしてパソコンって持ち主に似る???
見てないと... っつーことは、見てないときは cron かなんかでやってる? ありがちなのが、cron では LANG 環境変数が指定されてなくって 非日本語 mode で動いてるようなケースだな。
181 :
名無しさん@ディストリいっぱい :2001/05/18(金) 23:05
>>180 さん
ありがとうございます。早速2ch.shのほうに
LANG=ja
export LANG
set | grep LANG
を書き足してやってみます。
これさえ動作してくれればこれも完成だー
http://2ch.dyn.to/
>>177 クワー
(訳:文字化けは発生していない・・・クワ)
クワー
(訳:でも、
>>181 のような対策は必要だ・・・クワ)
クワー (訳:作った人・・・ありがとうだ) パタパタ (訳:それだけ。。。)
184 :
名無しさん@ディストリいっぱい :2001/05/19(土) 23:25
>>183 の師匠さん
作ったのはこの板のみんなです。「みんな」の中にはもちろん師匠さんも入ってますよ。
こちらこそありがとうございます。
そう書いてあったが・・・ ワシは「クワー」としか言っとらんじょ。。。 クワー (ま・・・イイか)
まぁ、2チャンネルのLinux板はマンセーだ・・・クワ まぁ、ワシスレが無くなれば尚イイのだが・・・クワワー
187 :
名無しさん@ディストリいっぱい :2001/05/20(日) 00:30
188 :
名無しさん@お腹いっぱい。 :2001/05/20(日) 07:04
>>1 ガムバッテルナー
検索できる項目が増えたようだね
190 :
名無しさん@ディストリいっぱい :2001/05/22(火) 14:34
>>189 さん
応援ありがとうございます!!!頑張ります!!
項目増やしたんですけどすごく時間がかかります。
板によってはindex作るのに12時間ぐらいかかります。
だからほとんど一日中CPUがフル稼働してます。そのうちに壊れるのは間違いないと思います・・
ちなみにlinux板は30分ぐらいで終わります。笑
なんでみんながあまりこういうサイトをやりたがらないかがわかりました。ふぅ。
191 :
名無しさん@お腹いっぱい。 :2001/05/22(火) 21:10
ヨタヨタとでもとにかく走り始めるところが如何にもLinux。 良い感じですよ。ありがとう>1
192 :
名無しさん@お腹いっぱい。 :2001/05/22(火) 21:12
ヨタヨタは>1だからだろ linuxで括るな
193 :
名無しさん@お腹いっぱい。 :2001/05/23(水) 00:54
>>27 です。
この心配が、本当に心配になるところまで来るとは、たいしたものです。
とりあえず、元気に動いているようなので良かった。
>>192 確かにおまえはヨタヨタとでも走りそうにねぇな(藁
195 :
名無しさん@お腹いっぱい。 :2001/05/23(水) 13:12
196 :
名無しさん@ディストリいっぱい :2001/05/23(水) 14:03
ホメられたりけなされたり、人生って楽しい♪
>>195 さん
あ、そこをサブスペースとして確保しておくのもいいかもしんないですね。
使えるのかなあ。後でちょっと見てみます。辞書を片手に。笑
197 :
名無しさん@お腹いっぱい。 :2001/05/23(水) 14:10
198 :
名無しさん@ディストリいっぱい :2001/05/23(水) 14:44
>>197 さん
違いはいっぱいあります。一番大きな違いは「Linux板が検索できるか否か」です。笑
199 :
名無しさん@ディストリいっぱい :2001/05/23(水) 14:53
あと違うところは向こうは「大先生」でこっち「よたよた」だってことです。 「よたよた検索」って名前に変えようかなあ。そっちのほうが目立つし。笑
200 :
名無しさん@お腹いっぱい。 :2001/05/23(水) 15:09
なんか遅そうだなあ >よたよた検索
201 :
名無しさん@お腹いっぱい。 :2001/05/23(水) 16:14
遅そうというよりなんか間違えて検索しそうだよ。「vine」で検索したら「パイン」とか出そう。
202 :
名無しさん@ディストリいっぱい :2001/05/23(水) 16:25
>>200 さん
それは「もたもた」です・・・
>>201 さん
そこまでは間違えません。「フェラチオ UNIX」が「フェニックス」にはなる可能性は否定できませんけど。
但し「フェラチオ」と「UNIX」を同時に検索する人はいないと思うので問題はないと思ってます。はい。
203 :
名無しさん@お腹いっぱい。 :2001/05/23(水) 16:27
>>201 2ちゃんの検索として考えるなら、その処理であっている思われ
204 :
presto :2001/05/25(金) 06:08
Linux板が他板の参考にされるとは、世も末だな 誉めてんの!一応
206 :
名無しさん@ディストリいっぱい :2001/05/25(金) 15:41
え?freewebでnamazuを稼動させることできるの??? ていうか23日にスレを立ててもう完成したんですか・・はやー
207 :
名無しさん@お腹いっぱい。 :2001/05/25(金) 16:28
pNamazu
209 :
名無しさん@お腹いっぱい。 :2001/05/27(日) 17:11
ここで、立ち上がったnamazuの検索項目に入ってない板を取り入れ 同じように公開を考えてはいるんですけど いまいち上手く動いてくれないです。 wget+namazu を cronで動かし問題無く動いてますが、 ここで公開されたスクリプトの設置が上手くいってないようです。 どなたか、動かした人レスお願いします。(メールも返事が無かったので)
210 :
名無しさん@お腹いっぱい。 :2001/05/27(日) 17:13
211 :
名無しさん@お腹いっぱい。 :2001/05/27(日) 17:17
批判要望じゃないと思われ
213 :
名無しさん@お腹いっぱい。 :2001/05/27(日) 17:18
214 :
名無しさん@お腹いっぱい。 :2001/05/27(日) 17:23
>>209 どの板?
>>71 が書いているように板によって区切り文字が違うので、それ関係だと思われ
そこんとこ、どんな設定にした?
215 :
209 :2001/05/27(日) 17:24
とりあえずもう一度見直してみよ。
216 :
名無しさん@お腹いっぱい。 :2001/05/27(日) 17:25
namazuがうまく動かないのはWindowsのせいだろう
217 :
209 :2001/05/27(日) 17:27
>>71 ここを読み飛ばしていたかも。
いろいろやってみよ。
218 :
209 :2001/05/27(日) 17:28
219 :
名無しさん@お腹いっぱい。 :2001/05/27(日) 17:34
Apache + mod_ruby は DB との連携に難がありましたが、
Ruby/ODBC・Ruby/DBI 等の出現により、徐々に改善の兆しが。
とはいえ似たようなものが乱立しているので、API の標準化は必須かな。
あと、ruby script も十分に速いんで、速度面で PHP にはそうは
劣らないです。
ちなみに、私は2のデザインとプログラムの一体化により、非常に
めんどくさい目にあっているので、
>>11 さんのおっしゃることに同感。
sqwebmail の source みたいに、デザインテンプレートにマクロを埋め込む
形にして、source は別 file っていうのがよさげ。
220 :
209 :2001/05/27(日) 18:28
>>11 さんのようなスクリプトが出来ましたら
是非公開してください。
221 :
名無しさん@ディストリいっぱい :2001/05/28(月) 00:31
あ、ホントだ。メール来てました。ごめんなさい。
>>209 さん
全然誰からもメールが来ないから見る習慣がついてなかったです。笑
えっと
>>11 さんのようなスクリプトというのが
http://2ch.dyn.to/settei/ ↑ここにある拡張子が sh のファイルです。
各板ごとに作ってるのでいっぱいあります。参考にしてください。
もしよくわからないようだったらどこの板か教えてくれたらその板用のを作ってあげます。
で、datファイルをhtmlに変換してくれるのが
http://2ch.dyn.to/settei/ ↑ここにあるdat2htmlです。
とりあえずこの二種類のファイルだけあれば動作はします。
わからないところがあったらこのスレに書き込んでいただければ誰か教えてくれると
思いますし僕もわかる範囲でお教えしますよ。
222 :
名無しさん@ディストリいっぱい :2001/05/28(月) 00:33
223 :
名無しさん@ディストリいっぱい :2001/05/28(月) 01:06
今メールボックス見たらMAILER-DAEMONからウイルス付きのメールがいっぱい来てる・・ずずーん。
MAILER-DAEMONめ・・身内のくせして裏切りやがったなー。笑
っていうかMAILER-DAEMONからウイルスメールが来るってことは僕が発信してます???
from defalt * to
[email protected] だから僕が発信しているわけじゃないですよね?
でもなんでMAILER-DAEMONからになるんだろ??外部からpostfixを使われてるのかなあ・・ちょっと心配・・・
>From linux Sun May 27 21:01:43 2001
Return-Path: <>
Delivered-To:
[email protected] Received: from default (xxxx.xxxxx.ne.jp [xxx.xxx.xxx.xx])
by 2ch.dyn.to (Postfix) with SMTP id D0E7946E9A
for <
[email protected] >; Sun, 27 May 2001 21:01:35 +0900 (JST)
MIME-Version: 1.0
Content-Type: multipart/mixed; boundary="--VEHUBSD6BK9YV41ERG1EN8P6FKLM7"
Message-Id: <
[email protected] >
Date: Sun, 27 May 2001 21:01:35 +0900 (JST)
From: MAILER-DAEMON
To: undisclosed-recipients:;
X-UIDL: R:>"!&Q`"!cU6!!5=_"!
224 :
名無しさん@お腹いっぱい。 :2001/05/28(月) 01:14
225 :
名無しさん@ディストリいっぱい :2001/05/28(月) 01:21
>>224 さん
あーよかったー。ちょっとドキドキしてたんですけど安心して寝れます。ふぅ。
ではおやすみなさい。
う〜 (ペンギソのキグルミは質草にした・・・) 一応・・・デンナ アチコチで宣伝したってるでぇ〜〜 そのハイブリスでっけどなぁ・・・_ケーッッ ウットコもぎょうさんもうてまっせえ。。。 なぁ...ソチラも"hogehoge.ne.jp"でんなぁ。。。 ついでにIPもマルダシや・・・アホ_ナ_ヤッチャ パンツ_マルミエ_ノ_コGAL_ミタイナ_モン_ヤ_ノウ_... そんでや・・・ そんなメールやったら・・・ そのまま張り付けてもオッケイ・リョーカイでっせ。。。ナマズ_ノ_オニイチャン
227 :
名無しさん@お腹いっぱい。 :2001/05/28(月) 07:48
228 :
名無しさん@ディストリいっぱい :2001/05/28(月) 10:36
>>226 さん
クワー
(宣伝ありがとうございます)
クワー
(ペンギンの着ぐるみっていくらになったんですか?)
ケケケ
(パンツ丸出しのコギャルはうれしいけどウイルスメールはうれしくないよー)
ケケケ
(送信した人は悪意を持って送ってるわけじゃないだろうから伏せました)
ウニャー
(こんな感じでいいんですか???)
クワ〜(語尾を下げる) (訳:3000円だクワ) クワ〜 (訳:最初のはウレシかったクワ) クワ〜 (訳:相手が学生なら悪意は乏しいだろキャ) パタパタ (訳:よくできました) ウー_ツウコウニン_ノ_シセン_ガ_イタイ_...
230 :
age :2001/05/28(月) 19:19
hogehoge
>>1 さん+みなさんのおかげで、namazuテスト成功しました。
まだ、細かな所を詰めないといけないけど
何処の板をnamazu検索に取り入れようかなぁ。
使ってないマシンにLinux系を入れて公開しようと思ってるから
まだ、時間掛かりますが。
まぁ・・・ 何時の間にかカテゴリちゅー・・・ あ,,,ちごた・・・ 検索できる板増えてるのはeeこっちゃ。。。
まぁ・・・これでもageとこ WIN厨房(恥ずかしいなぁ)にエサくれたる。。。ワ
カーネル 2.4.5 にするか、2.2.19 にするか・・・。 namazu検索公開マシンには、使ってないPentiumProデュアルマシンにしようと 思ってるけど 2.4.x系のカーネルの方がパフォーマンス良さそうだけど 頻繁にfixさそうだし大変かぁ。
>>hanajan_特科連X 頭弱そうだが 何も出来ね〜人間のクセに能書きは一人前だ ま、相手にしてもシャーナイか
236 :
login:Penguin :2001/05/29(火) 22:19
2ch.shの最後に cd $namazudir gcnmz $namazudir rm -rf *.BAK を追加してゴミ削除
>>235 まぁ・・・
相手したってもエエんやが・・・
自動的にできひんようになる。。。
しやから・・・
言うてることは全くの無駄やと思う。。。
ほんで・・・
人間と違ごて原始人や。。。
やっぱり・・・ SQLとか(ヲラクルはちゃうやろ)混ざってるんとちゃうか・・・ まぁ・・・ 埋め込み型SQLちゅー手ぇもあるけど・・・なぁ。。。 M$星人にヴォロカス書いたけど・・・ 基礎の知識とか,,,うー_ホンデヤナァ IECとかANSIとかロゼッタネットとかの勉強してや。。。 上の方はやってると思うけど・・・ まぁ、無理すんなや。。。
まぁ・・・ ウェーブソフトウェアつーのんで・・・ Linuxらーがラッキーになるような絵は描けるでぇ。。。 で、実装するんはプログラマつー職種のやっちゃ。。。
240 :
login:Penguin :2001/05/29(火) 22:54
>>231 >>1 と重ならないのを。きぼ〜ん
無目的なLinux初心者より2ch検索が絶対に建設的
まぁ・・・ 無目的なんは・・・ 無目的でも・・・ 後から目的になっていたコトもある。。。 要するに・・・ 予定調和説や。。。_<<_ヤパン人は殆どがそーやろと思う そーか・・・ 生きることのみを目的とした社畜に甘んじているか・・・や。。。 たぶん・・・そや・・・と思う。。。_<<_アーア
>>240 もちろん、同じ板を検索対象としてもしょうがないので
限られたリソースの範囲で検索対象を広げられればと思ってやす。
外から見ると無目的かもしれないけど
自分的にはスキルアップの為の勉強かな。
今はコンパイラー&コンパイルオプションの実性能比較をやっているところで
後はカーネル2.4.x 2.2.x の比較その他・・・。
PGCC ”-O6 -march=pentiumpro”で2.4.xカーネルが通るか知らんけど
人柱になってやってみる予定。
まぁ・・・ "作成までの道のり"のリンクやけど・・・ "最新100レス"でエエんとちゃいまっか?
244 :
名無しさん@ディストリいっぱい :2001/05/31(木) 16:37
う・・・なんか難しい話になってる・・・逃 やっぱ全部読むには長すぎる状態になってきたので覚えてたら あとで変更しておきます。忘れてたらそのままです。ごめんなさい。
ここで作ってたのか。。。 ごくろうさまです。ありがたく使わせてもらってます。
246 :
login:ディストリいっぱい :2001/06/03(日) 23:39
>>245 さん
いらっしゃいませー。他の板の人ですね。
みんなのための検索システムなのでじゃんじゃん使ってください。
久しぶりに上がったなあ・・もう上がることはないとあきらめてたのに。笑
ここで出ましたシェルスクリプトの ファイル名を変換する部分に新規ファイル&更新ファイルのみの変換と言った処理を 追加したいのですが、どなたか助言お願いします。 mknmzで実際には更新されてないファイルまでインデックス書き直しをしてしまうので・・。 for i in `ls $データdir | egrep "[0-9]+\.dat"` do j=`echo $i | sed -e 's/\.dat//'` $dat2html '<>' "" $データdir/$i > $変換先dir/'xxx.2ch.net/test/read.cgi?bbs=xxxx&key='$j done
248 :
名無しさん@ディストリいっぱい :2001/06/07(木) 18:25
シェルかぁ
249 :
login:Penguin :2001/06/08(金) 02:53
ちょっと時間がないのでヒントだけ。 mknmz が更新されたファイルかどうかを判別する材料は、 ファイルサイズと timestamp です。生成した html を dat と同じ timestamp にするのが良いのではないかと。
このスクリプトの処理を終えたファイルは 片っ端から新しく書き出されてしまいます。 >dat と同じtimestamp ファイル書き出しの時に元のファイルのtimestampを使って・・・。 (シェルは勉強し始めたばかりだった)
かなり遅めな事後報告ですが
「くだらねえ質問はここに書き込め! 1st」はレスの数が1000近くなったので
新しく「くだらねえ質問はここに書き込め! 2nd」を立てた
>>171 の通り、
>>1 の書き込みフォームで使わせていただきました。
>>1 名無しさん@ディストリいっぱい殿に感謝じゃ
>>252 さん
使っていただきありがとうございます。
使ってもらわないと作った意味がないですからどんどん使っちゃってください。
よろしくお願いします。ぺこぺこ
サイトに名前つけてみました。MOGURA。 もぐらのようにガサガサーとほじってほじって探し出すってことで。
>>251 touch -r にて解決。
if〜then〜fiでの作業合理化。
シェルは便利だ。
256 :
login:ディストリいっぱい :2001/06/15(金) 14:50
みんなにありがとうの気持ちをこめてプレゼントを用意させていただきました。
http://2ch.dyn.to/ 商品を提供してくれたコレガダイレクトショップ様に大感謝です。
しかし・・応募してくれる人はいるのか・・・汗
当選確率が高いかも。笑
あ・・「コレガダイレクトショッピング」でした・・ さっき間違いを指摘されたばっかりなのにまた間違えちゃったや。笑
過去ログの検索結果のところに広告の文字が表示されるのを回避するために過去ログ分の
ファイルは6行目から31行目まで削除する処理を追加。
でも2重3重に行削除を行うのを防止するために毎回kakoディレクトリを削除
することになるのでサーバーの負担倍増。笑
testディレクトリも削除しないとゴミファイルが大量に溜まるようなので毎回削除。
これにより一層サーバーの負担増加。笑
作業不合理化・・・
#!/bin/sh
LANG=ja
export LANG
set | grep LANG
export dat2html=/usr/bin/dat2html.pl
export workdir=/home/httpd/html
export wgetdir=$workdir/wgetlinux
export datdir=$wgetdir/cocoa.2ch.net/linux/dat
export namazudir=/usr/share/namazu/index/linux
export makenmz=$wgetdir/cocoa.2ch.net
rm -rf $wgetdir/cocoa.2ch.net/test
mkdir -p $wgetdir/cocoa.2ch.net/test
cd $wgetdir
wget -m -I linux/dat
http://cocoa.2ch.net/linux/dat for i in `ls $datdir | egrep "[0-9]+\.dat"`
do j=`echo $i | sed -e 's/\.dat//'`
$dat2html '<>' "" $datdir/$i > $wgetdir/'cocoa.2ch.net/test/read.cgi?bbs=linux&key='$j
done
rm -rf $datdir
rm -rf $makenmz/linux/kako
wget -m -I linux/kako
http://cocoa.2ch.net/linux/kako for k in `ls cocoa.2ch.net/linux/kako/*/* | egrep [0-9]+\.html`
do n=`echo $k | sed -e 's/\.html//'`
sed '6,31d' $k > $n
mv -f $n $k
done
mkdir -p $namazudir
cd $namazudir
mknmz -a -U $makenmz/test $makenmz/linux/kako
>>258 作業不合理化・・・これは...(笑
過去ログhtmlの広告部分を見てみると若干の広告行数の違いはあっても
「center」〜「/center」タグで囲んでいるようだから
このタグの間をゴッソリ削除出来ると他の板でもそのまま使えそう。
シェル勉強中の身にてスクリプトが直ぐに出てこない。
ずっと解らない可能性も...(爆
>>259 さん
「作業不合理化」のようで本当は合理化されてます。
testディレクトリはたまに削除しないと過去ログ倉庫行きになったファイルも
どんどんたまっていくんで結局は毎回削除して生成したほうがいいみたいです。
dat2htmlの処理自体はすぐに終わるんで。オススメ。
あ、その時にdatファイルのタイムスタンプを引き継げるんだったら引き継いだほうが
いいんでしょうけど。
過去ログのほうも元々タイムスタンプを取得することができてないため毎回更新されて
いるので削除したとしても同じことだし。
広告は過去ログファイルの6行目から31行目に入ります。これは各板共通のようなので
wget -m -I linux/kako
http://cocoa.2ch.net/linux/kako のあとに
for k in `ls cocoa.2ch.net/linux/kako/*/* | egrep [0-9]+\.html`
do n=`echo $k | sed -e 's/\.html//'`
sed '6,31d' $k > $n
mv -f $n $k
done
を書き加えればどの板でも対応できそうです。
ただし
>>258 の rm -rf $datdir は余分な処理のようでした。
これは削除したほうがいいと思います。
これで合理化(どうにか)なるかな?なんちて。←極寒
>>260 さんの
>testディレクトリはたまに削除しないと・・・
なるほど、この辺りも考えないとダメかぁ。
友人から検索対象にしてくれって言われてるPINK板は
過去ログ広告は、6-16行目までになってました。(検索対象になるかは未定)
egrep -nで広告部分の行数を拾っての処理も考えたけど
誤作動すると変な所を削除してしまうので、
結局、各板の広告行数を予めチェックして
>>260 さんのスクリプトで
処理するのが良さそうですね。
262 :
:2001/06/20(水) 07:36
263 :
login:Penguin :2001/07/05(木) 23:08
age
264 :
login:Penguin :2001/07/10(火) 03:07
ほげ
「MOGURA」検索、大分パワーアップしましたね。 そろそろ、検索サイトを公開しようかと思っていたけど バッティングしないように収録した板がカブってます・・・。 とりあえずは早めに公開して後から考えるか。
公開がとても楽しみです。応援しています。
>>266 どうもです。
「MOGURA」検索後(result)のレイアウトがいいですね。
この辺り参考にさせて頂きたいです。
後は見やすい配色を考えて..。(寝
>>265 さん
ああぁ。すみません。
前に聞かれた時には全然増やす気はなかったんですけどこのあいだ大先生の検索が
使えなくなってたのでそのフォローのつもりで一気に検索対象板を増やしちゃいました。
>>267 さん
ということはー。僕のところは見にくい配色だと言うことですね・・・へ・へこーん。
ひさしぶりに見たけどすげぇ 改めて使うと便利便利 運営ガンバレよ
>僕のところは見にくい配色 いや〜ちゃいます...今テストしているページの配色が悪くて見づらいので どうにかしようと考え中なところなんです。 wgetを使っていて、ファイル数が多い所からのダウンロードをすると 急に動作が遅くなり、通常ならメモリ消費がコンスタントに1MBぐらいのところ 20〜30MBも食いバグかな?と思わせる動きをしますね。 バージョン1.6、1.7を試した限りでは同じ症状。 この時1つ1つのファイルサイズが小さくても関係ないので メモリ回りのバグなのか・・・。 同じ相手サーバー内でもファイル数の少ないディレクトリなら全然問題無いので 通常利用には問題無いのだろうけど。
age
272 :
login:Penguin :2001/07/21(土) 22:57
ふむ、とくとくか・・・ 色分けによりわかりやすいサイトだね。
心配だった配色が不評じゃなくてよかった...。 ページ構成がまだ、決まってないけどシンプルに する予定です。
275 :
login:Penguin :2001/07/21(土) 23:34
綺麗でみやすい配色だと思います
>>275 どうもです。
使いやすいサイト目指してやってみます。
>>272 むぅ。うちの Netscape だと何も表示されん…
278 :
login:Penguin :2001/07/22(日) 02:54
>>272 俺もリロードすると何も表示されなくなる。。。
279 :
login:Penguin :2001/07/22(日) 02:55
>>279 UNIXです。
文字コードかも。今日夕方に取り組みます。
281 :
login:Penguin :2001/07/22(日) 09:04
文字コードだね。 <!--meta http-equiv="Content-Type" content="text/html; charset=euc"--> コメントアウトしてちゃあ駄目だろ。。。
282 :
login:Penguin :2001/07/22(日) 11:43
283 :
272 :2001/07/22(日) 17:14
フリーのCGIが使える所は、どうも文字コードの問題が出ると何処かで見たので 今朝、x-sjis>euc>コメントアウトしてチェックしてみたけど・・・。 これから色々やってみます。
こんな書込みを上げてしまった。
ひとまず、使えるようになりました。
テスト公開中検索
http://www12.tok2.com/home/apache/ 入り口のindex.htmlは、定期的にPerlで書き出しているのと
フリーサーバーの場合はそれを、#includeして広告を入れている?ので
手探りで文字コード指定しました。(笑
フレームタグのサイズ指定が、ブラウザによって解釈が違ったりするので
これもまた、手探り状態で色々設定してどうにかまともになりました。
287 :
272 :2001/07/26(木) 00:16
以前にタイムスタンプ引継ぎの事を書いたので
>>258 にタイムスタンプの引継ぎを入れると・・
wget -m -I linux/dat
http://cocoa.2ch.net/linux/dat for i in `ls $datdir | egrep "[0-9]+\.dat"`
do j=`echo $i | sed -e 's/\.dat//'`
$dat2html '<>' "" $datdir/$i > $wgetdir/'cocoa.2ch.net/test/read.cgi?bbs=linux&key='$j
touch -r $datdir/$i $wgetdir/'cocoa.2ch.net/test/read.cgi?bbs=linux&key='$j #タイムスタンプ引継ぎ
done
ディレクトリごと削除した時に効果あるかわかりませんがタイムスタンプが
以前にインデックスを作成した時と同じならmknmz 時にスキップしてくれるかも
しれません。
289 :
login:ディストリいっぱい :2001/07/31(火) 01:56
あははー。検索窓ついてるー。使ってくれてる人がいるとは思わなかったです。ありがとうございます。
しかし
http://www.dyn.to/ って結構ポロポロサバ落ちするんだなあ。金取ってるくせして。
こんなんだったら最初から無料の
http://dyndns.org/ にすればよかったなあ。
金取ってる分だけ安定してるかと思ったのに。今さら変えるの大変だしなあ。
はあああ。ストレスたまるー。
あまりにもストレスがたまるので他のところに変えてやるーって思って探してたら
最近新しいのできたんですね。→
http://ddo.jp/ ←誰か使ったことある人います?
試しに取ってみたけどどうだろう。1ヶ月全くオチないようだったらこのまま使ってもいいかなあ。
http://2ch.ddo.jp/ でも年額6000円は高い。。。
291 :
login:ディストリいっぱい :2001/07/31(火) 12:12
うおっ。すごいもの見つけました。
昨日書いた
http://ddo.jp/ のサイトをうろうろチェックしてたら
http://ddo.jp/links.php ↑「Linux@2ch掲示板」にリンクが張ってました!!!笑
そうだったんですね。僕たちの仲間だったんですね。水臭いではないですか。ddo.jpさん。
だったら推奨します。→
http://ddo.jp/ ←素晴らしい
今のところ問題ないし、無料バージョンもあるし、ドメイン覚えやすいし。いいと思います。
Linux板住人価格として6000円を3000円にまけてくれるともっと素晴らしい。←ホメた目的はこれ
話変わりますけどこの板、最近書き込みがすごく減ってないですか? (@@;)
あのにまうすさんも使ってくれてるんですね。ありがとうございます。 アップローダーがあったんでエロエロ画像がアップされているのを期待して 見てみたんですが全然違いました。。がっかりです。。。 アップローダ=エロエロ画像 と考える僕が間違ってますかー?(ーー;)
294 :
login:Penguin :2001/08/10(金) 14:53
2.0.6 リリース age
リンク有難う御座います。 高レスポンスで返せるようチューニングに励みます。
(・∀・) 300!!
301 :
login:Penguin :2001/08/25(土) 18:10
久しぶりに2ch検索使ってみたらこの板で作ったなんてことは全部すっとんで 広告貼って小遣い稼ぎですか?
302 :
2ch検索の"管理"人かも :2001/08/25(土) 18:26
>>301 1円もお金なんか入ってきませんけど?
広告=管理人にお金が入る
と思ってはいけません。
広告を貼るから値引きをしてくれ、ということで広告が入ってます。
ちなみに前のコレガの時も広告を貼るから懸賞の商品を提供してくれ、
との条件でバナーを貼ってました。僕には何も入ってきてません。
http://2ch.dyn.to/corega_hub.html ↑これね。
これらは、みんなに作ってもらったからみんなに対するお礼のつもりでやってます。
僕が金儲けして喜ぶような人間だと思ったんですかー?
303 :
余弦者 :2001/08/25(土) 23:01
>>1 と他の検索サイト管理人殿
現在閉鎖中の板は2度と戻ってこないかもしれないので、
現在のログを保存してあとで公開してもらえると非常に助かるのだが
304 :
2ch検索の管理人かも :2001/08/25(土) 23:57
>>303 ああぁ、、、僕はログは捨ててます、、、
でもって「かなりしばらくお待ちください。」のところは
今となってはdatファイルを取ることもできません、、、
ですから僕には何もできません、、、すみません、、、
みみずんさんのところがログをちゃんと保存してるからなんとか
してくれるかもしんないです。
↓ココです。
http://mimizun.mine.nu/
305 :
2ch検索の管理人かも :2001/08/26(日) 00:02
この手の検索システム構築には、マシンパワー&高速回線が必要だと思います。 データ取り込み時に圧迫される回線 インデックス書き出し時に消費されるCPUパワー データ保存で必要なHDD領域 常時稼動によって掛かる電気代&騒音。 手間も掛かり決して楽なボランティアでは無いと思いますので がんばってください。>各検索の管?理人
スレが見つかって、それを表示する場合、 "レス全部読む"ではなく"最新レス100" のURLが指定できんかのぅ。。。
>>306 お・応援ありがとうございます。が・頑張ります。
>>307 それ、いいですねえ。
ja.po かなんかをいじればできそうな気もします。
でも僕は ja.po というものがどこにあるのか知りません。ですから永遠に対応はできません。
さ・さようなら。。。ごめんなさい。。。
人為的ミスでブレーカーを落としデータがクラッシュ、しばらく停止してましたがやっと復旧。
UPSは管理人の個人的財政難から今後も採用予定無し...
>>307 可能だと思いますが、検索キーワードでHitしたスレッド内を
ブラウザ検索で長い書込みの中から絞込みを想定しています。
現状でどうにか使って頂きたいと思います。
このスレの連中はシェルスクリプトもロクに書けねーのかよ。 export var=valは許すとして、 for i in `ls $datdir|egrep "[0-9]\.dat"`なんて痛すぎ。 ディレクトリ空だったら死ぬだろ。 昔の話題ではあるが。
311 :
ディストリいっぱい :01/09/29 23:47 ID:gAs/Bj.E
今日発売のあちゃら11月号の91ページに2ちゃんねる検索が掲載されてます。 暇な人は見てみて下さい。 今月の初めにライターさんから「掲載させてもらいます。」という話は聞いていたけど どういうふうに取り上げるのかは聞いてなかったんで、どんなふうに載ってるんだろ? と思って立ち読みしようと思って本屋に行ったら結構大きく紹介されてたので 買ってしました。永久保存版。。。 今度の目標は日経Linuxに掲載されることです。頑張ります。
312 :
login:Penguin :01/09/29 23:49 ID:gAs/Bj.E
おめでとう。
313 :
login:Penguin :01/09/29 23:50 ID:gAs/Bj.E
名スレの予感
314 :
ディストリいっぱい :01/09/29 23:51 ID:gAs/Bj.E
ちなみに
>>312 >>313 は自分で書き込みました。
誰も反応してくれないとさみしいんで。。。
315 :
login:Penguin :01/09/30 00:06 ID:s8gsnkrQ
>>311 技術的なことはちんぷんかんぷんですが、
本当におめでとうございます。
316 :
ディストリいっぱい :01/09/30 00:14 ID:2uU1/ecY
あ、本当に祝ってもらえた。うれしいです。ありがとうございます。
>>311 おめでとうございます。
まだ見てないから見てみよ。
318 :
うろんぐ :01/11/30 17:52 ID:0UsyWI7S
Web ページで検索できるようにする前に、emacs から検索してみようと思って namazu.el を入れてみた。 でも、M-x namazu で検索文字列を入れてみると Wrong type argument: stringp, nil と表示されて検索できなかった。 コマンドラインから namazu で検索するとちゃんと検索できてるのになぁ。 何が悪いのでしょうか? emacs-lisp を勉強していない俺が悪いのでしょうか?
319 :
みみずん :01/11/30 20:32 ID:8qsrn8Pr
320 :
うろんぐ :01/12/01 08:49 ID:U6ZUKGfm
>318 自己レス。 ~/.namazurc でのデフォルトのインデックス指定が Index ほげ だったのが敗因でした。 INDEX ほげ じゃないとだめなんですね。いや、 namazu はどっちでもいいんですが、 namazu.el で .namazurc を解析するところが INDEX しか見てくれないんですよね。それだけでした。スマソ。
Namazuはクズ検索エンジン
>321 何がおすすめ? 合計 20GB 程度の Web サイト内の全文検索をしたい。
Mitake Search なりなんなりの売り物つかうのはどうよ。
>>321 は例の私怨厨か... まだいたんだな。
324 :
login:Penguin :01/12/13 11:18 ID:ugaubRPB
>323 なるほど、と思っていろいろ商用のものを見てみたんですが、 きづいたこと。 Namazu をつかってて、致命的に困っていることが、無い。 というわけで Namazu を使いつづけることにしました。 Debian 用パッケージも用意されていることだし。
325 :
あのみみずん@ N72ch-01p57.ppp11.odn.ad.jp :01/12/16 09:46 ID:dwyzpYXY
Namazu いいよね。便利だし、早いし。 まぁ検索精度は低く感じるけど無料だから文句ないし。 つか、index作るのに時間かかるね・・・メモリも食うし。
申し訳程度にrenice +20…
327 :
login:Penguin :02/01/26 16:50 ID:7jfLsj9S
kakasi の辞書、mysql とかのデータベースに格納できるとありがたいんだけどなぁ。
328 :
login:Penguin :02/01/26 21:15 ID:7jfLsj9S
DocuWorks 文書用のフィルタってどなたかしりませんか? 昨年10月ごろの ML で Fuji Xerox の開発部でも UNIX 用のフィルタの必要性は認識しているって言う話がでてたらしいんですが、その後まったく話を聞きません。
329 :
login:Penguin :02/01/26 21:30 ID:UX7CiKAA
広報にたずねてみては? 個人でも邪険にされることはありませんよ
330 :
login:Penguin :02/01/26 22:35 ID:cUpXDNAM
>>327 それ、ずーっと昔に試したことがあるけど、かなり遅いよ(汗
postgresでもmysqlでもoracleでもsybaseでも。
データ型のチェックとか格納のためのソートツリーの作成とか、
kakasiを使うにあたって不要な部分がボトルネックになる模様。
331 :
login:Penguin :02/01/27 00:49 ID:rUkqU65a
>330 それって、kakasi のソースをいじってってことですか? それとも毎回データベースから単語ファイルを作成して辞書ファイルを作成して…ってことですか? もしかして前者の場合だったらパッチがあるとか…。
332 :
login:Penguin :02/01/27 05:51 ID:rUkqU65a
>320 なんか久しぶりにこのスレ読んで、おもだしたので、BTS にあげときました。
1からよんで感動した
334 :
login:Penguin :02/03/08 14:10 ID:OE9ed93x
wvWare v0.5.x.tar.gz どっかに無いかな。 v0.6以降からおいらのスキルじゃWord文章をうまく検索できんようになってしまった。
336 :
login:Penguin :02/03/24 00:16 ID:ECEITlSW
age
337 :
login:Penguin :02/05/01 23:10 ID:vlGgka0t
338 :
名無しさん@ディストリいっぱい :02/05/04 01:19 ID:sJTSZgK7
なんと早くも1周年。おめでたいです。 よく頑張りました。(自画自賛)
>>338 コテハンはひさしぶりだな。
掲示板すごいことになってるね。
すごいことになってるっていうから荒らしでも来てるのかと思って見に行っちゃいました、、 あの質問づくしのことですか?もう慣れました。メールでも「削除して下さい。」とか 「書き込みができないんですけどなんでですか?」ってメールがしょっちゅうきます。 わかる範囲で答えてますけど。 1年ってあっという間だなあとしみじみとした気分です。
アーリーらっぱ飲みしながら>1から読破。 知らずに使っていた2ch検索にこんな歴史があったなんてね。
342 :
あれれ? :02/05/04 07:12 ID:vsdupTed
空欄にしたら「名前:login:Penguin」になってしまいました。 詐称ではありませぬ。
344 :
login:Penguin :02/07/19 22:06 ID:SLbxrvZg
UNIX板から来ました。 "namazu.cgi"を間違って消してしまいました。今から使おうと思ったのに redhat7.3のrpmから入れたやつです。ちなみにバージョンは namazu-2.0.10-4 namazu-cgi-2.0.10-4 だれかアップしていただけると助かります。お願いします。
345 :
hh :02/07/19 23:15 ID:6iM25OVn
大抵はつかえるだろう。
349 :
login:Penguin :02/07/26 10:44 ID:5MbssHQh
にちゃんねる検索はいいと思うんだけど、 自宅でサーバー立ててる人とかってさー namazu何に使ってんの? なんかおもしろい使い方ってある?
351 :
login:Penguin :02/09/04 13:04 ID:+A/E5ACP
感謝age
353 :
login:Penguin :02/09/22 12:59 ID:nEa4cqUa
つか/settei/がIndex表示になってないな。 shスクリプトとか欲しいのに。
2ch.shだと思ってたが名前変更されてたんだな。俺もちょっと探したけど見つけた。
http://2ken.net/settei/linux.sh これだろう。でもわざわざこれを取得しなくてもこのスレに書かれてるのと同じだと思うが。
但し、今はdatディレクトリが見れないからこれでは動作しないと思う。
あと3行目の set | grep LANG は不要だと思う。ここでgrepしてどうする・・
355 :
名無しさん@Emacs :02/10/03 02:45 ID:tCrncUsf
/usr/lib/mozilla/searchplugin/Googlejapan.src に
ちょっと変えてこんなんを作ってみた。
# Mozilla/2chSearch plugin
<search
name="2ch search"
description="2ch search"
method="GET"
action="
http://2ch.dyn.to/cgi-bin/namazu.cgi "
queryEncoding="2561"
queryCharset="Shift_JIS"
>
<input name="key" user>
<input name="whence" value="0">
<input name="lr" value="lang_ja">
<input name="dbname" value="all">
<input name="max" value="20">
<input name="sourceid" value="mozilla-search">
<interpret
charset = "Shift_JIS"
resultEncoding = "2561"
resultListStart="<!--a-->"
resultListEnd="<!--z-->"
resultItemStart="<!--m-->"
resultItemEnd="<!--n-->"
>
</search>
356 :
login:Penguin :02/11/01 10:53 ID:SkScjhB+
インデックスから日本語を排除したいと思っています。 検索対象は日本語のテキストファイル(含む LaTeX ソース、メール、ニュース)なのですが、 検索後として日本語を指定することがほとんどありません。 そこでインデックスを作る際に日本語は省いてしまいたいと思っています。 mknmzrc はどのように設定するといいのでしょうか? 現在は kakasi, chasen 共に使用できるようになっています。 あと、メールやニュースの Message-ID, In-Reply-To, References: フィールド以下の 文字列に対しては、メッセージ ID そのままの状態でインデックスに含めたいのですが、 可能でしょうか? つまり、検索文字列としてメッセージIDを指定したいことがあるということです。
357 :
356 :02/11/01 11:31 ID:SkScjhB+
nkf ~/Mail/ML/IETF/1 | chasen -j -F '%?U/%m/ / ' | jless で望む結果が得られ多っぽいです。 chasen のマニュアルによると %?U/STR1/STR2/ っての 『if unknown word, STR1, otherwise, STR2』 ってことなのですが、 UNKNOWN ってのは辞書に無いってことですよね? てことは chasen の辞書に英単語が載っていたらだめなんだな。
358 :
356 :02/11/01 11:32 ID:SkScjhB+
nkf ってデフォルトで BASE64 のデコードしてくれるんですね。 メールの Subject: の日本語(BASE64エンコードされている) が、 デコードされててちょっと感動した。
359 :
独自フィルタを作りたい :02/11/02 12:11 ID:0CRm6865
360 :
独自フィルタを作りたい :02/11/02 12:19 ID:0CRm6865
特にフィールド検索に重点をおきたいと思っています。 実験結果のファイルがあって、それには実験の条件が書き込まれているので、 Word や Excel 文書の「文書のプロパティ」みたいな扱いができればと。 使用している OS は Debian GNU/Linux 3.0 (woody) です。 いくつかのフィルタを読んでみたところ、フィルタの側ではとにかく可能な限り、 フィールドの情報を抽出して返しているように思います。 フィールド名などもフィルタのほうで勝手にいくらでも作ることができるみたいです。 どのフィールドをインデックスに採用するかというのは、 フィルタから返された情報を見て mknmz が決定するのでしょうか?
つまり、"+subject:linux" みたいな検索式の subject の部分に何を使えるかは、 誰がどうやっていつ指定しているか、ってことなんですが。
フィルタ読んでみました。 $REMAIN_HEADER → mailnews.pl が見ている $META_TAGS → html.pl が見ている $SEARCH_FIELD と %FIELD_ALIASES は mknmz 本体だけが見ている? (まぁ conf.pl でデフォルト値を設定しているのは別として) うむ〜 NMZ.field.* 出力している部分をよんでみまつ・・・
1)フィルタからフィールドのデータが連想配列で返ってくる。 2)%FIELD_ALIASES を使ってフィールド名を変換 %FIELD_ALIASES は キー = フィルタから返ってくるフィールド名 値 = インデックスに登録するときのフィールド名 3)フィールド名が SEARCH_FIELD にあるものは NMZ.field.<フィールド名> に出力 META_TAGS を使うようオプションで指定されていたときは SEARCH_FIELD だけでなく META_TAGS にあるものも対象。 ってことか・・・・ちょっと気持ち悪いのは、なぜか mailnews.pl では メールヘッダの Subject: の内容を 'title' フィールドとして返しておいて、 mknmz 本体でわざわざ 'title' -> 'subject' への別名置き換えをやってるところ。 だったらはじめから mailnews.pl で $fields->{'subject'} = $line とかすればいいのに。
今朝になって突発的に独自フィルタ作りたくなって、 my とか local ってなに? perl の名前空間ってどうなってんの? @ とか % とか \ とか $ とかなに? ってとこからはじめたんで、ちゃんとソース読めてないかもしれない・・・
366 :
login:Penguin :02/11/03 02:13 ID:RjWYQ8zV
Windows の Outlook の *.msg ファイルがあるんですが、 これのフォーマット分かる方おられませんか? フィルタかいてみようかとおもったんですが、 MH 形式とはちょっと違うみたいです。 いらないバイナリデータがあちこちにちりばめられていて。 確かにテキスト部分は一部読めるんですが。
これを使えば何とかなりそうな気がしてきました。
Converter for Microsoft Outlook 2000 (TM) .msg files
http://www.brodo.de/english/pub/msg2a/ Matijs van Zuijlen has written a Perl scriptwhich does convert Microsoft Outlook .msg files to mbox format.
He found out that the file format is OLE-compatible.
This script uses many Perl modules to extract the information,
but you should be able to find all Perl Modules either in your favourite Linux distribution, or at CPAN.
You can find his program (License: GPL), as well as documentation,
at
http://www.xs4all.nl/~mvz/software/msgconv.html .
368 :
login:Penguin :02/12/04 15:44 ID:t/qSISBU
まるちゃんage
369 :
1 :02/12/04 16:27 ID:fPwE/y/H
IP記録実験
http://qb.2ch.net/test/read.cgi/accuse/1042013605/ 1 名前:ひろゆき ◆3SHRUNYAXA @どうやら管理人 ★ 投稿日:03/01/08 17:13 ID:???
そんなわけで、qbサーバでIPの記録実験をはじめましたー。
27 名前:心得をよく読みましょう 投稿日:03/01/08 17:20 ID:yL/kYdMc
SETTING.TXT管轄でないということは全鯖導入を視野に、か?
38 名前:ひろゆき ◆3SHRUNYAXA 投稿日:03/01/08 17:22 ID:rLfxQ17l
>>27 鋭いです。
73 名前:ひろゆき ◆3SHRUNYAXA 投稿日:03/01/08 17:27 ID:rLfxQ17l
>ところで、IPが抜かれて何か今までと変わることってあるのでしょうか?
・今までより、サーバが重くなる。
・裁判所や警察からの照会があった場合にはIPを提出することがある。
>>47 HDDがいままでより早くいっぱいになってひろゆきと夜勤さんが困る
∋oノハヽo∈ ( ´ァョ) <のんのん♪
犯罪者はIP提出してとっとと警察へ連れて行って欲しいけど 荒らしは減らないような気がするんですが、、 そこんとこどうでしょうか? >ひろゆきさん
IP記録実験
http://qb.2ch.net/test/read.cgi/accuse/1042013605/ 1 名前:ひろゆき ◆3SHRUNYAXA @どうやら管理人 ★ 投稿日:03/01/08 17:13 ID:???
そんなわけで、qbサーバでIPの記録実験をはじめましたー。
27 名前:心得をよく読みましょう 投稿日:03/01/08 17:20 ID:yL/kYdMc
SETTING.TXT管轄でないということは全鯖導入を視野に、か?
38 名前:ひろゆき ◆3SHRUNYAXA 投稿日:03/01/08 17:22 ID:rLfxQ17l
>>27 鋭いです。
73 名前:ひろゆき ◆3SHRUNYAXA 投稿日:03/01/08 17:27 ID:rLfxQ17l
>ところで、IPが抜かれて何か今までと変わることってあるのでしょうか?
・今までより、サーバが重くなる。
・裁判所や警察からの照会があった場合にはIPを提出することがある。
ひろゆきのレイプ予告したらIP晒されちゃうかな?
379 :
山崎渉 :03/01/15 11:31 ID:+BGYmUVc
(^^)
380 :
login:Penguin :03/02/04 04:14 ID:A2vZpuZL
pc2サーバになってからログが取得できませんが
とりあえず、保守age
382 :
山崎渉 :03/04/17 12:22 ID:KRn99/cy
(^^)
383 :
山崎渉 :03/04/20 06:03 ID:X64WTq1+
∧_∧ ( ^^ )< ぬるぽ(^^)
| | ∧ |_|Д゚) こっそり保守 |文|⊂) | ̄|∧|
| | ∧ |_|Д゚) こっそり保守 |文|⊂) | ̄|∧|
ageないと。。。 ククーン。。。
| | ∧ |_|Д゚) ageないと保守できないと思っているなんて・・・。 |文|⊂) | ̄|∧|
>>387 お腹減らないのかしら・・・?
そうか! ヌイグルミの猫ちゃんなのかしら。。。
クククのクーン。。。
389 :
山崎 渉 :03/07/15 11:24 ID:2JhhXBQM
__∧_∧_ |( ^^ )| <寝るぽ(^^) |\⌒⌒⌒\ \ |⌒⌒⌒~| 山崎渉 ~ ̄ ̄ ̄ ̄
∧_∧ ∧_∧ ピュ.ー ( ・3・) ( ^^ ) <これからも僕たちを応援して下さいね(^^)。 =〔~∪ ̄ ̄ ̄∪ ̄ ̄〕 = ◎――――――◎ 山崎渉&ぼるじょあ
懐かしいスレだわ。。。 ククーン。。。 ククーン ...
392 :
山崎 渉 :03/08/15 22:59 ID:dil3w4kp
(⌒V⌒) │ ^ ^ │<これからも僕を応援して下さいね(^^)。 ⊂| |つ (_)(_) 山崎パン
画面綺麗だし、パフォーマンスもいいし、 なんか無性に感動した。 応援&保守sage
保守sage
てすと
396 :
login:Penguin :04/03/17 08:12 ID:YU7c9ND+
ぬるぽ
397 :
login:Penguin :04/06/04 22:18 ID:kp0vHpoH
なまず
399 :
login:Penguin :2005/05/20(金) 09:19:33 ID:g7agSS6H
まだ書けるのかな?テスト
>>19 おいおい、三流大学とはいえ、医学部は偏差値だけはそれなりだぞ。
401 :
login:Penguin :2005/07/14(木) 05:15:51 ID:TFsXQ32L
402 :
lute.kyoto-pc.ac.jp :2005/07/14(木) 10:11:22 ID:8kA6nqIz
てすと
403 :
login:Penguin :2006/10/11(水) 18:29:45 ID:sKmclboc
405 :
login:Penguin :2006/10/11(水) 21:49:21 ID:uK3oW7bv
namazuって、昔よく使かってたけど、 今は、どうなったの?
Hyper Estraier にお株を奪われて終了
>>406 Hyper EstraierってPerl動作版とかあるの?
レンタルサーバで使えないんじゃちょっとなぁ。
目玉のP2P並列処理もAPIだけ公開されてるけど
実運用するには敷居が高い。高すぎる。
あとResultページのカスタマイズとかできないし。
エンジン自体はNamazuよりずっといいと思うんだけどなぁ
408 :
406 :2006/10/21(土) 17:42:30 ID:MJXjqX1B
確かに Namazu における pnamazu みたいなのはないな。 QDBM とべったりだから、Pure Perl で実装するのは難しそうだね。 >あとResultページのカスタマイズとかできないし。 あー、確かに標準添付の estseek.cgi はいまいちね… API は提供するから各自でフロントエンド書けってのが作者のスタンスなんだろうな。
409 :
login:Penguin :2007/01/09(火) 23:59:29 ID:CgfAmGyf
Namazu 上げとこう
410 :
login:Penguin :2008/02/06(水) 21:31:47 ID:tz+SPYsr
Namazu 一年に一回位は上げとこう
今日で、北京オリンピックは終了か、 Beijing 2008. 次は、またロンドンで逢おう。
なまず テスト OK
NAMAZU namazu Test OK
415 :
名無しさん@ディストリいっぱい :2009/12/07(月) 04:12:12 ID:W7AG3aXs
>>1 です。おはようございます。
みなさんの協力のおかげで9年経った今でもまだ2検ネットは健在です。
本当に感謝してます。ありがとうございます。
416 :
login:Penguin :2010/04/23(金) 21:18:39 ID:KPkTwpyw
なまず あげ。
417 :
login:Penguin :2011/04/25(月) 23:07:38.53 ID:ukfhULhC
放射 あげ
10年経った。。。。
もうすぐ11周年
11周年だw 山崎渉とかいるのがすごいww namazuでもこんなにがんばれるんだねー。
421 :
login:Penguin :2012/11/01(木) 07:55:54.31 ID:l3rtPgcy
すみません。DNSの調子が悪くて暫く鯖落ちてました。こんなに長期間落ちたの初めて。
おかえりなさーいw
>>423 ただいまーwwwたまに見てますよー。
ここは僕のふるさとですから。うん。
425 :
名無しさん@ディストリいっぱい :2013/12/08(日) 12:55:11.20 ID:krbHjio2
426 :
名無しさん@ディストリいっぱい :2013/12/08(日) 13:02:08.47 ID:krbHjio2
ちなみにこのサバで5台目。維持費だけかかる金食いサーバ。 でもみんなで作ったサーバなので閉鎖する気はまったくありません。 ちなみにamazonのアフィ張ってるけど3ヶ月に5000円程度しか入りません。 回線使用料いくらかかってると思ってるのー。
∧_∧
( ・∀・) | | ガガッ
と ) | |
Y /ノ .人
/ ) .人 < >_∧∩
_/し' < >_∧∩`Д´)/
(_フ彡 V`Д´)/ / ←
>>396 / ←
>>383
428 :
login:Penguin :2014/01/13(月) 15:24:36.13 ID:1ZSU24T1
namazuでgoogleを超える検索サーバを作りたいです!
429 :
login:Penguin :2014/01/15(水) 22:44:30.34 ID:YJ+IGpFn
430 :
login:Penguin :2014/01/15(水) 23:20:01.60 ID:vfRBS9Pl
応援ありがとうございます!
ぬるぽ
432 :
ディストリいっぱい :2014/03/31(月) 17:16:21.68 ID:oW9JQMEb
お久しぶりです。
なかなかクロールするのが大変で試行錯誤してます。
http://2ken.net/2chall.sh ↑subback.htmlをダウンロードしてローカルでタイトルを分解することで相手鯖への負荷を減らすようにしたんですけど
何か動作不良起こします。
朝からずっと見てたら頭が痛くなってきたので誰か天才の人、ちゃちゃっと見てみて下さい。
なんだかわかりますか?
433 :
ディストリいっぱい :2014/04/01(火) 04:05:11.17 ID:rms93eqU
ちょっと仮眠してました。 やっぱり自分でなんとかしよう。どこか一文字消してしまっただけのような気もするけど。 目を覚まして検証、検証。
>>433 >>432 の2chall.shを弄ってみたけど
ファイルはAxfc辺りに上げればいいのか?
435 :
ディストリいっぱい :2014/04/01(火) 21:17:49.21 ID:rms93eqU
>>434 直りました?ありがとうございます。upするのはどこでも平気です。ありがとうございます。
きっと僕の回りくどいソースをちゃんと改良してくれてそうな・・・ありがとうございます。お願いします。
>>435 ttp://www1.axfc.net/u/3211965 Debian jessie 64bitでループの部分までは動作を確認したつもりだけど
エラー吐いたりsubback.htmlやlist.htmlのフォーマットが間違っている可能性があるので
必ずバックアップとテストしてから使ってね。
それと、おそらくは期待されているほどの能力は持っていないので、読みにくいと思う。
#namazuは使ったことないのでそれに関係する問題は答えられん。
437 :
ディストリいっぱい :2014/04/02(水) 10:37:51.94 ID:ItZiBH6c
>>436 問題ないです。見事に分解できました。ありがとうございます。
mknmzでコケたけど多分mknmzrc辺りの設定でエラー吐いてるっぽいので後は自分でnamazuと戦います。
ありがとうございます。
438 :
【大吉】 :2015/01/01(木) 17:49:02.60 ID:JW5HKjXz
名前欄に!omikujiで今年の運勢
439 :
【393円】 :2015/01/01(木) 17:49:51.07 ID:JW5HKjXz
名前欄に!damaでお年玉の額
続けて書けば2つ同時に占えます 正月だけ
なぜこのスレで。
ナマズ?
ナマズ!