全文検索エンジンNamazu ver2

このエントリーをはてなブックマークに追加
250名無しさん@お腹いっぱい。:2008/02/22(金) 02:22:48
>>249
よし頑張れ。
251名無しさん@お腹いっぱい。:2008/02/22(金) 03:33:49
それを必要な人がそれをやるしかないんだよ。

いわゆる言い出しっぺの法則 ――言い出しっぺがやらなければ誰もやらない―― だね。
252名無しさん@お腹いっぱい。:2008/02/28(木) 13:15:05
なんでこれ環境変数と設定ファイルで同一の設定値を設定しないといけないんだ?
混乱するだけだと思うんだが。
世の中からこういうバカがいなくなればいいなあ。
253名無しさん@お腹いっぱい。:2008/02/29(金) 04:25:26
>>252
kwsk
254名無しさん@お腹いっぱい。:2008/03/03(月) 03:31:23
>>252
じゃあ直せよ
255名無しさん@お腹いっぱい。:2008/03/03(月) 21:09:29
>>254
kursk
256名無しさん@お腹いっぱい。:2008/03/12(水) 02:04:18
Namazu 2.0.18 リリース age
257名無しさん@お腹いっぱい。:2008/04/21(月) 21:18:16
windows環境でのNamazuでofficeを入れない環境で
office文書を検索対象に含めるには何のソフトが有効ですか?
Microsoft Office Viewerを入れたら可能ですか?

また、zipなどの圧縮ファイル名を検索対象にするにはどうしたらいいでしょう?

よろしくおねがいします
258名無しさん@お腹いっぱい。:2008/04/21(月) 23:47:00
>>257
officeを入れない環境ではxdoc2txt.exeが有効。
windows環境ではzipには標準で対応している。試してみましたか?
説明書を読んでますか?
ttp://www.namazu.org/doc/manual.html#doc-filter
よろしくおねがいします
259名無しさん@お腹いっぱい。:2008/04/23(水) 00:31:46
14ではzip対応していなかった。
18では全部できました。

lzhを対象にしたフィルタはない?
ここは潰れてる
http://log.counterghost.net/20040417.html
260名無しさん@お腹いっぱい。:2008/04/23(水) 23:24:10
>>259
lzhを対象にしたフィルタはcvsにはあるっぽいね
http://cvs.namazu.org/namazu/filter/
でもwindowsでは使えないかもね
261名無しさん@お腹いっぱい。:2008/04/23(水) 23:55:45
sub status() {
return 'no' if ($English::OSNAME =~ /^(?:MSWin32|os2)$/i);

# Only LHa for UNIX.
$lhapath = util::checkcmd('lha');

とかあるからwinは無理っぽいですね。。。

http://log.counterghost.net/20040417.html
↑持っている人どこかに上げてくれないだろうか・・・
262名無しさん@お腹いっぱい。:2008/04/24(木) 00:22:14
WaybackMachine
263名無しさん@お腹いっぱい。:2008/04/24(木) 00:33:50
IA探したけどなかったんだよ
264名無しさん@お腹いっぱい。:2008/09/19(金) 01:28:40
質問です。

WindowsXP + NTEmacs22.2 + Gnus の環境で Namazu を使っていますが、
Fedora9 + Emacs23 + Gnus で同じようにインストールした Namazu だと
「山田」のような固有名詞でも検索出来ますが、Winの場合だと同じ名前
で検索に引っかかりません。
(その名前が含まれたメールは存在してます。)

一般的な名詞だとどちらも同じように検索できてます。

環境としては、Win は ja_JP.SJIS で、Fedora9 は ja_JP.utf8 です。
両方共 Kakasi を使ってます。

何か気づいた点などありましたら教えてください。
265名無しさん@お腹いっぱい。:2008/10/17(金) 19:17:44
すみません。教えてください

test.tgzという1GBほどのファイルがあった場合に、
中身のについてのindex作成を行わずに
ファイルの名前とパスのみをindexに残したいのですが、
どのように設定すればよいでしょうか?

たとえばtest.tgzをtgzで検索にひっかけるなど、
ファイル名だけでも検索に引っかかるようにしたいのですが
可能でしょうか?
266名無しさん@お腹いっぱい。:2009/08/29(土) 11:16:19
64bit Linuxマシン(Red Hat Linux ES5)でnamazuをインストールしようとしますと、


Text/ChaSen/ChaSen.so \
-L/usr/local/lib -lchasen \

/usr/bin/ld: /usr/local/lib/libchasen.a(chalib.o): relocation R_X86_64_32 against `a local symbol' can not be used when making a shared object; recompile with -fPIC
/usr/local/lib/libchasen.a: could not read symbols: Bad value
collect2: ld はステータス 1 で終了しました
make: *** [blib/arch/auto/Text/ChaSen/ChaSen.so] エラー 1

というエラーがでます。

どのように対処したらよろしいでしょうか?

GOOGLE検索してもなかなか解決策が出てきません。

よろしくお願いします。
267名無しさん@お腹いっぱい。:2009/08/29(土) 12:03:02
メッセージに recompile with -fPIC と言っているから、それを試みる。
268名無しさん@お腹いっぱい。:2009/08/29(土) 12:04:23
rpmないの?
269名無しさん@お腹いっぱい。:2009/08/29(土) 15:02:28
>>267
recompile with -fPIC
というのはどういうふうに試せばいいのでしょうか?
これも検索したんですが、よくわかりません。。
>>268
rpmはでていないようです。さがしてみたんですが。。
270269:2009/08/29(土) 15:06:27
少し説明不足だったように思いますので、付け加えますと、
http://www.asahi-net.or.jp/~wv7y-kmr/memo/namazu.html
を参考にし、
Text::chassen perl moduleをインストールしようとし、
$ perl Makefile.PL
$ make
をした後に、266のメッセージはでます。。

271名無しさん@お腹いっぱい。:2009/08/29(土) 15:46:16
>>270
茶筅のライブラリ /usr/local/lib/libchasen.a(chalib.o) が読み込めないと言って居るんだから
ライブラリをシステムに合わせて構築し直せ。
272269:2009/08/29(土) 16:11:36
>>271
すみません、もう少しヒントをもらえますか?
どのようにしてライブラリを構築しなおすといいのでしょうか?
自分がやったのは、
$perl -fPIC Makefile.PL
ですが、それもエラーがでました。このへん詳しくないので。。
273267:2009/08/29(土) 17:03:34
>>269 はじめのカキコのメッセージは、namazu のコンパイルオプション云々
じゃなくて、namazu をビルドするときに使おうとしているchasen のライブラリが
変だよ、といってるの。リンクに失敗しているんで、libchasen を -fPICという
のオプション付けてコンパイル (gcc) してくれたら直るとおもうよ、と言っているの.。

察するに、-fPIC オプションは実際には不要で、単に、chasen のソースを
とってきて、./configure; make; sudo make install ; sudo ldconfig とやれば
済みそうな気もするが。
274名無しさん@お腹いっぱい。:2009/08/29(土) 17:22:27
>>272
茶筅のインストールに失敗しているんだろ
ttp://chasen.naist.jp/hiki/ChaSen/?%A5%BD%A1%BC%A5%B9%A4%AB%A4%E9%A4%CE%A5%A4%A5%F3%A5%B9%A5%C8%A1%BC%A5%EB
茶筅単体で動くことを確認してみろ。 あと、茶筅のバージョンは最新か?

いらん話: -fPIC だが、茶筅の Makefile の CFLAG に 追加。
(このモジュールはCだかC++だかで書かれていたはず)
275名無しさん@お腹いっぱい。:2009/08/29(土) 17:26:25
茶筅の最新版の取得先
ttp://sourceforge.jp/projects/chasen-legacy/
276269:2009/08/30(日) 09:45:59
>>273
>>274

ありがとうございます。

chasen自体は、
$ chasen
EOS
テスト
テスト テスト テスト 名詞-サ変接続

のように動いています。

ただ、 namazuで使う perl moduleの
Text::chasen がうまく入ってくれません。

chasen はchasen-2.4.4を使っています。これが最新のようです。

chasenのコンパイル時のMakefileにCFLAGに-fPIC をつけてもうまくいきません。。

もし何か分かりましたら、よろしくお願いいたします。
277269:2009/08/30(日) 09:54:18
64bitマシンがだめなのでしょうか?
32bitのときは問題なく前は入ったのですが。。
64bitでnamazuはあきらめたほうがいいということなのでしょうか?
278名無しさん@そうだ選挙に行こう:2009/08/30(日) 09:58:36
>>269 「うまくいきません」
.so に関するエラーのとき、ldconfig したかどうかがまず確認箇所だけど、どう?
あと、google すると、以下のようなもんがすぐ引っかかってくるが、チェックした?
http://www.daionet.gr.jp/~knok/chasen/
http://www.namazu.org/pipermail/namazu-users-ja/2008-June/001090.html
279名無しさん@そうだ選挙に行こう:2009/08/30(日) 10:00:12
# 64bitでnamazu

64bit マシンなら、chasen のライブラリは、/usr/lib じゃなくて
/usr/lib64 のほうに行っていて、namazu の Makefile がそれに
適切に対応していない可能性がある。
280名無しさん@お腹いっぱい。:2009/08/31(月) 19:35:35
>>278
>>.so に関するエラーのとき、ldconfig したかどうかがまず確認箇所だけど、どう?
これはしております。

>>あと、google すると、以下のようなもんがすぐ引っかかってくるが、チェックした?
http://www.daionet.gr.jp/~knok/chasen/
はい、patchはあてています。

http://www.namazu.org/pipermail/namazu-users-ja/2008-June/001090.html
これは、まだチェックしきれていませんが、むつかしそうですね。調べてみます。

>>279
>>64bit マシンなら、chasen のライブラリは、/usr/lib じゃなくて
>>/usr/lib64 のほうに行っていて、namazu の Makefile がそれに
>>適切に対応していない可能性がある。
/usr/lib64にはlibchasen系は入っていなかったです。/usr/libに入っています。
281名無しさん@お腹いっぱい。:2009/08/31(月) 23:52:45
> >>適切に対応していない可能性がある。
> /usr/lib64にはlibchasen系は入っていなかったです。/usr/libに入っています。
「64bit版のライブラリは /usr/lib64 に置く必要があるかも?」って話なんだけど。
282名無しさん@お腹いっぱい。:2009/09/03(木) 18:01:17
mknmzで大規模データを一日かけて実施していたところ、

NMZ.lock2 ファイルを発見しました
このインデックスは他のプロセスによって更新されている可能性があります

というエラーがでました。おそらく前回、途中でmknmzをやめ、indexファイル群
を削除せずに再度mknmzを実施したからだと思います。
仕方ないので、このlock2ファイルを削除し、
mknmz -Y
で差分更新をしようと思うのですが、前回エラーで中断したところから、うまく
再開できますか?

よろしくお願いいたします。
283名無しさん@お腹いっぱい。:2009/09/05(土) 08:26:43
280です。別の64bitマシンを借りて、インストールをし直してみたところ、インストールはうまく
いったのですが、別の問題が起きています。。
Text::Chasenの64bitマシンへのインストールでつまずいています。
以下のように、Text::Chasenのインストール自体には成功しているように
見えるのですが、perlからよびだせていないようです。
検索して、LIBS lstdc++ chasenなどを、Makefile.PLに足したりはしているのですが、
それでもうまくいっていません。
$ sudo make install
Files found in blib/arch: installing files in blib/lib into architecture dependent library tree
Writing /usr/lib64/perl5/site_perl/5.8.8/x86_64-linux-thread-multi/auto/Text/ChaSen/.packlist
Appending installation info to /usr/lib64/perl5/5.8.8/x86_64-linux-thread-multi/perllocal.pod

$ perl -MText::ChaSen -e ''
Can't load '/usr/lib64/perl5/site_perl/5.8.8/x86_64-linux-thread-multi/auto/Text/ChaSen/ChaSen.so' for module Text::ChaSen:
libchasen.so.2: 共有オブジェクトファイルを開けません: そのようなファイルやディレクトリはありません
at /usr/lib64/perl5/5.8.8/x86_64-linux-thread-multi/DynaLoader.pm line 230.
at -e line 0
Compilation failed in require.
BEGIN failed--compilation aborted.

lddをすると以下のようになります。libchasen.so.2のある場所がおかしいのでしょうか?
どうすればいいかわからないので、何かアドバイスをいただけないでしょうか?

$ ldd /usr/local/bin/chasen
libchasen.so.2 => /usr/local/lib/libchasen.so.2 (0x00002aaaaaaad000)
libstdc++.so.6 => /usr/lib64/libstdc++.so.6 (0x00000032afc00000)
libm.so.6 => /lib64/libm.so.6 (0x00000032a9c00000)
libgcc_s.so.1 => /lib64/libgcc_s.so.1 (0x00000032af400000)
libc.so.6 => /lib64/libc.so.6 (0x00000032a9800000)
/lib64/ld-linux-x86-64.so.2 (0x00000032a8800000)

よろしくお願いします。
284名無しさん@お腹いっぱい。:2009/09/05(土) 21:53:03
Text::ChaSen をビルドする前に、Makefile.PL のなかのLIBS指定、
'LIBS' => ['-L/usr/local/lib -lchasen' みたくしてる?
285名無しさん@お腹いっぱい。:2009/09/08(火) 20:31:02
namazuでmknmzする際の最大メモリ使用量が32bitマシンでは、4GBでしょうか?
それだと足りなくて、
Out of memory!
NMZ.lock2 ファイルを発見しました
となる場合はどうすればよいでしょうか?
286名無しさん@お腹いっぱい。:2009/09/09(水) 01:21:47
>>285
インデックス分ければいい。
287名無しさん@お腹いっぱい。:2009/09/09(水) 21:25:51
だれかNamazuを近代化補修しろよ。
288名無しさん@お腹いっぱい。:2009/09/29(火) 19:31:08
>>287
近代化されているかは不明だけど、バージョンアップされているね。

Namazu 2.0.20
http://www.namazu.org/index.html.ja#news
289名無しさん@お腹いっぱい。:2010/04/22(木) 20:07:42
6万貰ってセックヌしてきたぞ!!

濡れた熟マンに入れたら、肉ヒダがしっとり絡みついてきて、
そんだけでイきそうになったわww
http://xabrina.net/om/c9y94mf
290名無しさん@お腹いっぱい。:2010/05/31(月) 16:47:39
スレがうまく読み込めない…
291名無しさん@お腹いっぱい。:2011/02/04(金) 21:34:06
mknmz + pdftotext で PDF ファイルをインデックス化してるんだけど、
100MBを超える PDF だと、out of memory のエラーが出る。

mknmzrc の記述はチェック済み ($FILE_SIZE_MAX, $TEXT_SIZE_MAX, $ON_MEMORY_MAX)。
マシンのメモリは 4G 積んでるので、実際のメモリ不足ではないと思う。

ご存知の方、よろしく。m(_ _)m

環境:Namazu for Windows (ver. 20.0.20) on WinXP SP3
Active Perl 5.8.9
292名無しさん@お腹いっぱい。:2011/02/04(金) 23:23:25
>>291
以前、某パッケージのマニュアルで発生した。
pdfsplit.pl でページ単位に分解したら上手くいった。

# つ〜か、そのサイズのpdfって数百ページないか?
# ページに分解して処理しないと面倒だと思う。
293名無しさん@お腹いっぱい。:2011/02/05(土) 10:22:07
>>292
サンクスです。
>> ttp://www.namazu.org/ml/namazu-devel-ja/msg01950.html
を見て、pdfslit.pl を導入してみましたが、out of memory のエラー
がでます。やはり、pdfファイルがでかすぎるのかな…
294名無しさん@お腹いっぱい。:2011/07/09(土) 20:40:20.11
>>293
File::MMagicでメモリを大量に消費しているのが原因っぽい。
-tを使うとうまくいくかも。
295名無しさん@お腹いっぱい。:2011/09/18(日) 16:06:29.49
サーバ中の文書を検索したくて入れてみました。
入れてみて気付いたのですが、EUC-JPにしか対応していないようです。
検索対象の文書は、UTF-8とEUCJPとSJISのファイルが混在しています。
内部的に、エンコードを自動的に検出して変換してインデックス化、
という処理は行われているのでしょうか?
それとも、すべてEUC-JPの文書という前提で動作しているのでしょうか?
296名無しさん@お腹いっぱい。:2011/09/18(日) 16:40:29.46
試しに検索してみたらできました
297電脳プリオン 忍法帖【Lv=40,xxxPT】(2+0:8) 【35.7m】 :2013/06/23(日) 13:34:26.59 BE:182433863-PLT(12080)
ver3は?
298名無しさん@お腹いっぱい。:2014/01/30(木) 20:35:11.93
299名無しさん@お腹いっぱい。
winのお話だけど、PCの引越ししたら下記URLをチェキだ!
http://www.namazu.org/pipermail/namazu-win32-users-ja/2009-September/001206.html
http://namazu.asablo.jp/blog/2009/08/09/4488130

なんでそんな古い話するかって?俺が今日ハマったからだ!