全文検索エンジンNamazu ver2

1 ：名無しさん＠お腹いっぱい。：2005/04/11(月) 01:31:01

全文検索エンジンNamazuについてアレコレ

http://www.namazu.org

2 ：名無しさん＠お腹いっぱい。：2005/04/11(月) 01:49:46

削除依頼よろ

3 ：名無しさん＠お腹いっぱい。：2005/04/11(月) 05:09:19

３ちしげ３ゆ３様が電光石火の３ゲットなの!
　　　　　　　　　　　　　　　　　　　　　　　　　>>1番かわいいのはさゆなの!
　　　　　　　　　　　　　　　　　　　ノノハヽヽ〃ノハヾ /) >>2じ本はハゲすぎなの!
　後>>10は落ち目すぎなの！ ∩*･｡.･)从*･｡.･）/ミ
　　　　　　　　　　　　　　　　　〃ノハヾノノハヽヽノノハヽヽつ　い>>4川は黒すぎなの!
矢>>9ちもフケすぎなの！⊂（｡.･从（･｡.･*∩ノノノハ｡.･）ノハヽ
　　　　　　　　　　　　　((　 (＼ゝノノノハノハ〃ハ v）っ彡*･｡.･）
あ>>8やはフケすぎなの!　⊂｀ヽ从*･｡.･）･｡.･））ノノノハヽつ　))>>5んのは顔ふくれすぎなの!
大の大人が>>7っちとか(ﾌﾟ⊂＼　 ⊂ ）　　＿つ从*･｡.･）
　　　　　　　　　　　　　　　　　　(／（ /∪∪ヽ)ヽ)/　Ｕ　つ　モー>>6すは売れなさすぎなの!
　　　　　　　　　　　　　　　　　　∪￣(／￣＼) ゝし'⌒∪ 　　　　　　　　　　　　　

　　　　　　　　　　　　　　>>11-1000さゆのかわいさの前にひれ伏すの！

4 ：名無しさん＠お腹いっぱい。：2005/04/11(月) 09:47:20

,,r ､,r'"⌒｀ﾞﾞヽ､　　　　+
　　／　　"~ ヽ､　　　　｀ゝ　　　+
.　./　,r彡"　　　､ﾉ彡' ヽﾐ｀＼　　　+
　r､r.r ､　ソ/ノ　　　　　ヽ　｀ゝ　　+　
　_　,|_,|　ﾉ　　 ⌒　　　 ⌒ヾ|ﾐヾ　　+　
　ノﾉﾉﾉﾉ--<-●>-,(-●>ﾐﾐ　　　　+ 素敵な微笑とともに4様上陸!
　ノﾉﾉﾉﾉ　　 "" 　　　) 　" ﾐ　　　+
ノ .彡|　| 　　　　トーー/|　| ﾐ　　
　　 ∧ | ＼　　..ヾ____/ 　..|
　　 |ﾉ＼　＼　　"⌒　ﾉ＼
　　　ヽ《　　..~ ー--／　 /

5 ：名無しさん＠お腹いっぱい。：2005/04/14(木) 15:26:59

【日産】 NOTE　ノート Part9 【普通で素直】
http://hobby7.2ch.net/test/read.cgi/auto/1113087118/

孤独な日産信者、通称「ネット版劇団独り」。
相次ぐノートの酷評記事、酷評レスの結果にもめげず、叩かれ役として大活躍ｗ
気が向いたら燃料でも投下してあげてください。

◆◇◆◇◆◇◆◇◆◇◆◇ネット版劇団独りの特徴◇◆◇◆◇◆◇◆◇◆◇◆
>ノート信者はやたらと若者向けと思わせたがる。
>ノート信者はやたらと女に人気があると思わせたがる。
>ノート信者はやたらと個性という単語を強調したがる。

さらに

捏造した燃費データを報告。
ノートについて論点は存在せず、私怨で追いかけ回すざま。
>>229,232などでわかるように、悔し涙で文字が読めないほど常時興奮。
ID変えまくって仲間がいると思わせたいらしいｗ
執念だけはルパンを追う銭形以上。
やられっぷりはトムとジェリーのトム以上。

本人へのアドバイス
「IDを変えて必死か？」というレスに対する反応が、毎回ビックリするほどワンパターンｗ
ID変えの際に書き込み時間が集中しすぎ。文体が似すぎｗ厨房レベルｗ
◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆

6 ：名無しさん＠お腹いっぱい。：2005/04/22(金) 14:58:10

namazuって、滅びた?

7 ：名無しさん＠お腹いっぱい。：2005/04/22(金) 17:52:35

しばらくは現役でしょ。今でもいろんなとこで使われている。
日本語全文検索エンジンを普及せしめたという歴史的役割は終えつつある
と思うけど。

8 ：名無しさん＠お腹いっぱい。：2005/04/22(金) 18:29:13

いやいや、開発コミュニティがさ。
サイトの復旧が途中で止まってる。

9 ：名無しさん＠お腹いっぱい。：2005/04/22(金) 19:10:49

FreeWnn化進行中？

10 ：名無しさん＠お腹いっぱい。：2005/04/22(金) 21:05:39

>>9
あそこまでひどくはないだろう。せめて引き合いに出すならCannaってところだ。
まあ作る方も使う方もフィルタ増やすことくらいしか頭にないからな。
それとUTF-8化。

11 ：名無しさん＠お腹いっぱい。：2005/04/22(金) 21:36:46

でもなんだか今年中に hyperestraier だの rast だのがリリースされそうだし、
寂れる一方なのかもしれない。

12 ：名無しさん＠お腹いっぱい。：2005/04/22(金) 23:43:22

企業関係のメイン検索システムに入ってるんで
そうそう簡単に捨てられることはないんじゃないの？
やっぱ、オフィス、PDFなんかがまとめて行けるのは大きい。
あと、インストールや設定の資料が豊富だし。

ただ、Namazu Proj.はセキュリティ関連アップデートとか
フィルタまわりのソフトウェアバージョンアップに伴う修正
ぐらいしかやってないから、進化は止まっちゃったよね。
良い意味でも悪い意味でも、枯れてしまった。

13 ：名無しさん＠お腹いっぱい。：2005/05/23(月) 18:00:46

茶筌でUTF8を使おうと思って、茶筌のHPの説明にあるとおりにしたんですが、
エラーがでてます。

それに関係しているようなのですが、英語の単語の認識が、例えばHelloだったら
h e l l o のように解析されてしまうんですが、一単語として認識させるには、
何が問題かわかる方いらっしゃいますか。

14 ：名無しさん＠お腹いっぱい。：2005/05/23(月) 18:02:18

あげときますです。。。

15 ：名無しさん＠お腹いっぱい。：2005/05/24(火) 08:40:00

ChaSenのバージョンはいくつよ。

16 ：名無しさん＠お腹いっぱい。：2005/06/09(木) 04:19:06

前スレくらい貼っとけばいいのに
http://pc5.2ch.net/test/read.cgi/unix/1009715036

17 ：名無しさん＠お腹いっぱい。：2005/06/24(金) 13:14:47

a name ごとにインデックス作成するのでやってるんですが、
特定の a name を対象外に指定することってできますでしょうか？
具体的には、ページトップ戻り用の<a name="top">てのをはずしたいんですが…

18 ：名無しさん＠お腹いっぱい。：2005/06/24(金) 13:32:20

あげてみた

19 ：名無しさん＠お腹いっぱい。：2005/06/24(金) 19:54:25

ヒットした検索結果毎に表示される日付のフォーマットって変更することできますか？
テンプレには無いのでcのソースかなと思ったんですが、該当箇所が見当たらないので。。

それと、
------------------------
参考ヒット数:[***:10]
検索式にマッチする10個の文書が見つかりました。
------------------------
の前後に挟まる謎の,<dl>タグと
------------------------
現在のリスト: 1 - 3
ページ: [1]
------------------------
の前後に挟まる謎のタグの消し方ご存知でしょうか？

＃namazuの仕様にうんざり…

20 ：名無しさん＠お腹いっぱい。：2005/06/24(金) 20:41:58

うんざりしてるなら，つかわなきゃいいじゃん。

21 ：名無しさん＠お腹いっぱい。：2005/06/24(金) 20:43:33

> namazuの仕様にうんざり…

って高飛車なこと書けるならsrcみて直せるんじゃないの？

22 ：名無しさん＠お腹いっぱい。：2005/06/24(金) 20:48:07

namazuにケチつけるとひたすら叩かれる件。

23 ：名無しさん＠お腹いっぱい。：2005/06/24(金) 20:58:08

たたかれてないじゃん？
うんざりしてるんなら使わなければいいじゃん？
いまだったらEstraier みたいな高機能なのもあるしさ。

24 ：名無しさん＠お腹いっぱい。：2005/06/24(金) 21:42:56

他のを使えと言うのならこのｽﾚはなんなんだ？

25 ：名無しさん＠お腹いっぱい。：2005/06/24(金) 22:08:12

>>24
意味不明

26 ：19：2005/06/24(金) 23:52:27

すいません、色々物議をかもしてるようで…
namazuの仕様にうんざりしたのは、色々と
試行錯誤していてもなかなかうまくいかなかったのでつい…。

修正する方法が無いのであれば仕方ないのかもしれませんが、
もしご存知の方がおりましたらご教授いただければ幸いです。

27 ：名無しさん＠お腹いっぱい。：2005/06/25(土) 00:44:51

>>19
> ,<dl>タグと

src以下で grep すりゃ一瞬で見つかる。
output.cの
print_hlist()
print_hitnum()
あたり。

28 ：名無しさん＠お腹いっぱい。：2005/06/25(土) 00:51:35

あと、日付の書式は NMZ.field.date を読んでるだけだから，
そっちを直す。 NMZ.*を手で修正した場合は，rfnmz で
NMZ.field.*を再構築すること。

29 ：19：2005/06/25(土) 12:49:47

>>27,28

ありがとうございます！
もう少し頑張ってみます。

30 ：名無しさん＠お腹いっぱい。：2005/07/13(水) 14:24:03

namazuをWindows2000で動かしています。Apacheを使ってnamazu.cgiもできましたし、
すべてが順調にすすんでいるかのように思いました,,,が、pdfを検索対象にするにあたって
インデックスを作成すると、
検索対象のファイルを調べています...
1個のファイルがインデックス作成の対象として見つかりました
1/1 - /C|/aaa/tsunaba_abst.pdf Unable to convert pdf file (maybe copying protect
ion)
[基本]
日付: Wed Jul 13 14:21:42 2005
わかち書き: module_kakasi -ieuc -oeuc -w
経過時間 (秒): 1
ファイル/秒: 0.00
システム: MSWin32
Perl: 5.00503
Namazu: 2.0.14

となり、インデックス作成できませんでした。
だれか解決法教えてください

31 ：名無しさん＠お腹いっぱい。：2005/07/13(水) 14:42:28

ttp://www.namazu.org/FAQ.html.ja#xpdf

32 ：名無しさん＠お腹いっぱい。：2005/07/13(水) 15:16:15

>>31
それも設定しました！説明などに書いてあるものはすべてしました！mknmz -Cを実行すると、
一応application/pdf: pdf.plが対応になっています。

33 ：名無しさん＠お腹いっぱい。：2005/07/13(水) 16:05:36

>>30
>(maybe copying protection)
元のPDFにprotectionがかかってる？

34 ：名無しさん＠お腹いっぱい。：2005/07/13(水) 21:29:02

>>30
PDFのセキュリティで文字のコピーが許可しないになってる

35 ：名無しさん＠お腹いっぱい。：2005/07/14(木) 08:53:43

そのまんまやんけ

36 ：名無しさん＠お腹いっぱい。：2005/07/14(木) 16:30:39

平和な世の中やなあ。

37 ：名無しさん＠お腹いっぱい。：2005/07/14(木) 20:31:49

>>36
どこが平和だ!!

イラクではアメリカ軍の攻撃で毎日毎日100万人ものイラク人が
虐殺されているのに、よくも平和だとかほざけるもんだな!!

38 ：名無しさん＠お腹いっぱい。：2005/07/14(木) 21:02:58

一日１００万ならたいしたことないな。

39 ：名無しさん＠お腹いっぱい。：2005/07/15(金) 17:02:22

もし日本なら130日で日本人全滅か

40 ：名無しさん＠お腹いっぱい。：2005/07/17(日) 02:27:52

rastはWindows版がないから駄目。

41 ：名無しさん＠お腹いっぱい。：2005/07/17(日) 03:24:06

ないなら作r(y

42 ：名無しさん＠お腹いっぱい。：2005/07/17(日) 17:48:14

作る能力ない。誰かキボンヌ。

>>41
> ないなら作r(y

43 ：名無しさん＠お腹いっぱい。：2005/07/17(日) 18:21:02

>>42
> 作る能力ない。誰かキボンヌ。

じゃあ、わたしが作りますから、みなさんは手を出さなくていいです(ニヤニヤ)

44 ：名無しさん＠お腹いっぱい。：2005/07/17(日) 18:31:53

Namazu邪悪だなwww

45 ：名無しさん＠お腹いっぱい。：2005/07/17(日) 18:37:09

>>43は、どう見ても、名乗りだけあげてあとは放置犯。

46 ：名無しさん＠お腹いっぱい。：2005/07/24(日) 08:53:54

IPAで同じことやるよりはいいだろ。

47 ：名無しさん＠お腹いっぱい。：2005/08/05(金) 11:12:41

namazuのフレーズ検索を利用しているのですが，
"New Order"で検索をかけても100%New Orderというフレーズ
がでるわけでなく，ときどきnewとorderが分離してても
結果としてはじきだしちゃう場合があります．
そういうミスをできるだけ減らしたいのですが，なんかいい
テクニックありますでしょうか？
フレーズ検索とはそういうものでしょうか？

googleだとNew-Orderとして検索するとほぼ100%でフレーズとなって
結果がでてくるのですが．．

48 ：名無しさん＠お腹いっぱい。：2005/08/05(金) 11:31:00

というか，いまいろいろ調べてたら，
"New Order"で検索をかけてもand検索にしかなっていない事が
判明しました．
フレーズ検索ってどうやってやるの？

環境はFedora4でnamazu of Namazu 2.0.14
です．
よろしくお願いします．

49 ：名無しさん＠お腹いっぱい。：2005/08/05(金) 12:04:14

できました

50 ：名無しさん＠お腹いっぱい。：2005/08/05(金) 12:07:32

>>49
どうやって?

51 ：名無しさん＠お腹いっぱい。：2005/08/05(金) 12:18:05

"{New Order}"
でよかったです．

52 ：名無しさん＠お腹いっぱい。：2005/08/05(金) 22:41:49

>>51
っていうか「検索式について」嫁や。

53 ：名無しさん＠お腹いっぱい。：2005/08/09(火) 21:24:22

JAVAでretrievalWordという変数にModern Artsというような文字列をいれて，
下記のような検索プログラムにより，検索エンジンnamazuの
入力として渡しています．
この場合，namazuには，
namazu --max=2000000 "{Modern Arts}" /home/jikken/index_0
という入力が渡される事になります．
なおnamazuは，"{Modern Arts}"という検索がいった場合，
"{}"で囲まれた文字列がフレーズとして検索されるという機能をもっています．
つまりターミナルから
namazu --max=2000000 "{Modern Arts}" /home/jikken/index_0
と入力するとModern Artsの検索としてうまく行くのですが，
java経由で下記のプログラムからnamazuへ検索要求をしても
namazuでは，
"{Modern Arts}"という文字列の検索を行ってしまい，
Modern Artsの検索がうまくいきません．

String proscmd = "namazu --max=2000000 ";
proscmd = proscmd + "＼"{" + retrievalWord + "}＼" " + indexdir;
System.out.println("proscmds : " + proscmd);
Process process = Runtime.getRuntime().exec(proscmd);

結果
namazu --max=2000000 "{Modern Arts}" /home/jikken/index_0

この原因がどういう点にあるのかを教えて頂けないでしょうか？
もう長いことこれに時間をかけています。でもわかりません。
宜しくお願い致します．

54 ：名無しさん＠お腹いっぱい。：2005/08/10(水) 08:26:03

>>53
結果だけ見ると、
proscmd = proscmd + retrievalWord + indexdir;
でいいような希ガス。

55 ：名無しさん＠お腹いっぱい。：2005/09/02(金) 12:23:34

メール本文のインデックスを作ってくれるのはありがたいんですけど、
メールに添付されている PDF や、Excel, Word ファイルについても
インデックスを作ることはできませんか？

56 ：名無しさん＠お腹いっぱい。：2005/09/02(金) 22:16:22

>>55
使ってるメーラーによる。

57 ：名無しさん＠お腹いっぱい。：2005/09/04(日) 13:40:04

e-mail の milti-part がそのまま保存される、mh形式です。

58 ：名無しさん＠お腹いっぱい。：2005/09/04(日) 21:25:54

>>57
multi-part部も
2.0.15ではインデックスに含めるようにできると思われる
ttp://www.namazu.org/pipermail/namazu-devel-ja/2005-July/000487.html
2.0.15pre1が出ているから試してみては？

59 ：名無しさん＠お腹いっぱい。：2005/09/23(金) 18:47:42

ナマズのブログ
http://namazu.asablo.jp/blog/

60 ：名無しさん＠お腹いっぱい。：2005/09/23(金) 21:19:39

>>59
密かに kakasidict の寺西版があるね。
http://www.asahi-net.or.jp/~yw3t-trns/namazu/kakasi/

61 ：名無しさん＠お腹いっぱい。：2005/09/23(金) 21:21:07

s/kakasidict/kanwadict/g

62 ：名無しさん＠お腹いっぱい。：2005/09/23(金) 22:44:14

gj

でも何が増えたのかわからないし、独自加工もしにくいので
mkkanwaする前のソースデータもうpきぼんぬ。GPLだし。

63 ：名無しさん＠お腹いっぱい。：2005/11/01(火) 17:00:27

かなり困った。。。

PHPモジュールでmaxhit超えたやつに　Too match hitとか出したいんだが
resultが全部0で帰ってくる・・・

どうしたらいいものだろうか

64 ：63：2005/11/01(火) 17:11:13

Too many documents hitだな・・・お恥ずかしい

65 ：名無しさん＠お腹いっぱい。：2005/11/04(金) 00:17:55

会社でUNIX畑の人に「とりあえずなまずって検索してみて」といわれたので
OHPとかこのスレとか見てみました。
日本語全文検索ってほぼGoogleでカバーできてるのでは？
Winではあまり普及していないらしいし、導入に面倒がありそうだし
これからのNamazuの役割って一体なんです？

66 ：名無しさん＠お腹いっぱい。：2005/11/04(金) 11:40:39

>>65
McDonald's があれば、モスバーガー、ロッテリアは必要ない、とかそーゆーこと？

67 ：名無しさん＠お腹いっぱい。：2005/11/04(金) 11:47:25

フレッシュネスうまうまだよもん。
駅前広場はラブホのかわりにはならないんだよもん。

68 ：名無しさん＠お腹いっぱい。：2005/11/04(金) 11:54:23

>>65

UNIX畑の人に聞いてみたら？
ってか色々なサイト見てきたんだったら役割は自ずと見えてくるだろうと思うけど

まぁちょっと設計が古かったりするところはあるとはおもうけど
自分に必要な機能が満たされていればNamazuでも十分だとか
そういうことを判別できれば役割はかなりあると思うよ

まぁ役割は自分が必要と思えばあるし、無ければ無いんだよ

69 ：名無しさん＠お腹いっぱい。：2005/11/04(金) 11:58:41

>>66
> McDonald's があれば、モスバーガー、ロッテリアは必要ない、とかそーゆーこと？
McDonald'sがあれば、家庭に台所は必要ない、って言ってるんだろ。

70 ：名無しさん＠お腹いっぱい。：2005/11/04(金) 22:18:50

というか最初は釣りかと思ったが、>>65がリアル素人な気がしてきた。

71 ：名無しさん＠お腹いっぱい。：2005/11/04(金) 23:35:30

>>65です。たくさんレスありがとうございます。
実際自分はWinしか触ったことのないリアル素人で、OHPや主だった関連サイトを
いくつか見てみましたがいまいちピンときませんでしたが
>>69氏の譬えが的を射ているのかな。

つまりGoogleとかはロボットに「検索してもらう」という受動的な検索だけど
なまずは自分で全文を検索に引っ掛けるように設定するという能動的検索
という理解でよろしかろうか。
なんか新しく入った会社で雑務のひとつとして、なまず検索の更新も担当する
ということらしいです。
まだ具体的には本物の鯰なのかcgiの鯰なのかよくわかりませんが、
これからも何かとお世話になるかも知れません。
どうぞよろしくおながいします。

72 ：名無しさん＠お腹いっぱい。：2005/11/05(土) 00:07:50

ぇ、>>54 で言ってる Google って GoogleDeskTop のことじゃなかったのか。

73 ：名無しさん＠お腹いっぱい。：2005/11/05(土) 00:09:33

> なまず検索の更新も担当

これも謎だよなー
ふつうは更新されたファイルを探し出て、インデックスも更新する
スクリプトを自動的に動かすもんだし。

74 ：名無しさん＠お腹いっぱい。：2005/11/05(土) 00:21:14

>>71
> なんか新しく入った会社で雑務のひとつとして、なまず検索の更新も担当する
> ということらしいです。

UNIX畑の人がいるのに素人にこんな雑務をやらせるこの会社って一体…

75 ：名無しさん＠お腹いっぱい。：2005/11/05(土) 01:42:57

OHPってなんだ？

76 ：名無しさん＠お腹いっぱい。：2005/11/05(土) 01:56:18

Obsoleted Home Page だよもん

webブラウザを立ち上げたときやホームボタンで表示されるページだよもんが、
メンテされないのでリンク切れ多発でよく使うのにリンクしてないサイト
多数出現だよもん

77 ：名無しさん＠お腹いっぱい。：2005/11/05(土) 04:24:46

>>75
> OHPってなんだ？

エロゲー方面の隠語

78 ：名無しさん＠お腹いっぱい。：2005/11/05(土) 10:50:34

>>74
UNIX畑の人が抜けるんで、自分が引継ぎということらしいです。
なにしろ社員3人で他SOHOスタッフしかいないんで勘弁してやってください。

>>77
ｴﾛｹﾞ用語だったのですか。ふつーに公式サイトの意味で使われているものとばかり（ｗ

>>73
なるほどー。それがふつうなのですね。
昨日全体の業務引き継ぎ内容を大雑把に説明されただけなので
まだ具体的なことはよくわからないのですが、鯰のこともうちょっと
調べてみるです。

79 ：名無しさん＠お腹いっぱい。：2005/11/06(日) 11:04:23

>>75
ドラクエだと棺おけがついてきている状態

80 ：68：2005/11/07(月) 14:10:30

がーん

ttp://www.ki.nu/OHP/
このことかと思ってた俺って。。。。

81 ：名無しさん＠お腹いっぱい。：2005/11/09(水) 00:36:29

Namazu 2.0.14 for Win32 (Beta) を導入したのですが、
C:\namazu\share\namazu\filter\win32 の中に oleword.pl が見当たりません。
Office 2000ではダメで, 2003が導入されている必要があるのでしょうか?

wvWareのWindows版を導入しようとしたのですが、コマンドがシェルスクリプトに
なっているようです。cygwinがいるのでしょうか?

82 ：名無しさん＠お腹いっぱい。：2005/11/09(水) 02:01:38

>>81
俺は cygwin + Namazu-2.0.14.tar.gz を
ソースコンパイルなので環境がだいぶ違うが、
Namazu 本家の namazu-2.0.14.tar.gz を解凍したら
namazu-2.0.14/filter/win32/ 以下に
olemsword.pl があるよ。

後半の方は俺には質問の意味が分からんのでパス。

83 ：名無しさん＠お腹いっぱい。：2005/11/09(水) 06:53:26

なるほど! ソースなら入っていそうですね。試してみます。

84 ：名無しさん＠お腹いっぱい。：2005/11/23(水) 03:46:07

olemsword.pl と olemsexcle.pl なら入ってるよ。
c:\Namazu\share\namazu\filter\win32 以下

85 ：名無しさん＠お腹いっぱい。：2005/11/23(水) 03:46:55

ミス
s/olemsexcle.pl/oleexcel.pl/

86 ：名無しさん＠お腹いっぱい。：2005/11/24(木) 11:56:33

Namazuで検索キーワードの該当部分を
検索結果に反映する方法はありますか？

たとえば、デフォだと該当キーワードがHTMLの末のほうにあっても、
検索結果のプレビューではHTMLの上のほうから表示されてキーワードが
出てきませんよね？
それを、キーワードの該当部分の前後文を表示するようにある方法が
あるらしいといわれたので探しているのですが、わかりません。

もしかして指示者が別の検索エンジンと混同してるかも知れないので、
Namazuにそういう機能があるのかどうか　だけでも教えていただければ
幸いです。

87 ：名無しさん＠お腹いっぱい。：2005/11/24(木) 13:31:31

estraier にはそういう機能があった。

88 ：名無しさん＠お腹いっぱい。：2005/11/24(木) 13:49:59

>>87
大ヒントありがとうございます！！
超感謝であります！

89 ：名無しさん＠お腹いっぱい。：2005/11/24(木) 15:01:07

>>86
Namazuはインデックスに単語の出現位置を記録していない。

90 ：名無しさん＠お腹いっぱい。：2005/11/25(金) 10:05:19

>>89
指示者もうろ覚えだったようなので、Esterierと混同していたのですね。
そのように報告しました。
どうもありがとうございます(´∀｀)

91 ：名無しさん＠お腹いっぱい。：2005/12/05(月) 20:35:20

Webサイト内の商品検索に使用したいと思うのですが
namazuの検索結果に画像を表示させることは可能ですか？

92 ：名無しさん＠お腹いっぱい。：2005/12/06(火) 00:45:33

>>91
どこかのサイトで検索結果のサムネイル画像をやろうとしてた希ガス。
template の NMZ.result.normal.?? を変更すれば出来るっけか。

93 ：名無しさん＠お腹いっぱい。：2005/12/06(火) 11:41:20

>>91
検索結果に見合った画像を出すのはテンプレ変更だけじゃ無理かも。
「可能か」の問いには、オープンソースだからね。出来るさ。

94 ：91：2005/12/06(火) 13:55:33

ありがとうございます。私のスキルでは簡単には出来そうもないですね。

調べてみたところkabayakiなら出来そうな感じですね。
Vineなんですが導入できるんだろうか。

95 ：名無しさん＠お腹いっぱい。：2005/12/07(水) 08:01:40

>>91 >>94
ML 探したらみつかった。
http://www.stellar.ac/~komai/software/namazu/research/namazu_play/

96 ：91：2005/12/07(水) 12:32:17

>>95
ありがとうございます！
他のどの方法でやるのか悩んでいたので助かりました。

97 ：名無しさん＠お腹いっぱい。：2005/12/07(水) 22:12:00

ビバ・オープンソース！

98 ：名無しさん＠お腹いっぱい。：2005/12/08(木) 02:18:24

i Adios Amigos !

99 ：名無しさん＠お腹いっぱい。：2005/12/09(金) 12:44:41

Namazuで動的ページに対してインデックスを作ることはできますか？

DBから取得した情報をHTMLで出力するPHPプログラムがあるとして、
そのHTMLを検索対象にしたい場合が結構でてくると思うんですが、
やっぱりHTMLファイルを生成するしかないんですかね？

wget 等で一度プログラムをたたいてその結果をインデックスすれば
いけないこともないと思うんですが…。
そのようなNamazuモジュールや設定があればご教示いただけると助かります。

100 ：名無しさん＠お腹いっぱい。：2005/12/09(金) 15:47:21

>>99
Namazuじゃないけど、mod_estraierどうよ。

101 ：99：2005/12/09(金) 18:22:14

>>100

そんなモジュールがあったんですね。
参考になります。

ただやっぱりNamazu系のフリーの全文検索ツールじゃないときついですね…

102 ：名無しさん＠お腹いっぱい。：2005/12/09(金) 20:19:13

つか、mod_estraierもHyper Estraierもフリーだよ。

103 ：名無しさん＠お腹いっぱい。：2005/12/10(土) 00:16:49

やっぱりHyper Estraierに誘導するケースが増えてきてるねえ。
まあしょうがないかな。

104 ：101：2005/12/12(月) 15:46:05

>>102,103

言葉足らずですんません。

mod_estraier はキャッシュとして動く感じだと思うので
ちょっと想定の動作とは異なる感じがしました。

Namazuを使うのはほぼ決定なんですが、
動的ページの検索がHyper Estraierでしかできないのであれば
その方向でも考えた方がよさそうですね。

105 ：名無しさん＠お腹いっぱい。：2005/12/12(月) 23:02:18

>>104
キャッシュをインデックス対象にするのであれば
apacheでproxyを立てて
mknmzで --replace=apachecache::replacecode
としてできるかも

106 ：名人：2005/12/18(日) 16:22:25

インディックスの作成の名人ですがどなたか勝負しましょう｡
どこかサイトをいってください｡
そしてインディックスの小ささと､単語のヒット率で勝負です｡

107 ：名人：2005/12/18(日) 16:23:32

工夫の余地の大きい日本語のサイトにしましょう｡

108 ：名人：2005/12/19(月) 09:05:34

前処理をよく行っておくことが重要です

109 ：名無しさん＠お腹いっぱい。：2005/12/19(月) 09:09:49

名人殿。なにゆえ「。」が半角なのでつか。

110 ：名無しさん＠お腹いっぱい。：2005/12/19(月) 16:27:59

>>109
全角にしました。

誰も挑戦者はいないようなのでインディックスにしたいサイトが
あったら名人が作ってあげます。
小さすぎても大きすぎても駄目。ファイル数が五千から五万くらいのならいいよ。

111 ：　：2006/01/04(水) 18:31:15

2.0.15RC1 テストに参加しる!!

112 ：名無しさん＠お腹いっぱい。：2006/01/11(水) 18:10:18

ウェブ上のバグ報告システムなら気軽に書けるし
仮にメール欄があっても捨てアドなりなんなりで良いけど
メールで ML にバグ報告は色々と敷居が高いよぅ

…と保守がてら言ってみるテスト。

113 ：名無しさん＠お腹いっぱい。：2006/01/11(水) 19:56:47

ファイルの添付も簡単だし、ハードコピーも貼れるし。
（namazu.cgiとかWindows上のエラーダイアログくらいしか出番はないかもしれんが)

Wikiがあるならドキュメントの保守も簡単だし、TracのWiki自体も差分や変更履歴が残るしね。

と言ってみる。

114 ：名無しさん＠お腹いっぱい。：2006/01/11(水) 22:11:11

(´-`).｡oO(メールじゃないと報告者減るってのは正直感覚ずれてる気がする)

115 ：名無しさん＠お腹いっぱい。：2006/01/16(月) 10:23:25

現在phpから動的にページを生成して出力しているのですが、
このPHPから出来上がるページをnamazuで検索したいと思っています。
どのような手法がありますでしょうか？

116 ：名無しさん＠お腹いっぱい。：2006/01/16(月) 20:04:50

>>115
一番いいのは、その PHP のページががキャッシュを書き出す方法だけど
Proxy 経由でキャッシュを取るか、無限ループに気をつけて wget するかじゃないかな。

117 ：名無しさん＠お腹いっぱい。：2006/01/22(日) 14:28:27

ファイル数が多く時間がかかるので
インデックスの作成を何日かに分けてやりたいんですが
どうすればいいでしょうか？
途中から再開する方法を知りたいです

118 ：名無しさん＠お腹いっぱい。：2006/01/23(月) 03:53:30

>>117
ファイル一覧を作ってから5000個ずつ処理するのがよいぞ

119 ：名無しさん＠お腹いっぱい。：2006/01/23(月) 03:56:11

大量のファイルを処理するにはindexサイズが大きくなりすぎないように
することが大切だぞ。
処理中になんどか更新するがとても時間が掛かってしまう
あとでマージせよ

120 ：名無しさん＠お腹いっぱい。：2006/01/23(月) 10:27:28

>>118,119
ありがとうございます。インデックスをいくつかに分けて
作成する事にしました。インデックスのサイズが小さいと
時間の掛かり方も全然違いますね。
全部まとめてやるよりも早く終わりそうです。

121 ：名無しさん＠お腹いっぱい。：2006/01/24(火) 13:27:51

動的ページ（DBから情報を取得するもの）を検索対象にするために、
wget + Namazu で実際に運用されている方はおられますか？

DBから取得した情報も全て静的ページに吐き出してからそれをインデックスするのか、
wgetで全部ダウンロードしてそれをインデックスするのかで悩んでいます。

後者の方が圧倒的にメンテナンスも構築も容易なのですが
実運用で使うに耐えられるものなのかが不安でして…。

宜しくお願いします。

122 ：名無しさん＠お腹いっぱい。：2006/01/24(火) 13:30:44

>>121
> 後者の方が圧倒的にメンテナンスも構築も容易なのですが
> 実運用で使うに耐えられるものなのかが不安でして…。

と悩みはじめてすでに5年～♪

123 ：121：2006/01/24(火) 14:10:24

>>122

悩むんですよね…。
Namazuのためだけに静的ページ生成を行うというのはどうも。

Namazuだと、ドキュメントルート以下にあるファイルでも
Webに公開されていない（リンクされていない）ものも引っかかってしまうので、
そう考えると wget の方が理にかなってるんですよね。

＃メルマガなんかで直接URLを通知されるページは元も子も無いですが。。

124 ：名無しさん＠お腹いっぱい。：2006/01/26(木) 05:06:02

>>120
最初は一度にまとめてやった方が速いと思うのだろうけど。
例えば5メガずつindexを書き出す場合、今のindexサイズが200メガだったら
後50メガ追加するのに約1ギガの書き込み、消去を行うことになる。
これはとても大変だ。

125 ：名無しさん＠お腹いっぱい。：2006/01/26(木) 05:08:29

ただディスクアクセスだけではない。
indexサイズがでかければメモリ、cpuの処理も時間が掛かる。

126 ：名無しさん＠お腹いっぱい。：2006/01/30(月) 18:47:40

ｷﾀ━━━(ﾟ∀ﾟ)━━━!!!!

127 ：名無しさん＠お腹いっぱい。：2006/01/30(月) 21:45:06

2006-01-29: Namazu 2.0.15 を公開

ISO-8859-* に関する文書の間違いを訂正
RedHat ソフトウェア namazu.spec の不必要なパッチは削除
File::MMagic 1.25 を同梱
MeCab の正式対応
mknmz に -b 及び --use-mecab オプションを追加
mknmz および namazu に --norc オプションを追加
mknmz に --decode-base64 オプションを追加
新しいフィルタ(Gnumeric, Koffice, Mainman/Pipermail, Zip, Visio)を追加
mknmzrc に MECAB, DENY_DDN を追加
ファイル名がDDN である時にスキップ。
日付フィールドによるソート機能の追加
nmzcat, nmzegrep コマンドの追加
フィルタの Windows 対応
(msword.pl, excel.pl, powerpoint.pl, postscript.pl, 等...)
OLE コントロールフィルタ更新
QUERY_STRING の区切りに';' 使用可能
Perl版テストプログラム(pltests) を追加
各種バグフィックス

128 ：名無しさん＠お腹いっぱい。：2006/01/31(火) 01:30:36

cygwin 1.15.19-4でインスコ成功。

129 ：名無しさん＠お腹いっぱい。：2006/01/31(火) 05:28:51

【IT】オープンソース全文検索システム「Namazu」、1年9カ月ぶりの新版 [1/30]
http://news18.2ch.net/test/read.cgi/bizplus/1138613562/

130 ：名無しさん＠お腹いっぱい。：2006/02/05(日) 11:23:19

そろそろ入れ換えるかなぁ
それとも別のに浮気するか...

131 ：名無しさん＠お腹いっぱい。：2006/02/11(土) 21:10:15

Debian Sarge で namazu 2.0.14 を使っているのですが、教えてください。

mknmz を -U オプションを付けて、Samba 内のインデックスを作成しているの
ですが、職場のパソコンのIEのバージョンにより、動作が異なります。

IE 6.0 では、検索結果の表示、クリックした時にファイルが開けるのですが、
IE 5.5 では、検索結果の表示は正常なものの、クリックしたときにパス名が
文字化けして、うまくファイルを開くことができません。

そこで、両バージョンのIEでファイルが正常に開けるように、検索結果を
.namazurc の Replace コマンドで全体を " " で囲む等ということが可能
でしょうか？それとも、もっとよい方法が存在するのでしょうか？

よろしくお願いします。m(._.)m

132 ：131：2006/02/12(日) 19:57:31

>>131 です。自己レス申し訳ないです。

再度、確認したら、自分の設定がおかしかったか、キャッシュが禍したのか原
因は不明でしたが、いずれのバージョンのIEでもまともに表示し、ファイルを
開くことができました。
確認したこと、.mknamazurc で lang=ja.SJIS、 mknmz -U オプション。

すれ汚し、申し訳ありませんでした。m(._.)m

133 ：名無しさん＠お腹いっぱい。：2006/03/01(水) 03:10:58

な～
「Namazu を使った検索ファイルシステム」
http://www.ipl.t.u-tokyo.ac.jp/~kaz/ptt/arc/313/313.html

って公開されてないのかの～

134 ：名無しさん＠お腹いっぱい。：2006/03/01(水) 16:00:46

>>133
作者に聞いてみたら？

Windows は Google、MS、Yahoo! 製があるけど
UNIX にはないよね？

135 ：名無しさん＠お腹いっぱい。：2006/03/01(水) 16:39:35

>>134
たぶん、なにか勘違いしてると思う。

136 ：名無しさん＠お腹いっぱい。：2006/03/01(水) 16:41:00

>>133
研究者連中、面白いものを作っても、
作って論文にしただけで満足して死蔵するケース多すぎ。

公開しようとするといろいろ面倒なのはわかるが、
なんとかならんものかのう。

137 ：名無しさん＠お腹いっぱい。：2006/03/01(水) 16:50:38

>>136
> 公開しようとするといろいろ面倒
を136がなんとかしてくれると。

138 ：名無しさん＠お腹いっぱい。：2006/03/01(水) 18:33:17

>133
http://www.spa.is.uec.ac.jp/~takita/CBNS/ を見てくれ。

…と言いたいところだが、電通大情報システム学専攻のネットワークが切れていて今は見れんようです。
復旧したら見てください。

一応、激しく汚いソース(NetBSD 1.6.2 からの差分)も置いてあります。

139 ：名無しさん＠お腹いっぱい。：2006/03/13(月) 15:38:49

はじめてNmazuに挑戦しまた
nknmzrc実行後
http://～/namazu.cgiにアクセスするとブラウザが真っ白
・・・
どこで間違っているのでしょう。
ヒントください
OS　FreeBSD　portsから導入
ブラウザ　winXP　IE

140 ：名無しさん＠お腹いっぱい。：2006/03/13(月) 16:40:55

> ヒントください
こっちのセリフだ

141 ：名無しさん＠お腹いっぱい。：2006/03/14(火) 00:18:47

2006-03-12: Namazu 2.0.16 を公開

* セキュリティフィックスリリース
Directory traversal 問題を修正
* 空白を含むファイル名の文書に対応
* NTFS のアクセス権で読み込み許可がないものは処理をスキップするように変更

142 ：名無しさん＠お腹いっぱい。：2006/03/15(水) 06:23:14

>>139
インデックスが読み込めていないときにそうなった
まずnamazuで結果が出てくるか確認しろ
次にnamazurcの中身を確認しろ

143 ：名無しさん＠お腹いっぱい。：2006/03/15(水) 18:26:19

>>142
nknmzrc実行後、沢山ファイルが作成された
取り合えず、動作しなくてもいいから表示してほしい・・・

作成されたファイルの中身を見ようとしたら何も表示されない
もしかしてファイル名だけ作成された？

144 ：名無しさん＠お腹いっぱい。：2006/03/15(水) 18:45:35

まず"namazu (適当なキーワード)" で検索結果がでる？
出なければ~/.namazurcか/etc/namazurcでのインデックスのパスが違う

145 ：名無しさん＠お腹いっぱい。：2006/03/15(水) 20:23:56

ports@FreeBSDのnamazu2が更新そぞろなも。

146 ：名無しさん＠お腹いっぱい。：2006/04/05(水) 12:56:41

Emacsでnamazu.elを使用しているのですが、
出力結果をutf-8にしたいのですが、どの辺をいじれば可能でしょうか

147 ：名無しさん＠お腹いっぱい。：2006/04/05(水) 23:26:44

奈辺

148 ：名無しさん＠お腹いっぱい。：2006/04/25(火) 09:19:38

なまずでサイズの小さく、検索の早く、漏れのないインデックスの作り方。

なまずにすべての作業を任せずに文字コード変換、Kakasiをあらかじめ
自分でやっておく。フィルタも使わない。
自分で確実にテキストに変換できたことを確認してからなまずに渡す。

インデックスに登録しないような一語の単語や記号などをあらかじめ削除する。

これでOk>

149 ：名無しさん＠お腹いっぱい。：2006/04/27(木) 01:07:07

>>148
専用のスクリプトを用意して cron とかで作成させると
効果的なんだろうか？

150 ：名無しさん＠お腹いっぱい。：2006/04/27(木) 02:24:29

>>149
nkfの最新版(それ以前もたぶん)はUTF-8の文字コードを誤認する。
これをすべてNAMAZUに任せると当然、検索できないindexが作成される。
丹誠込めて念入りにindexを作ることが重要だ。ちゃんと変換できてるとか目で見て。

151 ：名無しさん＠お腹いっぱい。：2006/04/27(木) 05:32:59

>>150
ああ、文字コードはそうかもね。
で、どうやって >>148 みたいなフィルタの結果をなまずに渡すの？

$ フィルタスクリプト | mknmz とか？

152 ：名無しさん＠お腹いっぱい。：2006/04/27(木) 05:50:57

ふつうにテキストで固定してindexを作成する。オプションの設定。
なまずは自動判別するからpdfでもhtmlでも中身がテキストなら
そうなるけどテキストに固定した方が早い。

153 ：名無しさん＠お腹いっぱい。：2006/04/27(木) 06:07:34

>>151
たとえば10000ファイルあったとしたら
構造、拡張子を保ったまますべてのファイルをEUCコードに変換する。
そしてまたすべてのファイルを分かち書きする(-wオプション)。

154 ：名無しさん＠お腹いっぱい。：2006/04/28(金) 16:43:24

UTF-8を誤認することは間違いないのだがどれがUTF-8かを見つけるのが苦労する。

155 ：名無しさん＠お腹いっぱい。：2006/05/03(水) 19:52:08

データだけ他サーバーに置くことは出来ますか？
あと複数のindexを検索するにはどうしたらいいですか。

156 ：名無しさん＠お腹いっぱい。：2006/05/06(土) 17:54:36

データだけ他サーバー =>できる。
複数のindexを検索する =>マニュアル夜目。

157 ：名無しさん＠お腹いっぱい。：2006/05/06(土) 19:04:08

マニュアル夜目 =>断る。

158 ：名無しさん＠お腹いっぱい。：2006/05/06(土) 23:36:46

>>156
でも動作鈍いんですよね？
無料のとくつーにデータ全部おくことにします。
fc2にデータおいて広告なし無料cgi可のページから検索したかったんですけど。

159 ：名無しさん＠お腹いっぱい。：2006/05/07(日) 18:51:41

nfsdとか動いてないとダメなんじゃないのか？

160 ：名無しさん＠お腹いっぱい。：2006/05/08(月) 08:11:15

いや、『データ』だけ他のサーバにおくのはかんたんでしょ。読み出せないけど。

161 ：名無しさん＠お腹いっぱい。：2006/06/01(木) 17:13:27

少し困っていることがあるので，教えてください．

Namazuのログで，検索ワードにヒットした文書ごとの
検索ワードの出現回数TFを出力できたりしますでしょうか？
ご教示お願いします．

また，タイトル<title>にその検索ワードが使われていたかどうか
などもログ出力できると助かるので，そういうことができるか
もお教えください．

162 ：名無しさん＠お腹いっぱい。：2006/06/01(木) 21:00:39

あげ

163 ：名無しさん＠お腹いっぱい。：2006/06/05(月) 11:05:16

age

164 ：名無しさん＠お腹いっぱい。：2006/06/07(水) 23:08:46

ユカコ☆スレに遊びにこいよ！

http://travel2.2ch.net/test/read.cgi/kyoto/1148668530/l50

165 ：名無しさん＠お腹いっぱい。：2006/07/25(火) 23:24:19

検索キーワードのログを見たいのですが、設定ファイルを
Logging on にするとどこにログが保存されているのでしょうか？
また、ログの保存場所を指定するにはどのようにしたらよいでしょうか？

166 ：名無しさん＠お腹いっぱい。：2006/07/26(水) 08:23:04

NMZ.slogに保存されます。場所はたぶん変えられないかな。

167 ：名無しさん＠お腹いっぱい。：2006/07/26(水) 15:46:23

Estraier、NAMAZU、msearch　でデフォルトの設定で、
インデックスの作成時の負荷がかかる順に並べるとどうなりますか？

168 ：名無しさん＠お腹いっぱい。：2006/07/26(水) 16:30:55

msearch は知らないけど、
HyperEstraier は Namazu より軽いと思う。

169 ：名無しさん＠お腹いっぱい。：2006/07/26(水) 20:30:41

namazuって重いんですね

170 ：名無しさん＠お腹いっぱい。：2006/07/27(木) 09:35:53

重い要因は
* Perlで書かれている
* File::Findによるディレクトリ走査
* File::MMagicによるコンテンツの種別確認
* DB書き込み速度がPerlのhashに依存
このへんかなあ。

171 ：名無しさん＠お腹いっぱい。：2006/07/27(木) 11:08:12

msearchもperlだよ。
NAMAZUよりmsearchのが軽いのかな？

HyperEstraier はよく知らんけど何で書かれてるの？

172 ：名無しさん＠お腹いっぱい。：2006/07/27(木) 12:20:30

msearchって、仕組みを知って爆笑してしまったぜ。

173 ：名無しさん＠お腹いっぱい。：2006/07/27(木) 13:11:58

中でハムスターが走ってるんだよな

174 ：名無しさん＠お腹いっぱい。：2006/07/27(木) 15:41:28

>>172
何で爆笑？

175 ：名無しさん＠お腹いっぱい。：2006/07/28(金) 17:32:38

namazuって、検索結果を重要度が高い順に並べたりしてくれる
ような機能ってあるっけ？

176 ：名無しさん＠お腹いっぱい。：2006/07/29(土) 16:43:59

>>175
重要度は分からんが、ポイント機能ならあるぞ

177 ：名無しさん＠お腹いっぱい。：2006/07/31(月) 12:58:34

最近では、EstraierとNAMAZUどっちが人気？

178 ：名無しさん＠お腹いっぱい。：2006/08/22(火) 13:39:59

Ｎａｍａｚｕのようにインデクシングの際に形態素解析を用いている
検索エンジンと、その他、形態素解析を用いない検索エンジンとは
インデックス作成の時間以外でどのような違いがあるのでしょうか？

179 ：名無しさん＠お腹いっぱい。：2006/08/23(水) 07:37:56

>>177 Google Trendsでも使ってしらべれ。
>>179 検索時の精度。すくなくとも再現率(recall)はn-gramのほうが高い。

180 ：名無しさん＠お腹いっぱい。：：2006/08/27(日) 13:38:59

namazuでＰＤＦファイルを検索し、概要だけであればhtmlで、
全文を見るのであれば、PDFで見るというふうにしたいのですが、
どうすればよいでしょうか？概要のhtmlは作ってあるのですが、ど
うすれば検索時にhtmlとPDFを選択できるのかなぁと思いまして。
よろしければ、お知恵をお貸しください。

181 ：名無しさん＠お腹いっぱい。：2006/08/27(日) 14:00:27

NMZ.result.* に概要のHTMLのURIを追加すればOK。
概要のHTMLのURIを${uri].htmlにして、その場所に概要のHTMLを格納するのが
楽そうだ。

182 ：名無しさん＠お腹いっぱい。：：2006/08/27(日) 14:13:20

>181
参考にさせていただきます。ご回答ありがとうございました。

183 ：名無しさん＠お腹いっぱい。：2006/09/21(木) 16:53:43

NMZ.* ファイルの仕様
http://www.namazu.org/doc/nmz.html.ja

上記を読んでもよく分からなかったのですが、
結局検索エンジン (namazu.exe)はどういう手順で
検索クエリから目的の文書を探し出すの？
NMZ.i には単語情報はないんだよね？

１．まずNMZ.iiで検索文字列から算出したハッシュ値をキーにして
　　NMZ.iのレコード番号を引く
２．NMZ.i の該当レコード番号から文書IDを引っ張ってくる

文書IDと対象ファイルの対応表はどこにあるのかなぁ？（・～・）ｳｰﾑ

184 ：名無しさん＠お腹いっぱい。：2006/09/21(木) 18:34:21

お～、それ、わたしも首をひねったよ。

185 ：名無しさん＠お腹いっぱい。：2006/09/21(木) 23:25:02

バージョン1.xのときはNMZ.f とNMZ.fi というファイルがあって
各ファイルの情報を記録していた。

2.xからは
NMZ.field.{subject,from,date,message-id,...}
NMZ.field.{subject,from,date,message-id,...}.i
の2つのファイルがその代わりをしている。
行番号=文書IDとなっている。

186 ：名無しさん＠お腹いっぱい。：2006/09/22(金) 08:26:08

NMZ.wが単語表で、NMZ.wiがそのインデックス(各単語の先頭のオフセット値が
入っている)。
NMZ.wはコード順にソートされているので、NMZ.wiとNMZ.wをバイナリサーチ
すれば該当するNMZ.wiのファイルの位置から単語IDが求まる。

まあ最悪mknmzとlibnamazu.cあたりをみればわかるよ。

187 ：名無しさん＠お腹いっぱい：2006/09/26(火) 09:15:59

Namazu(最新版)をWindows XPで使いたいのですが、カスタマイズを行う
場合は、バイナリではなく、ソースコードからインストールしなければ
ならないでしょうか？

188 ：名無しさん＠お腹いっぱい。：2006/09/27(水) 07:50:14

カスタマイズする内容によるが、普通いらない。
必要になるのはソースコードレベルで埋め込まれている出力を
いじるときぐらい。
それもほとんどはgettext化されてるので、ja.poだけいじって差し替えれば
済む話だし。

189 ：名無しさん＠お腹いっぱい。：2006/10/03(火) 13:05:12

"ペイジ" は勘弁して欲しい。直したけど。

190 ：名無しさん＠お腹いっぱい。：2006/10/04(水) 00:10:39

>>189
なんでページにしないんだろうな

191 ：名無しさん＠お腹いっぱい。：2006/10/04(水) 02:28:57

ぱげ

192 ：名無しさん＠お腹いっぱい。：2006/10/04(水) 05:05:52

三四郎ファンなんだろ

193 ：名無しさん＠お腹いっぱい。：2006/10/04(水) 10:48:43

ペイイチ？

194 ：名無しさん＠お腹いっぱい。：2006/10/04(水) 16:48:59

N-gram戦争中ｗ
全文検索ユーティリティ統一スレッド　part3
ttp://pc8.2ch.net/test/read.cgi/bsoft/1120649196/

195 ：(^-^) ◆MONSOON/qo ：2006/10/08(日) 05:27:21

インディックス作成時に読み込む文字種を正規表現で指定できますか?
記号は除外するとかです

196 ：名無しさん＠お腹いっぱい。：2006/10/08(日) 07:47:34

mknmz -K

文字列処理:
-E, --no-edge-symbol 単語の両端の記号は削除する
-G, --no-okurigana 送り仮名を削除する
-H, --no-hiragana 平仮名のみの単語は登録しない
-K, --no-symbol 記号をすべて削除する

あとはソース書き換えかな

197 ：(^-^) ◆MONSOON/qo ：2006/10/08(日) 11:58:48

>>196
どうもありがとう

198 ：名無しさん＠お腹いっぱい。：2006/10/15(日) 10:14:17

NamazuをCGI(localhost)で利用しているのですが、検索結果と
して表示されたファイルが開けません。よろしければ、お教え
願えないでしょうか？

検索結果のファイルを選択
Forbidden
You don't have permission to access
/C|/a/b/c/d/f/soturon.html on this server.
------------------------------------------------------
Apache/2.0.55 (Win32) PHP/5.0.5 Server at localhost Port　80
という表示になります。

各種設定はNamazu2.014のインストーラのデフォルトです。
.namazurc の Replace で正しい URI に書き換えれば良いという話なのです
がどうにもうまくいかなくて。。。

索対象のファイルのpath
C:/a/b/c/d/1/ファイル
C:/a/b/c/d/2/ファイル
C:/a/b/c/d/3/ファイル
という様にファイルを格納しています。

そして、CGIはローカルホストで動かしているのですが、http://
以下はどのように指定すれば良いのでしょうか？

199 ：名無しさん＠お腹いっぱい。：2006/10/15(日) 11:42:00

httpd.conf に書いた
<Directory> ディレクティブ
Alias ディレクティブ
ぐらいは示さないとコメントのしようがないよ

200 ：名無しさん＠お腹いっぱい。：2006/10/15(日) 23:08:08

>>198

>>NamazuをCGI(localhost)で利用(win32)
多分だけど C|このせいだと思う。昔はまった。
<a harf=c|となってると見れないはず

ブラウザによるけど

lynx
では個別にルール指定できてC|/ C:と置換指定。
なんでもlynxが内部で指定置換してくれる。
だからオリジナルは弄ず。w3m あたりも平気

firefox,oprea,IE系は無理だった気が...
なんか慣行らしいけど|。GUIのブラウザだと無理?かも??

namazuの方がC|じゃなくてC:/と吐いてくれないと。パスを。昔
考えたのは適当にsed噛ますとかして置換ちゃえばとか思った
が...namazu -hで吐かせてるからsedでフィルタすれば...と

テキストブラウザで使えるしそのまま...圧縮したまま使えるか
ら。普通のブラウザだと圧縮したまま動かないんで...

公開しないし個人で使う分には書換ちゃっていいと思うけど、セ
キュリティ上よくないのかね?

cgi?どこで吐いてるのかわかんないけど|を/に変えるべく追って
弄らないといけないと思う。winの代表的な各種ブラウザで見た
いなら

201 ：名無しさん＠お腹いっぱい。：2006/10/17(火) 15:40:16

>そして、CGIはローカルホストで動かしているのですが、http://
設定を晒してくれ

202 ：名無しさん＠お腹いっぱい。：2006/10/17(火) 21:35:23

「Replace http://localhost/C|/ file:」

にしとけ

203 ：名無しさん＠お腹いっぱい。：2006/10/18(水) 01:14:49

>198です。
インデックス作成のオプション指定に気をつけ、きちんとドキュメントルート
を確認の上、.namazurcのReplaceを設定したら無事にできました。
ありがとうございました。

204 ：名無しさん＠お腹いっぱい。：2006/10/18(水) 19:08:09

UNIX板ですが、話題がNamazuなので。。。
以下について、どなたかご教示願えませんか？

Windows XPでNamazuを利用しているのですが、これからPHP(5.0)
でNamazuを使うために、Namazuモジュール(php-namazu-2.3.1)
をインストールしたいと考えています。

調べた限りでは、現在はPECLもCVSも利用できない(Namazuモジュール)
ということでした。Windowsでこのモジュールをインストールするにはど
のような手順を踏めばよいのでしょうか？

それと、塚田卓也さんという方がNamazu関数をWindows版PHPで
も使えるように開発された、モジュール「php4_namazu-3.0.0PHP4.3.x
」があるそうですが、これは5.0でも使えたりするのでしょうか？

205 ：名無しさん＠お腹いっぱい。：2006/10/18(水) 20:55:13

なんでナマズってこんなに遅いの？

206 ：名無しさん＠お腹いっぱい。：2006/10/18(水) 21:13:56

>>205
何に比べて？

207 ：名無しさん＠お腹いっぱい。：2006/10/18(水) 23:11:06

バンドウイルカ

208 ：名無しさん＠お腹いっぱい。：2006/10/18(水) 23:34:51

>204
マルチよくない
ttp://www.namazu.org/pipermail/namazu-win32-users-ja/2006-October/001443.html

使えたりするかどうかは自分で試してみたの？

209 ：名無しさん＠お腹いっぱい。：2006/10/18(水) 23:49:19

いや、[PHP4---]というモジュール名から見るに、多分使えないだろう
なぁと思って、試してはいません。ただ、使えるか知っている方がいた
ら、その是非を教えて欲しいなぁと思いまして。
もう１つの、WindowsへのNamazuモジュールのインストールのほうは自分
でもそれなりに調べたりしましたが、どうも分からなかったもので。。。

210 ：名無しさん＠お腹いっぱい。：2006/10/19(木) 22:20:26

使えないと思うならPHPやめてPerlにしておけ

211 ：名無しさん＠お腹いっぱい。：2006/10/20(金) 03:49:00

使えない。
はい、この話題は終了。

212 ：名無しさん＠お腹いっぱい。：2006/11/13(月) 20:52:00

namazurcってmknmzしたときには適用されないんですか？
replace使いたいんですが…

213 ：名無しさん＠お腹いっぱい。：2006/11/13(月) 21:31:48

--replace というオプションがある
ttp://www.namazu.org/doc/tutorial.html#run-mknmz

214 ：名無しさん＠お腹いっぱい。：2006/12/22(金) 16:04:17

namazuの検索結果をEUC-JPで出力させているのですが、Shift_JISで書かれた
ファイルの内容がそのままShift_JISで出力されてしまうため、検索結果が文
字化けしてしまいます。何か設定が必要なんでしょうか。

215 ：名無しさん＠お腹いっぱい。：2006/12/24(日) 22:02:54

>>214
必要

216 ：名無しさん＠お腹いっぱい。：2006/12/26(火) 14:20:11

tp://www.ki.nu/software/namazu/tutorial/make.html#PERL_MODULEで
namazu 1.9.12 以降では Chasen2 にだけ対応している。
とありますが、kakasiは使用できないということでしょうか？

217 ：名無しさん＠お腹いっぱい。：2006/12/26(火) 15:07:33

検索結果にキーワードが最初にファイルの何行目に登場するか、の情報って取得できますか？
google検索エンジンみたいに、キーワードのヒットした前後の文章を結果一覧に出したいのですが・・・

218 ：名無しさん＠お腹いっぱい。：2006/12/27(水) 09:38:55

>>216
そんな古い情報参照しないでよ...
http://www.namazu.org/doc/tutorial.html#prep-make

>>217
namazu.cgi単独では無理。コマンドラインならnmzgrepというのがあるけど、
あれは単に検索結果に基づいてあとでgrepしているだけ。
libnmz使って同等のことをやるか、Hyper Estraierでも使ってみるのが吉。

219 ：名無しさん＠お腹いっぱい。：2006/12/28(木) 22:22:23

Namazu の ML はなぜ iso-2022-jp でも Content-Transfer-Encoding: 8bit
で送ってくるんだろう。なんか気持ち悪いなあ。

220 ：名無しさん＠お腹いっぱい。：2006/12/29(金) 09:48:34

僕はテンプルウエストが気持ち悪いよ。

221 ：名無しさん＠お腹いっぱい。：2006/12/29(金) 22:42:03

Linuxにnamazu-2.0.16をインストールして、
インデックスの作成とNamazuコマンドでの検索が出来るようになったのですが
検索対象はファイルの中身だけで、ファイル名は検索外にする事は可能でしょうか？
index.htmlを検索しても表示されない、でもindex.htmlの中身に書いてある文章で
検索を掛けると表示されるようにしたいのですが・・・

222 ：名無しさん＠お腹いっぱい。：2006/12/30(土) 12:24:41

>>221
mknmz の namazu_core というサブルーチンに
$content .= "\n\n$filename\n\n"; # add filename
という行がある
これを削ってインデックスを作り直す

223 ：名無しさん＠お腹いっぱい。：2007/01/02(火) 19:57:55

>>222
真にありがとうございます。上手く行きました。
ただ"index.html"だと表示されないようになったのですが、"index"で検索すると表示されてしまいます。
これも表示されないようにする方法はありますでしょうか？何度も質問して申し訳ありません

224 ：223：2007/01/04(木) 21:18:12

自己解決しました
本当にありがとうございました

225 ：名無しさん＠お腹いっぱい。：2007/01/10(水) 19:44:10

スレ違いかもしれませんが、

自分がよく利用するウェブサイトの一部のコンテンツをNamazuで検索可能にしたいの
ですが（Google等では何故かうまく出てこないので）、
その場合はウェブサイトの必要なコンテンツをローカルにダウンロードして、
それをNamazuにかけるわけですよね?
ウェブサイトのコンテンツをダウンロードするのにお勧めのソフトはありますか?

226 ：名無しさん＠お腹いっぱい。：2007/01/10(水) 21:58:48

wget >> 225

227 ：名無しさん＠お腹いっぱい。：2007/01/11(木) 08:26:55

wwwoffle+Namazuという組合せはどうか。
squid cacheも対応フィルタがどこかにあったような。

228 ：名無しさん＠お腹いっぱい。：2007/01/11(木) 17:18:29

風博士 + Hyper Estraier とか。

229 ：名無しさん＠お腹いっぱい。：2007/02/02(金) 19:26:32

Vine3.2から4.0にしてから気づいたんですが、
kernel2.6系だとqueryの先頭からフィールド検索すると
日付ソートが逆になりませんか？　バグですかね？

例：
http://www.namazu.org/cgi-bin/namazu.cgi?query=%2Bsubject%3ANamazu&submit=Search%21&whence=0&lang=ja_JP.eucjp&max=20&result=normal&sort=date%3Alate&idxname=www.namazu.org.ja

230 ：名無しさん＠お腹いっぱい。：2007/03/15(木) 00:55:42

namazu 2.0.17 release!!

231 ：名無しさん＠お腹いっぱい。：2007/07/05(木) 13:53:45

232 ：名無しさん＠お腹いっぱい。：2007/10/09(火) 03:41:55

EmphasisTags "" ""
みたいに設定してキーワードをハイライトさせているのですが、
キーワードの出現位置が検索結果の本文表示文字数のリミットと
被る場合にタグを閉じてくれず、次の行から真っ赤っかになってしまいます。
回避する方法ってあるのでしょうか？

233 ：名無しさん＠お腹いっぱい。：2007/10/10(水) 16:05:50

http://www.namazu.org/pipermail/namazu-devel-ja/2007-October/001647.html
これで直りませんかね。

234 ：名無しさん＠お腹いっぱい。：2007/11/28(水) 05:27:51

ダブルクオーテーション内の連続した文字　"、狼8、"　で検索かけたいのだがノイズ入りまくり
/、狼8、/　も試したが今度は見つからないとか言われた
勝手に要素に分割するなああああ

235 ：名無しさん＠お腹いっぱい。：2007/12/14(金) 21:25:55

mknmz -CでCoding System: eucってでるんだけどsjisにするにはどこの設定を弄れば良いですか？

236 ：名無しさん＠お腹いっぱい。：2007/12/14(金) 21:46:18

Cording Systemの意味わかってないんじゃない？
検索結果をSJISにしたいんだったら
.namazurcでShift_JISに設定すればいいだけだし。
ちなみにNamazuのインデックス内部はeuc。

237 ：235：2007/12/14(金) 22:33:23

>>236
なるほどありがとうございます

Namazuのインデックス内部はeuc。
ということはインデックスさせるページはEUCで記述しないと駄目なんですか？

238 ：名無しさん＠お腹いっぱい。：2007/12/14(金) 22:34:52

>>237
んなこたーない

239 ：235：2007/12/14(金) 22:41:36

>>238
むむむ･･
sjisで書いたページをmknmz -kでインデックス作ると
NMZ.wの中が所々文字化けるんですよ。。。
何かアドバイスお願いします。

# mknmz -C
わかち書き: /usr/local/bin/kakasi -isjis -osjis -w
メッセージの言語: ja_JP.SJIS
言語: ja_JP.SJIS
文字コード: euc

mknmzする前にsetenv LANG ja_JP.SJISしてます

240 ：名無しさん＠お腹いっぱい。：2007/12/15(土) 20:44:17

-i -o については何も疑問に感じないのかね。

241 ：名無しさん＠お腹いっぱい。：2007/12/15(土) 22:55:03

/usr/local/bin/kakasi -ieuc -oeuc -w
に戻せばいいよ
kakasiに渡される前にeucに変換されているのですよ。

242 ：235：2007/12/18(火) 10:46:31

>>240
>>241
なるほど！解決しました！
ありがとうございます！

243 ：名無しさん＠お腹いっぱい。：2008/02/04(月) 01:50:13

>>229
激しく亀レスだが、日付ソート(新しい順)の結果が
スコア順のソートと同じ結果になっている気がするんだが……。

244 ：名無しさん＠お腹いっぱい。：2008/02/06(水) 03:00:26

共有鯖でインスコしたいのですがsshやtelnet以外でインスコする方法ありませんか？
鯖が対応してなくて困ってます。

245 ：名無しさん＠お腹いっぱい。：2008/02/06(水) 14:37:42

それ意味不明だし。

246 ：名無しさん＠お腹いっぱい。：2008/02/06(水) 14:43:34

>>244
管理者の方に相談してください。

247 ：名無しさん＠お腹いっぱい。：2008/02/21(木) 21:40:38

新しいバージョンのnamazuだけど、namazu.cgiがnamazurc読み込んでないな。
なんかバージョンアップのたびに質が落ちてる。

248 ：名無しさん＠お腹いっぱい。：2008/02/21(木) 21:49:47

うーん…ベストを尽くせ。

249 ：名無しさん＠お腹いっぱい。：2008/02/22(金) 01:52:53

ナマズ作り直してくれねーかなあ。バカスカメモリ食いやがって。このへたくそが。

250 ：名無しさん＠お腹いっぱい。：2008/02/22(金) 02:22:48

>>249
よし頑張れ。

251 ：名無しさん＠お腹いっぱい。：2008/02/22(金) 03:33:49

それを必要な人がそれをやるしかないんだよ。

いわゆる言い出しっぺの法則 ――言い出しっぺがやらなければ誰もやらない―― だね。

252 ：名無しさん＠お腹いっぱい。：2008/02/28(木) 13:15:05

なんでこれ環境変数と設定ファイルで同一の設定値を設定しないといけないんだ？
混乱するだけだと思うんだが。
世の中からこういうバカがいなくなればいいなあ。

253 ：名無しさん＠お腹いっぱい。：2008/02/29(金) 04:25:26

>>252
kwsk

254 ：名無しさん＠お腹いっぱい。：2008/03/03(月) 03:31:23

>>252
じゃあ直せよ

255 ：名無しさん＠お腹いっぱい。：2008/03/03(月) 21:09:29

>>254
kursk

256 ：名無しさん＠お腹いっぱい。：2008/03/12(水) 02:04:18

Namazu 2.0.18 リリース age

257 ：名無しさん＠お腹いっぱい。：2008/04/21(月) 21:18:16

windows環境でのNamazuでofficeを入れない環境で
office文書を検索対象に含めるには何のソフトが有効ですか？
Microsoft Office Viewerを入れたら可能ですか？

また、zipなどの圧縮ファイル名を検索対象にするにはどうしたらいいでしょう？

よろしくおねがいします

258 ：名無しさん＠お腹いっぱい。：2008/04/21(月) 23:47:00

>>257
officeを入れない環境ではxdoc2txt.exeが有効。
windows環境ではzipには標準で対応している。試してみましたか？
説明書を読んでますか？
ttp://www.namazu.org/doc/manual.html#doc-filter
よろしくおねがいします

259 ：名無しさん＠お腹いっぱい。：2008/04/23(水) 00:31:46

14ではzip対応していなかった。
18では全部できました。

lzhを対象にしたフィルタはない？
ここは潰れてる
http://log.counterghost.net/20040417.html

260 ：名無しさん＠お腹いっぱい。：2008/04/23(水) 23:24:10

>>259
lzhを対象にしたフィルタはcvsにはあるっぽいね
http://cvs.namazu.org/namazu/filter/
でもwindowsでは使えないかもね

261 ：名無しさん＠お腹いっぱい。：2008/04/23(水) 23:55:45

sub status() {
return 'no' if ($English::OSNAME =~ /^(?:MSWin32|os2)$/i);

# Only LHa for UNIX.
$lhapath = util::checkcmd('lha');

とかあるからwinは無理っぽいですね。。。

http://log.counterghost.net/20040417.html
↑持っている人どこかに上げてくれないだろうか・・・

262 ：名無しさん＠お腹いっぱい。：2008/04/24(木) 00:22:14

WaybackMachine

263 ：名無しさん＠お腹いっぱい。：2008/04/24(木) 00:33:50

IA探したけどなかったんだよ

264 ：名無しさん＠お腹いっぱい。：2008/09/19(金) 01:28:40

質問です。

WindowsXP + NTEmacs22.2 + Gnus の環境で Namazu を使っていますが、
Fedora9 + Emacs23 + Gnus で同じようにインストールした Namazu だと
「山田」のような固有名詞でも検索出来ますが、Winの場合だと同じ名前
で検索に引っかかりません。
(その名前が含まれたメールは存在してます。)

一般的な名詞だとどちらも同じように検索できてます。

環境としては、Win は ja_JP.SJIS で、Fedora9 は ja_JP.utf8 です。
両方共 Kakasi を使ってます。

何か気づいた点などありましたら教えてください。

265 ：名無しさん＠お腹いっぱい。：2008/10/17(金) 19:17:44

すみません。教えてください

test.tgzという1GBほどのファイルがあった場合に、
中身のについてのindex作成を行わずに
ファイルの名前とパスのみをindexに残したいのですが、
どのように設定すればよいでしょうか？

たとえばtest.tgzをtgzで検索にひっかけるなど、
ファイル名だけでも検索に引っかかるようにしたいのですが
可能でしょうか？

266 ：名無しさん＠お腹いっぱい。：2009/08/29(土) 11:16:19

64bit Linuxマシン（Red Hat Linux ES5）でnamazuをインストールしようとしますと、

Text/ChaSen/ChaSen.so \
-L/usr/local/lib -lchasen \

/usr/bin/ld: /usr/local/lib/libchasen.a(chalib.o): relocation R_X86_64_32 against `a local symbol' can not be used when making a shared object; recompile with -fPIC
/usr/local/lib/libchasen.a: could not read symbols: Bad value
collect2: ld はステータス 1 で終了しました
make: *** [blib/arch/auto/Text/ChaSen/ChaSen.so] エラー 1

というエラーがでます。

どのように対処したらよろしいでしょうか？

GOOGLE検索してもなかなか解決策が出てきません。

よろしくお願いします。

267 ：名無しさん＠お腹いっぱい。：2009/08/29(土) 12:03:02

メッセージに recompile with -fPIC と言っているから、それを試みる。

268 ：名無しさん＠お腹いっぱい。：2009/08/29(土) 12:04:23

rpmないの？

269 ：名無しさん＠お腹いっぱい。：2009/08/29(土) 15:02:28

>>267
recompile with -fPIC
というのはどういうふうに試せばいいのでしょうか？
これも検索したんですが、よくわかりません。。
>>268
rpmはでていないようです。さがしてみたんですが。。

270 ：２６９：2009/08/29(土) 15:06:27

少し説明不足だったように思いますので、付け加えますと、
http://www.asahi-net.or.jp/~wv7y-kmr/memo/namazu.html
を参考にし、
Text::chassen　perl moduleをインストールしようとし、
$ perl Makefile.PL
$ make
をした後に、266のメッセージはでます。。

271 ：名無しさん＠お腹いっぱい。：2009/08/29(土) 15:46:16

>>270
茶筅のライブラリ /usr/local/lib/libchasen.a(chalib.o) が読み込めないと言って居るんだから
ライブラリをシステムに合わせて構築し直せ。

272 ：２６９：2009/08/29(土) 16:11:36

>>271
すみません、もう少しヒントをもらえますか？
どのようにしてライブラリを構築しなおすといいのでしょうか？
自分がやったのは、
＄perl -fPIC Makefile.PL
ですが、それもエラーがでました。このへん詳しくないので。。

273 ：267：2009/08/29(土) 17:03:34

>>269 はじめのカキコのメッセージは、namazu のコンパイルオプション云々
じゃなくて、namazu をビルドするときに使おうとしているchasen のライブラリが
変だよ、といってるの。リンクに失敗しているんで、libchasen を -fPICという
のオプション付けてコンパイル (gcc) してくれたら直るとおもうよ、と言っているの.。

察するに、-fPIC オプションは実際には不要で、単に、chasen のソースを
とってきて、./configure; make; sudo make install ; sudo ldconfig とやれば
済みそうな気もするが。

274 ：名無しさん＠お腹いっぱい。：2009/08/29(土) 17:22:27

>>272
茶筅のインストールに失敗しているんだろ
ttp://chasen.naist.jp/hiki/ChaSen/?%A5%BD%A1%BC%A5%B9%A4%AB%A4%E9%A4%CE%A5%A4%A5%F3%A5%B9%A5%C8%A1%BC%A5%EB
茶筅単体で動くことを確認してみろ。　あと、茶筅のバージョンは最新か？

いらん話： -fPIC だが、茶筅の Makefile の CFLAG に追加。
（このモジュールはＣだかＣ＋＋だかで書かれていたはず）

275 ：名無しさん＠お腹いっぱい。：2009/08/29(土) 17:26:25

茶筅の最新版の取得先
ttp://sourceforge.jp/projects/chasen-legacy/

276 ：２６９：2009/08/30(日) 09:45:59

>>273 様
>>274 様

ありがとうございます。

chasen自体は、
$ chasen
EOS
テスト
テストテストテスト名詞-サ変接続

のように動いています。

ただ、 namazuで使う perl moduleの
Text::chasen がうまく入ってくれません。

chasen はchasen-2.4.4を使っています。これが最新のようです。

chasenのコンパイル時のMakefileにCFLAGに-fPIC をつけてもうまくいきません。。

もし何か分かりましたら、よろしくお願いいたします。

277 ：２６９：2009/08/30(日) 09:54:18

64bitマシンがだめなのでしょうか？
32bitのときは問題なく前は入ったのですが。。
64bitでnamazuはあきらめたほうがいいということなのでしょうか？

278 ：名無しさん＠そうだ選挙に行こう：2009/08/30(日) 09:58:36

>>269 「うまくいきません」
.so に関するエラーのとき、ldconfig したかどうかがまず確認箇所だけど、どう？
あと、google すると、以下のようなもんがすぐ引っかかってくるが、チェックした？
http://www.daionet.gr.jp/~knok/chasen/
http://www.namazu.org/pipermail/namazu-users-ja/2008-June/001090.html

279 ：名無しさん＠そうだ選挙に行こう：2009/08/30(日) 10:00:12

# 64bitでnamazu

64bit マシンなら、chasen のライブラリは、/usr/lib じゃなくて
/usr/lib64 のほうに行っていて、namazu の Makefile がそれに
適切に対応していない可能性がある。

280 ：名無しさん＠お腹いっぱい。：2009/08/31(月) 19:35:35

＞＞278
＞＞.so に関するエラーのとき、ldconfig したかどうかがまず確認箇所だけど、どう？
これはしております。

＞＞あと、google すると、以下のようなもんがすぐ引っかかってくるが、チェックした？
http://www.daionet.gr.jp/~knok/chasen/
はい、patchはあてています。

http://www.namazu.org/pipermail/namazu-users-ja/2008-June/001090.html
これは、まだチェックしきれていませんが、むつかしそうですね。調べてみます。

＞＞279
＞＞64bit マシンなら、chasen のライブラリは、/usr/lib じゃなくて
＞＞/usr/lib64 のほうに行っていて、namazu の Makefile がそれに
＞＞適切に対応していない可能性がある。
/usr/lib64にはlibchasen系は入っていなかったです。/usr/libに入っています。

281 ：名無しさん＠お腹いっぱい。：2009/08/31(月) 23:52:45

> ＞＞適切に対応していない可能性がある。
> /usr/lib64にはlibchasen系は入っていなかったです。/usr/libに入っています。
「64bit版のライブラリは /usr/lib64 に置く必要があるかも？」って話なんだけど。

282 ：名無しさん＠お腹いっぱい。：2009/09/03(木) 18:01:17

mknmzで大規模データを一日かけて実施していたところ、

NMZ.lock2 ファイルを発見しました
このインデックスは他のプロセスによって更新されている可能性があります

というエラーがでました。おそらく前回、途中でmknmzをやめ、indexファイル群
を削除せずに再度mknmzを実施したからだと思います。
仕方ないので、このlock2ファイルを削除し、
mknmz -Y
で差分更新をしようと思うのですが、前回エラーで中断したところから、うまく
再開できますか？

よろしくお願いいたします。

283 ：名無しさん＠お腹いっぱい。：2009/09/05(土) 08:26:43

280です。別の64bitマシンを借りて、インストールをし直してみたところ、インストールはうまく
いったのですが、別の問題が起きています。。
Text::Chasenの64bitマシンへのインストールでつまずいています。
以下のように、Text::Chasenのインストール自体には成功しているように
見えるのですが、perlからよびだせていないようです。
検索して、LIBS lstdc++ chasenなどを、Makefile.PLに足したりはしているのですが、
それでもうまくいっていません。
$ sudo make install
Files found in blib/arch: installing files in blib/lib into architecture dependent library tree
Writing /usr/lib64/perl5/site_perl/5.8.8/x86_64-linux-thread-multi/auto/Text/ChaSen/.packlist
Appending installation info to /usr/lib64/perl5/5.8.8/x86_64-linux-thread-multi/perllocal.pod

$ perl -MText::ChaSen -e ''
Can't load '/usr/lib64/perl5/site_perl/5.8.8/x86_64-linux-thread-multi/auto/Text/ChaSen/ChaSen.so' for module Text::ChaSen:
libchasen.so.2: 共有オブジェクトファイルを開けません: そのようなファイルやディレクトリはありません
at /usr/lib64/perl5/5.8.8/x86_64-linux-thread-multi/DynaLoader.pm line 230.
at -e line 0
Compilation failed in require.
BEGIN failed--compilation aborted.

lddをすると以下のようになります。libchasen.so.2のある場所がおかしいのでしょうか？
どうすればいいかわからないので、何かアドバイスをいただけないでしょうか？

$ ldd /usr/local/bin/chasen
libchasen.so.2 => /usr/local/lib/libchasen.so.2 (0x00002aaaaaaad000)
libstdc++.so.6 => /usr/lib64/libstdc++.so.6 (0x00000032afc00000)
libm.so.6 => /lib64/libm.so.6 (0x00000032a9c00000)
libgcc_s.so.1 => /lib64/libgcc_s.so.1 (0x00000032af400000)
libc.so.6 => /lib64/libc.so.6 (0x00000032a9800000)
/lib64/ld-linux-x86-64.so.2 (0x00000032a8800000)

よろしくお願いします。

284 ：名無しさん＠お腹いっぱい。：2009/09/05(土) 21:53:03

Text::ChaSen をビルドする前に、Makefile.PL のなかのLIBS指定、
'LIBS' => ['-L/usr/local/lib -lchasen'　みたくしてる？

285 ：名無しさん＠お腹いっぱい。：2009/09/08(火) 20:31:02

namazuでmknmzする際の最大メモリ使用量が32bitマシンでは、4GBでしょうか？
それだと足りなくて、
Out of memory!
NMZ.lock2 ファイルを発見しました
となる場合はどうすればよいでしょうか？

286 ：名無しさん＠お腹いっぱい。：2009/09/09(水) 01:21:47

>>285
インデックス分ければいい。

287 ：名無しさん＠お腹いっぱい。：2009/09/09(水) 21:25:51

だれかNamazuを近代化補修しろよ。

288 ：名無しさん＠お腹いっぱい。：2009/09/29(火) 19:31:08

>>287
近代化されているかは不明だけど、バージョンアップされているね。

Namazu 2.0.20
http://www.namazu.org/index.html.ja#news

289 ：名無しさん＠お腹いっぱい。：2010/04/22(木) 20:07:42

6万貰ってセックヌしてきたぞ！！

濡れた熟マンに入れたら、肉ヒダがしっとり絡みついてきて、
そんだけでイきそうになったわｗｗ
http://xabrina.net/om/c9y94mf

290 ：名無しさん＠お腹いっぱい。：2010/05/31(月) 16:47:39

スレがうまく読み込めない…

291 ：名無しさん＠お腹いっぱい。：2011/02/04(金) 21:34:06

mknmz + pdftotext で PDF ファイルをインデックス化してるんだけど、
100MBを超える PDF だと、out of memory のエラーが出る。

mknmzrc の記述はチェック済み ($FILE_SIZE_MAX, $TEXT_SIZE_MAX, $ON_MEMORY_MAX)。
マシンのメモリは 4G 積んでるので、実際のメモリ不足ではないと思う。

ご存知の方、よろしく。m(_ _)m

環境：Namazu for Windows (ver. 20.0.20) on WinXP SP3
Active Perl 5.8.9

292 ：名無しさん＠お腹いっぱい。：2011/02/04(金) 23:23:25

>>291
以前、某パッケージのマニュアルで発生した。
pdfsplit.pl でページ単位に分解したら上手くいった。

# つ～か、そのサイズのpdfって数百ページないか？
# ページに分解して処理しないと面倒だと思う。

293 ：名無しさん＠お腹いっぱい。：2011/02/05(土) 10:22:07

>>292
サンクスです。
>> ttp://www.namazu.org/ml/namazu-devel-ja/msg01950.html
を見て、pdfslit.pl を導入してみましたが、out of memory のエラー
がでます。やはり、pdfファイルがでかすぎるのかな…

294 ：名無しさん＠お腹いっぱい。：2011/07/09(土) 20:40:20.11

>>293
File::MMagicでメモリを大量に消費しているのが原因っぽい。
-tを使うとうまくいくかも。

295 ：名無しさん＠お腹いっぱい。：2011/09/18(日) 16:06:29.49

サーバ中の文書を検索したくて入れてみました。
入れてみて気付いたのですが、EUC-JPにしか対応していないようです。
検索対象の文書は、UTF-8とEUCJPとSJISのファイルが混在しています。
内部的に、エンコードを自動的に検出して変換してインデックス化、
という処理は行われているのでしょうか？
それとも、すべてEUC-JPの文書という前提で動作しているのでしょうか？

296 ：名無しさん＠お腹いっぱい。：2011/09/18(日) 16:40:29.46

試しに検索してみたらできました

297 ：電脳プリオン忍法帖【Lv=40,xxxPT】(2+0：8) 【35.7m】：2013/06/23(日) 13:34:26.59 BE:182433863-PLT(12080)

ver3は？

298 ：名無しさん＠お腹いっぱい。：2014/01/30(木) 20:35:11.93

グーグル検索の進化
http://webblogsakusei.main.jp/seo-taisaku-matt-cutts-toha-2014-google-hummingbir.html

299 ：名無しさん＠お腹いっぱい。：2014/11/11(火) 18:34:41.57

winのお話だけど、PCの引越ししたら下記URLをチェキだ！
http://www.namazu.org/pipermail/namazu-win32-users-ja/2009-September/001206.html
http://namazu.asablo.jp/blog/2009/08/09/4488130

なんでそんな古い話するかって？俺が今日ハマったからだ！