1 :
名無しさん@お腹いっぱい。 :
2005/04/11(月) 01:31:01
削除依頼よろ
3 :
名無しさん@お腹いっぱい。 :2005/04/11(月) 05:09:19
3ちしげ3ゆ3様が電光石火の3ゲットなの!
>>1 番かわいいのはさゆなの!
ノノハヽヽ〃ノハヾ /)
>>2 じ本はハゲすぎなの!
後
>>10 は落ち目すぎなの! ∩*・ 。.・)从*・ 。.・)/ミ
〃ノハヾノノハヽヽノノハヽヽつ い
>>4 川は黒すぎなの!
矢
>>9 ちもフケすぎなの!⊂(。.・从(・ 。.・*∩ノノノハ 。.・)ノハヽ
(( (\ゝノノノハノハ〃ハ v)っ彡*・ 。.・)
あ
>>8 やはフケすぎなの! ⊂`ヽ从*・ 。.・)・ 。.・))ノノノハヽつ ))
>>5 んのは顔ふくれすぎなの!
大の大人が
>>7 っちとか(プ⊂\ ⊂ ) _つ从*・ 。.・)
(/( /∪∪ヽ)ヽ)/ U つ モー
>>6 すは売れなさすぎなの!
∪ ̄(/ ̄\) ゝし'⌒∪
>>11-1000 さゆのかわいさの前にひれ伏すの!
4 :
名無しさん@お腹いっぱい。 :2005/04/11(月) 09:47:20
,,r 、,r'"⌒`゙゙ヽ、 + / "~ ヽ、 `ゝ + . ./ ,r彡" 、ノ彡' ヽミ`\ + r、r.r 、 ソ/ノ ヽ `ゝ + _ ,|_,| ノ ⌒ ⌒ヾ|ミヾ + ノ ノノノノ--<-●>-,(-●>ミ ミ + 素敵な微笑とともに4様上陸! ノ ノノノノ "" ) " ミ + ノ .彡| | トーー/| | ミ ∧ | \ ..ヾ____/ ..| |ノ \ \ "⌒ ノ\ ヽ 《 ..~ ー--/ /
5 :
名無しさん@お腹いっぱい。 :2005/04/14(木) 15:26:59
【日産】 NOTE ノート Part9 【普通で素直】
http://hobby7.2ch.net/test/read.cgi/auto/1113087118/ 孤独な日産信者、通称「ネット版劇団独り」。
相次ぐノートの酷評記事、酷評レスの結果にもめげず、叩かれ役として大活躍w
気が向いたら燃料でも投下してあげてください。
◆◇◆◇◆◇◆◇◆◇◆◇ネット版劇団独りの特徴◇◆◇◆◇◆◇◆◇◆◇◆
>ノート信者はやたらと若者向けと思わせたがる。
>ノート信者はやたらと女に人気があると思わせたがる。
>ノート信者はやたらと個性という単語を強調したがる。
さらに
捏造した燃費データを報告。
ノートについて論点は存在せず、私怨で追いかけ回すざま。
>>229 ,232などでわかるように、悔し涙で文字が読めないほど常時興奮。
ID変えまくって仲間がいると思わせたいらしいw
執念だけはルパンを追う銭形以上。
やられっぷりはトムとジェリーのトム以上。
本人へのアドバイス
「IDを変えて必死か?」というレスに対する反応が、毎回ビックリするほどワンパターンw
ID変えの際に書き込み時間が集中しすぎ。文体が似すぎw厨房レベルw
◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆◇◆
6 :
名無しさん@お腹いっぱい。 :2005/04/22(金) 14:58:10
namazuって、滅びた?
しばらくは現役でしょ。今でもいろんなとこで使われている。 日本語全文検索エンジンを普及せしめたという歴史的役割は終えつつある と思うけど。
8 :
名無しさん@お腹いっぱい。 :2005/04/22(金) 18:29:13
いやいや、開発コミュニティがさ。 サイトの復旧が途中で止まってる。
FreeWnn化進行中?
>>9 あそこまでひどくはないだろう。せめて引き合いに出すならCannaってところだ。
まあ作る方も使う方もフィルタ増やすことくらいしか頭にないからな。
それとUTF-8化。
でもなんだか今年中に hyperestraier だの rast だのがリリースされそうだし、 寂れる一方なのかもしれない。
企業関係のメイン検索システムに入ってるんで そうそう簡単に捨てられることはないんじゃないの? やっぱ、オフィス、PDFなんかがまとめて行けるのは大きい。 あと、インストールや設定の資料が豊富だし。 ただ、Namazu Proj.はセキュリティ関連アップデートとか フィルタまわりのソフトウェアバージョンアップに伴う修正 ぐらいしかやってないから、進化は止まっちゃったよね。 良い意味でも悪い意味でも、枯れてしまった。
茶筌でUTF8を使おうと思って、茶筌のHPの説明にあるとおりにしたんですが、 エラーがでてます。 それに関係しているようなのですが、英語の単語の認識が、例えばHelloだったら h e l l o のように解析されてしまうんですが、一単語として認識させるには、 何が問題かわかる方いらっしゃいますか。
14 :
名無しさん@お腹いっぱい。 :2005/05/23(月) 18:02:18
あげときますです。。。
ChaSenのバージョンはいくつよ。
a name ごとにインデックス作成するのでやってるんですが、 特定の a name を対象外に指定することってできますでしょうか? 具体的には、ページトップ戻り用の<a name="top">てのをはずしたいんですが…
18 :
名無しさん@お腹いっぱい。 :2005/06/24(金) 13:32:20
あげてみた
19 :
名無しさん@お腹いっぱい。 :2005/06/24(金) 19:54:25
ヒットした検索結果毎に表示される日付のフォーマットって変更することできますか? テンプレには無いのでcのソースかなと思ったんですが、該当箇所が見当たらないので。。 それと、 ------------------------ 参考ヒット数:[***:10] 検索式にマッチする10個の文書が見つかりました。 ------------------------ の前後に挟まる謎の<p>,<dl>タグと ------------------------ 現在のリスト: 1 - 3 ページ: [1] ------------------------ の前後に挟まる謎の<p>タグの消し方ご存知でしょうか? #namazuの仕様にうんざり…
うんざりしてるなら,つかわなきゃいいじゃん。
> namazuの仕様にうんざり… って高飛車なこと書けるならsrcみて直せるんじゃないの?
namazuにケチつけるとひたすら叩かれる件。
たたかれてないじゃん? うんざりしてるんなら使わなければいいじゃん? いまだったらEstraier みたいな高機能なのもあるしさ。
24 :
名無しさん@お腹いっぱい。 :2005/06/24(金) 21:42:56
他のを使えと言うのならこのスレはなんなんだ?
25 :
名無しさん@お腹いっぱい。 :2005/06/24(金) 22:08:12
26 :
19 :2005/06/24(金) 23:52:27
すいません、色々物議をかもしてるようで… namazuの仕様にうんざりしたのは、色々と 試行錯誤していてもなかなかうまくいかなかったのでつい…。 修正する方法が無いのであれば仕方ないのかもしれませんが、 もしご存知の方がおりましたらご教授いただければ幸いです。
>>19 > <p>,<dl>タグと
src以下で grep すりゃ一瞬で見つかる。
output.cの
print_hlist()
print_hitnum()
あたり。
あと、日付の書式は NMZ.field.date を読んでるだけだから, そっちを直す。 NMZ.*を手で修正した場合は,rfnmz で NMZ.field.*を再構築すること。
29 :
19 :2005/06/25(土) 12:49:47
>>27 ,28
ありがとうございます!
もう少し頑張ってみます。
30 :
名無しさん@お腹いっぱい。 :2005/07/13(水) 14:24:03
namazuをWindows2000で動かしています。Apacheを使ってnamazu.cgiもできましたし、 すべてが順調にすすんでいるかのように思いました,,,が、pdfを検索対象にするにあたって インデックスを作成すると、 検索対象のファイルを調べています... 1個のファイルがインデックス作成の対象として見つかりました 1/1 - /C|/aaa/tsunaba_abst.pdf Unable to convert pdf file (maybe copying protect ion) [基本] 日付: Wed Jul 13 14:21:42 2005 わかち書き: module_kakasi -ieuc -oeuc -w 経過時間 (秒): 1 ファイル/秒: 0.00 システム: MSWin32 Perl: 5.00503 Namazu: 2.0.14 となり、インデックス作成できませんでした。 だれか解決法教えてください
32 :
名無しさん@お腹いっぱい。 :2005/07/13(水) 15:16:15
>>31 それも設定しました!説明などに書いてあるものはすべてしました!mknmz -Cを実行すると、
一応application/pdf: pdf.plが対応になっています。
>>30 >(maybe copying protection)
元のPDFにprotectionがかかってる?
>>30 PDFのセキュリティで文字のコピーが許可しないになってる
そのまんまやんけ
平和な世の中やなあ。
>>36 どこが平和だ!!
イラクではアメリカ軍の攻撃で毎日毎日100万人ものイラク人が
虐殺されているのに、よくも平和だとかほざけるもんだな!!
一日100万ならたいしたことないな。
もし日本なら130日で日本人全滅か
40 :
名無しさん@お腹いっぱい。 :2005/07/17(日) 02:27:52
rastはWindows版がないから駄目。
ないなら作r(y
作る能力ない。誰かキボンヌ。
>>41 > ないなら作r(y
>>42 > 作る能力ない。誰かキボンヌ。
じゃあ、わたしが作りますから、みなさんは手を出さなくていいです(ニヤニヤ)
Namazu邪悪だなwww
>>43 は、どう見ても、名乗りだけあげてあとは放置犯。
IPAで同じことやるよりはいいだろ。
47 :
名無しさん@お腹いっぱい。 :2005/08/05(金) 11:12:41
namazuのフレーズ検索を利用しているのですが, "New Order"で検索をかけても100%New Orderというフレーズ がでるわけでなく,ときどきnewとorderが分離してても 結果としてはじきだしちゃう場合があります. そういうミスをできるだけ減らしたいのですが,なんかいい テクニックありますでしょうか? フレーズ検索とはそういうものでしょうか? googleだとNew-Orderとして検索するとほぼ100%でフレーズとなって 結果がでてくるのですが..
48 :
名無しさん@お腹いっぱい。 :2005/08/05(金) 11:31:00
というか,いまいろいろ調べてたら, "New Order"で検索をかけてもand検索にしかなっていない事が 判明しました. フレーズ検索ってどうやってやるの? 環境はFedora4でnamazu of Namazu 2.0.14 です. よろしくお願いします.
49 :
名無しさん@お腹いっぱい。 :2005/08/05(金) 12:04:14
できました
51 :
名無しさん@お腹いっぱい。 :2005/08/05(金) 12:18:05
"{New Order}" でよかったです.
53 :
名無しさん@お腹いっぱい。 :2005/08/09(火) 21:24:22
JAVAでretrievalWordという変数にModern Artsというような文字列をいれて, 下記のような検索プログラムにより,検索エンジンnamazuの 入力として渡しています. この場合,namazuには, namazu --max=2000000 "{Modern Arts}" /home/jikken/index_0 という入力が渡される事になります. なおnamazuは,"{Modern Arts}"という検索がいった場合, "{}"で囲まれた文字列がフレーズとして検索されるという機能をもっています. つまりターミナルから namazu --max=2000000 "{Modern Arts}" /home/jikken/index_0 と入力するとModern Artsの検索としてうまく行くのですが, java経由で下記のプログラムからnamazuへ検索要求をしても namazuでは, "{Modern Arts}"という文字列の検索を行ってしまい, Modern Artsの検索がうまくいきません. String proscmd = "namazu --max=2000000 "; proscmd = proscmd + "\"{" + retrievalWord + "}\" " + indexdir; System.out.println("proscmds : " + proscmd); Process process = Runtime.getRuntime().exec(proscmd); 結果 namazu --max=2000000 "{Modern Arts}" /home/jikken/index_0 この原因がどういう点にあるのかを教えて頂けないでしょうか? もう長いことこれに時間をかけています。でもわかりません。 宜しくお願い致します.
>>53 結果だけ見ると、
proscmd = proscmd + retrievalWord + indexdir;
でいいような希ガス。
メール本文のインデックスを作ってくれるのはありがたいんですけど、 メールに添付されている PDF や、Excel, Word ファイルについても インデックスを作ることはできませんか?
e-mail の milti-part がそのまま保存される、mh形式です。
59 :
名無しさん@お腹いっぱい。 :2005/09/23(金) 18:47:42
s/kakasidict/kanwadict/g
gj でも何が増えたのかわからないし、独自加工もしにくいので mkkanwaする前のソースデータもうpきぼんぬ。GPLだし。
63 :
名無しさん@お腹いっぱい。 :2005/11/01(火) 17:00:27
かなり困った。。。 PHPモジュールでmaxhit超えたやつに Too match hitとか出したいんだが resultが全部0で帰ってくる・・・ どうしたらいいものだろうか
64 :
63 :2005/11/01(火) 17:11:13
Too many documents hitだな・・・お恥ずかしい
65 :
名無しさん@お腹いっぱい。 :2005/11/04(金) 00:17:55
会社でUNIX畑の人に「とりあえずなまずって検索してみて」といわれたので OHPとかこのスレとか見てみました。 日本語全文検索ってほぼGoogleでカバーできてるのでは? Winではあまり普及していないらしいし、導入に面倒がありそうだし これからのNamazuの役割って一体なんです?
>>65 McDonald's があれば、モスバーガー、ロッテリアは必要ない、とかそーゆーこと?
フレッシュネスうまうまだよもん。 駅前広場はラブホのかわりにはならないんだよもん。
>>65 UNIX畑の人に聞いてみたら?
ってか色々なサイト見てきたんだったら役割は自ずと見えてくるだろうと思うけど
まぁちょっと設計が古かったりするところはあるとはおもうけど
自分に必要な機能が満たされていればNamazuでも十分だとか
そういうことを判別できれば役割はかなりあると思うよ
まぁ役割は自分が必要と思えばあるし、無ければ無いんだよ
>>66 > McDonald's があれば、モスバーガー、ロッテリアは必要ない、とかそーゆーこと?
McDonald'sがあれば、家庭に台所は必要ない、って言ってるんだろ。
というか最初は釣りかと思ったが、
>>65 がリアル素人な気がしてきた。
>>65 です。たくさんレスありがとうございます。
実際自分はWinしか触ったことのないリアル素人で、OHPや主だった関連サイトを
いくつか見てみましたがいまいちピンときませんでしたが
>>69 氏の譬えが的を射ているのかな。
つまりGoogleとかはロボットに「検索してもらう」という受動的な検索だけど
なまずは自分で全文を検索に引っ掛けるように設定するという能動的検索
という理解でよろしかろうか。
なんか新しく入った会社で雑務のひとつとして、なまず検索の更新も担当する
ということらしいです。
まだ具体的には本物の鯰なのかcgiの鯰なのかよくわかりませんが、
これからも何かとお世話になるかも知れません。
どうぞよろしくおながいします。
ぇ、
>>54 で言ってる Google って GoogleDeskTop のことじゃなかったのか。
> なまず検索の更新も担当 これも謎だよなー ふつうは更新されたファイルを探し出て、インデックスも更新する スクリプトを自動的に動かすもんだし。
>>71 > なんか新しく入った会社で雑務のひとつとして、なまず検索の更新も担当する
> ということらしいです。
UNIX畑の人がいるのに素人にこんな雑務をやらせるこの会社って一体…
OHPってなんだ?
Obsoleted Home Page だよもん webブラウザを立ち上げたときやホームボタンで表示されるページだよもんが、 メンテされないのでリンク切れ多発でよく使うのにリンクしてないサイト 多数出現だよもん
>>75 > OHPってなんだ?
エロゲー方面の隠語
>>74 UNIX畑の人が抜けるんで、自分が引継ぎということらしいです。
なにしろ社員3人で他SOHOスタッフしかいないんで勘弁してやってください。
>>77 エロゲ用語だったのですか。ふつーに公式サイトの意味で使われているものとばかり(w
>>73 なるほどー。それがふつうなのですね。
昨日全体の業務引き継ぎ内容を大雑把に説明されただけなので
まだ具体的なことはよくわからないのですが、鯰のこともうちょっと
調べてみるです。
80 :
68 :2005/11/07(月) 14:10:30
Namazu 2.0.14 for Win32 (Beta) を導入したのですが、 C:\namazu\share\namazu\filter\win32 の中に oleword.pl が見当たりません。 Office 2000ではダメで, 2003が導入されている必要があるのでしょうか? wvWareのWindows版を導入しようとしたのですが、コマンドがシェルスクリプトに なっているようです。cygwinがいるのでしょうか?
>>81 俺は cygwin + Namazu-2.0.14.tar.gz を
ソースコンパイルなので環境がだいぶ違うが、
Namazu 本家の namazu-2.0.14.tar.gz を解凍したら
namazu-2.0.14/filter/win32/ 以下に
olemsword.pl があるよ。
後半の方は俺には質問の意味が分からんのでパス。
なるほど! ソースなら入っていそうですね。試してみます。
olemsword.pl と olemsexcle.pl なら入ってるよ。 c:\Namazu\share\namazu\filter\win32 以下
ミス s/olemsexcle.pl/oleexcel.pl/
86 :
名無しさん@お腹いっぱい。 :2005/11/24(木) 11:56:33
Namazuで検索キーワードの該当部分を 検索結果に反映する方法はありますか? たとえば、デフォだと該当キーワードがHTMLの末のほうにあっても、 検索結果のプレビューではHTMLの上のほうから表示されてキーワードが 出てきませんよね? それを、キーワードの該当部分の前後文を表示するようにある方法が あるらしいといわれたので探しているのですが、わかりません。 もしかして指示者が別の検索エンジンと混同してるかも知れないので、 Namazuにそういう機能があるのかどうか だけでも教えていただければ 幸いです。
estraier にはそういう機能があった。
>>87 大ヒントありがとうございます!!
超感謝であります!
>>86 Namazuはインデックスに単語の出現位置を記録していない。
>>89 指示者もうろ覚えだったようなので、Esterierと混同していたのですね。
そのように報告しました。
どうもありがとうございます(´∀`)
91 :
名無しさん@お腹いっぱい。 :2005/12/05(月) 20:35:20
Webサイト内の商品検索に使用したいと思うのですが namazuの検索結果に画像を表示させることは可能ですか?
>>91 どこかのサイトで検索結果のサムネイル画像をやろうとしてた希ガス。
template の NMZ.result.normal.?? を変更すれば出来るっけか。
93 :
名無しさん@お腹いっぱい。 :2005/12/06(火) 11:41:20
>>91 検索結果に見合った画像を出すのはテンプレ変更だけじゃ無理かも。
「可能か」の問いには、オープンソースだからね。出来るさ。
94 :
91 :2005/12/06(火) 13:55:33
ありがとうございます。私のスキルでは簡単には出来そうもないですね。 調べてみたところkabayakiなら出来そうな感じですね。 Vineなんですが導入できるんだろうか。
96 :
91 :2005/12/07(水) 12:32:17
>>95 ありがとうございます!
他のどの方法でやるのか悩んでいたので助かりました。
97 :
名無しさん@お腹いっぱい。 :2005/12/07(水) 22:12:00
ビバ・オープンソース!
i Adios Amigos !
Namazuで動的ページに対してインデックスを作ることはできますか? DBから取得した情報をHTMLで出力するPHPプログラムがあるとして、 そのHTMLを検索対象にしたい場合が結構でてくると思うんですが、 やっぱりHTMLファイルを生成するしかないんですかね? wget 等で一度プログラムをたたいてその結果をインデックスすれば いけないこともないと思うんですが…。 そのようなNamazuモジュールや設定があればご教示いただけると助かります。
>>99 Namazuじゃないけど、mod_estraierどうよ。
101 :
99 :2005/12/09(金) 18:22:14
>>100 そんなモジュールがあったんですね。
参考になります。
ただやっぱりNamazu系のフリーの全文検索ツールじゃないときついですね…
つか、mod_estraierもHyper Estraierもフリーだよ。
やっぱりHyper Estraierに誘導するケースが増えてきてるねえ。 まあしょうがないかな。
104 :
101 :2005/12/12(月) 15:46:05
>>102 ,103
言葉足らずですんません。
mod_estraier はキャッシュとして動く感じだと思うので
ちょっと想定の動作とは異なる感じがしました。
Namazuを使うのはほぼ決定なんですが、
動的ページの検索がHyper Estraierでしかできないのであれば
その方向でも考えた方がよさそうですね。
>>104 キャッシュをインデックス対象にするのであれば
apacheでproxyを立てて
mknmzで --replace=apachecache::replacecode
としてできるかも
106 :
名人 :2005/12/18(日) 16:22:25
インディックスの作成の名人ですがどなたか勝負しましょう。 どこかサイトをいってください。 そしてインディックスの小ささと、単語のヒット率で勝負です。
107 :
名人 :2005/12/18(日) 16:23:32
工夫の余地の大きい日本語のサイトにしましょう。
108 :
名人 :2005/12/19(月) 09:05:34
前処理をよく行っておくことが重要です
名人殿。なにゆえ「。」が半角なのでつか。
110 :
名無しさん@お腹いっぱい。 :2005/12/19(月) 16:27:59
>>109 全角にしました。
誰も挑戦者はいないようなのでインディックスにしたいサイトが
あったら名人が作ってあげます。
小さすぎても大きすぎても駄目。ファイル数が五千から五万くらいのならいいよ。
111 :
:2006/01/04(水) 18:31:15
2.0.15RC1 テストに参加しる!!
ウェブ上のバグ報告システムなら気軽に書けるし 仮にメール欄があっても捨てアドなりなんなりで良いけど メールで ML にバグ報告は色々と敷居が高いよぅ …と保守がてら言ってみるテスト。
ファイルの添付も簡単だし、ハードコピーも貼れるし。 (namazu.cgiとかWindows上のエラーダイアログくらいしか出番はないかもしれんが) Wikiがあるならドキュメントの保守も簡単だし、TracのWiki自体も差分や変更履歴が残るしね。 と言ってみる。
(´-`).。oO(メールじゃないと報告者減る ってのは正直感覚ずれてる気がする)
115 :
名無しさん@お腹いっぱい。 :2006/01/16(月) 10:23:25
現在phpから動的にページを生成して出力しているのですが、 このPHPから出来上がるページをnamazuで検索したいと思っています。 どのような手法がありますでしょうか?
>>115 一番いいのは、その PHP のページががキャッシュを書き出す方法だけど
Proxy 経由でキャッシュを取るか、無限ループに気をつけて wget するかじゃないかな。
ファイル数が多く時間がかかるので インデックスの作成を何日かに分けてやりたいんですが どうすればいいでしょうか? 途中から再開する方法を知りたいです
118 :
名無しさん@お腹いっぱい。 :2006/01/23(月) 03:53:30
>>117 ファイル一覧を作ってから5000個ずつ処理するのがよいぞ
119 :
名無しさん@お腹いっぱい。 :2006/01/23(月) 03:56:11
大量のファイルを処理するにはindexサイズが大きくなりすぎないように することが大切だぞ。 処理中になんどか更新するがとても時間が掛かってしまう あとでマージせよ
>>118 ,119
ありがとうございます。インデックスをいくつかに分けて
作成する事にしました。インデックスのサイズが小さいと
時間の掛かり方も全然違いますね。
全部まとめてやるよりも早く終わりそうです。
121 :
名無しさん@お腹いっぱい。 :2006/01/24(火) 13:27:51
動的ページ(DBから情報を取得するもの)を検索対象にするために、 wget + Namazu で実際に運用されている方はおられますか? DBから取得した情報も全て静的ページに吐き出してからそれをインデックスするのか、 wgetで全部ダウンロードしてそれをインデックスするのかで悩んでいます。 後者の方が圧倒的にメンテナンスも構築も容易なのですが 実運用で使うに耐えられるものなのかが不安でして…。 宜しくお願いします。
>>121 > 後者の方が圧倒的にメンテナンスも構築も容易なのですが
> 実運用で使うに耐えられるものなのかが不安でして…。
と悩みはじめてすでに5年~♪
123 :
121 :2006/01/24(火) 14:10:24
>>122 悩むんですよね…。
Namazuのためだけに静的ページ生成を行うというのはどうも。
Namazuだと、ドキュメントルート以下にあるファイルでも
Webに公開されていない(リンクされていない)ものも引っかかってしまうので、
そう考えると wget の方が理にかなってるんですよね。
#メルマガなんかで直接URLを通知されるページは元も子も無いですが。。
124 :
名無しさん@お腹いっぱい。 :2006/01/26(木) 05:06:02
>>120 最初は一度にまとめてやった方が速いと思うのだろうけど。
例えば5メガずつindexを書き出す場合、今のindexサイズが200メガだったら
後50メガ追加するのに約1ギガの書き込み、消去を行うことになる。
これはとても大変だ。
125 :
名無しさん@お腹いっぱい。 :2006/01/26(木) 05:08:29
ただディスクアクセスだけではない。 indexサイズがでかければメモリ、cpuの処理も時間が掛かる。
キタ━━━(゚∀゚)━━━!!!!
2006-01-29: Namazu 2.0.15 を公開 ISO-8859-* に関する文書の間違いを訂正 RedHat ソフトウェア namazu.spec の不必要なパッチは削除 File::MMagic 1.25 を同梱 MeCab の正式対応 mknmz に -b 及び --use-mecab オプションを追加 mknmz および namazu に --norc オプションを追加 mknmz に --decode-base64 オプションを追加 新しいフィルタ(Gnumeric, Koffice, Mainman/Pipermail, Zip, Visio)を追加 mknmzrc に MECAB, DENY_DDN を追加 ファイル名がDDN である時にスキップ。 日付フィールドによるソート機能の追加 nmzcat, nmzegrep コマンドの追加 フィルタの Windows 対応 (msword.pl, excel.pl, powerpoint.pl, postscript.pl, 等...) OLE コントロールフィルタ更新 QUERY_STRING の区切りに';' 使用可能 Perl版テストプログラム(pltests) を追加 各種バグフィックス
cygwin 1.15.19-4でインスコ成功。
そろそろ入れ換えるかなぁ それとも別のに浮気するか...
Debian Sarge で namazu 2.0.14 を使っているのですが、教えてください。 mknmz を -U オプションを付けて、Samba 内のインデックスを作成しているの ですが、職場のパソコンのIEのバージョンにより、動作が異なります。 IE 6.0 では、検索結果の表示、クリックした時にファイルが開けるのですが、 IE 5.5 では、検索結果の表示は正常なものの、クリックしたときにパス名が 文字化けして、うまくファイルを開くことができません。 そこで、両バージョンのIEでファイルが正常に開けるように、検索結果を .namazurc の Replace コマンドで全体を " " で囲む等ということが可能 でしょうか?それとも、もっとよい方法が存在するのでしょうか? よろしくお願いします。m(._.)m
132 :
131 :2006/02/12(日) 19:57:31
>>131 です。 自己レス申し訳ないです。
再度、確認したら、自分の設定がおかしかったか、キャッシュが禍したのか原
因は不明でしたが、いずれのバージョンのIEでもまともに表示し、ファイルを
開くことができました。
確認したこと、.mknamazurc で lang=ja.SJIS、 mknmz -U オプション。
すれ汚し、申し訳ありませんでした。m(._.)m
>>133 作者に聞いてみたら?
Windows は Google、MS、Yahoo! 製があるけど
UNIX にはないよね?
>>133 研究者連中、面白いものを作っても、
作って論文にしただけで満足して死蔵するケース多すぎ。
公開しようとするといろいろ面倒なのはわかるが、
なんとかならんものかのう。
>>136 > 公開しようとするといろいろ面倒
を136がなんとかしてくれると。
はじめてNmazuに挑戦しまた
nknmzrc実行後
http:// ~/namazu.cgiにアクセスするとブラウザが真っ白
・・・
どこで間違っているのでしょう。
ヒントください
OS FreeBSD portsから導入
ブラウザ winXP IE
> ヒントください こっちのセリフだ
2006-03-12: Namazu 2.0.16 を公開 * セキュリティフィックスリリース Directory traversal 問題を修正 * 空白を含むファイル名の文書に対応 * NTFS のアクセス権で読み込み許可がないものは処理をスキップするように変更
>>139 インデックスが読み込めていないときにそうなった
まずnamazuで結果が出てくるか確認しろ
次にnamazurcの中身を確認しろ
>>142 nknmzrc実行後、沢山ファイルが作成された
取り合えず、動作しなくてもいいから表示してほしい・・・
作成されたファイルの中身を見ようとしたら何も表示されない
もしかしてファイル名だけ作成された?
まず"namazu (適当なキーワード)" で検索結果がでる? 出なければ~/.namazurcか/etc/namazurcでのインデックスのパスが違う
ports@FreeBSDのnamazu2が更新そぞろなも。
Emacsでnamazu.elを使用しているのですが、 出力結果をutf-8にしたいのですが、どの辺をいじれば可能でしょうか
奈辺
148 :
名無しさん@お腹いっぱい。 :2006/04/25(火) 09:19:38
なまずでサイズの小さく、検索の早く、漏れのないインデックスの作り方。 なまずにすべての作業を任せずに文字コード変換、Kakasiをあらかじめ 自分でやっておく。 フィルタも使わない。 自分で確実にテキストに変換できたことを確認してからなまずに渡す。 インデックスに登録しないような一語の単語や記号などをあらかじめ削除する。 これでOk>
>>148 専用のスクリプトを用意して cron とかで作成させると
効果的なんだろうか?
150 :
名無しさん@お腹いっぱい。 :2006/04/27(木) 02:24:29
>>149 nkfの最新版(それ以前もたぶん)はUTF-8の文字コードを誤認する。
これをすべてNAMAZUに任せると当然、検索できないindexが作成される。
丹誠込めて念入りにindexを作ることが重要だ。ちゃんと変換できてるとか目で見て。
>>150 ああ、文字コードはそうかもね。
で、どうやって
>>148 みたいなフィルタの結果をなまずに渡すの?
$ フィルタスクリプト | mknmz とか?
152 :
名無しさん@お腹いっぱい。 :2006/04/27(木) 05:50:57
ふつうにテキストで固定してindexを作成する。オプションの設定。 なまずは自動判別するからpdfでもhtmlでも中身がテキストなら そうなるけどテキストに固定した方が早い。
153 :
名無しさん@お腹いっぱい。 :2006/04/27(木) 06:07:34
>>151 たとえば10000ファイルあったとしたら
構造、拡張子を保ったまますべてのファイルをEUCコードに変換する。
そしてまたすべてのファイルを分かち書きする(-wオプション)。
154 :
名無しさん@お腹いっぱい。 :2006/04/28(金) 16:43:24
UTF-8を誤認することは間違いないのだがどれがUTF-8かを見つけるのが苦労する。
155 :
名無しさん@お腹いっぱい。 :2006/05/03(水) 19:52:08
データだけ他サーバーに置くことは出来ますか? あと複数のindexを検索するにはどうしたらいいですか。
データだけ他サーバー =>できる。 複数のindexを検索する =>マニュアル夜目。
マニュアル夜目 =>断る。
158 :
名無しさん@お腹いっぱい。 :2006/05/06(土) 23:36:46
>>156 でも動作鈍いんですよね?
無料のとくつーにデータ全部おくことにします。
fc2にデータおいて広告なし無料cgi可のページから検索したかったんですけど。
nfsdとか動いてないとダメなんじゃないのか?
いや、『データ』だけ他のサーバにおくのはかんたんでしょ。読み出せないけど。
161 :
名無しさん@お腹いっぱい。 :2006/06/01(木) 17:13:27
少し困っていることがあるので,教えてください. Namazuのログで,検索ワードにヒットした文書ごとの 検索ワードの出現回数TFを出力できたりしますでしょうか? ご教示お願いします. また,タイトル<title>にその検索ワードが使われていたかどうか などもログ出力できると助かるので,そういうことができるか もお教えください.
162 :
名無しさん@お腹いっぱい。 :2006/06/01(木) 21:00:39
あげ
163 :
名無しさん@お腹いっぱい。 :2006/06/05(月) 11:05:16
age
165 :
名無しさん@お腹いっぱい。 :2006/07/25(火) 23:24:19
検索キーワードのログを見たいのですが、設定ファイルを Logging on にするとどこにログが保存されているのでしょうか? また、ログの保存場所を指定するにはどのようにしたらよいでしょうか?
NMZ.slogに保存されます。場所はたぶん変えられないかな。
167 :
名無しさん@お腹いっぱい。 :2006/07/26(水) 15:46:23
Estraier、NAMAZU、msearch でデフォルトの設定で、 インデックスの作成時の負荷がかかる順に並べるとどうなりますか?
msearch は知らないけど、 HyperEstraier は Namazu より軽いと思う。
169 :
名無しさん@お腹いっぱい。 :2006/07/26(水) 20:30:41
namazuって重いんですね
重い要因は * Perlで書かれている * File::Findによるディレクトリ走査 * File::MMagicによるコンテンツの種別確認 * DB書き込み速度がPerlのhashに依存 このへんかなあ。
171 :
名無しさん@お腹いっぱい。 :2006/07/27(木) 11:08:12
msearchもperlだよ。 NAMAZUよりmsearchのが軽いのかな? HyperEstraier はよく知らんけど何で書かれてるの?
msearchって、仕組みを知って爆笑してしまったぜ。
中でハムスターが走ってるんだよな
174 :
名無しさん@お腹いっぱい。 :2006/07/27(木) 15:41:28
175 :
名無しさん@お腹いっぱい。 :2006/07/28(金) 17:32:38
namazuって、検索結果を重要度が高い順に並べたりしてくれる ような機能ってあるっけ?
176 :
名無しさん@お腹いっぱい。 :2006/07/29(土) 16:43:59
>>175 重要度は分からんが、ポイント機能ならあるぞ
177 :
名無しさん@お腹いっぱい。 :2006/07/31(月) 12:58:34
最近では、EstraierとNAMAZUどっちが人気?
178 :
名無しさん@お腹いっぱい。 :2006/08/22(火) 13:39:59
Namazuのようにインデクシングの際に形態素解析を用いている 検索エンジンと、その他、形態素解析を用いない検索エンジンとは インデックス作成の時間以外でどのような違いがあるのでしょうか?
>>177 Google Trendsでも使ってしらべれ。
>>179 検索時の精度。すくなくとも再現率(recall)はn-gramのほうが高い。
180 :
名無しさん@お腹いっぱい。: :2006/08/27(日) 13:38:59
namazuでPDFファイルを検索し、概要だけであればhtmlで、 全文を見るのであれば、PDFで見るというふうにしたいのですが、 どうすればよいでしょうか?概要のhtmlは作ってあるのですが、ど うすれば検索時にhtmlとPDFを選択できるのかなぁと思いまして。 よろしければ、お知恵をお貸しください。
NMZ.result.* に概要のHTMLのURIを追加すればOK。 概要のHTMLのURIを${uri].htmlにして、その場所に概要のHTMLを格納するのが 楽そうだ。
182 :
名無しさん@お腹いっぱい。: :2006/08/27(日) 14:13:20
>181 参考にさせていただきます。ご回答ありがとうございました。
183 :
名無しさん@お腹いっぱい。 :2006/09/21(木) 16:53:43
NMZ.* ファイルの仕様
http://www.namazu.org/doc/nmz.html.ja 上記を読んでもよく分からなかったのですが、
結局検索エンジン (namazu.exe)はどういう手順で
検索クエリから目的の文書を探し出すの?
NMZ.i には単語情報はないんだよね?
1.まずNMZ.iiで検索文字列から算出したハッシュ値をキーにして
NMZ.iのレコード番号を引く
2.NMZ.i の該当レコード番号から文書IDを引っ張ってくる
文書IDと対象ファイルの対応表はどこにあるのかなぁ?(・~・)ウーム
お~、それ、わたしも首をひねったよ。
バージョン1.xのときはNMZ.f とNMZ.fi というファイルがあって 各ファイルの情報を記録していた。 2.xからは NMZ.field.{subject,from,date,message-id,...} NMZ.field.{subject,from,date,message-id,...}.i の2つのファイルがその代わりをしている。 行番号=文書IDとなっている。
NMZ.wが単語表で、NMZ.wiがそのインデックス(各単語の先頭のオフセット値が 入っている)。 NMZ.wはコード順にソートされているので、NMZ.wiとNMZ.wをバイナリサーチ すれば該当するNMZ.wiのファイルの位置から単語IDが求まる。 まあ最悪mknmzとlibnamazu.cあたりをみればわかるよ。
187 :
名無しさん@お腹いっぱい :2006/09/26(火) 09:15:59
Namazu(最新版)をWindows XPで使いたいのですが、カスタマイズを行う 場合は、バイナリではなく、ソースコードからインストールしなければ ならないでしょうか?
カスタマイズする内容によるが、普通いらない。 必要になるのはソースコードレベルで埋め込まれている出力を いじるときぐらい。 それもほとんどはgettext化されてるので、ja.poだけいじって差し替えれば 済む話だし。
"ペイジ" は勘弁して欲しい。直したけど。
ぱげ
三四郎ファンなんだろ
ペイイチ?
195 :
(^-^) ◆MONSOON/qo :2006/10/08(日) 05:27:21
インディックス作成時に読み込む文字種を正規表現で指定できますか? 記号は除外するとかです
mknmz -K 文字列処理: -E, --no-edge-symbol 単語の両端の記号は削除する -G, --no-okurigana 送り仮名を削除する -H, --no-hiragana 平仮名のみの単語は登録しない -K, --no-symbol 記号をすべて削除する あとはソース書き換えかな
197 :
(^-^) ◆MONSOON/qo :2006/10/08(日) 11:58:48
198 :
名無しさん@お腹いっぱい。 :2006/10/15(日) 10:14:17
NamazuをCGI(localhost)で利用しているのですが、検索結果と
して表示されたファイルが開けません。よろしければ、お教え
願えないでしょうか?
検索結果のファイルを選択
Forbidden
You don't have permission to access
/C|/a/b/c/d/f/soturon.html on this server.
------------------------------------------------------
Apache/2.0.55 (Win32) PHP/5.0.5 Server at localhost Port 80
という表示になります。
各種設定はNamazu2.014のインストーラのデフォルトです。
.namazurc の Replace で正しい URI に書き換えれば良いという話なのです
がどうにもうまくいかなくて。。。
索対象のファイルのpath
C:/a/b/c/d/1/ファイル
C:/a/b/c/d/2/ファイル
C:/a/b/c/d/3/ファイル
という様にファイルを格納しています。
そして、CGIはローカルホストで動かしているのですが、
http:// 以下はどのように指定すれば良いのでしょうか?
httpd.conf に書いた <Directory> ディレクティブ Alias ディレクティブ ぐらいは示さないとコメントのしようがないよ
>>198 >>NamazuをCGI(localhost)で利用(win32)
多分だけど C|このせいだと思う。昔はまった。
<a harf=c|となってると見れないはず
ブラウザによるけど
lynx
では個別にルール指定できてC|/ C:と置換指定。
なんでもlynxが内部で指定置換してくれる。
だからオリジナルは弄ず。w3m あたりも平気
firefox,oprea,IE系は無理だった気が...
なんか慣行らしいけど|。GUIのブラウザだと無理?かも??
namazuの方がC|じゃなくてC:/と吐いてくれないと。パスを。昔
考えたのは適当にsed噛ますとかして置換ちゃえばとか思った
が...namazu -hで吐かせてるからsedでフィルタすれば...と
テキストブラウザで使えるしそのまま...圧縮したまま使えるか
ら。普通のブラウザだと圧縮したまま動かないんで...
公開しないし個人で使う分には書換ちゃっていいと思うけど、セ
キュリティ上よくないのかね?
cgi?どこで吐いてるのかわかんないけど|を/に変えるべく追って
弄らないといけないと思う。winの代表的な各種ブラウザで見た
いなら
>そして、CGIはローカルホストで動かしているのですが、
http:// 設定を晒してくれ
203 :
名無しさん@お腹いっぱい。 :2006/10/18(水) 01:14:49
>198です。 インデックス作成のオプション指定に気をつけ、きちんとドキュメントルート を確認の上、.namazurcのReplaceを設定したら無事にできました。 ありがとうございました。
204 :
名無しさん@お腹いっぱい。 :2006/10/18(水) 19:08:09
UNIX板ですが、話題がNamazuなので。。。 以下について、どなたかご教示願えませんか? Windows XPでNamazuを利用しているのですが、これからPHP(5.0) でNamazuを使うために、Namazuモジュール(php-namazu-2.3.1) をインストールしたいと考えています。 調べた限りでは、現在はPECLもCVSも利用できない(Namazuモジュール) ということでした。Windowsでこのモジュールをインストールするにはど のような手順を踏めばよいのでしょうか? それと、塚田卓也さんという方がNamazu関数をWindows版PHPで も使えるように開発された、モジュール「php4_namazu-3.0.0PHP4.3.x 」があるそうですが、これは5.0でも使えたりするのでしょうか?
205 :
名無しさん@お腹いっぱい。 :2006/10/18(水) 20:55:13
なんでナマズってこんなに遅いの?
バンドウイルカ
209 :
名無しさん@お腹いっぱい。 :2006/10/18(水) 23:49:19
いや、[PHP4---]というモジュール名から見るに、多分使えないだろう なぁと思って、試してはいません。ただ、使えるか知っている方がいた ら、その是非を教えて欲しいなぁと思いまして。 もう1つの、WindowsへのNamazuモジュールのインストールのほうは自分 でもそれなりに調べたりしましたが、どうも分からなかったもので。。。
使えないと思うならPHPやめてPerlにしておけ
使えない。 はい、この話題は終了。
212 :
名無しさん@お腹いっぱい。 :2006/11/13(月) 20:52:00
namazurcってmknmzしたときには適用されないんですか? replace使いたいんですが…
214 :
名無しさん@お腹いっぱい。 :2006/12/22(金) 16:04:17
namazuの検索結果をEUC-JPで出力させているのですが、Shift_JISで書かれた ファイルの内容がそのままShift_JISで出力されてしまうため、検索結果が文 字化けしてしまいます。何か設定が必要なんでしょうか。
tp://www.ki.nu/software/namazu/tutorial/make.html#PERL_MODULEで namazu 1.9.12 以降では Chasen2 にだけ対応している。 とありますが、kakasiは使用できないということでしょうか?
検索結果にキーワードが最初にファイルの何行目に登場するか、の情報って取得できますか? google検索エンジンみたいに、キーワードのヒットした前後の文章を結果一覧に出したいのですが・・・
Namazu の ML はなぜ iso-2022-jp でも Content-Transfer-Encoding: 8bit で送ってくるんだろう。なんか気持ち悪いなあ。
僕はテンプルウエストが気持ち悪いよ。
Linuxにnamazu-2.0.16をインストールして、 インデックスの作成とNamazuコマンドでの検索が出来るようになったのですが 検索対象はファイルの中身だけで、ファイル名は検索外にする事は可能でしょうか? index.htmlを検索しても表示されない、でもindex.htmlの中身に書いてある文章で 検索を掛けると表示されるようにしたいのですが・・・
>>221 mknmz の namazu_core というサブルーチンに
$content .= "\n\n$filename\n\n"; # add filename
という行がある
これを削ってインデックスを作り直す
>>222 真にありがとうございます。上手く行きました。
ただ"index.html"だと表示されないようになったのですが、"index"で検索すると表示されてしまいます。
これも表示されないようにする方法はありますでしょうか?何度も質問して申し訳ありません
224 :
223 :2007/01/04(木) 21:18:12
自己解決しました 本当にありがとうございました
スレ違いかもしれませんが、 自分がよく利用するウェブサイトの一部のコンテンツをNamazuで検索可能にしたいの ですが(Google等では何故かうまく出てこないので)、 その場合はウェブサイトの必要なコンテンツをローカルにダウンロードして、 それをNamazuにかけるわけですよね? ウェブサイトのコンテンツをダウンロードするのにお勧めのソフトはありますか?
wget >> 225
wwwoffle+Namazuという組合せはどうか。 squid cacheも対応フィルタがどこかにあったような。
風博士 + Hyper Estraier とか。
229 :
名無しさん@お腹いっぱい。 :2007/02/02(金) 19:26:32
namazu 2.0.17 release!!
231 :
名無しさん@お腹いっぱい。 :2007/07/05(木) 13:53:45
ag
232 :
名無しさん@お腹いっぱい。 :2007/10/09(火) 03:41:55
EmphasisTags "<strong class=\"keyword\">" "</strong>" みたいに設定してキーワードをハイライトさせているのですが、 キーワードの出現位置が検索結果の本文表示文字数のリミットと 被る場合にタグを閉じてくれず、次の行から真っ赤っかになってしまいます。 回避する方法ってあるのでしょうか?
233 :
名無しさん@お腹いっぱい。 :2007/10/10(水) 16:05:50
ダブルクオーテーション内の連続した文字 "、狼8、" で検索かけたいのだがノイズ入りまくり /、狼8、/ も試したが今度は見つからないとか言われた 勝手に要素に分割するなああああ
235 :
名無しさん@お腹いっぱい。 :2007/12/14(金) 21:25:55
mknmz -CでCoding System: eucってでるんだけどsjisにするにはどこの設定を弄れば良いですか?
Cording Systemの意味わかってないんじゃない? 検索結果をSJISにしたいんだったら .namazurcでShift_JISに設定すればいいだけだし。 ちなみにNamazuのインデックス内部はeuc。
237 :
235 :2007/12/14(金) 22:33:23
>>236 なるほどありがとうございます
Namazuのインデックス内部はeuc。
ということはインデックスさせるページはEUCで記述しないと駄目なんですか?
239 :
235 :2007/12/14(金) 22:41:36
>>238 むむむ・・
sjisで書いたページをmknmz -kでインデックス作ると
NMZ.wの中が所々文字化けるんですよ。。。
何かアドバイスお願いします。
# mknmz -C
わかち書き: /usr/local/bin/kakasi -isjis -osjis -w
メッセージの言語: ja_JP.SJIS
言語: ja_JP.SJIS
文字コード: euc
mknmzする前にsetenv LANG ja_JP.SJISしてます
-i -o については何も疑問に感じないのかね。
/usr/local/bin/kakasi -ieuc -oeuc -w に戻せばいいよ kakasiに渡される前にeucに変換されているのですよ。
242 :
235 :2007/12/18(火) 10:46:31
>>229 激しく亀レスだが、日付ソート(新しい順)の結果が
スコア順のソートと同じ結果になっている気がするんだが……。
244 :
名無しさん@お腹いっぱい。 :2008/02/06(水) 03:00:26
共有鯖でインスコしたいのですがsshやtelnet以外でインスコする方法ありませんか? 鯖が対応してなくて困ってます。
それ意味不明だし。
247 :
名無しさん@お腹いっぱい。 :2008/02/21(木) 21:40:38
新しいバージョンのnamazuだけど、namazu.cgiがnamazurc読み込んでないな。 なんかバージョンアップのたびに質が落ちてる。
248 :
名無しさん@お腹いっぱい。 :2008/02/21(木) 21:49:47
うーん…ベストを尽くせ。
249 :
名無しさん@お腹いっぱい。 :2008/02/22(金) 01:52:53
ナマズ作り直してくれねーかなあ。バカスカメモリ食いやがって。このへたくそが。
それを必要な人がそれをやるしかないんだよ。 いわゆる言い出しっぺの法則 ――言い出しっぺがやらなければ誰もやらない―― だね。
252 :
名無しさん@お腹いっぱい。 :2008/02/28(木) 13:15:05
なんでこれ環境変数と設定ファイルで同一の設定値を設定しないといけないんだ? 混乱するだけだと思うんだが。 世の中からこういうバカがいなくなればいいなあ。
254 :
名無しさん@お腹いっぱい。 :2008/03/03(月) 03:31:23
Namazu 2.0.18 リリース age
257 :
名無しさん@お腹いっぱい。 :2008/04/21(月) 21:18:16
windows環境でのNamazuでofficeを入れない環境で office文書を検索対象に含めるには何のソフトが有効ですか? Microsoft Office Viewerを入れたら可能ですか? また、zipなどの圧縮ファイル名を検索対象にするにはどうしたらいいでしょう? よろしくおねがいします
sub status() {
return 'no' if ($English::OSNAME =~ /^(?:MSWin32|os2)$/i);
# Only LHa for UNIX.
$lhapath = util::checkcmd('lha');
とかあるからwinは無理っぽいですね。。。
http://log.counterghost.net/20040417.html ↑持っている人どこかに上げてくれないだろうか・・・
WaybackMachine
IA探したけどなかったんだよ
264 :
名無しさん@お腹いっぱい。 :2008/09/19(金) 01:28:40
質問です。 WindowsXP + NTEmacs22.2 + Gnus の環境で Namazu を使っていますが、 Fedora9 + Emacs23 + Gnus で同じようにインストールした Namazu だと 「山田」のような固有名詞でも検索出来ますが、Winの場合だと同じ名前 で検索に引っかかりません。 (その名前が含まれたメールは存在してます。) 一般的な名詞だとどちらも同じように検索できてます。 環境としては、Win は ja_JP.SJIS で、Fedora9 は ja_JP.utf8 です。 両方共 Kakasi を使ってます。 何か気づいた点などありましたら教えてください。
265 :
名無しさん@お腹いっぱい。 :2008/10/17(金) 19:17:44
すみません。教えてください test.tgzという1GBほどのファイルがあった場合に、 中身のについてのindex作成を行わずに ファイルの名前とパスのみをindexに残したいのですが、 どのように設定すればよいでしょうか? たとえばtest.tgzをtgzで検索にひっかけるなど、 ファイル名だけでも検索に引っかかるようにしたいのですが 可能でしょうか?
266 :
名無しさん@お腹いっぱい。 :2009/08/29(土) 11:16:19
64bit Linuxマシン(Red Hat Linux ES5)でnamazuをインストールしようとしますと、 Text/ChaSen/ChaSen.so \ -L/usr/local/lib -lchasen \ /usr/bin/ld: /usr/local/lib/libchasen.a(chalib.o): relocation R_X86_64_32 against `a local symbol' can not be used when making a shared object; recompile with -fPIC /usr/local/lib/libchasen.a: could not read symbols: Bad value collect2: ld はステータス 1 で終了しました make: *** [blib/arch/auto/Text/ChaSen/ChaSen.so] エラー 1 というエラーがでます。 どのように対処したらよろしいでしょうか? GOOGLE検索してもなかなか解決策が出てきません。 よろしくお願いします。
メッセージに recompile with -fPIC と言っているから、それを試みる。
rpmないの?
269 :
名無しさん@お腹いっぱい。 :2009/08/29(土) 15:02:28
>>267 recompile with -fPIC
というのはどういうふうに試せばいいのでしょうか?
これも検索したんですが、よくわかりません。。
>>268 rpmはでていないようです。さがしてみたんですが。。
270 :
269 :2009/08/29(土) 15:06:27
>>270 茶筅のライブラリ /usr/local/lib/libchasen.a(chalib.o) が読み込めないと言って居るんだから
ライブラリをシステムに合わせて構築し直せ。
272 :
269 :2009/08/29(土) 16:11:36
>>271 すみません、もう少しヒントをもらえますか?
どのようにしてライブラリを構築しなおすといいのでしょうか?
自分がやったのは、
$perl -fPIC Makefile.PL
ですが、それもエラーがでました。このへん詳しくないので。。
273 :
267 :2009/08/29(土) 17:03:34
>>269 はじめのカキコのメッセージは、namazu のコンパイルオプション云々
じゃなくて、namazu をビルドするときに使おうとしているchasen のライブラリが
変だよ、といってるの。リンクに失敗しているんで、libchasen を -fPICという
のオプション付けてコンパイル (gcc) してくれたら直るとおもうよ、と言っているの.。
察するに、-fPIC オプションは実際には不要で、単に、chasen のソースを
とってきて、./configure; make; sudo make install ; sudo ldconfig とやれば
済みそうな気もするが。
276 :
269 :2009/08/30(日) 09:45:59
>>273 様
>>274 様
ありがとうございます。
chasen自体は、
$ chasen
EOS
テスト
テスト テスト テスト 名詞-サ変接続
のように動いています。
ただ、 namazuで使う perl moduleの
Text::chasen がうまく入ってくれません。
chasen はchasen-2.4.4を使っています。これが最新のようです。
chasenのコンパイル時のMakefileにCFLAGに-fPIC をつけてもうまくいきません。。
もし何か分かりましたら、よろしくお願いいたします。
277 :
269 :2009/08/30(日) 09:54:18
64bitマシンがだめなのでしょうか? 32bitのときは問題なく前は入ったのですが。。 64bitでnamazuはあきらめたほうがいいということなのでしょうか?
# 64bitでnamazu 64bit マシンなら、chasen のライブラリは、/usr/lib じゃなくて /usr/lib64 のほうに行っていて、namazu の Makefile がそれに 適切に対応していない可能性がある。
280 :
名無しさん@お腹いっぱい。 :2009/08/31(月) 19:35:35
> >>適切に対応していない可能性がある。 > /usr/lib64にはlibchasen系は入っていなかったです。/usr/libに入っています。 「64bit版のライブラリは /usr/lib64 に置く必要があるかも?」って話なんだけど。
282 :
名無しさん@お腹いっぱい。 :2009/09/03(木) 18:01:17
mknmzで大規模データを一日かけて実施していたところ、 NMZ.lock2 ファイルを発見しました このインデックスは他のプロセスによって更新されている可能性があります というエラーがでました。おそらく前回、途中でmknmzをやめ、indexファイル群 を削除せずに再度mknmzを実施したからだと思います。 仕方ないので、このlock2ファイルを削除し、 mknmz -Y で差分更新をしようと思うのですが、前回エラーで中断したところから、うまく 再開できますか? よろしくお願いいたします。
283 :
名無しさん@お腹いっぱい。 :2009/09/05(土) 08:26:43
280です。別の64bitマシンを借りて、インストールをし直してみたところ、インストールはうまく いったのですが、別の問題が起きています。。 Text::Chasenの64bitマシンへのインストールでつまずいています。 以下のように、Text::Chasenのインストール自体には成功しているように 見えるのですが、perlからよびだせていないようです。 検索して、LIBS lstdc++ chasenなどを、Makefile.PLに足したりはしているのですが、 それでもうまくいっていません。 $ sudo make install Files found in blib/arch: installing files in blib/lib into architecture dependent library tree Writing /usr/lib64/perl5/site_perl/5.8.8/x86_64-linux-thread-multi/auto/Text/ChaSen/.packlist Appending installation info to /usr/lib64/perl5/5.8.8/x86_64-linux-thread-multi/perllocal.pod $ perl -MText::ChaSen -e '' Can't load '/usr/lib64/perl5/site_perl/5.8.8/x86_64-linux-thread-multi/auto/Text/ChaSen/ChaSen.so' for module Text::ChaSen: libchasen.so.2: 共有オブジェクトファイルを開けません: そのようなファイルやディレクトリはありません at /usr/lib64/perl5/5.8.8/x86_64-linux-thread-multi/DynaLoader.pm line 230. at -e line 0 Compilation failed in require. BEGIN failed--compilation aborted. lddをすると以下のようになります。libchasen.so.2のある場所がおかしいのでしょうか? どうすればいいかわからないので、何かアドバイスをいただけないでしょうか? $ ldd /usr/local/bin/chasen libchasen.so.2 => /usr/local/lib/libchasen.so.2 (0x00002aaaaaaad000) libstdc++.so.6 => /usr/lib64/libstdc++.so.6 (0x00000032afc00000) libm.so.6 => /lib64/libm.so.6 (0x00000032a9c00000) libgcc_s.so.1 => /lib64/libgcc_s.so.1 (0x00000032af400000) libc.so.6 => /lib64/libc.so.6 (0x00000032a9800000) /lib64/ld-linux-x86-64.so.2 (0x00000032a8800000) よろしくお願いします。
Text::ChaSen をビルドする前に、Makefile.PL のなかのLIBS指定、 'LIBS' => ['-L/usr/local/lib -lchasen' みたくしてる?
285 :
名無しさん@お腹いっぱい。 :2009/09/08(火) 20:31:02
namazuでmknmzする際の最大メモリ使用量が32bitマシンでは、4GBでしょうか? それだと足りなくて、 Out of memory! NMZ.lock2 ファイルを発見しました となる場合はどうすればよいでしょうか?
だれかNamazuを近代化補修しろよ。
289 :
名無しさん@お腹いっぱい。 :2010/04/22(木) 20:07:42
スレがうまく読み込めない…
mknmz + pdftotext で PDF ファイルをインデックス化してるんだけど、 100MBを超える PDF だと、out of memory のエラーが出る。 mknmzrc の記述はチェック済み ($FILE_SIZE_MAX, $TEXT_SIZE_MAX, $ON_MEMORY_MAX)。 マシンのメモリは 4G 積んでるので、実際のメモリ不足ではないと思う。 ご存知の方、よろしく。m(_ _)m 環境:Namazu for Windows (ver. 20.0.20) on WinXP SP3 Active Perl 5.8.9
>>291 以前、某パッケージのマニュアルで発生した。
pdfsplit.pl でページ単位に分解したら上手くいった。
# つ~か、そのサイズのpdfって数百ページないか?
# ページに分解して処理しないと面倒だと思う。
294 :
名無しさん@お腹いっぱい。 :2011/07/09(土) 20:40:20.11
>>293 File::MMagicでメモリを大量に消費しているのが原因っぽい。
-tを使うとうまくいくかも。
295 :
名無しさん@お腹いっぱい。 :2011/09/18(日) 16:06:29.49
サーバ中の文書を検索したくて入れてみました。 入れてみて気付いたのですが、EUC-JPにしか対応していないようです。 検索対象の文書は、UTF-8とEUCJPとSJISのファイルが混在しています。 内部的に、エンコードを自動的に検出して変換してインデックス化、 という処理は行われているのでしょうか? それとも、すべてEUC-JPの文書という前提で動作しているのでしょうか?
試しに検索してみたらできました
ver3は?
298 :
名無しさん@お腹いっぱい。 :2014/01/30(木) 20:35:11.93