いか焼きそば
namazuはカスタマイズがやりにくいのが嫌いだ。
作り直しきぼん。
5 :
名無しさん@ディストリいっぱい:2001/07/05(木) 10:22 ID:wD33sdDI
100%?(w
すご・・・
7 :
でり:2001/07/06(金) 02:36 ID:???
>>5 ん、それは負荷テストに参加してくれというお誘いかな (w
8 :
名無しさん@お腹いっぱい。:2001/07/09(月) 00:57 ID:muVIdrhs
9 :
名無しさん@お腹いっぱい。:2001/07/25(水) 04:10 ID:OjwNZy2I
10 :
名無しさん@お腹いっぱい。:2001/07/25(水) 18:41 ID:smjKvwXM
nice で優先度落とせばいいじゃん。
11 :
名無しさん@お腹いっぱい。:2001/08/01(水) 18:06 ID:ix6uIOfU
windowsだし。
WIN2Kに入ってるインデックスサービスってどーなん?
13 :
名無しさん@お腹いっぱい。:2001/08/04(土) 01:50 ID:aNwZ.JX.
14 :
名無しさん@お腹いっぱい。:2001/08/10(金) 14:53 ID:A94SLV6Y
2.0.6 release age
15 :
初心者:2001/08/11(土) 11:52 ID:???
NAMAZUのインデックスにはたくさんファイルがありますけど、
いらないファイル(テンプレート等)も多いと思います。
結局必ず必要なファイルってどれなんですか?
>>15 んー俺もそう言えばわからん、
もともと、俺にとって、このNamazu初めの頃難しすぎた。
その前に、うなぎ食いたいんだよね。腹減ってきた・・・
17 :
NAMANAMA:2001/08/12(日) 01:02 ID:TrSLsWVY
namazu2.0.5なんだけど、共有サーバにインストールしたんですよ。
でも、さすがにインデックスの作成は共有サーバでやるのも申し訳ないので、ローカルで作ってあげてます。
そういう場合って、namazu.cgi, .namazurc, Template, Index以外は全部テデリっても問題ないですかね?
それと、やっぱ、インデックスをcrontabで定期的に共有サーバで作ったら迷惑でしょうか?
マジレスお願いします。
18 :
むぎ茶 :2001/08/12(日) 01:08 ID:???
ばれなければ問題無い。
┐(´ー`)┌
┏━━━━━━━━━┓
┃('Д')y ─┛~~ ┃
┃むぎ茶 ┃
┃
[email protected] ┃
┗━━━━━━━━━┛
>>17 負荷はかからないけど、ローカルは、めんどくせぇ(涙
20 :
名無しさん@お腹いっぱい。:2001/08/12(日) 17:40 ID:KkZ3OuWw
Namazu.pm使ってperlでCGIを作りたいんですが…
Namazu.pmってあまり人気がないんですか?
参考スクリプト(書籍・サイト)がなかなか見つからなくって
何かありませんか?
>>20 ない、と思う。
まあしかし機能はシンプルなことこのうえないので、
利用にあたってそんなに難しいこともないと思うけど。
Ruby 用のモジュール rbnamazu.rb の方機能は多そうだ。
22 :
名無しさん@お腹いっぱい。:01/08/28 05:33 ID:aw.N/Mco
お奨め本おしえte
24 :
名無しさん@お腹いっぱい。:01/08/29 00:17 ID:TsF5AU7k
26 :
名無しさん@お腹いっぱい。:01/08/30 12:01 ID:8CpRLBMo
namazaってCGIやSSIで出力する内容も検索するんですか?
namazaは知りませんが
Namazuで検索できるのは「ファイル」だけのようです。
28 :
名無しさん@お腹いっぱい。:01/08/30 23:03 ID:YzLgVA/.
はやくpostgresqlのテーブルの中身を検索できるようになっておくれ。
29 :
名無しさん@お腹いっぱい。:01/09/10 22:31 ID:2EURowzo
みみずんか(藁
31 :
名無しさん@お腹いっぱい。:01/09/11 12:11 ID:liJMw8bE
XMLの検索ってどうなの?
33 :
名無しさん@お腹いっぱい。:01/09/17 18:18 ID:dMB6uEtM
>>28 Namazuシステムの構築と活用, ソフトバンク
やっぱこれじゃない?
34 :
名無しさん@お腹いっぱい。:01/09/17 18:21 ID:FURvtMLg
>>28 PostgreSQLスレッドで誰かやってなかったっけ?
36 :
名無しさん@お腹いっぱい。:01/09/20 17:20 ID:TUOJrHAw
PHPファイルを検索できるようにするにはどうすれば良いんですか?
ソースがまんま出ちゃうんですけど。
37 :
名無しさん@お腹いっぱい。:01/09/26 22:51 ID:9178Yr9s
>>36 PHP の出力を検索させたいのなら出力した結果をファイルにして
それにインデックスをかけるとかしないと無理。
38 :
36:01/09/27 00:11 ID:IzjiFxn2
>>37 「出力した結果をファイルにする」ってのは、phpでですか?
なんかそこら辺のこと詳しく書いてあるサイトが無いんで…。
Namazuシステムの構築本に書いてないかなー
>>38 php のことよく知らないけど
php scriptname.php ってやったら出力されないかな?
ところで俺も質問なんだけど、namazu.cgi って検索後は
ファイルへのリンクを
http://hostname/hogehogeで出力するけど、
こいつを file://hogehoge にする方法って無い?
windows でローカルファイルの検索に使いたいんだけど WEB で
探しても見つからなかった。
40 :
名無しさん@お腹いっぱい。:01/09/27 17:20 ID:IzjiFxn2
41 :
名無しさん@お腹いっぱい。:01/09/27 22:04 ID:clsPKe1Y
コマンド版のPHPがないとダメじゃないかねえ。
>>39 はインデックス作成時に
mknmz --replace='s#^#file:///'
とかでもいけそうだけどどうよ。
42 :
39:01/10/01 05:28 ID:UjeefWpE
2chNo1(と思える)過疎板にて反応があって感動。
>>40 .namazurc で
Replace
http://localhost/ file://
と指定してみてたんだけど、どうやら無効の模様。
この部分(
http://hostname)は固定で出力してるのかな?
>>41 やってみたけどだめっぽい。
でも他にそれらしいオプションも見つからないね・・・
こういう変な事やる時は cgi 改造しか無いのか、とほほ。
pnamazu か rbnamazu に挑戦してみよう。
ところで
>>40 はうまくいったかな?
アパッチのモジュール lib_php3.so (だっけ?) しか
インストールされてない時は
>>41 の 言う通りコマンド
ラインで使えるようにしよう。手動で最初からやってみ
たこと無いので詳しい説明できなくてごめん。
43 :
40:01/10/04 19:40 ID:4sun3RUk
返事遅れてスマソ。
>> 39
うちは
Replace /C\|/docume~1/admini~1/mydocu~1/mywebs~1/
http://ark/ みたいな感じになってる。ちなみにこの行と
Lang ja_JP.SJISと書かれた行以外は全てコメントアウト
php検索はコマンドラインで使えるように設定してみます。
というかコマンドラインで使えるようにする方法すら知らないんだけど。
どこか書いてるとこ知りません? 本でも良いんですけど。
44 :
アナログから光までオッケー:01/10/05 02:03 ID:7kq.xdqk
このサイトはみなさんのインターネット環境の
スピードを計ってくれます。また、遅いと思う
人は設定を少し変えることによって無料で
スピードを早くすることができます。
お金を出す前に一度試してみては
いかがでしょうか。上がりの計測も可能です。
http://cym10262.omosiro.com/
45 :
22:01/10/05 02:47 ID:UlE8Ntsc
46 :
名無しさん@お腹いっぱい。:01/12/09 11:02 ID:eU0f+J4K
だめだ〜Out of Memory!で止まっちゃうよ〜。
一応FAQに書いてあることは試したつもりなんだが・・・。
どうも特定のファイルの時にそうなってるみたい。
なんか落ちやすい文字とか、そういうのあるんかな?
47 :
名無しさん@お腹いっぱい。:01/12/10 22:24 ID:UuNX8sYB
設定の問題かどうか
ulimit がらみだと思うけど > Out of Memory
もしくは本当にメモリ(+仮想メモリ)が足りないか。
49 :
名無しさん@お腹いっぱい。:02/01/04 06:04 ID:HxTTmUTv
use POSIX 'strftime';
print strftime "%Y%m%d\n", localtime;
こう書くと年月日が出るじゃないですか。
この日付けに7を足す事ってできます???
>49
マルチうざい
資ね!
>>49 逝って良し。
■解説■
マルチは下げ進行で微妙に煽りつつシカトします
上記例のように古典的な煽りは「逝って良し」
他にアスキーアートを使ったものなど多彩ですが、
サーバーの不可を考慮してかあまり好まれません。
やはりシンプルに「氏ね」など短文なものがベストです。
あげ
age
もう、、下げといてやれよ。。
>>54 再利用というか、もっかい盛り上がることが出来ないスレなんですか?(笑)
56 :
名無しさん@お腹いっぱい。:02/01/25 06:48 ID:YyTiWZ/9
半年で、50位か。1000までいったら感動するな。あげ
57 :
名無しさん@お腹いっぱい。:02/02/18 08:00 ID:TWCf5+1d
age
58 :
1001 Over 1000 Thread:02/02/18 10:21 ID:Qb17d1xd
このスレッドは1000を超えました。
もう書けないので、新しいスレッドを立ててくださいです。。。
59 :
名無しさん@お腹いっぱい。:02/02/19 07:42 ID:DggBq+7H
age
61 :
nobodyさん:02/03/11 21:08 ID:Jt12j7IU
namazuの検索、なんか使いにくいんだけど。。
変に文節で区切らずに、googleみたいに普通に検索してくれたら
それでいいのに。。
63 :
nobodyさん:02/03/12 07:59 ID:qMnzd5b/
>>61 これのこと?
>日本語がでたらめにわかち書きされてしまう
>{ [ 最: 1 ] [ 新: 0 ] [ 情: 0 ] [ 報: 0 ] :: 0 } のように、
>でたらめにわかち書きされることがあります。
>これは、そもそも最新情報という言葉が検索対象に含まれないことを意味します。
>検索はあきらめましょう。
それとも、インデックス作るときの分かち書きをしないでほしい、ってこと?
それって実現できるのか?
googleはユーザーにあまり意識させないだけで、分けて探してるよ
65 :
nobodyさん:02/03/19 11:29 ID:ulLvfL7+
googleわけてるかな?
日本語は解析していないように見えるけど…。
英語はスペースでわけるだけだから楽だね。
それにしてもgoogleはスペルミスの修正判断も出してくれたりすごい。
つーか20億ページを0.1秒で検索できるのが単純にすごいと思うのだが。
ローカルでほしい、、
66 :
nobodyさん:02/03/19 12:54 ID:TPtrOTqR
>>66 さん、ありがとうございます。
ほんとだ。分かち書きしてる、、
うむ、googleはちゃんと各言語ごとにチューンしてるんですね。
68 :
nobodyさん:02/03/19 15:32 ID:TPtrOTqR
逆に言えば、分かち書きエンジンの精度さえ向上させれば、
google並みのことはできるってことだよね
(もちろん、PageRank とかは抜きにして)。
いつも kakasi だけど、Chasen を使ってみようかなあ・・・。
個人で使うような件数の多寡が知れているようなシステムだったら、純粋に全件マッチ検索の方が便利だよね。
>>68 googleの肝は結果の表示順序。(pagerankもそれを支える情報の一つ)
なので、namazuに少し手を入れたぐらいではgoogle並にはならないよ。
ヒット数が少ない場合、関係ないけど。
>>70 その点は激しく同意。
ただ、分かち書きの精度を上げることで、
>>61 のやりたいことは実現できるんじゃないかな、って思った。
(´_ゝ`)フーン
73 :
ato:02/05/09 14:31 ID:8gc3nIf4
Namazu使ったPDFの全文検索でページしていとかできますか?
Namazu使ったJPGの全文検索でページしていとかできますか?
>>75 まだ、このスレが生きていたとはね
興味深い文章サンクス。
改めて深入りできない、しちゃいけない分野だと再確認したよ
77ゲットオォォォォ!!
 ̄ ̄ ̄ ̄ ̄∨ ̄ ̄ ̄ (´´
∧∧ ) (´⌒(´
⊂(゚Д゚⊂⌒`つ≡≡≡(´⌒;;;≡≡≡
 ̄ ̄ (´⌒(´⌒;;
ズザーーーーーッ
(・∀・)イイ!
79 :
nobodyさん:02/05/27 19:51 ID:LrpMVRit
80 :
nobodyさん:02/06/06 04:44 ID:jW1FwXu2
ひさしぶり!
81 :
nobodyさん:02/06/09 00:21 ID:MvwsaEnI
mp3用のフィルタって誰か書いてないかしら?
83 :
nobodyさん:02/06/20 09:39 ID:updula6F
Namazuでmp3用のフィルタ???
わからん、俺がアフォなだけか?
84 :
nobodyさん:02/06/20 12:41 ID:0pQ6ektu
>>82 ID3タグでも検索するのか?
そういうのは ふつー DB 使うだろ。
>>83-84 自分のホームヂレクトリをクロンで毎晩なめてるんだけど、
どうせなら、ID3も見てくれないかなと。
変かなぁ。
って、WEBプログラミングとは、違いますな。
スレ違いスマソ。
87 :
nobodyさん:02/06/25 01:01 ID:cgKxt6dS
>>86 なるほど、mp3 の中に埋め込まれたテキストも「文書」として扱い、
検索対象としたい、ってわけね。全然変じゃない。むしろ面白い。
やってることは google のイメージ検索みたいな感じかな。
perl でサクッと書けそうな雰囲気。
ぜひトライしてみて。
あと、Web プログラミングとは関係ないけど、
Namazu に関係あればいいと思うよ。
いや、それをWebから使えるようにすりゃWebプログラミングと
むちゃくちゃ関係あるじゃん。
> やってることは google のイメージ検索みたいな感じかな。
イメージ検索は外部から関連性を持ってくるのでちと違うような。
内部のID3だけだったらPDF検索くらいに対応するだろう。
ぜんぜんNamazuじゃなくても良さそうだけど、他と串刺し検索するなら
やっぱり便利かも。
うなぎ食べたいね。
ナマズマズー
ウマー
検索結果で表示されるファイルの先頭部分のサイズを変更できますか?
やりかたを教えて下さい。
93 :
nobodyさん:02/09/25 08:37 ID:3VOnIdJA
wget
でURLテキスト-iで、ディレクトリ作成-x
しながらページ拾ってくると、
稀にディレクトリ作成(www.aaa.xxx)されなくて
関係ないディレクトリ(www.bbb.xxx)にページを
格納してしまいます。
このままindex作るとURLリンクが関係ないところに。
どうしてだろう。困った。
94 :
nobodyさん:02/09/27 20:30 ID:7S/gcFrV
Office XPファイルは、インデキシングできないのかなぁ。
95 :
nobodyさん:02/09/28 02:50 ID:gf1ROtiY
@ノハ@
ピュー( ‘ д‘)
=〔~∪ ̄ ̄〕
=◎−−◎
96 :
名無しさん@お腹いっぱい。:02/10/07 17:04 ID:ucR8g7pl
@ハヽ@
(' д ‘)ピュー
〔~∪ ̄ ̄〕=
◎−−◎=
づかれたゾイ
97 :
名無しさん@お腹いっぱい。:02/10/07 17:05 ID:ucR8g7pl
↑車輪がずれたゾイ
98 :
nobodyさん:02/11/02 15:20 ID:Jwe6TBuD
ウマー
99 :
Windows における namazu w/chasen:02/11/03 10:47 ID:rQsphwgx
>>99 Chasen 2.0.2 は cygwin 上で問題なくコンパイルできました。
102 :
Windows における namazu w/chasen:02/11/03 14:10 ID:rQsphwgx
namazu + chasen は cygwin で 問題なく動きました。
cygwin のコアDLLのバージョンは 1.3.14-1 です。
103 :
nobodyさん:02/11/03 23:09 ID:sdt4YScv
>>99 全部cygwinでやる方法以外無いのでは?
そもそもkakasiを使う事が推奨されていて。
茶筅は結構イレギュラーな方法なわけだし。
(運用上結構問題がある)
ウマー
105 :
nobodyさん:02/12/26 00:21 ID:DUegdvZH
namazuを2chのdat形式に対応させようとしている人っていますか?
形式自体はレス1つが1行になっているだけなんだけど、<a name="hoge">をつけるのもなんか違う気がするし。
ファイル名と行数だけ教えてくればそれでよいんですが。
Namazuでやっているようなこと、ChaSenで分かち書きしてインデックス作ってcgiで検索っていうのも作りかけたけど、
車輪の再発明になりそうで中断してる。
106 :
nobodyさん:02/12/26 00:41 ID:M1+zinp+
>>105 dat からそのままインデックスを作りたいってこと?
mknmz 用のフィルタを書けばいいだけだよね。
perl だし結構簡単そうだね。
107 :
nobodyさん:02/12/26 01:19 ID:DUegdvZH
>>106 そのとおりっす。
各行の先頭に<a name="スレ番号"></a>入れて、理由は不明ですが、先頭行に適当に<html>とか入れてあげて、
mknmz --html-split -a hogohoge.dat
でインデックスは作れたし、検索もできるのは分かるのですが、
mknmzのソースのprocess_file辺りを見ると、コメントに、FIXME: Very complicated.とあるくらいなんで、めんどいなと。
html向けには分割して処理してるみたいですし。
誰か同じようなこと考えていないかなと。
108 :
nobodyさん:02/12/26 01:48 ID:M1+zinp+
109 :
nobodyさん:02/12/26 02:05 ID:DUegdvZH
110 :
nobodyさん:03/01/02 18:30 ID:cP1MLYPA
112 :
nobodyさん:03/01/03 09:29 ID:v/h8n2uJ
113 :
111:03/01/03 18:29 ID:lPX3I1sa
あーれー、レスがない。
>>113 そういうこと書くと逆効果。大体お正月で人いないし。
そうだなあ、来週の金曜までにレスが無かったら、私がレスするよ。
>>113 この板でたかだか9時間くらいで何をいってるんだか。
再来週の木曜日までにレスがなかったら俺がレスするよ。
116 :
111:03/01/04 00:23 ID:U6dtWDEb
とりあえず、それまでに、自学でなんとかできるかできないかなでの段階に、
・・・いきたいな
117 :
111:03/01/04 19:17 ID:BatkqzbV
検索にひっかからない。。。
「php namazu インデクサ」とじゃ
「php namazu シェルスクリプト」とかで検索してるんだけど、
いまいち該当しない。
検索のヒント、ください。
118 :
111:03/01/11 17:11 ID:CeP+V+mb
ショボーン
119 :
nobodyさん:03/01/11 18:22 ID:8y79ZXZ4
namazuかぁ。
ひらがなとかカタカナのもうめちゃくちゃな弱ささえ克服できればなぁ。
kakasiにひらがな単語の辞書登録さえあれば…。
もともと、そーゆープログラムではないから
AQに採用されることないけど。
120 :
山崎渉:03/01/15 13:33 ID:???
(^^)
121 :
nobodyさん:03/01/17 16:56 ID:TsHzDgv8
Googleみたいにヒットした単語の周囲の文章をサマリ表示させてほしい。
サマリは直接生成。
123 :
nobodyさん:03/01/18 07:01 ID:0IdKnMy1
ところで、ウチのプロバイダはCGI使えないんだけど、全文検索(Namazuじゃなくても可)できる方法ないですかね。
>>123 あらかじめ検索用のインデックスを作っておいて、javascriptで、〜〜〜〜
125 :
124:03/01/18 15:07 ID:???
よく考えたら、自分の所でCGI使えなくても、
CGIを使えるサーバーを借りたら、解決だった。
127 :
nobodyさん:03/01/18 22:45 ID:KC3+f7J6
>>122 自分的にもそれは必須の機能だと思うんだけどなぁ。
頭の部分だけ静的に切り出したサマリーでずらずら検索で引っ掛かってきてもあんまサマリーの意味ない。
メーリングリストみたいにタイトルが内容の要約になってる、とかならいいんだけど。
128 :
nobodyさん:03/01/21 15:04 ID:2m91wCEm
、、、すんません 教えて下さい。
Namazu 2.0.12 for Win32をWin98で使用しています。
mknmzを実行すると、下記のエラーが出てしまいます、、、
Can't locate File/MMagic.pm in @INC (@INC contains: . C:/Perl/lib C:/Perl/site/
lib .) at C:\USR\LOCAL\NAMAZU\BIN/mknmz line 34.
BEGIN failed--compilation aborted at C:namazu\bin/mknmz line 34.
お分かりになる方、いらっしゃっいましたら
ご教授ください。お願いします!
MMagic が適切なパスにないか、インストールしていない。
>129さん 早速のレス、ありがとうございます。
MMagicのインストールを行おうとすると、エラーがでるので確かにインストール
されていないようです。
namazuのパッケージに含まれてるppmは、500番台と600番台の2つなのですが
私のActivePerlのビルド番号を確認すると、804となっています、、、。
これが原因なんでしょうか?
131 :
nobodyさん:03/01/22 22:49 ID:tlaGPNPQ
kabayaki使えYO!
132 :
nobodyさん:03/01/22 22:55 ID:0SY2SNoc
「パソコンの仕組み」
http://pc1.moo.jp パソコン・インターネットの仕組み、パソコン自作・サーバー構築法について、動画や静止画を豊富に取り入れて、初心者向けに基礎から分かりやすく解説しています。
ガンガン、アクセスしてください!!
133 :
nobodyさん:03/01/22 23:06 ID:DuSjMjDY
134 :
nobodyさん:03/01/23 09:19 ID:XTkiyicl
chasen使ってる人に質問です。
やっぱりkakasiより検索精度あがりますか?
とくにひらがな単語やカタカナ単語で。
135 :
nobodyさん:03/01/24 13:46 ID:DnlSMTjH
おまいら、namazuで検索するファイル数ってどのくらいですか?
1ディレクトリで1000ファイルオーバーとかって、インデックス
作るのに問題ないっぽい?
なんか、毎日自動でインデックス作ってるんだけど、ちゃんと
インデックス作れてない(検索できない)場合が時々あるのよ。手動で
作ってやるとちゃんと動くところがまた憎らしい。
136 :
nobodyさん:03/01/24 15:43 ID:9aIuMK5X
wgetの収集でたまにぜんぜん関係ないディレクトリに
index.htmが格納されて困るんだけどなんでだろう。
ブラウザ動かしながらやるとミスするのかなぁ。
win2k
137 :
nobodyさん:03/01/25 15:38 ID:x6YUG/OM
pnamazuのほうがヒットしやすいのでしょうか?
perl版でインデックス作らないとダメなのでしょうか?
そのままのインデックスでpnamazu.cgiでとりこぼしが減るのでしょうか?
138 :
nobodyさん:03/02/05 04:47 ID:vQpd3y9f
保守
139 :
nobodyさん:03/02/05 06:56 ID:CehyN38W
140 :
nobodyさん:03/02/05 09:04 ID:LQrwCDVW
アダルトの宣伝↑
ナマズの派生で、カバヤキっていうのでたけど使ってる人いる?
141 :
nobodyさん:03/02/05 09:11 ID:JiOCwoo3
初めて Namazu 使ってみたけど、SI には使いづらい作りだな…
>>142 どこら辺が?
内容によっては、回避策や運用のテクニック教えてあげられるかも。
144 :
nobodyさん:03/02/07 03:32 ID:/4XUF2iq
MS-Access + ASP の like による全文検索と Namaz でインデックス
作成した全文検索ってどのくらいパフォーマンスが変わってくるかなー
検索対象レコード:1000、検索対象フィールド:3
各フィールド60,000文字ぐらいで考えてるんだけど、
MS-Access + ASP じゃ無理あるかな・・・
2、3秒で検索結果がでてくればいいのですが・・・
インデックスの作成自体、最近気づいた愚か者ですが、
よろしくお願いいたします m(_ _)m
145 :
nobodyさん:03/02/07 06:28 ID:KeFGYCTZ
146 :
nobodyさん:03/03/07 18:19 ID:+bpjK8Vp
UNAGI
148 :
nobodyさん:03/03/08 16:11 ID:6pWNtujS
あるファイルを処理できるフィルターが複数あるとき、
どちらを使うかはどうやって決まるのでしょうか?
149 :
山崎渉:03/03/13 17:05 ID:???
(^^)
(・∀・)イイ!
(´-`).。oO(保守……。)
152 :
山崎渉:03/04/17 12:25 ID:???
(^^)
153 :
山崎渉:03/04/20 06:08 ID:???
∧_∧
( ^^ )< ぬるぽ(^^)
うちのノートPC、2chのlog数百個程度mknmzしてると
CPU周り熱々になって九割方落ちる鬱
レン鯖レン鯖
(・∀・)
157 :
nobodyさん:03/05/18 02:04 ID:inHKtSNs
Namazuを使ってます。
ただ、データの量が多くインデックス作成に失敗する事が多々あり、
現在は分割して、インデックスを作成。
ここに追加( --no-delete オプション)しています。
(更新は週に1回でも十分なので、本当は週に1回最初からインデックスを
作り直したいのですが、時間的にも労力的に厳しいです)
質問なのですが、上記の --no-delete オプションで一部のファイルをインデックスに
追加することと逆に、なんらかの方法で「指定したファイル」のインデックスからの
削除は可能でしょうか?
158 :
nobodyさん:03/05/18 10:06 ID:OMFaVw9A
>>157 >データの量が多くインデックス作成に失敗する事が多々あり
うちではそんなこと無いなあ。まあ10万ファイル程度だけど。
データ量が多いってどのくらい?
インデックス作成失敗って、どんなメッセージが出てどんな状況になるの?
>>158 共用サーバにてインデックスを作成、Namazuを利用しています。
おおよそ、1MB前後が1回あたりのインデックス作成の限度のようです。
メッセージは「Out of Memory!」です。
ローカルのマシンでインデックスを作ってアップロードじゃだめなん?
>>160 それも考えたのですが、インデックスには当然ローカルのファイルのパスが含まれてますよね?
現在はReplaceで、サーバのパス/virtual/ID/→
http://〜の絶対パスに変更しています。
ローカル(Windowsマシン)C:\〜を絶対パス
http://〜に変更させる事ができるのでしょうか?
>>161 だって自分でやってるって書いてんじゃん。
なんだ、結局サーバのメモリ使用量制限に引っかかってるだけじゃん。
Namazu と直接関係ないじゃん。
>>161 可能。パスを書き換えて、インデックスを再構築すればいい。rfnmz だっけ?
ml の過去ログで似たような事例を見た気がする。
164 :
nobodyさん:03/05/19 12:36 ID:R1nWpNfc
NamazuってリレーショナルデータベースのIndex検索できますか?
Javaで書かれたLuceneってのはできますよ。
165 :
動画直リン:03/05/19 13:08 ID:IEVyzYan
>>162 >>163 ありがとうございます。
wget>インデックス作成>検索と3段階で相当な負荷が
サーバにかかっていたので、いつアカウントを止められるのか
心配していました。
wget>インデックス作成まで行えれば、
検索だけをサーバで行うので負荷も和らげられると思います。
167 :
nobodyさん:03/05/19 15:01 ID:hryn2RRe
168 :
bloom:03/05/19 15:08 ID:IEVyzYan
ローカルのWindowsのNamazuと、共用サーバのLinuxのNamazuのインデックスは
互換性があるのでしょうか?
170 :
nobodyさん:03/05/21 14:38 ID:zDb/UTki
age
171 :
bloom:03/05/21 15:08 ID:JZ9K0e/X
>>172 ありがとうございます。
Liunxのインストールからはじめるのは辛いですし、
cgiでインデックスを作ろうとするとすぐに落ちるので
助かりました
174 :
山崎渉:03/05/22 01:58 ID:???
━―━―━―━―━―━―━―━―━[JR山崎駅(^^)]━―━―━―━―━―━―━―━―━―
(・∀・)
176 :
山崎渉:03/05/28 17:21 ID:???
∧_∧
ピュ.ー ( ^^ ) <これからも僕を応援して下さいね(^^)。
=〔~∪ ̄ ̄〕
= ◎――◎ 山崎渉
(・∀・)
178 :
nobodyさん:03/06/18 16:39 ID:DT1VWY3V
そろそろwindowsローカルのPHPマヌアルを検索できない不具合は解決してますか?
179 :
nobodyさん:03/06/18 22:37 ID:yFwDTAK+
>そろそろwindowsローカルのPHPマヌアルを検索できない不具合は解決してますか?
PHPマヌアルにかぎらずUTF8で書いてあるページは文字化けするツー事
nkfを利用しているからじゃないかな
180 :
nobodyさん:03/06/19 00:34 ID:r/KT2iM+
nkf使ってないよ、lvでutf8対応している
181 :
nobodyさん:03/06/25 14:23 ID:77oj5Ix9
Namazuってファイルの検索に使うんですか?
全文検索できないの?
できるんだったら、指定したキーワードを含むファイルだけから全文検索するなんて使い方も可能?
また、インストールしたLinuxとかのディスクに置いてあるファイルでないと検索できないのかな?
Windowsマシン上にあるファイルもさがせたりしないんでしょーか。
いろいろ関連サイト見てみたけどそういったことは書いてなかったYo!って探し方悪いんでしょうか
182 :
nobodyさん:03/06/25 15:10 ID:vaUG6cj5
183 :
_:03/06/25 15:12 ID:???
カスケードスタイルシートって、
おいしそうですねぇ。
>>181 no
no
no
no
no
調べ方悪すぎ。namazu.orgにある文章読むだけで全て分かるのに。
186 :
181:03/06/27 00:27 ID:6z/IvjGb
187 :
???:03/06/27 19:27 ID:1V/886pX
インデックスの作成 OK → Webサーバーへのアップ OK
→キーワード入力 OK →検索している 検索結果は出るのですが
全く関係のないページばかりリストアップ。そのページソースを検索キーワード
で探してもありません。
インデックスもエラーなくできて、アップも問題なくでき、検索もできるのですが
その結果が全くあさって・・・どこに問題がありそうでしょうか???。ご意見を
お願いします。
>>187 Namazuってそんなもんだよ。
といいつつ、おれもインスコしてますが、自分では一切使わない。w
189 :
187:03/06/30 07:16 ID:???
>>188 んっ〜それにしても結果が全く関係なさ過ぎるんですよ。
インデックスがまともに出来ていないような現象です。
ただ、作業的には問題なく進んでるんですよ・・・トホホ 。・゚(/д\)゚・。
190 :
◆MiMIZUNCjA :03/07/07 03:25 ID:sv7ydGsI
なんどもインデックスの構築をしているといつのまにかめちゃくちゃな回答をされるときがあって
そういう場合は最初から作り直しますがなんなんでしょうね。
191 :
:03/07/07 03:54 ID:???
>186
たぶん回答じゃなくて、ガイジンさんなんだよ。
...no. no! no!! no!!! nohhh!!!!!! nanimochigaudesholtu!!!
って感じだと思う。
(⌒V⌒)
│ ^ ^ │<これからも僕を応援して下さいね(^^)。
⊂| |つ
(_)(_) 山崎パン
no
194 :
nobodyさん:03/10/06 00:26 ID:MvGVNeyO
なんだか自分は複数indexについてよくわかっていません。
複数indexを作る場合、
namazu.cgiと.namazurcのあるディレクトリの下に新しいディレクトリを作って分けて、.namazurcで制御すればいいんでしょうか?
今はindexファイルをnamazu.cgiと.namazurcのあるファイルと同じ階層に全部詰め込んでいます。
これだと、二つ以上のindexは作れないみたいです。
複数インデックスは、 インデックスのあるディレクトリ内のサブディレクトリ名が
そのままインデクス名になる。使う場合は、.namzurcではなくて
NMZ.head.jaで idxname="foo" とか指定してやればいい。
196 :
nobodyさん:03/10/06 06:50 ID:fxmWtj2Y
>>195 わかりやすいレスありがとうございます。
解決しました。
197 :
nobodyさん:03/11/13 08:37 ID:Tw9dU9HY
相談なんですけど、
「ホスティング依頼している鯖に namazu を入れて、メールの全文検索ができ
ないもんかな?」
という相談をうけますた。
う〜ん…………
おいらの使ったのは、RedHatだったんで、namazuはRPMでなんも考えずに
入れて、インデックス作って使ってたことはあるけど、ホス依頼してる鯖だと
root 権限なんか貰えないだろーしなぁ……
なんかいい方法ってないでしょか?
pnamazu
199 :
197:03/11/14 14:31 ID:bYphtnKK
>>198 ありがとう!提案してみるよ
って、これ、インデックス作成はローカルの環境でするのかぁ
ま、いいや。相手がなんていうか、言うだけ言ってみよう
ヒントくれてサンクス!
200 :
nobodyさん:03/12/20 12:12 ID:BT5vMVU9
特定のディレクトリのみ除外する方法は何かありますか?
>>200 特定のファイル(拡張子だけだったかも)を除外する
という設定項目があった様な記憶があるんで、
もしかしたら、それの応用でディレクトリごと無視するとかできるかも。
#具体的にどんな設定をするかは忘れた
#多分namazuの本家サイト見たらあったよ
203 :
202:04/01/02 23:13 ID:???
204 :
202:04/01/04 01:18 ID:LkXOe+SC
あ、すごいタイムラグあいてますね。。。age
205 :
z33:04/01/04 10:35 ID:???
206 :
202:04/01/05 22:28 ID:???
>>205 ありがとうございます。
全部、/?cat=★は「★.inc」としてファイルをおいてあるので、それでなんとかいきそうです。
207 :
nobodyさん:04/01/19 19:55 ID:daYuprPN
教えてもらいたいことがあるんですが
nmz.field.****
の****を増やしたいのですが、どうしたら良いでしょうか?
具体的にはmknmz時にuriを見て
wwwroot/aaa/a.html
wwwroot/bbb/b.html
nmz.field.locate ってファイルを作ると
その中に
aaa
bbb
って出力されてほしい
で検索結果でyahooのカテゴリのように
<a href="a.html">aのタイトル</a>
カテゴリ TOP>>aaa(${locate}の値)とかやりたい
まぁ検索結果の中でuri見て変換したら良いんだけど、
もうちっとスマートに処理させたいなと・・・
208 :
z33:04/01/20 22:20 ID:???
Namazuで検索サイトやろうかな。
210 :
nobodyさん:04/02/13 03:38 ID:jCzy8g3E
質問です。
2chの過去ログを検索出来るようにしていますけど
ファイル数17万程度でインデックス作成に取り組んでいるのですけど
3日経っても終わりません。。おかしいと思いこちらに来ました。
もっと処理を早くしたいのですが、、
一応何を書けばいいのかわかりませんが、
PCのスペック等を簡単にまず記します。
何か必要な設定項目を書けと言われればすぐ書きますので、、
CPU P3-1G@dual
mem 1G
namazu ver2.0.12
perl 5.6
設定ファイルの中身を弄ればいいのでしょうか。。
一応インデックス書き出しは行われ続けていますけど
遅くて遅くて、、、
何かヒント等くれる方いらっしゃいませんでしょうか、、、?
211 :
210:04/02/13 03:45 ID:jCzy8g3E
OS windows2000 sp3
KAKASI使用
mknmzrc設定
$ON_MEMORY_MAX = 5000000;
$FILE_SIZE_MAX = 10000000;
$TEXT_SIZE_MAX = 1000000;
$WORD_LENG_MAX = 128;
$INVALID_LENG = 128;
$MAX_FIELD_LENGTH = 200;
$WAKATI = $KAKASI;
とりあえずon memory maxの値が小さいのはわかったのですけど
これが速さに関係するのかは理解出来ませんでした。
また、他に問題点や気づく点等がありましたら教えて欲しいです、、
処理能力にはディスクI/Oという重要なファクターもある。
一気にmknmzするのではなく、分割してmknmz→マージする。
そうすれば処理時間もだいたい想像できる。
213 :
210:04/02/13 13:43 ID:wO1Lum8s
>>212 ヒント有難う御座います!
少しそれについて調べてみます。
214 :
森の妖精さん:04/02/16 02:31 ID:/mo58UcM
Namazuでインデックス化をして検索をしようと思ったら
「現在-3の文書がインデックス化され、・・・」と文書の数がマイナスになっています。
どうしてなのでしょうか。
218 :
nobodyさん:04/03/31 21:46 ID:5e+SzBpf
219 :
(´・ω・`):04/04/01 21:05 ID:98Q5EoMa
どなたかPHPスクリプトで動く
日本語全文検索エンジンソフトウェアを教えてください。
220 :
nobodyさん:04/04/02 00:02 ID:n5mwBUCQ
4/1にNamazuの新バージョン出るんじゃなかったっけ?
222 :
nobodyさん:04/04/20 23:55 ID:hVBcQucn
Namazu 2.0.13-1 を公開age
223 :
nobodyさん:04/05/01 23:15 ID:HE2QfFBX
kakasiについて質問です。
自分で作った辞書を、追加した。
# mkkanwa kanwadict (追加した辞書ファイル)
自分で追加した辞書の内容は、
上記の場合、(追加した辞書ファイル)を参照すれば分かるけど、
現在の辞書全体にどのような単語が登録されているかを調べるにはどうしたらいいんでしょうか?
kanwadictって、viで開くと文字化けして見れません。
※環境:UNIX
224 :
nobodyさん:04/05/27 15:51 ID:CEx1TsW7
225 :
nobodyさん:04/05/27 16:43 ID:mtXfTMbY
今見たら面白いことになってるな
>>224 何かあったの?
クラックされてたとか?
228 :
nobodyさん:04/05/27 19:56 ID:WJMdSqlX
マジかよ・・・
マジかよ・・・
マジかよ・・・
マジかよ・・・
マジかよ・・・
うわっ・・・5重に書き込んじまったよorz
237 :
nobodyさん:04/05/30 20:09 ID:WmFD3m1t
Windowsバイナリは????
239 :
nobodyさん:04/06/17 19:14 ID:KtXfrXmS
>>240 本当だ・・・キーワードの入れ方がまずかったようです。
自分のnamazuでやり直したらちゃんと表示されました。
無知で申し訳ありません。
Perl版Namazuをレン鯖に置いてみましたが、
全角文字で検索すると検索語が”%a5%d0%a5%”みたいな感じで文字化けします。
検索結果画面はきちんと表示されますが、検索文字列だけが化けています。
もう一回全角で検索すると文字化けが直ります。1回目だけ必ず文字化けします。
何が原因でしょうか?
↑うわ、UNIX板に書くつもりだったのに間違えた
ごめんなさい、無視してください。
検索は問題なく出来るのですが、
ヒットしたファイルが日本語のファイル名だと、
ブラウザ上に表示されているファイル名を
クリックしてもファイルをオープンしません。
検索対象ファイルの、
ファイル名が日本語でも対応してますか?
ちなみにWindows版(2.0.12)です。
.namazurc弄ればいんでない
247 :
245:04/07/22 13:31 ID:???
>>247 何でだろうね?ところで自鯖でやってるの?
Replace A(インデックス作成時のパス) B(Aを置換したい文字列)
だよね。ちゃんとそうなってる?
pnamazu.cgiの検索結果に表示される「著者」の欄がウザイのと、
この欄の ${author} が一体何を表示するのかがわからないので
ソースを追跡してみたのですが自分には具体的に読み解くことができませんでした。
sub field_init {
%FieldAlias = (
'author' => 'from' ,
'title' => 'subject' ,
'url' => 'uri' ,
);
あたりまではなんとなく分かるんですが・・・
Perlのすごい人! だれか教えて!
著者を消したいだけなら NMZ.result をいじったほうが早いよ。
著者がなにかを知りたいんだったらpnamazuではなく、mknmzのほうを解析するよろし。
む?もしかして$1じゃなくて\1なのか・・・?そうなのか・・・?
ああ・・・やっぱ\1でも駄目だ・・・いったいどうすれば・・・
Namazuの検索結果って、
全部ドキュメントの行頭あたりしか表示しないけど
Googleみたいにマッチした前後の文章を表示できんの?
>>255 できない。
レスポンスを重視した結果、今の仕様になっていると思われる。
>>255 Googleっぽい動作が希望なら
Estraier使ってみるとか
Estraier はNamazu ほど敷居は低くないよなぁ・・・
>>255 有りものの中でなら msearch がお勧め
259 :
nobodyさん:04/08/24 01:13 ID:202RVh+S
001とか002とかもインデックス?
javascriptとかでチェックボックスをコントロールするとかじゃ駄目か。
多分無理かな。以下のようにcccを指定する
じゃダメ?
F:\index
+ccc
+aaa
+bbb
>>261-262 数字のフォルダがインデックスで大まかに分けてある。
やはり1つのフォルダ以下にインデックスの入ったフォルダを置くしかないのか。
264 :
nobodyさん:04/11/11 11:45:47 ID:VoJd1QOh
インデックスと結果表示をutf8でできないでしょうか…
本家のperl版まだー?
266 :
nobodyさん:04/11/26 13:50:33 ID:cbW9i0f7
お聞きしたいのですが…
wgetで落したHTMLファイルをNamazuで検索しています。
Namazuの検索結果の順番を自分で決めたいんですが、
NMZ.field.uriの順番をいじると全てのページがNOT FOUNDになってしまいます。
どなたかいい方法知りませんか?
インデックスの作成を速くする方法ないですか?
namazuはcなのにmknmzはperlなのはどうして?
>>267 インデックスの作成を早くするには分散して作成してからマージすればよいかも。
namazuがcなのはcの方がリクエストの度にコンパイルがない分、早いから、
mknmzはインデックス作る時しか使わないので文字の操作が楽チンなPerlを・・・。
ちなみにpnamazuっていうPerlで書かれたnamazuもある。
たしか2chもread.cgiはCだけど、bbs.cgiはPerlだったと思う。
質問は一個ずつにしてね。
269 :
nobodyさん:05/01/02 10:01:19 ID:Oo1G9Jag
とりあえずローカルで動かそうと思ったんですが、どうしてもインストールが
うまくいきません。
インデックスを作ろうとするとNKF.pmが無いといわれます。
PPM-INSTALL.BATを動かしてもうまくいきません。どうすればいいのでしょうか?
270 :
269:05/01/02 12:42:33 ID:???
すいません、自己解決しました。
271 :
nobodyさん:05/01/27 22:35:38 ID:muSCpH63
一日費やして何とかNamazuをサーバーでうごかせれるようになったレベルなんですが、これでñとかóのような外国語をブラウザから検索してみると激しく文字化けしてしまいます。
なんか改善する術ってありますでしょうか? 教えて誰かエロイ人!!
272 :
nobodyさん:05/02/11 17:47:10 ID:LfkZHaha
namazuのwin32版をインストールしたのですが、mknmzrcの$ALLOW_FILEのところで、
2行目以下のwordなどの設定が対応メディアタイプに反映されません。
2行目以下も#は外しているのですが…。
茶筌のところ#を残しているのですが、それもちょっと変かもです。
うまくいかない原因がわかる方どなたか教えてください。
読み込んだ設定ファイル: D:/namazu/etc/namazu/mknmzrc
システム: MSWin32
Namazu: 2.0.12
Perl: 5.006001
NKF: module_nkf
KAKASI: module_kakasi -ieuc -oeuc -w
茶筌: chasen -j -F '%m '
わかち書き: module_kakasi -ieuc -oeuc -w
メッセージの言語: ja_JP.SJIS
言語: ja_JP.SJIS
文字コード: sjis
CONFDIR: D:/namazu/etc/namazu
LIBDIR: D:/namazu/share/namazu/pl
FILTERDIR: D:/namazu/share/namazu/filter
TEMPLATEDIR: D:/namazu/share/namazu/template
対応メディアタイプ:
application/x-gzip
message/news
message/rfc822
text/hnf
text/html
text/html; x-type=mhonarc
text/plain
text/plain; x-type=rfc
text/x-hdml
>>272 まず最新の2.0.14を使いましょう。
それと
D:/namazu/etc/namazu/mknmzrc の$ALLOW_FILE
のところを全行はりつけてよ。
どこの#を外したのか見てみないとわからんよ。
274 :
272:05/02/11 19:40:50 ID:???
>>273 最新って言ってもベータ版らしいので…。
とりあえずこんな感じです。
#
# This pattern specifies file names which will be targeted.
# NOTE: It can be specified by --allow=regex option.
# Do NOT use `$' or `^' anchors.
# Case-insensitive.
#
$ALLOW_FILE =".*\\.(?:$HTML_SUFFIX)|.*\\.txt" . # HTML, plain text
"|.*\\.gz|.*\\.Z|.*\\.bz2" . # Compressed files
"|.*\\.pdf|.*\\.ps" . # PDF, PostScript
"|.*\\.tex|.*\\.dvi" . # TeX, DVI
"|.*\\.rpm|.*\\.deb" . # RPM, DEB
"|.*\\.doc|.*\\.xls|.*\\.ppt" . # Word, Excel, PowerPoint
"|.*\\.j[sabf]w|.*\\.jtd" . # Ichitaro 4, 5, 6, 7, 8
"|\\d+|[-\\w]+\\.[1-9n]"; # Mail/News, man
あれ?連続する半角スペースとタブが消えるのは2ちゃんの仕様でしたよね。
関係ないが消えるのはタブだけ。
そういえば2.0.12は2002年か…。
Office2003だということもあるのかな。
拡張子だけで判断してるのではないんですか。
まずは最新版をインストールしてみます。
用事があって今日これからはできないので、うまくいかなかったらまた後日質問させてもらいます。
回答ありがとうございました。
Redhat9、namazu2.012にて全文検索システムを作成しています。
ページが増えてきたので階層ごとにインデックスを作成し階層ごとに検索ページを
作りたいと考えております。しかしインデックスファイルを作成しnamazuコマンドでは
検索できるのですがブラウザから
http://サーバIPアドレス/cgi-bin/namazu.cgi?idxname=aaaとすると allインデックスから検索されてしまいaaaインデックスから結果を表示してくれません。
aaaインデックスから結果を表示するにはどのようにするのでしょうか?
ページの階層
/apache/htdocs/aaa
/apache/htdocs/bbb
/apache/htdocs/ccc
インデックスの格納場所
/apache/cgi-bin/namazu/index/all
/apache/cgi-bin/namazu/index/aaa
index/all内のNMZ.head.ja
<input type="hidden" name="idxname" value="all"> ←allに変更
<a href="{cgi}?idxname=all">[検索方法]</a> ←?idxname=allを追加
index/aaa内のNMZ.head.ja
<input type="hidden" name="idxname" value="aaa"> ←aaaに変更
<a href="{cgi}?idxname=aaa">[検索方法]</a> ←?idxname=aaaを追加
cgi-bin内にある.namazurc
Index /apache/cgi-bin/namazu/index
Template /apache/cgi-bin/namazu/index/all
Replace /apache/htdocs/
http://サーバIPアドレス/
281 :
279:05/03/11 09:08:13 ID:???
ご返答ありがとうございます。mknmzの結果は下記の通りです。
mknmz -O /apache/cgi-bin/namazu/index/all /apache/htdocs
合計の文書数 602
合計キーワード 5,499
わかち書き module_kakasi -ieuc -oeuc -w
mknmz -O /apache/cgi-bin/namazu/index/aaa /apache/htdocs/aaa
合計の文書数 9
合計キーワード 441
わかち書き module_kakasi -ieuc -oeuc -w
よろしくお願いします。
282 :
279:05/03/11 16:15:26 ID:8QvGuHRh
こっちですね。
KAKASI: module_kakasi -ieuc -oeuc -w
茶筌: no
わかち書き: module_kakasi -ieuc -oeuc -w
メッセージの言語: ja_JP.eucJP
言語: ja_JP.eucJP
文字コード: euc
CONFDIR: /etc/namazu
LIBDIR: /usr/share/namazu/pl
FILTERDIR: /usr/share/namazu/filter
TEMPLATEDIR: /usr/share/namazu/template
対応メディアタイプ:
application/pdf
application/x-bzip2
application/x-compress
application/x-gzip
application/x-rpm
message/news
message/rfc822
text/hnf
text/html
text/html; x-type=mhonarc
text/plain
text/plain; xtype=rfc
text/x-hdml
text/x-roff
283 :
279:05/03/11 16:20:49 ID:???
すいません。間違えました。
mknmz -C
読み込んだ設定ファイル: /etc/namazu/mknmzrc
システム: linux
Namazu: 2.0.12
Perl: 5.008
NKF: module_nkf
KAKASI: module_kakasi -ieuc -oeuc -w
茶筌: no
わかち書き: module_kakasi -ieuc -oeuc -w
メッセージの言語: ja_JP.eucJP
言語: ja_JP.eucJP
文字コード: euc
CONFDIR: /etc/namazu
LIBDIR: /usr/share/namazu/pl
FILTERDIR: /usr/share/namazu/filter
TEMPLATEDIR: /usr/share/namazu/template
対応メディアタイプ:
application/pdf
application/x-bzip2
application/x-compress
application/x-gzip
application/x-rpm
message/news
message/rfc822
text/hnf
text/html
text/html; x-type=mhonarc
text/plain
text/plain; xtype=rfc
text/x-hdml
text/x-roff
>>279 Template /apache/cgi-bin/namazu/index/all
としているから
常に index/all内のNMZ.head.ja
が読み込まれているということでないか
namazurcのTemplateの行をコメントアウトしてみたら
>>279 亀レスだけど、
Namazuでは 「/cgi-bin/namazu.cgi?idxname=aaa」 みたいな直接指定はNGだったはず。
きちんとhiddenとかから送らないと。
>>285 それってどこでNGにしてるんでしょ。Namazu本体じゃなくて
pnamazuとかインターフェースのところでやってるんですよね。
287 :
279:2005/03/30(水) 18:10:10 ID:???
>>284-286 ありがとうございます。
検証が遅くなり申し訳ありませんでした。
サーバIPアドレス/cgi-bin/namazu.cgi?idxname=インデックス名&query=キーワード
で検索したらうまくできました。htmlにhiddenで指定した場合もOKでした。
ご教授ありがとうございました。
しかし検索結果はOKなのですが、aaaインデックスを検索しても結果はOKなのですが
ヘッダーの部分がallのもので表示されてしまいます。
(現在602 の文書がインデックス化され5,499 個のキーワード)
検索結果ページから再検索するとあるはずのページでも検索できません。
(allインデックス及びaaaインデックス両方とも。インデックスネームがうまく指定されない為?)
namazurcのTemplate部分をコメントアウトするとインストール時?の古いインデックスが
表示されてしまいます。
複数インデックスがある時のTemplate指定はどのように行っているのでしょうか?
289 :
nobodyさん:2005/11/11(金) 14:19:22 ID:lZiu1JMN
会社で鯰使うらしいので、オフィとか見てみました。
日本語全文検索ってほぼGoogleでカバーできてるのでは?
Winではあまり普及していないらしいし、導入に面倒がありそうだし
今、敢えてNamazuで検索を作るうまみってなんですか?
んーどうだろう
Googleはイントラネット内も検索できるようになってんですかそうですか
>>289 イントラの情報を検索できること
検索結果画面をカスタマイズできること
カテゴリ検索ができること
文書の最終更新日をファイルスタンプから識別できること
今使うならnamazuじゃなくHyper Estraierにするな. 俺なら.
>>293 そのソフト最近人気らしいけど、Namazuに比べてどの辺が優れてるの
>>291-292 なるほど、イントラ内検索がGoogleにはないうまみっぽいですね。
だんだん鯰の位置づけがおぼろげながらわかってきました。
どうもありがとうございます。
Namazuだったら正規表現も使えるんじゃない?
あれは便利だお。
正規表現はすばらしい
(i)←こういうやつ?<性器表現
〃∩ ∧_∧
⊂⌒( ・ω・) はいはいわろすわろす
`ヽ_っ⌒/⌒c
⌒ ⌒
300 :
nobodyさん:2005/11/18(金) 11:32:18 ID:ngwfG4IK
namazuのなんかのバージョンで、検索指定した文が
ハイライトされて、(そのページの上のほうからのテキストだけでなく)
検索された部分が表示されるというやるがあるらしいよ
と先輩に言われたのですが、どこにありますか?
あるいはカスタマイズで処理するもんなのですか?
教えてください。
>>300 EmphasisTags じゃなくて?
302 :
nobodyさん:2005/11/21(月) 10:11:48 ID:T4fDN5+G
>>301 ありがとうございます、調べてみます。(`・ω・´)ゝ
303 :
nobodyさん:2005/11/21(月) 10:27:34 ID:T4fDN5+G
やってみましたが、どうも指示されたものと違うようです。
たとえば文中にキーワードがヒットしても、プレビューで表示されるのは
そのページの文頭から指定文字数分ですよね?
それを、キーワードの該当部分前後をプレビューに表示させたい
という話でした。
>>303です。
指示者がEstraierと混同していた可能性大です。
自己解決しました。どうもありがとうございました。
305 :
nobodyさん:2005/12/14(水) 20:47:34 ID:CwjBoKRv
Namazu はPerlだけでしょうか?
できればPHPでサイト内検索ができるスクリプトをご存知でしたら教えてください。
>>305 Namazu自体はPerlじゃないし。
308 :
nobodyさん:2005/12/16(金) 05:48:32 ID:+W2Wi6VX
な、なんだとーこのこのー
Namazuと言えばみみずんの2ちゃんねる過去ログ全文検索システムだな。
って思ったら
>>30に書いてあった・・・
310 :
nobodyさん:2006/01/16(月) 09:59:58 ID:rhuM8+qJ
現在phpから動的にページを生成して出力しているのですが、
このPHPから出来上がるページをnamazuで検索したいと思っています。
どのような手法がありますでしょうか?
その動的に出力してるやつを静的なHTMLとして書き出す。
312 :
nobodyさん:2006/01/16(月) 13:00:54 ID:rhuM8+qJ
動的なページを静的HTMLとして書き出してインデックス化するような処理をnamazuの方で出来ますか?
それとも、やはりこちら側であらかじめ静的ページを作っておいて、それをインデックス化するしかないでしょうか?
なんとかコマンド一発で出来ませんかね?
wget -> namazu
っていうシェルスクリプト書けば一発でしょ。
315 :
312:2006/01/16(月) 20:44:28 ID:???
wget!
キタ━━━(゚∀゚)━━━!!!!
2006-01-29: Namazu 2.0.15 を公開
ISO-8859-* に関する文書の間違いを訂正
RedHat ソフトウェア namazu.spec の不必要なパッチは削除
File::MMagic 1.25 を同梱
MeCab の正式対応
mknmz に -b 及び --use-mecab オプションを追加
mknmz および namazu に --norc オプションを追加
mknmz に --decode-base64 オプションを追加
新しいフィルタ(Gnumeric, Koffice, Mainman/Pipermail, Zip, Visio)を追加
mknmzrc に MECAB, DENY_DDN を追加
ファイル名がDDN である時にスキップ。
日付フィールドによるソート機能の追加
nmzcat, nmzegrep コマンドの追加
フィルタの Windows 対応
(msword.pl, excel.pl, powerpoint.pl, postscript.pl, 等...)
OLE コントロールフィルタ更新
QUERY_STRING の区切りに';' 使用可能
Perl版テストプログラム(pltests) を追加
各種バグフィックス
1年9カ月ぶりなのね
320 :
nobodyさん:2006/04/02(日) 12:56:16 ID:6BlopTUr
Namazuをローカルサーバーに組み込みたいのですが
何のファイルをサーバーに送れば良いのか教えてください。
323 :
nobodyさん:2006/05/16(火) 22:05:32 ID:A+ClptH/
324 :
nobodyさん:2006/07/04(火) 21:14:27 ID:t84Vuxwj
325 :
nobodyさん:2006/09/07(木) 22:19:16 ID:n616cZBc
AN HTTPDとnamazuでLAN内のファイルサーバ全文検索システムを構築しました。
この勢いでローカルにある2ちゃん専ブラのdatファイルもインデックス化したいんですけど
良い文書フィルタはありませんか?
>>325 っていうか2ちゃんにどっぷりハマってるような
人間のクズは氏んだほうがいいぞ。
専ブラ+dat保存なんて、何をたくらんでいるのやら・・・おー、こわ。
にくちゃんねる2号だろ
329 :
325:2006/09/08(金) 20:52:20 ID:???
>>327 単なるナレッジ・マネジメント・システムの構築を目指してるだけですよ。
「おーこわ」って・・・なにを勘繰ってんですか
330 :
nobodyさん:2006/09/29(金) 14:11:41 ID:MXN7wOzE
namazuがN-gram対応
332 :
(^-^) ◆MONSOON/qo :2006/10/08(日) 05:28:42 ID:aDf/+h/t
インディックス作成時に読み込む文字種を正規表現で指定できますか?
記号は除外するとかです
333 :
(^-^) ◆MONSOON/qo :2006/10/08(日) 05:39:20 ID:aDf/+h/t
自己解決しました
こいつの検索判定明らかにおかしい。
何でもそうなのだが、部分一致ができない。
ファッキントッシュは、バカの使うOS
を検索するとする
「ファッキン」で検索すると一致なし
「ファッキントッシュ バカ」 で検索しても一致せず
「ファッキントッシュはバカの使うOS」でやらないと一致しない。
まるでMSNの検索エンジンだ
あれとまったく同じ
ファッキン!
>>335 HyperEstraier いれろよ。こっちの方が簡単だよ。
検索漏れもないし。
>>335 「ホントかよ」とおもったんで、試してみたけど、ヒットするよ。
プレーンテキストで「ファッキントッシュは、バカの使うOS」と書いて
最後に改行して保存。
> まるでMSNの検索エンジンだ
というが同エンジンと思われる「Windowsデスクトップサーチ」でも問題なくヒットした。
Hyper Estraierでももちろんヒット。
>>335の環境がおかしいんじゃないのか?
339 :
nobody:2006/10/25(水) 22:26:22 ID:J6B8Hktu
Windows ,PHP5に対応したPHPのNamazuモジュールを使いたいのですが、
どうやってモジュールをインストールするのか良く分かりません。
よろしければ、手順を教えていただけないでしょうか?
341 :
nobodyさん:2007/02/08(木) 12:03:48 ID:Mb2H3yQx
保守
Namazu用のWEBクローラはないの?
あと、インデクサや検索エンジンの分散処理ってどうやるのですか?
どっちもHyperEstraierでは標準で付属してるよね
ない
じゃメタ検索は?
Namazuサーバを複数稼働させといてクライアントで検索結果をマージできるシステムとか
ないの?
windows版のnamazuでmknmzでイントラネット内の共有ディスクの
インデックスを作ると、終了できてないと思われるwordやexcelの
プロセスがガンガンできるんですけど解決方法はありますか?
xdoc2txt.exe を使え
348 :
nobodyさん:2007/08/22(水) 06:00:29 ID:XEGA28iC
インデクスの中から登録キーワードの一覧を取得したいのですが
ファイルを開くことすらままなりませぬ(Cの知識皆無・・・
PerlかRubyからアクセスする方法を探してるんだけど
説明のあるページなどご存知の方いませんか?
>>348 www.namazu.org/doc/nmz.html.ja#w
に書いてあるとおり単なるテキストファイルに
1行に1単語で書かれているだけ
350 :
348:2007/08/23(木) 00:04:33 ID:???
>>349 このページは見ていませんでした。(トップページからリンクされてない?)
片っ端からファイルを見ていって、
開くことができたファイルの内容をチェックしていたんですが見落としてました。
ありがとうございました!
351 :
nobodyさん:2008/02/20(水) 20:07:39 ID:fLDVdokd
100MB強のPDFをインデックス化しようとするとmknmzが動作を停止する。なんでだ。
mknmzrcには200MBまでを検索対象にするよう設定してるんだが。
352 :
nobodyさん:2008/02/21(木) 22:15:05 ID:7VDtsl8S
353 :
nobodyさん:2008/02/22(金) 01:51:00 ID:CRNkbfG6
メモリか。xpdfは王様プログラミングで作ってあるのか。。
356 :
nobodyさん:2008/07/19(土) 19:10:35 ID:Hdkv0asv
検索結果に出てくる数字が1000の区切りでカンマが入るのは止めようがありませんか?
「1000」が「1,000」と表示されないようにしたいのです。
当方、急に鯖管理をする事になった者なのですが、
いきなりよく分からない壁に当たりましたので教えて下さい。
namazu自体よく分かりませんので、手探りでやっています。
色んなサイトを見て見た結果、とりあえずnamazu.cgiを
見てみないと始まらないようなのでftpでダウンロードしてみました。
ところが、namazu.cgiを開いたら文字化けが酷くて読めません。
使ってみたソフトはjeditx あとは、miです。
どうしてこういうことになったのでしょうか。
namazu.cgiが読めないとインデックスの更新もできない
ようなので先に進めない、と思われるのですが、
どなたか読む方法をご教授下さい。
>>357 首を吊るか、辞表を書け。さもなきゃ、人を雇え。
359 :
357:2009/07/31(金) 01:45:58 ID:???
その「雇っていた人」が降りたので、倅の自分に
無茶振りで回って来ました。なのでショッピングカート
(詳細なcgi部分を除く)とサイトいじりまでくらいしか
分からないです。
namazu.cgi自体はおまけでついて来るものだということは
色んなサイトを見て雰囲気で今日分かりました。
そもそもnamazu自体は、レンタルサーバにインストール
されているべきなのか、自分のpcにインストールされているべきなのか
それも分かりません。とりあえず、コンソ−ルからftpで入って、
フィルタに使うファイルがたくさん有るディレクトリでmknmzをしても
動かなかったので、namazuのインストール自体はサーバではなくて、
本体にすると言うことでしょうか?ネットを調べても
自サーバメインのチュートリアルが多くて困っています。
とりあえずインデックスを更新するだけで良いです。
そもそもいきなり分かる訳が無いので多くは望んでいません。
人名の間違い登録は流石に放置できないので、質問した次第です。
大真面目なので、申し訳ありませんがよろしくお願い致します。
dxfフィルタを導入したかったのですが、ホームページからのリンクが切れてました。
dxf用フィルタはもう配布していないのでしょうか?
362 :
nobodyさん:2010/08/12(木) 12:11:44 ID:XzX6VOe9
1年ぶりに上げてみる
さらに1年四ヶ月
牛NASにpnamazu入れようとしたけどよくわからん
∧_∧
( ・∀・) 人 ガッ
( つ―-‐-‐-‐-‐-‐○ < >__Λ∩
人 Y ノ. V`Д´)/
し(_) / ←
>>153
ぬるぽ
鯰