全文検索ユーティリティ統一スレッド

このエントリーをはてなブックマークに追加
ネットワーク上やローカルに蓄えられた大量の文書から
一瞬で目的の文書を検索する全文検索システムは
ビジネスでもプライベートでも必須の環境となりつつあります。

このスレでは主に、LAN・ローカル環境で使用できる
安価な全文検索ユーティリティについて採り上げていきたいと思います。

ちなみ私はQuick Finder2.0から使い始めましたが、
いまはエーアイソフトのDiskX Search 1.0を利用しています。

関連スレ
文書管理ソフト、どこがええじゃろ。
http://pc.2ch.net/test/read.cgi/bsoft/980909106/l50

全文検索システム協議会
http://www.ftsanet.com/

Quick Finder2.0
http://www.dis.co.jp/db/qf/default_qf00.htm

インテリジェント情報検索システム DiskX Search
http://www.aisoft.co.jp/japanese/products/dxs/dxs.htm

全文検索システム Namazu for Win32
http://www.namazu.org/windows/

PDFファイル専用全文検索システム PDFinder Basic KIT3.0
http://www.ask-digital.co.jp/product/biz/pdf_b3/top.html
2追加しちゃいます:01/11/25 18:55
PDFnavi
http://www.pdfnavi.com/

\12,800-。
パーソナルユースだったらこれでもいいかも。
3名無しさん@そうだ選挙にいこう:01/11/25 20:04
インターネットブーメラン
http://www.justsystem.co.jp/ib/

コンセプトサーチ
http://www.justsystem.co.jp/cb/

PDF Finder
http://www.ask-digital.co.jp/product/biz/pdf_b3/top.html

PDF高速王2
http://www.ask-digital.co.jp/product/biz/pdf2/top.html

日本語全文検索エンジンソフトウェアのリスト
http://www.kusastro.kyoto-u.ac.jp/~baba/wais/other-system.html
4名無しさん@そうだ選挙にいこう:01/11/25 20:58
ジャストシステムのコンセプトサーチは高すぎて話にならない。
個人ユーザー向けのConseptBase検索ソフトといえば
「インターネットブーメラン」だけど、要するにこれって
自動巡回→収集文書をデータベース化するソフトだから、
常時接続が一般化した現在では利用価値が少ない。
ローカル文書に対してもDB化してくれるけど、
不安定だし、対応文書は古めでPDFも1.2しか対応していない。
5名無しさん@そうだ選挙にいこう:01/11/25 22:11
SHARP DataHunter
http://www.sharp.co.jp/datahunter/index.html

Xelo
http://www.xelo.ne.jp/ ←落ちてねーか?

Microsoft Internet Information Server
http://www.microsoft.com/japan/products/iis/
6名無しさん@そうだ選挙にいこう:01/11/25 22:20
7名無しさん@そうだ選挙にいこう:01/11/27 00:53
たとえば、JavaサーブレットとOracleで
Webシステムを作るとします。
で、全文検索もしたいと。

どうします?
InterMediaとか使いますか?
Oracleとは別の全文検索用エンジン立ててやりますか?

InterMediaが使い物になればいいんですが、
いい話きいたことないです。
別エンジン立てるとOracleのデータと全文検索用のデータで
同期とらなければならないし。

これっきゃないっしょ、とかありませんかね?

  い っ ぱ い ビ ッ ク マ ッ ク を 食 べ る の だ
9名無しさん@そうだ選挙にいこう:01/11/28 05:50
インターネットブーメラン、ATOKを使ってたら、アプリで文章入力中に
未確定文字列を、そのままショートカットで検索窓に持っていける。
作業効率考えたらスゲー便利。
10名無しさん@そうだ選挙にいこう:01/11/28 05:53
他にIMEと連携できる全文検索ソフトってある?
PDFが1、2しか検索できないのが問題だが、ATOK使いの自分は、
今んところ最強だと思ってる。
11名無しさん@そうだ選挙にいこう:01/11/28 06:06
>>4
確かに。Googleで出来ることを、わざわざ自分のHDDの中でしな
くてもね。まぁ自分の選んだサイトだけをやれるって言うのは
ミソだが。

iATOKとか訳の分からんことをやりだしてるが、単にATOKが
Googleなどと連携すれば良いよな。そうすりゃアジア人だけ
じゃなくて、英語圏の人間もIMEを使うようになる。
Google が一般化する前に完成したソフトじゃないの
うちだゆきが ブーメランを持ってる広告を見た記憶がある
----------------------------------------------
ローカルとネットワークを区別なく検索という
コンセプトは悪くはないと言うか
これから同種のものが出そうだな
(知らないだけであるのかも知れないが)

MSは msn に 強制的につなぎそうだ
1312:01/11/28 13:49
フルサーチ瞬索 富士通

http://software.fujitsu.com/jp/shunsaku/
インターネットブーメランが出た頃って
テレホ 全盛 ぐらいかな

今 本気で力入れて 対応ファイルを増やしたり
Iria 並の機能つけたりしたら 人気出そう
ビジネスというより MX とかで

ローカル ネットワーク を問わず
必要なデータを集めるというまさにコンセプトどおり
実現可能な技術はすでにあるんだろうけど 発売されないだろうな
http://www.zdnet.co.jp/news/bursts/0111/28/accs.html
15名無しさん@そうだ選挙にいこう:01/11/28 23:09
商品が一般ウケするためのキーワードに「半歩先」(手を伸ばせば届く)
ってのがあるが、インターネットブーメランは一歩先を行ってしまった
んだろうね。

ジャストもへこまないで続けて新しいバージョン出して欲しいよ。
16名無しさん@そうだ選挙にいこう:01/11/28 23:15
情報ボックス(ローカルドキュメント、ローカルメール、ローカル
ログ、インターネット巡回)の設定が最初面倒なんだよな。

最初から、ある程度情報ボックスのテンプレートを用意してあげたら
素人ウケするかもね。実際の利益を受けるまでの手順が長い商品って
売れないじゃん。もうちょっと辛抱すれば、便利になるのに。

ATOKからは、情報ボックスごとにショートカットで検索できたら玄人
ウケもするだろうし、いろいろ改善点はあるな。エンジンは日本語
解析として一番のもの使ってるんだから、頑張ってくれ。
17名無しさん@そうだ選挙にいこう:01/11/29 18:38
こういうのって、ネット経由じゃないと出来ないの?
ブラウザのホームページにお気に入りをhtmlに変換した物を表示してるんだけど、量が増えすぎて使いづらくなっちまったんだよね。(藁
いまのところ、Ctrl+Fの検索でやってるけど。
18名無しさん@そうだ選挙にいこう:01/11/29 18:41
19名無しさん@そうだ選挙にいこう:01/11/29 18:59
>>17
少なくともインターネットブーメランでは出来るよ。ローカル圧縮
するやつはどれでも出来ると思うけど、表示めっちゃくちゃ速い。
ctrl+Fとか使ってられなくなります…。

で、自分の場合ATOKだから、なんかのアプリで文字入力してると
きに、ショートカット(自分はctrl+0に割付)押すと、未確定文
字列がそのまま検索語になってくれてランク順に表示。むちゃ便利。

なんでジャストはこれをウリにしないのか…。関西弁とかやってる
場合じゃないってw。

作り方は、IBでは、html保存してるフォルダを「情報BOX」として
指定してあげるだけ。ただ、そこからサーチ用データをつくるのが
かったるい(1時間ぐらいかかる)けどね。休み時間とかのアイドル
時間にやるべし(無論バックグラウンド作業だけど、マシンパワーが
落ちる)。
20名無しさん@そうだ選挙にいこう:01/11/30 18:54
で、なんで1はDiskXなの?
21:01/11/30 20:02
QuickFinderはあまり長いテキストの場合、後半端折ってインデキシングしてしまう。
DiskXはそのあたりオプションで調節できる。
(デフォルトは「32KB以上のテキストはDB化しない」)

また、多くの全文検索ユーティリティはDB更新を時間指定の上で定期的に行う。
DiskXにも常駐させて「深夜1:00からDB更新」とか選べるけど、
完全手動にすることも出来る。明らかに更新したファイルがないのに、
PCパワーを喰われるのは嫌だし、一晩中PC付けっぱなしも抵抗がある。

DiskXは2年ほど前まで文書フィルタを頻繁に更新してくれていた。(最近はサパーリ…)
MS-Officeだけでなく一太郎やPDFにまで対応している。

DiskXを使ってる理由はこんな所……でも、結構不安定&索引ファイルがよく壊れるので
新しいソフトへの移行も模索中・・・
22名無しさん@そうだ選挙にいこう:01/12/01 00:38
詳説サンクス>1。
自分はインターネットブーメラン以外使ったことないので、容量
大きいファイルは後半はしょって…の事とか知らなかった。
それって何か意味あるの?
23:01/12/01 00:53
>>22
2chのスレのようななが〜い文書だと途中までしかDB化してくれない。
つまり後半は検索対象外になってしまう。(欲しい情報がそこにあってもヒットしない)
DBのサイズを抑えるのには有効かも知れないけど、過去ログのように
「どこに欲しい情報があるかわからない」場合は、やはり不便。
24名無しさん@そうだ選挙にいこう:01/12/01 22:13
>>23
ごめん、基本的なこと聞いて悪いけど、やっぱり検索DBは小さければ小さい
ほど反応速いのかな。個人で使ってるもんで昔と比べて、速度が変わるほど
気になったことがない。
25名無しさん@そうだ選挙にいこう:01/12/01 23:39
>>24
当然小さいほど早くなる・・・が、DBサイズはある一定を超えると、そんなに膨らまないようだ。

つまり、総計100MBのテキストをインデキシングしたDBサイズが、
50MBテキストのDBサイズの倍になるか、というと単純にそうはならない。
なぜなら登録済みの語彙はキーインデックス生成済みだから・・・
でも、やっぱり使い始め(DBサイズ小)の頃から比べると心持ち遅くなった?
といっても1〜2秒(長いと5秒くらいかかる)かな・・・
26名無しさん@そうだ選挙にいこう :01/12/04 05:36
アウトレットで500円で買った QquickFinder1.0 を使用中。
PDFの検索が出来ない以外は不満はない。
なんせ、500円だったから。
http://plaza3.mbn.or.jp/~h_ishida/KWICView.html
KWIC View
-----------------------------------------
自分はwz grepをメインにJSファイル検索ツール(ジャストシステム)

最近気づいたけどMSの検索(スタートにあるやつ)はへんだ
明らかに1つ以上ヒットするはずであるフォルダのhtmlを検索したらゼロ
grepとJSで検索したら50以上も出てきた 
ショック
2827:01/12/06 09:13
MSに対してショックなのではなく
自分の過去の検索結果に対してショック
29名無しさん@そうだ選挙にいこう:01/12/07 23:52
27も書いてるけど、一太郎におまけで付いてくる
JSファイル検索ツールはなかなか良いと思う。

索引ファイルの更新タイミングも自動・手動の融通が利くし、
対象ファイルも一太郎・花子・テキスト・HTMLはもちろんWord2000やExcel97にも対応している。
MS Officeについてくる「FindFast」よりもよっぽどわかりやすくて便利だと思う。
30名無しさん@そうだ選挙にいこう:01/12/08 00:16
namazu(for Win32)使ってるけど、他に使ってる人いないのかな?
DiskXsearchも使ったことあるが、DB作成の際のエラーとかちょっと
多くてイマイチだった。namazuの方がLANでの使用だとOSが何でも
使えるし、多数でのライセンス料とか考えるとフリーは嬉しい。
動作も今のところ安定してるし。
最初の設定とかが少しめんどくさいのが欠点だが。
(ちなみにMS Word,Excel,PowerPoint,一太郎、PDFが検索可だ)
Namazuいいんだけどインデックスの作成が面倒くさい。
誰かフロントエンド作ってくれ。
32名無しさん@そうだ選挙にいこう:01/12/08 11:41
>>30
一太郎やPDFの文書フィルタはフリーで入手可能なの?
33名無しさん@そうだ選挙にいこう:01/12/08 23:30
>>32 フリーであるよ。
一太郎とかオフィスのは http://cvs.namazu.org/namazu/filter/win32/
PDFについては
 http://www.namazu.org/ml/namazu-win32-users-ja/msg00495.html
フィルターも随時開発・更新されてるみたいで、namazuメーリングリスト
http://www.namazu.org/ml/namazu-win32-users-ja/ に注目。
34名無しさん@そうだ選挙にいこう:01/12/14 22:38
MS OfficeのFindFastはどうだ?
あとWin2000標準のフルテキストサーチ(正式名称忘れた)
35三村:01/12/15 00:33
PDFinder Basic KIT3.0 有償ジャねーかよ!
36名無しさん@そうだ選挙にいこう:01/12/15 01:13
>>35
フリーはnamazuしかないよ。
37名無しさん@そうだ選挙にいこう:01/12/20 03:16
mhtファイルを検索できるのはどれじゃろ?
38マカー:01/12/27 23:00
macだとultra findがおすすめですね。
39名無しさん@そうだ選挙にいこう:01/12/27 23:23
>>38
しゃーろっくはつかわねーのか?
40名無しさん@そうだ選挙にいこう:02/01/04 21:29
みなさんHTMLの保存ってどうしてます?DocuworksやPaperport、PDFなどの
形にするとまとまるけど独自形式なのでとり回しが悪いし容量も増えがち。

だからといってそのまま保存だとフォルダとHTMLが別々になって取り回しが
悪い。だからmht形式って以外にいいと思うんですが、問題はそれを検索でき
るソフトがないんですよね。
41名無しさん@そうだ選挙にいこう:02/01/04 23:26
>>40
そもそも、>>40 のいう「全文検索機能」の定義はどーなのよ?
1) 単純な grep
2) 形態素解析使うインデックス構築タイプ

単純な grep なら、やさしくファイリングv3 でできるよーだけど、
こーゆー書き方してるってことは、自分では何も調べてないってことだよね。
4240:02/01/05 10:13
>>41
あのー、やさしくファイリングがmhtに対応してるけど恒常的に
あんなとろい検索使ってられないから聞いているのであって、、、。

そこまでこだわるなら、このトピのタイトル「形態素解析使うインデッ
クス構築ユーティリティ統一スレッド」とでもして立て直したらどうで
すか?

このトピで全文検索といえば2)なのは文脈上自明と思うんですが。
43名無しさん@そうだ選挙にいこう:02/01/05 10:39
>>42
namazu のフィルターつくれば神様になれると思うよ。

第一 mht なんて仕様も公開されていない独自形式で管理して
なにかうれしいことあるの?
4443:02/01/05 10:45
あ、スマソ、RFC 公開されてたっすね。
http://www.ietf.org/rfc/rfc2110.txt?number=2110
45名無しさん@そうだ選挙にいこう:02/01/05 17:33
詳しいことはよくわかんないけど、mhtってメール添付の
形式でしょ。MS単体で提唱してる訳でもなし。

HTMLを保存するのにファイルがバラバラするのが気持ち悪いので。
だからといって必要ないのにHTMLをなにかに変換するのもいやだし。
46名無しさん@そうだ選挙にいこう:02/01/05 17:40
余談ですが、XMLも結局HTMLみたいにファイルがバラバラしちゃう
のですよね?

だったら何かmhtみたいな、クリックすればすぐにXMLになる形がメ
ジャーになってくれるといいと思うし、検索ソフトもそれを主眼に
おいてくれた方が助かるんですけどねぇ。
4743:02/01/05 18:02
>>45
そのための紙2001だと思うのだけど、
実際に紙2001使って、どういう風に保存されているのかみた?
48名無しさん@そうだ選挙にいこう:02/01/05 21:35
>>46
mht ってのは html やそれとリンクされたファイルを、
既存の技術や標準(MIMEエンコード)を組み合わせて一つに
まとめる方法と提唱されたんだわ。

でも、既存の標準に合わせたために、テキスト情報も
MIMEエンコードって方法で、非文字情報(って文字ではあるんだ
けど)にエンコードしてしまって、プレーンテキスト情報では
なくしてしまったんだよね。

だから、ふつーの検索ソフトでは検索できなくなってしまったんだ。

検索するには、mht ファイルを解析してテキスト部分をデコードして
テキスト情報を抽出する必要があるんだけど、いかんせん mht 形式で
保存もできますぐらいの位置づけで、実際にそれでファイル管理しようと
いう人が少ないんで、対応するソフトも少ないんだわ。

紙みたく Drag & Drop でクリップするのが一番楽だし、
PDF writer や DW みたく印刷メニューでクリップするほうが、保存メニューで
mht 指定して云々よりずっと楽だったりするしね。
49名無しさん@そうだ選挙にいこう:02/01/07 03:54
>>47
「紙」の保存方法見たんだけど、結局HTMLと画像がバラバラのままじゃん。
すべて「紙」を使うならいいけど、それじゃ意味ないし。
50名無しさん@そうだ選挙にいこう:02/01/07 04:04
>>48
PDFやDWみたいにHTMLのものを自己形式に変えるって言うのが
いまいちよくわかんないんだよな。再利用しにくい形にして。

HTMLでよくない事ってバラバラになることだけだけど、mhtが
普及したら万事解決のような。IEさえあれば見れるんだから
便利と思わない?
51名無しさん@そうだ選挙にいこう:02/01/07 04:12
>>49
あ、何が言いたいかわからないね。
「紙」が作るデフォルトフォルダ(mydoc\kamidata)以下から、ほかの
フォルダにHTMLをファイル移動したいって時あるじゃない。なにも
「紙」だけでスクラップする訳じゃないから。そのときに対応してる
画像ファイルを見つけるのが困難になるって事。

あとデータが500件ぐらいまでなら捌けそうだけど、それ以上にな
ったら階層管理出来ないのはつらいなぁ。まぁフリーだしバージョン
アップに期待してフォロー見てみます。サンクス。
52名無しさん@そうだ選挙にいこう:02/01/07 06:40
>>51
独自形式にするのは、扱うのが html だけじゃないからだね。
mht つーか html のレイアウト能力って極めて低いから、html 以外の
アプリで作ったファイルはまともに再現することができないんだよ。
だから、独自ファイル形式に吐き出すんだ。

html だけでいいんなら、Webページのキャプチャソフトも探してみたら?
興味ないから、どういう機能もっているのかわからんけどね。

それで満足いかないなら、自分で作るってことやね。
RFC で公開されているし、自分で作るか、ソフトウェア開発会社に
オーダーメイドで作らせるって方法もある。
532ゲット:02/01/07 14:17
>>51
Windows2000だと、例えば、hoge.html用の画像ファイルを
同じディレクトリ内のhoge.filesというフォルダ(IEの「Webページ完全」保存とかでできる)
にいれとくと、hoge.htmlのアイコンだけつかんで移動させてもhoge.filesフォルダが
勝手にひっついて一緒に移動してくるんだよね。不気味。
hoge.htmlを削除すると、hoge.filesフォルダも勝手に消えるし。
この機能で勘弁してくれ。ダメですか、ああそうですか。
54名無しさん@そうだ選挙にいこう:02/01/08 06:00
>>53
あれ、hoge.filesフォルダって引っ付いてきます?確かに不気味ですね。
だったら問題ない、、、事もなくてなんかフォルダが見えるのってスッキリ
しないんですけどね。実用上問題なければ簡単だしサンクスです。
55名無しさん@そうだ選挙にいこう:02/01/12 02:03
インターネットブーメランでPDFの透明テキスト検索できますか?
56名無しさん@そうだ選挙にいこう:02/01/14 19:27
>>55
古いバージョンのPDFしか検索できないので無理だと思う。でも確かめたわけ
じゃないので誰か確認して。

でも次バージョンのIBではしっかり対応するでしょ。まぁ次のIBが出るかどう
かが問題だが。
57名無しさん@そうだ選挙にいこう:02/01/20 18:54
>>55・56
PDFバージョン1.2ならできました。
58名無しさん@そうだ選挙にいこう:02/01/24 02:14
もうジャストシステムは一太郎がこけて、コンセプトベース+ATOKで稼ぐしか
ないんだから、次バージョンのIBにはかなり期待なんだけど。

というか、やれなきゃ潰れそう。
59名無しさん@そうだ選挙にいこう:02/01/29 09:31
インターネットブーメラン、情報BOXごとにショートカット割り付けられると
いいんだけど。
60名無しさん@そうだ選挙にいこう:02/01/31 20:10
高速常接になって、この手のソフトの需要は増えると思うんだけど…。
バージョンアップ期待。

ところで、Web検索巡回、CSJしかヒットしないのは私だけ? 設定ミスかなぁ〜。
61 :02/02/01 02:19
インターネットの部分は使ってねーからわかんねぇ。

ってか、Googleで一からやる方がよっぽど便利。
6260:02/02/01 13:49
検索エンジンって、やっぱり言葉や文字が正確じゃないとヒットしづらいでしょ?
そこをIBがうまく補完してくれないかなぁ〜、とか思ってます。
>>61さんのやり方のほうが便利なのは正解なのですが(私も結局そうしてますし)、
常接が当たり前になった今だからこそ、Webとの繋がり方を再検討して欲しい。
 
つーかIBって今後VerUpするの? なんかこのままフェードアウトの予感…。
63 :02/02/02 06:04
ATOK自体がこのままフェードアウトの感があるので、
最後っぺとしてなんかやるでしょ。ATOKと検索の連動。
64名無しさん@そうだ選挙にいこう:02/02/02 09:12
っーか今のままnamazuでいいや,俺.
65名無しさん@そうだ選挙にいこう:02/02/02 19:51
>>64
Win2Kでも使える?
66 :02/02/05 05:56
IBの自然文入力、つい検索エンジンみたいにスペースで区切っちゃうの、
私だけでしょうか。
67がっくす:02/02/05 13:35
>>65
perlとkakasi入れれ.バリバリつ使えるぞよ,なによりもロハ.
68名無しさん@そうだ選挙にいこう:02/02/08 17:36
三四郎と五郎使用中age
69 :02/02/10 23:53
自然文を解析してくれるのはIBだけだべ?
70名無しさん@そうだ選挙にいこう:02/02/10 23:53
五郎サポート終了〜。
71窓際無職 ◆CHcAKaBs :02/02/11 12:08
>>70
マジで? 困るんだけど…。
い、一応ソースきぼーん。(公式サイトにはまだ情報ナシ)。
72名無しさん@そうだ選挙にいこう:02/02/11 23:11
これ見る限りサポート継続中。
http://www.justsystem.co.jp/support/jsupport/detail/list_st.html
>>70のコメントは
・サポート:J-SUPPORT(サポートサービス対象製品一覧[1])に無いので勘違い
・「現在サポートサービス対象製品となっている製品が製造終了になった場合、
 その製品は製造終了の1年後にサービスの対象外」の解釈
のどちらかなのだろう。
ただ、後者の解釈が「次バージョン発売=製造終了」になっていくようであればこれは大問題。
一太郎が2年でサポート打ち切り計算になりかねないから。
73名無しさん@そうだ選挙にいこう:02/02/12 02:54
ここもanhttpd+namazuのようだね
結構詳細にでているよ
http://www.yamatabi.net/main/club/pc/pc_home.html
74窓際無職 ◆CHcAKaBs :02/02/12 16:43
(;´Д`)ノ <72さんありがとうございます。
        これで一安心、って安心できないのが今のjust…。
この検索システムはどうよ。
情報検索システム「FUND」
http://www.in-tel.co.jp/div/it/fundform.html
76名無しさん@そうだ選挙にいこう:02/02/15 18:51
スレ違いだけど、
日経テレコン21 @nifty Light コース
http://www.nifty.com/NIKKEI/
をあらかじめ決めた検索語と検索条件で、自動巡回してくれる
ツールってないでっしゃろか?

毎日同じキーワードでヲチするのが面倒になってきたので。
クリッピングサービス使えってのはあるだろうけど、
月800円の固定料金だし、なんとか楽したいんだけど。
77窓際無職 ◆CHcAKaBs :02/02/16 17:06
>>76
おそらく、検索サイトサーバの負担を考えて、どのソフトもやらないのでは…?
78名無しさん@そうだ選挙にいこう:02/02/16 19:42
自然文解析ってどういうアルゴリズムなんだろう?
80 :02/02/25 16:15
まず日本語入力と連携できることが重要
よってインターネットブーメラン以外カス
81名無しさん@そうだ選挙にいこう:02/02/26 22:09
IBを使っていたが、
・容量150MB以上のフォルダは検索できない
(フォルダを分割して2個インデックスを作るしかない)
・ヒット率が悪い(htmlファイルでも)
・高速化ツールを入れるとヒット率がさらに悪化
(まさか辞書登録単語数を減らして高速化したのでは
あるまいな?)
でやめた。 特に最後の問題が最悪。
辞書が公開されていず、単語登録もできなかったのもマイナス点で、
文書がヒットしないのでは、IBの特徴も何も無かった。

今はnamazuを使用(win2K、kakasiをカスタマイズ)。
不満といえばMy Documentsを検索対象にできないくらいか?

やぱり全文検索用の辞書は、中身が公開されていなければと思う。
82 :02/03/02 03:52
>>81
ごめん、何言ってるか解らん。小学生の俺に解るように説明して。
>>82
検索に使える単語が限られてるってことじゃないかな?
辞書に登録されていない単語は検索しないことで、速度をかせいでいると。
本当ならずさんな作りだと思うんだけど、本当に本当? >>81
84名無しさん@そうだ選挙にいこう:02/03/02 18:49
>82,>83
まさかレスがつくとは。

インターネットブーメラン(以下IB)もnamazuも事前に検索対象のフォルダ
からインデックスを作る。
そのためインデックス作成用に辞書が必要になる。
namazu for win32ではそのためにkakasiというフリーの辞書を使うが、IB
では公開されていず、単語追加もできない(少なくともマニュアルには無か
った)。
自分の場合、仕事に関連する特許をまとめて検索対象にしていたため、技術
用語を多く使用する。 この目的でヒット率の悪さは致命的だった。
 また、検索対象には画像ファイルも含まれるため必然的にフォルダ容量も
大きい。 150MBの制限(これもマニュアルには無い)は苦しかった。
自分に事例は特殊かもしれないが、全文検索を必要とする人間は大抵特殊用語
の使用が多く、かつ大容量のフォルダを対象にすると思う。
8581:02/03/02 19:01
あ、上の発言は81のものです(上げちまった)。

ちなみに>83
上のような目的なんで、対象フォルダへのヒット数(上のヒット率は間違い)
は細かく確認していた。
IBのインデックス高速化に伴うヒット数低下は顕著などという生易しいもの
ではなかった。

なお、namazuはUNIX育ちのせいか、スペースの入るフォルダ名(例えば
My Documents)からはインデックスを作れない。
Win9X系列では例えばMyDocなどにリネームすることで対処できるが、NT
系列ではこれができないのが悲しい。
8681:02/03/02 19:14
ええい、毒くわば皿までだ。
IBでもnamazuでも、検索時にはどんな単語を入れてもそれなりの結果を吐き
出し、「indexの対象になってねーヨ」などとは間違っても言ってこない。
だから、検索誤がインデックス用辞書に入っているかなどは直には分からん。

検索結果を地道にチェックしないと、うかつに使えん。
87>81:02/03/02 23:31
熱弁サンキュ。なるほどね。専門用語の事など考えたことなかったわい。

と言うか、インデックス化に単語辞書がそこまで関連しているというのすら
イメージわいてなかった、文字通りの消防だったな。使ってただけだった。
その意味では今までかなりの検索漏れがあるかもしれん。

でもそこまでするのって普通の人は必要ないと思うがね。よっぽど特殊な
仕事なの?

でも確かにATOKの辞書とかと連動できると良いね>IB。わざわざIB用
(namazu用)の辞書編集するってのもかったるいし。だからIME用の辞書と
連動。
88名無しさん:02/03/03 01:42
>>81
2000ならMyDocumentsのパス変えれるべよ。
NT4ならスペース入らないし。
8981:02/03/03 04:09
はは、興奮してしまい、はずかしい。

>87
仕事はメーカの研究職(材料畑)。
 関連特許や文献の活用に必要と感じていたので、個人レベルで使える
検索システムを私費で入れた。
(ConseptBaseは利用部門で簡単に買える値段で無い)
 対象ファイル数は2000程度だろうか。
こんな用途なので、検索時に「見つけたと思った」のは許せても
「見逃し」は許容できない。

確かに自分の場合はIBの利用対象から外れているかも知れない。
 でも、逆に普通の人であれば、IBのようなインデックス作成に時間の
かかるソフトを使わずに、例えばエクスプローラの検索やGREPのほうが
便利ではないかな?
 正直、>87がどのような使い方をしているのか興味がある。

>88
え、2000とXPしか知らんが変えられるのか?
Documents and Settingがリネームできなかったのだが?
90名無しさん@そうだ選挙にいこう:02/03/04 01:50
>>89
ローカルユーザーとグループ→詳細な設定→プロパティ
→プロファイル→ホームフォルダ→ローカルパスを設定する
で適当なフォルダをホームフォルダにしてそこに入れるぢゃだめ?

9181:02/03/04 03:42
>90
デスクトップの「マイ ドキュメント」アイコンを右クリック→プロパティで
変えられることに気付いた。
ただいまインデックス構築中。 ありがとう。
92名無しさん@そうだ選挙にいこう:02/03/04 21:39
誰も書かないが、Win2K/XPの「インデックスサービス」はどうなのだ?
OS標準だぞ
少しおかしなところがあるね。
ファイル名が日本語の時うまく検索できない。
日本語コードの問題じゃないかと思う。

PDFの検索もできるところは良いね。
インターフェイスもHTMLで事由に作れるしね。
94名無しさん@そうだ選挙にいこう:02/03/07 06:19
>92
あまり大量のデータを扱わず、複雑な検索も行わない用途
(保存した文書のファイル名を忘れた程度)であれば
使えると思う。

>93
namazuの事だよね?
インデックスを作る際に

mknmz -U [インデックス対象ホルダ名]

というように -U を付ける必要がある。
(オプション無しではs-jisのフォルダ名をうまく扱えない)
いや、>>93はWin2K/XPの「インデックスサービス」の話だよ
96>81:02/03/08 20:59
特許ね。なるほど。それじゃ検索漏れは許されんね。
自分は普通のオフィス再利用仕事&個人データなんで、早さの方が問題
だから、日本語入力と連携できる方が良い。

そもそも文書に取りかかるときにウザイから過去を見てるようなもんだし。
あればめっけもんって感じ。蓄積が膨大になってきたからGREPじゃ間に合
わなくなってきた。というよりアウトラインはエディタで作るけど、実際は
エクセルワードの再利用がほとんど…。
97>81:02/03/08 21:03
あ、ごめん「他人の作った」が抜けた。保存してあるエクセルワード
文書から引っ張って自分の文書にするって意味。せこい。が、そんな
もんだろ。
98名無しさん@そうだ選挙にいこう:02/03/10 17:56
>>87に激しく同意。ATOK辞書と連動して欲しい。
JUSTSYSTEMはすでに保持しているりソースを有効に利用するのがヘタだね。
それともこれ以上を要求するならConseptBase使え、ってことなのかなぁ。
99名無しさん@そうだ選挙にいこう:02/03/16 22:20
>>93
Win2kのインデックスサービス、PDFも検索できるのか・・・あなどれんな。
仕様を公開していろんな文書フィルタをユーザーが作成できるようにしてくれればもっといいんだが
(公開されても漏れは作れんが)
>>99
作れるよ。単体の Index Server だった時から検索用ドライバの仕様公開してる。
この分野に通じた開発者でないと知らなくても無理ないんだが、MSDN あたりで探せ。
作るなら検索対象のデータファイルの仕様も必要だぞ。
アプリのメーカーにメリットがなければドライバ作らないから、数が出てないだけ。
101名無しさん@そうだ選挙にいこう:02/03/17 14:43
adobeが提供しているインデックスサービス用フィルター
PDF ifilter
ifilterは、 http://www.adobe.com/support/downloads/8126.htm
102名無しさん@そうだ選挙にいこう:02/03/19 00:19
仕事でNamazu2.0.10使って社内用検索システム作った。
ちなみに、↓の本を見ながら、2日でできた。
Namazuシステムの構築と活用―日本語全文検索徹底ガイド
http://www.amazon.co.jp/exec/obidos/ASIN/4797316411/

Namazuはフリーなのにめちゃくちゃ良くできてると思う。
とにかく検索が速い。

>>81
Namazu や google の全文検索エンジンは、
検索漏れが全く許されないケースには適さない。

100%の精度を要求するなら、GREP 的な検索をするしかないんじゃないかな。
103名無しさん@そうだ選挙にいこう:02/03/19 20:57
>>102
>仕事でNamazu2.0.10使って社内用検索システム作った。
Webサーバを立ち上げてない環境では無理?
>>102
googleは形態素解析じゃないみたいだし(N字インデックス法?)、LAN環境下で使えば
検索漏れの無いシステムになるんじゃない?
105名無しさん@そうだ選挙にいこう:02/03/19 21:50
>103
自分の部署ではファイルサーバに検索対象ファイルとnamazuインデックス
ファイルを置き、クライアント側にSearch-Sを入れて使っている。
サーバの検索対象ドライブをクライアント側で共有ドライブに設定し、
同じドライブ名を割り当てておけば簡単に使える。
インデックスファイルはサーバで作ったものをクライアント側にコピーして
使えるため、検索も高速にできる。

>102
Grepは大量のデータに使うと遅そうなのでやめたのだが、それ以外にも
&の付くキーワードが使えないのではという懸念があった(会社名では
&の入るものが結構多い)。
実際はどうか知らない?
106103:02/03/19 22:16
>>105
インデックスの更新はファイルサーバ側で自動的にやってくれるの?
それとも手動でいちいち例のコマンドラインを打ち込まなくちゃならない?
107104:02/03/19 22:45
>105
時刻指定でプログラムを起動するソフトを使い、バッチを動かしている。
108名無しさん@そうだ選挙にいこう:02/03/19 22:47
>>104
google も形態素解析してるみたいだよ。
http://pc.2ch.net/test/read.cgi/php/992477868/66
109103:02/03/19 22:49
>>107
「タスクスケジューラ」でもいけるかな?

ところでnamazuのコマンドオプションを見ると「サブディレクトリも索引化対象とする」が見当たらないんだけど、
ひょっとしたらすべてのディレクトリをバッチファイルで指定する必要があるの?
110名無しさん@そうだ選挙にいこう:02/03/19 22:58
いや、Namazu はサブディレクトリも含んでインデックスしてくれるよ。
少なくとも Unix 版はそうだった。
111104:02/03/19 23:01
>109
タスクスケジューラで問題ないと思う。
また、namazuの場合デフォルトでサブディレクトリも検索対象になる。
つーか、サブディレクトリを除外する方法は知らん(必要なかったので)。
112103:02/03/19 23:12
>>110-111
thx なんかやる気が出てきたよ。
最大の問題は文書フィルタなんだけど、
これは組み込んどけば、拡張子で判断して適切にテキスト抽出してくれるん?
それとも同一形式のファイルは1ディレクトリに突っ込んで、
「-t」オプションで文書形式をしてしてやる必要があるのかな?
113名無しさん@そうだ選挙にいこう:02/03/19 23:28
namazuいい感じだよ。

Namazu 2.x for Win32
http://sl.hunet.ne.jp/cgi/_cool/namazu2/

Namazuによる全文検索システムの導入
http://www.atmarkit.co.jp/flinux/special/namazu/namazu.html
114名無しさん@そうだ選挙にいこう:02/03/22 00:04
いいスレなのであげてみよう
115105:02/03/22 06:43
>112
namazuの場合、設定された拡張子を自動的に判別して処理する。
判別対象は,.txt,.htm,.html,.pdf,.doc,.xls,.ppt,.rtf,tex,一太郎文書(拡張子忘れた)
がデフォルトで使える(フィルターも同梱)。

中身はテキストだけれども拡張子が違うような文書の場合、namazuの設定ファイルを書き換え
れば対処できるそうだが、やったことは無い。
116名無しさん@X:02/04/08 12:00
117名無しさん@X:02/04/08 12:02
118名無しさん@そうだ選挙にいこう :02/04/08 22:47
いいスレなのであげてみよう
119名無しさん@そうだ選挙にいこう:02/04/11 21:37
>116,117
その辺の比較については
www.kusastro.kyoto-u.ac.jp/%7Ebaba/wais/other-system.html
あたりを参考にすればよいかと。

ただ、現時点で個人用PC上にインデックス作成型全文検索システムを
低価格で作ろうとすると、
・Win版がある
・導入事例が本、ネット、MLで手に入る
・Serch-SというGUIローカル検索ツールがある
という点で、どうしてもnamazuが選択されがちと思う。

というか、ローカル使用を前提とした場合、namazu以外では
どうやったらいいかすら分からない。

個人的にはインターネットブーメランにもう少し期待していたのだが。
120名無しさん@そうだ選挙にいこう:02/04/15 03:32
namazuの一太郎フィルタってきちんと使えてる人いる?
全然インデックス化されてないみたいなんだけど・・・
1211:02/04/15 18:47
本スレの1ですが、namazuマンセーレスが多いので、入れてみました。namazu2.0.10
フロントエンドにはsearch-sを使用。で、感想ですが
《利点》
●有志による開発のため、バグ報告やパッチのリリースが盛んで「ほったらかし」にされる心配がない
●複数OS対応、ユーザー数も多く信頼性が高い。
●インデックス作成が比較的早い。体感的にはDiskX Searchの1/5くらい?
●検索オプションが豊富
《欠点》
●導入がややこしい。使いもしないActivePerlまでインストールする必要がある
●PDFや一太郎の文書フィルタがデフォルトでは使い物になっていない
●serch-sのインデックス作成インターフェースが低機能。結局コマンドラインを打ち込まなければならない
●検索インターフェースからファイルの削除やリネームが出来ない

といったところ。思ったよりひらがなやカタカナ固有名詞にも強く、
「とにかくフリーで」という人なら手間をかけても導入する価値は十二分にあります。
というか「導入に手間がかかる」以外、性能面では製品版と互角以上でしょう。
namazu導入難しい。
search-s使ってもindex should be old format.ってでるんですが・・・
意味不明。逝こう・・・。
123名無しさん@そうだ選挙にいこう:02/04/18 19:33
>>122
検索に使うインデックス指定した?
124名無しさん@そうだ選挙にいこう:02/04/18 21:39
namazuでインデックス作成時、たとえばc:\data以下を索引化するとして、
c:\data\folder1
c:\data\folder2
の2つのディレクトリを索引の対象外とするにはどうすればいいのでしょう?
excludeオプションを使ってみましたが、どうも上手くいきません。
複数フォルダは駄目?
gcnmz
文書の更新・削除を伴うインデックスの更新を繰り返していくと、インデックス内に不要なデータが
溜まっていきます。gcnmz はこの不要なデータを削除するツールです。コマンド行から次のように実行します。

% gcnmz [options] <target>...

たとえば、 ~/Namazu/foobar に置かれているインデックスをゴミ掃除するなら、次のように実行します。

% gcnmz ~/Namazu/foobar
126名無しさん@そうだ選挙にいこう:02/04/19 01:12
127ないない:02/04/20 01:47
2chのどっかで見かけたフラッシュの動画を見たくて探してみたら
見つかったんだけど、画面が小さいんです。
2chに貼付けしてあったアドレスで見ると全画面だったのですが、
あのアドレスはどこにあったのだろうか・・・。

「ぼくとナイフ」って作品なんですが。
128名無しさん@そうだ選挙にいこう:02/04/20 02:51
ConceptBaseを会社で導入検討中です。既に使ってて詳しい方
いらっしゃいますか??一応社内ポータルで社員全部に使わせる
予定です。インデキシングの速度とかは結構早いみたいですが・・
129名無しさん@そうだ選挙にいこう:02/04/20 03:07
一応仕事で使ってますよ。まだ勉強中ですが。
開発のほうも少々。
まぁ日本語の扱いについてはさすがジャストシステムと言った感じですね。
Namazu すげえな。
なによりオープンソースでフリーなのがいい。
http://www.kusastro.kyoto-u.ac.jp/%7Ebaba/wais/other-system.html#Namazu
の導入実績がすべてを物語ってる感じだな。
国会図書館でも使われてるのね。
131名無しさん@そうだ選挙にいこう:02/04/20 20:41
>124
遅レスだけど、

mknmz --exclude="folder1|folder2" c:\data

でできない?
-uオプションも通るけど?
132名無しさん@そうだ選挙にいこう:02/04/21 02:07
インターネットブーメランが話題になってて、かなりほほえましいです。
そろそろ次バージョンが出てもええんちゃうの? っていう気がしてますけど。

コンセプトは素晴らしかった。今こそ、バージョンアップで日の目を見てもええんちゃうかなぁ。

JUSTSYSTEMよ、頑張ってくれage。
>132
禿同
134名無しさん@そうだ選挙にいこう:02/04/22 20:33
Windows2000に標準装備のindexサービスは全文検索ソフトの一種ですか?
たまにIndexが壊れたりしますが・・・活用されてる方いますか?
わたしは
"filename" hoge.*
なんてのをよく使います。
>>134
事故レスです。高度なクエリで
#filename hoge.*
でした。(これしか使えない)

ファイル名のカタログするソフトを色々探しているうちに
結局indexサービスがこの目的では結構使いやすいことが解りました。
 特にCPU負荷が高いときには殆ど動かない様子であるところが良いです。

全文検索的な使い方はできそうなのですが理解できません・・・・・
136名無しさん@そうだ選挙にいこう:02/04/23 00:50
>>135
参考URL:【Microsoft インデックスサービス設定ガイド】
http://www.microsoft.com/japan/sharepoint/techinfo/Other/
137名無しさん@そうだ選挙にいこう:02/04/24 21:58

 どうにかこうにかsearch-sでファイル検索できるところまで来ましたが
うーむ、いまいちな結果・・・・・

2chログを検索してヒットしたものを読もうと思ったんですけど生データで
表示されちゃうんですね。 これじゃ読めないや(笑)
拡張子ごとに設定できたらいいんですけどそのような項目は発見できません
でした。
他に何か良いアイデアありませんでしょうか?
申し訳ないですけど何かありましたら教えてください。

インターネットブーメランも悪くはないんですけどDBを構築するのに
凄く時間が掛かった記憶があってどうもねえ・・・・・


>>137
「ツール→オプション→webブラウザ→外部」では?
>>137
俺は HTML 化してる。
レスごとにアンカーつけて分割してインデックス化。
140名無しさん@そうだ選挙にいこう:02/04/26 00:10
俺は耐えきれずに
ジャストシステムにインターネットブーメランの
サポート続けるか、新バージョンだせやごるあ
と要望を出しました。
141名無しさん@そうだ選挙にいこう:02/04/26 15:00
>>137 です。 
やはりそんなところしかなさそうですね。
有力なのはHTML変換してから検索かな。

>「ツール→オプション→webブラウザ→外部」では?
確かにIEに表示はされるんですけどデータがそのまま表示されちゃいます。
ちょっとこれを読むには辛そうです。

やはり、>140さんが言うようにインターネットプーメランの新バージョンを
ジャストに出して貰うのが一番良さそうですね(笑)


142名無しさん@そうだ選挙にいこう:02/04/26 19:11
>>140
だな、バージョンアップしなくてもいいから、
コンセプトサーチ用につくったエンジンとフィルタ公開しろやゴルァやね。

ってこんせぷろさーちべーす1000も同じだったりして。
1千万もとって、ゴミ売りつけるなゴルァ状態なんでしょうか?>使ってるヤシ

143140:02/04/27 14:55
みんなで力を合わせて、
https://www.justsystem.co.jp/ask/?w=sm
で、
インターネットブーメランのサポート続けるか
新バージョン出せやごるあ!
という要望を出しましょう。
みんながやれば、想いはきっと届くはずです。
俺は、また送要望を出しました。
144名無しさん@そうだ選挙にいこう:02/05/07 04:59
フルじゃ葉でかかれたナマズ希望
145名無しさん@そうだ選挙にいこう:02/05/08 20:35
>144
JAVAで? 需要あるのかなあ?
146名無しさん@そうだ選挙にいこう:02/05/09 10:07
NAMAZUは確かに高性能だけど、やっぱりPC初心者には導入に難がある。
MSが全文検索の意義に気づく前に、そしてNamazuのインストール簡単版が出る前に
何とかしてくれジャストシステム!
147名無しさん@そうだ選挙にいこう:02/05/18 12:48
age
148名無しさん@お腹いっぱい。:02/05/18 19:29
アクセラテクノロジ
http://www.accelatech.com/

↑の検索エンジン、(・∀・)イイ
149名無しさん@そうだ選挙にいこう:02/05/18 22:35
インターネットブーメランだが、けっこう荒削りだと思う。
だいたい情報ボックスの構築中にパソコンが止まると、データが壊れる。
ロールバック機能くらい入れればよいのに。
それにCPUを100%使用する割には、スレッドの優先度が通常なので、処理が重くなって困る。
あとなんでEPWinGに対応していないのだ?
インターネットブーメランといえば、昔こんなのを作った記憶が...

http://www.kjps.net/~kouno/iboom/index.html

話題性なくて半分くらいコンテンツ作ったところで撃沈。
151名無しさん@そうだ選挙にいこう:02/05/21 01:15
IBもConceptBaseも基本エンジンは同じよ♪
500万円でばかすか売れるものを8000円で買えるんだから
サポートが続いてるだけいいんじゃない?
152名無しさん@そうだ選挙にいこう:02/05/21 09:48
サポート続いてるのか?
事実上されてないと思うんだがな。
153名無しさん@そうだ選挙にいこう:02/05/21 21:54
サポートは中止されてるっしょ。
大昔のアップデーターがいまでもダウンロードできるだけ。
154名無しさん@そうだ選挙にいこう:02/05/26 22:26
こんなんだったらタダで使えるみたいだが。UNIXだけど。
http://freshmeat.net/projects/snatcher/
IB、\3,400なら買い?
156名無しさん@そうだ選挙にいこう:02/05/31 03:47
age
>>152
>>153
もう、サポートされてないだろう。
俺、一太郎12を買うときにジャス
トシステムに一太郎12のファイル
読み込んでDB化したり閲覧したりで
きるか確認したら、未確認だ、と言
われてしまった。実際は、一太郎
12で作成したファイルも扱えるみ
たいだけど、同じ会社のアプリにも
見放されるなんて。。。
158名無しさん@そうだ選挙にいこう:02/06/06 13:00
>>157
ちょっとショックな回答ですね。自分もバージョンアップ期待してるのに。

これからのブロードバンド時代こそ、Googleに負けないためには自分に
必要なサイト(データ)だけを検索対象にすることが重要なのに。
>158
の見て思ったんだけど、iDiskにインターネットブーメランのエンジンを
提供するのってダメかな?
希望者にはiDiskにアップしたテキストや、一太郎のファイルを
CBSearchのエンジンで検索できるようにするの。

サバーの負荷は結構大きくなりそうだけど。。。定期的に更新したり
してくれたら、iDiskの増量も悪くないかな、とか、ちょっと思った。
160名無しさん@そうだ選挙にいこう:02/06/11 11:02
データをオンラインに置くのってダメダメだと思うんだけど。
今からは逆に、ローカルの重要性が増してくると思うよ。
161別スレ358:02/07/20 04:30
持ち歩きデータの検索活用と悩み
〜 Namazu DataHunter インターネットブーメラン
http://www.watch.impress.co.jp/pc/docs/2002/0718/mobile162.htm
162名無しさん@そうだ選挙にいこう:02/07/21 00:08
>>161
>これだけ長期に渡ってメンテナンスや次期バージョンが登場しないと、
>いつかは互換性で使えなくなるかもしれない。いずれも次期バージョン
>の予定は、現在のところないとか。

やはり個人向けにはニーズが低いということか
HDDに大量の文書データを溜めこんでる人なんて
あんましいないのかも知れないな
163名無しさん@そうだ選挙にいこう :02/07/21 05:33
尻集を検索するには便利
それだったらGrepあたりでも十分ぽいが
つうかWindowsの「検索」で充分だろ
以前のShurikenみたいに、オンラインソフトとしてでもいいから、復活しないかなぁ。。。。
167名無しさん@そうだ選挙にいこう:02/08/27 23:48
インターネットブーメランのweb巡回って、うまく使えている人いますか?
使い方でじゃなくて安定して処理できるか、ってだけ。
1ページとってくるだけなら動くが、1階層取りに行かせるとほぼ確実に終了しない。
ジャストのWebページでも
http://searchqa.justsystem.co.jp/support/faq/ib1/fs2ws012.html
こんな情けない説明があるので、仕方ないのだと思いますが。
いちおう最新パッチはあててあります。
168名無しさん@そうだ選挙にいこう:02/09/06 09:34
>やはり個人向けにはニーズが低いということか
>HDDに大量の文書データを溜めこんでる人なんて
>あんましいないのかも知れないな

お役所関係、教育関係、法律関係、研究機関
HDDには無くても大量に文書持ってる人は多いはず。
俺も悩んでます。
だから、ブーメラン新しいの出してね。
169 :02/09/07 22:31
>つうかWindowsの「検索」で充分だろ
文書の中身の検索ができんだろーが!たわけが!
なぜnamazuを使わない?
171名無しさん@そうだ選挙にいこう:02/09/07 23:40
>>170
NAMAZU って単なるキーワード検索しかできないんじゃないのか?
インターネットブーメランみたいに、類似文書を探し出してくれる方が
100万倍いいにきまってる。

おなじキーワードがあっても、全然関係ないような
ページが出てくるサーチエンジンとかみてたらそう思うね。
(キーワード増やして絞り込んだら、今度は必要なページが
検索結果から漏れたりするしな)
どうも俺とは用途が違うようだな。
俺は曖昧なキーワードでワケワカラメな文書がたくさん当たるほうが困る。
173名無しさん@そうだ選挙にいこう:02/09/08 09:37
>>169
テキストならできますよ。
174名無しさん@そうだ選挙にいこう:02/09/08 14:57
>>169
indexservice知らないの?
9xユーザですか?
175 :02/09/08 15:08
>>174
IISがinstallされてないと無理だろ。アホか。
>>175
2000から、IISがなくてもデフォルトのサービスで組み込まれてるんですよ。
177名無しさん@そうだ選挙にいこう:02/09/08 22:44
検索一番はだめ?
Word、Excel、PowerPoint、一太郎、PDF、テキスト、HTML形式に
対応してるけど。
178b:02/09/08 22:58
179名無しさん@そうだ選挙にいこう:02/09/09 01:50
>>177
だめ。ありゃGREP検索じゃん
一般的になり得ないジャンルだな、これ
>>177
grep が各種ファイルフォーマットに対象なら便利かと思ったら
売り物かあ。残念。OfficeファイルがXPに移行しちゃえば、
自分で作れるんだけどな。
182名無しさん@そうだ選挙にいこう:02/09/09 09:55
>indexservice知らないの?

知らなかったのでマイクロソフトに電話した。
win98の検索と同じ機能って言うことだった。
indexなんて言うからindex貼って検索するのかと思ったのに。
183完全サン@プル:02/09/09 19:32
,〜((((((((〜〜、
 ( _(((((((((_ )
 |/ ~^^\)/^^~ ヽ|
  |  _ 《 _  |
 (|-(_//_)-(_//_)-|)
  |   厶、   |    / ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
  \ |||||||||||| /  < サンプルを覗くのも・・・。
    \_~~~~_/     \_________
http://www.traffimagic.com/WIPE7MMLZCA/comein/CHKGK
無料で今日も”どっぴゅ〜” だっふんだぁ〜
184名無しさん@そうだ選挙にいこう:02/09/09 21:37
>177

ありゃあ、ファイルが増えると、途端に遅くなり、うちでは全く使い物にならなかった。2000以上の文書があると、もうダメ。
185名無しさん@そうだ選挙にいこう:02/09/09 23:06
>>182
> win98の検索と同じ機能って言うことだった。
MSウソゆってんな( ;゚Д゚)

Microsoft フルテキスト検索技術
http://www.microsoft.com/japan/technet/treeview/default.asp?url=/japan/technet/prodtechnol/sharepoint/reskit/part1/co5spprk.asp
186名無しさん@そうだ選挙にいこう:02/09/11 22:21
182です
> win98の検索と同じ機能って言うことだった
間違いですね。ファイルの種類は限られるみたいですが
インデックス貼れますね。
聞き方が悪かったのか?
PDF、一太郎、123、JPEGなどにインデックスできますか。
知ってる人教えて。
187名無しさん@そうだ選挙にいこう:02/09/12 18:23
>>186
PDF はフィルタを Adobe のサイトからダウンロードしてくれば大丈夫です。
一太郎はたしかインデックスつくってくれた筈です。
123はわからないっす。
JPEGはテキスト情報もたないんでむりっす。ヘッダ部分に関してはわからいけど、たぶん
だめでしょう。
188名無しさん@そうだ選挙にいこう:02/09/12 18:25
189名無しさん@そうだ選挙にいこう:02/09/12 19:45
1) START>設定>コントロールパネル>管理ツール>コンピュータの管理
2) サービスとアプリケーション>インデックスサービス>システム>カタログのクエリ
の操作が趙めんどーなんだけど、「カタログのクエリ」を一発で呼び出す方法ってないの?
190名無しさん@そうだ選挙にいこう:02/10/06 07:40
保守あげ
191名無しさん@そうだ選挙にいこう:02/10/07 08:56
っていうか、
インターネットブーメランの新バージョン出せよ >浮川

ワンマン経営なおまえがジャストシステムをだめにしたことわかってるのかよ。

いっぺん死んでこい。>浮川
>>191
新OSへの対応と新しいワードやPDFや一太郎のバージョンの
文章への対応だけで良いから新バージョン出して欲しいよね。
一太郎の次のバージョンや手裏剣プロのおまけって
形でも構わないから。。。。
昔はあんなに大いばりでコンセプトベースのこと
宣伝していたのに。。。。
193名無しさん@そうだ選挙にいこう:02/10/15 17:44
一太郎とかについてる、JSファイル検索ソフトっての? あれ、結構気に入ってるんだけど、細部突き詰めると、やっぱりクソだ。

■時々「システムエラー」とかで索引更新ができないときがある。何がどう悪くてエラーなのか位教えてくれんと修正のしようもない。

■ファイルサーバで索引を作って、クライアントからその索引だけを読み込んで検索しようとしても無視される。
イントラネットでの使用を見込んで、索引を共有できるとか、いっそのことインターフェイスをブラウザにしてくれたらかなり使えると思う。苦労してnamazuとかセッティングしなくてもいいし。

■資料があまりにも少ない。わしのまわりでは、ソフトの存在すら知らないヤツがほとんど。簡易マニュアル位付けてくれ。

■いくつかヒットしたとき、中身を確かめる方法が「開く」しかない。ビュアと連動して、開かなくても中身を確認できれば良し。

■ヒットした状態でファイルの移動とかコピーができれば良し。
194名無しさん@そうだ選挙にいこう:02/10/18 19:20
Glimpse
http://webglimpse.org/
なんかの話題もこちらのスレでよろしいのでしょうか?
195名無しさん@そうだ選挙にいこう:02/10/20 15:33
IIS の Indexing Service の話題はこちらのスレでいいでしょうか?
196IFilter:02/10/20 15:43
IFilter は、Indexing Service 用の拡張コンポーネントです。 IFilter をインストールする事によって、検索対象となる文書を拡張することが出来ます。
http://www.microsoft.com/japan/sharepoint/downloads/IFilter.asp
198名無しさん@そうだ選挙にいこう:02/10/20 15:57
DocuWorks もあるのか・・・
でも俺が買ったのはバージョン5.0なんだが。

ところで、Indexing Service ってサービスとして使えるわけだよね。
ASPと組み合わせて、Webサービスとして。

単独スレって、ないんかな?
>>196 Indexing Service について色々調べようと思ったら、
検索にヒットするのは CodeRed の話題ばかり・・・
200名無しさん@そうだ選挙にいこう:02/10/20 21:24
Indexing Service って、コマンドラインからのクエリーはできないの?
201名無しさん@そうだ選挙にいこう:02/10/20 21:27
>>198
DocuWorks 5.0 用のフィルタもあるよ。
http://www.fujixerox.co.jp/soft/docuworks/download12.html

てか、Microsoft の Indexing Service ネタは Windows 板のほうがいいと思うんだが。
Microsoft SharePoint Portal Server とかの話題も含めて。
202名無しさん@そうだ選挙にいこう:02/10/23 01:45
Indexing Service は、[スタート] ボタンをクリックして [検索] をクリックしたとき、
Ctrl キーを押しながら F キーを押したとき、Windows エクスプローラの [検索] ボタンをクリックしたとき、および Office XP の [検索] 作業ウィンドウをクリックしたときに画面に表示されます。
>>202 Windows キーを押しながら F のまちがい?
>>154 で既出ですが、Snatcher 使っている人いますか?
http://www.arc.ritsumei.ac.jp/kachina/mikio/spex-ja.html
ttp://www.kilab.tama.or.jp/~komai/software/namazu/kakasi/index.html
をみるとnamazuの辞書に追加をすることは可能なみたいです。とりあえず、
ftp.namazu.org/kakasi/stable/kakasidict.XXXXX.gz
をひろってきて中身を見てみると、普通のテキストファイルでした(たぶん
エディタが対応していれば)。つまり、辞書に何が登録されているのかも
分かるということです。
って、よく読むと既出てか
207うっかりさん:02/10/25 21:17
>>199
関連スレ立てましたので、こちらもよろしくお願いします。
Microsoftの全文検索ソフト(Indexing Service等)
http://pc3.2ch.net/test/read.cgi/win/1035387243/
>207
なんでわざわざスレを立てるのさ?
ここで良いじゃないか
Comparing Open Source Indexers
http://www.infomotions.com/musings/opensource-indexers/

オープンソースの検索エンジンの話題もここでいい?
オープンソースの全文検索ソフト
http://pc.2ch.net/test/read.cgi/linux/1036088927/
211名無しさん@そうだ選挙にいこう:02/11/02 03:06
ビレッジセンターが新しいの出すみたいだね
http://www.villagecenter.co.jp/soft/searchx/
誰かレビューして
212名無しさん@そうだ選挙にいこう:02/11/02 17:04
>>211
使っていないが、技術的には難しくないね。平仮名が使えないところがミソ
需要があるならゴニョゴニョゴニョ
213名無しさん@そうだ選挙にいこう:02/11/02 19:53
>> 204
Snatcher使ってみた。サーバ版のStokerを使うとかなり速い。
214:02/11/02 21:45
>>211
パッケージ版としては久々の新作ですね!
早速ダウソしてみました。
試用してみて良かったら\4800払うべ
215名無しさん@そうだ選挙にいこう:02/11/03 00:55
>>214
試用レポートよろしく!
216:02/11/03 00:57
「サーチクロス」試用しました。
結構いい感じじゃないかな?
インデックス作成もかなり早いし、インデックス容量も凄く小さい
うちではnamazuの1/3くらいの容量だった。
気になるのはnamazuと同じ検索ワードでヒットする数がかなり多い。
namazuに検索漏れが多いのか、サーチクロスにゴミが多いのか・・・

公式サイトの掲示板が結構盛況で細かい要望点にも答えてくれてきたようだから
今後の文書フィルタ等のサポートに期待かな?
217212:02/11/03 07:30
サーチクロス感想
・インタフェース
最低必要な機能が一通りありながら、予想以上に簡単に扱える
検索結果がリスト表示なので見辛いが、初心者を考えればこれでいいだろう
・検索能力
検索速度は当然よい。
スコア計算をしていないのか、複数ヒットすると目的の文書を見つけるのに
手間がかかる。検索が単語単位でない場合、いろいろマズイ
・平仮名の扱い
気持ちいいくらい見事なまでに完全に平仮名を無視していた
平仮名を無視すれば索引を大幅に縮小でき、
形態素解析もほぼ不要になる、またヒット率も向上する
宣伝には大きくは書かれていないが、平仮名を検索できないのは大きな
イメージダウンやトラブルに繋がると思われる。どう対処するかが見所
218212:02/11/03 07:31
・数値の扱い
索引における数値の占める割合は決して高くはないが、
数値の曖昧検索は意外と難しい
また扱わなければ索引を縮小できるので、上手くごまかした印象
需要も少ないので正解
・価格
採算を心配するくらい安い。ネットワーク販売が特別好調でない限り
なんらかの手は打ってくると思われる
・試用した範囲
8000件の比較的小さなHTML文書とメール少々
肝心な巨大文書は試していない
・全体
検索もコツを掴めば全く問題ない
使いづらい部分もあるが値段を考えれば十分すぎる性能
219名無しさん@そうだ選挙にいこう:02/11/03 11:03
サーチクロス」試用しました。
検索ファイルが直接編集・削除などできるのがいいですね。
必要なくなったファイルなどはnamazuで発見したとき、
WIN標準の検索でさがして、削除してるから。
220216:02/11/03 14:26
>>218
> 肝心な巨大文書は試していない
巨大なBBSログを何本も溜めこんでますが、巨大文書も全く問題ない模様。
namazuではなかなか手間取る一太郎やPDFもバッチリインデックス化できました。
あと不満なのがタスクトレイに常駐できないところ。
せっかく自動更新機能も付いてるのにこれでは無意味なのでは……?
221名無しさん@そうだ選挙にいこう:02/11/04 02:06
☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆
●知る人ぞ知るあのビジネスです。ビジネスに役立つマル秘情報など満載です。
http://www.zero-city.com/smilesmile/index.htm

●私がビジネスの助けとして今でもよく利用させて頂いているHPです。
(DMよりは効果は薄れてしまいますが、安いし確実なのでおすすめです。)
http://fsjp.com/compile/join.cgi?AG164729

●最近ではこんな大手でも代理店募集してるんですね(驚)
(還元率けっこう高いです。HPをお持ちの方に特にお勧めします。)
http://join.dreampartner.jp/fase/bb/index.html
☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆☆
222名無しさん@そうだ選挙にいこう:02/11/06 05:21
サーチクロス意外に評判高いね。WZMAILを使っている自分としては
かなり迷う。インターネットブーメラン、バージョンアップしなそうだし…。
223名無しさん@そうだ選挙にいこう:02/11/06 23:24
>>222
PDF対応つってもなぁ・・・
PDFが暗号化されていると検索できないのが致命的だな。
雑誌の縮刷CDのPDFなんかを検索できないと、オレの用途としては使いづらい。

インターネットブーメランはPDFの検索が実際上お話にならないのであれなんだが。
正直な話、インターネットブーメランがバージョンアップしたら最強なんだけどな。
224211:02/11/07 00:15
迷っていたところ、図ったようにビレッジセンターからWZ4.0ユーザー優待販売
(4300円)の知らせが届いたので買うことにしますた。レビューしてくれたみんな
ありがとう。参考になりました。

>>223
なるほろ。まーいいや。時期にバージョンアップすることに期待…。
サーチX、店頭販売の方が安くなりそうな予感が…(藁
226211:02/11/07 02:26
>>225
うそ?しかも明日払い込んでも到着するの遅そうだし…。
227名無しさん@そうだ選挙にいこう:02/11/07 22:16
ダウンロード販売でいいじゃん
228名無しさん@そうだ選挙にいこう:02/11/07 22:22
namazuでいいじゃん
229名無しさん@そうだ選挙にいこう:02/11/07 23:03
「サリン」で「キャサリン」とかがヒットする…… >サーチクロス
今時形態素解析を使わないインデクサも珍しいね。
インデックス作成が速く済んで良いが……
230名無しさん@そうだ選挙にいこう:02/11/07 23:49
2ちゃんで盛り上がればIBバージョンアップするんじゃないかなぁ
CB作ってる会社だし、技術的にはなんら問題ないと思う。
こっそり会社でIB使ってるけど今でもすげぇ便利。
メールの検索とか特に・・・。
231名無しさん@そうだ選挙にいこう:02/11/08 15:25
ソースネクスト社から「速捜X」ってのが出てるみたいです。
http://www.sourcenext.com/products/sokusou/
232名無しさん@そうだ選挙にいこう:02/11/11 08:14
>>230
ATOKと連携できるからIB(JSファイルサーチも)ってすごく便利なんだよね。
九州弁対応とかどうでもいいから、そっちの方からやってくれよ>Just
233名無しさん@そうだ選挙にいこう:02/11/11 13:46
>>189
一発じゃ無理だが、system32\ciadv.mscのショートカットを作っておけ。
234名無しさん@そうだ選挙にいこう:02/11/11 16:53
IB、バージョンアップしないなら、http://www.copernic.co.jp/あたりと統合して欲しいなぁ
Justsystemには、捨てるにはもったいないのにほったらかしのソフト(五郎とか)が多すぎる。
235名無しさん@そうだ選挙にいこう:02/11/11 17:00
IBとATOKの連携ってどうやるの?
236名無しさん@そうだ選挙にいこう:02/11/11 20:26
>>231
PDF と代表的なメーラーサポートしていないんじゃ、つかえねーYO!
IB以下だな
237名無しさん@そうだ選挙にいこう:02/11/11 20:35
なぜ>>1-3のリンクにNamazuが無いのだ?
全文検索といえばNamazuが圧倒的に有名だろうに。

http://www.namazu.org/
238名無しさん@そうだ選挙にいこう:02/11/11 21:03
>>237
>>1には Namazu for Win32 のリンクが貼ってあるようだが?
239名無しさん@そうだ選挙にいこう:02/11/12 02:29
>>235
自分まだATOK13だけど、ATOK13のプロパティってあるでしょ。
それでスタイル設定、スタイル一覧から適当なものを選んで
(自分はスタイル新規作成)、キーカスタマイズ。

下の方にコンセプトナビってあるから、自分はCtrl+0に割り付けて、
エディタでもエクセルでもワードでも、その文字を入力中にCtrl+0
を押せばコンセプトナビ(IB)が立ち上がって、立ち上がれば既にその
文字が入って検索された状態になってる。

同様にCtrl+9がJSファイルサーチで、+8が郵便番号、+7がドクター
マウス辞書。新たなATOKのバージョンは解らない。ごめん。
ともかく一々検索アプリ立ち上げなくて良く、立ち上げたときには既に
検索されているのですごく便利。

他の検索ユーティリティーもIMEとの連携を考えてくれればいいのに…。
240名無しさん@そうだ選挙にいこう:02/11/13 10:43
>>236
対応ファイルフォーマットの多さ云々以前の問題。
ソースネクストからでている時点で
糞以下
241名無しさん@そうだ選挙にいこう:02/11/13 12:52
Justに要望を出しました。その返事。


○○○○ 様
 
弊社製品・ホームページをご利用いただき、誠にありがとうございます。
 
>インターネットブーメランのサポート(パワーアップキット)の継続もしくは、新バージョンの開発をぜひぜひお願いします。

お寄せいただきましたご意見・ご要望は、各担当部署に伝え、今後の製品
開発・サービス向上の参考にさせていただきます。
 
今後とも弊社並びに弊社製品をご愛顧賜りますようお願い申し上げます。

------------------------
株式会社ジャストシステム
ご意見・ご要望承り窓口
http://www.justsystem.co.jp/ask/
------------------------
242名無しさん@そうだ選挙にいこう:02/11/13 20:07
>>241
自分ところに来た返事と全く一緒w。
>>242
自動返答だったりして
244名無しさん@そうだ選挙にいこう:02/11/13 22:09
譬えコピペ文だったとしても、ある程度期待の持てる返事ではないか?
やる気ないならやる気ないとはっきり言うよ。最近の企業は
245名無しさん@そうだ選挙にいこう:02/11/14 01:03
Indexing ServiceとExcelで全文検索のマクロを作ってみた。
あまりテストしてないので、使うときは自己責任で。
http://fhewfhew.hp.infoseek.co.jp/IdxsrvQuery20021113.zip
246名無しさん@そうだ選挙にいこう:02/11/15 02:46
>>244
サポートに聞いてみたら、「インターネットブーメランのバージョンアップの
予定はありません」だって。萎え。何考えてんだあの田舎会社。
247名無しさん@そうだ選挙にいこう:02/11/15 03:32
トップページ製品情報の、「インターネット・携帯電話」からも
インターネットブーメランのリンクないし…
>>246
ユーザーのニーズつかむのホント下手だね、あの会社。
249名無しさん@そうだ選挙にいこう:02/11/15 06:24
一太郎は拝金奴のごとく毎年バージョンアップするくせに、
肝心なものは全くバージョンアップしないって、ほんとクソ会社だよな…。
今だったらブラウザを新しく開発して、Shurikenもそれに併せて、ATOK16をつければそれなりに売れると思うのだが・・・。
一太郎は正直どうでもいいが買ってしまうんだろうな。
251245:02/11/15 20:52
インデックスサービスとExcelでの全文検索のマクロ
バージョンアップしました。
・ソート機能を追加
・インデックスサービスのヘルプ表示機能を追加
http://fhewfhew.hp.infoseek.co.jp/IdxsrvQuery20021113.zip
252245:02/11/15 20:53
乙彼!
254245:02/11/16 02:28
インデックスサービスとExcelでの全文検索のマクロ
またまた、バージョンアップ
・カタログの選択をフォームで行うようにした。
・検索するディレクトリを選択できるようにした。
http://fhewfhew.hp.infoseek.co.jp/
255名無しさん@そうだ選挙にいこう:02/11/16 22:46
「サーチクロス」あの「噂の真相」の裏表紙に広告出しているじゃぁないか。
なんか萎え・・
256名無しさん@そうだ選挙にいこう:02/11/16 23:30
>>255
今頃萎えてんなよ・・・
ビレッジセンターの社長は噂真の編集長と仲がいいから、
VZもWZも広告出してたぞ。
噂の真相のライターは皆WZ使い
258245:02/11/18 20:40
バージョンアップしてみた。
これで完成かな?
http://fhewfhew.hp.infoseek.co.jp/
259ろてぃれる:02/11/19 01:00
>>246
■情報ボックス(インデックス)を更新する際に、NAVEX ばりに新しいのをワンセット
 作ってからスイッチするようにする。
→更新中に強制終了してもデータは無事。
→IB 本体から参照中の情報ボックスを更新できない問題を解消。

■対応文書フォーマットの拡大。それがダメなら MS IFilters 互換に(爆
→PDF の件も一気に解決。DW から乗り換えたい人にも勧めやすい……?

・情報ボックス更新スケジューラの優先度を変更可能に。
・情報ボックスのサイズ制限を撤廃。
・速度低下は覚悟の上で、普通の全文検索機能の搭載。
・NS7 や Opera にもこの際対応。
・Win XP 等で、情報ボックスマネージャーが“System Volume Information”に
 アクセスしてエラーを出すのをなんとかする。

・結果リストなどに使われている JS 独自スクロールバーを OS 標準に。
 ↑マウスドライバによってはスクロールできない?

パッと思いつく要望はこれだけありますが、真面目に取り組むと結構大変そう……。
とりあえず、メニューの「ヘルプ→NewsTrek」を消すパッチくらいは出して欲しい(笑

# 一太郎のヘルプは有名ですが、文例集の検索機能も CB っぽい。
 13で新しく付いた「参照機能」に IB をプラスして、Word 文書も再利用しやすくして
 しまえばウリになるのでは? と思うのは私だけでしょうか?
 ttp://www.zdnet.co.jp/products/justsystem/ichitaro13.html
260名無しさん@そうだ選挙にいこう:02/11/19 12:37
>>258
更新日の入力がちょっと変です。
261245:02/11/19 20:54
262名無しさん@そうだ選挙にいこう:02/11/21 23:42
このレビューってどうよ?
http://review.ascii24.com/db/review/soft/hddutil/2002/11/11/639816-000.html
単なる宣伝に見えるのだが。

比較してるのがWindows XP標準の検索機能ってのが...
あれはインデックスを作らないファイルや圧縮ファイルも検索するから
時間がかかるのは当たり前。
Office Xpの検索は速いよね
MSは「インデックス サービス クエリ フォーム」を使いやすくすれば良いのに
263名無しさん@そうだ選挙にいこう:02/11/23 00:49
まぁ自分はWZMAIL使いで、あの程度の検索で満足するから使い勝手
良いんだけど、他の人が満足するか疑問<サーチクロス
インデキシングが早いのはすごく良いけど。
264名無しさん@そうだ選挙にいこう:02/11/27 06:49
>>262
ascIIは基本的にヨイショ記事ばかりでしょ
265名無しさん@そうだ選挙にいこう:02/11/28 01:33
サーチクロスがなかなかよく売れているみたいで・・

これに触発されてインターネットブーメランがバージョンアップとかだったら最高なのにな。
266名無しさん@そうだ選挙にいこう:02/11/28 09:05
>>265
室井茂の影響か?
mp3落としたやついる?なかなか名曲(w
267名無しさん@そうだ選挙にいこう:02/11/28 14:18
>>266
現段階では、マメにアップデートしてくれるのも要因かも。

新機能は今のうちに実現しておいてもらわんと、二度と実現されないだろうからね、鮮度が落ちてからは。
268名無しさん@そうだ選挙にいこう:02/11/29 20:24
サーチクロスいいねえ
時々落ちるけどな w)
269名無しさん@そうだ選挙にいこう:02/11/30 22:26
Snatcherイイ!
Windows版出ないのかなあ
270名無しさん@そうだ選挙にいこう:02/12/01 13:57
ソースネ糞トの「速捜X」のレビューはないかのぉ
271名無しさん@そうだ選挙にいこう:02/12/01 18:18
>>270
あれはやめとけ、糞だぞ。使ってみたが、設定から、まずわかりにくく
検索結果の表示も使いづらかった。namazuやサーチクロスにしときなさい。
272名無しさん@そうだ選挙にいこう:02/12/02 17:37
日本ヒューレット・パッカード(株)は26日、日本語全文検索ソフトの最新版『MitakeSearch(ミタケサーチ) V3.2』を発表した。
新バージョンはフィルター機能、マルチサービス検索、PostgreSQLに対するアクセス機能などを追加したのが特徴。
製品版の価格は9万円(Linux版/10万ファイル対応)からで、フリーライセンス版も用意する。
フリーライセンス版は、検索できるファイルの上限が1万までに制限されている以外は製品版と同等。
使用期限の制限もなく、コピーや再配布も自由で、同社のサイトから無償でダウンロードできる。

暇な人レポートよろ
273bloom:02/12/02 17:43
274名無しさん@そうだ選挙にいこう:02/12/03 08:15
サーチクロス、いいよ。なんてったて速い!
鶴亀のオレには大満足。

で、
>266
作詞、作曲は、大日本検索音頭協会とからしいけど、
伊東に行くならハトヤの人がつくったんだって。
なんか知らんけどあのmp3ファイル、触っただけでエクスプローラが落ちる罠
276名無しさん@そうだ選挙にいこう:02/12/03 18:59
これが日本語環境で使えたらなぁ
ttp://www.zdnet.co.jp/news/0211/29/nj00_sixdegrees.html
277名無しさん@そうだ選挙にいこう:02/12/03 19:43
サーチクロス、レジストしようと思ってるんだけど
バージョンアップのたびに試用期限が30日に戻るから
どんどん先延ばしになっていく……
278名無しさん@そうだ選挙にいこう:02/12/03 21:56
サーチクロスはWordやExcelで問題があるので使えないよう...
半年以上前にテストした時はNamazuもインデックスがうまくできなかった。
マクロ、差込印刷、外部へのリンク、他のファイルの埋め込み等が原因?
Office文書はインデックス サービスが安心できるね。

MitakeSearchは高くて買えないよ。フリーのファイル検索上限数1万件はちょっと少ないし。
>>277
昔のNetscapeみたいだな(藁
BBSでどしどし改善要望を出そう!
280名無しさん@そうだ選挙にいこう:02/12/05 13:12
本田雅一氏もサーチクロスに注目
http://www.watch.impress.co.jp/pc/docs/2002/1205/mobile182.htm
281名無しさん@そうだ選挙にいこう:02/12/05 15:12
> Outlook 2002のメールを検索してくれず四苦八苦している
だめじゃん
282☆☆☆☆☆:02/12/05 15:15
283名無しさん@そうだ選挙にいこう:02/12/05 19:37
サーチクロス試用中だけど、最初は結構使えるじゃんと思ったのだが、
300MB ほどのメールボックス食べさせたら、うじゃうじゃヒットしすぎて
わけわかめ状態になってしまった。

んー DiskX Search か IB 復活きぼーん。
284名無しさん@そうだ選挙にいこう:02/12/05 19:53
サーチクロス(の検索結果)にノイズが多いのは何で?
形態素解析アルゴリズムを使っていないから?
285名無しさん@そうだ選挙にいこう:02/12/05 22:40
でしょうな
286名無しさん@そうだ検索にいこう:02/12/07 06:35
サーチクロス使用しているけど、「ひらがな」を完全に無視するから
はっきり言って使い物にならん

「2ちゃんねる」で検索かけると「2」でしか探してこない
「むつ市」で検索かけると「市」でしか探してこない
「なべやかん」になるとデータがありませんときた日には・・・(藁

こんなモノ、金取って売るなよって言いたい!
287名無しさん@そうだ選挙にいこう:02/12/07 06:39
>>286
「なべやかん」って文字列の入ったデータを持っているってだけで、
かなーりDQNのかほりが...
288名無しさん@そうだ選挙にいこう:02/12/07 06:58
サーチクロスに限らず、(試用版を使っているが)、
オレには「ひらがな」での検索は必要ない。
他の検索語(数字を含む)で探せばよいと思う。
人形は顔が命。検索はスピードが命。

ま、「ひらがな」対応した時はそれで検索するのかも知れないけど。
289名無しさん@そうだ選挙にいこう:02/12/07 09:27
恐ろしいほどの遅レス

>>223
>雑誌の縮刷CDのPDFなんかを検索できないと、オレの用途としては使いづらい。
それって画像として収録されていてテキスト情報が入っていないだろうから
どうやっても検索できるわけ無い。
290名無しさん@そうだ選挙にいこう:02/12/07 09:29
>>269
cygwinでコンパイルしる
ソースを自力で修正しないと行けないけどね。
291名無しさん@そうだ選挙にいこう:02/12/07 09:36
>>284
検索語が四字熟語とかだと検索+ボタンを押すとノイズが減るかも

たとえば「焼肉定食」で検索する場合
「焼肉」and「定食」で検索されて
さらに検索+で「焼肉定食」をgrep的に絞り込む感じ


「2ちゃんねる」で検索してみた…
ヽ(`Д´)ノモドッテコネーヨウワァァン!!
>>289
(´,_ゝ`)プッ
293名無しさん@そうだ選挙にいこう:02/12/07 13:30
>>292
雑誌の縮刷CDってテキスト情報も入ってるの?
昔LinuxマガジンのDVD(雑誌の無い用の入ったPDF集)を買ったけど単なる画像だったよ。

テキスト情報が入って無かったら検索出来ないと思うけど違うの?
OCRじゃいくらなんでも限界があるでしょ。
294223:02/12/08 02:24
テキスト情報入ってるんだけど・・・

オレが使おうと思っているのは、日経エレクトロニクスの縮刷とかそんなのです。
保護されているので、検索できないツールが多い。
295名無しさん@そうだ選挙にいこう:02/12/08 06:30
>>294
セキュリティ強制解除してしまうって方法もあるよ
http://www.elcomsoft.com/
296245:02/12/08 20:57
【インデックスサービスとExcelでの全文検索のマクロ】
大きなバグがありましたゴメンナサイ。

修正内容
・更新日による検索結果に漏れがあった。更新日の指定方法を変更。
・項目名、メッセージの一部を変更

http://fhewfhew.hp.infoseek.co.jp/

>>296
OTSU!
298名無しさん@そうだ選挙にいこう:02/12/12 18:51
サーチクロス、ひらがな対応w)
>>298
マジで?でも、ひらがなに対応すると辞書が膨れ上がって
他の検索ソフトと大差なくなるよ
さて、どうごまかす?
300名無しさん@そうだ選挙にいこう:02/12/13 20:38
代わりに漢字辞書を捨てたってさ w)
「焼肉定食」も「2ちゃんねる」も「むつ市」も一発だった。

ここ見てるのかと思ったが、「なべやかん」は辞書にはいってない。
「そのまんま」と「らっきょ」は人名辞書に入ってるのにィ
301245:02/12/17 23:22
「インデックスサービスとExcelでの全文検索のマクロ」を
Visual Basicで作り直しています。
ニーズ有りますか?

作成中の画面
http://fhewfhew.hp.infoseek.co.jp/image/satori_beta.gif
302名無しさん@そうだ選挙にいこう:02/12/17 23:25
>301
ありありです。期待しております。ぜひ公開お願いします。
303名無しさん@そうだ選挙にいこう:02/12/17 23:40
【祭り】「TIME」誌2002年の顔にアラファト議長を!
昨年の投票に懲りたのか、TIME誌は投票可能な人物を
あらかじめ設定するという方法に出てきました。これは黙っていられません。
2ちゃんねらーの力で、彼ら米国人が最も無視したい人物
「Yasser Arafat」アラファト議長を表紙にしましょう!!
現在シャロン(イスラエル首相)を推す対抗勢力に押されています。増援求む!
投票はこちらから↓ 12月22まで!
http://www.time.com/time/personoftheyear/
画面右下、「Yasser Arafat」にチェックを入れ、
「VOTE」ボタンを押すと投票できます。
初代スレ:http://live2.2ch.net/test/read.cgi/news/1039871151/l50
前スレ:http://live.2ch.net/test/read.cgi/festival/1039909795/l50
主陣地:http://live.2ch.net/test/read.cgi/festival/1039959396/l50

>>301
Excelでの動作環境がよくわかっていないため希望します。
>>304
hagedou!
306名無しさん@そうだ選挙にいこう:02/12/18 23:32
>>304
インデックスサービスは動作してる?
307名無しさん@そうだ選挙にいこう:02/12/19 14:50
>>301
ほしいです。
自分で使う分には EXCEL でもいいんだけど、
同僚に、このソフト入れるから自分で探してねってできるのがいいっす。
308名無しさん@そうだ選挙にいこう:02/12/20 00:18
サーチクロス、最新版が駐在可能に
>>308
駐在って‥‥(w
310サーチクロス:02/12/20 08:56
うん、確かに常駐可能になってる!
このソフトのVerUpは、すごすぎ。
毎週新しくなっているような気がする。
311名無しさん@そうだ選挙にいこう:02/12/20 16:47
でも、サーチクロス Datua のログのインデックス作成させよとするとエラーで止まってしまう。
1.02 の時は問題なかったのに、1.05/1.06 にアップしたらエラーがでるようになってしまった。
(しくしく、折角レジストしたのにつかえないぢゃん)
312301:02/12/20 19:27
期待してる人もいるようなので開発を進めています。
Excel版より高速で使い易くなっています。

開発中の画面2
http://fhewfhew.hp.infoseek.co.jp/image/satori_beta2.gif
313名無しさん@そうだ選挙にいこう:02/12/22 12:37
245氏は神!
サーチクロス1.6のひらがな辞書、きちんとデフォルトで
「2ちゃんねる 2ちゃん 2ch」と登録されてるのにワラタ
それはすでに300で指摘されている
1.06で辞書追加されてるのは「なべやかん」
「おさみ」もはいってるぞ
316245:03/01/02 21:47
暇つぶしに作ってみた

インデックスサービスをvbsで検索するサンプルです。
http://fhewfhew.hp.infoseek.co.jp/sample/query.vbs

Visual Basic版は近日中にリリースできそう。
317fhew ◆inDExNNjx. :03/01/03 20:16
245です。

インデックスサービスによる全文検索ソフト
サトリ ver.1.00 をリリースしました。
http://fhewfhew.infoseek.ne.jp/

Excelマクロで公開したものを、Visual Basicで作り直したものです。
今回はインデックスサービスを理解できていない方でも使えるように考慮しました。

サトリをリリースしたので、Excelマクロは公開中止です。
>245様
早速使ってみました。
なかなかいい感じです。

しかし、こちらの環境で、タイトルが空白の文書が
ヒットしたときに、それをプレビューしようとすると、

プログラムエラーが発生しました。
エラー箇所:TimeerRsMove_Timer
エラーコード:94
エラー内容:Nullの使い方が不正です

と言うエラーが発生しましたので、報告いたします。
319fhew ◆inDExNNjx. :03/01/05 02:43
>>318
こちらでは再現できないエラーです。
デバッグのために、もう少し情報が欲しいです。
・インストールしたのはランタイム同梱版ですか
・Windowsのバージョン
・Internet Explorerのバージョン
・判るならMDACのバージョン、修正パッチの有無
・すべてのタイトルの無い文書で発生するエラーなのか
・特定のファイルだけで発生するならファイルの種類、拡張子

このスレを私物化するのはイヤなので、サトリについては
今後、私のサイトの掲示板に書き込んでください。
よろしくお願いします。
了解いたしました。
321名無しさん@そうだ選挙にいこう:03/01/06 11:16
サーチクロス使ってみたよ。
最高じゃん。
ジャストのIBなんかよりずっといいよ。
早いし。
322名無しさん@そうだ選挙にいこう:03/01/07 12:46
KWIC Finderはどうよ?
http://plaza3.mbn.or.jp/~h_ishida/KWIC.html
>>322
GREPは微妙にスレ違いかな?
>>1
  『一瞬で』目的の文書を検索する全文検索システム
とあるから‥‥
324名無しさん@そうだ選挙にいこう:03/01/07 22:52
>>323
GREPだけじゃないよ
「全文検索エンジンのクライアント機能。
namazuやMicrosoft Index Serviceで検索対象を高速に絞り込み、
KWIC Finder でファイル中の一致箇所を閲覧するハイブリッド検索が可能。」
325名無しさん@そうだ選挙にいこう:03/01/13 09:46
>>322=324
 情報ありがとう。

 けれど,
「検索対象を高速に絞り込み」は,いいんだけれど,
「KWIC Finder でファイル中の一致箇所を閲覧する」ためか
 DocuWorksはプレビューできないのがなんとも。それとも設定が悪いのか。

 サトリのようにIISでプレビューできればいいのに。
ageてしまった……スマソ
327名無しさん@そうだ選挙にいこう:03/01/15 09:38
Microsoft Visio用のIFilterがリリースされました。(1/9)
http://www.microsoft.com/japan/Office/Visio/downloads/default.asp
328bloom:03/01/15 09:39
329山崎渉:03/01/15 16:41
(^^)
330名無しさん@そうだ選挙にいこう:03/01/15 18:23
XPのインデックスサービスで、PDFのIFilter5.0が使えている人いますか?
SP1、NTFS、IIS5.1、Admin権限で使用しています。

いろいろ試しても一向に改善されず、インデックスサービスを無効にしたら
エクスプローラの検索で引っかかるようになったものの、grep検索になって
しまいます。で、有効にしたら今度はかすりもせず…

Acrobat5.0のCD-ROMに入っているクセロPDFサーチLiteも使ってみましたが、
これもgrep検索で、かなり時間がかかります。
(検索結果から該当箇所にジャンプできるのは大変便利なんですが)
インデックスサービスでPDF検索使いたいYO〜!!
331330:03/01/15 18:27
書き漏らしました…

>SP1、NTFS、IIS5.1、Admin権限で使用しています。
が、インデックスサービスでPDFが検索できません。
Win2000では使えているのですが。
332fhew ◆inDExNNjx. :03/01/19 00:07
>>330
Windows NT 4.0/2000は動作するが、Xp Home/Proはダメみたいです。
おそらく、Windows Xp日本語版だけの問題でしょう。
Windows Server 2003のリリースも近づいてきたので修正して欲しいですね。
333330:03/01/19 20:40
>>332
コメントありがとうございます。
そうですか…非常に歯がゆいです。

Adobeはまだこの問題を認識していないんでしょうね。
動作確認していれば、動作環境にXPを含めて掲示したりしないはずだし。
Adobeのサポートは電話のみでしかも有料だし…
334さっちんX:03/01/19 21:53
サーチクロスいいね。
買った甲斐が合ったよ。
株やってるもんで、メーリングリスト過去5年分やメールマガジンの過去4年分、その他2chログ
あわせて2ギガのファイル検索が1秒とは速過ぎ!!
しかもEdMAXに対応しているし、IEのキャッシュフォルダも検索対象にすれば過去のページも検索できるし
いうこと無しだね。

でもときどきF3押すとエラーで落ちるのがちと不満。
お試し版を入れていい感じだった>サーチクロス。
ただ、EXCELにマクロがあるとインデックス作成時に
マクロを実行しちゃうとゆー部分がどうにもダメで断念した。
>>335
私も同じです。Officeでマクロ、差込印刷とかあるとインデックス作成に問題あり。
OLEを使ったインデックス作成の仕様はだめでしょ。

インデックス作成の設定は柔軟じゃないし。
>>335-336
ちょっと煩雑でしょうけど、マクロのあるOfficeファイルは
見に行かないように除外指定するのではダメですか?
OUTLOOKのデータ覗きに行って、毎回OUTLOOKに叱られるのも、
何とかならんもんかのう。
339名無しさん@そうだ選挙にいこう:03/01/21 09:09
>>337
除外したら検索できなくなるからNG
それに、ファイルが大量にあるので、マクロファイルを
一つ一つ登録するのは大変だよ。

マクロがあるとインデックス作成は止まるし、サーチクロスが
エラーになったりすることがあるので、使うのはあきらめた。
使用期限も切れたし

インデックスサービス等、他のツールでは問題が無いので
サーチクロスのインデックス作成が糞なだけ。
対応するファイル形式、メールソフトを増やすより、こっちを直せよ
サーチクロス、インデックス作成時にエラーが出ていて、あきらめていたが
いつのまにかV1.07が・・・。改善したようなのでレジストしますた。
2chのログ検索だったからメモリ消費おおきかったのだろうか?
341さっちんX:03/01/21 11:11
>340

おれは2chのログおよそ600Mあるけどインデックス作成でエラーでたことないけど・・・・

>339

マクロあるとだめなのか。
しらなんだ。まあ、Office使わないからいいけど。
>>341
それが、うちでもWindows98では発生しなかったんだけど、2000だとでてた。
ログはもっとあるかもしれない・・・。ただ、98で試したのログは少ないから
あてにはならないんだけど。とりあえず、今は落ち着いているのでOK。
必ず出るというわけでもなくて、80%くらいの確率だったかな。
定期的に更新するとダイアログが出てうっとうしかった。
343337:03/01/21 20:12
>>339
サーチクロス公式の掲示板あるんで、そっちに
クレームつけたら、もしかしたら修正されるかも。
344339:03/01/23 17:46
KWIC Finderを使用してみた。

良い点
・必要な機能は揃っている(サーチクロスと同等)
・インデックスサービスまたはNamazuを使っているので安定している。
・サーチクロスより安い

悪い点
・検索フォルダにショートカットファイルがあるとウザイ
・デザインがダサい。
345339:03/01/23 17:55
まだ、あった。

良い点
・検索ノイズが少ない。

悪い点
・メールの検索方法はイマイチ、結果も見づらい。

メールを重視するならサーチクロス、
ファイル検索を重視するならKWIC Finderが良いかな。
346名無しさん@そうだ選挙にいこう:03/01/23 19:31
347名無しさん@そうだ選挙にいこう:03/01/25 02:01
あの〜、インデックスサービスのインデックスが待てど暮らせど
出来ないのですが、原因が何か考えられますか?
最初はカリカリしてる音がユーザーがアクティブって訳でもないのに止まります。
でそのままカリカリ音がしないままというか。
348名無しさん@そうだ選挙にいこう:03/01/25 23:29
>>347
もしかして標準のカタログを削除して
自分でカタログを作成した?
ディレクトリを指定し忘れていないかな
349名無しさん@そうだ選挙にいこう:03/01/26 17:47
>>348
いえ、ドライブごと指定してるのですが、これってまずいのですかね。
バックアップ用のドライブだけは外しました。
みなさん詳細にディレクトリ指定されてるのですかね?
ともあれお返事ありがとうございます。
350名無しさん@そうだ選挙にいこう:03/01/26 21:45
>>349
カタログの追加では名前とディレクトリを指定するが、
これは、カタログの保存先を指定するのです。
実際に検索したいディレクトリの指定は、
作成したカタログを開いてディレクトリの指定をします。
ここで注意するのはインデックスに含めるが「はい」に
なっているか。または、「いいえ」の設定と被ってないかを
確認してください。
351 :03/01/26 21:53
台湾のエロ画像掲示板が今一番ホットと言えませんかね?

http://wossal.k-server.org/tw/

352名無しさん@そうだ選挙にいこう:03/01/27 23:06
>>350
お返事ありがとうございます。
「はい」にはなっていますし、再開するとしばらくはカリカリ言ってるのですが、
どうも途中で止まってしまいます。
サーチクロスがあるので不便はしてないのですが、サーチクロス非対応の
ものを探すときとかあった方が便利なのですよね。
353名無しさん@そうだ選挙にいこう:03/01/31 23:03
下がりすぎage
354名無しさん@そうだ選挙にいこう:03/02/04 09:18
一般ユーザには関係ないが
「Microsoft SharePoint Portal Server Service Pack 2 リリースに関するお知らせ」
http://support.microsoft.com/default.aspx?scid=kb;ja;813881
355名無しさん@そうだ選挙にいこう:03/02/06 17:28
サーチクロス、本日、ライセンスをVector経由で購入しました。
記念あげ
KWIC Finder は 落ちて使い物にならない。
windows xp は未対応か?
何かひとつは全文検索をもっていたい。
quick finder とか ブーメランとかいろいろ使って見たがノイズが多かった。
サーチクロスはKWICよりは少なかったが落ちた。
修正されたのだろうか?
期限越えると、消してインストールしなおしても
使わせてくれないんだよねえ(^_^;
357名無しさん@そうだ選挙にいこう:03/02/07 11:03
>>356
何をしたら落ちたのかな

XpでKWIC Finder問題なく動作してるよ
サーチクロスはインデックス作成で落ちた。

Windows Xpを使っているならインデックスサービスを使ったら?
そういや サーチクロスはインデックス作成で落ちたんだった(^_^;
インデックスサービスってなんですか
>358
 Microsoft Index Service のことだと思われるが……違うのか?
 そもそもKWIC FinderはMicrosoft Index ServiceもしくはNamazu
を併用しないと全文検索にはならない。(単体で使うとGrep)
358です
レスありがとう
みな50歩100歩ですね
361名無しさん@そうだ選挙にいこう:03/02/12 12:46
>>330です。
その後いろいろ調べてみたら、こんなのがありました。
ttp://pc21.nikkeibp.co.jp/pc21/pc_02/021128.htm

しかしこのレジストリを適用してインデックス作成を始めたところ、
インデックスサイズが元ファイルの2倍以上に膨れあがり、なかなか終了せず、
しかも検索結果が引っかからないという、激しくトホホな結果に終わりました。
マジでWin2000に戻そうか悩み中。
362名無しさん@そうだ選挙にいこう:03/02/12 16:42
>>361
私も試してみましたがダメですね。
ファイル名以外はインデックスされていません。

日経PC21に問い合わせてみたら回答あるかな?
363名無しさん@そうだ選挙にいこう:03/02/17 09:35
>>354の続報
「SharePoint Portal Server 2001 の最新の Service Pack を入手する方法」
http://support.microsoft.com/default.aspx?scid=kb;ja;312963
364.:03/02/24 19:04
2chのdatログをサーチクロスで検索したいんだがいい方法はないものでしょうか?
いまはDAT to HTMLでHTMLに変換してるんですけど、変換するのがめんどくさい。
なんかいい方法はないものやら
365名無しさん@そうだ選挙にいこう:03/02/24 19:29
366名無しさん@そうだ選挙にいこう:03/03/06 02:19
>>364
公式で対応の望みが出てきてるな
対応が早いのは好感が持てる
367名無しさん@そうだ選挙にいこう:03/03/06 10:28
>366

あそこ公式の対応いいよね。
要望出したらすぐにメールがきてdatファイルおくったんです。
そしたら次期バージョンで対応予定ってメールがきました。
368名無しさん@そうだ選挙にいこう:03/03/08 03:05
LZHやZIPやtar.gzの中身をインデックスできるインデックスソフトってありますか?
369名無しさん@そうだ選挙にいこう:03/03/08 20:59
サーチクロス
2003/3/7 Ver.1.08
一太郎13対応
プライベートパスワードが設定されている場合、Word,Excelが失敗する不具合
XREFがないPDF対応(キャノンのCanoScan等)
Outlookの外部pstファイルがデフォルトで開かれていない場合の不具合
アイドル時自動更新がマウスしかみていない
grep検索でのパス長を大きく
grepでの「キーワードを含まない」
インデックス対象外にフォルダ指定
「ファイルは削除されています。更新しますか?」にNO後、リンク切れクリックしたとき不具合
壊れたPDFファイルのインデックス化で処理が終わらなくなる不具合修正
370名無しさん@そうだ選挙にいこう:03/03/08 21:55
いい!
http://hkwr.com/
371山崎渉:03/03/13 16:36
(^^)
372名無しさん@そうだ選挙にいこう:03/03/15 10:05
アップデート情報
□「サトリ」v1.02(03/03/07)
- Office文書などを高速に検索できる“インデックス サービス”用フロントエンド
http://fhewfhew.hp.infoseek.co.jp/
1.文書内の検索キーワードの強調表示方法を変更
2.不具合修正
373名無しさん@そうだ選挙にいこう:03/03/15 23:35

  ☆^〜^★【新着情報追加】毎日随時更新
   http://sagatoku.fc2web.com/
  あなたの探し物こちらで見つかります

374名無しさん@そうだ選挙にいこう:03/04/02 23:14
ネタ切れ?
375名無しさん@そうだ選挙にいこう:03/04/03 21:35
サトリ version 2.00 beta2
2003/4/3
・Visual Basic.NETでプログラムを書き直しました。
・検索速度を向上しました。
・検索の条件指定を変更しました。
・イントラネット(IIS+Indexing Service)のWebを検索可能にしました。
.net…
入れたくない(´・ω・`)
377名無しさん@そうだ選挙にいこう:03/04/04 09:23
>>376
何で?
ウチではサトリ2.00β問題無いよ
378bloom:03/04/04 09:46
379fhew ◆NKR2cRlGXU :03/04/13 21:16
>>376
そうですか
大多数の意見なのかなぁ
.NET Frameworkをインストールしている人って少ないし

ところで、サトリ ver.2.00 正式版をリリースをしました。
>>379
新しいからねぇ>.NET Framework
メリット感じないと、調べないで怖がる人がいるのは仕方ないっす。
漏れ的には一押し。旧型アプリとの衝突がいやなので専用 XP 組んでるけど(w
プリインストのクライアントは来年より後っすかね。
381名無しさん@そうだ選挙にいこう:03/04/14 19:14
>>380
DLL HELL(旧型アプリとの衝突)が無いのが
.NET Frameworkのメリットなんだけどね
382380:03/04/14 23:23
>>381
そうじゃなくて、行儀が悪かったり下手糞な作りの旧型アプリをうっかり入れて
.NET アプリまで壊されるようなことになりたくないんですよ。
旧型アプリがのさばっている今は、はっきり環境を分けないと、どうしたって
混入する可能性があると思うから。
早く .NET に置き換わらんかな。プログラミングのしやすさは最高。
>>381
DLL HELLがないとはどういう仕様で?
384名無しさん@そうだ選挙にいこう:03/04/15 22:37
>>384
読んだけどわけわからん

@IT:基礎解説 初めてのMicrosoft .NET ―.NET初心者のためのMicrosoft .NET入門―
http://www.atmarkit.co.jp/fdotnet/basics/msdotnet/msdotnet_01.html

↑ こっちの方が分かりやすかった

ようするに
●.NETとはJAVA全盛に対抗してMSがつくった新たな金儲けの手段
●Webアプリケーションへの移行によって課金の強化を目指す
●.NET FrameworkとはJava VMみたいなものだが色んな言語系に対応する
●.NET Frameworkは実行プログラムコンパイル時に強力なセキュリティチェックや
 バージョンチェックを行いプログラムの安定性が増す(DLL HELLの撲滅)
●.NET Frameworkはプログラム導入以前にランタイムとして導入しておく必要がある

というところか?確かに余り導入したくないな‥‥
VB6までならXpで(ランタイム無しで)動くんだしこっちの方が良かったのでは?
386名無しさん@そうだ選挙にいこう:03/04/17 02:48
>>385
WindowsUpdateでみたときには、ハァ?だったが、
さとりを導入するときに有難みがわかったよ。

> ●.NETとはJAVA全盛に対抗してMSがつくった新たな金儲けの手段
> ●Webアプリケーションへの移行によって課金の強化を目指す

ここまでは、やっぱりMS、だし、

> ●.NET FrameworkとはJava VMみたいなものだが色んな言語系に対応する

> ●.NET Frameworkは実行プログラムコンパイル時に強力なセキュリティチェックや
>  バージョンチェックを行いプログラムの安定性が増す(DLL HELLの撲滅)

ここも、ホントならすごいな、程度なんだけど、

> ●.NET Frameworkはプログラム導入以前にランタイムとして導入しておく必要がある


ここで、WindowsUpdateで導入、更新ができるのはありがたい。

VBランタイムは4,5,6とバージョンが散乱している上に、
探して落とすのが手間。fhewさんのページ見ても混乱した。
旧バージョンで手間取ってるうちに、V2.00が出たので
入れなおしたら一発。ユーザーサイドにも十分メリットあるよ。
387山崎渉:03/04/17 11:30
(^^)
388名無しさん@そうだ選挙にいこう:03/04/17 16:36
>>385
何故導入したくないのかわからない。
導入して困ることはないのでは?

私は、DLL HELLが無いのなら安心して使えるアプリが増えるので歓迎したいよ。

サーバーはJAVAでも.NETでも使う人には関係ないしね。
389名無しさん@そうだ選挙にいこう:03/04/17 17:26
現在、個人で使えるインデックス構築タイプの全文検索は以下のソフトですか?

フリーウェア
・Namazu + Search-S
・インデックスサービス + サトリ

市販パッケージ or シェアウェア
・DiskX Search
・サーチクロス
・速捜X
・Namazu + KWIC Finder
・インデックスサービス + KWIC Finder
390山崎渉:03/04/20 05:49
   ∧_∧
  (  ^^ )< ぬるぽ(^^)
391名無しさん@そうだ選挙にいこう:03/04/20 13:00
MS、新種の検索ツール開発中
http://headlines.yahoo.co.jp/hl?a=20030419-00000014-zdn-sci
392あぼーん:03/04/20 14:02
MSが研究を進める検索/スパム対策/インタフェース技術
http://www.zdnet.co.jp/news/0304/21/ne00_msresearch.html

JustsystemのConceptBaseみたいなのを目指しているのか?
よくわからんぞ
394名無しさん@そうだ選挙にいこう:03/04/27 13:41
Satori ver.2.01 リリース歓迎age
http://fhewfhew.hp.infoseek.co.jp/
395名無しさん@そうだ選挙にいこう:03/04/27 13:49
キミとは関係ないよ,ぼくちゃん
坊ややプログラマか電話工事屋で終わりだ
ぼうや,オナニでもしてママにこづかいでももらってさっさと寝な
おまえの彼女は昨日の夜,他の男のちんぽくわえて,ふとももをザーメンがつたっていたぜ
おまえなんか,ペットぐらいにしか考えてないんだよ
ま,ブスだから結局おまえの嫁さんになるけどな
子供ができたらDNA検査しないとな ぷぷぷ
396動画直リン:03/04/27 14:25
397名無しさん@そうだ選挙にいこう:03/04/27 14:43
>>389
遅レスすまそ。

ほぼ、リストどおりだが、

KWIC Finder は独自エンジン"KWIC Search Engine"を装備したぞ。

以下はヘルプより、
1.N-gram方式 を採用しています。辞書のメンテナンスが必要なく、
 検索漏れの少ない全文検索が可能です。
2.GUIの他にコマンドライン版を提供します。他のアプリケーションから起動したり、
 タスクスケジューラに登録することができます。
3.差分更新を行うため、一度インデックスを作成した後は、タイムスタンプの変更された
 ファイルのみが更新対象になります。

N-gram方式とは分かち書きを行わず、文書中の全ての文字位置からN字毎に切り出した文字列から
インデックスを作成する方式だそうだ。

ヘルプに曰く、
「N-gram方式は原理的には検索漏れのない全文検索が可能です。」とのこと。

漏れが使用したところでは、ひらがなや、ごく一般的な単語のみのフレーズでも正確にヒットした。

弱いところは
1. インデックス作成・更新時に時間がかかる(他のエンジンと比較して)
2. 標準ではインデックス自動更新がセットされない
 (自分でタスクスケジューラに登録すればよい。ヘルプに方法が記載されている。)

ほかのエンジンとは方式が異なっているので、併用すると効果が期待できそうだ。
KWIC Finder、ずいぶん進化したんだね。また使ってみようかな。
399名無しさん@そうだ選挙にいこう:03/04/30 20:31
KWIC Finder のあたらしい全文検索機能が面白そうだから、
ためしに入れてみたけど、以前インストールした情報を覚え
ているようで使用できなかった。残念。
>>399
たしか、独自エンジンはレジストしないと利用できなかったと記憶している。
1000円の価値は十分にある、と私は思う。
サーチクロスのインデックス化についてなんですが、

登録しているディレクトリで全然更新してないディレクトリ
まで一から読み込むようなのですが仕様ですか?
402名無しさん@そうだ選挙にいこう:03/05/02 16:48
サーチクロスのインデックス作成機能は糞だ!
403動画直リン:03/05/02 17:14
404名無しさん@そうだ選挙にいこう:03/05/03 00:21
サーチクロス
たくさんの種類のファイルに対応してるのはありがたいが
インデックスの作成なんとかならんかね?

Windowsのインデックスサービスみたいに
バックグラウンドでいつのまにか作成して欲しいんだが。
>>404
自動でされるだろ?
406名無しさん@そうだ選挙にいこう:03/05/03 01:04
インデックスサービスみたいにCPU負荷の少ないときに自動で実行できるの?
何か作業しているときに実行されると激しく邪魔だが

それに、Officeや一太郎のインデックスにOLEを使っているのがダメ、不安定極まりない。
407動画直リン:03/05/03 01:14
408名無しさん@そうだ選挙にいこう:03/05/03 02:24
ナマズで、LAN上の他のマシンのディスクの中まで探ってインデキシングさせる方法はないですか? もちろん、共有フォルダなんですけど。
409名無しさん@そうだ選挙にいこう:03/05/03 06:52
410名無しさん@そうだ選挙にいこう:03/05/03 21:38
サーチクロスはアプリケーションとして動作する以上は
インデックスサービスみたいに「いつのまにかインデクスができてる」
というわけにはいかない。

サーチクロスもサービスでインデックス作成するようにしてもらいたいもんだ。

対応してるファイルの種類が多いことが唯一の利点だから
インデックスサービス用のIFilterがたくさんあれば
サーチクロスは用済みになると思われ。

どっちにしろWinFSのLonghornが出るまでの命だろうけど。
とはいえ、メール検索ではインデックスサービスはサーチクロスにとてもかなわない。
412名無しさん@そうだ選挙にいこう:03/05/04 03:04
前から疑問だったけど、サーチクロスなどで実装されているメールの全文検索って必要?
俺はメーラーを起動して検索しても苦じゃないんだけど

これなら欲しいけど
http://www.zdnet.co.jp/news/0211/29/nj00_sixdegrees.html
413bloom:03/05/04 03:14
>>411
だから各種メーラー用のIFilterをMSが用意すればサーチクロスいらなくなるんだよ。

ついでにJaneやかちゅ〜しゃのLOG用IFilterも用意すれば万全。
>>412
Outlookからの例になっているがOutlookってスレッド対応していたっけ?
416名無しさん@そうだ選挙にいこう:03/05/04 21:37
>>415
Outlookがスレッド表示できなくても、
Six Degreesが凝ったスレッド表示できるから問題無いぞ。
>>414
IFilterはファイルの内容たるテキスト情報を抽出する機能しかもっていないし、
MSインデックスサービス自体はファイルの存在場所を示すことしか出来ない。
個々のメールを分類する機能が無いと、メール検索としては役に立たないわけだが、
1つのファイル上に複数のメールを保存するタイプのメーラーには現時点では対応できんし
1通1通個別ファイルに保存するメーラーは少ない(電信八号くらいか?)。

IFilterよりはインデックスサービス自体を改造しなければならないのではないかと。
しかしMSが自社製品以外のしかもローカルなメーラーに個別対応するとは思えんのだが・・・
へー、現時点でも技術的には出来るんだねぇ。
420名無しさん@そうだ選挙にいこう:03/05/07 17:46
KWIC Finderの全文検索エンジン搭載版かなり良いですね。
検索精度が高く、インデックス作成が安定している。
KWIC Finderの全文検索エンジンがメール検索に対応したらサーチクロスはいらないね。
保守
422名無しさん@そうだ選挙にいこう:03/05/17 17:15
Ninomiyaにいったら
ジャストシステムのインターネットブーメランが
まだおいてあった・・・・
423名無しさん@そうだ選挙にいこう:03/05/17 17:17
KWIC Finderの試用期限が迫っているが、買おうかやめようか・・・。
>>424
買っちゃえば?
千円だし,作者もこまめにバージョンアップしているから損ではないと思うよ。
PDFファイル用IFilterの日本語WinXPで使えない問題、解決されそうな動きはないのだろうか・・・。
KWIC Finderって多機能そうだが、インデックス化の処理は遅いね。
>>427
サーチクロスの糞インデックス処理よりまし
429428:03/05/19 19:15
サーチクロスより速いって意味じゃないよ
安定しているって事
KWIC Finderは検索精度が高いのがウリでしょ

でも、インデックス作成はインデックスサービスが一番ですね。
PCに負荷をかけず、いつのまにかできるているし、こけない。
まあそこがOS標準のサービスならではの強みでしょうな。

これでサーチクロス並みに
多くのファイルフォーマットに対応してくれれば
最強なんだが。

IFilterイパーイきぼんぬ
431山崎渉:03/05/22 01:51
━―━―━―━―━―━―━―━―━[JR山崎駅(^^)]━―━―━―━―━―━―━―━―━―
432名無しさん@そうだ選挙にいこう:03/05/22 23:29
サトリ2.02が出てます…って1週間経ってるけど
433::03/05/24 14:15

探し物はこちら
http://sagatoku.fc2web.com/
新商品・安売・キャンペーン・流行商品・ネット商品等10万点以上
ジャンル別・50音別で楽々探し物


434名無しさん@そうだ選挙にいこう:03/05/24 23:37
win2000のインデックスサービスを動かすと

メモリリークしてんのか2時間くらいでめもり使用量700MBとかになって
あぼーんしちゃうんですがどうなってるのかなあ。

ま、おれはサーチクロスがあればインデックスサービスなんかいらないんだが。
435名無しさん@そうだ選挙にいこう:03/05/25 00:51
サーチクロスってインデックスサービス使ってるんではなかったのか。
マジで知らんかった。
買ってこようかな。
>>435
独自のインデックスを作成しているが
437435:03/05/25 01:46
なるほど
レスありがとうございます。
438あぼーん:あぼーん
あぼーん
439名無しさん@そうだ選挙にいこう:03/05/27 16:26
サーチクロスの掲示板で「ファイルサーバーを検索できないか?」ってのがよくあがってくるなぁ。
サーバーがWindowsならインデックスサービス、LinuxならNamazuを使えよ!

サーチクロスを使ったらネットワークトラフィックがひどいことになるぞ。
サポートもいいかげんな回答するなよ。
440_:03/05/27 16:29
441あぼーん:あぼーん
あぼーん
442名無しさん@そうだ選挙にいこう:03/05/27 16:39
サーチクロスはGB単位の大量のデータを検索するには全く向いてないからな
443名無しさん@そうだ選挙にいこう:03/05/27 16:43
サーチクロスのインデックス作成は重いので
サーバーで実行されたらいやだなぁ
444山崎渉:03/05/28 16:34
     ∧_∧
ピュ.ー (  ^^ ) <これからも僕を応援して下さいね(^^)。
  =〔~∪ ̄ ̄〕
  = ◎――◎                      山崎渉
age
446名無しさん@そうだ選挙にいこう:03/05/29 09:05
アンドール,CADデータ内のテキストを全文検索できるツールを発売
 アンドール(本社神戸市)はイントラネット向けの全文検索ツール「かんたんサー
チ」を2003年6月から発売する。Microsoft Word,同Excel,同Powerpoint,PDF,一
太郎,OASYS,LotusWord,テキストファイルに加えてDXF,AutoCAD(DWG),CADSUPE
Rの各CADデータも検索対象にした。また,画像データ(Windowsのbmp,TIFF,JPEG,
PNG)から実質的にOCR(光学的文字認識)と同様の処理で文字情報を抽出し,これも
全文検索の対象とする。データ変換研究所(本社京都市)のシステムにCADデータの
検索機能を加えて製品化した。価格は40万円から(20ユーザーライセンス)。
http://www.andor.co.jp/
447名無しさん@そうだ選挙にいこう:03/06/24 18:31
448名無しさん@そうだ選挙にいこう:03/06/29 02:50
MitakeSearchってどうよ?
449fhew ◆NKR2cRlGXU :03/07/04 01:00
>>447
直しました。
450山崎 渉:03/07/15 11:21

 __∧_∧_
 |(  ^^ )| <寝るぽ(^^)
 |\⌒⌒⌒\
 \ |⌒⌒⌒~|         山崎渉
   ~ ̄ ̄ ̄ ̄
451名無しさん@そうだ選挙にいこう:03/07/16 08:50
452名無しさん@そうだ選挙にいこう:03/07/29 09:45
↑はサトリ。

KWIC Finderも紹介された。
http://www.forest.impress.co.jp/article/2003/07/28/kwicfinder.html
453???:03/07/29 10:01
     ∧_∧  ∧_∧
ピュ.ー (  ・3・) (  ^^ ) <これからも僕たちを応援して下さいね(^^)。
  =〔~∪ ̄ ̄ ̄∪ ̄ ̄〕
  = ◎――――――◎                      山崎渉&ぼるじょあ
     ∧_∧  ∧_∧
ピュ.ー (  ・3・) (  ^^ ) <これからも僕たちを応援して下さいね(^^)。
  =〔~∪ ̄ ̄ ̄∪ ̄ ̄〕
  = ◎――――――◎                      山崎渉&ぼるじょあ
456名無しさん@そうだ選挙にいこう:03/08/04 22:02
雑誌の縮刷版PDFって制限がかかっていてほかのソフトから検索できない。
それでもコピー・ペースト許可にして保存しなおせばできるようになるものもあるが
日経の縮刷版ってパスワードかかっていてこれもできねぇ
使いにくいぞ。。。
457_:03/08/04 22:10
458_:03/08/04 22:15
459名無しさん@そうだ選挙にいこう:03/08/07 09:44
460山崎 渉:03/08/15 22:10
    (⌒V⌒)
   │ ^ ^ │<これからも僕を応援して下さいね(^^)。
  ⊂|    |つ
   (_)(_)                      山崎パン
461山崎 渉:03/08/15 22:37
    (⌒V⌒)
   │ ^ ^ │<これからも僕を応援して下さいね(^^)。
  ⊂|    |つ
   (_)(_)                      山崎パン
462名無しさん@そうだ選挙にいこう:03/08/24 01:16
あげ
463名無しさん@そうだ選挙にいこう:03/08/24 10:24
linux+sambaでwindowsのファイルサーバを構築して、中身をnamazuで検索するシステムを本を見ながら作ったんですが、cgiで検索結果が表示されるところまではできました。

でも、検索結果をクリックしてもその文書が開きません。というか、ファイルのリンク先が

/hostname/directoryname/%k%3%%\.doc

みたいな感じになってしまいます。
mknmzで-Uオプションでエンコードを無効にしてみたりしましたが同じです。

何が悪いんでしょうか。
464名無しさん@そうだ選挙にいこう:03/08/24 10:32
>>463
/hostname/directoryname/%→http://
に書き換えてくれるんだが、その設定しましたか?

namazuサイトに記載されているはず。
465名無しさん@そうだ選挙にいこう:03/08/24 19:22
>464 さっそくさんくす

あ、そこじゃなくて、ファイル名の部分が文字化けっぽくなる、ってことなんだ

口べたでスマソ
466名無しさん@そうだ選挙にいこう:03/08/29 09:35
インデックスサービスでmhtファイルを検索できるみたいです。
サトリを公開しているfhewさんのWebサイトに方法が載ってました。
467名無しさん@そうだ選挙にいこう:03/09/01 14:07
HPのMitakeSearch V4.0試した人いますか?
いませんか?
468fhew ◆NKR2cRlGXU :03/09/09 22:57
>>467
ターゲットがよくわからない製品ですよね。
試そうとも思いませんでした。

値段が高い商品を購入するなら、ConceptBaseが欲しい。
保守です。
Namazu/Apache を Windows XP のPCにいれる方法:  http://www.fkimura.com/namazu-win32-1.html
PDFのIFilterがXPで使えない場合の修正方法。
たぶんこれで大丈夫なはず。
http://pc2.2ch.net/test/read.cgi/win/1035387243/132-133
471名無しさん@そうだ選挙にいこう:03/11/30 11:49
この関連文書検索機能ほすぃ。
http://qdbm.sourceforge.net/cgi-bin/qfts.cgi
472名無しさん@そうだ選挙にいこう:03/12/06 14:04
>>466
おお、ありがとうございます。
mhtで保存してるので凄く助かります。
473名無しさん@そうだ選挙にいこう:03/12/21 05:19
【NHKスペシャルアンコール】
【映像の世紀】
1995年3月から1996年2月にかけて放映された大型シリーズを、11夜連続でアンコール放映する。
世界各地に保存されている貴重映像を発掘、収集して時代順に構成し、
有名・無名の人物が書き残した回想録、日記、手帳、演説などを紹介しながら、
激動の20世紀を映像で追体験する。

12/22(月) 23:00〜24:15 @20世紀の幕開け           Gコード9411551
12/23(火) 23:00〜24:15 A大量殺戮の完成           Gコード9315323
12/24(水) 23:00〜24:15 Bそれはマンハッタンから始まった  Gコード9382095
12/25(木) 23:00〜24:15 Cヒトラーの野望            Gコード9359767
12/26(金) 23:00〜24:15 D世界は地獄を見た          Gコード9253539
12/27(土) 21:55〜23:10 E独立の旗の下に           Gコード5588008
12/27(土) 23:20〜24:35 F勝者の世界分割           Gコード5956089
12/28(日) 22:40〜23:55 G恐怖の中の平和           Gコード2604139
12/29(月) 22:40〜23:55 Hベトナムの衝撃            Gコード5458851
12/30(火) 22:40〜23:55 I民族の悲劇 果てしなく       Gコード9753063
12/30(火) 24:00〜25:15 JJAPAN                Gコード4558031

いまなおNHKスペシャル最高傑作の名が高い作品。未見の人は是非一見をお奨めする。
ちなみに発売中のDVD-BOXは\74,800もします。

ttp://www.nhk.or.jp/winter/gtv/gtv016.html
ttp://www.nhk.or.jp/special/rerun.html
サーチクロスは開発およびサポート停止状態なのでやめとけ
http://pc2.2ch.net/test/read.cgi/software/1070739655/
475名無しさん@そうだ選挙にいこう:03/12/26 23:22
Estraier使ってる人いる?
http://estraier.sourceforge.net/spex-ja.html
導入が簡単でないと使う気がしない
Win版は簡単だったぞ
CGIなんてわかんね
>>475
これWin版のバイナリではPDFのインデックス作成は無理なんですかね?
pdftotextを起動させるバッチファイルを書いて渡してみたけど
実行されて無いようです。
Win版で作成できてる人いますでしょうか?
>>479
Cygwin上だとマニュアルに書いてあるPDFフィルタでできたよ。でもDOSプロンプトで実行するとダメ。
あと、日本語が化けるんだけど、多分、xpdfに日本語化パッチをあてないといけないのかな。
>>480
レス遅れてすみません。
その後調べたらCygwin環境無しでも変換できる方法が見つかりました。
CygwinのDLLを使っている場合はsystem()を正しく実行させるためにsh.exeが必須のようです。
Cygwinを配布しているサイトからこれだけダウンロードしてきて再度実行してみたら
うまくフィルタプログラムが呼び出されるようになりました。

>日本語が化ける
日本語用のlanguage packageが入ってないか、
xpdfrcの設定が間違っているのではないでしょうか?
自分はWin版のpdftotextを使ってますが文字化けはしてないです。
482480:04/01/09 22:11
Thanks. language package入れてみます。 >> 481
ところでWordのファイルを登録する方法はあるんでしょうか。
それできるとかなーりイイ感じなんですけど。
483名無しさん@そうだ選挙にいこう:04/01/14 09:56
で、EstraierはNamazuやインデックスサービスから乗り換える価値あるの?
484名無しさん@そうだ選挙にいこう:04/01/14 13:46
用途によるんじゃない?
検索速度とか対象文書の規模とかは、ベンチマークテストしないとわからないけど、
要約がわかりやすいのがいい感じだな。
対象フォーマットを増やしてほしいところだけど。
485名無しさん@そうだ選挙にいこう:04/01/17 00:54
私は、ローカルでは最近でたG-Search (Personal) を使ってます。
機能は少ないけど、基本的な部分は押さえてるし
何よりも高速なので満足してます。
Professional版では、LAN内の他のPC上のファイルも検索できるらしい。
お奨めです。
http://www.vector.co.jp/soft/win95/util/se295328.html
>>480
WordとExcelとPowerPointに対応したみたいだよ。
487名無しさん@そうだ選挙にいこう:04/01/24 19:08
>>485
見れないんだけど
488蕪木ら某 ◆Googl8RmwA :04/01/24 21:33
489名無しさん@そうだ選挙にいこう:04/02/01 22:31
今年に入ってからサーチクロスのバージョンアップが盛ん

2004/1/27 Ver.1.10
  ツールメニューに「新しいインデックスの作成」を追加。
  インデックスの切り替えを高速化。
  アプリケーションのタイトルヘッダにインデックス名を表示。
  異なるインデックスの複数サーチクロスを多重起動可。
  サーチクロス本体を常駐していてもインデックス切り替え可。異なるインデックスを別々に常駐することも可。
  検索結果がWord, Excel, PowerPointのとき、結果をクリックしても「次を検索」と「前を検索」のメニューとボタンが有効にならなかった。
  別ユーザで起動したときなどレジストリが空の状態でも、インデックス位置やオプション初期値を適切に持つようにした。
  SXKickの起動をレジストリのRUNを廃止し、スタートアップに変更。
  設定を変更したときにSXKickが起動していないときはSXKickを起動。
  「メール本文のみ検索」を廃止。……仕様的に意味のないオプションだったため。
  共有フォルダの検索のための読み込み専用起動オプションと、ユーティリティ SXShare を追加。
  キー操作の一部変更。プレビュー最大化をCtrl+D、アプリケーションの終了をCtrl+Wに。
  アイコン登録を、All Usersのスタートメニューに変更。
2004/1/20 Ver.1.08c
  SXSwitchで、インデックス対象及びファイルタイプの設定が10個を超えるときに、正しくインデックス切り替わりしていなかった。
2004/1/19 Ver.1.08b
  SXSwitchで、指定したインデックスフォルダを自動的に作成してエラーが出ないようにした。
2004/1/16 Ver.1.08a
  WZ MAIL5.0対応
  インデックス切り替えツールSXSwitchを同梱
>>489
まだ、OLEを使ってインデックスを作ってるかな?
以前、試用したときはインデックス作成でExcelのマクロが実行されたり、
途中で落ちたりして使えなかったんだけど
491名無しさん@そうだ選挙にいこう:04/02/02 13:58
今使うならサーチクロスとブーメランどっちがいいのかな〜〜
492名無しさん@そうだ選挙にいこう:04/02/04 21:18
サーチクロス v1.11 リリース
OLEを使わずにOffice文書や一太郎文書を読み込むのをあきらめました。
ライバルであるKWIC Finderの作者によるxdoc2txt.exeを使えってことみたいです。
>>489
>>492

標準出力フィルタが存在するファイルタイプなら、自由に登録して検索対象にすることが
できるようになった!

これで、Docuworks(dxw)の文書を検索対象にすることができるよ。現在、インデックス作成中

掲示板も閉鎖されて一時は終わりかと思われてたけれどよかった〜。
多分、作者が急かされるのがいやだったり、オンラインソフト的な開発に
なじめない人なんだろうね。
494検索太郎:04/02/07 10:15
dat2txtにも標準出力オプションをつけてもらったので、datファイルから
インデキシングも可能になりました。
(datから直接インデキシングすると、検索結果の表示が美しくないので)
>>481

いいな、いいな。
やり方知りたい・・・・・・
496名無しさん@そうだ選挙にいこう:04/03/04 05:03
MP3のタグを全文検索できるシステムって知らない?
497名無しさん@そうだ選挙にいこう:04/03/05 10:50
サーチクロス1.12使ってるんですが、Outlook Express6のメー
ルがうまく検索出来ないんです。何か設定忘れてるんでしょうか?

あるメールの本文中の単語をいくつかキーワードにしても、その
メールが検索結果に出てこないんです。インデックスは直前に作
ってますけど。去年からずっとはまりっぱなしで弱ってます・・・
もしかしてインデックス作る段階で取りこぼしが多いのかなあ(鬱
498名無しさん@そうだ選挙にいこう:04/03/05 18:58
インターネットブーメランの新バージョンまだぁ?
>497
ひらがなだったりする?
>>498
そういえばこれってWindowsXPでちゃんと動かないみたいなんだけど
501497:04/03/06 01:10
>499
レスありがとん。
キーワードはひらがなじゃなくて漢字です。具体的に言うと
「京都」「出張」「山田」が使ったキーワードそのものです。
この単語を含むメールが確かにあるのに、引っかからないので
頭かかえてます。他にも検索出来ない場合があり得るんじゃな
いかと。環境はW2000 sp4なんですが、何か設定に見落としが
あるんでしょうか?謎だ。
>501
OEは使ってないから分からないけれど、
使っている範囲では漢字を取りこぼしてたことはないなぁ。
インデックスを作り直してもダメ?

それでもダメならサポート掲示板に書いてみては?


503名無しさん@そうだ選挙にいこう:04/03/10 17:39
サーチクロスver.2.00が出た
2ちゃんのログ検索にも対応しているらしいぞ
504名無しさん@そうだ選挙にいこう:04/03/10 22:27
>>503
おお、ネタかと思たらマジかYO!

・2ちゃんねるのdatとHTMLの検索に対応。

でもヒットしてもいったんHTMLに変換してやらないと駄目なのでわ・・・?
今入れてみた。

datファイルをインデックス化して検索してみると、ちゃんとレス単位で検索して
検索結果も表示窓も1レスごとに表示される。

ただ、アンカーのハイパーリンクやポップアップには対応してない。
あと気になったのが検索結果がどのスレなのかが全くわからないこと
>>505-506
リクエストしたら対応してくれるかもよん>ハイパーリンクとスレ名
まだβなんだし。

ポップアップは必要ないけど、ジャンプしてくれると便利な気がする。
dat2htmlと併用するのがいいのかなぁ。
508名無しさん@そうだ選挙にいこう:04/03/11 11:23
商用ソフトが対応するなんて、2ちゃんもメジャーに
なったんだなあ。つか開発者が2ちゃんねらなのか?
とにかく入れてみよう。
509名無しさん@そうだ選挙にいこう:04/03/11 12:06
2ちゃんのことを掲示板で要望出したら「難しいけど検討項目に入れておきます」だって。
510名無しさん@そうだ選挙にいこう:04/03/11 23:32
2chのdatだけ別インデックスにしたいんだけどやり方おせーて
511名無しさん@そうだ選挙にいこう:04/03/12 17:17
サーチクロスVer.2.01 リリースage

掲示板に書くとすぐに開発者からのレスがついてとてもいい感じ。
512名無しさん@そうだ選挙にいこう:04/03/13 22:10
サーチクロス2.0にUPしてみたらエラいことになった。
●1.08の時のインデックスを認識しない
●しょうがないから一からインデックス作成
●なんか普通のHTMLファイルでエラーが出てまたやり直し
●何度繰り返しても終わらない
●どんどん検索対象ファイル数が増えていく

2時間くらい格闘してやめた。
結局、1.08に戻しますた。
ノーエラーにて16分でインデックス作成完了。
やっぱ安定版はいいな
513名無しさん@そうだ選挙にいこう:04/03/13 23:17
>>496
NamazuがMP3のタグ検索に対応しているよ。
インデックスサービスでもMP3検索できたような
これかな
http://www.meticulus.com/mp3filter.html

使ったこと無いので日本語に対応してるのかどうかは分かりませんが
516496:04/03/15 01:17
>>513-515
サンクスコ。
とりあえずNamazuから試してみます。
517名無しさん@そうだ選挙にいこう:04/03/15 11:37
mitakeを使い始めたのですが、Namazuで行っていた

my $EXCLUDE_TAG_START = '<!-- EXCLUDE_INDEXING_START -->';
my $EXCLUDE_TAG_END = '<!-- EXCLUDE_INDEXING_END -->';
$$contref =~ s/$EXCLUDE_TAG_START(.*?)$EXCLUDE_TAG_END//gs;

このような特定の場所を検索対象から外す事はmitakeで可能なのでしょうか?
518名無しさん@そうだ選挙にいこう:04/03/16 21:36
サーチクロスv2.02リリースage
おお、サーチクロス大胆に値下げしたね。
520名無しさん@そうだ選挙にいこう:04/03/18 00:25
2000円か〜〜

買っちゃおうかな〜〜
>518
Ver1ユーザは無償アップグレードなのね。ちょっとだけ見直したワン
俺ユーザ登録していなかった
しなくては・・・
>>519
KWIC Finderが1000円だからだろう
>>523
kwicはGREPだから話にならないほど遅い。
張り合う必要ないと思うけどね。
KWICも独自のインデックス検索機能備えているよ
526名無しさん@そうだ選挙にいこう:04/03/18 20:43
インタフェース的にもKWICの方が優れているからな。
普通にバグフィックス早いのも好感が持てる
そう?
俺はKIWCのインターフェイスは使いにくかった。
あと、インデックスを作る速度が遅いのが難点。検索漏れがないのはいいんだけどね。

SearchXは検索にクセがあるから、それに慣れないと使いにくいかも。
(俺は慣れちゃったけど。。。)
KIWCはいろいろできそうだけど、粗削りな感があるからなぁ。
529名無しさん@そうだ選挙にいこう:04/03/20 20:11
結局今一番のおすすめは何よ?
>>529
なまずなんて開発進んでないじゃない
タダじゃなくていいから、まともなもの希望。
KWIC、サトリ、鯰、search-s for Namazu全部使ってみた(疲れた〜

見積書大量エクセルデーターから全文検索がメインの漏れは
この中ではKWICが一番良かった。

grepと全文検索が選択可能。
結果がエクセルに出力可能。
単語辞書を持たない。
インデックス差分更新簡単。(自動更新も出来るみたい・・・

設定もマンドクサクなくて(・∀・)イイ!
¥1,000−レジストしようか思案中。
533名無しさん@そうだ選挙にいこう:04/03/21 10:08
PDFの透明テキストは自由に編集できるのですか?
また、エクスプローラライクなPDF用ファイラはないですか?
日立がNAMAZU に対応?

>> http://www.boxer.ne.jp/vespine/summary02.html
「フリーの検索エンジンとしてよく知られているNamazu*4との接続インタフェースを
標準で備えているため、Namazuを連携させてフォルダ内の文書ファイルを全文検索
させることも可能です」
>>532
SearchXは使ってみなかったのん?
536532:04/03/21 14:46
>>535
> >>532
> SearchXは使ってみなかったのん?

気がつかなかった(汗
エクセルの検索結果のソートやプレビューはKWICより良かった。
オンライン版だと\2,000-なんですね。
迷ってしまう・・・(;´∀`)
>>536
僕は全文検索愛好家なので両方レジストしてます。
両方レジストしても3,000円だし。

鯰はタダだけど、鯰を使うくらいならKWICなりSearchXなり使ったほうが使えると思うナリ。
サーチクロスいいね。
Wzユーザで体験版送られても無視してたけど、今回の値下げで
興味もって一度使ってみたら買ってもいい気になってきた。
kwicは画面に明朝体が出てきて使う気が一気に失せた
>>539
俺もそこがひっかかってる。見ていて疲れるんですよ明朝体は。
検索ってのは大量の検索結果の中からさらに目で見て特定するわけで
文字に余計な飾りが付いている明朝体は、さらっと流れるように読むのがしんどい。
きっとどこかで設定すればゴシックに変えられるんだろうけど、
変更しようという気持ちも起きない。

印刷物用の明朝体をディスプレイに使おうという考えが理解できない。
ワープロでは明朝体使うこともあるし、読んでも苦にならないんだけど
なぜかKWIC Finderの明朝体は気に障る。
>>542
そんなこと言わないでさ
http://www31.ocn.ne.jp/~h_ishida/KWIC/screen1.gif
      『MS明朝体』が検索野郎の使う気を鼓舞すること
のために何をしたか。何もしないばかりでなくわれわれを女
らしき意気地なしになした。あのような文字はわれわれのな
かから根コソギに絶やしたい
SearchX2体験版/winXPで使用

標準のインデックス保存先フォルダが↓以外を選択出来ないみたい・・・

C:\Documents and Settings\○○\Local Settings\Application Data
\VillageCenter\SearchX

マイドキュメント内に移動させたいんだけど・・・
標準以外のインデックスは問題なく出来る。
なんでだろ?
バグかもね。報告したら?
>>545
詳しく知らないのだけど、標準は変えられないのでは?
私はQ,007見て変えました。
HKEY_LOCAL_MACHINE\Software\VillageCenter\SearchX
IndexLocation

C:\Documents and Settings\All Users\Application Data\VillageCenter\SearchX

D:\SX_INDEX

うちではこんな感じで標準も移動できてます。

当然こっち↓は消してます。
HKEY_CURRENT_USER\Software\VillageCenter\SearchX
549545:04/03/24 20:33
↓回答キタ━━━━━━(゚∀゚)━━━━━━ !!!!!

問題の症状を確認いたしましたので次版で修正します。

なお、レジストリを直接編集していただければ、現在のバージョンでも変更で
きます。
ファイル名を指定して実行にて regedit でレジストリエディタを起動。

HKEY_CURRENT_USER
Software
VillageCenter
SearchX

の IndexLocation の値を変更してください。
以上、よろしくお願い申し上げます。
550名無しさん@そうだ選挙にいこう:04/04/01 20:54
サーチクロス Ver.2.03a
ttp://www.villagecenter.co.jp/soft/searchx/download.html
バージョンうぷage
551名無しさん@そうだ選挙にいこう:04/04/02 21:10
サーチクロスVer.2.03b登場age
552名無しさん@そうだ選挙にいこう:04/04/02 23:20
結局サーチクロスにしときゃいいの?
VISIOの検索できるのないかなぁ
VisioはIndexing ServiceのIFilterを追加して、サトリ、KWICで検索できるよ
http://www.microsoft.com/japan/sharepoint/server/downloads/ifilter.asp
Z-XCV
http://www.z-xcv.com/versus.html
個人向けにも出ないっすかね。
サーチクロスインデックス更新時にOUTLOOK2002の場合
ダイアログボックスが出てアクセス許可時間を指定するまで
更新を停止してしまいます。
なお最長アクセス時間10分です。
http://office.microsoft.com/assistance/preview.aspx?AssetID=HA010506531041&CTT=6&Origin=EC010553071041

回避する方法知りませんか・・・
ちなみにセキュリティーレベル低にしてもダメでした(泣
一応セキュリティ対策でそうなってるわけだから無理じゃない?
確認なしでメッセージ抜き出せたら気づかない間に他人にメッセージ
のぞき見される可能性があるわけだし。
557名無しさん@そうだ選挙にいこう:04/04/17 21:41
サーチクロスを使い始めてみた。ギガバイトクラスのデータ量になると
インデックスを分けないと使い物にならんのね。インデックス作成時に
全てメモリに置こうとしなきゃ良いのに、と素人目には思ってしまう。
他のソフトでも同様なんでしょか?
パフォーマンスを考えると、オンメモリとディスク使用では雲泥の差が出ます。
今の速度があってこそのサーチクロスだと思っているから、
ディスク使用でパフォーマンスが落ちるのであればイヤです。

一種のデータベースなわけだし、でかいデータを扱うデータベースなら
メモリを積めるだけ積むのがよろしいんじゃないの、とか思うがいかが?
559名無しさん@そうだ選挙にいこう:04/05/03 01:43
http://www.allmusic.com/
有名な音楽の情報検索サイトなんですが、
こういう検索サイトの全文検索は可能なんですか?
不可能ではないが現実的ではない
561559:04/05/03 22:48
>>560
レスありがとうございます。
現実的ではないというのはお金の問題ですか?
あるサイトの全文検索をローカルで行おうとすれば、
グーグルなどと同様にそのサイトにあるページ全てを読み込み保存する必要がある。

個人運営のサイトならばページ数も少ないが、
こういった商用サイトとなるとページ数は万単位になる。

ゆえに、Webサイトで検索サービスが用意されてるならばそれを使うのが一番だし、
なかったらグーグルや他のサーチエンジンで範囲指定して検索する方がベター。
>>559
まず、前提として、
検索サイトを全文検索して、何がヒットして、何を取ってこれると期待してるのでしょうか?

検索サイトって、自分で持ってる情報を検索させるサイトと、
他のサイトの情報を検索させるサイトがあるでしょ。
自分で持ってないサイトなら、何を期待してそこを検索するのかな?
ちなみに、そのAMGは、自分で情報持ってるみたい。

次に、自分で持ってる情報を検索させてくれるとして、
その情報ってそれぞれURLを持ってるのかな?
言い換えると、それぞれの情報に外からアクセスできるの?

検索の「仕掛け」はURLを持ってる、外からアクセスできる。それがAMGのURLだよね。
じゃ、検索対象である「それぞれの情報」は?

>>562さんが言うとおり、全文検索をローカルで行おうとすると、
検索のインデックスをローカルに作ることになるよね。
つまり検索対象とする「それぞれの情報」をローカルに持ってくる必要があるけど、
その「それぞれの情報」に外から、こちらからアクセスできないと持って来られない。
つまり、ローカルで全文検索できない。
564559:04/05/04 14:19
ローカルで全ページを読み込み保存しなければ全文検索できないんですね。
そういうことを知らなかったので質問させていただきました。

プロフィールやアルバム紹介にある文章も対象にして
ワード検索できれば便利だなと思っていたんです。
googleのサイト検索もやってみましたが、効果がなかったです。

ありがとうございました。
質問です。
word文書の検索を主に考えているのですが、ドイツ語のウムラウトやフランス語のアクサンにまで
対応しているものってあるでしょうか。
教えて頂ければ幸いです。
566名無しさん@そうだ選挙にいこう:04/05/09 20:07
567名無しさん@そうだ選挙にいこう:04/05/11 23:19
Quick Finder2.0
568名無しさん@そうだ選挙にいこう:04/05/15 18:53
>>565 estraier
Google、PC内のデータを検索するツール立ち上げへ
http://www.itmedia.co.jp/news/articles/0405/19/news051.html
>>568
レスさんくすです!
estraierのHPを早速見てみたのですが、私のような完全文系人間にはやや敷居が高そう…。
少し無理をすれば使えるレベルであれば良いのですが、ある程度のプログラミングの知識がないと
やはり厳しいんでしょうか?
フリーのワード検索野郎か、1,000円のKWIC Finderにしておこうかしら…
571名無しさん@そうだ選挙にいこう:04/05/24 01:35
>>570
必要なのは、プログラミングというより、サーバ管理のスキルなんでしょうね。
いずれにしても、とっつきにくいのに変わりはないですが。
572名無しさん@そうだ選挙にいこう:04/05/24 13:40
Greplaceが簡単でいい
サーチクロス
オンライン版レジストしちゃった・・・

インデックス自動更新の設定をどうするか悩みどころ・・・
574名無しさん@そうだ選挙にいこう:04/06/08 09:50
複数の文章から検索語を含む文全てを表示するようにできるツールはありますか?
検索語が含まれる文書検索は上のどれでもできると思うんですが。
>>574
出来なかったのはどれ?
参考までに教えてください。
576名無しさん@そうだ選挙にいこう:04/06/08 12:21
>575
namazuをそのまま入れた状態では無理でした。
できる方法はありますか?
>>検索語を含む文全てを表示

なんか意味が分からんが他のソフト適当に試してみれば・・・
文書(ファイル)単位でなくて、文(句点や改行で区切られる)を単位にして
検索したいってこと?
579名無しさん@そうだ選挙にいこう:04/06/09 12:39
>578
そのとおりです!
英作文用に、ある単語を打つとそれに対する例文がでるようにしたいんです。
サーチクロス結構いい。ファイル仕分けしなくて良くなった。
grepじゃ駄目なくらい量があるの?
うん、過去5年くらいのオフィスファイル。
583名無しさん@そうだ選挙にいこう:04/06/10 00:42
>>579
全部のファイルからテキストを抽出てひとつのファイル連結してからgrepかければいい。
その際に、必要に応じて、「。」やピリオドで行を区切る前処理を行ってもいい。
最近のマシンなら、連結したファイルのサイズが100MBくらいまで実用になるよ。
俺は英辞郎っていう辞書データでそれやって実際に使ってるから。
584名無しさん@そうだ選挙にいこう:04/06/11 03:52
今更な質問で恐縮ですが、
いわゆる単純grepでダメというのは、
対象の容量が大きすぎるため、時間がかかって実用に適さないという意味なんでしょうか。
DWなどでは検索用データを別につくるので、かなり早くなるというように
理解しているのですが、両者の境目はどのあたりにあるのでしょうか。
主に文書ファイルで200Mを対象と考えているのですが、
この程度であれば、grepで十分ですか?
>時間がかかって実用に適さないという意味なんでしょうか。
単純に言えば、そういうこと。一日に何回実行するかに依ると思うけど。
また、問題になる時間というのも人によりまちまちだと思うな。
電話の応対中に使うなら、10秒はアウトだね。Grep200Mならそのくらいでしょう。
文書作成中に検索すれば、おそらく単純に時間の損失になるし、思考の
中断にもなる。損失10秒として、10秒 × 15回/1日 × 200日/年もあると
仕事ならやっぱちょっと考えちゃうよ。
ナマズ使ってるけど
自分用に設定すれば実用的なレベルになるよ。
テキスト、ワード、エクセル、htmlなどの文書データが40G程度あるけど
簡単な検索なら一瞬で出てくる。
ただ思考の中断は早くなっても解決しないよ。
自宅PC、会社PC両方いれてるけど使用頻度は圧倒的に会社。
顧客から何年も前の見積や製品をフリーワードで検索。
ヒットして即答出来るのが快感w

所詮自己満足か・・・
確かに仕事では良く使う。
特に大量メールが溜まると。。。
589584:04/06/12 07:14
まずは実際に試してみるのが一番と思い、KWIC Finderを使ってみました。
インストール・使用共に非常に手軽で便利ですね。
ただ、逐次検索では確かに200M弱でも10秒程度必要で、
物書きのような仕事をしている者としては、思考の中断ということでは少し気になりますね。
しばらくこのまま使ってみて、それでも気になるようであれば、
Microsoft Index ServiceやKWIC Search Engineを使った全文検索システムに挑戦してみようと思います
(完全文系人間としては、やや大変そうですが)。
皆さん、アドバイス誠にありがとうございました。
あとは、ホットキー機能があるものを使うことかな。同時に選択文字の自動コピーが
出来るものだとなおよし。
作業の簡略化により、「あーして、こーして」等、本来の作業と関係ない思考が
割り込むことを防ぐよ。
>>589

その時間分、人件費を考えたらサーチクロスを2000円ぐらいで買ったほうが
結局安くなりません?
自作自演ヤメレ
>>591
そのままKWIC Finderを使ったほうが安いし、今回の目的にはサーチクロスよりあっていると思うが
594584:04/06/14 18:12
皆さんその後もアドバイスありがとうございます
KWIC Finderでインデックス検索を行うのと、サーチクロスを使う違いは、過去ログで確認したところでは
サーチクロスでは、2ちゃんのdatログも扱えること、あとはメールの検索に優れていることぐらいでしょうか。
確かに便利そうではありますが。
ところで、Microsoft Index ServiceとKWIC Search Engineではどちらが優れているのでしょうか?
マニュアルでざっと見たところでは
Microsoft Index Service:自動作成が可能
やKWIC Search Engine:信頼性がより高い
ぐらいでしょうか。

ちなみに>>592は私に対してでしょうか?別に自演はしてませんが・・・
併用でいいんじゃない
確か並べ替え(ソート)はサーチクロスのほうが優れていたような気がする・・・
個人用(ファイル数:十数万、サイズ:数ギガ、Win2K)に全文検索システムを
導入したくて estraierを試してみた。
目下、転置インデックスを作成中なのだが、estindex register がまだ終わらない。
開始してからもう一日以上経っている。
コマンドプロンプトを見てると進行が速かったのは最初だけ、今は、一項目登録に
数秒から十数秒かかってる。
現在 casketのサイズは500MB。
estraierにこの規模は無理なのかなあ。
データとインデックスを別の物理ドライブに置いて高速化を図ってるんだが。
分割して作ってからestindex mergeする方法を試してみたら?
製作側の想定外の使用条件であることはわかるな。
600597:04/06/24 19:01
レスもらってたんだね。アリガト。
2日以上かかった。その間HDDはギーギー言いっぱなし。
HDDの耐久試験をしているような気分だった。
結局namazuに乗り換えた。こっちはいたって静か&スムーズにindexing終了。

サイトに10万超の文書数にも対応とあったと思うから、
使用条件を大幅に越えるものではなかったと思うのだが。
601名無しさん@そうだ選挙にいこう:04/07/01 00:29
サーチクロス、インデックスの作り方に癖があるような…
どういうアルゴリズム使ってるんだろう。
って、まぁそこは秘密なんだろうけど。

俺、マジでべたにGREP掛けてるんだと思ってた。
なるほど、KWIC Finder は N-gram 使ってるのか。
603名無しさん@そうだ選挙にいこう:04/07/01 07:04
おれ、Indexing Service は結構好きで、
自分でフィルタ作ったり、OLE DB Data Provider for Indexing Service
つかって検索ソフト作ったりしている。使用言語は C#。

でも、周りはほとんど Indexing Service なんて使ってない。
Microsoft は Indexing Service を今後も続けていく気はあるんだろうか。
なんてふと考える。

Indexing Service は N-gram 使ったような総なめの検索は
統合しづらいみたいだしなぁ。なにせ「プロパティ - 値」の
集合として捕らえるわけだから。
604名無しさん@そうだ選挙にいこう:04/07/02 02:35
他スレで質問しましたが、スレ違いだったようなのでこちらで質問させて下さい。

【必要な機能】 ロボット検索技術を応用した、インターネット上の販売情報を検索することができるソフト。商品名やスペック等からリアルタイムな情報を検索することができる。その得た情報をMYSQLなどのDBに落とし込みたい。
【.  目 的  】 リアルタイムに価格比較できるPC比較サイトを作りたい
【. 使用OS 】 windowsXP
【.  条 件  】 10万以内なら払いたい
■試したけど条件を満たさなかったソフト
【. 名  称  】 まったく見つからず
■これだけはやりました
>>1-10、FAQ集、上手な検索の仕方 を読んだ 】 はい
【  調べたサイトの名前  】 GOOGLE YAHOO など大手検索エンジン
【検索キーワードは?  ..】 ロボット型検索技術 クロール ソフト

恐らくこのようなソフトはないと思います。。
この技術の最も単純なソフト。もしくは応用が聞くような単純ソフトがあれば・・・・などと不遜にも考えています。

ちなみに下記2サイトで私がやりたいような事を行っております。

http://www.bestgate.net/

http://yasune.dokoda.jp/

このような技術の雛形などご存知の方いましたらどうかご教授下さい。
>>604
このスレ最初から読んだ?
606604:04/07/02 22:09
すいません。かいつまんでしか読んでいませんでした。

そして、今、完読しましたが、クロール系の話題が
どこかわかりませんでした。もしよろしければ、
どのスレかご教授頂ければ嬉しいです。
これか?

ロボット型検索エンジン5

http://pc5.2ch.net/test/read.cgi/hp/1030973183/
608名無しさん@そうだ選挙にいこう:04/07/04 22:42
サーチクロスって、Becky!2の添付ファイル内も検索できるんでしょうか?
>>608
対応してるファイル形式なら出来るよ。
610608:04/07/04 23:39
>>609
Becky! Ver.2だと添付ファイルはエンコードされたまま保管されていますが、
それでも中身の検索をできるんでしょうか?
メールの添付ファイルの文章の検索なんて出来るのか?
つーかそんなこと考えてみた事もなかったな。大体別フォルダに保管しておくし。
>>604
不遜すぎ。自分で手を動かす気もなくたったの10万かよ。
ケタ2つ間違ってるぜ。
613名無しさん@そうだ選挙にいこう:04/07/05 14:39

         ,,-―--、
        |:::::::::::::;;;ノ  / ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
        |::::::::::( 」 <私は、ストーンズフリークですが・・・
        ノノノ ヽ_l   \__だから好きなんですかね____________
       ,,-┴―┴- 、    ∩_
     /,|┌-[]─┐| \  (  ノ
      / ヽ| |  バ  | '、/\ / /
     / `./| |  カ  |  |\   /
     \ ヽ| lゝ    |  |  \__/
     \ |  ̄ ̄ ̄   |
      ⊂|______|
       |l_l i l_l |
       |   ┬    |
>>611
Lotus Notes R5 は出来るよ
だれかIBをXPで動かす方法知りませんか?
616蕪木ら某 ◆Googl8RmwA :04/07/14 13:05
>>615
http://faq.justsystem.co.jp/faq/1003/app/jsfaq.jsp?26863+0081
> インターネットブーメランは、Windows XPには対応していません。
http://faq.justsystem.co.jp/faq/1003/app/jsfaq.jsp?26862+0081
> インターネットブーメランは、Internet Explorer5.5 SP2および6.0に
> は対応していません。
???


http://www.justsystem.co.jp/win2000/win2000_ib.html
> 「Windows 2000」へのインターネットブーメランの対応について
...
> 現在発売中のインターネットブーメラン(※)は...制限ユーザーでの
> ご使用には対応しておりません。
...
> システム管理者(Administrator)または標準ユーザー(PowerUsers
> グループ)で問題なく動作します。

http://www.atmarkit.co.jp/fwin2k/win2ktips/061execauscut/execauscut.html
> 一時的にほかのユーザー権限でプログラムを実行する方法...
(w
>>616
結局、無理?
>>617
616読んで自分で判断しろ
619615:04/07/14 23:31
615です。

昨日、インストール後に再起動しても「仮想メモリが足りません」とでて
何故か起動しませんでした。メモリは1GBあったんですが。
今起動したら、普通に起動して使えます。

>>616
そのFAQやWindows2000対応モジュールは導入済みですが、>>616さんが
それを貼った意図がわかりません。
まさか、IBのアップデート情報も読まない馬鹿だと思われたのでしょうか?_| ̄|○


>>617,618
動きましたよ。全部ちゃんと使えるかどうかはこれから確認します。
まあ>>615読んだだけでは普通どんな状況か、何をやったのか分かる奴はいないわな
少なくとも、質問の仕方も知らないバカだとは思ったな
>>619
情報は小出しにするな
>>615
???インストール直後の再起動では無理で、そのあとなぜか起動したって事?
モジュールのインストールと再起動のタイミングとか情報キボンヌ。

何にせよ XP で動くというのは希望が見えた気分だ・・・。
624615:04/07/17 11:57
>>620-622
もう虐めないでください。

>>623
IB導入→パワーアップキット、2000対応パッチ導入(1パッチ毎に再起動)→起動せず_| ̄|○

それで一度諦めたんですが、翌日再起動したらあっさり起動しました。
何度か試しましたが、情報ボックスを複数作って普通に検索できてます。精度はまだ
アレですが。


IEとの連携や、ATOK17との連携はまだ試していません。たぶん無理だと思いますけど。
625623:04/07/17 22:16
>>624
おおサンクス。
ATOK17 との連携は 2K でも出来ないっぽい。
ヘルプに削除されたって書いてあったよ>コンセプトナビ
方言使わないし 16 にしようかな・・・。
CDにプログラムごと焼いて、CDの中のドキュメントを検索できるという
Namazuみたいなものありませんか?

627615:04/07/24 15:33
ごめんなさい。

>>624の手順、最後の再起動前にIB関連の全EXEに「NT4 SP5互換」設定してます。
忘れてました。

互換設定直後に動かないので諦めましたが、再起動したらあっさり動きました。
628名無しさん@そうだ選挙にいこう:04/08/12 15:28
Vectorプロレジ大賞ユーティリティ部門で
サーチクロス 2.0が受賞

ttp://shop.vector.co.jp/service/special/award2004_summer/
受賞しても売れないとしょうがないんだよね。メーカは開発
やめちゃったりで。。。。

IBやConceptBaseSearch20も日経の何か受賞していたけど
その後は。。。。。
630名無しさん@そうだ選挙にいこう:04/10/08 06:57:56
>629
> IBやConceptBaseSearch20も日経の何か受賞していたけど
> その後は。。。。。

ConceptBaseは法人向けでがんがってるけど、
NamazuとかGETAに浸食されつつある。
631名無しさん@そうだ選挙にいこう:04/10/15 02:57:33
Google Desktop Searchベータ版リリース
633名無しさん@そうだ選挙にいこう:04/10/15 13:14:34
Google Desktop Searchは日本語のメールが検索できなかった
日本語版が早く出て欲しい
MSのメーラーしか検索できないんじゃ、漏れには役に立たないや。
PDFが検索出来ないのは痛いな。
2chのログもね。 結構馬鹿にされるかも知れないけど、コンピュータの設定
関係については役に立つよ。 専門的に本格的な話になると相当怪しい
けどね。
文書や曲、画像など様々なローカルファイルを検索「Copernic Desktop Search」
http://www.forest.impress.co.jp/article/2004/10/20/cds.html
>>637
どうなの?

>  なお、編集部のWindows XPにて本ソフト英語版を試用したところ、
> Office文書や楽曲ファイルのタグ情報、IEのお気に入りやアドレス帳、
> そのほか一部のメールは日本語で検索できたが、テキストや
> HTML/PDF文書は日本語で内容を検索できなかった。
>>638
何がですか?
>>639
何がって。。。

ほんとに全文検索したいの?
641名無しさん@そうだ選挙にいこう:04/10/30 16:35:14
サーチクロスって読んde!!ココで作った透明テキスト入りのPDFが検索できないね。
>>640
質問の意味が分からない。

>>641
両方とも一番新しいの使ってるけど出来てるよ
643641:04/10/30 23:58:51
>>642
マジか・・・?
不都合無いんでずっと1.0使ってた。
最新バージョン落として使ってみるか。。。
644名無しさん@そうだ選挙にいこう:04/11/01 12:38:17
サーチクロスって今のメジャーバージョンは2でなんで、
1とは相当違うんじゃない?
ていうか1のユーザーは無償で2にアップデートできるんじゃなかったか?
素直に最新のにしたほうがいいだろう。
646名無しさん@そうだ選挙にいこう:04/11/04 14:52:06
Lookoutはどうでしょう。今のところ便利に使えてますよ。日本語も通りますし。
添付ファイルも検索してくれますが、たぶんPDFは検索対象にならないのが残念。

http://www.atmarkit.co.jp/fwin2k/win2ktips/467lookout/lookout.html

http://www.microsoft.com/downloads/details.aspx?familyid=09b835ee-16e5-4961-91b8-2200ba31ea37&displaylang=en
>>646
検索漏れが多いのが気になる。
ないよりはマシってとこかな。
>>642
http://www.villagecenter.co.jp/cgi-bin/faq.cgi?software=SX&keyword=pdf

Q.003 検索できないAdobe Acrobat文書(PDFファイル)があるようですが……。

残念ながら、すべてのAdobe Acrobat文書が検索できるわけではありません。
現時点でサーチクロスが対応しているのは次のタイプとなります。

以下略
デスクトップサーチは世間的には赤丸急上昇なジャンルなのに、
サーチクロスは先行者利益を活かせてない気がする。惜しいな
先行すれば常に利益があるわけじゃないし。
世間的に流行なのは無料だからねぇ。

インデクサの軽さは良いと思うんだけどね。。。
LookOutとGoogle Desktop Search の日本語検索の漏れ方が同じことに気付いた。
スペースか改行がなければ一単語とみるみたいだね。
Google Desktop Search日本語化まだ?
yahooも参入するらしいけど・・・

サーチクロスレジストしてしまった俺にとっては複雑な心境。
namazuでメールのIndexを作るにはやっぱり一度HTMLに変換するしかない?
他の商用ソフトならdbx形式でもそのままIndex作ってくれるのかな。
654名無しさん@そうだ選挙にいこう:04/11/13 12:33:39
>>643
写真や手書きの書類を無理やり読んde!!ココに読み込ませて
透明テキストにキーワードを書き込んでpdfで保管しておりまつ。

検索がメチャ便利
655名無しさん@そうだ選挙にいこう:04/11/13 18:52:21
656名無しさん@そうだ選挙にいこう:04/11/13 18:53:01
657名無しさん@そうだ選挙にいこう:04/11/18 23:35:23
xdoc2txtとデフォのPDFフィルタとだとどっちがいいのかな?>サーチクロス
658名無しさん@そうだ選挙にいこう:04/11/20 18:28:31
uerhr
今発売中の週間アスキーにサトリが取り上げられているね
>>659
サトエリの仲間?
661名無しさん@そうだ選挙にいこう:04/11/21 16:03:08
2ちゃんねる専用ブラウザ「ホットゾヌ2」の3年分のログを
サーチクロスでインデックス化してみた。

単語数3,826,244
4つの単語で検索したら53秒もかかったよ(;´Д`)
PCのスペックは?
663名無しさん@そうだ選挙にいこう:04/11/21 16:50:15
>>662
4年前に買ったPenIII-866 512MB PC133 SD-RAM Win2K
たしかに一昔前のスペックだが……
あ、2chのログはサーチクロス内蔵のを使うより、dat2txtを使ったほうがいいよ。
dat2txtを使っても遅い?
ちなみに何メガぐらい?
>>663
そんくらいあれば
53秒もかかるはずはないよ
うちはセレ1G 256M WinXPだけど
10〜15秒くらい。
データはテキストだけで10Gくらい
667661:04/11/22 21:25:49
>>664
dat2txtを使ってるよ。でも遅い

>>665
過去ログはトータルで737MB。

>>663
10GB!? おかしいなぁ?
でも単語4つのAND検索だと1分近くかかるんじゃない?
あ、ヒットしまくるような単語で検索すると遅くなるかもね。漢字1文字とか。
669名無しさん@そうだ選挙にいこう:04/11/24 02:57:44
>>669
マカーじゃないしなぁ。
それにOS標準の検索サービスってHDDアクセスしまくりの悪寒が。。。

Winなら現状以下の選択肢が勧められる
●ただが一番
 Namazu for Win32 + search-s
●シェアウェアなら。。。
 KWIC Finder
●製品版が安心
 サーチクロス2

多機能というならKWIC Finderかなぁ。
検索エンジンをNamazu,IndexService,独自エンジンから選べるし
圧縮ファイルの他、文書フィルタの導入で色んな文書を検索対象に出来る。
主要メーラにも対応、正規表現での検索も可能。

……ただインデキシングの遅さに辟易したんで、漏れはサーチクロス使ってるが……
Windows 環境であれこれ考えずに導入できて, それなりに使えるのは
サーチクロスだけだろ.
そういうわけで, オレはサーチクロスを買う気でいたのだが, なんか
google が出してくるみたいなので, しばらく様子見.
なんか, あらためて考えると, なんで2千円位の出費に躊躇しているのか
自分でも解らんが.
2千円>時間なら別にいいんじゃないの?
ちなみにnamazuで2chのdatファイルはインデクス作れるのですか?
もしかして、なんかのフィルタでhtmlに変換して、インデクス作るから
ディスクを食うとか。

namazuは設定とかはダルイけど、早いですから。
674名無しさん@そうだ選挙にいこう:04/11/25 10:19:35
サーチクロスだとエクセルのテキストボックスまでインデックス化してくれない。
xdoc2txtだとどうなのかな?
675674:04/11/25 10:35:17
早速試してみた。xdoc2txtをコマンドラインからテキスト変換。
テキストボックス内のテキストもちゃんと抽出できてるようだ。
OLEじゃなくこちらでインデックス化してみよう。。。
>>673
みすずん検索はnamazuとdat2htmlで過去ログ全文検索システムを作ってる。
htmlへのコンバートはオンメモリで行われるのでディスクは喰わないよ。
AcrobatのWebCaptureで取り込んだWebページが検索に引っかからない。
× サーチクロス2標準
× xdoc2txt
× pdftotext(xpdf)

いいPDF用文書フィルタはない?
>>677
namazu & xpdf で出来るYo。
>>678
あれ? コマンドラインから
"> pdftotext ○○○.pdf >○○○.txt"

で正常にテキスト抽出出来なかったんだけど。。。
それは日本語の設定をちゃんとしていないか、pdfにパスが掛かっているから。
英語のみのpdfファイルで試してみれば。
パソコンのハードディスクの中身をGoogleで検索――Google Desktop Beta IT最前線 :ITビジネス&ニュース
http://it.nikkei.co.jp/it/column/zensen.cfm?i=20041022c7000c7

DesktopSearch - PukiWiki
http://www.globe.to/~oka326/?DesktopSearch

MSNサーチが検索市場にもたらすもの - CNET Japan
http://216.239.57.104/search?q=cache:aDdb83vN4E4J:japan.cnet.com/interview/story/0,2000050154,20075038-2,00.htm+%E3%82%B5%E3%83%BC%E3%83%81%E3%82%AF%E3%83%AD%E3%82%B9&hl=ja
>>680
thx
日本語の設定やったらコンバートは上手くいった。
でもpdftotext.exeって標準出力が出来ないのが痛いね。
これが出来たらサーチクロスのコマンドフィルタとして利用できるのに。
サーチクロスで数字と漢字の連続した文字の検索が出来ません。
たとえば山田太郎の6月の領収書を探したいとき「山田太郎 領収書 6月」で検索しても絞り込まれません。
山田太郎の領収書が沢山引っかかるのでしらみつぶしに探さざるを得なくて困ってます。
設定で数字もインデックスの対象にはしてあります。
どなたかお暇な方、御教授をお願い申し上げます。
>>683
数字は全角で「6月」と入れてみる。
「6」(または「6」)と「月」を含む文書がヒットするのであとは「検索+(S)」で絞り込む
>>684
「山田太郎 6月」で検索するのではなく「6月」で「検索+」するのがミソなんですね。
そして「いずれかのキーワードを含む」で山田太郎で絞り込むんですね。
ありがとうございました。助かりました。
686名無しさん@そうだ選挙にいこう:04/12/01 14:44:42
ジャストシステム、デスクトップ検索ソフトConceptSearchを来春発売
http://japan.cnet.com/news/ent/story/0,2000047623,20077303,00.htm?ref=rss
687名無しさん@そうだ選挙にいこう:04/12/01 20:12:09
うおおおおお
きたああああああああああああああ

ジャストシステムがんがれ!!!
688名無しさん@そうだ選挙にいこう:04/12/01 22:31:55
IB以来の個人向け全文検索ツールの発売か。
期待せずにはいられないな。
ところで

*インストールには別途「作業ディスク」2,000円(税別)が必要です。

これなに?
689名無しさん@そうだ選挙にいこう:04/12/01 22:46:11
現段階では、「ライセンス製品」だから

ライセンス製品の購入は
購入は、「ライセンス」+「メディアパック」というのが普通

店頭販売も検討してるようだけど、是非やってほしい
税別って,,,,。
順法意識のない会社だ。
●CB IVの検索エンジンを使用したデスクトップ検索ソフト
http://www.justsystem.co.jp/software/dt/cs/

インターネットブーメランの正統な後継者といった感じか。
もれIBって使ったことないんだけど実際どうなの?
サーチクロス2は2ちゃんDATまで検索できて愛用してるんじゃが
乗り換える価値アリ?
税込みでも難癖つけられるけどな
ついにきたね〜
待ちに待ったCB!!!


でもね・・・これ、

企業向けですから!!!   残念!!
企業向けではなく、法人用ですからの間違いです・・・ 切腹!!
justのやつはDocuWorksに搭載されるから、DocuWorksを買うのが正しい。のか?
もう少しドキュワークスが安ければねぇ・・・・
企業向けと法人用の言葉の違いってなに?
698名無しさん@そうだ選挙にいこう:04/12/02 17:05:18
https://www.justsystem.co.jp/if/email_if.html

みんなでいつ店頭販売されるか問い合わせよう!!
い・や・だ
今から自宅を法人登記して買おう
>>686
>>688

ライセンス販売だから企業のみだね
個人では購入できない
702名無しさん@そうだ選挙にいこう:04/12/03 00:49:45
>>696
DocuWorks+ConceptSearch(6,000+2,000円)+Acrobat Elements(4,000円?)で
14,200円と考えればお買い得に思えるかもしれない
Scan SnapにDocuworks付かないかな。
そもそもドキュワークスってなんなんじゃ??
>>704
つまらない・・・
706名無しさん@そうだ選挙にいこう:04/12/04 08:10:32
ドキュンワークス
○Adobe PDF IFilter v6.0が10/19/2004に出ているようです。

http://www.adobe.com/support/downloads/detail.jsp?ftpID=2611

日本語windows Xpでもつかえそう。

> Additional notes
> Language notice:
> Adobe PDF IFilter has no user interface and therefore is
> language-agnostic. It is tested and supported in Tier 1
> languages (English, French, German, and Japanese), utilizing
> operating systems in the above languages and text within
> Adobe PDF files in the above languages. However, it has also
> undergone additional limited testing utilizing Adobe PDF
> documents in all Acrobat languages and has correctly
> returned text to Microsoft Indexing Services. Since Adobe
> PDF IFilter is based on the Microsoft indexing client, it is
> this indexing client that is responsible for interpreting
> the returned text and then presenting the information to the
> user.
おー、やっと出ましたか。ていうか出てましたかw
レジストリいじるのが嫌でIFilter5.0を見送っていたもんで、早晩試してみます。
709名無しさん@そうだ選挙にいこう:04/12/12 11:49:34
>>702
>Acrobat Elements(4,000円?)...
って、普通のAcrobat Stdと、どこが違うんですか?購入価格は、
40万円ってことですか?
”最も信頼性の高い Adobe PDF 文書を作成し、社内外にすばやく確実に
配信..”の後半文句って、何が利点なんだろ。
http://www.adobe.co.jp/products/acrobatel/main.html
>>709
サイトを読めば分かる
>>709
Acrobatファミリー - 製品比較
ttp://www.adobe.co.jp/products/acrobat/matrix.html

単体販売のない100ライセンスからのライセンス販売のみ。
昨日としては本当にただPDFを作れるだけ。今はいろんなメーカーから
安価なPDF作成ソフトが出てきたからあまりありがたみはないかもな。
×昨日 ○機能
713名無しさん@そうだ選挙にいこう:04/12/16 14:31:38
ついにMSもデスクトップ検索に参入か。
714名無しさん@そうだ選挙にいこう:04/12/16 17:44:03
>>657
遅レスだけどxdoc2txtの方が良い。
デフォのPDFフィルタだと、
「単体販売のない100ライセンスからのライセンス販売のみ」という文章が
「単 体 販 売 の な い 1 0 0 ラ イ セ ン ス か ら の ラ イ セ ン ス 販 売 の み」
という風にスペースを1つずつ入れながらテキスト抽出してしまうことがある。
これだと単語でヒットしなくなる。
(読んde!!ココでつくった透明テキスト入りPDFファイルで実験)
WinFSの実現、さらに遠のく--マイクロソフト幹部明かす
http://japan.cnet.com/news/ent/story/0,2000047623,20079624,00.htm

Windows Serverの開発を指揮するBob Mugliaが、WinFSは2007年に
出荷されるサーバ版Longhornにも搭載されないと語った。
「WinFSはLonghornクライアントに搭載されない」と同氏はインタ
ビューのなかでかたり、さらに「また、Longhorn Serverにも搭載さ
れない」と付け加えた。

 MicrosoftではLonghorn投入の数年後にアップデート版を出す予定
だが、WinFSがこれに搭載されるかどうかさえはっきりしていない。

さらに、WinFSのOSへの搭載がもっと遅れ、2010年以降に出荷予定の
Windows「Blackcomb」(開発コード名)になる可能性さえある。
716名無しさん@そうだ選挙にいこう:04/12/16 23:22:45
>>715
ヲワタ
AskJeevesも。いちおう。
>>718
デバイスドライバとかOffice/ウェブブラウザ以外のソフトの記述が抜けてるのが
気になるけどな。
720名無しさん@そうだ選挙にいこう:04/12/17 22:17:18
ちょっとスレ違いかもしれませんが…

米blinkx、テレビ番組の全文検索サーチエンジン「blinkxTV」を発表
 米blinkxは16日、テレビ番組を24時間蓄積し続けることで、音声認識技術により全文検索できるようにしたサーチ
エンジン「blinkxTV」を発表した。 http://internet.watch.impress.co.jp/cda/news/2004/12/17/5843.html



xdoc2txt 縦書きのPDFは



P
D
F

みたいなテキストにしちゃう orz
これじゃ検索引っかからないよ。。。
>>727
後整形すればいいだけでは?
723名無しさん@そうだ選挙にいこう:04/12/20 11:43:07
>>722
元のPDFはテキスト部コピペできちんと「縦書きのPDF」になっている。
xdoc2txt.exeでフィルタリングすると



P
D
F
になってしまうので、元PDFは整形のしようがない。
ちなみにサーチクロスにて利用。
724名無しさん@そうだ選挙にいこう:04/12/26 08:53:57
>>651
ならワイルドカード使えばいーのかとlookoutで試したら,良さげな感じ.
「全文検索ユーティリティ統一スレッド」って文書に対して
「全文」「統一」だと検索hitせず
「全文*」「*統一*」だと探してくれる.

他のも試してみる.



ヘルプファイルに「テキスト検索」タブがあるやつってあるよね?
あれってどうやって作ってるのかな?
索引作ってるみたいだけど、Winの標準APIにそういうのがある?

サーチクロスいいね。これでPalmのDOC形式も検索できれば最高なんだけど。
サーチクロスで1GB、7万ファイルほどのtxt,htmlを喰わせたら
落ちる落ちる。これぐらいのデータ量だと、別のソフトを使った方が
いいのでしょうか?
やっぱりNamazuかなあ。でもコマンドラインなんて使えないよ_| ̄|○...
>>727
インデックスを分ける。
また、インデキシングは数回に小分けして行う、などの対策が有効かと。
>>727
namazuならブラウザから使う方が簡単でいいよ。
>>727

2000円のソフトに業務用レベルを求めるのが間違ってるような・・・・・
1GB、7万ファイルって業務用レベルなの? 煽りじゃなくて純粋な質問。
これぐらいならWEBの自動巡回ソフトでニュースサイトを根こそぎさらえば
すぐに溜まる量だと思うんだけど。
気に入った WEB サイトがあると(無くなるのが怖いので)すぐに根こそぎ
コピーする癖のある漏れの場合、

ファイル数 : 約 130,000
容量   : 約 1.7GB

だった。参考まで。
2500ファイル
10GB

で問題ないですよ。メモリが糞の可能性があるとか?
俺はUSB経由で100GBをバックアップしようとしていつもシステムダウンしてた。
糞メモリを引き抜いたら治った経験がある。
メモリスレで勉強した。
734名無しさん@そうだ選挙にいこう:04/12/30 11:06:38
>>732 おまえか!全部持っていったのは!
かえせよ〜 あれ、かえしてくれよ〜

>>733 とりあえず memtest86+ だな。
メールを1メール1テキストファイルで切り出している人なら、
軽く万は超えるんじゃない?

うちは5万ぐらいあったと思う。
>>731
自分中心に考えられても・・・
>>736
お前中心に物言われてもな
世界の中心は俺だと叫んでみるテスト
で、サーチクロスの限界はどれぐらい?
GB超えたらナマズの方がいいのかな。
なまずでデスクトップ検索できるの?
「サトリ」のページ、死んでいない?404になってしまう。
何かあったか?開発中止なのか?
もうほっといてやれよ・・・
デスクトップ以外も検索すんのになんで「デスクトップ検索」っていうん?
この場合のデスクトップは「ローカルコンピュータ」って意味合いだろ。
うほ、なまずインストールすら出来ねえwwww
c:\以下をインデックス対象にすればnamazuでもデスクトップ検索はできる。
絶対にやろうとは思わないけど。
>>698-701
興味があったので、Justsystemに問い合わせてみた。
サポートからの返信は、以下の通り。
==================================================
『ConceptSearch』につきましては、ご指摘の通り、
法人様専用ライセンス製品となっております。
残念ながら、個人様ではご購入いただけない製品でございますので、
所属される法人名義でお申し込みいただくか、屋号などの
個人事業主名があればお申し込み可能です。
なお、個人向け製品の販売については、
ご要望としてお承りしたいと存じます。
================================================
748名無しさん@そうだ選挙にいこう:05/01/01 14:02:16
インターネットブーメランで大量に不良在庫抱えた(かどうかは知らないが、そうだとして)から
慎重になってるのか?

ダウンロード販売でもいいから個人にも売れよな

いまさら三四郎復活させたりとか
やってることがめちゃくちゃなんだよ!
所詮は浮川の個人商店だからな
まー、shurikenも一時期は開発停止してたくらいだからね。
個人的にはshurikenに同梱して欲しい>ConceptSearch
751名無しさん@そうだ選挙にいこう:05/01/01 15:21:17
>>747
お 屋号で可?
うち休眠自営業があるからそれを使って・・・
でもdocuworksも捨てがたいんだよね。
ダウンロード販売なんかしたら
法人版にも影響が出ると思うが・・・
Namazuで素直に日本語ファイル名のファイル開けたら
文句なしなんだけれどね

わけのわからん奴がいるみたいで、いっこうに修正して
くれないんだよねぇ。

あれで正しい動作とかなんとか抜かしている。
全く、英語のファイル名をつければいいじゃんとかぬかす。

利便性の利の字も奴らにはない。
ちょっとカスタマイズすればいいだけなんだから・・・
Namazuでhtmlを取り込むと、一部のファイルが未対応の形式となって
読んでくれない。なぜ?
756名無しさん@そうだ選挙にいこう:05/01/02 21:19:58
FileDiver最強
自分でなんとかできないなら、
簡単な市販ソフトつかったほうがいいぞ
758名無しさん@そうだ選挙にいこう:05/01/03 01:02:00
全文検索ソフトって、インデックスの作り方とか
検索の際のシソーラスとか、中身が詳しく説明されて無いと、
予想不可能な検索漏れがでて困るよね。
大抵は説明されてるから
問題ないのでは?
読まない奴が悪い
あんなの読む方が頭おかしい。
761名無しさん@そうだ選挙にいこう:05/01/03 16:54:25
>760
よかったね。
>>760
そうですね
その通りですね
763名無しさん@そうだ選挙にいこう:05/01/03 18:10:07
>>759 異体字の同一視とか、検索時のシソーラスとか、
形態素解析の癖とか、説明されていないものが多いと思う。
>>763
例えばどのソフトですか?
サーチクロス 2100円 (オンライン版)
ConceptSearch 7000円 (ライセンス5000円、ディスク2000円)
DocuWorks 6.0 14200円 (新規)

どれを選ぶ??


docuworksに7000円のconceptsearchが入ってると思えば安いけど、
他の機能を使うかどうかわからんし。。。
766名無しさん@そうだ選挙にいこう:05/01/04 03:18:52
>>765
DocuWorksは便利だよ
OCRも付いてるし、6.0からAcrobat Elementsも同梱されるし
かなりお買得だと思う
他の機能も買えば使うようになるさ
ConceptSearchとGoogleが出そろうまでは様子見。
サーチクロスはザクザク落ちるから、何でもため込んで検索しようという用途には
向かない。
ちょっとした業務用の資料を検索するぐらいならいいだろうけど。
今ならなにを使うのがいいんだ?
出るまでまってられないんだが・・・
>>768
namazuだな
ConceptSearch まじ期待している。
771名無しさん@そうだ選挙にいこう:05/01/04 22:25:17
docuworksスレ覗いたけど便利そうなソフトだね

【ファイリング】ゼロックスのDocuWorksってP2
http://pc5.2ch.net/test/read.cgi/bsoft/1080963577/
SOHOとかだとすっごい便利そう。DocuWorks
773名無しさん@そうだ選挙にいこう:05/01/04 22:42:12
>>770
まだ続いてるのか。
インターネットブーメラソと、他の自動巡回&ダウンロードソフトと組み合わせて、
ダイヤルアップの頃は重宝したなあ。
>>772
すっごい便利ですよ。1万3000円くらいの投資で事務員一人分年間最低200万円は浮きますね。
772 名前:名無しさん@そうだ選挙にいこう[sage] 投稿日:05/01/04(火) 22:26:53
SOHOとかだとすっごい便利そう。DocuWorks

774 名前:名無しさん@そうだ選挙にいこう[sage] 投稿日:05/01/05(水) 01:24:31
>>772
すっごい便利ですよ。1万3000円くらいの投資で事務員一人分年間最低200万円は浮きますね。
体験版期限一杯使って結構便利だと思ったけど
下っ端だから導入提案できない > DocuWorks
777名無しさん@そうだ選挙にいこう:05/01/05 13:50:08
最寄の上司にメール投げてみろよ。
活用事例とコスト計算を3ページくらいにまとめてさ。
2chのdatを変換なしで、まともな形で解釈してくれる全文検索ソフトは
サーチクロスだけ?
Namazuのフィルタって無いのかな。
ナマズスレいけ
あった気がする
780名無しさん@そうだ選挙にいこう:05/01/06 11:33:23
ConceptSearch には期待しているけど
あのドキュン社長のことだから
インターネットブーメランのようになるのは目に見えてる

と言ってみる
Namazuを入れた。1GBのHTMLのインデックスを作るのに
Athlon XP 1800+で12時間。
だけど精度が出ない。しょうがないからkakasiの辞書から作り直し。
そのためにATOKのユーザー辞書を再編中。何か泥沼……
そんなもんだ
KWIC FinderならMicrosoft Index Serviceが使えるし、軽くていいと思うんだが
このスレではほとんど話題にもならないな
>>783
サービス起動を敬遠しているのかも。
ウチもメモリ貧弱だから辛い。
>>784
なるほど
確かにIS+Nortonだと1Gのメモリ積んでても辛い時が…
色々試したけど、Index Serviceが早くて確実で機能も豊富で安定していて
使いやすくていいような気がしてきた。
787名無しさん@そうだ選挙にいこう:05/01/07 10:53:14
>>781
> kakasiの辞書から作り直し。
> そのためにATOKのユーザー辞書を再編中。

やり方おせーて
検索もできないのか。
ナマズ難しい。Unixなんて使ったこと無い俺にはインストールすら困難。
ようやく動くようになって最初に作ったインデックスが、ナマズMLのログ。
これで調べながら設定を作り込める。。。
そういう人にはサーチXがいいと思います。
時間をかけるかお金をかけるか出来る方をすればいい。
793790:05/01/07 23:42:44
>>791
サーチは気に入っているんだけど、ファイル数が多すぎてインデックス作成中に落ちる。
3万円ぐらいで、100GBぐらいのファイルをインデックス化出来る上位版を出して欲しい。
>>793
そらやすすぎw
795名無しさん@そうだ選挙にいこう:05/01/08 12:56:01
>>793
抽出単語数はどれくらいになってる?
うちとこは300万語くらいになってるけど落ちないよ。

インデックスを分けるか、作成時に小分けして作ってけばいいと思う。

MSN、デスクトップ検索戦争に参戦--MSN Toolbar Suiteベータ版公開
ttp://japan.cnet.com/news/media/story/0,2000047715,20079652,00.htm
↑Longhorn搭載予定とのことだけど、もうIndexServiceは無くなるってこと?
 それともIndexServiceの新クライアントと言うことなのかな?
796790:05/01/08 17:32:58
NAMAZU馬鹿杉。全然関係ないファイルが引っかかる。しかもトップに。
飼い主に似るんだなw
>>796
馬鹿は何使っても一緒だってば
サーチクロスもナマズも馬鹿だろ。つーか、インデックス型なんてつかえねー
取りこぼしが酷すぎて、仕事にならねえ。馬鹿にはちょうどいいんだろうけどwww
と、1週間風呂にも入らずエロゲばっかりやってるヒキのキモヲタが申しております。
全文検索出来る時間があるんですね^^;
それとも大した量じゃないのですか?
802名無しさん@そうだ選挙にいこう:05/01/09 11:40:55
NAMAZUは、検索語が沢山あったページを優先して表示するのかな?
>>802
マニュアル読んだ方がいいよ。
サトリはVectorからも消えてしまった。
HP更新が無くてinfoseekからデリられたんじゃなくて、作者が自発的に消したってこと?
久々にいいソフトに出会えたと思ってたのに・・・残念。
805名無しさん@そうだ選挙にいこう:05/01/09 17:43:50
サーチクロスを使っとるんじゃが、Acrobat Web Capture 4.0 (Acrobat4.0仕様)で
作成したPDFを読めるフィルターはないものかのう。
サーチクロスのデフォルトフィルタも駄目、xdoc2txtも駄目。。。
>>802
まだインストールしてなくても
そんな質問する君には使いこなせないからやめたほうがいい
>>805
馬鹿には使いこなせないよ
>>805
やめろ厨房
809805:05/01/10 19:40:18
>>807-808
答えられないんなら出てくんなゴミ虫野郎が。
「ぼくは無能だから分かりません」とはっきり書けやピロロ菌どもが!
(´∀`)ぴろろろろろ
(゜∀゜)アヒャヒャ
サーチクロスのインデックス作成機能は下痢便ウンコだが、ひらがなを
認識させないと普通のうんこぐらいにマシになる。
分かち書きのアルゴリズムが腐ってるんだろうな。
サーチクロスは基本的に「漢字」「カタカナ」「アルファベット」を抽出してインデックスを作ってるでしょ。
おかげでインデックス作成速度がバカッぱやなわけで。
>>812
>分かち書きのアルゴリズムが腐ってるんだろうな。
そういう問題じゃないと思うぞ
サーチクロスは形態素解析使ってない。
だから辞書も(ひらがなを除いて)持っていない。

上の文章だと「サーチクロス」「形態素解析」「辞書」「除」「持」が抽出される。
「解析」で検索かけると全ての索引を1文字単位でサーチして「形態素解析」を見付ける。
だから検索は遅い。
やっぱり通はGREP。
精度はピカ一だ
同意。index型は信用できない。
>>816
遅くて仕事にならんな
>>815
あれ、「解析」なら「解析」でインデックスを探すはず。
「分かち書き」なら「分」と「書」で検索するけど。
βακαには見えないインデックスです
米Yahoo、デスクトップ検索始めました
http://desktop.yahoo.com/
デスクトップ検索流行ってるな。
サーチクロスも「VC Desktop Search」と名を変えフリーで提供しる!
うえでちょっと話題になっていたIndexServiceをKWIC Finderで使っているのですが
これはPDFはインデキシングできないんでしょうか?IFilterも入れてみたんですが
無料の検索ソフトがこれだけ出ると、有料のソフトは大変だな。

今のところは日本語に弱いってのが不利だけど、
これを解決されたらますます・・・
無料の検索ソフトがどうというより
割れが一番の問題です。
まあねぇ。
もっとも無料のソフト群はBecky!その他日本製のメールソフトに対応してくれるような気がしない。
どーせOutlookとOutlookExpressだけでしょ。

あるいはDocuWorksとか2chログとか。

>804
本当に残念だ。作者のfhew氏、ご苦労様。
828名無しさん@そうだ選挙にいこう:05/01/15 11:57:41
CD-R等のリムーバブルメディアにインデックスごと検索対象文書を保存できるシステムって
もっと容易・安価にならんもんかね?
フリーのデスクトップサーチがリリースラッシュになってる今こそ
有料の検索ソフトには一考してほしい。

……つうか今のサーチクロスとかでもインデックスからのファイル参照を
絶対ディレクトリじゃなく相対ディレクトリにすれば済む問題なのになぁ。。。
リムーバブルメディアだと検索が遅すぎて使えないって
830名無しさん@そうだ選挙にいこう:05/01/15 16:45:05
げっ、サトリなくなってたのか...or2
フリーでXDWも検索できるし、究極の検索ソフトだったのに…
なくなっても別に困らんし・・・
>>831
DocuWorksの文書はインデックスサービス用のIFilterをMSが配ってるから、
それ入れてインデックスサービスで我慢しな。
>>833
d...  (;_;)
サトリ
の書
837名無しさん@そうだ選挙にいこう:05/01/22 21:13:36
サトリってもうどこでもダウソできないの?
>>837
残念ながらそのようだ。
web.archive.orgも見てみたけど、DLはできんかった。

fhew氏、もったいないよ。週アスでも紹介されたばかりだったのに。
あらら、やっぱり。 ほんともったいないですわ。
紹介されたからやめたんだろ。
841名無しさん@そうだ選挙にいこう:05/01/23 02:01:07
842名無しさん@そうだ選挙にいこう:05/01/23 02:03:56
オンラインソフトは、わけわかんない人から変なメールたくさん来るからなぁ。
844名無しさん@そうだ選挙にいこう:05/01/23 18:31:12
ConceptSearch は結局パッケージ販売はしないのかなぁ・・・

ジャストシステムのことだもんな
やるわけねぇか
製品戦略も中途半端でポリシーがないもんな
>>844
いやポリシーはあるが金がない
846名無しさん@そうだ選挙にいこう:05/01/24 12:53:19
Spotlight
http://www.apple.com/jp/macosx/tiger/spotlight.html
コンピュータの中のあらゆる場所から、あらゆるものを一瞬で検索。
http://www.apple.com/jp/macosx/tiger/searchtechnology.html
>>846
これ、こないだ出たちっちゃなMacにもインストールできるのかな。
ちょっと使ってみたい。
>>847
ちっちゃなmacも次期Tigerに対応しているから使えるよ。
特定の文字列を検索したとき
その真下にある行も
抽出したい場合はどんな
ツール使えばよいですか?
>>849
意味不明
>>849
perlで一発
>>849
エディタのマクロ
ワードのVBA
>>844
やるみたいよ?

> 「ConceptSearch(コンセプトサーチ)」を、3月4日(金)から店頭にて販売開始します。
> 希望小売価格は、8,000円(税別)です。
http://www.justsystem.co.jp/news/2005f/news/j01251.html
855名無しさん@そうだ選挙にいこう:05/01/25 15:28:28
いまの個人向けに市販されてる全文検索ソフトって、
N-gram つかってるんでしょうか?それとも形態素解析
してインデックス作ってるんでしょうか?
それとも他の方法で?
856名無しさん@そうだ選挙にいこう:05/01/25 17:57:38
>>854
きたああああああああああああああ
店頭販売キタ━━━━━━(゚∀゚)━━━━━━ !!
>>855
ソフトによる。
>>855
> いまの個人向けに市販されてる全文検索ソフトって、

現状、サーチクロスしかないからなぁ。
サーチクロスは「カナ・漢字区切り法」とでもいうべきか。

ちなみに昔売ってたQuickFinderはN-gram法、
DiskX Searchは形態素解析使ってた。

>>854
このスレで散々インターネットブーメランの評価を聞いてきたからには
買わずにはおられないな。
でも*.mhtや2ちゃんログに対応してるのはサーチクロスだけだから
これも手放せない。。。orz
検索結果は画面中央にオフセットしてほしい。
ログ検索なんかだと、ヒットした文字が画面の一番下/上の行に
張り付いてるより見やすいと思うんだけど。
サクラエディタのF3にはこんなのを設定してる。
S_SearchNext('')   // 次を検索
S_CurLineCenter( ) //カーソル行をウィンドウ中央へ
861名無しさん@そうだ選挙にいこう:05/01/25 21:59:00
>>859 THX いちおう N-gram のものもあったのか。
Namazu つかってるんだけど検索洩れが気になって…
仕事では BizSearch つかってて検索洩れはほとんどないけど、
これって個人で使うようなものじゃないし。

DocuWorks ってたしかなにか全文検索ソフトがついてたよね。
Concept Search だったけ?
>>861
> Concept Search だったけ?
そうだよ。

N-gramには一応検索漏れはないけど、ノイズが多い。
あと、前述のQuickFinderは「検索ワードは2文字以上」という
決まりがあった。(当たり前だけど)
だから「桐」とか「犬」とかは検索できなかった。
元インターネットブーメランユーザとしてはとりあえずConcept Searchは買うぞ。

2ちゃんログは・・・ぶつ切りしてhtmlに変換するスクリプトでも書くか。
インターネットブーメランをWindowsXP SP2にインストールしてみた
なんかエラーが出て動かない

Windows2000にインストールしてみた
起動するが根本的に使い方がわからないorz
865名無しさん@そうだ選挙にいこう:05/01/26 02:40:46
>>862
ExpandFinderって「DocuWorks文書の検索に最適な仕様にカスタマイズした」
ってリリースにあるけど、XDWしか検索できないとかじゃ・・・ないよね?
866名無しさん@そうだ選挙にいこう:05/01/26 08:18:32
メーラーとか一部のファイルが検索できないだけ
基本的には ConceptSeach でサポートしてるほとんどのファイルを検索できるらしい
質問です。過去ログを読むと、ちらほらと

>>861
>DocuWorks ってたしかなにか全文検索ソフトがついてたよね。
>Concept Search だったけ?

>>862
>そうだよ。

という書き込みがあるのですが、デモ版のDocuWorksにも
Concept Searchが付属してるのでしょうか?

先ほどからデモ版DocuWorksを使い始めたのですが、
「検索(全文検索)」らしき機能は確かにあったのですが、
この機能がConceptSearchなのかどうか、よく分かりません
でした。

ハッキリと「CoceptSearchを使うにはココをクリックせよ」
みたいなインターフェースになってるんでしょうか?
Concept SearchとAcrobat Elementsが付属するのはDocuWorks6.0
現行のDocuWorks5.0には付いてない
な、なるほど。
まだ出てないのですね…。
早とちりしてました。

(だから、過去ログでConceptSearch単品で買うか
CSも含まれているDocuworksを14000円くらいで
買うか悩む、みたいな書き込みがあったのかな)

とりあえず、ConceptSearchの発売待ち、でしょうか…。
3月まで、は長いなー…。
870865:05/01/26 12:52:36
>>866
d。 それはいい事教えてもらいました。 とりあえずDocuworks買ってみます。
871名無しさん@そうだ選挙にいこう:05/01/26 12:55:42
(ジャストシステム)きたか
872名無しさん@そうだ選挙にいこう:05/01/26 15:57:39
こんどまた一代限りで終わらせたら
今後ジャストシステム製品は買わない
一太郎みたいに1年に1度バージョンアップされても困る
>>872>>873

ワロタ 確かにどっちも困るw
うちはまだ一太郎13とオフィス2000だ・・・
新しいのを買う気力が起きないんだよな・・・
876名無しさん@そうだ選挙にいこう:05/01/26 16:39:00
でもあまり売れなそう…
877名無しさん@そうだ選挙にいこう:05/01/26 18:16:55
ファイル数が多くて一つの文章も長めなのがおおいような人には
ConceptSeach はいいんじゃないかな

文書要約できる(と思う)し、
検索した文書を抽出条件にしてさらに精度の高い類似文書を探し出せる
(はず。でないとインターネットブーメランより機能低いやん)し。

ただ、ピッタリある文書を探すんじゃなくて「類似文書」を探すソフト
ってことを意識しておいた方がいいかな
878名無しさん@そうだ選挙にいこう:05/01/26 18:18:14
なるほど。>>877は賢いな。

Niftyやってて数百MBのログが溜まっていた俺にとって、インターネットブーメランは驚異のソフトだったな。
カッターの定義ファイルを書けば大抵のメーラには対応したし。WZ MAIL用のカッター書いて使ってた記憶がある。

出荷バージョンの品質の低さには悩まされたが(月例パッチの2〜3回目くらいまではとにかく安定しなかった)。
当時インターネットブーメランを入れたPCが今でも現役で、これを書いてるんだよな・・・
ソフトばかり新しくしないで、元となるPCも新しくしないとな。

と今ふと思った。
2chログの検索が出来るのはサーチクロスとKWIC Finderだけ?
2chのdatってタダのテキストファイルだろ。対応もクソもあるかよ。
>>882
m9(^Д^)プギャーッ
釣り?datファイルがテキストファイルなわけないじゃないか。
885名無しさん@そうだ選挙にいこう:05/01/28 08:21:24
dat を直接見たことあるけど
ただのテキストファイルだったよ

ちなみに、どうせまたアホがでてくるのは明白なので言っておくと
おれは >>892 じゃないから
886名無しさん@そうだ選挙にいこう:05/01/28 08:39:25
>>882 だった
エディタで文章はみれるけど
そのままだとわけわからないよね。
エディタで見れても拡張子がdatだとソフトの検索対象から漏れるから
結局意味がないってことなんじゃないの?





と言って見る。
889名無しさん@そうだ選挙にいこう:05/01/28 18:06:39
改行コードがWin標準のやつ(ど忘れ)じゃないだけな
>>889
CR+LFだろ。
つうか中身がテキストなら.htmも.vcsも.emfもそうじゃろ。
だからって全文検索でテキストファイルと同じ扱いしたらあかんじゃろ。
ビューワが整形してくれないと。
891名無しさん@そうだ選挙にいこう:05/01/28 20:04:22
ていうか、2ちゃんの掲示板は1レスが短くて中身がないものが多いから
ConceptSearchでの検索には向かないと思うよ

普通にキーワード検索の方がいいかも
892名無しさん@そうだ選挙にいこう:05/01/29 16:17:23
WinFSは登場しないかもしれない――?
http://www.itmedia.co.jp/news/articles/0409/13/news010.html
調査会社米Gartnerのアナリストらによれば、米Microsoftは次世代
Windowsから「WinFS」を除去すると発表したが、リリースが大幅
に遅れているこのプロジェクトをリリースしないという選択肢を選ぶ
可能性もあるという。

アップルが「Spotlight」で特許を取得──申請は2000年1月
http://www.macobserver.com/article/2005/01/27.10.shtml
アップルの「Spotlight特許」の概要は次のように記されている。

「様々な場所にある情報に数々の技術を通してアクセスすることの
出来る統一されたインターフェースにより、ユーザーが入力した
様々な記述に関連する情報の細目へ簡便にアクセスすることを提供
する。ユーザーが入力した情報の記述を操作する多数の発見的アル
ゴリズムを用い、選択あるいは検索された情報の候補を表示し、
位置を示す。このように、サーチエンジンの長所を活用しつつ、
関連性のある情報の候補だけをリストアップする。」
Tigerに搭載されるSpotlight機能が5年も前から開発されていたこと
がわかる。

Mac OS X - Tigerプレビュー - Spotlight
http://www.apple.com/jp/macosx/tiger/spotlight.html
>>892
UNISYSのLZW特許より酷いな。
そんなもので特許を申請するかな、普通…
説明してほしい・・・
良く分からん。
>>894
金はあるのか?
酷くない特許ってありますか?
>>892
漏れは車輪を発明しましたと言ってるようなものだな。
ここまでアホなのは他にない…ブリティッシュ・テレコム以外にはない。
車輪というか・・・

「調べたい事柄が本のどこにあるのか、簡単に調べる方法を発明しました。索引です。」

だな。
まぁ、、、ブランコの乗り方で特許がとれる国だからな・・・ あの国は。
ああ、BTな。
あれは大顰蹙だったな。
justsystem自身でconceptsearchのことを「デスクトップ検索ツール」って言っているんだ。
日本の特許も見てみると
かなりおかしいぞ
902名無しさん@そうだ選挙にいこう:05/01/31 01:42:38
WEB検索も著作権侵害に当たりそうな勢いだね
なんで著作権が出てくるんだ???
【請求項1】
情報識別子を入力し、
前記識別子にマッチする情報を見つけるために異なる発見手法を
各々使っている複数のプラグイン・モジュールに前記情報識別子に供給し、
前記モジュールから少なくとも1つの情報候補アイテムを準備し、
前記情報候補アイテムの代表を表示する、
ことを特徴とする、コンピュータシステムにおいて情報を見つける方法。

こんな感じかなあ。違ってたらなおして。
4行目は「を供給し」だった
Appleの特許は、OS組み込みだけに影響するようだ。
Windowsのメタデータ検索は開発中止。
907名無しさん@そうだ選挙にいこう:05/02/01 20:35:55
今日判決がでた一太郎に対する松下の訴訟もかなり香ばしいぞ。
908名無しさん@そうだ選挙にいこう:05/02/01 20:38:59
松下が我々の(?)ConceptBaseを狙っているな。
マイクロソフト:「Windowsへのデスクトップ検索技術搭載は急がず」
http://japan.cnet.com/news/media/story/0,2000047715,20080393,00.htm

独禁法絡みとか言ってるけど、絶対、アップルの特許のせいだよね。
Spotlight 使ってみたいなぁ。
911名無しさん@そうだ選挙にいこう:05/02/02 00:13:45
これからのビジネススキルとして求められるのが「仕事のナレッジ
ベースづくり」。2005年前半に出荷が予定されているMac OS X
TigerのSpotlightを使えば、お使いのMacが驚くほど“有能”なナレッジ
ベースに早変わりします。
たとえば「中国の自動車市場」についての情報を引き出したいなら、
Spotlightで「中国 自動車市場」と検索します。すると、関連する
Word書類やMailメッセージ、成長率を表すグラフ画像など、さまざま
なフォルダに点在しているファイルをすべて見つけ出します。
この検索結果を「スマートフォルダ」として保存すれば、後から関連
するファイルが作られた場合も、自動でフォルダに反映されるのです。
http://www.apple.com/jp/macosx/tiger/spotlight.html

OSレベルでメタデータ検索エンジンを搭載できるのは、Macだけ。
>>911
「中国の自動車市場」
   ↑
こんな文章、絶対検索しない
どうせMSに真似されて終わりだろう。
914名無しさん@そうだ選挙にいこう:05/02/02 02:16:34
WinFSは登場しないかもしれない――?
http://www.itmedia.co.jp/news/articles/0409/13/news010.html
調査会社米Gartnerのアナリストらによれば、米Microsoftは次世代
Windowsから「WinFS」を除去すると発表したが、リリースが大幅
に遅れているこのプロジェクトをリリースしないという選択肢を選ぶ
可能性もあるという。

アップルが「Spotlight」で特許を取得──申請は2000年1月
http://www.macobserver.com/article/2005/01/27.10.shtml
アップルの「Spotlight特許」の概要は次のように記されている。

「様々な場所にある情報に数々の技術を通してアクセスすることの
出来る統一されたインターフェースにより、ユーザーが入力した
様々な記述に関連する情報の細目へ簡便にアクセスすることを提供
する。ユーザーが入力した情報の記述を操作する多数の発見的アル
ゴリズムを用い、選択あるいは検索された情報の候補を表示し、
位置を示す。このように、サーチエンジンの長所を活用しつつ、
関連性のある情報の候補だけをリストアップする。」
Tigerに搭載されるSpotlight機能が5年も前から開発されていたこと
がわかる。

Mac OS X - Tigerプレビュー - Spotlight
http://www.apple.com/jp/macosx/tiger/spotlight.html
しかしまぁ、検索機能だけでMac使うやつってそうはいないと思うけどな。
ああ、サトリ使ってみたかった・・・
誰かうpってホスィ
ttp://www.katsakuri.sakura.ne.jp
917名無しさん@そうだ選挙にいこう:05/02/03 20:54:12
ジョブズ氏:複雑な技術を簡単に使えるようにすることがアップル
のコア
http://www.appleinsider.com/article.php?id=832
Apple Insiderは基調講演後に行われたCNBCのジョブズ氏へのイン
タビューの内容を伝えた。

「コンピューター界はますますメディアへと向かっていて、メディア
はデジタル音楽の出現でますますコンピューターへと向かっている。
その二つは中間で遭遇しているようなものだ。アップルのコアは、
複雑な技術を我々人間にとってどのように使いやすいものにするか
を考え出すことだと思う。」
いいこと言うなぁ(´∀`)
>>916
↓ここにあげたよ(uporg38960.zip)
http://www.uploda.org/
>>917
全文検索以上の検索も、なにもわからない素人でも使えちゃうんだろうな。
ジョブさんすごいよ。まじで。
921名無しさん@そうだ選挙にいこう:05/02/04 14:46:41
米Yahoo!、キーワード入力が不要な検索ツール「Y!Q」ベータ版を公開

CBみたいな方法だ
>>919
916です。いただきましたーアリがd
同じインデックスサービスを使っているのに、サトリだと標準の検索より
断然早い。なせ?
サトリここにきて人気だな
同じくインデックスサービス使うのではKWIC finderとどっちがいい?
とりあえずNamazu入れてみた
とりあえずTiger待ちかな。なんもしないでお気軽に使えそうだから、
Tiger出たらMac買ってみるよ。
楽天に concept searchがチラホラ出だした
送料高いな,ォィ
>>783
このスレまともに読んでいないだろ?
一ヶ月も前のレスに突っ込んでも仕方ないが
929名無しさん@そうだ選挙にいこう:05/02/06 11:42:33
ConceptSearch って3月発売だよなぁ
JoshinのJ&Pテクノランドでまた 10&引き&10%ポイント還元やってくれないかなぁ
ちょうど決算前だしちょっと期待しちゃう
>>928
なんで?
理由も書いてほしい
話題になってるからじゃないの
932名無しさん@そうだ選挙にいこう:05/02/07 22:57:37
久々にファイリングソフト使ってデータベース更新しようとしたら

"0x73d2bd9b"の命令が"0x010c01d3"のメモリを参照しました。メモリが"read"になることはできませんでした。

なんて言われてちっとも機能しなくなっちゃいました。('A`)

ソフトはやさしくファイリング6で、最新版にアップデートもしてあります。
フォルダを追加しようと「デスクトップ」をクリックすると上記エラーが出て、ソフトが強制終了です。
再インストールもしてみたけどだめ。全く同じ症状。('A`)

最近いじった所と言ったらDVDドライブ換装したのとサービスの設定を変えた事位。
ウイルスバスターがテレフォニー有効じゃないと使用できないみたいに、
何かサービス切ってたら動かないのかな?
メディアドライブのホームページで探してみたけど見当たらないし。('A`)

やさしくファイリング結構使いやすくて気に入ってたんだけど誰か知らないですか?('A`)
やさしいのは、OS組み込みのTigerのやつだと思う
Kwicいいね。独自のインデックスは時間がかかりすぎたり、途中でエラーになったりで自分的にはダメだったけど、Indexing Service と組み合わせてフォルダの絞り込みしたら速い。

>>932
以下を試してみる
1.メモリチェックする
2.スペックを上げる
3.常駐ソフトの見直し
4.OSの再インストール
デフォが明朝体ってことは中国系の人が作者?
最近、変な奴が紛れ込んでるな
そうだね
938名無しさん@そうだ選挙にいこう:05/02/08 18:08:55
Shuriken Pro4 VerUP版&ConceptSearchセット MyShop価格 8,400 円(税込)
https://www.justmyshop.com/app/servlet/item?item_code=2640372&idt_tag=512

Shuriken Pro4&ConceptSearchセット MyShop価格 9,975 円(税込)
https://www.justmyshop.com/app/servlet/item?item_code=9001845&idt_tag=512

ともに店頭販売せず

939名無しさん@そうだ選挙にいこう:05/02/08 18:14:28
>>938
添付ファイルの中身も検索できるとはすごいな。
早く発売されて人柱報告が出てくるのが待ち遠しい。。。
940932:05/02/08 20:21:15
>>934
I/Oバッファ変更したよ。そういえば。('A`)
バッファ下げてみる。

ありがとう。
>>940
それだ! m9(`・ω・´)シャキーン













( ゚Д゚)……I/Oバッファって何?
942932:05/02/09 00:05:30
原因判明しましたのでここに報告いたします。

原因はやさしくファイリングの設定でした。

「ツール」-「環境設定」-「表示」-「サムネイルの初期表示状態」で、「文書内容で分類」を選び、
その上で「デスクトップ」をクリックすると起きます。

対策は同設定画面で「分類しない」を選択し、一旦やさしくファイリングを再起動し、
「表示」-「サムネイル分類」-「文書内容」を選択して各フォルダに設定していけば良いようです。

「サムネイルの初期表示状態」で他の設定は試してみてませんがとりあえず使えるようになって良かったです。

メモリのI/Oバッファを戻してみたり、
縮小版のアイコンサイズ変更がだめだったかな〜って戻してみたり、
レジストリソフトやサービスとにらめっこしてみたり、
再インストールすること3回。
昨晩今晩のいわば自由時間(自分時間とも言う)を費やして原因がソフト自体とは...

サンプルなしで再インストール&設定ファイルが残ってたんでその設定引き継いだよ便利だねコンボを喰らいました...('A`)
標準インストールしてすぐに使い出したらあまり遭遇しないんでしょうけどね。

ごみレジストリと隠れ設定ファイルを洗いざらい探し出して
全部消した上で普段とは違うアカウントでインストールしてやっと気がつきましたよ。

って、説明書に載ってたりして。では、長文失礼。
943932:05/02/09 00:19:47
板違い&スレ違いですが('A`)
>>941
大容量メモリのパフォーマンスを最適化
でググッたら解りますよ。
944名無しさん@そうだ選挙にいこう:05/02/09 10:17:13
>>938 注文しました。
一番普及してるメーラーってやっぱOutlookExpressとOutlookだと思うんだけど、
Outlookなんて高価な市販ソフトなのに検索機能はきわめて貧弱だね。
アプリ依存の特殊なファイル形式のわりに、メールログは逐次検索……。
3年分くらいたまったら、もう全文検索なんて時間かかりすぎでやる気がなくなる。
Notesみたいに標準でインデックス型の全文検索機能が付いていても良さそうなものなのに。
>>945
日本語に完全対応ではないですがこんなのあります
むちゃくちゃ速いですよ
ttp://www.microsoft.com/downloads/details.aspx?amp;displaylang=en&familyid=09b835ee-16e5-4961-91b8-2200ba31ea37&displaylang=en
サーチクロスで特定のフォルダ以下のファイルだけが検索出来ません。
インデックスの更新&初期化をしてもダメでした。

何が原因だろ???
>>945
> Outlookなんて高価な市販ソフトなのに検索機能はきわめて貧弱だね。

同意。

> Notesみたいに標準でインデックス型の全文検索機能が付いていても良さそうなものなのに。

ジャストシステムの Shuriken は、むちゃくちゃ検索が高速ですよ。
スパム対策やウィルス対策も充実してるので、おすすめ。

  http://www.justsystem.co.jp/shuriken/product/pro4.html
>948

おれもShurikenユーザなので、メールソフトとしておすすめなのは同じだが、

> ジャストシステムの Shuriken は、むちゃくちゃ検索が高速ですよ。 

は無い。別にインデックスを作成するワケもなんでもないから。
だから、おれは仕事関係のメールを検索するためにはサーチクロスを併用
している。


950名無しさん@そうだ選挙にいこう:05/02/10 20:49:03
いま、ふと気付いたんだけど、
ConceptSearch って、インターネットブーメランのユーザに
アップグレード版ぐらい用意してくれてもよかったんじゃないのかと
小一時間・・・・。
IBは内田有紀とともに「無かったこと」になっています
gooがリニューアル 自然言語繋がりで
http://labs.nttrd.com/

>>950
IBを今でも持っている人がいなさそうだな〜
うちはUser's kitの箱ごとまだ持ってるけど。
サーチクロスを使ってますが、コンセプトサーチには期待してもいいですか?
IB持ってますが・・・。

対応ファイルが減ったのと,データベース更新時間の長さに耐えきれず,
つい最近になってサーチクロスに乗り換えました。
アップグレード版ほしい。

そういえば今度のやつはIBみたいに,英語と日本語のファイルを分けて
扱うなんて煩わしさは絶対にないものと勝手に想像。
CBって売方次第でものすごく売れると思うんだけどな〜
売り方 と書いた方がいいと思う
ごめんよ〜 うちのATOKが馬鹿で・・・
958名無しさん@そうだ選挙にいこう:05/02/11 11:47:39
まぁ、サーチクロスとかの検索ソフトけっこう使われるようになってきてるし
インターネットブーメランよりは売れるんじゃないかな
>>957
2005なら売り方になるよ
CB目当てでDocuWorks買ったんだけど、マダとどかねぇ
961名無しさん@そうだ選挙にいこう:05/02/12 18:39:26
>>949-950
そこで Shuriken VerUP 版+ConceptSearch セットの出番ですよ。
 
  https://www.justmyshop.com/app/servlet/item?item_code=2640372

2つ合わせると便利なところは、検索対象のフォルダを選べたりするところ、
かな? (よく分からないです)
>>961
でもこのセットって、
一太郎についてくる手裏剣は対象外なのよね・・・
つーかあんまりセットのうまみがないと思うのはオレだけ?
OutlookのPSTを検索対象としてほしいよ。
ConseptSearchさんよ
インターネットブーメランの問題点

情報ボックス作成の優先度が普通なので処理が重い。
情報ボックス作成中は検索ができなくなる。
メール1万通くらいが一度に作成できる限度。
ShurikenPro3形式のメールボックスが読めない。
作成中にWindowsを再起動すると、情報ボックスが壊れる。

…コンセプトサーチで直っているのかね?
966名無しさん@そうだ選挙にいこう:05/02/13 00:58:32
Shuriken Pro 3 の形式は新しくなってるから当然無理でしょ
一太郎 13 ぐらいまでは、一太郎をインストールしてれば
さりげなく検索できるようにしてくれてたけどな

今度は情報ボックスというのかどうかはしらんが、
当時に比べてCPUの速度もかなり上がってるし
マシになるんじゃねぇの
967名無しさん@そうだ選挙にいこう:05/02/13 09:52:32
>>965
それらの点が直ってるかどうか、週明けに、ジャストシステムに
メールしてみよう!
メールを送るのは別に週明けまで待たなくてもいいのではw
969名無しさん@そうだ選挙にいこう:05/02/13 11:37:00
インターネットブーメランは、一つの情報ボックスに300MBまでだったが
ConceptSearch は制限なしだからな
>969
100GBの情報ボックスとか作れるのかね。
最近のハードディスクだと、その気になれば可能だが。
これがちょっと気になった。
ttp://d.hatena.ne.jp/Genpaku/20050212/p4

972932:05/02/13 20:10:11
全てがスレ違いだったって最近気がつきました。

ここにいる全ての方達にお詫び申し上げます。 _| ̄|○


>>934
>>941
こんな馬鹿の相手してくれてありがとう。
( ゚∀゚)ノドンマイ キニシナイ
>>965
IBの問題点,俺も気になるー!

これに加えて,確か日本語と英語の文書ファイルの検索では
情報ボックスの使い分けがあって,いちいち切り替えなきゃならなかった
のが非常にウザかった。けど,さすがにこれは直ってる・・・よなぁ?
>974
一つ聞きたいが、英語の文章ファイルなんて使うのか?
どういう用途で?
ため込んでる海外の論文とかだが,なんか不思議か?

それとも,そもそも俺の使い方がなんか間違ってるとか?
ま、英語とは無縁な生活な人ってのはいるからね
そういう人にとっては英語の文章を読むなんて考えられないんでしょう
975が想像力がないだけ
ネットじゃ最新情報はほとんど英語だしな。
苦労して読まなきゃいけないときもある。
>>965
>>974
オイラもちーっとも気になったんで,代わりにジャストにきいてみたぞ。

なんでも新しいのじゃ,データベースを更新してつときにも問題なく
検索とかできるって。そもそもデータベースを作るのがもんのすごく
早くなてる。

あと英語と日本語は一緒に探せる。
だけど基本的に日本語検索ソフトなんで英語の検索は「完全一致」のみ orz
形態素解析とかっていうんだっけ?やっぱり日英両方の言葉に同じく対
応するのって,この値段じゃ難しいんかな〜。ちょっと残念っ
>980
グッドジョブ
982名無しさん@そうだ選挙にいこう:05/02/15 11:53:27
ConceptSearch では、そもそもデータベースを作るときに
日本語のデータベースか英語のデータベースかを
設定する項目がない

ConceptSearch のインストーラはあのジャストシステム独自のやつかぁ・・・
嫌やなぁ・・・。
983名無しさん@そうだ選挙にいこう:05/02/15 12:32:09
あー、そうだ

体験版が出たってこと書くの忘れてた
http://www.justsystem.co.jp/conceptsearch/try.html?

VMware で環境作ってそこに入れてみた。
ConceptBaseの威力はインターネットブーメランでわかってるから
実環境にはいれないけど。
人柱ヨロ
早速、Concept Search試用版をダウンロード。
メールフォルダ(1万件ぐらいかな?)を対象にインデックスを作成してみたが、
超遅。

まぁ、最初に新規作成するのに時間がかかる(約1時間)のは多めに見るとして
も、20件ほど新規メールを受信した直後に更新しても、10分以上やってる(途中
で止めたのでどこまでかかるか不明)。
まだよくわからずに使っているが、(俺の操作間違いじゃなくて)本当にこんなに
更新がかかるようじゃ......う〜ん。

ConceptSearchって、「関連した文章」を探すだけでなく
サーチクロスのような普通のキーワード検索もできるんですか?
>986

文章入力が基本だが、一応、単語検索もできますよ。
ただし、いわゆるキーワード検索とは違って、指定した単語それぞれの「重み」を
指定して、その重み付けを評価した検索結果となります……AND検索のつもりで
使うと裏切られます(笑)。


■デスクトップ検索製品について
・ConceptBase
・インターネットブーメラン
・Google Desktop Search
・MSN Toolbar Suite
・サーチクロス

体験版のアンケート。かなりサーチXを意識してるんだな。
CBの検索の仕組みを理解しない人には値段の差がかなりネックになりそう。
>>988
どこから「かなりサーチXを意識」って読み取れるんだ?
>>987
ありがとうございます。
いわゆる一般的な全文検索は満足に出来ないんですね。なら見送りかな。
「関連した文章」が出てくるのも便利そうではあるんだけど…残念。
>>990
試用版を使ってみて判断したほうが良いと思うが
コンセプトサーチを使った感想

更新は相変わらず長いが、更新時の優先度が下げられるので軽い。
ソースファイルが300MBを超えたとかいうメッセージがログに残っているが、元のファイルは6MBくらいしかなかったりする。

ホイールが使用できるようになったので操作性が向上した。
フォントサイズの変更が不可。文字が小さくてとにかく見づらくなった。
画面の配置の変更が不可。
インターネットブーメランの時は3回目のパッチあたりで実用レベルになったから(毎月のようにパッチが出てたような気が)、今回もじっくり見守ります。

あの時期に出ていたジャスト製品は一太郎もATOKも品質的にちと問題があった記憶が。最近は大丈夫なのかね。
あとブックマーク画面もホイールは使用不可
ConceptSearchは次スレを立ててからじっくり話しましょうよ。
というわけで、スレ立てお願いします。
996次スレ:05/02/16 20:20:04
全文検索ユーティリティ統一スレッド part2
http://pc5.2ch.net/test/read.cgi/bsoft/1108552631/

漏れ、間違い修正よろしくお願いします。
乙津
うめ」
ウメさん〜!!
1000名無しさん@そうだ選挙にいこう:05/02/16 23:38:56
1000!
10011001
このスレッドは1000を超えました。
もう書けないので、新しいスレッドを立ててくださいです。。。