全文検索ユーティリティ統一スレッド

このエントリーをはてなブックマークに追加
330名無しさん@そうだ選挙にいこう
XPのインデックスサービスで、PDFのIFilter5.0が使えている人いますか?
SP1、NTFS、IIS5.1、Admin権限で使用しています。

いろいろ試しても一向に改善されず、インデックスサービスを無効にしたら
エクスプローラの検索で引っかかるようになったものの、grep検索になって
しまいます。で、有効にしたら今度はかすりもせず…

Acrobat5.0のCD-ROMに入っているクセロPDFサーチLiteも使ってみましたが、
これもgrep検索で、かなり時間がかかります。
(検索結果から該当箇所にジャンプできるのは大変便利なんですが)
インデックスサービスでPDF検索使いたいYO〜!!
331330:03/01/15 18:27
書き漏らしました…

>SP1、NTFS、IIS5.1、Admin権限で使用しています。
が、インデックスサービスでPDFが検索できません。
Win2000では使えているのですが。
332fhew ◆inDExNNjx. :03/01/19 00:07
>>330
Windows NT 4.0/2000は動作するが、Xp Home/Proはダメみたいです。
おそらく、Windows Xp日本語版だけの問題でしょう。
Windows Server 2003のリリースも近づいてきたので修正して欲しいですね。
333330:03/01/19 20:40
>>332
コメントありがとうございます。
そうですか…非常に歯がゆいです。

Adobeはまだこの問題を認識していないんでしょうね。
動作確認していれば、動作環境にXPを含めて掲示したりしないはずだし。
Adobeのサポートは電話のみでしかも有料だし…
334さっちんX:03/01/19 21:53
サーチクロスいいね。
買った甲斐が合ったよ。
株やってるもんで、メーリングリスト過去5年分やメールマガジンの過去4年分、その他2chログ
あわせて2ギガのファイル検索が1秒とは速過ぎ!!
しかもEdMAXに対応しているし、IEのキャッシュフォルダも検索対象にすれば過去のページも検索できるし
いうこと無しだね。

でもときどきF3押すとエラーで落ちるのがちと不満。
お試し版を入れていい感じだった>サーチクロス。
ただ、EXCELにマクロがあるとインデックス作成時に
マクロを実行しちゃうとゆー部分がどうにもダメで断念した。
>>335
私も同じです。Officeでマクロ、差込印刷とかあるとインデックス作成に問題あり。
OLEを使ったインデックス作成の仕様はだめでしょ。

インデックス作成の設定は柔軟じゃないし。
>>335-336
ちょっと煩雑でしょうけど、マクロのあるOfficeファイルは
見に行かないように除外指定するのではダメですか?
OUTLOOKのデータ覗きに行って、毎回OUTLOOKに叱られるのも、
何とかならんもんかのう。
339名無しさん@そうだ選挙にいこう:03/01/21 09:09
>>337
除外したら検索できなくなるからNG
それに、ファイルが大量にあるので、マクロファイルを
一つ一つ登録するのは大変だよ。

マクロがあるとインデックス作成は止まるし、サーチクロスが
エラーになったりすることがあるので、使うのはあきらめた。
使用期限も切れたし

インデックスサービス等、他のツールでは問題が無いので
サーチクロスのインデックス作成が糞なだけ。
対応するファイル形式、メールソフトを増やすより、こっちを直せよ
サーチクロス、インデックス作成時にエラーが出ていて、あきらめていたが
いつのまにかV1.07が・・・。改善したようなのでレジストしますた。
2chのログ検索だったからメモリ消費おおきかったのだろうか?
341さっちんX:03/01/21 11:11
>340

おれは2chのログおよそ600Mあるけどインデックス作成でエラーでたことないけど・・・・

>339

マクロあるとだめなのか。
しらなんだ。まあ、Office使わないからいいけど。
>>341
それが、うちでもWindows98では発生しなかったんだけど、2000だとでてた。
ログはもっとあるかもしれない・・・。ただ、98で試したのログは少ないから
あてにはならないんだけど。とりあえず、今は落ち着いているのでOK。
必ず出るというわけでもなくて、80%くらいの確率だったかな。
定期的に更新するとダイアログが出てうっとうしかった。
343337:03/01/21 20:12
>>339
サーチクロス公式の掲示板あるんで、そっちに
クレームつけたら、もしかしたら修正されるかも。
344339:03/01/23 17:46
KWIC Finderを使用してみた。

良い点
・必要な機能は揃っている(サーチクロスと同等)
・インデックスサービスまたはNamazuを使っているので安定している。
・サーチクロスより安い

悪い点
・検索フォルダにショートカットファイルがあるとウザイ
・デザインがダサい。
345339:03/01/23 17:55
まだ、あった。

良い点
・検索ノイズが少ない。

悪い点
・メールの検索方法はイマイチ、結果も見づらい。

メールを重視するならサーチクロス、
ファイル検索を重視するならKWIC Finderが良いかな。
346名無しさん@そうだ選挙にいこう:03/01/23 19:31
347名無しさん@そうだ選挙にいこう:03/01/25 02:01
あの〜、インデックスサービスのインデックスが待てど暮らせど
出来ないのですが、原因が何か考えられますか?
最初はカリカリしてる音がユーザーがアクティブって訳でもないのに止まります。
でそのままカリカリ音がしないままというか。
348名無しさん@そうだ選挙にいこう:03/01/25 23:29
>>347
もしかして標準のカタログを削除して
自分でカタログを作成した?
ディレクトリを指定し忘れていないかな
349名無しさん@そうだ選挙にいこう:03/01/26 17:47
>>348
いえ、ドライブごと指定してるのですが、これってまずいのですかね。
バックアップ用のドライブだけは外しました。
みなさん詳細にディレクトリ指定されてるのですかね?
ともあれお返事ありがとうございます。
350名無しさん@そうだ選挙にいこう:03/01/26 21:45
>>349
カタログの追加では名前とディレクトリを指定するが、
これは、カタログの保存先を指定するのです。
実際に検索したいディレクトリの指定は、
作成したカタログを開いてディレクトリの指定をします。
ここで注意するのはインデックスに含めるが「はい」に
なっているか。または、「いいえ」の設定と被ってないかを
確認してください。
351 :03/01/26 21:53
台湾のエロ画像掲示板が今一番ホットと言えませんかね?

http://wossal.k-server.org/tw/

352名無しさん@そうだ選挙にいこう:03/01/27 23:06
>>350
お返事ありがとうございます。
「はい」にはなっていますし、再開するとしばらくはカリカリ言ってるのですが、
どうも途中で止まってしまいます。
サーチクロスがあるので不便はしてないのですが、サーチクロス非対応の
ものを探すときとかあった方が便利なのですよね。
353名無しさん@そうだ選挙にいこう:03/01/31 23:03
下がりすぎage
354名無しさん@そうだ選挙にいこう:03/02/04 09:18
一般ユーザには関係ないが
「Microsoft SharePoint Portal Server Service Pack 2 リリースに関するお知らせ」
http://support.microsoft.com/default.aspx?scid=kb;ja;813881
355名無しさん@そうだ選挙にいこう:03/02/06 17:28
サーチクロス、本日、ライセンスをVector経由で購入しました。
記念あげ
KWIC Finder は 落ちて使い物にならない。
windows xp は未対応か?
何かひとつは全文検索をもっていたい。
quick finder とか ブーメランとかいろいろ使って見たがノイズが多かった。
サーチクロスはKWICよりは少なかったが落ちた。
修正されたのだろうか?
期限越えると、消してインストールしなおしても
使わせてくれないんだよねえ(^_^;
357名無しさん@そうだ選挙にいこう:03/02/07 11:03
>>356
何をしたら落ちたのかな

XpでKWIC Finder問題なく動作してるよ
サーチクロスはインデックス作成で落ちた。

Windows Xpを使っているならインデックスサービスを使ったら?
そういや サーチクロスはインデックス作成で落ちたんだった(^_^;
インデックスサービスってなんですか
>358
 Microsoft Index Service のことだと思われるが……違うのか?
 そもそもKWIC FinderはMicrosoft Index ServiceもしくはNamazu
を併用しないと全文検索にはならない。(単体で使うとGrep)
358です
レスありがとう
みな50歩100歩ですね
361名無しさん@そうだ選挙にいこう:03/02/12 12:46
>>330です。
その後いろいろ調べてみたら、こんなのがありました。
ttp://pc21.nikkeibp.co.jp/pc21/pc_02/021128.htm

しかしこのレジストリを適用してインデックス作成を始めたところ、
インデックスサイズが元ファイルの2倍以上に膨れあがり、なかなか終了せず、
しかも検索結果が引っかからないという、激しくトホホな結果に終わりました。
マジでWin2000に戻そうか悩み中。
362名無しさん@そうだ選挙にいこう:03/02/12 16:42
>>361
私も試してみましたがダメですね。
ファイル名以外はインデックスされていません。

日経PC21に問い合わせてみたら回答あるかな?
363名無しさん@そうだ選挙にいこう:03/02/17 09:35
>>354の続報
「SharePoint Portal Server 2001 の最新の Service Pack を入手する方法」
http://support.microsoft.com/default.aspx?scid=kb;ja;312963
364.:03/02/24 19:04
2chのdatログをサーチクロスで検索したいんだがいい方法はないものでしょうか?
いまはDAT to HTMLでHTMLに変換してるんですけど、変換するのがめんどくさい。
なんかいい方法はないものやら
365名無しさん@そうだ選挙にいこう:03/02/24 19:29
366名無しさん@そうだ選挙にいこう:03/03/06 02:19
>>364
公式で対応の望みが出てきてるな
対応が早いのは好感が持てる
367名無しさん@そうだ選挙にいこう:03/03/06 10:28
>366

あそこ公式の対応いいよね。
要望出したらすぐにメールがきてdatファイルおくったんです。
そしたら次期バージョンで対応予定ってメールがきました。
368名無しさん@そうだ選挙にいこう:03/03/08 03:05
LZHやZIPやtar.gzの中身をインデックスできるインデックスソフトってありますか?
369名無しさん@そうだ選挙にいこう:03/03/08 20:59
サーチクロス
2003/3/7 Ver.1.08
一太郎13対応
プライベートパスワードが設定されている場合、Word,Excelが失敗する不具合
XREFがないPDF対応(キャノンのCanoScan等)
Outlookの外部pstファイルがデフォルトで開かれていない場合の不具合
アイドル時自動更新がマウスしかみていない
grep検索でのパス長を大きく
grepでの「キーワードを含まない」
インデックス対象外にフォルダ指定
「ファイルは削除されています。更新しますか?」にNO後、リンク切れクリックしたとき不具合
壊れたPDFファイルのインデックス化で処理が終わらなくなる不具合修正
370名無しさん@そうだ選挙にいこう:03/03/08 21:55
いい!
http://hkwr.com/
371山崎渉:03/03/13 16:36
(^^)
372名無しさん@そうだ選挙にいこう:03/03/15 10:05
アップデート情報
□「サトリ」v1.02(03/03/07)
- Office文書などを高速に検索できる“インデックス サービス”用フロントエンド
http://fhewfhew.hp.infoseek.co.jp/
1.文書内の検索キーワードの強調表示方法を変更
2.不具合修正
373名無しさん@そうだ選挙にいこう:03/03/15 23:35

  ☆^〜^★【新着情報追加】毎日随時更新
   http://sagatoku.fc2web.com/
  あなたの探し物こちらで見つかります

374名無しさん@そうだ選挙にいこう:03/04/02 23:14
ネタ切れ?
375名無しさん@そうだ選挙にいこう:03/04/03 21:35
サトリ version 2.00 beta2
2003/4/3
・Visual Basic.NETでプログラムを書き直しました。
・検索速度を向上しました。
・検索の条件指定を変更しました。
・イントラネット(IIS+Indexing Service)のWebを検索可能にしました。
.net…
入れたくない(´・ω・`)
377名無しさん@そうだ選挙にいこう:03/04/04 09:23
>>376
何で?
ウチではサトリ2.00β問題無いよ
378bloom:03/04/04 09:46
379fhew ◆NKR2cRlGXU :03/04/13 21:16
>>376
そうですか
大多数の意見なのかなぁ
.NET Frameworkをインストールしている人って少ないし

ところで、サトリ ver.2.00 正式版をリリースをしました。
>>379
新しいからねぇ>.NET Framework
メリット感じないと、調べないで怖がる人がいるのは仕方ないっす。
漏れ的には一押し。旧型アプリとの衝突がいやなので専用 XP 組んでるけど(w
プリインストのクライアントは来年より後っすかね。
381名無しさん@そうだ選挙にいこう:03/04/14 19:14
>>380
DLL HELL(旧型アプリとの衝突)が無いのが
.NET Frameworkのメリットなんだけどね
382380:03/04/14 23:23
>>381
そうじゃなくて、行儀が悪かったり下手糞な作りの旧型アプリをうっかり入れて
.NET アプリまで壊されるようなことになりたくないんですよ。
旧型アプリがのさばっている今は、はっきり環境を分けないと、どうしたって
混入する可能性があると思うから。
早く .NET に置き換わらんかな。プログラミングのしやすさは最高。
>>381
DLL HELLがないとはどういう仕様で?
384名無しさん@そうだ選挙にいこう:03/04/15 22:37
>>384
読んだけどわけわからん

@IT:基礎解説 初めてのMicrosoft .NET ―.NET初心者のためのMicrosoft .NET入門―
http://www.atmarkit.co.jp/fdotnet/basics/msdotnet/msdotnet_01.html

↑ こっちの方が分かりやすかった

ようするに
●.NETとはJAVA全盛に対抗してMSがつくった新たな金儲けの手段
●Webアプリケーションへの移行によって課金の強化を目指す
●.NET FrameworkとはJava VMみたいなものだが色んな言語系に対応する
●.NET Frameworkは実行プログラムコンパイル時に強力なセキュリティチェックや
 バージョンチェックを行いプログラムの安定性が増す(DLL HELLの撲滅)
●.NET Frameworkはプログラム導入以前にランタイムとして導入しておく必要がある

というところか?確かに余り導入したくないな‥‥
VB6までならXpで(ランタイム無しで)動くんだしこっちの方が良かったのでは?
386名無しさん@そうだ選挙にいこう:03/04/17 02:48
>>385
WindowsUpdateでみたときには、ハァ?だったが、
さとりを導入するときに有難みがわかったよ。

> ●.NETとはJAVA全盛に対抗してMSがつくった新たな金儲けの手段
> ●Webアプリケーションへの移行によって課金の強化を目指す

ここまでは、やっぱりMS、だし、

> ●.NET FrameworkとはJava VMみたいなものだが色んな言語系に対応する

> ●.NET Frameworkは実行プログラムコンパイル時に強力なセキュリティチェックや
>  バージョンチェックを行いプログラムの安定性が増す(DLL HELLの撲滅)

ここも、ホントならすごいな、程度なんだけど、

> ●.NET Frameworkはプログラム導入以前にランタイムとして導入しておく必要がある


ここで、WindowsUpdateで導入、更新ができるのはありがたい。

VBランタイムは4,5,6とバージョンが散乱している上に、
探して落とすのが手間。fhewさんのページ見ても混乱した。
旧バージョンで手間取ってるうちに、V2.00が出たので
入れなおしたら一発。ユーザーサイドにも十分メリットあるよ。
387山崎渉:03/04/17 11:30
(^^)
388名無しさん@そうだ選挙にいこう:03/04/17 16:36
>>385
何故導入したくないのかわからない。
導入して困ることはないのでは?

私は、DLL HELLが無いのなら安心して使えるアプリが増えるので歓迎したいよ。

サーバーはJAVAでも.NETでも使う人には関係ないしね。
389名無しさん@そうだ選挙にいこう:03/04/17 17:26
現在、個人で使えるインデックス構築タイプの全文検索は以下のソフトですか?

フリーウェア
・Namazu + Search-S
・インデックスサービス + サトリ

市販パッケージ or シェアウェア
・DiskX Search
・サーチクロス
・速捜X
・Namazu + KWIC Finder
・インデックスサービス + KWIC Finder
390山崎渉:03/04/20 05:49
   ∧_∧
  (  ^^ )< ぬるぽ(^^)
391名無しさん@そうだ選挙にいこう:03/04/20 13:00
MS、新種の検索ツール開発中
http://headlines.yahoo.co.jp/hl?a=20030419-00000014-zdn-sci
392あぼーん:03/04/20 14:02
MSが研究を進める検索/スパム対策/インタフェース技術
http://www.zdnet.co.jp/news/0304/21/ne00_msresearch.html

JustsystemのConceptBaseみたいなのを目指しているのか?
よくわからんぞ
394名無しさん@そうだ選挙にいこう:03/04/27 13:41
Satori ver.2.01 リリース歓迎age
http://fhewfhew.hp.infoseek.co.jp/
395名無しさん@そうだ選挙にいこう:03/04/27 13:49
キミとは関係ないよ,ぼくちゃん
坊ややプログラマか電話工事屋で終わりだ
ぼうや,オナニでもしてママにこづかいでももらってさっさと寝な
おまえの彼女は昨日の夜,他の男のちんぽくわえて,ふとももをザーメンがつたっていたぜ
おまえなんか,ペットぐらいにしか考えてないんだよ
ま,ブスだから結局おまえの嫁さんになるけどな
子供ができたらDNA検査しないとな ぷぷぷ
396動画直リン:03/04/27 14:25
397名無しさん@そうだ選挙にいこう:03/04/27 14:43
>>389
遅レスすまそ。

ほぼ、リストどおりだが、

KWIC Finder は独自エンジン"KWIC Search Engine"を装備したぞ。

以下はヘルプより、
1.N-gram方式 を採用しています。辞書のメンテナンスが必要なく、
 検索漏れの少ない全文検索が可能です。
2.GUIの他にコマンドライン版を提供します。他のアプリケーションから起動したり、
 タスクスケジューラに登録することができます。
3.差分更新を行うため、一度インデックスを作成した後は、タイムスタンプの変更された
 ファイルのみが更新対象になります。

N-gram方式とは分かち書きを行わず、文書中の全ての文字位置からN字毎に切り出した文字列から
インデックスを作成する方式だそうだ。

ヘルプに曰く、
「N-gram方式は原理的には検索漏れのない全文検索が可能です。」とのこと。

漏れが使用したところでは、ひらがなや、ごく一般的な単語のみのフレーズでも正確にヒットした。

弱いところは
1. インデックス作成・更新時に時間がかかる(他のエンジンと比較して)
2. 標準ではインデックス自動更新がセットされない
 (自分でタスクスケジューラに登録すればよい。ヘルプに方法が記載されている。)

ほかのエンジンとは方式が異なっているので、併用すると効果が期待できそうだ。
KWIC Finder、ずいぶん進化したんだね。また使ってみようかな。
399名無しさん@そうだ選挙にいこう:03/04/30 20:31
KWIC Finder のあたらしい全文検索機能が面白そうだから、
ためしに入れてみたけど、以前インストールした情報を覚え
ているようで使用できなかった。残念。
>>399
たしか、独自エンジンはレジストしないと利用できなかったと記憶している。
1000円の価値は十分にある、と私は思う。
サーチクロスのインデックス化についてなんですが、

登録しているディレクトリで全然更新してないディレクトリ
まで一から読み込むようなのですが仕様ですか?
402名無しさん@そうだ選挙にいこう:03/05/02 16:48
サーチクロスのインデックス作成機能は糞だ!
403動画直リン:03/05/02 17:14
404名無しさん@そうだ選挙にいこう:03/05/03 00:21
サーチクロス
たくさんの種類のファイルに対応してるのはありがたいが
インデックスの作成なんとかならんかね?

Windowsのインデックスサービスみたいに
バックグラウンドでいつのまにか作成して欲しいんだが。
>>404
自動でされるだろ?
406名無しさん@そうだ選挙にいこう:03/05/03 01:04
インデックスサービスみたいにCPU負荷の少ないときに自動で実行できるの?
何か作業しているときに実行されると激しく邪魔だが

それに、Officeや一太郎のインデックスにOLEを使っているのがダメ、不安定極まりない。
407動画直リン:03/05/03 01:14
408名無しさん@そうだ選挙にいこう:03/05/03 02:24
ナマズで、LAN上の他のマシンのディスクの中まで探ってインデキシングさせる方法はないですか? もちろん、共有フォルダなんですけど。
409名無しさん@そうだ選挙にいこう:03/05/03 06:52
410名無しさん@そうだ選挙にいこう:03/05/03 21:38
サーチクロスはアプリケーションとして動作する以上は
インデックスサービスみたいに「いつのまにかインデクスができてる」
というわけにはいかない。

サーチクロスもサービスでインデックス作成するようにしてもらいたいもんだ。

対応してるファイルの種類が多いことが唯一の利点だから
インデックスサービス用のIFilterがたくさんあれば
サーチクロスは用済みになると思われ。

どっちにしろWinFSのLonghornが出るまでの命だろうけど。
とはいえ、メール検索ではインデックスサービスはサーチクロスにとてもかなわない。
412名無しさん@そうだ選挙にいこう:03/05/04 03:04
前から疑問だったけど、サーチクロスなどで実装されているメールの全文検索って必要?
俺はメーラーを起動して検索しても苦じゃないんだけど

これなら欲しいけど
http://www.zdnet.co.jp/news/0211/29/nj00_sixdegrees.html
413bloom:03/05/04 03:14
>>411
だから各種メーラー用のIFilterをMSが用意すればサーチクロスいらなくなるんだよ。

ついでにJaneやかちゅ〜しゃのLOG用IFilterも用意すれば万全。
>>412
Outlookからの例になっているがOutlookってスレッド対応していたっけ?
416名無しさん@そうだ選挙にいこう:03/05/04 21:37
>>415
Outlookがスレッド表示できなくても、
Six Degreesが凝ったスレッド表示できるから問題無いぞ。
>>414
IFilterはファイルの内容たるテキスト情報を抽出する機能しかもっていないし、
MSインデックスサービス自体はファイルの存在場所を示すことしか出来ない。
個々のメールを分類する機能が無いと、メール検索としては役に立たないわけだが、
1つのファイル上に複数のメールを保存するタイプのメーラーには現時点では対応できんし
1通1通個別ファイルに保存するメーラーは少ない(電信八号くらいか?)。

IFilterよりはインデックスサービス自体を改造しなければならないのではないかと。
しかしMSが自社製品以外のしかもローカルなメーラーに個別対応するとは思えんのだが・・・
へー、現時点でも技術的には出来るんだねぇ。
420名無しさん@そうだ選挙にいこう:03/05/07 17:46
KWIC Finderの全文検索エンジン搭載版かなり良いですね。
検索精度が高く、インデックス作成が安定している。
KWIC Finderの全文検索エンジンがメール検索に対応したらサーチクロスはいらないね。
保守
422名無しさん@そうだ選挙にいこう:03/05/17 17:15
Ninomiyaにいったら
ジャストシステムのインターネットブーメランが
まだおいてあった・・・・
423名無しさん@そうだ選挙にいこう:03/05/17 17:17
KWIC Finderの試用期限が迫っているが、買おうかやめようか・・・。
>>424
買っちゃえば?
千円だし,作者もこまめにバージョンアップしているから損ではないと思うよ。
PDFファイル用IFilterの日本語WinXPで使えない問題、解決されそうな動きはないのだろうか・・・。
KWIC Finderって多機能そうだが、インデックス化の処理は遅いね。
>>427
サーチクロスの糞インデックス処理よりまし
429428:03/05/19 19:15
サーチクロスより速いって意味じゃないよ
安定しているって事
KWIC Finderは検索精度が高いのがウリでしょ

でも、インデックス作成はインデックスサービスが一番ですね。
PCに負荷をかけず、いつのまにかできるているし、こけない。
まあそこがOS標準のサービスならではの強みでしょうな。

これでサーチクロス並みに
多くのファイルフォーマットに対応してくれれば
最強なんだが。

IFilterイパーイきぼんぬ
431山崎渉:03/05/22 01:51
━―━―━―━―━―━―━―━―━[JR山崎駅(^^)]━―━―━―━―━―━―━―━―━―
432名無しさん@そうだ選挙にいこう:03/05/22 23:29
サトリ2.02が出てます…って1週間経ってるけど
433::03/05/24 14:15

探し物はこちら
http://sagatoku.fc2web.com/
新商品・安売・キャンペーン・流行商品・ネット商品等10万点以上
ジャンル別・50音別で楽々探し物


434名無しさん@そうだ選挙にいこう:03/05/24 23:37
win2000のインデックスサービスを動かすと

メモリリークしてんのか2時間くらいでめもり使用量700MBとかになって
あぼーんしちゃうんですがどうなってるのかなあ。

ま、おれはサーチクロスがあればインデックスサービスなんかいらないんだが。
435名無しさん@そうだ選挙にいこう:03/05/25 00:51
サーチクロスってインデックスサービス使ってるんではなかったのか。
マジで知らんかった。
買ってこようかな。
>>435
独自のインデックスを作成しているが
437435:03/05/25 01:46
なるほど
レスありがとうございます。
438あぼーん:あぼーん
あぼーん
439名無しさん@そうだ選挙にいこう:03/05/27 16:26
サーチクロスの掲示板で「ファイルサーバーを検索できないか?」ってのがよくあがってくるなぁ。
サーバーがWindowsならインデックスサービス、LinuxならNamazuを使えよ!

サーチクロスを使ったらネットワークトラフィックがひどいことになるぞ。
サポートもいいかげんな回答するなよ。
440_:03/05/27 16:29
441あぼーん:あぼーん
あぼーん
442名無しさん@そうだ選挙にいこう:03/05/27 16:39
サーチクロスはGB単位の大量のデータを検索するには全く向いてないからな
443名無しさん@そうだ選挙にいこう:03/05/27 16:43
サーチクロスのインデックス作成は重いので
サーバーで実行されたらいやだなぁ
444山崎渉:03/05/28 16:34
     ∧_∧
ピュ.ー (  ^^ ) <これからも僕を応援して下さいね(^^)。
  =〔~∪ ̄ ̄〕
  = ◎――◎                      山崎渉
age
446名無しさん@そうだ選挙にいこう:03/05/29 09:05
アンドール,CADデータ内のテキストを全文検索できるツールを発売
 アンドール(本社神戸市)はイントラネット向けの全文検索ツール「かんたんサー
チ」を2003年6月から発売する。Microsoft Word,同Excel,同Powerpoint,PDF,一
太郎,OASYS,LotusWord,テキストファイルに加えてDXF,AutoCAD(DWG),CADSUPE
Rの各CADデータも検索対象にした。また,画像データ(Windowsのbmp,TIFF,JPEG,
PNG)から実質的にOCR(光学的文字認識)と同様の処理で文字情報を抽出し,これも
全文検索の対象とする。データ変換研究所(本社京都市)のシステムにCADデータの
検索機能を加えて製品化した。価格は40万円から(20ユーザーライセンス)。
http://www.andor.co.jp/
447名無しさん@そうだ選挙にいこう:03/06/24 18:31
448名無しさん@そうだ選挙にいこう:03/06/29 02:50
MitakeSearchってどうよ?
449fhew ◆NKR2cRlGXU :03/07/04 01:00
>>447
直しました。
450山崎 渉:03/07/15 11:21

 __∧_∧_
 |(  ^^ )| <寝るぽ(^^)
 |\⌒⌒⌒\
 \ |⌒⌒⌒~|         山崎渉
   ~ ̄ ̄ ̄ ̄
451名無しさん@そうだ選挙にいこう:03/07/16 08:50
452名無しさん@そうだ選挙にいこう:03/07/29 09:45
↑はサトリ。

KWIC Finderも紹介された。
http://www.forest.impress.co.jp/article/2003/07/28/kwicfinder.html
453???:03/07/29 10:01
     ∧_∧  ∧_∧
ピュ.ー (  ・3・) (  ^^ ) <これからも僕たちを応援して下さいね(^^)。
  =〔~∪ ̄ ̄ ̄∪ ̄ ̄〕
  = ◎――――――◎                      山崎渉&ぼるじょあ
     ∧_∧  ∧_∧
ピュ.ー (  ・3・) (  ^^ ) <これからも僕たちを応援して下さいね(^^)。
  =〔~∪ ̄ ̄ ̄∪ ̄ ̄〕
  = ◎――――――◎                      山崎渉&ぼるじょあ
456名無しさん@そうだ選挙にいこう:03/08/04 22:02
雑誌の縮刷版PDFって制限がかかっていてほかのソフトから検索できない。
それでもコピー・ペースト許可にして保存しなおせばできるようになるものもあるが
日経の縮刷版ってパスワードかかっていてこれもできねぇ
使いにくいぞ。。。
457_:03/08/04 22:10
458_:03/08/04 22:15
459名無しさん@そうだ選挙にいこう:03/08/07 09:44
460山崎 渉:03/08/15 22:10
    (⌒V⌒)
   │ ^ ^ │<これからも僕を応援して下さいね(^^)。
  ⊂|    |つ
   (_)(_)                      山崎パン
461山崎 渉:03/08/15 22:37
    (⌒V⌒)
   │ ^ ^ │<これからも僕を応援して下さいね(^^)。
  ⊂|    |つ
   (_)(_)                      山崎パン
462名無しさん@そうだ選挙にいこう:03/08/24 01:16
あげ
463名無しさん@そうだ選挙にいこう:03/08/24 10:24
linux+sambaでwindowsのファイルサーバを構築して、中身をnamazuで検索するシステムを本を見ながら作ったんですが、cgiで検索結果が表示されるところまではできました。

でも、検索結果をクリックしてもその文書が開きません。というか、ファイルのリンク先が

/hostname/directoryname/%k%3%%\.doc

みたいな感じになってしまいます。
mknmzで-Uオプションでエンコードを無効にしてみたりしましたが同じです。

何が悪いんでしょうか。
464名無しさん@そうだ選挙にいこう:03/08/24 10:32
>>463
/hostname/directoryname/%→http://
に書き換えてくれるんだが、その設定しましたか?

namazuサイトに記載されているはず。
465名無しさん@そうだ選挙にいこう:03/08/24 19:22
>464 さっそくさんくす

あ、そこじゃなくて、ファイル名の部分が文字化けっぽくなる、ってことなんだ

口べたでスマソ
466名無しさん@そうだ選挙にいこう:03/08/29 09:35
インデックスサービスでmhtファイルを検索できるみたいです。
サトリを公開しているfhewさんのWebサイトに方法が載ってました。
467名無しさん@そうだ選挙にいこう:03/09/01 14:07
HPのMitakeSearch V4.0試した人いますか?
いませんか?
468fhew ◆NKR2cRlGXU :03/09/09 22:57
>>467
ターゲットがよくわからない製品ですよね。
試そうとも思いませんでした。

値段が高い商品を購入するなら、ConceptBaseが欲しい。
保守です。
Namazu/Apache を Windows XP のPCにいれる方法:  http://www.fkimura.com/namazu-win32-1.html
PDFのIFilterがXPで使えない場合の修正方法。
たぶんこれで大丈夫なはず。
http://pc2.2ch.net/test/read.cgi/win/1035387243/132-133
471名無しさん@そうだ選挙にいこう:03/11/30 11:49
この関連文書検索機能ほすぃ。
http://qdbm.sourceforge.net/cgi-bin/qfts.cgi
472名無しさん@そうだ選挙にいこう:03/12/06 14:04
>>466
おお、ありがとうございます。
mhtで保存してるので凄く助かります。
473名無しさん@そうだ選挙にいこう:03/12/21 05:19
【NHKスペシャルアンコール】
【映像の世紀】
1995年3月から1996年2月にかけて放映された大型シリーズを、11夜連続でアンコール放映する。
世界各地に保存されている貴重映像を発掘、収集して時代順に構成し、
有名・無名の人物が書き残した回想録、日記、手帳、演説などを紹介しながら、
激動の20世紀を映像で追体験する。

12/22(月) 23:00〜24:15 @20世紀の幕開け           Gコード9411551
12/23(火) 23:00〜24:15 A大量殺戮の完成           Gコード9315323
12/24(水) 23:00〜24:15 Bそれはマンハッタンから始まった  Gコード9382095
12/25(木) 23:00〜24:15 Cヒトラーの野望            Gコード9359767
12/26(金) 23:00〜24:15 D世界は地獄を見た          Gコード9253539
12/27(土) 21:55〜23:10 E独立の旗の下に           Gコード5588008
12/27(土) 23:20〜24:35 F勝者の世界分割           Gコード5956089
12/28(日) 22:40〜23:55 G恐怖の中の平和           Gコード2604139
12/29(月) 22:40〜23:55 Hベトナムの衝撃            Gコード5458851
12/30(火) 22:40〜23:55 I民族の悲劇 果てしなく       Gコード9753063
12/30(火) 24:00〜25:15 JJAPAN                Gコード4558031

いまなおNHKスペシャル最高傑作の名が高い作品。未見の人は是非一見をお奨めする。
ちなみに発売中のDVD-BOXは\74,800もします。

ttp://www.nhk.or.jp/winter/gtv/gtv016.html
ttp://www.nhk.or.jp/special/rerun.html
サーチクロスは開発およびサポート停止状態なのでやめとけ
http://pc2.2ch.net/test/read.cgi/software/1070739655/
475名無しさん@そうだ選挙にいこう:03/12/26 23:22
Estraier使ってる人いる?
http://estraier.sourceforge.net/spex-ja.html
導入が簡単でないと使う気がしない
Win版は簡単だったぞ
CGIなんてわかんね
>>475
これWin版のバイナリではPDFのインデックス作成は無理なんですかね?
pdftotextを起動させるバッチファイルを書いて渡してみたけど
実行されて無いようです。
Win版で作成できてる人いますでしょうか?
>>479
Cygwin上だとマニュアルに書いてあるPDFフィルタでできたよ。でもDOSプロンプトで実行するとダメ。
あと、日本語が化けるんだけど、多分、xpdfに日本語化パッチをあてないといけないのかな。
>>480
レス遅れてすみません。
その後調べたらCygwin環境無しでも変換できる方法が見つかりました。
CygwinのDLLを使っている場合はsystem()を正しく実行させるためにsh.exeが必須のようです。
Cygwinを配布しているサイトからこれだけダウンロードしてきて再度実行してみたら
うまくフィルタプログラムが呼び出されるようになりました。

>日本語が化ける
日本語用のlanguage packageが入ってないか、
xpdfrcの設定が間違っているのではないでしょうか?
自分はWin版のpdftotextを使ってますが文字化けはしてないです。
482480:04/01/09 22:11
Thanks. language package入れてみます。 >> 481
ところでWordのファイルを登録する方法はあるんでしょうか。
それできるとかなーりイイ感じなんですけど。
483名無しさん@そうだ選挙にいこう:04/01/14 09:56
で、EstraierはNamazuやインデックスサービスから乗り換える価値あるの?
484名無しさん@そうだ選挙にいこう:04/01/14 13:46
用途によるんじゃない?
検索速度とか対象文書の規模とかは、ベンチマークテストしないとわからないけど、
要約がわかりやすいのがいい感じだな。
対象フォーマットを増やしてほしいところだけど。
485名無しさん@そうだ選挙にいこう:04/01/17 00:54
私は、ローカルでは最近でたG-Search (Personal) を使ってます。
機能は少ないけど、基本的な部分は押さえてるし
何よりも高速なので満足してます。
Professional版では、LAN内の他のPC上のファイルも検索できるらしい。
お奨めです。
http://www.vector.co.jp/soft/win95/util/se295328.html
>>480
WordとExcelとPowerPointに対応したみたいだよ。
487名無しさん@そうだ選挙にいこう:04/01/24 19:08
>>485
見れないんだけど
488蕪木ら某 ◆Googl8RmwA :04/01/24 21:33
489名無しさん@そうだ選挙にいこう:04/02/01 22:31
今年に入ってからサーチクロスのバージョンアップが盛ん

2004/1/27 Ver.1.10
  ツールメニューに「新しいインデックスの作成」を追加。
  インデックスの切り替えを高速化。
  アプリケーションのタイトルヘッダにインデックス名を表示。
  異なるインデックスの複数サーチクロスを多重起動可。
  サーチクロス本体を常駐していてもインデックス切り替え可。異なるインデックスを別々に常駐することも可。
  検索結果がWord, Excel, PowerPointのとき、結果をクリックしても「次を検索」と「前を検索」のメニューとボタンが有効にならなかった。
  別ユーザで起動したときなどレジストリが空の状態でも、インデックス位置やオプション初期値を適切に持つようにした。
  SXKickの起動をレジストリのRUNを廃止し、スタートアップに変更。
  設定を変更したときにSXKickが起動していないときはSXKickを起動。
  「メール本文のみ検索」を廃止。……仕様的に意味のないオプションだったため。
  共有フォルダの検索のための読み込み専用起動オプションと、ユーティリティ SXShare を追加。
  キー操作の一部変更。プレビュー最大化をCtrl+D、アプリケーションの終了をCtrl+Wに。
  アイコン登録を、All Usersのスタートメニューに変更。
2004/1/20 Ver.1.08c
  SXSwitchで、インデックス対象及びファイルタイプの設定が10個を超えるときに、正しくインデックス切り替わりしていなかった。
2004/1/19 Ver.1.08b
  SXSwitchで、指定したインデックスフォルダを自動的に作成してエラーが出ないようにした。
2004/1/16 Ver.1.08a
  WZ MAIL5.0対応
  インデックス切り替えツールSXSwitchを同梱
>>489
まだ、OLEを使ってインデックスを作ってるかな?
以前、試用したときはインデックス作成でExcelのマクロが実行されたり、
途中で落ちたりして使えなかったんだけど
491名無しさん@そうだ選挙にいこう:04/02/02 13:58
今使うならサーチクロスとブーメランどっちがいいのかな〜〜
492名無しさん@そうだ選挙にいこう:04/02/04 21:18
サーチクロス v1.11 リリース
OLEを使わずにOffice文書や一太郎文書を読み込むのをあきらめました。
ライバルであるKWIC Finderの作者によるxdoc2txt.exeを使えってことみたいです。
>>489
>>492

標準出力フィルタが存在するファイルタイプなら、自由に登録して検索対象にすることが
できるようになった!

これで、Docuworks(dxw)の文書を検索対象にすることができるよ。現在、インデックス作成中

掲示板も閉鎖されて一時は終わりかと思われてたけれどよかった〜。
多分、作者が急かされるのがいやだったり、オンラインソフト的な開発に
なじめない人なんだろうね。
494検索太郎:04/02/07 10:15
dat2txtにも標準出力オプションをつけてもらったので、datファイルから
インデキシングも可能になりました。
(datから直接インデキシングすると、検索結果の表示が美しくないので)
>>481

いいな、いいな。
やり方知りたい・・・・・・
496名無しさん@そうだ選挙にいこう:04/03/04 05:03
MP3のタグを全文検索できるシステムって知らない?
497名無しさん@そうだ選挙にいこう:04/03/05 10:50
サーチクロス1.12使ってるんですが、Outlook Express6のメー
ルがうまく検索出来ないんです。何か設定忘れてるんでしょうか?

あるメールの本文中の単語をいくつかキーワードにしても、その
メールが検索結果に出てこないんです。インデックスは直前に作
ってますけど。去年からずっとはまりっぱなしで弱ってます・・・
もしかしてインデックス作る段階で取りこぼしが多いのかなあ(鬱
498名無しさん@そうだ選挙にいこう:04/03/05 18:58
インターネットブーメランの新バージョンまだぁ?
>497
ひらがなだったりする?
>>498
そういえばこれってWindowsXPでちゃんと動かないみたいなんだけど
501497:04/03/06 01:10
>499
レスありがとん。
キーワードはひらがなじゃなくて漢字です。具体的に言うと
「京都」「出張」「山田」が使ったキーワードそのものです。
この単語を含むメールが確かにあるのに、引っかからないので
頭かかえてます。他にも検索出来ない場合があり得るんじゃな
いかと。環境はW2000 sp4なんですが、何か設定に見落としが
あるんでしょうか?謎だ。
>501
OEは使ってないから分からないけれど、
使っている範囲では漢字を取りこぼしてたことはないなぁ。
インデックスを作り直してもダメ?

それでもダメならサポート掲示板に書いてみては?


503名無しさん@そうだ選挙にいこう:04/03/10 17:39
サーチクロスver.2.00が出た
2ちゃんのログ検索にも対応しているらしいぞ
504名無しさん@そうだ選挙にいこう:04/03/10 22:27
>>503
おお、ネタかと思たらマジかYO!

・2ちゃんねるのdatとHTMLの検索に対応。

でもヒットしてもいったんHTMLに変換してやらないと駄目なのでわ・・・?
今入れてみた。

datファイルをインデックス化して検索してみると、ちゃんとレス単位で検索して
検索結果も表示窓も1レスごとに表示される。

ただ、アンカーのハイパーリンクやポップアップには対応してない。
あと気になったのが検索結果がどのスレなのかが全くわからないこと
>>505-506
リクエストしたら対応してくれるかもよん>ハイパーリンクとスレ名
まだβなんだし。

ポップアップは必要ないけど、ジャンプしてくれると便利な気がする。
dat2htmlと併用するのがいいのかなぁ。
508名無しさん@そうだ選挙にいこう:04/03/11 11:23
商用ソフトが対応するなんて、2ちゃんもメジャーに
なったんだなあ。つか開発者が2ちゃんねらなのか?
とにかく入れてみよう。
509名無しさん@そうだ選挙にいこう:04/03/11 12:06
2ちゃんのことを掲示板で要望出したら「難しいけど検討項目に入れておきます」だって。
510名無しさん@そうだ選挙にいこう:04/03/11 23:32
2chのdatだけ別インデックスにしたいんだけどやり方おせーて
511名無しさん@そうだ選挙にいこう:04/03/12 17:17
サーチクロスVer.2.01 リリースage

掲示板に書くとすぐに開発者からのレスがついてとてもいい感じ。
512名無しさん@そうだ選挙にいこう:04/03/13 22:10
サーチクロス2.0にUPしてみたらエラいことになった。
●1.08の時のインデックスを認識しない
●しょうがないから一からインデックス作成
●なんか普通のHTMLファイルでエラーが出てまたやり直し
●何度繰り返しても終わらない
●どんどん検索対象ファイル数が増えていく

2時間くらい格闘してやめた。
結局、1.08に戻しますた。
ノーエラーにて16分でインデックス作成完了。
やっぱ安定版はいいな
513名無しさん@そうだ選挙にいこう:04/03/13 23:17
>>496
NamazuがMP3のタグ検索に対応しているよ。
インデックスサービスでもMP3検索できたような
これかな
http://www.meticulus.com/mp3filter.html

使ったこと無いので日本語に対応してるのかどうかは分かりませんが
516496:04/03/15 01:17
>>513-515
サンクスコ。
とりあえずNamazuから試してみます。
517名無しさん@そうだ選挙にいこう:04/03/15 11:37
mitakeを使い始めたのですが、Namazuで行っていた

my $EXCLUDE_TAG_START = '<!-- EXCLUDE_INDEXING_START -->';
my $EXCLUDE_TAG_END = '<!-- EXCLUDE_INDEXING_END -->';
$$contref =~ s/$EXCLUDE_TAG_START(.*?)$EXCLUDE_TAG_END//gs;

このような特定の場所を検索対象から外す事はmitakeで可能なのでしょうか?
518名無しさん@そうだ選挙にいこう:04/03/16 21:36
サーチクロスv2.02リリースage
おお、サーチクロス大胆に値下げしたね。
520名無しさん@そうだ選挙にいこう:04/03/18 00:25
2000円か〜〜

買っちゃおうかな〜〜
>518
Ver1ユーザは無償アップグレードなのね。ちょっとだけ見直したワン
俺ユーザ登録していなかった
しなくては・・・
>>519
KWIC Finderが1000円だからだろう
>>523
kwicはGREPだから話にならないほど遅い。
張り合う必要ないと思うけどね。
KWICも独自のインデックス検索機能備えているよ
526名無しさん@そうだ選挙にいこう:04/03/18 20:43
インタフェース的にもKWICの方が優れているからな。
普通にバグフィックス早いのも好感が持てる
そう?
俺はKIWCのインターフェイスは使いにくかった。
あと、インデックスを作る速度が遅いのが難点。検索漏れがないのはいいんだけどね。

SearchXは検索にクセがあるから、それに慣れないと使いにくいかも。
(俺は慣れちゃったけど。。。)
KIWCはいろいろできそうだけど、粗削りな感があるからなぁ。
529名無しさん@そうだ選挙にいこう:04/03/20 20:11
結局今一番のおすすめは何よ?
>>529
なまずなんて開発進んでないじゃない
タダじゃなくていいから、まともなもの希望。
KWIC、サトリ、鯰、search-s for Namazu全部使ってみた(疲れた〜

見積書大量エクセルデーターから全文検索がメインの漏れは
この中ではKWICが一番良かった。

grepと全文検索が選択可能。
結果がエクセルに出力可能。
単語辞書を持たない。
インデックス差分更新簡単。(自動更新も出来るみたい・・・

設定もマンドクサクなくて(・∀・)イイ!
¥1,000−レジストしようか思案中。
533名無しさん@そうだ選挙にいこう:04/03/21 10:08
PDFの透明テキストは自由に編集できるのですか?
また、エクスプローラライクなPDF用ファイラはないですか?
日立がNAMAZU に対応?

>> http://www.boxer.ne.jp/vespine/summary02.html
「フリーの検索エンジンとしてよく知られているNamazu*4との接続インタフェースを
標準で備えているため、Namazuを連携させてフォルダ内の文書ファイルを全文検索
させることも可能です」
>>532
SearchXは使ってみなかったのん?
536532:04/03/21 14:46
>>535
> >>532
> SearchXは使ってみなかったのん?

気がつかなかった(汗
エクセルの検索結果のソートやプレビューはKWICより良かった。
オンライン版だと\2,000-なんですね。
迷ってしまう・・・(;´∀`)
>>536
僕は全文検索愛好家なので両方レジストしてます。
両方レジストしても3,000円だし。

鯰はタダだけど、鯰を使うくらいならKWICなりSearchXなり使ったほうが使えると思うナリ。
サーチクロスいいね。
Wzユーザで体験版送られても無視してたけど、今回の値下げで
興味もって一度使ってみたら買ってもいい気になってきた。
kwicは画面に明朝体が出てきて使う気が一気に失せた
>>539
俺もそこがひっかかってる。見ていて疲れるんですよ明朝体は。
検索ってのは大量の検索結果の中からさらに目で見て特定するわけで
文字に余計な飾りが付いている明朝体は、さらっと流れるように読むのがしんどい。
きっとどこかで設定すればゴシックに変えられるんだろうけど、
変更しようという気持ちも起きない。

印刷物用の明朝体をディスプレイに使おうという考えが理解できない。
ワープロでは明朝体使うこともあるし、読んでも苦にならないんだけど
なぜかKWIC Finderの明朝体は気に障る。
>>542
そんなこと言わないでさ
http://www31.ocn.ne.jp/~h_ishida/KWIC/screen1.gif
      『MS明朝体』が検索野郎の使う気を鼓舞すること
のために何をしたか。何もしないばかりでなくわれわれを女
らしき意気地なしになした。あのような文字はわれわれのな
かから根コソギに絶やしたい
SearchX2体験版/winXPで使用

標準のインデックス保存先フォルダが↓以外を選択出来ないみたい・・・

C:\Documents and Settings\○○\Local Settings\Application Data
\VillageCenter\SearchX

マイドキュメント内に移動させたいんだけど・・・
標準以外のインデックスは問題なく出来る。
なんでだろ?
バグかもね。報告したら?
>>545
詳しく知らないのだけど、標準は変えられないのでは?
私はQ,007見て変えました。
HKEY_LOCAL_MACHINE\Software\VillageCenter\SearchX
IndexLocation

C:\Documents and Settings\All Users\Application Data\VillageCenter\SearchX

D:\SX_INDEX

うちではこんな感じで標準も移動できてます。

当然こっち↓は消してます。
HKEY_CURRENT_USER\Software\VillageCenter\SearchX
549545:04/03/24 20:33
↓回答キタ━━━━━━(゚∀゚)━━━━━━ !!!!!

問題の症状を確認いたしましたので次版で修正します。

なお、レジストリを直接編集していただければ、現在のバージョンでも変更で
きます。
ファイル名を指定して実行にて regedit でレジストリエディタを起動。

HKEY_CURRENT_USER
Software
VillageCenter
SearchX

の IndexLocation の値を変更してください。
以上、よろしくお願い申し上げます。
550名無しさん@そうだ選挙にいこう:04/04/01 20:54
サーチクロス Ver.2.03a
ttp://www.villagecenter.co.jp/soft/searchx/download.html
バージョンうぷage
551名無しさん@そうだ選挙にいこう:04/04/02 21:10
サーチクロスVer.2.03b登場age
552名無しさん@そうだ選挙にいこう:04/04/02 23:20
結局サーチクロスにしときゃいいの?
VISIOの検索できるのないかなぁ
VisioはIndexing ServiceのIFilterを追加して、サトリ、KWICで検索できるよ
http://www.microsoft.com/japan/sharepoint/server/downloads/ifilter.asp
Z-XCV
http://www.z-xcv.com/versus.html
個人向けにも出ないっすかね。
サーチクロスインデックス更新時にOUTLOOK2002の場合
ダイアログボックスが出てアクセス許可時間を指定するまで
更新を停止してしまいます。
なお最長アクセス時間10分です。
http://office.microsoft.com/assistance/preview.aspx?AssetID=HA010506531041&CTT=6&Origin=EC010553071041

回避する方法知りませんか・・・
ちなみにセキュリティーレベル低にしてもダメでした(泣
一応セキュリティ対策でそうなってるわけだから無理じゃない?
確認なしでメッセージ抜き出せたら気づかない間に他人にメッセージ
のぞき見される可能性があるわけだし。
557名無しさん@そうだ選挙にいこう:04/04/17 21:41
サーチクロスを使い始めてみた。ギガバイトクラスのデータ量になると
インデックスを分けないと使い物にならんのね。インデックス作成時に
全てメモリに置こうとしなきゃ良いのに、と素人目には思ってしまう。
他のソフトでも同様なんでしょか?
パフォーマンスを考えると、オンメモリとディスク使用では雲泥の差が出ます。
今の速度があってこそのサーチクロスだと思っているから、
ディスク使用でパフォーマンスが落ちるのであればイヤです。

一種のデータベースなわけだし、でかいデータを扱うデータベースなら
メモリを積めるだけ積むのがよろしいんじゃないの、とか思うがいかが?
559名無しさん@そうだ選挙にいこう:04/05/03 01:43
http://www.allmusic.com/
有名な音楽の情報検索サイトなんですが、
こういう検索サイトの全文検索は可能なんですか?
不可能ではないが現実的ではない
561559:04/05/03 22:48
>>560
レスありがとうございます。
現実的ではないというのはお金の問題ですか?
あるサイトの全文検索をローカルで行おうとすれば、
グーグルなどと同様にそのサイトにあるページ全てを読み込み保存する必要がある。

個人運営のサイトならばページ数も少ないが、
こういった商用サイトとなるとページ数は万単位になる。

ゆえに、Webサイトで検索サービスが用意されてるならばそれを使うのが一番だし、
なかったらグーグルや他のサーチエンジンで範囲指定して検索する方がベター。
>>559
まず、前提として、
検索サイトを全文検索して、何がヒットして、何を取ってこれると期待してるのでしょうか?

検索サイトって、自分で持ってる情報を検索させるサイトと、
他のサイトの情報を検索させるサイトがあるでしょ。
自分で持ってないサイトなら、何を期待してそこを検索するのかな?
ちなみに、そのAMGは、自分で情報持ってるみたい。

次に、自分で持ってる情報を検索させてくれるとして、
その情報ってそれぞれURLを持ってるのかな?
言い換えると、それぞれの情報に外からアクセスできるの?

検索の「仕掛け」はURLを持ってる、外からアクセスできる。それがAMGのURLだよね。
じゃ、検索対象である「それぞれの情報」は?

>>562さんが言うとおり、全文検索をローカルで行おうとすると、
検索のインデックスをローカルに作ることになるよね。
つまり検索対象とする「それぞれの情報」をローカルに持ってくる必要があるけど、
その「それぞれの情報」に外から、こちらからアクセスできないと持って来られない。
つまり、ローカルで全文検索できない。
564559:04/05/04 14:19
ローカルで全ページを読み込み保存しなければ全文検索できないんですね。
そういうことを知らなかったので質問させていただきました。

プロフィールやアルバム紹介にある文章も対象にして
ワード検索できれば便利だなと思っていたんです。
googleのサイト検索もやってみましたが、効果がなかったです。

ありがとうございました。
質問です。
word文書の検索を主に考えているのですが、ドイツ語のウムラウトやフランス語のアクサンにまで
対応しているものってあるでしょうか。
教えて頂ければ幸いです。
566名無しさん@そうだ選挙にいこう:04/05/09 20:07
567名無しさん@そうだ選挙にいこう:04/05/11 23:19
Quick Finder2.0
568名無しさん@そうだ選挙にいこう:04/05/15 18:53
>>565 estraier
Google、PC内のデータを検索するツール立ち上げへ
http://www.itmedia.co.jp/news/articles/0405/19/news051.html
>>568
レスさんくすです!
estraierのHPを早速見てみたのですが、私のような完全文系人間にはやや敷居が高そう…。
少し無理をすれば使えるレベルであれば良いのですが、ある程度のプログラミングの知識がないと
やはり厳しいんでしょうか?
フリーのワード検索野郎か、1,000円のKWIC Finderにしておこうかしら…
571名無しさん@そうだ選挙にいこう:04/05/24 01:35
>>570
必要なのは、プログラミングというより、サーバ管理のスキルなんでしょうね。
いずれにしても、とっつきにくいのに変わりはないですが。
572名無しさん@そうだ選挙にいこう:04/05/24 13:40
Greplaceが簡単でいい
サーチクロス
オンライン版レジストしちゃった・・・

インデックス自動更新の設定をどうするか悩みどころ・・・
574名無しさん@そうだ選挙にいこう:04/06/08 09:50
複数の文章から検索語を含む文全てを表示するようにできるツールはありますか?
検索語が含まれる文書検索は上のどれでもできると思うんですが。
>>574
出来なかったのはどれ?
参考までに教えてください。
576名無しさん@そうだ選挙にいこう:04/06/08 12:21
>575
namazuをそのまま入れた状態では無理でした。
できる方法はありますか?
>>検索語を含む文全てを表示

なんか意味が分からんが他のソフト適当に試してみれば・・・
文書(ファイル)単位でなくて、文(句点や改行で区切られる)を単位にして
検索したいってこと?
579名無しさん@そうだ選挙にいこう:04/06/09 12:39
>578
そのとおりです!
英作文用に、ある単語を打つとそれに対する例文がでるようにしたいんです。
サーチクロス結構いい。ファイル仕分けしなくて良くなった。
grepじゃ駄目なくらい量があるの?
うん、過去5年くらいのオフィスファイル。
583名無しさん@そうだ選挙にいこう:04/06/10 00:42
>>579
全部のファイルからテキストを抽出てひとつのファイル連結してからgrepかければいい。
その際に、必要に応じて、「。」やピリオドで行を区切る前処理を行ってもいい。
最近のマシンなら、連結したファイルのサイズが100MBくらいまで実用になるよ。
俺は英辞郎っていう辞書データでそれやって実際に使ってるから。
584名無しさん@そうだ選挙にいこう:04/06/11 03:52
今更な質問で恐縮ですが、
いわゆる単純grepでダメというのは、
対象の容量が大きすぎるため、時間がかかって実用に適さないという意味なんでしょうか。
DWなどでは検索用データを別につくるので、かなり早くなるというように
理解しているのですが、両者の境目はどのあたりにあるのでしょうか。
主に文書ファイルで200Mを対象と考えているのですが、
この程度であれば、grepで十分ですか?
>時間がかかって実用に適さないという意味なんでしょうか。
単純に言えば、そういうこと。一日に何回実行するかに依ると思うけど。
また、問題になる時間というのも人によりまちまちだと思うな。
電話の応対中に使うなら、10秒はアウトだね。Grep200Mならそのくらいでしょう。
文書作成中に検索すれば、おそらく単純に時間の損失になるし、思考の
中断にもなる。損失10秒として、10秒 × 15回/1日 × 200日/年もあると
仕事ならやっぱちょっと考えちゃうよ。
ナマズ使ってるけど
自分用に設定すれば実用的なレベルになるよ。
テキスト、ワード、エクセル、htmlなどの文書データが40G程度あるけど
簡単な検索なら一瞬で出てくる。
ただ思考の中断は早くなっても解決しないよ。
自宅PC、会社PC両方いれてるけど使用頻度は圧倒的に会社。
顧客から何年も前の見積や製品をフリーワードで検索。
ヒットして即答出来るのが快感w

所詮自己満足か・・・
確かに仕事では良く使う。
特に大量メールが溜まると。。。
589584:04/06/12 07:14
まずは実際に試してみるのが一番と思い、KWIC Finderを使ってみました。
インストール・使用共に非常に手軽で便利ですね。
ただ、逐次検索では確かに200M弱でも10秒程度必要で、
物書きのような仕事をしている者としては、思考の中断ということでは少し気になりますね。
しばらくこのまま使ってみて、それでも気になるようであれば、
Microsoft Index ServiceやKWIC Search Engineを使った全文検索システムに挑戦してみようと思います
(完全文系人間としては、やや大変そうですが)。
皆さん、アドバイス誠にありがとうございました。
あとは、ホットキー機能があるものを使うことかな。同時に選択文字の自動コピーが
出来るものだとなおよし。
作業の簡略化により、「あーして、こーして」等、本来の作業と関係ない思考が
割り込むことを防ぐよ。
>>589

その時間分、人件費を考えたらサーチクロスを2000円ぐらいで買ったほうが
結局安くなりません?
自作自演ヤメレ
>>591
そのままKWIC Finderを使ったほうが安いし、今回の目的にはサーチクロスよりあっていると思うが
594584:04/06/14 18:12
皆さんその後もアドバイスありがとうございます
KWIC Finderでインデックス検索を行うのと、サーチクロスを使う違いは、過去ログで確認したところでは
サーチクロスでは、2ちゃんのdatログも扱えること、あとはメールの検索に優れていることぐらいでしょうか。
確かに便利そうではありますが。
ところで、Microsoft Index ServiceとKWIC Search Engineではどちらが優れているのでしょうか?
マニュアルでざっと見たところでは
Microsoft Index Service:自動作成が可能
やKWIC Search Engine:信頼性がより高い
ぐらいでしょうか。

ちなみに>>592は私に対してでしょうか?別に自演はしてませんが・・・
併用でいいんじゃない
確か並べ替え(ソート)はサーチクロスのほうが優れていたような気がする・・・
個人用(ファイル数:十数万、サイズ:数ギガ、Win2K)に全文検索システムを
導入したくて estraierを試してみた。
目下、転置インデックスを作成中なのだが、estindex register がまだ終わらない。
開始してからもう一日以上経っている。
コマンドプロンプトを見てると進行が速かったのは最初だけ、今は、一項目登録に
数秒から十数秒かかってる。
現在 casketのサイズは500MB。
estraierにこの規模は無理なのかなあ。
データとインデックスを別の物理ドライブに置いて高速化を図ってるんだが。
分割して作ってからestindex mergeする方法を試してみたら?
製作側の想定外の使用条件であることはわかるな。
600597:04/06/24 19:01
レスもらってたんだね。アリガト。
2日以上かかった。その間HDDはギーギー言いっぱなし。
HDDの耐久試験をしているような気分だった。
結局namazuに乗り換えた。こっちはいたって静か&スムーズにindexing終了。

サイトに10万超の文書数にも対応とあったと思うから、
使用条件を大幅に越えるものではなかったと思うのだが。
601名無しさん@そうだ選挙にいこう:04/07/01 00:29
サーチクロス、インデックスの作り方に癖があるような…
どういうアルゴリズム使ってるんだろう。
って、まぁそこは秘密なんだろうけど。

俺、マジでべたにGREP掛けてるんだと思ってた。
なるほど、KWIC Finder は N-gram 使ってるのか。
603名無しさん@そうだ選挙にいこう:04/07/01 07:04
おれ、Indexing Service は結構好きで、
自分でフィルタ作ったり、OLE DB Data Provider for Indexing Service
つかって検索ソフト作ったりしている。使用言語は C#。

でも、周りはほとんど Indexing Service なんて使ってない。
Microsoft は Indexing Service を今後も続けていく気はあるんだろうか。
なんてふと考える。

Indexing Service は N-gram 使ったような総なめの検索は
統合しづらいみたいだしなぁ。なにせ「プロパティ - 値」の
集合として捕らえるわけだから。
604名無しさん@そうだ選挙にいこう:04/07/02 02:35
他スレで質問しましたが、スレ違いだったようなのでこちらで質問させて下さい。

【必要な機能】 ロボット検索技術を応用した、インターネット上の販売情報を検索することができるソフト。商品名やスペック等からリアルタイムな情報を検索することができる。その得た情報をMYSQLなどのDBに落とし込みたい。
【.  目 的  】 リアルタイムに価格比較できるPC比較サイトを作りたい
【. 使用OS 】 windowsXP
【.  条 件  】 10万以内なら払いたい
■試したけど条件を満たさなかったソフト
【. 名  称  】 まったく見つからず
■これだけはやりました
>>1-10、FAQ集、上手な検索の仕方 を読んだ 】 はい
【  調べたサイトの名前  】 GOOGLE YAHOO など大手検索エンジン
【検索キーワードは?  ..】 ロボット型検索技術 クロール ソフト

恐らくこのようなソフトはないと思います。。
この技術の最も単純なソフト。もしくは応用が聞くような単純ソフトがあれば・・・・などと不遜にも考えています。

ちなみに下記2サイトで私がやりたいような事を行っております。

http://www.bestgate.net/

http://yasune.dokoda.jp/

このような技術の雛形などご存知の方いましたらどうかご教授下さい。
>>604
このスレ最初から読んだ?
606604:04/07/02 22:09
すいません。かいつまんでしか読んでいませんでした。

そして、今、完読しましたが、クロール系の話題が
どこかわかりませんでした。もしよろしければ、
どのスレかご教授頂ければ嬉しいです。
これか?

ロボット型検索エンジン5

http://pc5.2ch.net/test/read.cgi/hp/1030973183/
608名無しさん@そうだ選挙にいこう:04/07/04 22:42
サーチクロスって、Becky!2の添付ファイル内も検索できるんでしょうか?
>>608
対応してるファイル形式なら出来るよ。
610608:04/07/04 23:39
>>609
Becky! Ver.2だと添付ファイルはエンコードされたまま保管されていますが、
それでも中身の検索をできるんでしょうか?
メールの添付ファイルの文章の検索なんて出来るのか?
つーかそんなこと考えてみた事もなかったな。大体別フォルダに保管しておくし。
>>604
不遜すぎ。自分で手を動かす気もなくたったの10万かよ。
ケタ2つ間違ってるぜ。
613名無しさん@そうだ選挙にいこう:04/07/05 14:39

         ,,-―--、
        |:::::::::::::;;;ノ  / ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
        |::::::::::( 」 <私は、ストーンズフリークですが・・・
        ノノノ ヽ_l   \__だから好きなんですかね____________
       ,,-┴―┴- 、    ∩_
     /,|┌-[]─┐| \  (  ノ
      / ヽ| |  バ  | '、/\ / /
     / `./| |  カ  |  |\   /
     \ ヽ| lゝ    |  |  \__/
     \ |  ̄ ̄ ̄   |
      ⊂|______|
       |l_l i l_l |
       |   ┬    |
>>611
Lotus Notes R5 は出来るよ
だれかIBをXPで動かす方法知りませんか?
616蕪木ら某 ◆Googl8RmwA :04/07/14 13:05
>>615
http://faq.justsystem.co.jp/faq/1003/app/jsfaq.jsp?26863+0081
> インターネットブーメランは、Windows XPには対応していません。
http://faq.justsystem.co.jp/faq/1003/app/jsfaq.jsp?26862+0081
> インターネットブーメランは、Internet Explorer5.5 SP2および6.0に
> は対応していません。
???


http://www.justsystem.co.jp/win2000/win2000_ib.html
> 「Windows 2000」へのインターネットブーメランの対応について
...
> 現在発売中のインターネットブーメラン(※)は...制限ユーザーでの
> ご使用には対応しておりません。
...
> システム管理者(Administrator)または標準ユーザー(PowerUsers
> グループ)で問題なく動作します。

http://www.atmarkit.co.jp/fwin2k/win2ktips/061execauscut/execauscut.html
> 一時的にほかのユーザー権限でプログラムを実行する方法...
(w
>>616
結局、無理?
>>617
616読んで自分で判断しろ
619615:04/07/14 23:31
615です。

昨日、インストール後に再起動しても「仮想メモリが足りません」とでて
何故か起動しませんでした。メモリは1GBあったんですが。
今起動したら、普通に起動して使えます。

>>616
そのFAQやWindows2000対応モジュールは導入済みですが、>>616さんが
それを貼った意図がわかりません。
まさか、IBのアップデート情報も読まない馬鹿だと思われたのでしょうか?_| ̄|○


>>617,618
動きましたよ。全部ちゃんと使えるかどうかはこれから確認します。
まあ>>615読んだだけでは普通どんな状況か、何をやったのか分かる奴はいないわな
少なくとも、質問の仕方も知らないバカだとは思ったな
>>619
情報は小出しにするな
>>615
???インストール直後の再起動では無理で、そのあとなぜか起動したって事?
モジュールのインストールと再起動のタイミングとか情報キボンヌ。

何にせよ XP で動くというのは希望が見えた気分だ・・・。
624615:04/07/17 11:57
>>620-622
もう虐めないでください。

>>623
IB導入→パワーアップキット、2000対応パッチ導入(1パッチ毎に再起動)→起動せず_| ̄|○

それで一度諦めたんですが、翌日再起動したらあっさり起動しました。
何度か試しましたが、情報ボックスを複数作って普通に検索できてます。精度はまだ
アレですが。


IEとの連携や、ATOK17との連携はまだ試していません。たぶん無理だと思いますけど。
625623:04/07/17 22:16
>>624
おおサンクス。
ATOK17 との連携は 2K でも出来ないっぽい。
ヘルプに削除されたって書いてあったよ>コンセプトナビ
方言使わないし 16 にしようかな・・・。
CDにプログラムごと焼いて、CDの中のドキュメントを検索できるという
Namazuみたいなものありませんか?

627615:04/07/24 15:33
ごめんなさい。

>>624の手順、最後の再起動前にIB関連の全EXEに「NT4 SP5互換」設定してます。
忘れてました。

互換設定直後に動かないので諦めましたが、再起動したらあっさり動きました。
628名無しさん@そうだ選挙にいこう:04/08/12 15:28
Vectorプロレジ大賞ユーティリティ部門で
サーチクロス 2.0が受賞

ttp://shop.vector.co.jp/service/special/award2004_summer/
受賞しても売れないとしょうがないんだよね。メーカは開発
やめちゃったりで。。。。

IBやConceptBaseSearch20も日経の何か受賞していたけど
その後は。。。。。
630名無しさん@そうだ選挙にいこう:04/10/08 06:57:56
>629
> IBやConceptBaseSearch20も日経の何か受賞していたけど
> その後は。。。。。

ConceptBaseは法人向けでがんがってるけど、
NamazuとかGETAに浸食されつつある。
631名無しさん@そうだ選挙にいこう:04/10/15 02:57:33
Google Desktop Searchベータ版リリース
633名無しさん@そうだ選挙にいこう:04/10/15 13:14:34
Google Desktop Searchは日本語のメールが検索できなかった
日本語版が早く出て欲しい
MSのメーラーしか検索できないんじゃ、漏れには役に立たないや。
PDFが検索出来ないのは痛いな。
2chのログもね。 結構馬鹿にされるかも知れないけど、コンピュータの設定
関係については役に立つよ。 専門的に本格的な話になると相当怪しい
けどね。
文書や曲、画像など様々なローカルファイルを検索「Copernic Desktop Search」
http://www.forest.impress.co.jp/article/2004/10/20/cds.html
>>637
どうなの?

>  なお、編集部のWindows XPにて本ソフト英語版を試用したところ、
> Office文書や楽曲ファイルのタグ情報、IEのお気に入りやアドレス帳、
> そのほか一部のメールは日本語で検索できたが、テキストや
> HTML/PDF文書は日本語で内容を検索できなかった。
>>638
何がですか?
>>639
何がって。。。

ほんとに全文検索したいの?
641名無しさん@そうだ選挙にいこう:04/10/30 16:35:14
サーチクロスって読んde!!ココで作った透明テキスト入りのPDFが検索できないね。
>>640
質問の意味が分からない。

>>641
両方とも一番新しいの使ってるけど出来てるよ
643641:04/10/30 23:58:51
>>642
マジか・・・?
不都合無いんでずっと1.0使ってた。
最新バージョン落として使ってみるか。。。
644名無しさん@そうだ選挙にいこう:04/11/01 12:38:17
サーチクロスって今のメジャーバージョンは2でなんで、
1とは相当違うんじゃない?
ていうか1のユーザーは無償で2にアップデートできるんじゃなかったか?
素直に最新のにしたほうがいいだろう。
646名無しさん@そうだ選挙にいこう:04/11/04 14:52:06
Lookoutはどうでしょう。今のところ便利に使えてますよ。日本語も通りますし。
添付ファイルも検索してくれますが、たぶんPDFは検索対象にならないのが残念。

http://www.atmarkit.co.jp/fwin2k/win2ktips/467lookout/lookout.html

http://www.microsoft.com/downloads/details.aspx?familyid=09b835ee-16e5-4961-91b8-2200ba31ea37&displaylang=en
>>646
検索漏れが多いのが気になる。
ないよりはマシってとこかな。
>>642
http://www.villagecenter.co.jp/cgi-bin/faq.cgi?software=SX&keyword=pdf

Q.003 検索できないAdobe Acrobat文書(PDFファイル)があるようですが……。

残念ながら、すべてのAdobe Acrobat文書が検索できるわけではありません。
現時点でサーチクロスが対応しているのは次のタイプとなります。

以下略
デスクトップサーチは世間的には赤丸急上昇なジャンルなのに、
サーチクロスは先行者利益を活かせてない気がする。惜しいな
先行すれば常に利益があるわけじゃないし。
世間的に流行なのは無料だからねぇ。

インデクサの軽さは良いと思うんだけどね。。。
LookOutとGoogle Desktop Search の日本語検索の漏れ方が同じことに気付いた。
スペースか改行がなければ一単語とみるみたいだね。
Google Desktop Search日本語化まだ?
yahooも参入するらしいけど・・・

サーチクロスレジストしてしまった俺にとっては複雑な心境。
namazuでメールのIndexを作るにはやっぱり一度HTMLに変換するしかない?
他の商用ソフトならdbx形式でもそのままIndex作ってくれるのかな。
654名無しさん@そうだ選挙にいこう:04/11/13 12:33:39
>>643
写真や手書きの書類を無理やり読んde!!ココに読み込ませて
透明テキストにキーワードを書き込んでpdfで保管しておりまつ。

検索がメチャ便利
655名無しさん@そうだ選挙にいこう:04/11/13 18:52:21
656名無しさん@そうだ選挙にいこう:04/11/13 18:53:01
657名無しさん@そうだ選挙にいこう:04/11/18 23:35:23
xdoc2txtとデフォのPDFフィルタとだとどっちがいいのかな?>サーチクロス
658名無しさん@そうだ選挙にいこう:04/11/20 18:28:31
uerhr
今発売中の週間アスキーにサトリが取り上げられているね
>>659
サトエリの仲間?
661名無しさん@そうだ選挙にいこう:04/11/21 16:03:08
2ちゃんねる専用ブラウザ「ホットゾヌ2」の3年分のログを
サーチクロスでインデックス化してみた。

単語数3,826,244
4つの単語で検索したら53秒もかかったよ(;´Д`)
PCのスペックは?
663名無しさん@そうだ選挙にいこう:04/11/21 16:50:15
>>662
4年前に買ったPenIII-866 512MB PC133 SD-RAM Win2K
たしかに一昔前のスペックだが……
あ、2chのログはサーチクロス内蔵のを使うより、dat2txtを使ったほうがいいよ。
dat2txtを使っても遅い?
ちなみに何メガぐらい?
>>663
そんくらいあれば
53秒もかかるはずはないよ
うちはセレ1G 256M WinXPだけど
10〜15秒くらい。
データはテキストだけで10Gくらい
667661:04/11/22 21:25:49
>>664
dat2txtを使ってるよ。でも遅い

>>665
過去ログはトータルで737MB。

>>663
10GB!? おかしいなぁ?
でも単語4つのAND検索だと1分近くかかるんじゃない?
あ、ヒットしまくるような単語で検索すると遅くなるかもね。漢字1文字とか。
669名無しさん@そうだ選挙にいこう:04/11/24 02:57:44
>>669
マカーじゃないしなぁ。
それにOS標準の検索サービスってHDDアクセスしまくりの悪寒が。。。

Winなら現状以下の選択肢が勧められる
●ただが一番
 Namazu for Win32 + search-s
●シェアウェアなら。。。
 KWIC Finder
●製品版が安心
 サーチクロス2

多機能というならKWIC Finderかなぁ。
検索エンジンをNamazu,IndexService,独自エンジンから選べるし
圧縮ファイルの他、文書フィルタの導入で色んな文書を検索対象に出来る。
主要メーラにも対応、正規表現での検索も可能。

……ただインデキシングの遅さに辟易したんで、漏れはサーチクロス使ってるが……
Windows 環境であれこれ考えずに導入できて, それなりに使えるのは
サーチクロスだけだろ.
そういうわけで, オレはサーチクロスを買う気でいたのだが, なんか
google が出してくるみたいなので, しばらく様子見.
なんか, あらためて考えると, なんで2千円位の出費に躊躇しているのか
自分でも解らんが.
2千円>時間なら別にいいんじゃないの?
ちなみにnamazuで2chのdatファイルはインデクス作れるのですか?
もしかして、なんかのフィルタでhtmlに変換して、インデクス作るから
ディスクを食うとか。

namazuは設定とかはダルイけど、早いですから。
674名無しさん@そうだ選挙にいこう:04/11/25 10:19:35
サーチクロスだとエクセルのテキストボックスまでインデックス化してくれない。
xdoc2txtだとどうなのかな?
675674:04/11/25 10:35:17
早速試してみた。xdoc2txtをコマンドラインからテキスト変換。
テキストボックス内のテキストもちゃんと抽出できてるようだ。
OLEじゃなくこちらでインデックス化してみよう。。。
>>673
みすずん検索はnamazuとdat2htmlで過去ログ全文検索システムを作ってる。
htmlへのコンバートはオンメモリで行われるのでディスクは喰わないよ。
AcrobatのWebCaptureで取り込んだWebページが検索に引っかからない。
× サーチクロス2標準
× xdoc2txt
× pdftotext(xpdf)

いいPDF用文書フィルタはない?
>>677
namazu & xpdf で出来るYo。
>>678
あれ? コマンドラインから
"> pdftotext ○○○.pdf >○○○.txt"

で正常にテキスト抽出出来なかったんだけど。。。
それは日本語の設定をちゃんとしていないか、pdfにパスが掛かっているから。
英語のみのpdfファイルで試してみれば。
パソコンのハードディスクの中身をGoogleで検索――Google Desktop Beta IT最前線 :ITビジネス&ニュース
http://it.nikkei.co.jp/it/column/zensen.cfm?i=20041022c7000c7

DesktopSearch - PukiWiki
http://www.globe.to/~oka326/?DesktopSearch

MSNサーチが検索市場にもたらすもの - CNET Japan
http://216.239.57.104/search?q=cache:aDdb83vN4E4J:japan.cnet.com/interview/story/0,2000050154,20075038-2,00.htm+%E3%82%B5%E3%83%BC%E3%83%81%E3%82%AF%E3%83%AD%E3%82%B9&hl=ja
>>680
thx
日本語の設定やったらコンバートは上手くいった。
でもpdftotext.exeって標準出力が出来ないのが痛いね。
これが出来たらサーチクロスのコマンドフィルタとして利用できるのに。
サーチクロスで数字と漢字の連続した文字の検索が出来ません。
たとえば山田太郎の6月の領収書を探したいとき「山田太郎 領収書 6月」で検索しても絞り込まれません。
山田太郎の領収書が沢山引っかかるのでしらみつぶしに探さざるを得なくて困ってます。
設定で数字もインデックスの対象にはしてあります。
どなたかお暇な方、御教授をお願い申し上げます。
>>683
数字は全角で「6月」と入れてみる。
「6」(または「6」)と「月」を含む文書がヒットするのであとは「検索+(S)」で絞り込む
>>684
「山田太郎 6月」で検索するのではなく「6月」で「検索+」するのがミソなんですね。
そして「いずれかのキーワードを含む」で山田太郎で絞り込むんですね。
ありがとうございました。助かりました。
686名無しさん@そうだ選挙にいこう:04/12/01 14:44:42
ジャストシステム、デスクトップ検索ソフトConceptSearchを来春発売
http://japan.cnet.com/news/ent/story/0,2000047623,20077303,00.htm?ref=rss
687名無しさん@そうだ選挙にいこう:04/12/01 20:12:09
うおおおおお
きたああああああああああああああ

ジャストシステムがんがれ!!!
688名無しさん@そうだ選挙にいこう:04/12/01 22:31:55
IB以来の個人向け全文検索ツールの発売か。
期待せずにはいられないな。
ところで

*インストールには別途「作業ディスク」2,000円(税別)が必要です。

これなに?
689名無しさん@そうだ選挙にいこう:04/12/01 22:46:11
現段階では、「ライセンス製品」だから

ライセンス製品の購入は
購入は、「ライセンス」+「メディアパック」というのが普通

店頭販売も検討してるようだけど、是非やってほしい
税別って,,,,。
順法意識のない会社だ。
●CB IVの検索エンジンを使用したデスクトップ検索ソフト
http://www.justsystem.co.jp/software/dt/cs/

インターネットブーメランの正統な後継者といった感じか。
もれIBって使ったことないんだけど実際どうなの?
サーチクロス2は2ちゃんDATまで検索できて愛用してるんじゃが
乗り換える価値アリ?
税込みでも難癖つけられるけどな
ついにきたね〜
待ちに待ったCB!!!


でもね・・・これ、

企業向けですから!!!   残念!!
企業向けではなく、法人用ですからの間違いです・・・ 切腹!!
justのやつはDocuWorksに搭載されるから、DocuWorksを買うのが正しい。のか?
もう少しドキュワークスが安ければねぇ・・・・
企業向けと法人用の言葉の違いってなに?
698名無しさん@そうだ選挙にいこう:04/12/02 17:05:18
https://www.justsystem.co.jp/if/email_if.html

みんなでいつ店頭販売されるか問い合わせよう!!
い・や・だ
今から自宅を法人登記して買おう
>>686
>>688

ライセンス販売だから企業のみだね
個人では購入できない
702名無しさん@そうだ選挙にいこう:04/12/03 00:49:45
>>696
DocuWorks+ConceptSearch(6,000+2,000円)+Acrobat Elements(4,000円?)で
14,200円と考えればお買い得に思えるかもしれない
Scan SnapにDocuworks付かないかな。
そもそもドキュワークスってなんなんじゃ??
>>704
つまらない・・・
706名無しさん@そうだ選挙にいこう:04/12/04 08:10:32
ドキュンワークス
○Adobe PDF IFilter v6.0が10/19/2004に出ているようです。

http://www.adobe.com/support/downloads/detail.jsp?ftpID=2611

日本語windows Xpでもつかえそう。

> Additional notes
> Language notice:
> Adobe PDF IFilter has no user interface and therefore is
> language-agnostic. It is tested and supported in Tier 1
> languages (English, French, German, and Japanese), utilizing
> operating systems in the above languages and text within
> Adobe PDF files in the above languages. However, it has also
> undergone additional limited testing utilizing Adobe PDF
> documents in all Acrobat languages and has correctly
> returned text to Microsoft Indexing Services. Since Adobe
> PDF IFilter is based on the Microsoft indexing client, it is
> this indexing client that is responsible for interpreting
> the returned text and then presenting the information to the
> user.
おー、やっと出ましたか。ていうか出てましたかw
レジストリいじるのが嫌でIFilter5.0を見送っていたもんで、早晩試してみます。
709名無しさん@そうだ選挙にいこう:04/12/12 11:49:34
>>702
>Acrobat Elements(4,000円?)...
って、普通のAcrobat Stdと、どこが違うんですか?購入価格は、
40万円ってことですか?
”最も信頼性の高い Adobe PDF 文書を作成し、社内外にすばやく確実に
配信..”の後半文句って、何が利点なんだろ。
http://www.adobe.co.jp/products/acrobatel/main.html
>>709
サイトを読めば分かる
>>709
Acrobatファミリー - 製品比較
ttp://www.adobe.co.jp/products/acrobat/matrix.html

単体販売のない100ライセンスからのライセンス販売のみ。
昨日としては本当にただPDFを作れるだけ。今はいろんなメーカーから
安価なPDF作成ソフトが出てきたからあまりありがたみはないかもな。
×昨日 ○機能
713名無しさん@そうだ選挙にいこう:04/12/16 14:31:38
ついにMSもデスクトップ検索に参入か。
714名無しさん@そうだ選挙にいこう:04/12/16 17:44:03
>>657
遅レスだけどxdoc2txtの方が良い。
デフォのPDFフィルタだと、
「単体販売のない100ライセンスからのライセンス販売のみ」という文章が
「単 体 販 売 の な い 1 0 0 ラ イ セ ン ス か ら の ラ イ セ ン ス 販 売 の み」
という風にスペースを1つずつ入れながらテキスト抽出してしまうことがある。
これだと単語でヒットしなくなる。
(読んde!!ココでつくった透明テキスト入りPDFファイルで実験)
WinFSの実現、さらに遠のく--マイクロソフト幹部明かす
http://japan.cnet.com/news/ent/story/0,2000047623,20079624,00.htm

Windows Serverの開発を指揮するBob Mugliaが、WinFSは2007年に
出荷されるサーバ版Longhornにも搭載されないと語った。
「WinFSはLonghornクライアントに搭載されない」と同氏はインタ
ビューのなかでかたり、さらに「また、Longhorn Serverにも搭載さ
れない」と付け加えた。

 MicrosoftではLonghorn投入の数年後にアップデート版を出す予定
だが、WinFSがこれに搭載されるかどうかさえはっきりしていない。

さらに、WinFSのOSへの搭載がもっと遅れ、2010年以降に出荷予定の
Windows「Blackcomb」(開発コード名)になる可能性さえある。
716名無しさん@そうだ選挙にいこう:04/12/16 23:22:45
>>715
ヲワタ
AskJeevesも。いちおう。
>>718
デバイスドライバとかOffice/ウェブブラウザ以外のソフトの記述が抜けてるのが
気になるけどな。
720名無しさん@そうだ選挙にいこう:04/12/17 22:17:18
ちょっとスレ違いかもしれませんが…

米blinkx、テレビ番組の全文検索サーチエンジン「blinkxTV」を発表
 米blinkxは16日、テレビ番組を24時間蓄積し続けることで、音声認識技術により全文検索できるようにしたサーチ
エンジン「blinkxTV」を発表した。 http://internet.watch.impress.co.jp/cda/news/2004/12/17/5843.html



xdoc2txt 縦書きのPDFは



P
D
F

みたいなテキストにしちゃう orz
これじゃ検索引っかからないよ。。。
>>727
後整形すればいいだけでは?
723名無しさん@そうだ選挙にいこう:04/12/20 11:43:07
>>722
元のPDFはテキスト部コピペできちんと「縦書きのPDF」になっている。
xdoc2txt.exeでフィルタリングすると



P
D
F
になってしまうので、元PDFは整形のしようがない。
ちなみにサーチクロスにて利用。
724名無しさん@そうだ選挙にいこう:04/12/26 08:53:57
>>651
ならワイルドカード使えばいーのかとlookoutで試したら,良さげな感じ.
「全文検索ユーティリティ統一スレッド」って文書に対して
「全文」「統一」だと検索hitせず
「全文*」「*統一*」だと探してくれる.

他のも試してみる.



ヘルプファイルに「テキスト検索」タブがあるやつってあるよね?
あれってどうやって作ってるのかな?
索引作ってるみたいだけど、Winの標準APIにそういうのがある?

サーチクロスいいね。これでPalmのDOC形式も検索できれば最高なんだけど。
サーチクロスで1GB、7万ファイルほどのtxt,htmlを喰わせたら
落ちる落ちる。これぐらいのデータ量だと、別のソフトを使った方が
いいのでしょうか?
やっぱりNamazuかなあ。でもコマンドラインなんて使えないよ_| ̄|○...
>>727
インデックスを分ける。
また、インデキシングは数回に小分けして行う、などの対策が有効かと。
>>727
namazuならブラウザから使う方が簡単でいいよ。
>>727

2000円のソフトに業務用レベルを求めるのが間違ってるような・・・・・
1GB、7万ファイルって業務用レベルなの? 煽りじゃなくて純粋な質問。
これぐらいならWEBの自動巡回ソフトでニュースサイトを根こそぎさらえば
すぐに溜まる量だと思うんだけど。
気に入った WEB サイトがあると(無くなるのが怖いので)すぐに根こそぎ
コピーする癖のある漏れの場合、

ファイル数 : 約 130,000
容量   : 約 1.7GB

だった。参考まで。
2500ファイル
10GB

で問題ないですよ。メモリが糞の可能性があるとか?
俺はUSB経由で100GBをバックアップしようとしていつもシステムダウンしてた。
糞メモリを引き抜いたら治った経験がある。
メモリスレで勉強した。
734名無しさん@そうだ選挙にいこう:04/12/30 11:06:38
>>732 おまえか!全部持っていったのは!
かえせよ〜 あれ、かえしてくれよ〜

>>733 とりあえず memtest86+ だな。
メールを1メール1テキストファイルで切り出している人なら、
軽く万は超えるんじゃない?

うちは5万ぐらいあったと思う。
>>731
自分中心に考えられても・・・
>>736
お前中心に物言われてもな
世界の中心は俺だと叫んでみるテスト
で、サーチクロスの限界はどれぐらい?
GB超えたらナマズの方がいいのかな。
なまずでデスクトップ検索できるの?
「サトリ」のページ、死んでいない?404になってしまう。
何かあったか?開発中止なのか?
もうほっといてやれよ・・・
デスクトップ以外も検索すんのになんで「デスクトップ検索」っていうん?
この場合のデスクトップは「ローカルコンピュータ」って意味合いだろ。
うほ、なまずインストールすら出来ねえwwww
c:\以下をインデックス対象にすればnamazuでもデスクトップ検索はできる。
絶対にやろうとは思わないけど。
>>698-701
興味があったので、Justsystemに問い合わせてみた。
サポートからの返信は、以下の通り。
==================================================
『ConceptSearch』につきましては、ご指摘の通り、
法人様専用ライセンス製品となっております。
残念ながら、個人様ではご購入いただけない製品でございますので、
所属される法人名義でお申し込みいただくか、屋号などの
個人事業主名があればお申し込み可能です。
なお、個人向け製品の販売については、
ご要望としてお承りしたいと存じます。
================================================
748名無しさん@そうだ選挙にいこう:05/01/01 14:02:16
インターネットブーメランで大量に不良在庫抱えた(かどうかは知らないが、そうだとして)から
慎重になってるのか?

ダウンロード販売でもいいから個人にも売れよな

いまさら三四郎復活させたりとか
やってることがめちゃくちゃなんだよ!
所詮は浮川の個人商店だからな
まー、shurikenも一時期は開発停止してたくらいだからね。
個人的にはshurikenに同梱して欲しい>ConceptSearch
751名無しさん@そうだ選挙にいこう:05/01/01 15:21:17
>>747
お 屋号で可?
うち休眠自営業があるからそれを使って・・・
でもdocuworksも捨てがたいんだよね。
ダウンロード販売なんかしたら
法人版にも影響が出ると思うが・・・
Namazuで素直に日本語ファイル名のファイル開けたら
文句なしなんだけれどね

わけのわからん奴がいるみたいで、いっこうに修正して
くれないんだよねぇ。

あれで正しい動作とかなんとか抜かしている。
全く、英語のファイル名をつければいいじゃんとかぬかす。

利便性の利の字も奴らにはない。
ちょっとカスタマイズすればいいだけなんだから・・・
Namazuでhtmlを取り込むと、一部のファイルが未対応の形式となって
読んでくれない。なぜ?
756名無しさん@そうだ選挙にいこう:05/01/02 21:19:58
FileDiver最強
自分でなんとかできないなら、
簡単な市販ソフトつかったほうがいいぞ
758名無しさん@そうだ選挙にいこう:05/01/03 01:02:00
全文検索ソフトって、インデックスの作り方とか
検索の際のシソーラスとか、中身が詳しく説明されて無いと、
予想不可能な検索漏れがでて困るよね。
大抵は説明されてるから
問題ないのでは?
読まない奴が悪い
あんなの読む方が頭おかしい。
761名無しさん@そうだ選挙にいこう:05/01/03 16:54:25
>760
よかったね。
>>760
そうですね
その通りですね
763名無しさん@そうだ選挙にいこう:05/01/03 18:10:07
>>759 異体字の同一視とか、検索時のシソーラスとか、
形態素解析の癖とか、説明されていないものが多いと思う。
>>763
例えばどのソフトですか?
サーチクロス 2100円 (オンライン版)
ConceptSearch 7000円 (ライセンス5000円、ディスク2000円)
DocuWorks 6.0 14200円 (新規)

どれを選ぶ??


docuworksに7000円のconceptsearchが入ってると思えば安いけど、
他の機能を使うかどうかわからんし。。。
766名無しさん@そうだ選挙にいこう:05/01/04 03:18:52
>>765
DocuWorksは便利だよ
OCRも付いてるし、6.0からAcrobat Elementsも同梱されるし
かなりお買得だと思う
他の機能も買えば使うようになるさ
ConceptSearchとGoogleが出そろうまでは様子見。
サーチクロスはザクザク落ちるから、何でもため込んで検索しようという用途には
向かない。
ちょっとした業務用の資料を検索するぐらいならいいだろうけど。
今ならなにを使うのがいいんだ?
出るまでまってられないんだが・・・
>>768
namazuだな
ConceptSearch まじ期待している。
771名無しさん@そうだ選挙にいこう:05/01/04 22:25:17
docuworksスレ覗いたけど便利そうなソフトだね

【ファイリング】ゼロックスのDocuWorksってP2
http://pc5.2ch.net/test/read.cgi/bsoft/1080963577/
SOHOとかだとすっごい便利そう。DocuWorks
773名無しさん@そうだ選挙にいこう:05/01/04 22:42:12
>>770
まだ続いてるのか。
インターネットブーメラソと、他の自動巡回&ダウンロードソフトと組み合わせて、
ダイヤルアップの頃は重宝したなあ。
>>772
すっごい便利ですよ。1万3000円くらいの投資で事務員一人分年間最低200万円は浮きますね。
772 名前:名無しさん@そうだ選挙にいこう[sage] 投稿日:05/01/04(火) 22:26:53
SOHOとかだとすっごい便利そう。DocuWorks

774 名前:名無しさん@そうだ選挙にいこう[sage] 投稿日:05/01/05(水) 01:24:31
>>772
すっごい便利ですよ。1万3000円くらいの投資で事務員一人分年間最低200万円は浮きますね。
体験版期限一杯使って結構便利だと思ったけど
下っ端だから導入提案できない > DocuWorks
777名無しさん@そうだ選挙にいこう:05/01/05 13:50:08
最寄の上司にメール投げてみろよ。
活用事例とコスト計算を3ページくらいにまとめてさ。
2chのdatを変換なしで、まともな形で解釈してくれる全文検索ソフトは
サーチクロスだけ?
Namazuのフィルタって無いのかな。
ナマズスレいけ
あった気がする
780名無しさん@そうだ選挙にいこう:05/01/06 11:33:23
ConceptSearch には期待しているけど
あのドキュン社長のことだから
インターネットブーメランのようになるのは目に見えてる

と言ってみる
Namazuを入れた。1GBのHTMLのインデックスを作るのに
Athlon XP 1800+で12時間。
だけど精度が出ない。しょうがないからkakasiの辞書から作り直し。
そのためにATOKのユーザー辞書を再編中。何か泥沼……
そんなもんだ
KWIC FinderならMicrosoft Index Serviceが使えるし、軽くていいと思うんだが
このスレではほとんど話題にもならないな
>>783
サービス起動を敬遠しているのかも。
ウチもメモリ貧弱だから辛い。
>>784
なるほど
確かにIS+Nortonだと1Gのメモリ積んでても辛い時が…
色々試したけど、Index Serviceが早くて確実で機能も豊富で安定していて
使いやすくていいような気がしてきた。
787名無しさん@そうだ選挙にいこう:05/01/07 10:53:14
>>781
> kakasiの辞書から作り直し。
> そのためにATOKのユーザー辞書を再編中。

やり方おせーて
検索もできないのか。
ナマズ難しい。Unixなんて使ったこと無い俺にはインストールすら困難。
ようやく動くようになって最初に作ったインデックスが、ナマズMLのログ。
これで調べながら設定を作り込める。。。
そういう人にはサーチXがいいと思います。
時間をかけるかお金をかけるか出来る方をすればいい。
793790:05/01/07 23:42:44
>>791
サーチは気に入っているんだけど、ファイル数が多すぎてインデックス作成中に落ちる。
3万円ぐらいで、100GBぐらいのファイルをインデックス化出来る上位版を出して欲しい。
>>793
そらやすすぎw
795名無しさん@そうだ選挙にいこう:05/01/08 12:56:01
>>793
抽出単語数はどれくらいになってる?
うちとこは300万語くらいになってるけど落ちないよ。

インデックスを分けるか、作成時に小分けして作ってけばいいと思う。

MSN、デスクトップ検索戦争に参戦--MSN Toolbar Suiteベータ版公開
ttp://japan.cnet.com/news/media/story/0,2000047715,20079652,00.htm
↑Longhorn搭載予定とのことだけど、もうIndexServiceは無くなるってこと?
 それともIndexServiceの新クライアントと言うことなのかな?
796790:05/01/08 17:32:58
NAMAZU馬鹿杉。全然関係ないファイルが引っかかる。しかもトップに。
飼い主に似るんだなw
>>796
馬鹿は何使っても一緒だってば
サーチクロスもナマズも馬鹿だろ。つーか、インデックス型なんてつかえねー
取りこぼしが酷すぎて、仕事にならねえ。馬鹿にはちょうどいいんだろうけどwww
と、1週間風呂にも入らずエロゲばっかりやってるヒキのキモヲタが申しております。
全文検索出来る時間があるんですね^^;
それとも大した量じゃないのですか?
802名無しさん@そうだ選挙にいこう:05/01/09 11:40:55
NAMAZUは、検索語が沢山あったページを優先して表示するのかな?
>>802
マニュアル読んだ方がいいよ。
サトリはVectorからも消えてしまった。
HP更新が無くてinfoseekからデリられたんじゃなくて、作者が自発的に消したってこと?
久々にいいソフトに出会えたと思ってたのに・・・残念。
805名無しさん@そうだ選挙にいこう:05/01/09 17:43:50
サーチクロスを使っとるんじゃが、Acrobat Web Capture 4.0 (Acrobat4.0仕様)で
作成したPDFを読めるフィルターはないものかのう。
サーチクロスのデフォルトフィルタも駄目、xdoc2txtも駄目。。。
>>802
まだインストールしてなくても
そんな質問する君には使いこなせないからやめたほうがいい
>>805
馬鹿には使いこなせないよ
>>805
やめろ厨房
809805:05/01/10 19:40:18
>>807-808
答えられないんなら出てくんなゴミ虫野郎が。
「ぼくは無能だから分かりません」とはっきり書けやピロロ菌どもが!
(´∀`)ぴろろろろろ
(゜∀゜)アヒャヒャ
サーチクロスのインデックス作成機能は下痢便ウンコだが、ひらがなを
認識させないと普通のうんこぐらいにマシになる。
分かち書きのアルゴリズムが腐ってるんだろうな。
サーチクロスは基本的に「漢字」「カタカナ」「アルファベット」を抽出してインデックスを作ってるでしょ。
おかげでインデックス作成速度がバカッぱやなわけで。
>>812
>分かち書きのアルゴリズムが腐ってるんだろうな。
そういう問題じゃないと思うぞ
サーチクロスは形態素解析使ってない。
だから辞書も(ひらがなを除いて)持っていない。

上の文章だと「サーチクロス」「形態素解析」「辞書」「除」「持」が抽出される。
「解析」で検索かけると全ての索引を1文字単位でサーチして「形態素解析」を見付ける。
だから検索は遅い。
やっぱり通はGREP。
精度はピカ一だ
同意。index型は信用できない。
>>816
遅くて仕事にならんな
>>815
あれ、「解析」なら「解析」でインデックスを探すはず。
「分かち書き」なら「分」と「書」で検索するけど。
βακαには見えないインデックスです
米Yahoo、デスクトップ検索始めました
http://desktop.yahoo.com/
デスクトップ検索流行ってるな。
サーチクロスも「VC Desktop Search」と名を変えフリーで提供しる!
うえでちょっと話題になっていたIndexServiceをKWIC Finderで使っているのですが
これはPDFはインデキシングできないんでしょうか?IFilterも入れてみたんですが
無料の検索ソフトがこれだけ出ると、有料のソフトは大変だな。

今のところは日本語に弱いってのが不利だけど、
これを解決されたらますます・・・
無料の検索ソフトがどうというより
割れが一番の問題です。
まあねぇ。
もっとも無料のソフト群はBecky!その他日本製のメールソフトに対応してくれるような気がしない。
どーせOutlookとOutlookExpressだけでしょ。

あるいはDocuWorksとか2chログとか。

>804
本当に残念だ。作者のfhew氏、ご苦労様。
828名無しさん@そうだ選挙にいこう:05/01/15 11:57:41
CD-R等のリムーバブルメディアにインデックスごと検索対象文書を保存できるシステムって
もっと容易・安価にならんもんかね?
フリーのデスクトップサーチがリリースラッシュになってる今こそ
有料の検索ソフトには一考してほしい。

……つうか今のサーチクロスとかでもインデックスからのファイル参照を
絶対ディレクトリじゃなく相対ディレクトリにすれば済む問題なのになぁ。。。
リムーバブルメディアだと検索が遅すぎて使えないって
830名無しさん@そうだ選挙にいこう:05/01/15 16:45:05
げっ、サトリなくなってたのか...or2
フリーでXDWも検索できるし、究極の検索ソフトだったのに…
なくなっても別に困らんし・・・
>>831
DocuWorksの文書はインデックスサービス用のIFilterをMSが配ってるから、
それ入れてインデックスサービスで我慢しな。
>>833
d...  (;_;)
サトリ
の書
837名無しさん@そうだ選挙にいこう:05/01/22 21:13:36
サトリってもうどこでもダウソできないの?
>>837
残念ながらそのようだ。
web.archive.orgも見てみたけど、DLはできんかった。

fhew氏、もったいないよ。週アスでも紹介されたばかりだったのに。
あらら、やっぱり。 ほんともったいないですわ。
紹介されたからやめたんだろ。
841名無しさん@そうだ選挙にいこう:05/01/23 02:01:07
842名無しさん@そうだ選挙にいこう:05/01/23 02:03:56
オンラインソフトは、わけわかんない人から変なメールたくさん来るからなぁ。
844名無しさん@そうだ選挙にいこう:05/01/23 18:31:12
ConceptSearch は結局パッケージ販売はしないのかなぁ・・・

ジャストシステムのことだもんな
やるわけねぇか
製品戦略も中途半端でポリシーがないもんな
>>844
いやポリシーはあるが金がない
846名無しさん@そうだ選挙にいこう:05/01/24 12:53:19
Spotlight
http://www.apple.com/jp/macosx/tiger/spotlight.html
コンピュータの中のあらゆる場所から、あらゆるものを一瞬で検索。
http://www.apple.com/jp/macosx/tiger/searchtechnology.html
>>846
これ、こないだ出たちっちゃなMacにもインストールできるのかな。
ちょっと使ってみたい。
>>847
ちっちゃなmacも次期Tigerに対応しているから使えるよ。
特定の文字列を検索したとき
その真下にある行も
抽出したい場合はどんな
ツール使えばよいですか?
>>849
意味不明
>>849
perlで一発
>>849
エディタのマクロ
ワードのVBA
>>844
やるみたいよ?

> 「ConceptSearch(コンセプトサーチ)」を、3月4日(金)から店頭にて販売開始します。
> 希望小売価格は、8,000円(税別)です。
http://www.justsystem.co.jp/news/2005f/news/j01251.html
855名無しさん@そうだ選挙にいこう:05/01/25 15:28:28
いまの個人向けに市販されてる全文検索ソフトって、
N-gram つかってるんでしょうか?それとも形態素解析
してインデックス作ってるんでしょうか?
それとも他の方法で?
856名無しさん@そうだ選挙にいこう:05/01/25 17:57:38
>>854
きたああああああああああああああ
店頭販売キタ━━━━━━(゚∀゚)━━━━━━ !!
>>855
ソフトによる。
>>855
> いまの個人向けに市販されてる全文検索ソフトって、

現状、サーチクロスしかないからなぁ。
サーチクロスは「カナ・漢字区切り法」とでもいうべきか。

ちなみに昔売ってたQuickFinderはN-gram法、
DiskX Searchは形態素解析使ってた。

>>854
このスレで散々インターネットブーメランの評価を聞いてきたからには
買わずにはおられないな。
でも*.mhtや2ちゃんログに対応してるのはサーチクロスだけだから
これも手放せない。。。orz
検索結果は画面中央にオフセットしてほしい。
ログ検索なんかだと、ヒットした文字が画面の一番下/上の行に
張り付いてるより見やすいと思うんだけど。
サクラエディタのF3にはこんなのを設定してる。
S_SearchNext('')   // 次を検索
S_CurLineCenter( ) //カーソル行をウィンドウ中央へ
861名無しさん@そうだ選挙にいこう:05/01/25 21:59:00
>>859 THX いちおう N-gram のものもあったのか。
Namazu つかってるんだけど検索洩れが気になって…
仕事では BizSearch つかってて検索洩れはほとんどないけど、
これって個人で使うようなものじゃないし。

DocuWorks ってたしかなにか全文検索ソフトがついてたよね。
Concept Search だったけ?
>>861
> Concept Search だったけ?
そうだよ。

N-gramには一応検索漏れはないけど、ノイズが多い。
あと、前述のQuickFinderは「検索ワードは2文字以上」という
決まりがあった。(当たり前だけど)
だから「桐」とか「犬」とかは検索できなかった。
元インターネットブーメランユーザとしてはとりあえずConcept Searchは買うぞ。

2ちゃんログは・・・ぶつ切りしてhtmlに変換するスクリプトでも書くか。
インターネットブーメランをWindowsXP SP2にインストールしてみた
なんかエラーが出て動かない

Windows2000にインストールしてみた
起動するが根本的に使い方がわからないorz
865名無しさん@そうだ選挙にいこう:05/01/26 02:40:46
>>862
ExpandFinderって「DocuWorks文書の検索に最適な仕様にカスタマイズした」
ってリリースにあるけど、XDWしか検索できないとかじゃ・・・ないよね?
866名無しさん@そうだ選挙にいこう:05/01/26 08:18:32
メーラーとか一部のファイルが検索できないだけ
基本的には ConceptSeach でサポートしてるほとんどのファイルを検索できるらしい
質問です。過去ログを読むと、ちらほらと

>>861
>DocuWorks ってたしかなにか全文検索ソフトがついてたよね。
>Concept Search だったけ?

>>862
>そうだよ。

という書き込みがあるのですが、デモ版のDocuWorksにも
Concept Searchが付属してるのでしょうか?

先ほどからデモ版DocuWorksを使い始めたのですが、
「検索(全文検索)」らしき機能は確かにあったのですが、
この機能がConceptSearchなのかどうか、よく分かりません
でした。

ハッキリと「CoceptSearchを使うにはココをクリックせよ」
みたいなインターフェースになってるんでしょうか?
Concept SearchとAcrobat Elementsが付属するのはDocuWorks6.0
現行のDocuWorks5.0には付いてない
な、なるほど。
まだ出てないのですね…。
早とちりしてました。

(だから、過去ログでConceptSearch単品で買うか
CSも含まれているDocuworksを14000円くらいで
買うか悩む、みたいな書き込みがあったのかな)

とりあえず、ConceptSearchの発売待ち、でしょうか…。
3月まで、は長いなー…。
870865:05/01/26 12:52:36
>>866
d。 それはいい事教えてもらいました。 とりあえずDocuworks買ってみます。
871名無しさん@そうだ選挙にいこう:05/01/26 12:55:42
(ジャストシステム)きたか
872名無しさん@そうだ選挙にいこう:05/01/26 15:57:39
こんどまた一代限りで終わらせたら
今後ジャストシステム製品は買わない
一太郎みたいに1年に1度バージョンアップされても困る
>>872>>873

ワロタ 確かにどっちも困るw
うちはまだ一太郎13とオフィス2000だ・・・
新しいのを買う気力が起きないんだよな・・・
876名無しさん@そうだ選挙にいこう:05/01/26 16:39:00
でもあまり売れなそう…
877名無しさん@そうだ選挙にいこう:05/01/26 18:16:55
ファイル数が多くて一つの文章も長めなのがおおいような人には
ConceptSeach はいいんじゃないかな

文書要約できる(と思う)し、
検索した文書を抽出条件にしてさらに精度の高い類似文書を探し出せる
(はず。でないとインターネットブーメランより機能低いやん)し。

ただ、ピッタリある文書を探すんじゃなくて「類似文書」を探すソフト
ってことを意識しておいた方がいいかな
878名無しさん@そうだ選挙にいこう:05/01/26 18:18:14
なるほど。>>877は賢いな。

Niftyやってて数百MBのログが溜まっていた俺にとって、インターネットブーメランは驚異のソフトだったな。
カッターの定義ファイルを書けば大抵のメーラには対応したし。WZ MAIL用のカッター書いて使ってた記憶がある。

出荷バージョンの品質の低さには悩まされたが(月例パッチの2〜3回目くらいまではとにかく安定しなかった)。
当時インターネットブーメランを入れたPCが今でも現役で、これを書いてるんだよな・・・
ソフトばかり新しくしないで、元となるPCも新しくしないとな。

と今ふと思った。
2chログの検索が出来るのはサーチクロスとKWIC Finderだけ?
2chのdatってタダのテキストファイルだろ。対応もクソもあるかよ。
>>882
m9(^Д^)プギャーッ
釣り?datファイルがテキストファイルなわけないじゃないか。
885名無しさん@そうだ選挙にいこう:05/01/28 08:21:24
dat を直接見たことあるけど
ただのテキストファイルだったよ

ちなみに、どうせまたアホがでてくるのは明白なので言っておくと
おれは >>892 じゃないから
886名無しさん@そうだ選挙にいこう:05/01/28 08:39:25
>>882 だった
エディタで文章はみれるけど
そのままだとわけわからないよね。
エディタで見れても拡張子がdatだとソフトの検索対象から漏れるから
結局意味がないってことなんじゃないの?





と言って見る。
889名無しさん@そうだ選挙にいこう:05/01/28 18:06:39
改行コードがWin標準のやつ(ど忘れ)じゃないだけな
>>889
CR+LFだろ。
つうか中身がテキストなら.htmも.vcsも.emfもそうじゃろ。
だからって全文検索でテキストファイルと同じ扱いしたらあかんじゃろ。
ビューワが整形してくれないと。
891名無しさん@そうだ選挙にいこう:05/01/28 20:04:22
ていうか、2ちゃんの掲示板は1レスが短くて中身がないものが多いから
ConceptSearchでの検索には向かないと思うよ

普通にキーワード検索の方がいいかも
892名無しさん@そうだ選挙にいこう:05/01/29 16:17:23
WinFSは登場しないかもしれない――?
http://www.itmedia.co.jp/news/articles/0409/13/news010.html
調査会社米Gartnerのアナリストらによれば、米Microsoftは次世代
Windowsから「WinFS」を除去すると発表したが、リリースが大幅
に遅れているこのプロジェクトをリリースしないという選択肢を選ぶ
可能性もあるという。

アップルが「Spotlight」で特許を取得──申請は2000年1月
http://www.macobserver.com/article/2005/01/27.10.shtml
アップルの「Spotlight特許」の概要は次のように記されている。

「様々な場所にある情報に数々の技術を通してアクセスすることの
出来る統一されたインターフェースにより、ユーザーが入力した
様々な記述に関連する情報の細目へ簡便にアクセスすることを提供
する。ユーザーが入力した情報の記述を操作する多数の発見的アル
ゴリズムを用い、選択あるいは検索された情報の候補を表示し、
位置を示す。このように、サーチエンジンの長所を活用しつつ、
関連性のある情報の候補だけをリストアップする。」
Tigerに搭載されるSpotlight機能が5年も前から開発されていたこと
がわかる。

Mac OS X - Tigerプレビュー - Spotlight
http://www.apple.com/jp/macosx/tiger/spotlight.html
>>892
UNISYSのLZW特許より酷いな。
そんなもので特許を申請するかな、普通…
説明してほしい・・・
良く分からん。
>>894
金はあるのか?
酷くない特許ってありますか?
>>892
漏れは車輪を発明しましたと言ってるようなものだな。
ここまでアホなのは他にない…ブリティッシュ・テレコム以外にはない。
車輪というか・・・

「調べたい事柄が本のどこにあるのか、簡単に調べる方法を発明しました。索引です。」

だな。
まぁ、、、ブランコの乗り方で特許がとれる国だからな・・・ あの国は。
ああ、BTな。
あれは大顰蹙だったな。
justsystem自身でconceptsearchのことを「デスクトップ検索ツール」って言っているんだ。
日本の特許も見てみると
かなりおかしいぞ
902名無しさん@そうだ選挙にいこう:05/01/31 01:42:38
WEB検索も著作権侵害に当たりそうな勢いだね
なんで著作権が出てくるんだ???
【請求項1】
情報識別子を入力し、
前記識別子にマッチする情報を見つけるために異なる発見手法を
各々使っている複数のプラグイン・モジュールに前記情報識別子に供給し、
前記モジュールから少なくとも1つの情報候補アイテムを準備し、
前記情報候補アイテムの代表を表示する、
ことを特徴とする、コンピュータシステムにおいて情報を見つける方法。

こんな感じかなあ。違ってたらなおして。
4行目は「を供給し」だった
Appleの特許は、OS組み込みだけに影響するようだ。
Windowsのメタデータ検索は開発中止。
907名無しさん@そうだ選挙にいこう:05/02/01 20:35:55
今日判決がでた一太郎に対する松下の訴訟もかなり香ばしいぞ。
908名無しさん@そうだ選挙にいこう:05/02/01 20:38:59
松下が我々の(?)ConceptBaseを狙っているな。
マイクロソフト:「Windowsへのデスクトップ検索技術搭載は急がず」
http://japan.cnet.com/news/media/story/0,2000047715,20080393,00.htm

独禁法絡みとか言ってるけど、絶対、アップルの特許のせいだよね。
Spotlight 使ってみたいなぁ。
911名無しさん@そうだ選挙にいこう:05/02/02 00:13:45
これからのビジネススキルとして求められるのが「仕事のナレッジ
ベースづくり」。2005年前半に出荷が予定されているMac OS X
TigerのSpotlightを使えば、お使いのMacが驚くほど“有能”なナレッジ
ベースに早変わりします。
たとえば「中国の自動車市場」についての情報を引き出したいなら、
Spotlightで「中国 自動車市場」と検索します。すると、関連する
Word書類やMailメッセージ、成長率を表すグラフ画像など、さまざま
なフォルダに点在しているファイルをすべて見つけ出します。
この検索結果を「スマートフォルダ」として保存すれば、後から関連
するファイルが作られた場合も、自動でフォルダに反映されるのです。
http://www.apple.com/jp/macosx/tiger/spotlight.html

OSレベルでメタデータ検索エンジンを搭載できるのは、Macだけ。
>>911
「中国の自動車市場」
   ↑
こんな文章、絶対検索しない
どうせMSに真似されて終わりだろう。
914名無しさん@そうだ選挙にいこう:05/02/02 02:16:34
WinFSは登場しないかもしれない――?
http://www.itmedia.co.jp/news/articles/0409/13/news010.html
調査会社米Gartnerのアナリストらによれば、米Microsoftは次世代
Windowsから「WinFS」を除去すると発表したが、リリースが大幅
に遅れているこのプロジェクトをリリースしないという選択肢を選ぶ
可能性もあるという。

アップルが「Spotlight」で特許を取得──申請は2000年1月
http://www.macobserver.com/article/2005/01/27.10.shtml
アップルの「Spotlight特許」の概要は次のように記されている。

「様々な場所にある情報に数々の技術を通してアクセスすることの
出来る統一されたインターフェースにより、ユーザーが入力した
様々な記述に関連する情報の細目へ簡便にアクセスすることを提供
する。ユーザーが入力した情報の記述を操作する多数の発見的アル
ゴリズムを用い、選択あるいは検索された情報の候補を表示し、
位置を示す。このように、サーチエンジンの長所を活用しつつ、
関連性のある情報の候補だけをリストアップする。」
Tigerに搭載されるSpotlight機能が5年も前から開発されていたこと
がわかる。

Mac OS X - Tigerプレビュー - Spotlight
http://www.apple.com/jp/macosx/tiger/spotlight.html
しかしまぁ、検索機能だけでMac使うやつってそうはいないと思うけどな。
ああ、サトリ使ってみたかった・・・
誰かうpってホスィ
ttp://www.katsakuri.sakura.ne.jp
917名無しさん@そうだ選挙にいこう:05/02/03 20:54:12
ジョブズ氏:複雑な技術を簡単に使えるようにすることがアップル
のコア
http://www.appleinsider.com/article.php?id=832
Apple Insiderは基調講演後に行われたCNBCのジョブズ氏へのイン
タビューの内容を伝えた。

「コンピューター界はますますメディアへと向かっていて、メディア
はデジタル音楽の出現でますますコンピューターへと向かっている。
その二つは中間で遭遇しているようなものだ。アップルのコアは、
複雑な技術を我々人間にとってどのように使いやすいものにするか
を考え出すことだと思う。」
いいこと言うなぁ(´∀`)
>>916
↓ここにあげたよ(uporg38960.zip)
http://www.uploda.org/
>>917
全文検索以上の検索も、なにもわからない素人でも使えちゃうんだろうな。
ジョブさんすごいよ。まじで。
921名無しさん@そうだ選挙にいこう:05/02/04 14:46:41
米Yahoo!、キーワード入力が不要な検索ツール「Y!Q」ベータ版を公開

CBみたいな方法だ
>>919
916です。いただきましたーアリがd
同じインデックスサービスを使っているのに、サトリだと標準の検索より
断然早い。なせ?
サトリここにきて人気だな
同じくインデックスサービス使うのではKWIC finderとどっちがいい?
とりあえずNamazu入れてみた
とりあえずTiger待ちかな。なんもしないでお気軽に使えそうだから、
Tiger出たらMac買ってみるよ。
楽天に concept searchがチラホラ出だした
送料高いな,ォィ
>>783
このスレまともに読んでいないだろ?
一ヶ月も前のレスに突っ込んでも仕方ないが
929名無しさん@そうだ選挙にいこう:05/02/06 11:42:33
ConceptSearch って3月発売だよなぁ
JoshinのJ&Pテクノランドでまた 10&引き&10%ポイント還元やってくれないかなぁ
ちょうど決算前だしちょっと期待しちゃう
>>928
なんで?
理由も書いてほしい
話題になってるからじゃないの
932名無しさん@そうだ選挙にいこう:05/02/07 22:57:37
久々にファイリングソフト使ってデータベース更新しようとしたら

"0x73d2bd9b"の命令が"0x010c01d3"のメモリを参照しました。メモリが"read"になることはできませんでした。

なんて言われてちっとも機能しなくなっちゃいました。('A`)

ソフトはやさしくファイリング6で、最新版にアップデートもしてあります。
フォルダを追加しようと「デスクトップ」をクリックすると上記エラーが出て、ソフトが強制終了です。
再インストールもしてみたけどだめ。全く同じ症状。('A`)

最近いじった所と言ったらDVDドライブ換装したのとサービスの設定を変えた事位。
ウイルスバスターがテレフォニー有効じゃないと使用できないみたいに、
何かサービス切ってたら動かないのかな?
メディアドライブのホームページで探してみたけど見当たらないし。('A`)

やさしくファイリング結構使いやすくて気に入ってたんだけど誰か知らないですか?('A`)
やさしいのは、OS組み込みのTigerのやつだと思う
Kwicいいね。独自のインデックスは時間がかかりすぎたり、途中でエラーになったりで自分的にはダメだったけど、Indexing Service と組み合わせてフォルダの絞り込みしたら速い。

>>932
以下を試してみる
1.メモリチェックする
2.スペックを上げる
3.常駐ソフトの見直し
4.OSの再インストール
デフォが明朝体ってことは中国系の人が作者?
最近、変な奴が紛れ込んでるな
そうだね
938名無しさん@そうだ選挙にいこう:05/02/08 18:08:55
Shuriken Pro4 VerUP版&ConceptSearchセット MyShop価格 8,400 円(税込)
https://www.justmyshop.com/app/servlet/item?item_code=2640372&idt_tag=512

Shuriken Pro4&ConceptSearchセット MyShop価格 9,975 円(税込)
https://www.justmyshop.com/app/servlet/item?item_code=9001845&idt_tag=512

ともに店頭販売せず

939名無しさん@そうだ選挙にいこう:05/02/08 18:14:28
>>938
添付ファイルの中身も検索できるとはすごいな。
早く発売されて人柱報告が出てくるのが待ち遠しい。。。
940932:05/02/08 20:21:15
>>934
I/Oバッファ変更したよ。そういえば。('A`)
バッファ下げてみる。

ありがとう。
>>940
それだ! m9(`・ω・´)シャキーン













( ゚Д゚)……I/Oバッファって何?
942932:05/02/09 00:05:30
原因判明しましたのでここに報告いたします。

原因はやさしくファイリングの設定でした。

「ツール」-「環境設定」-「表示」-「サムネイルの初期表示状態」で、「文書内容で分類」を選び、
その上で「デスクトップ」をクリックすると起きます。

対策は同設定画面で「分類しない」を選択し、一旦やさしくファイリングを再起動し、
「表示」-「サムネイル分類」-「文書内容」を選択して各フォルダに設定していけば良いようです。

「サムネイルの初期表示状態」で他の設定は試してみてませんがとりあえず使えるようになって良かったです。

メモリのI/Oバッファを戻してみたり、
縮小版のアイコンサイズ変更がだめだったかな〜って戻してみたり、
レジストリソフトやサービスとにらめっこしてみたり、
再インストールすること3回。
昨晩今晩のいわば自由時間(自分時間とも言う)を費やして原因がソフト自体とは...

サンプルなしで再インストール&設定ファイルが残ってたんでその設定引き継いだよ便利だねコンボを喰らいました...('A`)
標準インストールしてすぐに使い出したらあまり遭遇しないんでしょうけどね。

ごみレジストリと隠れ設定ファイルを洗いざらい探し出して
全部消した上で普段とは違うアカウントでインストールしてやっと気がつきましたよ。

って、説明書に載ってたりして。では、長文失礼。
943932:05/02/09 00:19:47
板違い&スレ違いですが('A`)
>>941
大容量メモリのパフォーマンスを最適化
でググッたら解りますよ。
944名無しさん@そうだ選挙にいこう:05/02/09 10:17:13
>>938 注文しました。
一番普及してるメーラーってやっぱOutlookExpressとOutlookだと思うんだけど、
Outlookなんて高価な市販ソフトなのに検索機能はきわめて貧弱だね。
アプリ依存の特殊なファイル形式のわりに、メールログは逐次検索……。
3年分くらいたまったら、もう全文検索なんて時間かかりすぎでやる気がなくなる。
Notesみたいに標準でインデックス型の全文検索機能が付いていても良さそうなものなのに。
>>945
日本語に完全対応ではないですがこんなのあります
むちゃくちゃ速いですよ
ttp://www.microsoft.com/downloads/details.aspx?amp;displaylang=en&familyid=09b835ee-16e5-4961-91b8-2200ba31ea37&displaylang=en
サーチクロスで特定のフォルダ以下のファイルだけが検索出来ません。
インデックスの更新&初期化をしてもダメでした。

何が原因だろ???
>>945
> Outlookなんて高価な市販ソフトなのに検索機能はきわめて貧弱だね。

同意。

> Notesみたいに標準でインデックス型の全文検索機能が付いていても良さそうなものなのに。

ジャストシステムの Shuriken は、むちゃくちゃ検索が高速ですよ。
スパム対策やウィルス対策も充実してるので、おすすめ。

  http://www.justsystem.co.jp/shuriken/product/pro4.html
>948

おれもShurikenユーザなので、メールソフトとしておすすめなのは同じだが、

> ジャストシステムの Shuriken は、むちゃくちゃ検索が高速ですよ。 

は無い。別にインデックスを作成するワケもなんでもないから。
だから、おれは仕事関係のメールを検索するためにはサーチクロスを併用
している。


950名無しさん@そうだ選挙にいこう:05/02/10 20:49:03
いま、ふと気付いたんだけど、
ConceptSearch って、インターネットブーメランのユーザに
アップグレード版ぐらい用意してくれてもよかったんじゃないのかと
小一時間・・・・。
IBは内田有紀とともに「無かったこと」になっています
gooがリニューアル 自然言語繋がりで
http://labs.nttrd.com/

>>950
IBを今でも持っている人がいなさそうだな〜
うちはUser's kitの箱ごとまだ持ってるけど。
サーチクロスを使ってますが、コンセプトサーチには期待してもいいですか?
IB持ってますが・・・。

対応ファイルが減ったのと,データベース更新時間の長さに耐えきれず,
つい最近になってサーチクロスに乗り換えました。
アップグレード版ほしい。

そういえば今度のやつはIBみたいに,英語と日本語のファイルを分けて
扱うなんて煩わしさは絶対にないものと勝手に想像。
CBって売方次第でものすごく売れると思うんだけどな〜
売り方 と書いた方がいいと思う
ごめんよ〜 うちのATOKが馬鹿で・・・
958名無しさん@そうだ選挙にいこう:05/02/11 11:47:39
まぁ、サーチクロスとかの検索ソフトけっこう使われるようになってきてるし
インターネットブーメランよりは売れるんじゃないかな
>>957
2005なら売り方になるよ
CB目当てでDocuWorks買ったんだけど、マダとどかねぇ
961名無しさん@そうだ選挙にいこう:05/02/12 18:39:26
>>949-950
そこで Shuriken VerUP 版+ConceptSearch セットの出番ですよ。
 
  https://www.justmyshop.com/app/servlet/item?item_code=2640372

2つ合わせると便利なところは、検索対象のフォルダを選べたりするところ、
かな? (よく分からないです)
>>961
でもこのセットって、
一太郎についてくる手裏剣は対象外なのよね・・・
つーかあんまりセットのうまみがないと思うのはオレだけ?
OutlookのPSTを検索対象としてほしいよ。
ConseptSearchさんよ
インターネットブーメランの問題点

情報ボックス作成の優先度が普通なので処理が重い。
情報ボックス作成中は検索ができなくなる。
メール1万通くらいが一度に作成できる限度。
ShurikenPro3形式のメールボックスが読めない。
作成中にWindowsを再起動すると、情報ボックスが壊れる。

…コンセプトサーチで直っているのかね?
966名無しさん@そうだ選挙にいこう:05/02/13 00:58:32
Shuriken Pro 3 の形式は新しくなってるから当然無理でしょ
一太郎 13 ぐらいまでは、一太郎をインストールしてれば
さりげなく検索できるようにしてくれてたけどな

今度は情報ボックスというのかどうかはしらんが、
当時に比べてCPUの速度もかなり上がってるし
マシになるんじゃねぇの
967名無しさん@そうだ選挙にいこう:05/02/13 09:52:32
>>965
それらの点が直ってるかどうか、週明けに、ジャストシステムに
メールしてみよう!
メールを送るのは別に週明けまで待たなくてもいいのではw
969名無しさん@そうだ選挙にいこう:05/02/13 11:37:00
インターネットブーメランは、一つの情報ボックスに300MBまでだったが
ConceptSearch は制限なしだからな
>969
100GBの情報ボックスとか作れるのかね。
最近のハードディスクだと、その気になれば可能だが。
これがちょっと気になった。
ttp://d.hatena.ne.jp/Genpaku/20050212/p4

972932:05/02/13 20:10:11
全てがスレ違いだったって最近気がつきました。

ここにいる全ての方達にお詫び申し上げます。 _| ̄|○


>>934
>>941
こんな馬鹿の相手してくれてありがとう。
( ゚∀゚)ノドンマイ キニシナイ
>>965
IBの問題点,俺も気になるー!

これに加えて,確か日本語と英語の文書ファイルの検索では
情報ボックスの使い分けがあって,いちいち切り替えなきゃならなかった
のが非常にウザかった。けど,さすがにこれは直ってる・・・よなぁ?
>974
一つ聞きたいが、英語の文章ファイルなんて使うのか?
どういう用途で?
ため込んでる海外の論文とかだが,なんか不思議か?

それとも,そもそも俺の使い方がなんか間違ってるとか?
ま、英語とは無縁な生活な人ってのはいるからね
そういう人にとっては英語の文章を読むなんて考えられないんでしょう
975が想像力がないだけ
ネットじゃ最新情報はほとんど英語だしな。
苦労して読まなきゃいけないときもある。
>>965
>>974
オイラもちーっとも気になったんで,代わりにジャストにきいてみたぞ。

なんでも新しいのじゃ,データベースを更新してつときにも問題なく
検索とかできるって。そもそもデータベースを作るのがもんのすごく
早くなてる。

あと英語と日本語は一緒に探せる。
だけど基本的に日本語検索ソフトなんで英語の検索は「完全一致」のみ orz
形態素解析とかっていうんだっけ?やっぱり日英両方の言葉に同じく対
応するのって,この値段じゃ難しいんかな〜。ちょっと残念っ
>980
グッドジョブ
982名無しさん@そうだ選挙にいこう:05/02/15 11:53:27
ConceptSearch では、そもそもデータベースを作るときに
日本語のデータベースか英語のデータベースかを
設定する項目がない

ConceptSearch のインストーラはあのジャストシステム独自のやつかぁ・・・
嫌やなぁ・・・。
983名無しさん@そうだ選挙にいこう:05/02/15 12:32:09
あー、そうだ

体験版が出たってこと書くの忘れてた
http://www.justsystem.co.jp/conceptsearch/try.html?

VMware で環境作ってそこに入れてみた。
ConceptBaseの威力はインターネットブーメランでわかってるから
実環境にはいれないけど。
人柱ヨロ
早速、Concept Search試用版をダウンロード。
メールフォルダ(1万件ぐらいかな?)を対象にインデックスを作成してみたが、
超遅。

まぁ、最初に新規作成するのに時間がかかる(約1時間)のは多めに見るとして
も、20件ほど新規メールを受信した直後に更新しても、10分以上やってる(途中
で止めたのでどこまでかかるか不明)。
まだよくわからずに使っているが、(俺の操作間違いじゃなくて)本当にこんなに
更新がかかるようじゃ......う〜ん。

ConceptSearchって、「関連した文章」を探すだけでなく
サーチクロスのような普通のキーワード検索もできるんですか?
>986

文章入力が基本だが、一応、単語検索もできますよ。
ただし、いわゆるキーワード検索とは違って、指定した単語それぞれの「重み」を
指定して、その重み付けを評価した検索結果となります……AND検索のつもりで
使うと裏切られます(笑)。


■デスクトップ検索製品について
・ConceptBase
・インターネットブーメラン
・Google Desktop Search
・MSN Toolbar Suite
・サーチクロス

体験版のアンケート。かなりサーチXを意識してるんだな。
CBの検索の仕組みを理解しない人には値段の差がかなりネックになりそう。
>>988
どこから「かなりサーチXを意識」って読み取れるんだ?
>>987
ありがとうございます。
いわゆる一般的な全文検索は満足に出来ないんですね。なら見送りかな。
「関連した文章」が出てくるのも便利そうではあるんだけど…残念。
>>990
試用版を使ってみて判断したほうが良いと思うが
コンセプトサーチを使った感想

更新は相変わらず長いが、更新時の優先度が下げられるので軽い。
ソースファイルが300MBを超えたとかいうメッセージがログに残っているが、元のファイルは6MBくらいしかなかったりする。

ホイールが使用できるようになったので操作性が向上した。
フォントサイズの変更が不可。文字が小さくてとにかく見づらくなった。
画面の配置の変更が不可。
インターネットブーメランの時は3回目のパッチあたりで実用レベルになったから(毎月のようにパッチが出てたような気が)、今回もじっくり見守ります。

あの時期に出ていたジャスト製品は一太郎もATOKも品質的にちと問題があった記憶が。最近は大丈夫なのかね。
あとブックマーク画面もホイールは使用不可
ConceptSearchは次スレを立ててからじっくり話しましょうよ。
というわけで、スレ立てお願いします。
996次スレ:05/02/16 20:20:04
全文検索ユーティリティ統一スレッド part2
http://pc5.2ch.net/test/read.cgi/bsoft/1108552631/

漏れ、間違い修正よろしくお願いします。
乙津
うめ」
ウメさん〜!!
1000名無しさん@そうだ選挙にいこう:05/02/16 23:38:56
1000!
10011001
このスレッドは1000を超えました。
もう書けないので、新しいスレッドを立ててくださいです。。。