∧_∧
ナデナデ (´∀` ) 帰化してから
∧ ∧ ⊂( ∪ ) またこようね〜
<`Д´> (_(_)
〜( _ノ
マカー
以下、「Mac」、「Tiger」、「Jobs」、「Apple」、「iTune」、「iPod」等MacintoshがらみはNG指定。
まく たいが じょぶす あっぷる あいちゅーんず あいぽっど まきんとしゅー
はいはい、もうこないでね。 /
______ _____/
∨
------------- 、____ ウワァァン ヽゝ バカ
/  ̄ ̄ ̄.// ̄ ̄|| |___/\ヽ(`Д´)ノ ヽ(`Д´)ノ
イッテヨシ!.∧//∧ ∧.|| | \ .\(
>>1 )ヽ(`Д´)ノ (
>>1)
[/_________.(゚//[ ]Д゚#).|| | \ \/ヽ (
>>1 ) / ヽ ノ
.||_ ___|_| ̄ ̄ ∪.|.| |___\ \ / ヽヽ(`Д´)ノ ノ
.lO|--- |O゜.|______ |.|_|ニニニニニニl.|ヽ(`Д´)ノ(
>>1) ゴルァ
|_∈口∋ ̄_l______l⌒ l.|_____| l⌒l_|| (
>>1) /ヽヽ(`Д´)ノ
──`--'───`ー'─── `--' `ー' ┐ /ヽヽ(`Д´)ノ(
>>1 )
│ヽ(`Д´)ノ(
>>1 ) /ヽ ノ
│ (
>>1) /ヽヽ(`Д´)ノ
│ ミ / ヽヽ(`Д´)ノ )ジャブーン
│ ;: (
>>1 )’/ ヽ〃、、..
ボシャーン ミ ミ\ヽ(`Д´)ノ /ミ
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~〜〜〜〜~~~~~~~~~~~~~~~~~~~
なぜこうなってしまうのか。
じゃあ WinでもMac でもそこそこ使える Unix系のアプリの話をしようか。
Estrainer ってどうよ?
7 :
名無しさん@そうだ選挙にいこう:2005/07/08(金) 23:44:34
やっと馬鹿どもがいなくなったか。
まだ7が残ってますよw
やっぱTigerの完勝だなw
ほらまたきた
11 :
名無しさん@そうだ選挙にいこう:2005/07/10(日) 07:10:21
オマエモナー
こんな過疎板の過疎スレでなにやってんだ。
オレモナー
前スレで出てたインクリメンタルサーチってN−gramのような感じなの?
もうMacの話はするなよ!絶対するなよ!!
ダブルマックバーガー
>>14 ググルはインクリメンタルサーチしてないでしょ?あれは形態素解析プラスページランクのはず、nゴラムは関係ないよ。
>>16 ご一緒にポテトとシェイクいかが?っていうかピザでも食ってろ(笑)
18 :
名無しさん@そうだ選挙にいこう:2005/07/12(火) 12:37:44
でにMSの検索ツール使えないよな。。。
マックが現状では進んでるのは事実だよな
20 :
名無しさん@そうだ選挙にいこう:2005/07/12(火) 15:07:37
頼むからMacの話題は振らないでくれ!
MacってインクリメンタルMigemo検索できる?
ひどいよ。やめてよってこんなにたのんでるのに。
>>22 >MacってインクリメンタルMigemo検索できる?
できないというかしてない。
しない方が確率高いし、ローマ字インクリメントを含んだこれまでの検索とは
問題にならない速度差がある。次元が違うって感じ。
でた、マカーの姑息ないいわけw
どっちでもいいから、Mac対Winの対決をここでやらんでくれ。民度が知れるぞ。
>>28 ソフトを2種類しかリンクしてないのはなぜ?
マックについて今まで悪いイメージとくになかったけど
前スレとこのスレみてマックが嫌いになりました。
私は全文検索について知りたかったのですが全然情報が載ってません。
マックのせいだと思います。
昔、パソコンが詳しいクラスメートに宿題教えてもらおうとしたらなんか全然興味ないのにベラベラとよくわかんないことしゃべってあげくの果てに家まできてインストールするとかしないとか。
キモいから友達になる気ないし仮にも女で私の家に押し掛けるなんてアリエナイ。
そんなことがあったのを思い出しましたよ。
マックの人も大半はそんな感じなんでしょうね、あーキモい、おぇっ
>>31 そうですね
あなたは正しいですよ
だからもう荒らさないで下さいね
ってかマックってデザインだけはいいよね。
箱だけマックで中身ウインドーズにすれば機能もデザインもばっちりじゃね?
MacはOSのデザインが良い。
スレ違いの話題はそろそろ止めにしなか?
1と2前半は良スレだったのにな〜
37 :
名無しさん@そうだ選挙にいこう:2005/07/18(月) 05:09:48
ExpandFinderってメール検索できないじゃん!
ダメダメだわな。
CS買えって事
立ち読みしたけど、予想通りの内容で飽きた。
てか、2ch巡回してりゃ常識なことばっかり書いてある。
スキン変えるとかWidget入れるとか。
世の中2ちゃん巡回できる暇人ばかりだったらいいんだけどね
グーグルのデスクトップ検索ってインデックス容量は4GBぐらいで
アウトじゃないか
これじゃぁ、使い物にならん
4G以上文章を持ってる人がどれだけいるのかと・・・
100Gあっても足りない人はいるだろうし・・・
>>43 でも、技術系のマニュアルや論文全部合わせたらそれくらい余裕で行きますが。。
>>44 そういう人はGoogle Search Applianceを買えとGoogle様は仰っているようだ。
あれ蓮っぽいから嫌い。
>>44 そんな一部のオタクなんてどうでもいいと思われ
制限があるかぎりオタクは文句言うんだし言わせておけばいいよ
47様が良いことをいいましたよ
そんな一部のオタクなんてどうでもいい。
マックユーザーにぴったりフィットな言葉をありがとう
49 :
名無しさん@そうだ選挙にいこう:2005/07/21(木) 09:38:49
48 名前:名無しさん@そうだ選挙にいこう[sage] 投稿日:2005/07/21(木) 02:47:23
47様が良いことをいいましたよ
そんな一部のオタクなんてどうでもいい。
マックユーザーにぴったりフィットな言葉をありがとう
いいなぁ…ほんといいなぁ…
お恥ずかしい質問なのですが、Tigerの読みってタイガーですか!
それともティガーなのでしょうか?
トラー
家にはPowerMac、モバイルはPowerBook、そしてもちすろんiPod、
ええのぉ
戦車好き>ティーガー
その他>タイガー
ティーゲルだろ
>>50 たしかにすばらすぃ。
しかし"Longhornを超えるか!? "っておかしくね?
もともとMacが圧勝してる部分なのに。。
LonghornではTigerを超えられない。
その次でやっと追いつく。いったいいつになるんだろう?
その頃には、Macは王者Lionになっているぞ。
サーチクロスで十分な俺は勝ち組
grepで充分な俺は帝王。
[スタートをくりく] -> [検索(s)をくりく] ->
で十分な俺は魔王
>58
メタデータ検索なんてLonghornどころか、Windows2000だってできるだろ?
例えばNTFSのファイル付加情報を扱うインターフェイスがあればいいんだから。
今その辺に便利なソフトウェアが無いだけで、OSレベルの問題とは明らかに違う。
検索したいなら、インデックスサービスのフィルタを作ればいいだけだろうし、
ディレクトリツリーに代わるものとして使いたいなら、
ちょっとしたシェルの拡張で充分だろう。
なんでいつも、ソフトウェアとかユーザーインターフェースレベルの話が、
OSとかファイルシステムのレイヤーの話に擦り替えられるんだ?
わざと間違えているのか?
理屈はいーからさっさと使える様にしてください。
64 :
名無しさん@そうだ選挙にいこう:2005/07/23(土) 21:41:38
>>62 同じドザとし恥ずかしいよ
タイガーのスポットライトは従来の検索とは概念が違うんだよ
Windowsは残念ながらこの分野では敗北したんだよ
ってゆうかさ。
俺は主にテキストの「全文検索」がしたいの。
メールやPDFやワードetcも含めて。
なので、全文検索とは関係ない話はスレ違いなので他所でやってください。
Macの方はファイルシステムのレベルでちゃんと考えて作ってあるんだろ?
それにひきかえWindozeときたら、いちいちガリガリやってるから目も当てられない。
何でこんなところでMacの宣伝してんだよ。
何が面白くてAppleの犬みたいなことしてんの?
やめろとは言わないけど、Mac板かOS板でやってくれよ。
REFTだかRAFTだかっていう検索のは有名ですか?
インデックス型とグレップ型両方できるみたいですよ。
DBインストールしたりとめんどくさそう
70 :
名無しさん@そうだ選挙にいこう:2005/07/25(月) 02:10:22
>>68 1からして
>Mac最高 ドザは氏ね
って言ってんのに何でMacネタはダメなの?
検索と全く無関係のカキコに対してならわかるけど。
勝手に1を改変しておいて何開き直ってんだ。
検索にかこつけてMacネタを展開するのがお前の目的・楽しみなんだろうが
Macに興味を持ち始めていた人々まで敵に回し始めたことにいい加減気付いてもらいたい。
俺はWinしか使ったことないけど、このスレみて
マックに興味もったけど。。
だよな〜。たとえ嵐みたいに見えても、こんだけ話題になるMacって
どんなもんなんだろう?って思うよ。
まぁそれでMacを買うかどうかは別問題だけどさ。
おまえらのダメなとこは全文検索話題スルーでマック話するってとこだな。
まあマックがどうこう言ってるのは自演君だから相手にしないほうがいいよ
粘着が約1〜2名貼り付いてるだけ
スルーしましょう。
とりあえず’Macmini買った者ですけど、その後、PowerBookも買っちゃいました。
本格的に移行するつもり。
相手にしてる人はなんでいるんだろ・・・
ID付けて欲しいな。こうなると。
Macの話でもいいじゃん。
それがきっかけで、全文検索がホットになっているんだから。
僕は、いろんな環境での全文検索の実際について知りたいよ。
でもさ、
「概念が違う」とか「ちゃんと考えて作ってある」とか、
糞小学生の糞寝言みたいな糞屁理屈しか書けない糞野郎は、
Win派だろうがMac派だろうがUNIX派だろうが、
もう少し遠慮してくれたらいいのに、と思う。
こういう検索機能のおかげで、こういうファイルを見つけることが出来た、
とかそういう話なら、OS自慢でも構わないんだけど。
【なんだ】Spotlightで見つけた変なファイル。【これ】
> それがきっかけで、全文検索がホットになっているんだから。
そりゃ誰の見解だ?
82 :
名無しさん@そうだ選挙にいこう:2005/07/26(火) 09:00:10
いや煽りでもなんでもなく、本当に不思議なんだけど、このスレ立てた
>>1もMacの優位をうたい、前スレの関連スレにもMacが出てるのにな
んでMacに関連する(もちろん検索関連の)話はダメなのですか?
ダメというか、モラルの問題でしょ。
Macの話題を振ると粘着信者が活性化してスレタイと関係ないOS自慢とWindows批判
を始めるから、しばらくMacの話題は無視しましょうということじゃないの?
84 :
名無しさん@そうだ選挙にいこう:2005/07/26(火) 12:49:05
でもなSpotlightが与えた衝撃は大きいよ
今までリードしていたWindowsをあっという間に抜き去ってしまった。
無視できないのよ
>>84 自演乙
ID導入するまでもなく上げてるのは君だけですから
夏厨以下ですね
グーグルデスクトップサーチとウィンドウズデスクトップサーチ両方使った印象
グーグル
・インデックス容量は4GBでダメ
・検索結果はさすがにいい
・インデックスを作成したいフォルダ指定がめんどくさい
・インデックス作成後も常時更新している(みたい)で意識なく使える
ウィンドウズ
・インデックス容量は不明
・検索結果はイマイチ
・インデックス作成したいフォルダ指定は簡単
・一度インデックスを作成したら、更新するときは最初から全データを改めて見直してるみたいで
更新は時間がかかる(みたい)
・プレビュー画面は便利
正しいかな?
俺としたらどっちもイマイチというのが印象、他に同分野のソフトがないから使ってる、ってとこかな
タダだし
Spotlightはわからん
検索結果が良いとか悪いとかの基準についてもうちょい詳しく聞きたい。
89 :
82:2005/07/26(火) 15:27:17
>>83 なるほろ、それなら良くわかりました。
他スレにもちょくちょく現れる方々wですね。
>>85 84は私ではないですよ。
>>87 Spotlight
・インデックス容量は制限が無い模様
・検索はさすがに高速、結果も文句無し
(結果は完璧。速度も全くストレス無し。これ以上のものは無いでしょう。)
・インデックスを作成したいフォルダ指定の面倒は無い
(デフォルトで指定されてるから。逆に外したい時も、プライバシー設定
ウィンドウに非対象にしたいフォルダをドラッグするだけ)
・インデックス作成はファイル保存と同時
(そのため、アプリや当該ファイルによっては、「保存」がワンテンポ遅れ
る時があるような気がする。)
でかいファイル全体が処理される保証はないけどな。無論もれることあるし。
それって、全文検索じゃないってこと?
Spotlightが全文検索でないとすると、スレ違いになるのだろうか
Googleの奴みたいだな
これか?
>589 名前:名称未設定 投稿日:2005/06/12(日) 09:59:45 ID:75iI3fxg
>
>>584 >内容検索の速度面のオーバーヘッドはディスクアクセスによるものだからマシ
>ンスペックとはあまり関係無い。他のメタデータに比べて大きなインデックス
>ファイルが必要なのもオーバーヘッドです。
>それにSpotlightの内容検索はインデックス検索であって全文検索ではない。
>一部のキーワードを抽出しているだけだし、大きな文書全体が処理される保証も
>無い。Search KitやV-Twinの解説を一度読んでみると良い。
>インデックス検索であって全文検索ではない。
ここでいう「全文検索」とはgrepみたいなやつの事?
>>95 Spotlightは全文+キーワード登録が正解。
検索文章を探して見つからないときは、キーワード一致検索してくれる。
>>95 Spotlightは全文+キーワード登録が正解。
検索文章を探して見つからないときは、キーワード一致検索してくれる。
99 :
名無しさん@そうだ選挙にいこう:2005/07/27(水) 01:08:44
100 :
名無しさん@そうだ選挙にいこう:2005/07/27(水) 01:14:44
インデックス検索と全文検索とキーワード一致検索の違いがわからん。
MSN Desktop Search で新しいタイプの文書を検索対象に加えたいときには、
IFilter を書けばいいの? Indexing Service で認識できるものは
MSN Desktop Search でも認識できる?
Google(デスクトップでなくgoogl.com)を全文検索システムとして認めるなら、
インデックス使ってても全文検索って言えると思うんだけど。
「記事の全文を検索対象とする検索機能」というのを全文検索の定義したとして、
全文とは何かということが問題になる。
・メールのヘッダは含めるのか
・OLEの属性やリソースフォークは含めるのか
・ACLの属性は含めるのか
といったことについては、ユーザの要求によって変わるので、固定的に定義できない。
つまり、検索対象の範囲や、検索洩れの多い少ないは、程度の問題だということ。
ある製品がたまたま自分の要求に合ってないからって、「こんなの全文検索じゃない」
とけなすのは厨房の振る舞いと言わざるを得ない。
大文字と小文字や片仮名と平仮名を同一視するとか、漢字を読みで検索するとかいう
技術も考えると、全文検索は単なるパターンマッチング以上の技術であることがわかる。
grep型に固執する人々はちょっとオールドタイプな感じでしょう。
というか、grep型(逐次探索)で大規模な検索システムを実用化するにはかなりの
分散処理が必要になるのはちょっと考えればわかるでしょ。このスレで語られている
ような個人利用のシステムでそれを期待するのは無茶だって。
個人的には、N-gram型のインデックスがこれから流行ると思っている。
最低限、基本となる本文全体が対象として保証されていないと全文とはいえないのでは
だから、その本文の定義が曖昧だっての。
105 :
名無しさん@そうだ選挙にいこう:2005/07/27(水) 12:37:38
それを実現できてるのはMacのSpotlightだけですが。。。
狭義な意味での全文検索の議論は不毛だけど
GDSもMSNSも文書全体の「全文」ではない。
だから使えないとは思わないし、
取りこぼしをどこまで認めるかは個人の考えだと思う。
grep型か
インデックス作成による
キーワード型(分かち書き辞書による)かN-gram型か
についても意見は分かれるけど、
grep型は数百MB以上では実質選択不可だし
N-gram型もKWIC Finderで使った限りでは
精度が高いとは思えなかった。
(でも辞書に頼らない部分で将来性はありそう)
キーワード型は辞書によって結果が変わりすぎ、、
(namazuでも辞書をいじれば十分に使える)
個人的には、いまだにサーチクロス&CSの組み合わせ。。。
(CSは決定打にならなかった)
マカーはスルーしる
>>106 > サーチクロス&CSの組み合わせ。。。
Docuworks User の方ですか?
サーチクロスは Type1 フォントを使った PDF ファイルから
正しくテキストを抽出できない。もちろん外部フィルタを使えば
抽出できるけど。なので、英文のPDFファイルがインデックスされない。
論文とかいっぱい蓄積しているはずなのに、何でヒットしないんだ〜
ってかなり悩んだ。
とりあえず MSN Desktop Search 使ってる。
でも独自のファイル形式があるんだよね、仕事で必要な。
サーチクロスだと、単なるコマンドラインフィルタでよかったんだけど、
MSN Desktop Search に新しいタイプをインデックスさせようとすると
IFilter を書かなきゃならないみたいなんで、COM から勉強しなおし。
109 :
106:2005/07/27(水) 13:46:54
>>107 Ver.4くらいからのユーザーです。
検索の選択時はDocuに対応してるorフィルターが存在するのが前提
ですが、最近は苦労する事少なくなった。。。
>108
サーチクロスは、外部フィルタ使ってます。
xdoc2txtだっけ
Officeの文書なんかもこれを使った方が処理が早そうなので
つかってます。
純正より安定もしてるので重宝します。
すんません。CSって何ですか?
111 :
名無しさん@そうだ選挙にいこう:2005/07/27(水) 20:04:16
すんません。CSって何ですか?
すんません。CSって何ですか?
すんません。CSって何ですか?
すんません。CSって何ですか?
インデックスの使用は当然で(形式はともかく)、
ちゃんと文書全体からインデックスを作っているかどうかがポイントかなぁ>全文
キーワード型は自動的に辞書を学習するようなればいいんじゃ?
>>106 どこかが作ったって発表してた気がするし。
114 :
名無しさん@そうだ選挙にいこう:2005/07/28(木) 16:36:12
Hyper Estraierも同梱してインストーラ作ればいいのに。
ライセンス的には問題ないでしょ。
116 :
名無しさん@そうだ選挙にいこう:2005/07/28(木) 20:22:22
age
117 :
106:2005/07/28(木) 21:58:13
118 :
113:2005/07/29(金) 11:14:54
>>115 そのライセンスがよくわからん。
ライセンス読んでも、どうすればいいのかが分かりづらい。
そのへんが明確になったら同梱するかも。
とりあえず同梱しなければ、制限を受けないようなので。
LGPLなら、ライブラリのソースコード自体を改編しなければ、コマンドやDLLだけ
取り出して別のパッケージに含めても問題ないよ。スタティックリンクしたものを
配布できるんだから、DLLを同梱したものを配布できるのも当然といえば当然だね。
心配だったら作者に聞いてみれば?
おれ、DocuWorksのデータがかなりあるんで、CSに惹かれているんだけど、
グーグルやウィンドウズがタダだと考えると、使う気になれん
富士ゼロックスはプラグイン作ってくれんかな
121 :
113:2005/07/29(金) 13:59:50
>>119 今のところの理解では、DLLを同梱する場合は以下の条件が必要と思う。
・どれを取り出したのか明示する。
・Hyper Estraierのソースも同梱するか、HPでダウンロードできるようにする。
・LGPLライセンスファイルを同梱する。
・著作権表示をする場合は、Hyper Estraierも同時にする。
さらに、Hyper Estraierに同梱されているDLL(zlibやpthreadGC2等)は、別の作者だろうから、
そのライセンスも調べなければならんとなるとマンドクセ。
DLL全部取り出して使っていいよ、っつーなら楽なんだが。
>>121 それ誤解だよ。GPLと混同してるのかな。
LGPLの場合、そのライブラリを組み込んだプログラムのソースを公開する必要は
ないよ。その点がGPLとLGPLの違い。
あと、GPLにもLGPLにも広告条項はない。だから、組み込んだライブラリを自分
で作ったと主張するのはダメだけど、「本ソフトウェアはHyper Estraierを利用
しています」みたいなことを表記する必要は全くない。使いたい奴が勝手に使えばいい。
zlibやpthreadGC2もその点では同じだね。むしろもっと制限が緩いはず。
結論としては、DLL全部取り出して使っていいと思うよ。
123 :
113:2005/07/29(金) 16:43:14
HTMLファイルの検索で該当箇所にブラウザ表示でジャンプか色付けをしてくれるのはありますか?
10年経ってもMacOSをパクリ続けるとは呆れ通り越して尊敬してしまいそうだ
パクってるのが見た目だけだから余計に始末が悪い
128 :
106:2005/07/30(土) 00:47:32
>>120 Docuのデータだけで100GBくらいある。。。orz
いろんな検索試したけど、個人ベースでは
サーチクロスが使い勝手が一番良いと思った。
CS(実際はExpandFinder)も良いけど、サーチクロスの
方が自分の予測に近いものが検索される感じ
CSは想定外の文書が上がって来る楽しさ?はあるけど、、
業務であればnamazu+kakashi(辞書改)かな
GDSもMSサーチも文書先頭のみのインデックス化だから
業務では使えないし、、
(こんなの検索できない理由として他者に説明できない)
最近注目してるフォーマットはDWF
でもDocuWorks Deskの使い心地を知ってしまうと
他のフォーマットには中々手が出せませんね
>>128 ちなみに、chmやmhtファイルもインデックス作れますか?
130 :
106:2005/07/30(土) 07:18:36
CS は Outlook のメールをインデックスできないのでやめた。
サーチクロスは Type1 フォントを使った PDF ファイルと
UTF-8 なウェブページに対応していないのでやめた。
生きてるのもやめたら?
36歳無職童貞だから生きるのやめた。
で、結局131は何使ってんの?
どうせいつか死ぬんだし
136 :
名無しさん@そうだ選挙にいこう:2005/07/30(土) 23:31:11
とりあえずMac使ってみれば?
驚愕するぞ
137 :
名無しさん@そうだ選挙にいこう:2005/07/30(土) 23:32:21
M$ と Intel は、人類の歴史に残るクズだと思うよ。
明らかに、正常な技術の発展を阻害している。
自社に足すなとは言わないから、独占を利用して、
「他に引き算をしかけるな。」ってこった。
結局、アップルがウィンドウズ版のSpotlightを出したら
全て解決だろ
Spotlightはプレビューないから、いらん。
Mac信者を137のように偏狭で排他的にさせる要因は何なのか。
彼らがどっかの雑誌やブログのヨタ記事を鵜呑みにしてその受け売り
を書き込んでしまうのはなぜなのか。興味は尽きない。
実社会でスポイルされてる人間が
攻撃先をインターネットに見出してるだけ
彼らにとっては
「何かに影響を及ぼしてる」
つもりのようだが、
傍から見れば単なる自慰行為。
でも気付かなければそれはそれで幸せ
┓(´々`)┏
自己紹介乙。
>>139 >Spotlightはプレビューないから、いらん。
プレビューあるよ。
リスト表示をアイコン表示に変えると、現在の内容をプレビューできる。
マイクロソフトが誤解されるように言ってるけど、ビスタとの違いは、
MacはPDFなどの画像形式のプレビューを作成し、ビスタはワードとエクセルの
プレビューは作るけどPDFは作らないところなんだよね。
Tigerでワードやエクセルのプレビューアイコン(随時更新しない)作る
ユーティリティーためしてみたけど、見た目で中身が判断できず
全く役立たなかった。ワードのプレビューはあまり意味がない気がした。
>>139 ドザは本当に無知だな
一度マックを使え
これは命令だ
文書検索において、文書が確認できないプレビューに意味無い
146 :
名無しさん@そうだ選挙にいこう:2005/07/31(日) 17:25:44
>>128 100G…すごいっすね。
自分もこれからDocuworksで書類を取り込んでいこうと決意したとこです。
MSNサーチ+フィルターでXDWも検索対象にできると教わったんですが、
106さんのカキコをみると、素直にサーチX買った方がいいですかね?
>>143 プレビューアイコンじゃなくて、文章の検索なのだからヒットした部分の文書プレビューがほしい。
アプリケーションで開いて検索して確認、違うなら次の候補なんて効率悪いからね。
今あるユーティリティでも、ヒットした部分の周囲を次々プレビュー表示できるのは、普通だし。
>>144 IIfxから色々使ってきたけど、ついに処分したよ。マックは最近周辺環境わるすぎでさ。
>>147 >文章の検索なのだからヒットした部分の文書プレビューがほしい。
それができるのってある?
>今あるユーティリティでも、ヒットした部分の周囲を次々プレビュー表示できるのは、普通だし。
Macでも、PDFならできるけど。ワードとかエクセルはできないな。
なぜかと言ったら、マイクロソフトの独自形式だから。
マイクロソフトがそういう仕様にすればできる。
対応してるのもありますよ
>>146 Docuへの取り込みは
スキャンの場合は最新版(V6)を薦めます
(OCRの精度がやっと業務レベルになった)
V6ならメール検索無しのConceptSearchも
付いてくるし、PDF書き出しも出来る
検索は無料に拘らなければサーチクロスを
持っておいた方が幸せになれると思う
たぶんWinFSが来るまでこれで十分かと思ってる
とうぶん先になりそうだけど、、、ヽ(`Д´)ノウワァン
でも急いで出したためにどっかの検索みたく
システムに負荷かけまくる、なんちゃってメタデータの
システムになっても困り物。。。
時間かけてもファイルシステムとの整合性のとれたモノを
作って欲しい
>>148 >>文章の検索なのだからヒットした部分の文書プレビューがほしい。
>それができるのってある?
多分無い。
MacでPDFができるなら別だが。
152 :
146:2005/07/31(日) 21:46:48
>>150 d。
サーチXについて「インデックス作成時にプロセスの優先度を下げてもフォアグラウンド
のプロセスが止まるという致命的欠点がある」のでGDSに変えたってヒトがいたのです
が、それ以外の部分(検索精度等)はサーチXの方がいいみたいですね。
>>148 独自形式だからってのはあまり問題にならない、対応すればよいのだから。
OpenOfficeでも、KWIC Finderでも自力でワード・エクセルファイルを読み出している。
それに、そんなに難しいことは要求していない。文章が追えれば体裁は崩れてもよいので、
ヒットした単語のハイライト付きテキストを表示し、操作でヒットした単語間を移動してくれればよい。
ExpandFinderでもサーチクロスでも前述のKWIC Findeでもこのくらいはできる。
Googleですらハイライト付きのダイジェストを併記表示する。これが無ければ不便だよ。
ローカルなファイルを対象としているならダイジェストではなく全文であってほしいな。
154 :
131:2005/07/31(日) 23:22:59
とりあえず、今はMSNデスクトップサーチ使ってる。
appleの奴隷が何を言ってんだ。
五十歩百歩という言葉を君に贈ろう。
この場合は、「目糞鼻糞を笑う」が適切かと。
ちょっと待てよ。
148の言うようなのがあるのか?
>文章の検索なのだからヒットした部分の文書プレビューがほしい。
それができるのってある?
>>155 M$の話など出していないけどな。
ExpandFinderもサーチクロスもKWIC FinderもM$が作っている訳じゃないよ。
M$がどうの、Appleがどうのとかの中身のない問題で話をしているわけではない。
そのツールが使えるか、使えないかの問題だ、奴隷になる必要すらない。
荒らしはスルー汁
161 :
150:2005/08/01(月) 12:24:52
>>152 指摘の欠点は私の環境では経験無いですが、
データ量によってはインデックス作成時に不安定になることは
あります。
インデックスセットの切り替え(インデックス分割)で安定しますが、
(環境によるけど普通のオフィス文書で30〜40GBを
1インデックスでも可能)
OLEよりもxdoc2txtを使った方が安定して感じられます。
(OLEで出来るものもxdoc2txtで処理させる)
使い始めは多少メンテしましたが、
ここ半年程は完全にメンテフリーです。
欠点というか改善して欲しいのは
インデックス分割しなくて済む安定性ですかね
162 :
名無しさん@そうだ選挙にいこう:2005/08/01(月) 12:43:09
欠点と欠陥はマックの奴隷とマック自身
欠点と欠陥はWINの奴隷とWIN自身
164 :
名無しさん@そうだ選挙にいこう:2005/08/01(月) 12:49:32
アホの18番はコピペオウム返し低能に化ける事だな
Hyper Estraier面白いね。
Windows版はもっとWindowsに特化した作り(GUIとか)にしてくれるといいんだけど。
RubyやJavaのフロントエンドがこれからでてくるのかな。
誹謗せよ! 誹謗せよ! さすれば誹謗のみが残るであろう。
という言葉がありましてな。
嘘でも何でもただひたすら相手の評判を下げる話を垂れ流した挙げ句に、
最後にぽろっと「ほら、だって火のないところに煙は立たないっていうし」
とでも付け加えたら、あら不思議印象操作のできあがりって奴ですわ。
ネットなんか見てたら火が無くてもいくらでも煙出せるのわかってるはずなのに、
-------------------------
クソマカーの論理によく当てはまるね
今でも”火のない〜”の理屈で疑心暗鬼に陥る人間が後を絶たないわけで。
根も葉もない噂
とも言うけど、悪い噂は良く広まるからねぇ。
噂の真偽を自分で確かめず
盲目的に信じる馬鹿が多いのが困る・・・
誹謗せよ! 誹謗せよ! さすれば誹謗のみが残るであろう。
という言葉がありましてな。
嘘でも何でもただひたすら相手の評判を下げる話を垂れ流した挙げ句に、
最後にぽろっと「ほら、だって火のないところに煙は立たないっていうし」
とでも付け加えたら、あら不思議印象操作のできあがりって奴ですわ。
ネットなんか見てたら火が無くてもいくらでも煙出せるのわかってるはずなのに、
-------------------------
クソドザの論理によく当てはまるね
今でも”火のない〜”の理屈で疑心暗鬼に陥る人間が後を絶たないわけで。
copernicはいろいろなファイルのプレビューに対応してるよ。
インクリメンタルサーチもバリバリ動くから使いやすい。
日本語に弱いのが欠点だが。
どう弱いんだ?
7月28日に「Windows Vista」とともに発表された「Internet Explorer 7.0(IE7) beta 1」が、
早くも開発者の間に多くの話題を提供している。
まず、IE7 beta 1が公開されてほどなくして英テクノロジー誌の「Register」が、
IE7 beta 1ではGoogleツールバーとYahoo!ツールバーが消えてしまう問題を指摘し、
Microsoftがライバル企業に打撃を与えるようとしているのではないかとの憶測記事を掲載した。
この問題は他の多くの環境でも発見されたらしく、ブロガーたちが競ってこの話題を書くようになった。
http://internet.watch.impress.co.jp/cda/news/2005/08/01/8626.html
サーチクロスはインデックスを2GBしか作れないんじゃなかったっけ
これじゃぁ、使いものにならんだろ
うちの用途だと使い物になっている・・・
ま、自分で作ったビジネス文書数千と画像のファイル名数万くらいだからな、操作性もまあまあよし。
でも、GBサイズの2ちゃんねるのログ用にはやっぱ使いにくかった。軽快性無くなる感じ。
インデックス作成もオンメモリでやっているせいか終盤になるほど重くなるし。
176 :
128:2005/08/02(火) 01:34:44
>>173 どんな大きなDB作ってるんですか?(笑
でもインデックス分割したくないケースは
確かにありますよね。。。
>174
終盤になるほど、、は感じますね。
namazuも同様でした。
1インデックスが数百MBになると途端に、、
逆にnamazuはオンメモリでない為だと思ってましたが、
どうなんだろ???
たぶんサーチクロスのインデックス作成はオンメモリ
じゃないと思う。(単に過去の経験から)
2Gじゃ不十分な人もいますよ^^;
視野せますぎ
>>161 私のところだと
インデックス作成時にATOKの入力が奪われますがね。
うちのATOK15はインデックス作成時以外でも負荷に弱く
入力途中で引っかかるので、そんときだけMS-IMEにしている。
おれのカスタムATOKはそんなのへっちゃら
183 :
名無しさん@そうだ選挙にいこう:2005/08/05(金) 16:46:27
ミスチルなんか聞いてる奴ってださすぎじゃね?
1回グレイ聞いてみ?
ミスチルなんか聞いてられなくなるからwwwww
>>182 普通のPCなら平気だぞ
180のPCがしょぼいか設定とかパフォーマンスがおかしいってだけだとおもう
えー、MS-IMEなら問題なっしんぐなんだけど、だめか。
まあ、XP1.4Gセレ384MBだからハイパフォーマンスとは言い難いけど。
インデックス作成以外の負荷って、OCR連続処理なんだけど、
操作の要所要所で重いんじゃなくて、脈絡なしに時々2〜3秒無反応になるんだよな。
ATOKの先読み処理とかがHDD高負荷状態に向いていないんだと思っていたよ。
まあいいや、スレ違いなんでここまで。
平穏だな。
>>186 後付いくない。
インストールに失敗してるか
PC環境の問題だとおもうぞ
あとけんか腰もいくない
188 :
名無しさん@そうだ選挙にいこう:2005/08/07(日) 16:40:18
サーチクロス2.0を購入してみました。
インデックスの初期化中に「インデックスが大きすぎる可能性があります」と表示され
エラーとなってしまいます。 ファイル容量が数GB(ギガバイト)を超えるような場合、
サーチクロスの性能の限界との事で、インデックスを小分けして切替えながら使用し
ないといけないようなんですが、データ(txt,html,xdw,pdf)だけで100Gもあるのに数GB
づつに分けて切替えながら使うなんて現実的考えて...orz です。
何か使い方まちがってるのでしょうか? あるいはMSNやGDSに変えれば問題がな
くなるのでしょうか? アホと思われるかもしれませんが、どうか検索プロの方々の対
処方法をアドヴァイスしていただけないでしょうか。
社員乙
今時サーチ買う馬鹿はいませんよ
>>186 けんか腰な奴はしね。二度と来るなぼけ。
>>188 前に話しが出てると思うけど、インデックスのサイズの壁が
2G位だったはず。(真偽は確かめてないけど)
→検索対象データ量の事じゃない。
純正のOLE使わずに極力xdoc2txtを使えば
検索対象30GBでも1インデックスで可能だけど?
192 :
188:2005/08/07(日) 22:10:56
>>191 レスどもです。
なるほどxdoc2txtってのは良さげですね。 ただ一番多いデータが本
をスキャンしたxdwなんですけど、対応できないみたいですね...orz
サーチクロスは2ch.dat専用にするしかないかなぁ。
自分がスレを良く読むべきだったんですが、まさか今時2Gの壁がある
とは、、、ワタスのMP3プレーヤでも1Gはいるっつーに。。
>>192 一言多い人って言われない?
前半だけでやめとけばいいのに・・・・
GDSってGoogle Desktop Searchのことですよね?
ところで、GDSの全体的な使い心地はどうですか? 完成度とか?
私の場合、検索対象が40Gくらいあるので、大容量でも素早く検索できて、
chmファイルも検索出来るのをさがしているのですが。。
あと、namazuってchmファイルのindexをつくれないですよね?
>>192 スキャンする文書に2Gの壁なんてないし
インデックス自体のサイズを問題にしてもな〜
先ずは日本語を読めるようになってから使えば?
それとも工作員?
>>192 その論理展開でMP3プレイヤーを持ち出したのが分からない・・・・
GDSは検索に漏れがあるから信用できなくなった
>>195 >スキャンする文書に2Gの壁なんてないし
ここの意味がよくわからないのですが、xdoc2txtを使ってテキストにすれば2G
の壁はないって事ですか?
CD版に説明書がなかったので公式FAQみたら、「インデックス対象のファイル容
量が数GB(ギガバイト)を超えるような場合、サーチクロスの性能の限界」とあり
ますが…
xdoc2txtはよさそうなんですが、Docuworks文書に使えないです。
ためしにMSNの方を入れてみたらなんの問題もなくインデックス作成終了し、サ
クサク使えてます。(もちろんインデックス対象ファイルは同一です)
>>196 これは半分は冗談ですが、言いたい意味は以下の事です。
今時安価なPC買ったって30G〜40G位の容量のHDDは付いてくるじゃないです
か。 2G以下のPCを探す方が難しい。 ならばインデックス対象のデータが全部
使い切ってないにしても数10G位になるのは当然想定すべきではないかと。
CDのパッケージにも「PC内に”散在”している各種・・・快適に検索できる」とある
のだから、MSNの様に数10Gのデータくらい横断的に使えなくてどうするのかと。
(HDDですらないメモリのMP3プレーヤだって今時1Gなのに...orz)って事です。
↑ここはもちろんアホアホです、スンマソ。
自分が買ったものを失敗したと思いたくないので悪くは言いたくないですが、実際
使えないです。 むしろ自分の使い方or設定が悪いだけって事である方がずっと
いいですけど…
200 :
198:2005/08/09(火) 00:28:39
>>199 解説ありがとうございます。
Q.034は「インデックス対象のファイル容量がGB(ギガバイト)の単位まで
満たない状況で」とあったので試してないですが、やってみます。
5回ほど初期化しなおす必要があるようなので、時間かかるかもしれませ
んが結果がでましたら報告させていただきます。
>>198 2G問題は買う前から分かることなんだし
調べなかったあなたが悪いだけでは?
ただのアンチの発言にしか見えないんだよな・・・
横槍だが、自分が悪いかメーカーが悪いかって議論は全くしてないだろう。
198は購入して使ってみたら使いにくかったという主観的事実を書いただけだ。
>>201 初めてこの手のソフト買ったし使ったんで、アンチも何も。
CDパッケージをみて量販店でサクっと買ってしまったんですが、確か
に良く調べるべきでした。 その事は自分も上で書きましたけど。
何も「1Tで使えない」などと言ってるわけではないですし、今時まさか
数G程度の容量で問題があるとは思っていませんでした。
>>202 あ、気持ち代弁していただきありがとうございます。
本当にアンチとか貶めてやろうとかはないです。
連投スマソ
ちくしょーーーーーーーーー!
うらやましいから来るな!!!
広告記事を張っちゃダメでしょ。
鵜呑みにして騒ぐ人が出るから。
──最後に、Tigerを使っていない人に何と言って薦めますか?
貴族的な生活が、Tigerで手に入ります(笑)。アイコン1つをとっても重厚感があって、
高級な応接室ぐらいの雰囲気になりました。執事みたいな感じです。
>>203 一般人の感覚からしたら
2Gも1Tも五十歩百歩
車だって2〜5人乗れれば普通は十分でしょ。
>>209 例えになってない。
五十歩百歩は程度の低すぎるもの同士を無駄に比較する場合の暗喩だぞ。
どんぐりの背比べ、ともいうな。
金があったらマック買いたい。
カネを積まれてもマックは使いたくない。
正直、存在すら目障り。
>>210 程度の低さは関係ないですよ^^;
他人の間違いを正すなら辞書を引いてからにしたほうがいいですよ
辞書の短い説明だけ見て満足な中学生はそれでいいけどね、語源を考えれば
良いものや貴いものに対して五十歩百歩というと失礼にあたるのはわかるでしょ。
社会に出て恥ずかしい思いする前に正しといたほうがいいよ、日本語よりまずその態度をね。
久しぶりにこのスレに来てみてxdoc2txtの存在を知って
早速サーチクロスのコマンドフィルターをOLEから変更。
インデックスの時間はかなり速くなっている感じ。
あとはビュアーの外部プログラムに何を使ったら良いか思案中。
激しく気になるぅぅ・・・
変に慣用句使おうとせずに、ふつうに「大差ない」って言っておけばいいのにな。
「大差ない」も「五十歩百歩」も大差ない。
ってか語彙が貧弱すぎ。
貧弱!貧弱ゥゥッ!!
Macほしいなぁ…買っちゃおっかなぁ
検索も魅力だけど、あのエクスポゼってやつに憧れてる。
飾りだけのうんこマカーは巣に帰れ。
>>199 Q.034を試してみましたがやはりダメでした。 エラーは同じ「インデックスが大きすぎる
可能性があります」でした。 更にインデックス対象から大量にスキャンしたxdwをはず
し、txt、html、jpg、pdf等のマイドキュメントとデスクトップ(9G弱)を選んでみたのですが
残念ながら同じ結果でした...orz
>>106さんは「Docuのデータだけで100GBくらいある」との事ですが、インデックス対象
をフォルダで小分けする方法を使ってるのですか?
>>220 メンテナンスちゅうだとよ〜
>>205 全文検索モノ全般に言えることだけど、
「原稿の中で霊を使っているものが全部出てきました。」
ってのがくせ者なんだよな。本当に全部か?と言う問いに対して
自信を持って全部だと答えることができない。
全部かどうか分からないけどいっぱい出てきました、としか言いようがない。
は?
grepのように指定文字列を含むものを全部出力するとわかっているツールと
対照実験すれば言えるだろ?
もちろん作り手ならそんなことしなくてもアルゴリズムから確言できるし。
ところでSpotlightのインデックスの形式は何なの?
ハッシュ(分かち書き/N-gram)、Suffix Array、Patriciaとか考えられるが。
228 :
106:2005/08/13(土) 14:16:25
>>224 勿論分割はしてる
家の環境だと
Docuだと20〜30GBを1インデクスでも大丈夫
9G弱でってことは他に原因があるのでは?
Q.035のようにログを取ってみると止まるファイルがあるのかも
(会社でnamazu使ってるときは特定のファイルで止まる事は
良くあった)
インデックス分けるのは構わないけど、(←トラブル時のメンテが楽だから)
複数のインデックスにまたがって一括で検索できる仕様に
して欲しい、、、
>>227 たしかSQLiteがバックエンドのはずだから、データ格納形式としてはB-Treeかな。
>>228 レスありがとうございます。
確かに9Gってのは少なすぎる気がするのでログみてみます。
またDocu単一なら20〜30G位1indexでいけるというのは特に
参考になりますです。
>QuickSolution は 10GB(1,000万件)のテキストを0.1秒で検索可能
ってことは100Gでも1秒なのか、すげえな。
>>232 負荷が O(n) ならそうだろうが、100GBで同じ性能になるかどうかは
難しいんじゃないの、とくにソートする場合とか。
そのQuickSolutionに限らないことですけど、そういう売り文句を真に受けちゃいけませんよ。
「0.1秒で検索++可能++」というのは、「0.1秒で検索結果が表示される++こともある++」という意味です。
ヒット数が少ないなどの有利な条件で検索した結果を根拠にした主張である可能性があります。
これも一般論ですが、対象のテキストの規模だけでなく、検索条件の複雑さが検索時間に対する影響に
注意すべきです。むしろ、対象の規模と比較すべきはインデクシングにかかる時間の方でしょう。
どうでも良いけど、対応フォーマットを増やして欲しい。 個人的にはchmファイルが
たくさんあるからそれ対応の。 現在、chmファイル対応のってコンセプトサーチだけか。
それ案件の話? それとも個人でchm形式で物書きしてんの?
後者だったらかなり猛者かも。
ヘルプから検索したいだけ何じゃないかと
やっぱり、OS組み込みじゃないとダメなのかもな。
ヤフーの日本語対応、まだ?
釣りはもういいよ
本文だけじゃなくて、各ファイル形式が持っている
メタデータ項目もできるだけインデックス対象にして欲しいな。
PDFのタイトルとか著者とかはほとんどの
全文検索ソフトで対応しているけど、
もっと、もっと、もっと〜〜〜〜〜
サーチクロスで複数のシートがあるブックがヒットしたときにダブルクリックで
選択したキーワードがあるシートをサックリ開けたら最高なのにな〜
作者さんみてるw
googleなんてサーチクロスの足下にもおよばない・・・今のところ・・・
247 :
名無しさん@そうだ選挙にいこう:2005/08/23(火) 17:33:56
Google Desktop Search
MSN デスクトップサーチ
などのフリーのデスクトップ検索ソフトは、
全角半角などの同一視をしてくれない、気がする。
でも時々同一視してくれてるような検索結果も見る。
どっちなんだ。
上に上げた二つ以外にフリー載ってある?
Yahoo もフリーのデスクトップ検索ソフト出してた?
>>247 使い方すら分からずいい加減なこと言わないでくれませんか
「いい加減なことをいっている」ように感じるのか
>全角半角などの同一視をしてくれない、気がする。
>でも時々同一視してくれてるような検索結果も見る。
ヘルプ嫁、ぐぐれ
馬鹿は使うなってことだなw
自打球乙w
247みたいなアフォは多いぞ
そういう人に限って自分の勘違いを認めようとせず
バグだ不具合だと騒ぎ立てるし・・・
サポセンで働いていたオレがいうんだから間違いない
折れ最初のマシンがW95だったな。
数枚の参考資料持ってアキバ行って部品買って組んだ。W95も一応すんなり入った。
よかったよ、W95が屑中の屑で。
1年待たずに見切り付けてLinuxに乗り換え。
今に至る。
最高パワーの反面教師として正しい道を示してくれたOS(モドキ)という意味で、大変感謝してる。
今後もハイテンションな屑を作り続けて人々に道を示して下さいね>MS様
261 :
名無しさん@そうだ選挙にいこう:2005/08/30(火) 15:34:41
>>261 MSの焦りが感じられるのは俺だけかな。
焦ってもらって結構
それがSpotlightのおかげなら
Spotlightもちっとは役に立ってるじゃん
よかったねマカーの皆さん
まぁ、所詮Spotlightには叶わないがな。
MacのシェアからしてSpotlightなんぞ歯牙にも掛けてないだろ
MSが意識してるライバルはGoogleであってAppleなんぞ相手にもしてない
MSの後出しは戦略。
何でもかんでもMacに先んじては市場シェアが上がりすぎてしまうのでわざとやっている。
MacにOfficeだしてやっているようにお情けをかけてあげているようなモンだ。
まぁ、Appleを生かさず殺さず、がMSの戦略だ。
WinFSとSpotlightは、全然違うものなんですが・・・。
わかってないな
Spotlightがシステムに近いと言ってもインデキシングにガリガリやるのは避けられないわけでしょ?
オフィスによっては数十GBのドキュメントを保存してるところもあると思うが
ネットワーク上のファイルサーバに対してもSpotlightは使い物になるわけ?
それともmacだからそういう使途は想定されていない?
>>272 何言ってるの?
少なくともWindowsより遥かにマシなんだけどね
Winならサーバでインデックスサービス走らせとけば
クライアントはブラウザとかで検索できるけど
macはそういう使途は想定されていない?
>>273 それぞれについで、どうマシなのか答えてほしいよ。
さっぱり参考にならないよ、それじゃ。
Mac購入を考えている人だっているかもしれないんだから。
ろくに使いこなせてないから質問にまともに答えられないのさ。
Spotlight持ってても仕事もろくにしないで、Macで遊んでばかりいるんだろ。
ここはあくまでビジ板だ。こういうどうしようもないマカーはとっとと巣に帰れ。
>>276 どちらかというと、お前の方がどうしようもないな。
人を呪わば穴二つ。
女の子は穴三つ。
Macintoshは文房具。
鼻毛がチクチクしてすごくイイです。
与太話はいいからマカはさっさと質問に答えろよ
マカーはバカーですから、まともな返事を期待してはいけません。
>>280 人間には、
目:2 + 鼻:2 + 耳:2 + 口:1 + ヘソ:1 + 肛門:1
の9個の穴が有る。そして女はさらにもうひとつの穴が。
「九の一」 → くのいち
オレは女ではないのでおしっこは目から出ます。
粘着キモッ
290 :
名無しさん@そうだ選挙にいこう:2005/10/27(木) 20:12:25
291 :
名無しさん@そうだ選挙にいこう:2005/11/13(日) 23:32:24
NTFSドライブのプロパティで設定できる「このディスクに
インデックスをつけ、ファイル検索を速くする」っての
MSNデスクトップサーチとかGoogleデスクトップサーチ使う時には
必要ないのん?
関係ない
あ、どうもサンクス
サーチクロスが一番な気がしてきた
サーチクロスのエンジンをHyperEstraierにすればいい
xdoc2txtとHyperEstraierのやってることは別だと思うけど?
298 :
名無しさん@そうだ選挙にいこう:2005/11/16(水) 10:48:36
誘導されてきました。
ExpandFinderで
文書データベースを、ネットワークで共有する裏技はございませんか?
インデックスを共有したいのですが、サーチクロスだと同時にインデックスを参照できないようです。
対象文書はpdf、xdw(docuworks)です。
302 :
名無しさん@そうだ選挙にいこう:2005/11/17(木) 11:37:05
>>256,297
xdoc2txtと同じ作者のKWIC Finderと比較すべきなのかな。
できることはだいたい同じだけど、HyperEstraierの方が大量の文書を扱えるし速い。
でも、Webサーバを立てなきゃいけないのが面倒くさい。
HyperEstraierはライブラリだから、できる人にとってはUIを自由に設計できる
点も評価できるんじゃないかな。
303 :
名無しさん@そうだ選挙にいこう:2005/12/12(月) 23:26:41
>>303 これで日本で使用されているメールクライアントが制覇してくれれば・・・
それhtmlファイルだとその場に飛ばないから使えない
306 :
名無しさん@そうだ選挙にいこう:2005/12/15(木) 10:43:36
>>304 メールクライアントが制覇ってどういう意味?
307 :
名無しさん@そうだ選挙にいこう:2005/12/21(水) 12:18:55
310 :
308:2005/12/23(金) 01:52:07
>>309 試していただいてありがとうございます。
いつもそこでエラー出るんですが、こっちの環境に問題があったようです。
すみませんでした。
バージョンも書かず何がしたいんだろう・・・
xdoc2txtにコマンドフィルター使ってるとインデンクス更新は
速くなるけど検索が遅くなる気がする・・・
5GBクラスのエクセルの検索で5秒以上かかってしまいます。
PC環境くらい書けよw
ただの煽りなら乙
普通の人は更新も検索も早くなるようなうまい話があるとは思ってないけどな
>5GBクラスのエクセルの検索で5秒以上かかってしまいます。
「の」大杉w読みづらい
5GBったってそのうちテキストがどれくらいか分からんと何とも言えんわな。
え、1ファイルが5GBのエクセルファイルなんじゃないの?
そりゃー大変じゃろと思ってたんだけど。
で、99.99995%が画像で残りがファイルフォーマット固有の情報と・・・
319 :
名無しさん@そうだ選挙にいこう:2005/12/31(土) 04:19:48
Windows2000のファイルサーバー全文検索に、インデックスサービス+ASP使ってます。
namazuを入れてみたんですが、どうも日本語フォルダとの相性が悪くIndex作成してくれません。
WEBからみんなでWindowsファイルサーバーを検索できるような一番よいソフト(仕組み)はなんかないですか?
HyperEstraier
321 :
名無しさん@そうだ選挙にいこう:2005/12/31(土) 21:17:10
>>320 ありがとうございます。
Office文書もいけますかね?っていうかOffice文書検索がほとんどなんですが。。
322 :
名無しさん@そうだ選挙にいこう:2005/12/31(土) 21:19:08
>>320 ありがとうございます。
Office文書もいけますかね?っていうかOffice文書検索がほとんどなんですが。。
>>322 いける。Windows版バイナリには、Office用のフィルタも同梱されているから、
コマンド叩くだけですぐ構築できる。
fhew氏が復活しますように。
326 :
319,321,322:2006/01/01(日) 22:09:40
ありがとうございます!
さっそく使ってみます。
327 :
312:2006/01/11(水) 14:07:24
インデックス作りなおしたら高速になりました。
お騒がせしました。
パソコン内のメールやファイルをすばやく探し出せるデスクトップ情報検索ソフトの新版
「ConceptSearch(R) /R.2」2月10日(金)発売
〜「Outlook 2003」や「Becky! Internet Mail Version 2.22」の
メール検索に対応〜
ttp://www.justsystem.co.jp/news/2006f/news/j01112.html >ConceptSearchユーザーには、「ConceptSearch /R.2」にアップデートできる
>「アップデートモジュール」を、2月9日(木)より無償提供します。
>ConceptSearch /R.2では、新たに「Outlook 2003」や「Becky! Internet Mail
>Version 2.22」に対応し、これらのメールソフトで管理しているメールと
>その添付ファイルが検索できるようになりました。
>インデキシングの設定では、文書データベースのソースファイルの
>最大サイズを300MBから2GBに引き上げました。
>また、インデキシング時の一時メモリ使用効率を改善しています。
googleデスクトップは、outlookの検索に便利だな。
なんせ、pstファイルが2GBにふくれあがっているものだから、通常の検索じゃあ
時間がかかってしょうがない。
ユーザインタフェースもブラウザ形式でわかりやすい。
それにしても、googleデスクトップが作り出すインデックスファイルは巨大だ。。。
ハードディスクの容量が少なくなって気づいた。
330 :
名無しさん@そうだ選挙にいこう:2006/01/16(月) 21:53:43
>>329 自分のPCの能力も考えず
むやみに導入したあなたが悪いだけでは?
わかりやすいかどうかも人それぞれの問題だしさ・・・
331 :
名無しさん@そうだ選挙にいこう:2006/01/18(水) 00:31:58
試しに入れてみたけどイイ
グーグルデスクトップから完全に移行する予定
pstファイルだったらサーチクロスじゃね?
ソートとか出来るし。
naamzuも出来るなw
市販ソフト進めてるやつって社員なんだろうな
関係者乙
また社員同士のいがみ合いか・・・
>>334 PCオタばっかりじゃないし
イニシャルコストが高すぎ
338 :
名無しさん@そうだ選挙にいこう:2006/01/18(水) 13:06:41
試しに入れてみたけどグーグルデスクトップの方が良い
グーグルはやはり時代の弔辞だな
ググールデスクトップサーチだと検索で引っかからないファイル(ファイルサイズの
大きい物)があったからMSNに乗り換えてみたら結構いい感じだった。
今はどっちも消してサーチクロス動かしてる。
僕の頭では、MSNもGoogleも使いこなせない。何されてるかわからない。
メール検索いらないし、サーチクロスがちょうどいい。ニーズにも合ってる。
サーチクロス人気だな・・・
フリーだったら最高なんだが。
EXCEL検索でヒットしたあと複数シート検索マクロ使うのがかったるい。
出来れば検索→ヒット→ヒットしたシートを即表示して欲しい。
何とかならないかな・・・
新しいConceptSearchにちょっとは期待してるんだヨ。
>>342 いずれにせよインデックス作成に時間がかかる予感
とうか重すぎ
344 :
名無しさん@そうだ選挙にいこう:2006/01/19(木) 01:52:47
>>44の補足
堀江君にとって最悪のシナリオは、「風説の流布」や、「偽計取引」による「罰金」
では収まらず、インサイダー取引としての立件、そしてその後のライブドアやライ
ブドアマーケティングの株価下落によってキャピタルロスを被った同社の株主が、
堀江君個人を民事訴訟するといった展開でしょう。
2005年春の騒動で、ライブドアの大株主に「無理やりさせられた」フジサンケイグ
ループだって、そうなったら黙っていないでしょう。
結局のところ、「ファイナンスに対する理解」がない人にとっては、ライブドアの
経営が「如何にインチキであるか」がわからないわけですから、困ったものです。
「わかってない人」が、このような企業の株価を支えているわけですからね。
ライブドア事件・・・これは、今見えている「容疑」の範囲では、全然収まらないでしょう。
当局がどこまでメスを入れるのか、それは僕にもわかりません。
しかし、ホリエモンだけではなく、その取り巻きの「多くのインチキ錬金術師」
たちは、ぶるぶるしていることでしょう。
この場で、具体的には書けませんが、僕の持っている情報、そして僕の知識から
観た場合、「ある一定のカテゴリー」に属する人々の事件へのかかわりが透けて
見えます。
メスを入れていけば、相当の膿が出てくることでしょう。
そのとき、みなさんにも僕の訴えたいことが、ようやくご理解いただけるのでは
ないかと思います。
345 :
名無しさん@そうだ選挙にいこう:2006/01/19(木) 03:25:53
htmlファイルを検索して
該当箇所の前後をブラウザや内蔵の表示部分で表示してくれるものはありますか?
estraierで検索するときの検索対象の拡張子を増やす方法がわからない。
どなたかご教示してください
>>347 Hyper Estraierなら、
find . -name '*.foo' -o -name '*.bar' -o -name '*.baz' -print | estcmd gather dbdir -fh -
とやると、カレントディレクトリ以下で拡張子がfooかbarかbazのものをHTMLとして登録できるよ。
-fhを-ftにすればプレーンテキストとして扱われる。旧Estraierでも同じような機能があるはず。
>348
おお、ありがとうございます
>>345 microsoft index server ならできる。
昔、オプションパック時代にサンプルでついていた。
今、たしかサンプルプログラムついていないからな〜。
まあ、ぐぐってみてください。
M$製品はだめだろw
仕事メーカー営業。
10年ぐらい前の製品内訳を物件名だけでピンポイント検索。
電話で製品のデーターを即答してあげたら驚いてた。
ちょっとだけ自慢したい気分。
他の奴ら、こんな便利なソフトなんで使わないんだろ?
きっちりデータを整理してあるから、
力任せの検索は必要ないからだと思われw
>>354 あなたが扱うデータ量が少ないだけじゃない?
それか整理できるデータしか扱ってないかのどっちかだとおもう
まだ学生なんだろ
357 :
名無しさん@そうだ選挙にいこう:2006/01/30(月) 00:11:43
age
358 :
名無しさん@そうだ選挙にいこう:2006/02/02(木) 20:06:50
MitakeSearchのwin版インストールがわからない
だれかやったことあるヤシいる?
>>358 ん?何が分からないんだ?
特に躓くところはないとおもったけど・・・
360 :
名無しさん@そうだ選挙にいこう:2006/02/04(土) 08:32:43
>他の奴ら、こんな便利なソフトなんで使わないんだろ?
PCオタじゃなければ
導入コストには見合わないだろうね
煽りじゃなく普通の人には難しいよ
会社では使うが自宅では使わない。
環境によっては激しく便利。
俺は逆だな・・・
会社のデータはしっかり管理してるが
趣味のデータはばらばら
インデキシングの時間が普通の人には何か嫌だと思う。
もっと気にならないようにインデックス作成出来るようになればね。
普通の人ってなに?
むやみやたら一般化して
自分の意見=普通にするのやめようよ
俺は普通だ!
普通の人は、そんなこと気にしないとおもうけどな・・・
少なくともwindows標準でもなんかのインデキシングやってたり
8.3のファイル名やら作ってるけど
誰も気にしてないし・・・
夜中にインデックス化するように設定すればいい
インデックスにしないで夜中に検索かければいい
なんとなく
374 :
名無しさん@そうだ選挙にいこう:2006/02/08(水) 09:09:07
>>364 インストール直後はgrep検索で、バックグラウンドでインデックスこつこつ
作って、徐々に早くなるっていうのはどうだろう?
知らないところで勝手に作られてもねw
364のいう普通の人はいやがるとおもうよw
知らないのなら、いやがるまでもない。
知識が無い人ほど理由がなくいやがるもんだよ
写真を撮られたら魂も取られるとかねw
取られてますよ。気付いてないだけです。(`・ω・´)
クレジット持たない人のいいわけに似てるw
そして、あなたは気づいてないかもしれないが、インデックスも既に作られています。
ConceptSearchやっとOutlook対応してくれたか
ちょっとは使えそう
あ、もう体験版出てるのか。
忘れてた。
アンケートにSearchXがあるのがちょっとびっくり。
確かに数少ない製品ではあるけれど。
8.3のファイル名も勝手に作るしな・・・
インターネットブーメランを常用してるお^^;
相変わらずインデクサは重めだねぇ>ConceptSearch
んでも、要約が表示されるのはちょっとよかった。
SearchXでも要約表示ができるようにならんかな。
386 :
名無しさん@そうだ選挙にいこう:2006/03/10(金) 10:59:38
;;;;;j,. ---一、 ` ―--‐、_ l;;;;;;
{;;;;;;ゝ T辷iフ i f'辷jァ !i;;;;; 日経バイト=アルバイト情報誌
ヾ;;;ハ ノ .::!lリ;;r゙
`Z;i 〈.,_..,. ノ;;;;;;;;> そんなふうに考えていた時期が
,;ぇハ、 、_,.ー-、_',. ,f゙: Y;;f 僕にもありました
~''戈ヽ `二´ r'´:::. `!
388 :
名無しさん@そうだ選挙にいこう:2006/03/15(水) 17:35:07
また懐かしいネタですねw
googleへのインデクス集積の通信は暗号化されてるの?
中国なんかだとgoogleからの提出もさることながら、PCからgoogleまでの
間の通信を傍受されかねず、googleが提出しなくても中国政府に個人の
PCの内容をチェックする機会を与えかねない。
>>392 グーグルで検索しただけじゃ個人PC内のファイルに関するヒントは
流出しないだろ。アホか。
395 :
名無しさん@そうだ選挙にいこう:2006/03/18(土) 11:08:08
>>395 違いますよ
嘘情報ひろめるのはやめてほしい
397 :
名無しさん@そうだ選挙にいこう:2006/03/18(土) 22:36:45
Dim FoundCell
FoundCell = FoundCell.Offset(1, 0).Address
なにがダメなのでしょうか?エラーが帰ってきてしまいます。
401 :
名無しさん@そうだ選挙にいこう:2006/03/32(土) 11:09:22
Hyper Estraire でpdfファイル中のタイトルを(ファイル名ではなく)、
検索結果のタイトルにしたいのですが、どうやってやればよいのでしょうか?
windows版で、フィルタはxdoc2txtを使っています。
401です。
>>402 お返事ありがとうございます。
どのようなフィルターを使用すれば可能でしょうか?
ググってみましたが、適当なものが見つかりませんでした。
もし、ご存じであればご教示願えないでしょうか。
>>403 Hyper Estraireというのはようわからんが
俺はNamazuでxpdfとか使ってる
ただしパスワード設定文書はIndex作成時完全無視される
xdoc2txtってメタデータを出力するオプションなかったっけ。
>>404 >ただしパスワード設定文書はIndex作成時完全無視される
出来るけどやったらあかんだろ・・・
え?
ということにしとこう
出来たら違法だしねw
413 :
名無しさん@そうだ選挙にいこう:2006/04/06(木) 17:17:18
ConceptSearchはインデキシングの時間はともかく、テンポラリのファイルを大量に作らない?
あれどうにかして欲しいよ。
昨日上がったサーチXのアップデータ、腐ってるんじゃあるまいか?
416 :
名無しさん@そうだ選挙にいこう:2006/04/08(土) 17:43:35
どういうふうに?
>>415 腐ってるね。。。。
ダウンロードしたファイルをダブルクリックしても
コマンドプロンプトが表示され、なにもなく終了。(インスコできない)
掲示板もリードオンリーになったし、だれか指摘汁!
社長が代わって最初の仕事が、掲示板封鎖とコレじゃねぇ……
Indexを破壊されたような気もするが、これは別口かな。
え、うそ、中村さん止めちゃったの!?
……ほんとだ。
この新社長は何やってた人なん?
まあそれはそれとして、SearchXのアップデータはちゃんとアップされてないね。
掲示板の書き込みもできないとなると、単なる容量不足だったりして(笑)
>>412 一太郎に対応してないのに目をつぶれば
これ結構いいな。対応エンコードとかすごすぎ。
Googleデスクトップ検索のBeckyプラグインって、インストール後に
来たメールしか検索できないんすか?
VCオワタ
サーチXのアップデータ。
あらこっそり差し替えたのね、と思ってデスクトップでクリックしてみたら、
そんなファイルねーよってorz
ルートにコピーして再度クリックしてみたらアップデートできたから、
半角カナ駄目とかスペース駄目とか、そんな話なんだろうけど・・・
サーチ×を2.10に上げたらまともに検索できなくなったんだけど。。。
仕方ないので2.09に戻した。
大丈夫か?>VC
つか、社名も変えたら?
>>424 indexを再構築しては? うちでは使えているよ。
再構築したんだけど、駄目だった。
うーん、なんだろう。。。
具体的にどう駄目なのかが分からんから、何とも言えんがね
不正ユーザだから
Web News においては既に告知済みですが、3月末日の創業者の退社により、株式会社
ビレッジセンターの代表取締役社長が交代いたしました。
パソコン通信創成期の頃より、日経MIX、NIFTY-Serve を経て、長年にわたって提供
して参りました電子会議室形式のサポート掲示板ですが、新社長の方針により、各
ソフトウェアのウェブ掲示板は本日を持って読み取り専用とし、今月内にも閉鎖さ
せて頂くことになりました。
テクニカルサポートは、これまで同様にお問い合わせフォームより受け付け、メール
でのご対応をさせていただきます。
今までのご利用に感謝致しますとともに、これからも弊社ソフトウェア製品を何卒よ
ろしくお願い申し上げます。
株式会社ビレッジセンター
\^o^/VCオワタ
新社長の方針って曖昧だよな
客と直接関わる部分なんだからちゃんとその方針とやらを示せよ
なんか理由あるんでしょ
あのユーザーと開発者との距離感の近さが取り柄だったのに。
荒れてただけだな・・・
436 :
名無しさん@そうだ選挙にいこう:2006/05/30(火) 11:33:38
>>435 > ・・・が、そもそも一太郎ドキュメントはバージョン別に複数の保存形式があるため、今後も強化するらしい。
基本的にバージョン8方式が標準になってるんだけどね。
あとタブ付とかにすると最初のタブしか検索対象にならない
2006.05.25
サーチクロス2.0のVer.2.10aを公開
・Ver.2.10 で、探す場所の絞り込みが機能しなかったバグを修正
>>433 その距離感のせいで倒産寸前なんだって^^;
>>438 え、マジで?
なんか買ってやろうと思ったけど、今のラインナップだと買うものがないんだよな……
(SerchXは既に買ってるし)
ソフトイーサとセキュアVMのおこぼれでなんとかやってけるんじゃないの・・・
無理だな
442 :
名無しさん@そうだ選挙にいこう:2006/06/16(金) 13:57:15
キチガイマカーが去ってから伸びが鈍くなったね。
フリーのデスクトップ検索ツールが広まってる上に
OS標準ツールがデファクトスタンダードになっていくだろうから
もうこのスレもいらなくなるね
アフォ?
普通の人には全文検索に魅力を感じないからスレが伸びないのかと・・・
片付けは昔から苦手
Mac板やLinux板では全体のユーザ数が少ないのに
もりあがってるからユーザ層の質の違いだろうね
ってことは、GDSの5000字制限が無くなるのを待つか
待てるなんて
楽な仕事しかしてないんだろうな・・・
「ボクは苦労人です」ってアピールしたいの?
キモすぎ
待てる人はほとんどいないだろw
必要ないならともかくw
451 :
名無しさん@そうだ選挙にいこう:2006/07/06(木) 10:59:36
もうサーチクロスでいいよ。これだけ長く重宝してる同類ソフトウェアはない
452 :
名無しさん@そうだ選挙にいこう:2006/07/06(木) 14:11:23
JSクランチが良いよ
遅い
455 :
名無しさん@そうだ選挙にいこう:2006/07/28(金) 13:23:49
つうかVistaにはWindowsDesktopSearchがデふぉ搭載でしょ?
もうそれで決まりじゃん。このスレの存在意義もなくなるね
WindowsFSじゃなかったっけw
WinFSって開発断念しただろ
いや、やめますってアナウンスがあったはずだが
じゃあなんて名前になったんだ?
WindowsDesktopSearch ww
>>461 そのあと再開されたのをしらんのか???
それでなんて名前になったんだ?
SuperWinFS
>>467 おまえしつこいよ
そんなもんはない、あれは中止。
ゲイシと共に去りぬってやつだな
>>470 馬鹿発見
w連打が格好いいと思っている
粘着厨www
敗北宣言乙
新しい話題無いねー
ネコちゃんにメールしろよ。
476 :
名無しさん@そうだ選挙にいこう:2006/09/10(日) 14:44:39
サーチクロスを導入して2ちゃんログの全文検索をしようとしているのですが、インデックスの作成が出来ません。
サーチクロストップページからの導入方法にあるようにhtml2txtを導入してインデックスの作成を実行したら
インデックス対象が大きすぎると表示されました。
そのため拡張子をDATだけに限定して、フォルダも2ちゃんのログ保存フォルダだけにしたのですが、
【例外コード】
C0000005
【INDEXタイプ】
新規
【エラーの場所】
PickMimeInfo()
【メールオフセット】
124646
【ファイル数】
7113
【サイズ合計】
1009119830
インデックスが大きすぎる可能性があります。
[ツール]-[インデックスセットの切り替え]を使い、対象フォルダやフィルタイプで切り分けてみてください。
となります。ログサイズはたったの1Gしかありません。
これを回避するには板ごとにインデックスを作ってやるしかないのでしょうか?
試しに一番ログの大きいニュー速だけで作ったらきちんとできました。
あー俺も出ることある
何度もやってると問題なくできたりもするよ
たぶん報告した方がいい問題な気がする
478 :
名無しさん@そうだ選挙にいこう:2006/09/10(日) 22:55:47
>>477 ずっと前にメモリの少ないマシンで出続けて聞いたことがあります。
そのときの回答は「いっぱい小分けしてね♪」でした。
インデックスの横断検索できるの?
小分けするのはいいけどさ
Archivarius 3000ってDocuworksと2ちゃんdatに対応してくれないかな。
そしたら完璧なんだが。
>>479 横断検索の要望は多いと思うんだが、まだ実現してないんだよなぁ。
実現したとしても、1GB近いインデックスをメモリに読み込んでは検索して、
また次のインデックスを読み込んで検索して‥‥と、分割数が増えれば
増えるほど、どんどん低速になっていかざるを得ないんで、実用度としては
厳しいかも。
遅くなるのは仕方ないよ。
一々切り替える手前が面倒なだけだから要望しているんだろう?
>>482 1つのインデックスが500MBと仮定して、4つのインデックスを横断検索すると
2GBのインデックスがメモリに常駐することになる。
単に「切り替えて順番に検索」ならインデックスは都度メモリから解放されるけど
横断検索は検索結果を表示したままにしないといけないからそうはいかない。
どんどん新規ウィンドウを開いていかないといけない。
かなりのマシン負荷がかかると思うし、実装されたらされたで不満でまくりになるんじゃないかな。
馬鹿ですか?
>>484 読解力無いな。いいから首吊って来いよ。
486 :
あぼ〜〜ん:2006/09/15(金) 11:42:04
あぼ〜〜〜ん
読解力w
485の馬鹿さ加減に拍手を送りたいw
>>485 理由無く煽る馬鹿はいないよ
いい機会と思って反省したほうが君のため
>>488 何を反省すんだよ。ヴォケが。
サーチクロスのあのでっかいインデックスをいくつも切り替えて
横断検索することに合理性があるのかって話だろ!?
読解力無いな。
491 :
名無しさん@そうだ選挙にいこう:2006/09/15(金) 15:51:32
コピペ乙
スレが伸びたとおもったら
間抜けが一人暴れているようだな
____
/ \ /\ キリッ
. / (ー) (ー)\
/ ⌒(__人__)⌒ \ < 間抜けが一人暴れているようだな
| |r┬-| |
\ `ー'´ /
ノ \
/´ ヽ
| l \
ヽ -一''''''"~~``'ー--、 -一'''''''ー-、.
ヽ ____(⌒)(⌒)⌒) ) (⌒_(⌒)⌒)⌒))
____
/_ノ ヽ、_\
ミ ミ ミ o゚((●)) ((●))゚o ミ ミ ミ
/⌒)⌒)⌒. ::::::⌒(__人__)⌒:::\ /⌒)⌒)⌒)
| / / / |r┬-| | (⌒)/ / / // <だってお www
| :::::::::::(⌒) | | | / ゝ :::::::::::/
| ノ | | | \ / ) /
ヽ / `ー'´ ヽ / / バ
| | l||l 从人 l||l l||l 从人 l||l バ ン
ヽ -一''''''"~~``'ー--、 -一'''''''ー-、 ン
ヽ ____(⌒)(⌒)⌒) ) (⌒_(⌒)⌒)⌒))
長いことサーチクロス使ってるけど、
http://www.vector.co.jp/magazine/softnews/040410/n0404101.html ↑で作者が述べてるように形態素解析は使ってないってことで、
どういうアルゴリズムなのかずっと疑問に思っていた。
で、「サーチクロスは形態素解析によるインデックス化を行っておりません」という文章だけ
インデックス化してみたところ、次のような手法を採っていることが分かった。
(1)まず文章から記号類とひらがなを除去する
「サーチクロス形態素解析インデックス化行」
(2)これを文字コードによりカナ・漢字・英字に分割
「サーチクロス | 形態素解析 | インデックス | 化 | 行」
(3)分割された単語をN-gram法で索引化する
「サ | サー | サーチ | サーチク ・・・・・・ッ | ック | ックス | 化 | 行」
検索語が「チク」や「態素解」などでもヒットすることから確認
(4)5つの単語をN-gram法でインデックス化することで
サーチクロス 6+5+4+3+2+1=21
形態素解析 5+4+3+2+1=15
インデックス 6+5+4+3+2+1=21
化 1
行 1
59単語が索引登録されることになる。
この単純なアルゴリズムが高速なインデックス化の秘密なのだろう。
ちなみに「先頭一致検索」にチェックを入れるとノイズは減るが、
「解析」で検索しても「形態素解析」はヒットしなくなる。
以上チラシの裏でした。
ここは483が自分が何故馬鹿と言われるのかが理解できずに暴れるスレですね
AAに逃げる所からも彼の自分の頭で物を考えられない幼稚さがよく出ている
自分の頭で物を考えられない
幼稚さがよく出ている
 ̄ ̄ ̄)/ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
( ^ω^) ∧_∧
/ \ ( )何言ってんだこいつ
.__| | .| |_ / ヽ
||\  ̄ ̄ ̄ ̄ / .| | |
||\..∧_∧ (⌒\|__./ ./
||. ( ) ~\_____ノ| ∧_∧
/ ヽ 氏ねよ \| ( )
| ヽ \/ ヽ. オマエ馬鹿だろ
| |ヽ、二⌒) / .| | |
>>495 ひらがなが検索できない点でそーやってるだろうってのはすぐ分かったけど、
N-gramの部分はもうちょっと工夫してるかもしれんと思ってた。
(そのやり方だと辞書が大きくなりそうだけど、そうでもないから)
499 :
名無しさん@そうだ選挙にいこう:2006/09/16(土) 00:19:00
日本語、にほんご、nihongo
で検索できるのはありますか?
Tiger
なんかサーチクロスで盛り上がってるから俺もサーチクロスの話題をw
複数のキーワードが「スレ」に含まれるんじゃなくて、「レス」に含まれてるのを
抽出できなかったから導入を諦めた。
かといっても他に代替ソフトが無かったので自分でそれ専用の糞ツールを作ったんだがな。
もう2年前の話だがこれが出来るソフトってもうあるの?
サーチクロスのレスごとにわけられちゃう方ならできそうだが・・・
まあ流れわからなくなるが
あとxdoc2txtにメタ情報抽出機能が付いて
サーチクロスにインデックス串刺し検索が付けば最強かな。
そういやWindowsデスクトップサーチではzipやメールの添付ファイルも
検索できるんだった。ただ2ちゃんDATだけはどうしようもないしな。。。
壷を使えばHTMLとしてキャッシュしてくれるな
ただ機能が少ないのがちょっと、、、
需要もないしな・・・
わざわざhtmlにする必要ないし
いや、HTMLならWDSで使えるじゃん
>>504 できる?
出来るならスレを専ブラで開けば流れは分かるから楽なんだが。
サーチクロスのデフォルト設定を使ったインデキシングがいつも失敗するから
1レス1文書のほうは成功したこと無い。
>サーチクロスのデフォルト設定を使ったインデキシングがいつも失敗するから
PC環境が悪いんじゃね?
うちは失敗したことないし・・・
>>510 XP2台と2000にも入れなおしてみたけど駄目だったよ。
どれか1台でもきちんと動作すればそれをファイルサーバーにしたいんだけどね。
っxdoc2txt
>>512 それ、スレ丸ごと。
レスごとは内臓を使わないと無理。
サーチクロスのダウンロード販売いつの間にか終わってたんだな
515 :
名無しさん@そうだ選挙にいこう:2006/09/20(水) 13:54:57
Windowsデスクトップサーチのインデクシング、サーチクロスなみに早いな。
本当に形態素解析使ってるのか?
体感でnamazuのインデクサ(mknmz)の10倍以上・・・
BYTE LAB「デスクトップ検索」(2):ITpro
http://itpro.nikkeibp.co.jp/article/COLUMN/20051208/225942/ Googleデスクトップ検索とSpotlightは,インデックス生成の負荷とサイズを軽減するために,
抽出したテキスト情報の一部しかインデックスに含まない。重要な情報が先頭に位置することが
多い一般的な文書構造であれば問題ないが,大きなファイルの後方にある単語を対象に
したキーワードでは検索漏れが起こる。
GDSの5000文字制限は有名だったけどSpotlightもそうだったのね。。。
事実上、全文検索とは言えないじゃん。
前スレとかでSpotlightマンセーしまくってた連中はなんだったんだ?
インデクッスである以上検索漏れはしょうがない
見つからなければ全文検索すればいいんだしさ・・・
>>517 さて、ここのスレタイはなんだったでしょうか?
517はMac教徒
ConceptSearchって、2chのログも検索対象にできるのでしょうか?
そのためには、2chのビューワーも限られるのでしょうか?
それとも他のソフトでできるものがあるのでしょうか?
>>520 専ブラのdatログに対応してるのはサーチクロスと
あと、GDSにプラグインがあったと思う。
ConceptSearchは自然文検索でGoogleに馴れた我々からすると
かえって検索しづらいそうだし、検索漏れも多いみたいだからおすすめできない。
>>514 あそこは機能は少ないけどユーザーの要望をどんどん取り入れていつのまにか高機能で
バグの少ないソフトができあがるメーカーだったのにこれまでと対応が変わってきたからね。
コンシューマー目当てのソフト業界から撤退したりして。
524 :
名無しさん@そうだ選挙にいこう:2006/09/23(土) 00:46:03
411 名前:名無しさん@お腹いっぱい。 投稿日:2006/09/22(金) 10:32:16 392HYhyT0
唯一といって良いWindowsネイティブなフリー全文検索ソフト「探三朗」を使ってみた。
すごい小さいパッケージでインストーラも無し。適当なフォルダにおいて実行ファイルダブルクリックするだけ。
namazuとは正反対のお手軽さだね。
インデックス作成も煙草吸ってる間に出来上がるって感じ?サーチクロスと同等の早さじゃないかな?
検索インターフェイスも至ってシンプル。検索は一瞬で検索結果はスコア・パス・サイズ・日付でソート可能。
インデクシングのアルゴリズムはおそらくN-gram。だから「メータ」で「パラメータ」がヒットする。
インデックスは探三朗をインストールしたフォルダの\filterにsindex.datとsindexi.datという名前で保存される。
前者がインデックス本体?中身はテキスト+バイナリでインデックス化した全文がごちゃ混ぜで入ってる。
少なくとも転置インデックスの体裁は取っていない。何なんだ?このファイルは。
もう一つのsindexi.datはファイルパスが更新日付やサイズとともに1レコードずつ格納されている。
一体どういう手順でインデックスから文書を探してくるのか不明。
表示がカスタマイズ出来ないなど
使いづらいんだよな・・・
無料で手軽だからいいけどさ
検索したいモノの8割がメールだから、対応してないと結局使わないんだよね。。。
>表示がカスタマイズ出来ないなど
>使いづらいんだよな・・・
デフォルトが使いやすくなってればカスタマイズできなくても気にならないんだけどね。
大体メールクライアント単体で標準装備しててもいい機能じゃない?>索引型全文検索
Windowsヘルプでさえ搭載してるっつうのに……
高価なOutlookでさえないもんな。
俺が知ってる限り、インデックスを使って検索ができる機能が最初から付いてきた
メールクライアントは「Notes R5 Client」だけだ。チョー使いにくかったけど。。。
>高価なOutlookでさえないもんな。
嘘はいくないw
糞ソフトだけどさw
メールだけでインデクッス型が必要な理由が分からん
俺は全部Gmailに転送してる
テラ便利
しかしアレ正式サービスまでやたら長く掛かったな
>>530 嘘でしたか。すみません。
一応チョコっと使ったことはあるんだけど気付かなかったな。
使い勝手はどうなの?>Outlookの検索
>>531 全文検索型の方が漏れがなくていいのにな・・・
Beckyに対応している全文検索ソフトは、サーチクロスとGDS + plug-inだけ?
>>535 GDSは全文検索ではないと何回言えば・・・
>>535 書き込む前に
ちょっとは調べろよ・・・
嘘情報を書いて信じる人がいたらどうする気なんだろう・・・
先頭から5000語までなんだから、メールぐらいなら全文インデックス化すると思うが
でもこの「語」ってわかりにくいよなぁ、Byte制限にしてほしい
つかGDSくらいオープンソースにしてくれよ
byteのほうが分かりづらい
>>534 その「全文検索型」ってのはいわゆる「grep型」のことだろうけど、
会社のメールなんか1日10通以上来るし、それが7〜8年分溜まって
恐ろしいことになってる。
ましてや「受け付け」と「受付」であいまい検索とかしてると
1日中メールの検索にPC占有されちゃうよ。
>>543 なんで片方しか使わない前提なの?
普段はインデックス型で
漏れが困るときは全文型とか使い分ければいいのに・・・
>会社のメールなんか1日10通以上来るし、それが7〜8年分溜まって
これなら約3万通だし全文検索でも問題ないでしょ
いくらなんでも一日中占有されるのは言い過ぎ
何が何でも全文検索型は否定しないと気が済まないんだろw
grepは全文と言わずにgrepと言ってくれ
読みにくい
何言ってるんだ
grepとは違うだろ
わかってるよ
>>545 一通がものすごく長文とか
添付が多いとかじゃね?w
>>550 ペン持ってる?って聞かれたら
普通はペンを貸してってことなのは分かる?
>>550 >>553みたいな馬鹿はすぐに下らない例え話を始めて悦に入る
というところまでは分かった?
たぶん
>>553はしつこいタイプだから放置した方が良いよ、君がレスしてまた
>>553が大喜びで返してって続くとスレが読みづらくなるから
メールだけでもインデックス型じゃないと
使えないっていってた人はどうしたんだ?
するでしょ
>>556 少なくとも数万件のメールログになると検索結果の表示に
えらく時間がかかるようになる。
検索するときってのは、そのときすぐに結果が欲しいもの。
だからインデックスは必須だし、メールソフトには標準搭載すべきだと思う。
>>530 Outlook2000で確認したところ逐次検索しか無かったよ
量が多くなると遅くなるのは
どれも一緒では?
>>559 インデックス型では量が多くなっても速度は落ちない。
もし Google が grep 型だったら・・・
AMDがウハウハ
インデックス型の場合検索漏れはやむ無しというレスが
>>517にあるけど
N-gram方式の場合は検索漏れはないし、サーチクロスみたく字種で切り分ける
手法でも検索漏れは出にくいよ。
検索漏れが多いのはNamazuやGoogleといったタイプ
>>564 形態素解析で単語に分けてインデックスに登録してるタイプね>検索漏れ
最近は併用するのが流行りらしいけど。
566 :
名無しさん@そうだ選挙にいこう:2006/09/27(水) 20:28:44
>>567 そりゃ文書数が100から100万に増えればある程度は落ちるだろうさ。
でもgrep型みたいに1万倍遅くなったりはしない。
・・・ていうか今さらこのスレでこんなこと言ってるのっておかしくないか?
インデックス型全文検索の存在意義にかかわる話だし。
>>566 一太郎にも対応してるしね。
でもシェアならサーチクロスが圧倒的だし、
フリーでGDSもMSNもある今となってはなぁ・・・
ところでサーチクロス使ってる人に聞きたいんだけど
一番デカいインデックスで単語数はどれくらいになった?
うちの「標準」インデックスは100万超えた所なんだけど
起動時の読み込み速度や検索速度からいってもまだまだ行けそう。
>>568 grep型はソフトによって速度変わるぞ
>>495 (1)と(2)はそんな感じだろうね。
ただ
> (3)分割された単語をN-gram法で索引化する
というのは違うと思う。
(2)で分割された単語テーブルがsxindex.lstで
「先頭一致検索」の時はこのリストをバイナリサーチして
sxlink.dat(転置ファイル?)→sxpath.dat と辿って
結果表示してるんじゃないか?
で、「先頭一致検索」のチェックが外れてるときは単語テーブルを
Grepで検索してる。
だから「チク」で「サーチクロス」がヒットするけどその分時間がかかる。
(マニュアルによると先頭一致検索の10倍以上)
先頭一致〜にチェックを入れると、「チク」で「サーチクロス」はヒットしなくなるけど
結果表示は一瞬になる。
>>569 標準 525万語 209MB
2ちゃん 382万語 908MB
ニュース板 239万語 491MB
「cache」フォルダがデカいんだよな。
これって文書フィルタ通すときに使うだけでしょ?
消してもいいのかなぁ。。。と思って消してみた!
結果は検索には影響ないみたい。ただ検索結果をプレビューするごとに
新しい「cache」フォルダが作られて、どんどん溜まっていく。
キャッシュを除いた容量を書くと、、、
標準 525万語 165MB
2ちゃん 382万語 102MB
ニュース板 239万語 57MB
574 :
名無しさん@そうだ選挙にいこう:2006/10/03(火) 15:50:40
家ではサーチクロス使ってんだけど、会社のPCにWindowsデスクトップサーチ入れてみた。
インデックス作成はやっぱ時間かかるね。初日は電源入れっぱなしで帰宅した。
ネットワークサーバーも検索対象に指定できるし、インデックス保存場所も
カスタマイズできる。こういいたところはGDSより優れてるね。
検索結果はファイル名・フォルダ名・メタデータまで検索するから
かなり件数が多くなるけど、漏れがないという点ではこの方がいいかも。
あと、複数インデックスへの対応、リムーバブルメディア対応、2ちゃんDATのiFilterとか
が出てくれば最高なんだがなぁ。。。
漏れはあるだろ・・・
基本が分かってない奴のレポはゴミだな
>>575 その程度で玄人ヅラですか( ´,_ゝ`)プッ
ファイル名・フォルダ名・メタデータまで網羅しているという意味の「漏れがない」
N-gramでない限り検索漏れはあるに決まってるし、それはサーチクロスも
GDSもConceptSearchも同じだから比較にならない。
N-gramでも漏れはありますよ
>それはサーチクロスもGDSもConceptSearchも同じだから比較にならない。
漏れ具合が違いますから比較する意味はあるよ
検索に対するアプローチも全部違うしね
どれも五十歩百歩じゃないかな
漏れが気になるならgrepしか無いと思われ
579 :
名無しさん@そうだ選挙にいこう:2006/10/04(水) 05:56:59
うるさいな
N-gram最高なんだよ
N-gramに漏れはないよ。漏れがあるなんて何を根拠に言ってんの?
そもそもWDSは「全文」検索じゃないだろう、と今更
次スレではスレタイ考えた方がいいね
検索漏れがあったら「全文検索」じゃないんだったら
grep以外は全文検索じゃなくなるのか?
じゃnamazuも「全文検索」じゃないってことだな
namazuは設定次第だろ
これだから馬鹿は・・・
N-gramはノイズが大杉
>>585 namazuを設定次第でGrep検索できると思いこんでる馬鹿発見!!
588 :
名無しさん@そうだ選挙にいこう:2006/10/04(水) 11:27:24
>>581 「全文検索」
http://ja.wikipedia.org/wiki/%E5%85%A8%E6%96%87%E6%A4%9C%E7%B4%A2 > N-Gram
> (中略)
> たとえば「全文検索技術」という文字列の場合、「全文」「文検」「検索」「索技」「技術」と2文字ずつ分割して
> 索引化を行ってやれば、検索漏れが生じず、辞書の必要も無い。
577 名前:名無しさん@そうだ選挙にいこう 本日のレス 投稿日:2006/10/04(水) 02:58:59
N-gramでも漏れはありますよ
577 名前:名無しさん@そうだ選挙にいこう 本日のレス 投稿日:2006/10/04(水) 02:58:59
N-gramでも漏れはありますよ
577 名前:名無しさん@そうだ選挙にいこう 本日のレス 投稿日:2006/10/04(水) 02:58:59
N-gramでも漏れはありますよ
577 名前:名無しさん@そうだ選挙にいこう 本日のレス 投稿日:2006/10/04(水) 02:58:59
N-gramでも漏れはありますよ
馬鹿皿仕上げ
N-gram信者って
なんで必死なの?
N-gramは他のインデックス型に比べたらいいのは事実だからね
ただ漏れがないとか信者発言は痛いよな・・・
592 :
名無しさん@そうだ選挙にいこう:2006/10/04(水) 12:53:13
http://www.blwisdom.com/word/key/000876.html > N-gram方式
> (中略)
> N-gram の長所として、検索漏れがない、文法解析をしていないので多言語展開が容易などがあり、
> 漏れがないという利点を利用して特許情報の全文検索に用いられたりすることがある。
理論上検索漏れがないのはどこのソースを見ても明らか。
「ギリシア」で「ギリシャ」がヒットしないから漏れがある、とか言ってんじゃねえだろうな
馬鹿発見w
>>592 >「ギリシア」で「ギリシャ」がヒットしないから漏れがある、とか言ってんじゃねえだろうな
どこを読んだからこんなことが言えるんだ???
それと単語だけじゃなくて文でも考えてみろよ
だから「N-gramに検索漏れがある」という具体的事例なり
ソースなり示してみろよ。フォルスドロップと検索漏れをごっちゃにしてんじゃねえだろうな
ギリシアに行った。
だとアに行とかで引っかからんよ
単語によっては結構あるのよ
今はインデックス型とgrep型両方使うしかないんだよな
N-gramはゴミも多いしいつ使っていいか分からん
検索も遅く漏れもあるしさ・・・
598 :
名無しさん@そうだ選挙にいこう:2006/10/04(水) 14:14:59
うるせいよ馬鹿
N-gram最強なんだよ
>>595 お前は普段使ってるのか?
使ってる人なら理屈を知らなくても
漏れがあるのは知ってるはず
600 :
名無しさん@そうだ選挙にいこう:2006/10/04(水) 15:36:10
>>599 N-gram式ならQuickFinder2.0を使っていたし、
平凡社の「世界大百科事典第2版」の全文検索もたぶんN-gram。
最近ならDesktopHE(Hyper Estraierのスタンダロン)を試用したことがある。
いま、ためしに「ギリシアに行った。」と記したテキストを保存して
DesktopHEでインデクシングかけてみた。
結果は「アに行」でも問題なくヒットした。
N-gramに検索漏れがあるとか言ってる奴はサーチクロスをN-gram と勘違いしてんじゃねえの?
原理通り全部インデックスにしてれば漏れはない気がするが
原理通りなら元のファイル容量を大きく超えないか???
うむ。それを実装してるとは思えない。
だから漏れはあると俺も思う。
ギ、リ、シ、ア、に、行、っ、た、。
ギリ、リシ、シア、アに、に行、行っ、った、た。
ギリシ、リシア、シアに、アに行、に行っ、行った、った。
ギリシア、リシアに、・・・
信者はたぶんNの値が小さい時の場合しか考えてないんでしょ
全パターンをインデクシングしてるのもあるんだろうか?
>>600 「ギリシアに行った。明日はドイツに行くつもりです。」
を「アに行った。明日はドイツに行くつもりで」でも出る?
607 :
名無しさん@そうだ選挙にいこう:2006/10/04(水) 16:16:48
http://www.ipa.go.jp/jinzai/esp/2004mito2/mdata/4-4.html > Hyper Estraierの方式では、インデックスサイズを対象文書のサイズの半分以下に抑えることができる。
> これにより、普通のパソコンクラスのリソースがあれば100万件(10GB)以上の文書を
> 対象とした検索システムが実用的に使えるようになった。
N-gram 方式のインデックスは通常、バイナリ圧縮されてるし、同じ文字のリピートが
多いから圧縮率も高くなる。
おまけにHyper Estraierみたいに位置情報をもたせない仕組みを設けて
いっそうサイズを小さくする工夫がなされているものもある。
>>603 だから「思う」じゃなくて、実際にN-gram で検索漏れが発生している実例を出してくれよ。
まあ、漏れがある時点で「純粋なN-gram」であるはずは無いんだけど。
>>607 >まあ、漏れがある時点で「純粋なN-gram」であるはずは無いんだけど。
漏れがあってもN-gramだぞ
公式を嫁
>>606 やってみた。問題なくヒットする。
疑うんならDesktopHE を入れて試してみればいいよ。
適当なフォルダに解凍してダブルクリックするだけのシンプル設計だから。
>>607 596の例でも
bi-gramならヒットしないよね
つまりN-gramはNの値と検索文字数によって漏れが出るのはしょうがない
長い文字列じゃ検索シネーヨで終わる予感w
>>610 はぁ?
Bi-gramでもヒットするに決まってるじゃん。
(index)ギリ、リシ、シア、アに、に行、行っ、った、た。
(query word)アに行
query wordは「アに」と「に行」に分解されてindexに対してAND探索かけてみたら
結果は明白だろ。
>>610 Nが無限のもあるにはあるぞ
ただ実用的じゃないがなw
>>613 茶々入れるのはよせよ
理解してないならレスするな
>>613 そうか!
mono-gramでインデックスを作ってAND検索すれば漏れないじゃんw
俺天才だな
>>615 理解してないのはお前だろ。
Bi-gramを「2文字ずつスライドさせてインデックス化する方式」とでも
思ってんのか?
>>617 N-gram 方式を謳ってるエンジンの多くは
@まず文字種ごとに区切る
AそれをN文字(ふつうは2〜3)単位で索引化
だから違う文字種が混ざると漏れが出るわな。
Hyper Estraierはそれでも優秀な方だし実用上問題はないだろ
>>597 共起関係を調べたりでしょ
検索で使ってる人よりも多いしさ
漏れがないって人は
根拠を示して欲しいな
リンク先は都合のいい部分しかかかれてないし・・・
622 :
名無しさん@そうだ選挙にいこう:2006/10/04(水) 16:46:59
信者は絶対に認めないよ
AND検索まで持ち出したのは笑ったw
>>621 「N-gram」でググればいい。どこのサイトにも「検索漏れがない」って書いてあるだろ
624 :
名無しさん@そうだ選挙にいこう:2006/10/04(水) 16:47:53
>>622 だから理解してないんならしゃべんなよ。
「AND探索」ってのは検索エンジンがクエリワードをN字ごとに切り分けて
転置ファイルの文書IDをAND条件で拾ってくるってことだ。
N-gram方式の場合は必ずこれが行われている。
実際、Hyper EstraierはBi-gramだけど
>>600にあるとおり、
ヒットしてるし。
>>610の理解してるBi-gramってのはどういうモンなんだ?
626 :
名無しさん@そうだ選挙にいこう:2006/10/04(水) 16:53:25
N-gramってどうやって使うんだ?
細かいことはもうどうでもいいよ
事実、漏れはあったし
>>623 N-gram 検索漏れがない の検索結果 約 29 件中 1 - 16 件目 (0.21 秒)
N-gram 検索漏れがある の検索結果 約 880 件中 1 - 100 件目 (0.26 秒)
>>625 お前こそ理解してないだろ・・・
Estraierがないのは当たり前
だからといってN-gramでもないとは言えないんだよ
>>625 上の方でギリシアとギリシャがあったけど
どちらで検索しても漏れがないgrepやインデックス型もあるけど
だからといってgrepやインデックス型の特徴とはいわんだろ
「BBSではハンドルネーム」が「Sではハンドルネーム」だと引っかからない。
これは英字と日本語を分離させてからN字に区切るHyper Estraierの
アルゴリズムに起因する問題だろ。(そもそも実用上問題ないが)
N-gramアルゴリズム自体には検索漏れが生じる隙間はない。
たぶん世の検索エンジンで「N-gram」を名乗るものには
字種で切り分けてからインデックス化するタイプが多いんだろう。
だから
>>596みたいなとんちんかんな話が出る。
>>629 だから実例で示せっつってんのに。
>>623 Googleは検索 | 漏れ | が | ある で区切って検索してるから
そんな結果になるんだろw
おれは
>>600で具体的にどんなソフトを使ってきて、
「N-gram 方式には検索漏れがない」って言ってるわけじゃん。
でも「検索漏れがある」派はアルアルと繰り返すばかりで
どういうシステム、またはアプリで検索漏れが発生するのか
全然示そうとしないね。
要するに連中はN-gram の仕組みを理解してなかっただけだろ。
>>629なんてその典型。
>>610 > つまりN-gramはNの値と検索文字数によって漏れが出るのはしょうがない
このあたり全く理解出来てないのが丸見えだな。
Nの値は検索速度に影響してくるが、漏れの発生件数とは何の関係もないのに
漏れの証拠が出たら一気に沈静化したなw
>>637 estcmd create [-tr] [-apn|-acc] [-xl|-xh] [-sv|-si|-sa] [-attr name type] db
インデックスを作成します。
-trをつけると、既にインデックスがある場合にも新しいインデックスを作成します。
-apnをつけると、全ての言語をN-gram法で処理します。
-apnをつけると、全ての言語をN-gram法で処理します。
-apnをつけると、全ての言語をN-gram法で処理します。
-apnをつけると、全ての言語をN-gram法で処理します。
それを使ってないってことはインデックスが馬鹿でかくなるのか?
でも、圧縮できるといってたよなぁ
なぜわざわざパフォーマンスが落ちるものをデモにしてるんだ
>>641 なんのためにN-gram使ってると思っているの?
日本語が分かち書きされていないからだよ?
>>639 いや、どうひいき目にみても
>>617は、いわゆる「検索漏れ」ではないだろ。
形態素解析の検索ソフト(GDSやWDS、CB)つかってみろよ。
「紗綾」で「入江紗綾」がヒットしないとかマジあるし。
>>632 ある の検索結果 約 916,000,000 件中 1 - 100 件目 (0.19 秒)
ない の検索結果 約 583,000,000 件中 1 - 100 件目 (0.29 秒)
「ある」と「ない」で2倍程度しか差がないのに
628では20倍も差ができてるから
お前の理屈はおかしい
>>647 「普通の全文検索では検索漏れがあるが、N-gram法ではない」っていう文章が多いんだろ。
~~~~~~~~~~~~~~~~~
だいたい、形態素解析を使ってるシステムを紹介するページだと、わざわざ自分の弱点である
検索漏れについて触れることすら少ないしね。
「検索漏れ」という単語を多く含んでいるということはそれだけN-gramに検索漏れがない
証拠とも言える
>「検索漏れ」という単語を多く含んでいるということはそれだけN-gramに検索漏れがない証拠とも言える
なんで???
>>648 >「検索漏れ」という単語を多く含んでいる
どこから多くなんて結論が出たんだ?
他のソフトで検索でもしたのなら書いて欲しい・・・
N-gram派が遊ばれてる・・・
>>648 普通はソフト名+バグなら
バグを含んでるととらえるよな
いくら信者でもさすがにその理屈はおかしいよ
>>653 バグと検索漏れじゃ単語としての使用頻度が違うだろ。
つうか、Googleの検索結果で「ブッシュ 悪」が 819,000 件だから
「ブッシュは悪だ」っていう判断と同じだろそりゃ。
いいからN-gramでググってまずアルゴリズムを理解するところから始めろよ
>>655 そんな一例だけもってこられてもw
ググれば評価はいろいろだよ
いいからさっさとN-gramの検索漏れの実例を出せよ。
信者は都合のいい意見しか記憶に残らんから^^;
>>617 の事?
>欧文は単語を単位にして検索され、
>それ以外の言語(中国語、日本語、韓国語、アラビア語など)は文字を単位にして検索されます(N-gram方式)。
って書いてあるけど??
BBSがBSで引っかからないはN-gram使ってないからだろ?
N-gramで検索漏れをなくしたら
grepより遅くならんかな
結局は理屈の上では検索漏れをなくすことが出来るってだけなんだよな
今北産業
とりあえずN-gramは、理論的には漏れは無いはずだ。
アルゴリズムをちゃんと理解すればそれは分かるはず。
で、N-gramには適合率(ノイズが多いってことね)が下がるという欠点があるわけで、
それを補うために検索ソフトが様々な工夫を凝らしている訳だ。
その結果、適合率が上がったが、
N-gramを謳いながらも検索条件によっては検索漏れが生じる事になった。
という事でN-gramに検索漏れはないけど、
N-gramを使った検索ソフトには検索漏れがある場合はあるとういう事でFA?
ソフトのせいじゃないだろw
>>664の見解でほぼFAでしょ。
おそらくLivedoorブログあたりの「N-gram 方式」を謳うエンジンで
漏れを経験したもんだから、アルゴリズムも知らずに「検索漏れはある」
と強弁してたんじゃないかな。
実際、ノイズと漏れとは逆比例の関係にあるから、実装上は
インデックスサイズの最適化も考慮して、ある程度の漏れを
許容してるのが普通だしね。
漏れがないソフトを書けよ
668 :
名無しさん@そうだ選挙にいこう:2006/10/05(木) 13:06:59
estraierは純粋なn-gramじゃないんじゃない?
Ngramって曖昧検索は出来んの?
yes
>>670 あいまい検索はシソーラスを内蔵してるかどうかだから
インデクシング方式とは関係ない。
grep式でも曖昧検索は出来る。(一太郎の全ファイル検索とか)
なんかいろいろサーチエンジン入れるハメになっちゃったんで
この機会に性能比較してみた。
対象フォルダ
70MBのtxt,doc,xls,html,mht混在フォルダ
サーチクロス インデクシング22秒 インデックスサイズ971KB(cache含まず)
DesktopHE インデクシング1分54秒 インデックスサイズ4.8MB
探三朗 インデクシング10秒 インデックスサイズ1.1MB
※探三朗以外は文書フィルタにxdoc2txt.exe使用
「溶接」でサーチ
サーチクロス 5件、DesktopHE 5件、探三朗 2件
理由は探三朗でヒットしなかったファイルは探三朗で未対応の*.mhtファイルだったため
意外と探三朗は優秀か?ただもっと大規模な文書群を索引化してみないと
ノイズや検索時間の問題が出てくるかも分からんから断定は出来んが
ついでにGREPでもヨロ
あと長い単語も
>>674 GREPじゃ「インデクシング0秒」「インデックスサイズ0B」に決まってんじゃないか。
とりあえず、Office SuiteやPDF文書フィルタを備えたgrepソフトなんてないから
WindowsXPの検索で同じフォルダに検索かけてみた(一太郎やPDFのiFilter導入済み)
検索時間50秒で4件ヒット。サーチクロス&DesktopHEと比べて
1件少ないのは、mht文書が1件漏れているから。
その文書には確かに本文に「溶接」の文字が含まれているのだが
Windowsの逐次検索ではヒットしない。フィルタの質が悪いんだろうな
本論は最初から実装として漏れがあるって話だったじゃん
それをN-gram自体はってのにすり替えて勝利宣言かよwwwwwwwww
>>676 「実装として」なんて話なかったよ。
おれが
>>576で「N-gramでない限り検索漏れはあるに決まってるし」と
いったところ、
>>577が「N-gramでも漏れはありますよ」というので
>>580で「N-gramに漏れはないよ」と返したところ、議論になっただけ。
べつに勝利宣言するつもりもないよ。
実装レベルで(文字種による切り分け)でN-gram法でも検索漏れが
出るという認識は俺もほとんど持ってなかった。
ただアルゴリズム上は漏れは出ないという認識は正しいはずだし、
>>617レベルの漏れは実用上なんの問題もない「漏れ」だとは
思うけどね。
このスレはなんで昼間に伸びるの?
業務用として使われることが多く、詳しい人は管理者であり
管理者特権を行使している人が集うから。
ついに認めたなアホ
漏れがあることを認めたんなら、他の形式のソフトと同じと言うこと
もう出てこなくていいよおまえ
「理論上は」と「実装した場合」の区別をわざとつけずに詭弁を弄するだけの馬鹿は消えろ
679の訂正
業務用として使われることが多く、詳しい人は管理者であり
管理以外の仕事を任せてもらえない人も多いようだ。
N-gram "検索漏れがない" の検索結果のうち 日本語のページ 約 6 件
N-gram "検索漏れがある"に該当するページが見つかりませんでした
AN HTTPDとnamazuでLAN内検索システムってのを
前に作ったことがあるんだけど、これからはHyper Estraierだってんで、
同じように挑戦してみた。
●Active Perlが無くても動く
●*.cgiはEXEとして実行可能にしておく
●-pc CP932 オプションを付けてインデクシングする
と、いった感じで進めていった。
インデックスも無事できて検索画面で検索もできるんだけど、
ファイル名に日本語名が入ってると、ブラウザからのリンクが効かないんだよね。
ファイル名がURLエンコードされたままになってるからじゃないかと思う。
mknmzなら-U オプションで解決したんだけど、
Hyper Estraierではやり方が分からん。。。namazuと比べると
WEB上の資料も乏しいし、誰か分かる人いませんか?
>>675 Grep以外は全文検索じゃないとか言ってた奴がいたが、
そのGrepが一番精度低いとは笑えるな
>>683 設定ファイルの
showlreal: true
は指定してみた?
688 :
683:2006/10/05(木) 23:04:02
>>686 すげー!THX!
confいじってからインデックス作り直したらバッチリ動いたよ!
あとはnamazuみたいに複数のインデックスをチェックボックスで切り替えられたらなぁ。
公式みたところでは@genre によるジャンル絞り込みしかできないみたい。
検索時に検索が発生するか否かの議論
>>687 はいはいGrep信者は専用スレでも立ててそっち行ってね。
ここはインデックス型高速全文検索スレだから
>>692 えーと君は精度って言葉の意味を調べた方が良いよ
煽りに煽り返すんじゃなくてさ
ていうか、喧嘩はもうやめよう。
適合率(精度)と再現率の定義から始めないと議論が噛み合わないぞ。
>>695 「ノイズが少ない」では定義として不十分でしょ。
さらに一歩踏み込んで、シグナルとノイズの定義を明確化せねば。
ノイズの定義は明らかでしょ。
まず、フォルスドロップ、ついで単語の切り分けに失敗したケース
「相撲」で検索→「航空相撲殺」がヒット
「スキー」で検索→「ドストエフスキー」「スキーム」がヒット
いずれにせよ上記のようなノイズはN-gram 方式では技術的に不可避だから
WWW検索みたいな大規模な検索エンジンにN-gramを使うのは自殺行為だろうね。
Hyper Estraierのようにハイブリッド式って方向もあるだろうけど
,ィ⊃ , -- 、
,r─-、 ,. ' / ,/ } ち
{ ヽ / ∠ 、___/ |
署 ヽ. V-─- 、 , ',_ヽ / ,' ょ
ヽ ヾ、 ',ニ、 ヽ_/ rュ、 ゙、 /
ま \ l トこ,! {`-'} Y っ
ヽj 'ー'' ⊆) '⌒` !
で , 、 l ヘ‐--‐ケ } と
ヽ ヽ. _ .ヽ. ゙<‐y′ /
来 } >'´.-!、 ゝ、_ ~ ___,ノ
| −! \` ー一'´丿 \
い ノ ,二!\ \___/ /`丶、
/\ / \ /~ト、 / l \
>>697 ところが、細かいところでノイズの捉え方は異なる。
そしてその細かい違いに拘るユーザが多いということがこういった論争を引き起こしている
ような気がする。
例えば「検索」で「全文検索」を該当させるべきか否か。
わかち書きの場合、「全文検索」が辞書にあれば、
そのフレーズは「検索」というクエリではヒットしないことになるが、
それが「ノイズ除去」なのか「検索漏れ」なのかは、ユーザが「全文検索」
というフレーズをどうとらえているかによる。
つまり、「単語の切り分けに失敗」したかどうかが各ユーザの主観に委ねられてしまう
ので、宗教論争になりがちなのだと思う。
ノイズや検索精度の定義が自明でないことを踏まえて、統計的なアプローチをとるのが
賢明なんじゃないかなぁ。
estaierはbi-gramとhashだから
まったくの別物だよ
>>700 スペル間違ってるし、いきなり何言ってるのかも分かんないし・・・
702 :
名無しさん@そうだ選挙にいこう:2006/10/07(土) 06:51:37
>>702 完全N-gramモードで動かせば検索漏れは無くせる。
それはもはやN-gramじゃないですからw
>>702 アフォですか?
Estraierってのは形態素解析を使ったH.E.の前世代エンジン。
検索漏れはあって当然。
Hyper Estraierはデフォ設定だと漏れはあるが
設定次第で完全N-gramにできるから漏れはゼロにできる。
検査漏れもいいけれど、表示の優先度はどうするよ?
つまるところ、ググルのページランクみたいなものだが、実質的な使い勝手
はソート順の方が効いてくる希ガス。
>>705 設定次第なら大抵のソフトでも検索漏れないなw
>>707 ページランクって被リンク先のランクと数から重み付けする方式でしょ?
WWW検索では有効かも知れないけど、イントラネットや個人のアーカイブなら
やっぱりタイトル(ファイル名)と本文に含む数で順位付けするしかないんじゃない?
>>708 namazuはどんな設定しても漏れまくりですが何か?
710 :
名無しさん@そうだ選挙にいこう:2006/10/07(土) 22:28:36
ずいぶんスレ伸びたね。N-gram論争で。
でもここは個人向けの全文検索スレだよね?
もうじきVistaが出荷されるよね。
VistaにはWDSと同エンジンのインデックス検索が標準で付いてくるよね。
君らみたいなマニア層じゃない人はもちろんそれを使うよね。
「すげー、Excelの中身まで一瞬で検索するよ」
「mp3のID3タグやPDFのメタデータまで検索してくれるわ」
「インデックスとか良く分からないけど、いつのまにやら作ってくれてる。便利だなー」
「やっぱシェル統合だね」
オタクは「MSNエンジンは形態素解析の精度がどうのこうの」いうかも
知れないけど、結局サードパーティの変なソフト入れて、インデックス作成に
メモリ大量消費したり、途中でこけたりするサーチ○ロスとかNa○azuとか○straierとか
Concept○earchみたいのはあっという間に淘汰されていくんだろうね。
ムシャ |
ムシャ |
∩___∩ | ぷらぷら
| ノ ヽ (( |
/ ● ● | J ))
. (( | ( _●_) ミ ・
彡、 |∪}=) ,ノ ∴
/ ヽ/^ヽ ヽ 。
| ヽ \ |
| ヽ__ノ
712 :
名無しさん@そうだ選挙にいこう:2006/10/07(土) 23:33:24
Vista 使わないな。XPと2000で間に合う。
2ちゃん専ブラの過去ログ検索にこだわってサーチクロス使ってきたけど
いい方法考えた。
(1)まず
http://tatsu01.at.infoseek.co.jp/ でDAT2HTMLを入手
(2)c:\Program Files に「dat2html」フォルダを作って解凍したファイルを
全部突っ込む
(3)次のファイルをメモ帳で作る
path c:\Program Files\dat2html
c:
cd c:\Program Files\hzb2\users\USER_NAME\log\2ch ←専ブラによる
dat2html /c /t /s
pause conversion is finished
(4)「dat2html.bat」とでも名前を付けて適当な場所に保存
(5)上記バッチファイルをダブルクリックで、専ブラのログ保存場所に
html形式に変換されて保存される
(6)バッチファイルをタスクスケジューラで3日に1回くらい実行させておく
これでGDSやMSN、はてはnamazuでもスレッド単位で過去ログ検索が可能になる
オレって天才!
>>714 バッチファイルの中身を訂正
path c:\Program Files\dat2html
c:
cd c:\Program Files\hzb2\users\USER_NAME\log\2ch ←専ブラによる
dat2html *.dat /c /t /s ←「*.dat」が必要
pause conversion is finished
>>714 それで満足できるなら問題ないけど。ファイルサイズがが大きくなっちゃうとか。
あと、GDSはサイズ制限でイマイチだと思います。
サーチクロスって無料?
否
>>714 面倒じゃね?
メリットもあんまりなさそう・・・
>>719 タスクスケジューラで一度設定しとけばあとは自動的にやってくれるから面倒じゃないよ。
でもログのサイズが倍増するのが玉に瑕。。。
あと、差分だけの変換ってのができないから、実行のたび一から変換になっちゃう。
ログサイズによっては結構時間かかるんだよね〜。
2ちゃんの過去ログを宝の山と思う人でなおかつサーチクロス使わない人は
試す価値あるんじゃないかな?
721 :
名無しさん@そうだ選挙にいこう:2006/10/08(日) 17:00:47
Hyper Estraierってデフォルトでファイルサイズ32MB、テキストサイズ128KBの
制限があるんだよね。どうりで文書の最後の方が引っかからないと思った。。。
で制限を緩めてファイルサイズ512MB、テキストサイズ2048KBにして
Gatherer走らせてみた。テキストサイズの方は何とかなるんだけど、
うちにある透明テキスト入り480MBのPDF(テキスト自体は1MB程度)が「Out of Memory」でこける。
しゃーないから仮想メモリを1024MBまで増やしたんだけど、それでもダメ。
ちょっとメモリ食い過ぎじゃないの?xdoc2txtでテキストをテンポラリーに抽出してから
インデックス化すればいいだけだと思うんだがなぁ。
これじゃ書籍をスクラップしてPDF化した奴はかなり弾かれることになる。
ちなみにこのファイル、サーチクロスやWDSではすんなりインデックス化されるんだよね。
使う前にヘルプ読むなりするから
デフォルトが糞でも問題ない
724 :
名無しさん@そうだ選挙にいこう:2006/10/08(日) 22:21:42
N-gramを使うまでは、僕はまったくもてませんでした。
2ちゃんねるやWarez、最新アニメの話で彼女をひきつけようとしても、白けられるばかりでした。
N-gramを使ってからは全てが変わりました。
全文検索の話で盛り上がり、彼女はもう僕にめろめろです。
素敵な彼女のハートをつかむことを助けてくれたN-gramに僕は大感謝です。
>>722 そういうフィルタを書けばいいんじゃね?
estxfilt.batを適当に改造するだけだから多分簡単ぽい。
>>722 480MBのpdfを作業フォルダにコピーしてからestxfilt.batで変換するようになってるみたいだけど
こけるのは480MBのコピーのときかな?
-fzオプションでコピーを抑止して、estxfilt.bat の中で
%ESTORIGFILE% から読み込むようにすればいいんじゃね?
728 :
722:2006/10/09(月) 01:45:53
estxfilt.bat の中身って単なるxdoc2txtのコマンドだよね。
とりあえずコマンドプロンプトから正常にテキスト抽出できるかどうか試してみたら
「abnormal terminal」と出て、動かない。
物理メモリ512MB、仮想メモリ2048MBのクライアントでGatherer走らせたら
インデックス化できました。結局クライアントがしょぼすぎたっつうことで。。。
xdoc2txt.exeってファイルサイズ分を実メモリに読み込んで処理するんだね
【desktop】Google デスクトップ Vol.3【検索】
http://pc7.2ch.net/test/read.cgi/software/1153406994/l50 329 名前:名無しさん@お腹いっぱい。 投稿日:2006/10/04(水) 11:22:45 sDrCWpEr0
さっきこれ入れてみました。
かのGoogleがやることに間違いはないだろうと楽しみでしたね。
さすがにインターフェイスがわかりやすいです。
スケジューラーないなーと思ってたんですけど探したらカレンダーがありました。
よくわかんないけどユーザー登録して苦労しながら使ってみたら、
いちいちブラウザ立ちあがんのかよと思いましたけどまあいいかな。
そんな間にもデスクトップはPCを検索してくれます。
アイドル状態じゃないと検索しないのかよと思い、すぐ検索を選択。
CPUを80〜90%ずっと使ってます。重い。。。でも意外に遅い。。。
だけどむしろ終わったときに喜びましたね。 いい感じじゃ、さすがグーグル様。
で、感動しながらディスク容量を見たときにびっくり。 なんか1GBとか減ってんの。
調べてみたらデータベースね。 馬鹿かと。 なんでデータベース作んのにそんな容量使うねん。
多分ファイルの内容とかも全部読み取ってんだろうけど、個人的にそこまでしなくていいよ。
題名でだいたい分かるし。勘弁して。 しかもさらに調べたらプロセスが4つぐらい常駐してんのね。メモリ馬鹿食い。
むかついてとっさにアンインストールしようとしたんだけど、 ちょっと待って。
そうか容量食うんだったらデータベースを全部消せばいいんだよな。
よし探し出してShift+Deleteと。 あとGoogleDesktopCrawl.exeを消せばHDDの検索機能止まるから完璧。
しかもGoogleDesktopCrawl.exeのプロセス1個減るからメモリにも優しいっていう。
天才かもしれない。
こんな感じでうまく使いこなせそうです。
みなさんもお試しあれ〜。
釣りだろ。下の中。
Sennaの薄いラッパーにすぎないのに、まるで自社開発の検索エンジンであるかのような
宣伝のしかたはうまいよなー。
>>734 ちゃんと中身を見てからイチャモン付けような。
>>733とは別人だけど、実際はSennaのPostgreSQLバインディングなんよ。
しかもちょっと手が加えられたpg_sennaにconfigureを加えただけと言っても過言ではないようなステキ構成。
それをさも独自開発のように宣伝するのは凄いw
pgestraierやpg_rast(むしろRast本体)に動きが見られない現状、
PostgreSQLに対応したものを出してくれるだけで十分ありがたいんだけどね。
俺も読んだけど
>まるで自社開発の検索エンジンであるかのような
になるのはおかしくね?
>>735 どこに独自開発のように宣伝してる部分があるの?
何も但し書きがない状態で自社サイトに載せてて自社開発でないと思うほうが難しいだろ
そんなこと言ってたら全ての漫画家は手塚治虫のパクりだろ
( ・?ω・?)喧嘩が好きですね
そんなことよりも、サーチクロスで、PDFのフォントとかに制限のないフィルタを探してくれ。
type1 はむりだべ。
type1をフィルタリングできるのは海外にあったけど
標準出力が出来ない。ファイルには出せるけど。
だれか探してくれ。
出来るでしょ
748 :
名無しさん@そうだ選挙にいこう:2006/10/13(金) 15:21:53
N-gram使えば解決
N-gram・・・
とっつきにくそうだな。調べる気にもならなくなるなぁ。
サーチクロスのフィルタとして使えるの?
簡単に説明してちょ。
750 :
名無しさん@そうだ選挙にいこう:2006/10/13(金) 16:22:41
円記号問題がないソフトはありますか?
>>750 HyperEstraier なら"¥"で検索できる。
ちゃんと半角もヒットする。
752 :
名無しさん@そうだ選挙にいこう:2006/10/13(金) 18:12:13
>>745 type1 フォント使ってるPDFを紹介してよ。
抽出できるかどうか試してみるから
そのludiaとやらは、まがりなりにも「オープンソース開発センタ」を名乗っている
部署が作っているわりには、派生元であるSennaに対するリスペクトがなさすぎるよな。
というか、ソース見る限り、わざわざ商標までとるような仕事なのかと小一時間…
$ wc -l pgsenna2.c pgsenna2.h
751 pgsenna2.c
93 pgsenna2.h
844 合計
おとなしくpg-sennaとして出してればよかったのにな。
なんか妬んでけちをつけてるようにしか見えないよな
でも正直、商標はやりすぎだろ
>>755 なんで?
AVEXくらいなら分かるけど
これは何の問題もないとおもうぞ
商標=金儲けの感があるからじゃね?
放っておくと勝手に名前を使われて信用を害されたりするから、防衛的に商標登録することがある。
大会社は信用の保護のために、こういう金にならないものであっても無策ではいられないのだよ。
759 :
名無しさん@そうだ選挙にいこう:2006/10/15(日) 17:26:30
ヤクザな企業が後から商標を取って
「ねー、おたくの会社、うちの名前を勝手に使うってどういうこと?お金払ってよ」
と訴えられるのを防ぐために商標とってるだけ。
>>758のいうとおりです。
755には、なんでやりすぎなのか説明してほしいw
ようするにNamazuのパッケージに新規開発した文書フィルタ追加して
「Hyper NTT SearchSolutionSystem (HN-3S)」とか商標とって
公開してるようなもん?
全然違うだろ
732をよくよめ
>>761 作者は違うと主張するだろうけど、
傍目に見るとそんなレベルだよな。
フィルタとラッパーは同じものなの?
サーチクロスでUnicode(UTF-16),UTF-8のテキストファイルが
インデックス化できないのは有名だが、txt htm html shtml に対しても
xdoc2txt.exeを文書フィルタとして使えば抽出できるようになるんだな。
テキストとHTMLのインデックスを作り直すか。。。
>>752 ありがとうございます。ただ、該当フォントを使ったpdfは新たに作ることも出来ず
機密ではなくとも外に出せる文書ではないため、うpできませぬ。
再度国内HPで紹介され、試用できるものは試してみましたが、やはりだめやった。
どうもありがとう。
767 :
名無しさん@そうだ選挙にいこう:2006/10/16(月) 11:39:11
>>759 みかかが勝手に商標を取って
「ねー、おたくの会社、うちの名前を勝手に使うってどういうこと?お金払ってよ」
と訴えるんじゃないかってことだろ。
もともと他人のフンドシに自分の名前を書いてるんだから
勝手に名前を使われて信用を害されたりするなんて因縁つけるのは本末転倒。
大会社と違ってボランティア組織は金が無いから、こういうことに無策で食い物にされそう。
アンチの論理はおもしろいなw
商標って勝手に取れるものなの?
探三郎、使ってみた。
検索結果から直接文書を開けるのと
結果一覧が見やすいのはイイ!
これで、大文字・小文字を区別するかどうかを
選択できれば完璧なんだが。
行に飛んでくれない
検索結果の画面がカスタマイズできない
もなんとかしてほしい
プレビューで行に飛ぶってこと?
そんなソフトサーチクロス以外にあるの?
あと、探三朗(Vectorなど)なのか探三郎(公式)なのかもはっきりして欲しい
>>772 Copernic Desktop Search2も飛ぶよ
namazuやkwicも飛べる
>あと、探三朗(Vectorなど)なのか探三郎(公式)なのかもはっきりして欲しい
吉とよしのやの「よし」が同じなのと一緒
> 吉とよしのやの「よし」が同じなのと一緒
それは違うだろw
今時の検索エンジンは朗も郎も同一視するから問題ない
一太朗
サーチクロスは標準でUTF-8のHTML文書がインデックス化されないんだよね。
xdoc2txtを外部フィルタとして使えば、UTF-8だろうがUnicode Textだろうが
インデックス化される。
でも、HTML文書ってデフォルトで外部フィルタ選べないようになってんだよな。
で、標準HTMLフィルタはオフにして、「新しいファイル形式」から拡張子とxdoc2txtを
登録する。これでUTF-8な文書も検索できるのはいいんだけど、
今度はHTMLプレビューが使えなくてプレーンテキストになっちゃう。
諸刃の剣やなぁ。なんとかしてよヴィレッジさん
780 :
名無しさん@そうだ選挙にいこう:2006/10/18(水) 17:07:01
掲示板ないソフトは総じて不親切な気がする
いや、ちゃんとした会社だと別なんだけどさ・・・
掲示板があるだけマシだからな
783 :
名無しさん@そうだ選挙にいこう:2006/10/18(水) 19:55:16
僕もソフト屋のはしくれだけど、掲示板は怖い。
それに面倒くさい。
掲示板を管理してくれる専用の業者に頼むほど予算もないし。
サーチクロス、圧縮ファイルとリムーバブルメディアに対応して欲しいなぁ。
Open Office形式に対応できてんだからzip対応は簡単そうなんだが……
785 :
名無しさん@そうだ選挙にいこう:2006/10/24(火) 13:41:56
テスト
>>776 つち吉はU+20BB7でコード化されてる。メイリオや小塚明朝には入っている。
787 :
名無しさん@そうだ選挙にいこう:2006/10/29(日) 21:00:32
サーチクロスでファイル名のみの検索って出来る?
うちの環境だとファイル名検索をチェック入れると必ずこける。
いつもこけるフォルダを除外に入れても位置がちょっとあとにずれるだけでやっぱり
サーチクロスごとこける。
どうにかならんもんかね。
>うちの環境だとファイル名検索をチェック入れると必ずこける。
単に君のPC環境の問題でしょ
バグならもっと話題になってるはず
サーチクロスは環境ごとに不具合の出方も違うしね。
うちではフレーズ検索の絞り込みが中途半端にしかされない問題がある。
あと
>>787の場合「こける」が何を意味してんのか分からんし答えようもないよ。
一般保護エラーでアプリが落ちるのか、エラーメッセージとかが出るのか
787は単にグチってるだけなのかもね
>>788 PC3台ともこけるんですが。。。
自社エンジンがこけまくってても直さずにxdoc2txtを薦めるソフト会社ですが。。。
こんなことぐちりながらも他にいい商品が無いから使ってる俺も俺ですが。。。
>>789 スマソ。アプリごと落ちる。
793 :
787:2006/10/30(月) 21:51:32
ばかはてめえだ
質問すらまともに出来な奴はスルーしたほうがいい
優しくて損したなw
>>792 詳しい状況も何も対象フォルダをCドライブ全体を指定してIndexを作るだけ。
これでサーチクロスが丸ごと落ちる。
フォルダの範囲を小さくするとまともに動く。でもCドライブを丸ごと指定すると駄目ぽ。
>>793 あんただぁれぇ?
>>791 ひょっとしたら「こける」のはインデクシング最中にってこと?
>>787の書き方だと検索をするときにこける、みたいに読めてしまう。
もしインデクシング中にこけるんであれば、単に搭載物理メモリに対して
インデックス対象ファイル数が多すぎるだけだと思う。
経験則からいくとメモリ1GBに対してファイル20,000個が限界。
うちではインデックス作成の時に少しずつ対象フォルダ&対象拡張子を
増やしていき、一度のインデクシングで対象を1万数千ファイル程度に抑えてる。
対象フォルダや拡張子を増やすときに「一から作り直せ」みたいなメッセージが出るが
無視して「更新」し続けていれば、いつかは完成する。
一度出来上がれば、あとは適当な頻度で更新すれば、もう強制終了することもなくなる。
>>796 レスどうも。そうです。インデクシング中にこけます。
メモリは4G乗せててOSに3.5G、RAMディスクに500M割り当ててます。
一から作り直せって言われても無視して更新すればいいんですね。
やってみます、と書いてやってみたら出来ました。
ありがとうございました。
あともう一つ教えて欲しいのですが、全ドライブを検索対象に入れる
いい方法は無いでしょうか。
マイコンピュータ自体を指定不可なので、今はCとDドライブのインデックス、
Eドライブのインデックスと分けています。
>>797 ???また良く分からんことを・・・
「インデックス対象」ってとこに新規で「フォルダ1=c:\」「フォルダ2=d:\」って
つくるだろ。そしたらもう1回、「新規」ボタン押して好きなドライブ追加していきゃ
インデックスは1つ(標準)だけでできるだろ。
ただ、そこまでやるとインデックスが肥大化しすぎて、
読み込みに何十秒もかかるようになって実用に耐えられないんじゃあるまいか
>>797 いつどこで何をしてたら
どうコケるのか書けよ
基本的なコミュニケイト能力がないな・・・
うるせー
すみません、自己解決しました。
お騒がせしました。
>>798 す、すまん。馬鹿だった。許してたもれ。
試しにwindowsでファイル名のみにチェックを入れて検索してみたら、
readme.txtとかが大量にヒットした。原因はフォルダ名にWindowsを含んでるだけ。。。orz
使えないっす。。。
おまえら優しいな
俺はバカに答える気になれんわ
>>802 フルパス名が検索対象になってるからいいんじゃないか。
「windows」なんかで検索すなよ。アホかっちゅうの
>>802 いや、それは正しい挙動だろ?>windowsを検索でフォルダ名にWindowsを含む
それが探せないほうが困る。
というか、基本的にはシステムディレクトリ(c:\winntとかc:\windowsとか)は
外したほうがいいんじゃね?
場合によってはc:\program filesとかも外したほうがよさげ。
(上記は別indexにしたほうが便利)
バカばっかりだな
自己紹介乙
>>804 何を必死になってるのか知らんがファイル名のみで検索するオプションなんて
どんなファイラーの検索コマンドにもあるぞ。
フォルダ名を含むか含めないか選択させればいいだけの話だろ?
804はアンチが煽り失敗したようにみえるよな
かいたときはみんな賛同してくれると思ってたんじゃないかな
もうVistaの検索でいいやん。
お前らも次PC買い換えるときはVista入ってるだろ。
セットアップしたら有無を言わさずインデックス作成してくれてるよ。
宣伝乙
812 :
名無しさん@そうだ選挙にいこう:2006/11/24(金) 14:44:37
社員乙
>>814 この記事は一太郎とWEB検索との連動についての記事。
CSはデスクトップサーチだから関係ない。
>>816 ジローサーチ?次郎さんが開発したのか?
サーチクロスって起動して即フリーズ。
なんだよ、この糞ソフト。
アンインストールも上手く出来ないし。糞過ぎるぞ。
820 :
名無しさん@そうだ選挙にいこう:2006/12/09(土) 15:04:41
>>819 金払ってるワイ。
貧乏割れ厨と一緒にすんな。ここはビジネスsoft板だ、経費だよ、経費。つーても2000円程度だったなw
金ならある、まともな検索ソフト教えれ。
茨城県
>>820 普通に使えてる人もいるしPC環境のせいでは?
818はただのアンチだろ
>>818 > サーチクロスって起動して即フリーズ。
ありえねえし。どうせOSがMeかなんかだろ
Copernic Desktop Search 2のバージョンが2.02になったみたい。変更点は以下の模様
Changes & improvements
Toolbar now compatible with Firefox 2.0
Improved previewing of plain text email messages
Improved plug-in support
Fixes
Fixed index update issues with non-permanently connected network drives
Other stability and performance tweaks
826 :
818:2006/12/10(日) 17:48:52
>>824 インスコ直後は普通に使えていたんだけど、そのうちに起動しても枠だけ表示されてボタンとかが全く表示されなくなった。
これは最小化してから元のサイズに戻すと表示されていたので使えてた。
その後は起動直後にフリーズ。インデックスが大きすぎたのかな??
結構、お気に入りのソフトなので使えれば使いたいですよ。
> サーチクロスって起動して即フリーズ。
> なんだよ、この糞ソフト。
> アンインストールも上手く出来ないし。糞過ぎるぞ。
> 金払ってるワイ。
> 貧乏割れ厨と一緒にすんな。ここはビジネスsoft板だ、経費だよ、経費。つーても2000円程度だったなw
> 金ならある、まともな検索ソフト教えれ。
お気に入り、ねぇ……
828 :
名無しさん@そうだ選挙にいこう:2006/12/10(日) 23:24:14
>>826 昔から、かわいさ余って憎さ百倍というじゃないか。
そういう人情の機微が分からないようじゃ、世渡りが大変だろうな。
831 :
名無しさん@そうだ選挙にいこう:2006/12/28(木) 11:50:12
832 :
名無しさん@そうだ選挙にいこう:2006/12/28(木) 17:44:53
JS検索ツール最強
検索するときに正規表現つかえるし。
>>831 Docuworksに対応してない。
終了
あれ、インデックスサービスのフィルタ使えないの?
835 :
名無しさん@そうだ選挙にいこう:2007/01/08(月) 07:04:04
秀丸エディタでGREP検索
これ最強
秀丸って検索遅くない?
そうでもないか。
Grepなんか使えるか。1000や2000のドキュメントじゃないんだ。
839 :
名無しさん@そうだ選挙にいこう:2007/01/19(金) 11:05:34
だれかHyperestraierでifilterを使えるようにしてくれないかな。
xdoc2txtだと漏れがある感じ。
>>838 それでは、OS付属の検索使え
スタート→検索→ファイルやフォルダ
Vistaの検索って結局どうなんだろう?
エクセルのセルに書いたのやPDFやXDWとかも大丈夫なんかな?
ファイルのセキュリティ設定次第だろ
age
897 名前:名無しさん@お腹いっぱい。 投稿日:2006/10/12(木) 14:05:02 wcjlsRxk
プトレマイオス朝時代のエジプトには、当時世界最大の図書館「アレクサンドリア大図書館」があり、
70万もの蔵書を誇っていたという。
蔵書のほとんどは巻物だったが、1巻200ページ相当として、300dpiでスキャンした場合、1頁500KBとして
1巻100MB、それが70万巻ということは70TBか。
TeraStation 2TBを35台つなげればアレクサンドリア図書館に匹敵するデジタルアーカイブが完成するな。
文字数を見ると、1頁に2000文字のアルファベットが書き込めるとすると、
2000文字×200頁×70万=280,000,000,000文字の知識が詰まっていたということになる。
1文字1バイトなら280GB、UTF-8みたいに1文字3バイトなら840GBか。テキストだけ抜き出せば
個人のPCでも何とかなりそうだな。
さて、これを全文検索かけるとなるとNamazuの場合、対象ファイル数は90万弱が限界みたいだから
http://www.namazu.org/FAQ.html#index-scale 何とかなるかも。
Hyper Estraierの場合、
http://hyperestraier.sourceforge.net/uguide-ja.html#tips にあるように「一つのインデックスに登録できる文書の総量の目安は、プレーンテキストなら300GB」
とのことなので、1文字1バイトならぎりぎりいけそう。UTF-8なら3つくらいにインデックスを分けて
P2P連係させないといけなくなる。
やれば?
848 :
名無しさん@そうだ選挙にいこう:2007/03/25(日) 18:56:34
MitakeSearchあぼーんだって
>>846 あと20年もすれば一瞬で検索できるようになってる。
まぁ机上の空論だがな
違うだろw
覚えたてか?
何が言いたいんだ?
IBM OmniFind Yahoo! Editionってどうよ?
855 :
名無しさん@そうだ選挙にいこう:2007/06/18(月) 09:57:44
低スペック向けのソフトばかりじゃつまらんよ
>>857 >利用するための環境だが(ry
>Windows XP SP2、Windows Server 2003 SP1(ry
>ハードウェアの最小要件は1プロセッサ、1GBのRAM、80GBの空き領域、(ry
対象OSにXPが入っているからクライアント機で使えますよ。
まあ書いて有るように個人向けでは無く企業向けだけど。
855はそういうことを言いたいんじゃないとおもうぞ
単に愚痴ってるだけじゃね?
860 :
名無しさん@そうだ選挙にいこう:2007/07/02(月) 16:59:44
結局GDSのひとり勝ちか。もうこのスレの存在意義もなくなったな
861 :
名無しさん@そうだ選挙にいこう:2007/07/02(月) 21:48:41
DesktopHEいいよ。
インデックスファイルの更新とメールへの対応をのぞけば
サーチクロスと同等かそれ以上。
862 :
名無しさん@そうだ選挙にいこう:2007/08/08(水) 15:51:47
namazu以外でもっとこう簡単に全文検索サーバって立てられないのかね。
GDSはバージョンアップでDNKA(だっけ?)が使えなくなっちゃうし。
手軽におひすでフルテキスト検索サーバを立てたいんだよ俺は
HE
864 :
名無しさん@そうだ選挙にいこう:2007/08/13(月) 01:56:48
DesktopHE(・∀・)イイ!!微妙にアップデートしとる。
OEに未対応じゃん>デスクトップHE
OEなんか使うなよ……
DesktopHEスゴいね。
これで、変更があった部分のみのインデックスの差分更新が
出来るようになったらサーチクロスを完全に喰ってしまうんでないかい?
>>867 DesktopHEのインデックスは変更のあった部分だけだと思うぞ。
GUIでかったりぃーと思うなら,直接”estcmd”にオプション付けたbatにすればよい
ここを参考に
http://hyperestraier.sourceforge.net/uguide-ja.html 本家のゲストブックから受売りだけど,うちの例
インデックスする
estcmd gather -il ja -sd -cm -pc CP932 -lf 8 "インデックス作りたいパス”
複数ある場合は,繰返し書けばいいと思う,
直列でかける区切りは知らん(セミコロンとかやったけど,並列で動いたので未確認)
消した物は消す
estcmd purge -pc CP932 "インデックスのパス"
キーワード抽出する
estcmd extkeys -um "インデックスのパス"
最適化する
estcmd optimize "インデックスのパス"
これをコマンドランチャーから気が向いたときに,バックグラウンドで実行してる。
>>868 > 消した物は消す
> estcmd purge -pc CP932 "インデックスのパス"
↑これってやらないかんものなの?
俺はestcmd gather だけで新規作成、更新も済まして、週一でoptimizeかけてんだけど
>>869 つ込まれても困るが,
こちらの環境では一瞬なので無視してます。(へたれ)
>>868-869 ありがとう。知らなかった。
よく分からないので毎回インデックス削除して、再作成していたよ(´Д`;)
DesktopHE使ってみた。
ツール構成がシンプルでいいね。
残念なのがxdoc2txtでうまく内容を拾えないpdfがあること。
ScanSnapの付属ツールScanSnapOrganizerでOCRしたpdfの中に
xdoc2txtでテキストが抽出できるものとできないものがあって
その境界がよくわからん……。(xdoc2txt単体で試してみた)
GDSでも透明テキスト付pdfの一部でやはりうまく内容が拾い出せないし
WDS3.0はiFilterとの連携がうまく作動しないし(俺の環境が悪そう)
WDS2.6はpdfに関しては問題ないけど検索精度が悪すぎる。
透明テキスト付pdfをきちんと利用できる環境が整わなん。
ウチの環境(Win XP x64), WDS3.0, Acrobat Pro 7 (現在Pro 8)で、
透明テキスト付pdfの全文検索できてますよ。
pdfファイルはWDSのプレビューペインで表示されずに、直接Acrobat
で開きますが。
それに、たまにインデクスしないpdfファイルもあるけど(ネットで拾ってきた
やつ)。なぜか、MicrosofのOOXML仕様書のpdfファイルがWDSで
インデクスされないんだよね。
874 :
872:2007/09/14(金) 12:45:46
64bitのpdf用iFilterあったんか、と思って調べたら
FoxitReaderのiFilterがあるんだね。
うちは32bitXPだけどadobeのからこれに入れ替えてインデックス作り直したら
WDS3.0でもうまく透明テキスト付pdfの内容が拾えるようになったよ。
ヒントをくれた873氏、ありがとう。
アドビ以外で作られたPDFも必要なら
NAMAZUとかで自分で設定しないとダメ
一般向けのソフトでは対応がマチマチ
876 :
名無しさん@そうだ選挙にいこう:2007/09/19(水) 13:37:17
xdoc2txtがいまいちすぎる
ソースよこせば改造してやるのに
xpdfを使え。
DesktopHE使ってみた。
検索結果当初は良い感じだけど、安定して動作しないことない?
フォルダ名の最後が"表"(別の漢字だったかも。うろ覚え)で終わるフォルダは
gather時に全てエラーが発生してインデックスが作れなかったり
正常にインデックス作成できた分も1月ぐらいするとインデックスが壊れちゃったりした。
repairすると復旧できるようになるけど、漏れる率がだいぶ上がっちゃうし。
ちなみに対象ファイルは80Gバイトの100万ファイルぐらい。
うちのPCが不安定なのが悪いのかな〜
試しにやってみたけど
きちんとインデックス作れたよ
1TBをインデックスしてるけど
特に不安定とは感じたことないな
880 :
名無しさん@そうだ選挙にいこう:2007/10/13(土) 10:16:45
サーチクロスなんだけど
二つのエクセルシートへ
100000-1で検索すると
-1以外も検索され
ちゃうんだけど
7箇所ヒット!俺だけ?
ファイル1 ファイル2
100000-3 100000-3
100000-2 100000-2
100000-4 100000-4
100000-1
100000-6 100000-6
100000-0 100000-0
100000-5 100000-5
881 :
名無しさん@そうだ選挙にいこう:2007/10/20(土) 13:51:10
DesktopHEのインデックス
早いね
883 :
名無しさん@そうだ選挙にいこう:2007/10/21(日) 09:29:31
>>882 ビュアーをテキストでなく
OLEにするとダメみたい
884 :
名無しさん@そうだ選挙にいこう:2007/11/11(日) 18:26:29
Vistaの検索使えあげ
>>884 あれ使い物にならん。
結局、従来のインデックスサービス使ってる。
887 :
名無しさん@そうだ選挙にいこう:2008/01/18(金) 14:04:36
ネタないねあげ
>>886 検索結果にノイズ多すぎ。
全然関係無いものばっかり引っかかる。
詳しいドキュメントも持って無いから細かい設定法もわからん。
従来のインデックスサービスのほうがよっぽど役に立つ。
従来のインデックスサービスについてなら
レジストリの設定法まで載ってる詳しいドキュメントを持ってるから
うまく使いこなせるが
Vista検索の詳しいドキュメントを持ってないから使いこなせてないだけかもしれないが、
そういう詳細な日本語ドキュメントを用意してないMSが悪いとも言える。
ノイズが多いのは単にお前が使えてないだけだ
890 :
名無しさん@そうだ選挙にいこう:2008/02/28(木) 13:11:23
DesktopHEでファイルサイズとテキストサイズの上限を調整する方法教えてくれよ。
公式のBBSできいたら?
>>890 本家のBBSからメモっておいたもの デフォは128KBらしい
>[設定]-[上級者向けインデックス設定]の
>「テキスト、HTML、MIMEファイルインデックスコマンド」に文字列を追加してください。
>ファイルの先頭512KBまでを解析させたいのであれば、「-lt 512」
>という文字列を追記してください。
> 数値にマイナスの値を指定すると、無制限になりますが、
>インデックス時にメモリ容量が足りなくなる可能性があります。
DesktopHE使ってみたがいい感じ。
サーチクロスから変えたいけど個人的に検索結果がまだ若干悪いのが惜しすぎる
894 :
名無しさん@そうだ選挙にいこう:2008/03/24(月) 20:13:06
俺は画像とテキスト文書の検索にしか使わないんだが、
グーグルのは巨大テキストファイルは文の後半を読まない。
MSのは検索精度は相当優れているんだが、ビュワーが遅い遅い。
画像管理ならPICASAが相当早くて最強なんだが日本語検索が
まったく使い物にならない。
てことで今はCOPEMIC使ってます。
まあこれも検索精度の点じゃMSのより不満があるけど、ユーザーインターフェース、
速度、機能のバランスが一番いいかな。
895 :
名無しさん@そうだ選挙にいこう:2008/03/24(月) 20:13:57
COPERNICの間違い
896 :
名無しさん@そうだ選挙にいこう:2008/03/25(火) 13:09:49
COPERNICは日本語が弱いんだよねえ。
ファイル名ならひっかかるけど、内容はまったく無視。
グーグルは後半も読むでしょ
COPERNIC日本語引っかかるぞ?
>>896 んなこたーないぞ?
俺の環境では。
メールの文字は化けてるけどね
文字化けするなら日本語弱いと言われても仕方ないのでは・・・。
902「わざと文字化けしてんのか?」
>>900 それで本文引っかかる?
引っかかっても文字化けして読めないなら
あまり意味が無いと思うけど・・・
>>905 導入してみればええやん
結論から言うとかかるし読める
900の環境だけで文字化けするなら
一行目は変じゃね?
908 :
名無しさん@そうだ選挙にいこう:2008/04/08(火) 20:20:51
GoogleデスクトップがVer5になってるけど、結局全文検索ならぬ先頭検索?
yes
高須
HIT率が一番良いのはWDSなんだよなぁ
重いけど
Linux 板と間違えた
誤爆スマソ
◆ハードディスクD ドライブの中のフォルダ D:¥txt 内にある10個のサブ
フォルダ txt01〜txt10 に散らばって保存してある文書ファイル計814本の中から、
「恐慌」の文字列を持つファイルを全て検索する grep のテスト結果
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
EmEditor professional 1秒以内 (マッチした件数を表示しない)
EdTex Editor 2秒以内 (マッチした件数を表示しない)
WZ Editor 3秒以内 (2件ありました、と表示する)
NotePad++ 3秒以内 (find result-2 hits、と表示する)
>>914 訂正です
◆ハードディスクD ドライブの中のフォルダ D:¥txt 内にある10個のサブ
フォルダ txt01〜txt10 に散らばって保存してある文書ファイル計814本の中から、
「恐慌」の文字列を持つファイルを全て検索する grep のテスト結果
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
EmEditor professional 1秒以内 (マッチした件数を表示しない)
EdTex Editor 1・5秒以内 (検索ファイル数とマッチ数を表示する)
WZ Editor 3秒以内 (2件ありました、と表示する)
NotePad++ 3秒以内 (find result-2 hits、と表示する)
Linux 板にでもどうぞ
>>914 参考にはなる人もいるかもしれんがスレ違いだから
出来たら書き込む前にテンプレ読んでくれ
918 :
名無しさん@そうだ選挙にいこう:2008/05/19(月) 07:52:26
DesktopHE使い始めたんですけど、
テキストファイルの内容だけじゃなくて、
ファイル名にもヒットするようにできないんでしょうか?
できる
>>919 どうしたらいいですか?
特にDesktopHEって設定項目が少ない上にヘルプも貧弱で良く分かりません・・・
>>921 すみません言葉足らずだったかも知れません
name:を用いた検索だと、txtやxlsなどは出てきても
mpgやaviなどが検索できないのです
そういうのも検索したいのですが・・・
だからググれよ
ここを特定のサポート代わりにつかわないでくれ。
せめて有益な情報もかいてあれば
別なんだが・・・
レビューとかさ
ググってもでてこねいな
俺も知りたいから教えてくれ
テキストファイルとみなせばいいんじゃね?
お前ら優しいな
やってみたけどできないな
うまく行った人いたら詳しく教えて
>>926 インデックス設定でテキスト〜に対象拡張子を追加
>>928 試しにやってみたが一応出来た。
*.c *.cpp *.pl *.py *.cgi *mpg *.avi *.zip *.rar *.lzh *.mp3
こんなふうにやってるんだがうまくいかんな
一回インデックス消して作り直さないとだめなのかな
教えて君に関わるとろくなことにならないな・・・
>>930 なんでまだ質問するの?
俺もうまくいかね
*
公式サイトすら読まない馬鹿ばっかだな
公式サイトがわかりにくいからしょうがないよ
あれ分かりにくいとか、どんだけゆとりだよw
公式サイト云々言ってる奴はバカだな
このスレの意味ねーだろ
( ´,_ゝ`)プッ
俺も公式は分かりにくいと思うわ
肝心なことがきちんと記述されていない
せめてヘルプぐらいつけろと
上級者向け設定の項目とか、上でも出てる拡張子の書式とか
肝心なことはなーんも書いてないやん
もう少しマジメにヘルプ書けと
確かに書いてないな
煽ってる暇があったらよ〜く理解なさってる
>>943先生がヘルプ作ってやれよ
書いてねえじゃん
こんなマイナーなソフトを使えるぐらいで優越感を持たれても失笑しか出てこんあ
プロテインだね
>>948 こんな単純なソフトすら使えない人って…
>>952 俺はバカでいいから上級インデックス設定についてヘルプ書いてくれよ
単純なソフトなんだからすぐ書けるよね?
お前ら優しすぎ
やっぱりDesktopHEをちゃんと理解してる人はいないみたいだな
なんでこのスレって煽り口調の人が多いの?
>>959 インデックス対象の種類を追加するとか基本的な使い方なら
本家のページさえ読めば書いてあるからできるはずなんだけどね。
出来ない人は読んでないか本当に日本語を理解できないか
ただの荒らしかだろう
対称の拡張子を追加するってのやってみたんだが、
estcmd I/O errorってなってうまくいかないのが既出?
estcmd: ERROR: .cpp: I/O problem
こんなかんじな
で、すべてのファイル名を検索するには?
CDSかGDSかWDSを使いたくないからDesktopHE使ってるんじゃないの
乙
だが早すぎではなかろうか
半年早いと思う
971 :
名無しさん@そうだ選挙にいこう:2008/05/29(木) 10:46:56
Janeの標準ログ検索でデスクトップサーチ使えるぜ。
WDS使用
【54 件見つかりました】(検索時間:5秒)
WDS未使用
【78 件見つかりました】(検索時間:89秒)
WDS3.1って検索精度低い?
関係ないファイルまでヒットしまくるんだけど
パスが検索対象になってるからか・・・
これOFFにできないのか
例)D:\マニュアル\デジカメ\CANON EOS 5D.pdf
キーワード:"マニュアル"
ヒット結果:CANON EOS 5D.pdf
>>973 Janeで一つのレスの中に指定した複数のワードが含まれてるレスを
全文検索する方法なんて無いかな?
janeでやるしかないんじゃないかな?
>>977 Janeではできないぞ?
一つのスレの中に単語が含まれてるかどうかを検索するだけで、レスの中に含まれるかの
判断はしない。
出来るよ
全部のjaneで出来るかは分からないけど
OpenJaneDoeだとできない。
JaneDoe Viewだとできる。
Jane Styleでも出来るね
>>981 えっ?俺Jane Doe Style使ってるけどできないぞ?
ログから検索(G)じゃだめ?
>>983 それは指定したキーワードが「スレ」に含まれているかどうかを検索するんでしょ?
俺が言ってるのは「レス」
ごめん。できた。
通常検索じゃなくて、マルチワードにしないと駄目なんだな。
ありがとう。
あと半年もたす予定のスレを13も減らしてすまってほんっとすまん。
最後はどうでもよくね?
>ビジネスでもプライベートでも必須の環境となりつつあります。
テンプレのこういう書き方はどうかとおもうけど・・・
毎日 全文検索してる人はほとんどいないんじゃないかな
一週間、一月単位でもね
基本フォルダ分けしてるから毎日は使わないけど、
どこに入れたか思い出せないときとか
1週間に1回ぐらいの頻度では使うかな俺は。