全文検索ユーティリティ統一スレッド part3

このエントリーをはてなブックマークに追加
1名無しさん@そうだ選挙にいこう
Mac最高
ドザは氏ね

全文検索ユーティリティ統一スレッド part2
http://pc8.2ch.net/test/read.cgi/bsoft/1108552631/

全文検索ユーティリティ統一スレッド
http://pc5.2ch.net/test/read.cgi/bsoft/1006680403/
2名無しさん@そうだ選挙にいこう:2005/07/06(水) 20:34:59
        ∧_∧
  ナデナデ (´∀`  ) 帰化してから
  ∧ ∧ ⊂( ∪ )    またこようね〜
  <`Д´>  (_(_)
〜(  _ノ
  マカー

以下、「Mac」、「Tiger」、「Jobs」、「Apple」、「iTune」、「iPod」等MacintoshがらみはNG指定。
3名無しさん@そうだ選挙にいこう:2005/07/06(水) 20:42:35
まく たいが じょぶす あっぷる あいちゅーんず あいぽっど まきんとしゅー
4「Spotlight」も禁止:2005/07/06(水) 21:19:13
 はいはい、もうこないでね。  /
______ _____/
         ∨
   ------------- 、____    ウワァァン  ヽゝ     バカ
   /  ̄ ̄ ̄.// ̄ ̄|| |___/\ヽ(`Д´)ノ     ヽ(`Д´)ノ
  イッテヨシ!.∧//∧ ∧.|| |  \ .\(>>1 )ヽ(`Д´)ノ  (>>1
[/_________.(゚//[ ]Д゚#).|| |    \ \/ヽ  (>>1 )   / ヽ   ノ
.||_    ___|_| ̄ ̄ ∪.|.| |___\ \   / ヽヽ(`Д´)ノ      ノ
.lO|--- |O゜.|______ |.|_|ニニニニニニl.|ヽ(`Д´)ノ(>>1)  ゴルァ
|_∈口∋ ̄_l______l⌒ l.|_____| l⌒l_||   (>>1) /ヽヽ(`Д´)ノ
──`--'───`ー'─── `--' `ー' ┐  /ヽヽ(`Д´)ノ(>>1
                         │ヽ(`Д´)ノ(>>1 ) /ヽ     ノ
                         │  (>>1) /ヽヽ(`Д´)ノ
                         │ ミ / ヽヽ(`Д´)ノ  )ジャブーン
                         │  ;:   (>>1 )’/ ヽ〃、、..
                     ボシャーン ミ ミ\ヽ(`Д´)ノ /ミ
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~〜〜〜〜~~~~~~~~~~~~~~~~~~~
5名無しさん@そうだ選挙にいこう:2005/07/07(木) 01:51:25
>>1=ドザ
6名無しさん@そうだ選挙にいこう:2005/07/07(木) 20:41:06
なぜこうなってしまうのか。

じゃあ WinでもMac でもそこそこ使える Unix系のアプリの話をしようか。
Estrainer ってどうよ?
7名無しさん@そうだ選挙にいこう:2005/07/08(金) 23:44:34
やっと馬鹿どもがいなくなったか。
8名無しさん@そうだ選挙にいこう:2005/07/09(土) 09:43:59
まだ7が残ってますよw
9名無しさん@そうだ選挙にいこう:2005/07/09(土) 13:18:13
やっぱTigerの完勝だなw
10名無しさん@そうだ選挙にいこう:2005/07/10(日) 01:10:14
ほらまたきた
11名無しさん@そうだ選挙にいこう:2005/07/10(日) 07:10:21
オマエモナー
12名無しさん@そうだ選挙にいこう:2005/07/10(日) 12:15:47
こんな過疎板の過疎スレでなにやってんだ。
オレモナー
13名無しさん@そうだ選挙にいこう:2005/07/12(火) 02:25:38
前スレで出てたインクリメンタルサーチってN−gramのような感じなの?
14名無しさん@そうだ選挙にいこう:2005/07/12(火) 02:55:14
>>13
つ google
15名無しさん@そうだ選挙にいこう:2005/07/12(火) 04:39:36
もうMacの話はするなよ!絶対するなよ!!
16名無しさん@そうだ選挙にいこう:2005/07/12(火) 09:34:24
ダブルマックバーガー
17名無しさん@そうだ選挙にいこう:2005/07/12(火) 09:42:30
>>14
ググルはインクリメンタルサーチしてないでしょ?あれは形態素解析プラスページランクのはず、nゴラムは関係ないよ。

>>16
ご一緒にポテトとシェイクいかが?っていうかピザでも食ってろ(笑)
18名無しさん@そうだ選挙にいこう:2005/07/12(火) 12:37:44
でにMSの検索ツール使えないよな。。。
マックが現状では進んでるのは事実だよな
19名無しさん@そうだ選挙にいこう:2005/07/12(火) 12:43:50
>>18
ちがうよ
20名無しさん@そうだ選挙にいこう:2005/07/12(火) 15:07:37
“Tiger”入りのPowerMac G5をいじってみた〜Spotlight&Automater編
http://www.itmedia.co.jp/pcupdate/articles/0507/12/news027.html
21名無しさん@そうだ選挙にいこう:2005/07/12(火) 18:28:05
頼むからMacの話題は振らないでくれ!
22名無しさん@そうだ選挙にいこう:2005/07/13(水) 12:10:15
MacってインクリメンタルMigemo検索できる?
23名無しさん@そうだ選挙にいこう:2005/07/13(水) 13:10:12
ひどいよ。やめてよってこんなにたのんでるのに。
24名無しさん@そうだ選挙にいこう:2005/07/14(木) 01:08:52
>>22
できないw
25名無しさん@そうだ選挙にいこう:2005/07/14(木) 03:40:47
>>22
>MacってインクリメンタルMigemo検索できる?
できないというかしてない。
しない方が確率高いし、ローマ字インクリメントを含んだこれまでの検索とは
問題にならない速度差がある。次元が違うって感じ。
26名無しさん@そうだ選挙にいこう:2005/07/14(木) 04:17:24
でた、マカーの姑息ないいわけw
27名無しさん@そうだ選挙にいこう:2005/07/14(木) 08:51:01
どっちでもいいから、Mac対Winの対決をここでやらんでくれ。民度が知れるぞ。
28名無しさん@そうだ選挙にいこう:2005/07/14(木) 21:53:27
>>1
つうかテンプレくらい貼れよ。
ネットワーク上やローカルに蓄えられた大量の文書から
一瞬で目的の文書を検索する全文検索システムは
ビジネスでもプライベートでも必須の環境となりつつあります。

このスレでは主に、LAN・ローカル環境で使用できる
安価な全文検索ユーティリティについて採り上げていきたいと思います。


前スレ
全文検索ユーティリティ統一スレッド part2
http://pc8.2ch.net/test/read.cgi/bsoft/1108552631/

全文検索ユーティリティ統一スレッド
http://pc5.2ch.net/test/read.cgi/bsoft/1006680403/

関連スレ
文書管理ソフト、どこがええじゃろ。
http://pc.2ch.net/test/read.cgi/bsoft/980909106/

【ファイリング】ゼロックスのDocuWorksってP2
http://pc5.2ch.net/test/read.cgi/bsoft/1080963577/

MSNサーチツールバー with デスクトップサーチ
http://pc8.2ch.net/test/read.cgi/software/1119706316/l50
29名無しさん@そうだ選挙にいこう:2005/07/14(木) 22:14:33
>>28
ソフトを2種類しかリンクしてないのはなぜ?
30名無しさん@そうだ選挙にいこう:2005/07/15(金) 01:59:47
[スマートフォルダ]Spotlightを使いこなそう![検索]
http://pc7.2ch.net/test/read.cgi/mac/1114760098/
31名無しさん@そうだ選挙にいこう:2005/07/16(土) 18:44:16
マックについて今まで悪いイメージとくになかったけど

前スレとこのスレみてマックが嫌いになりました。

私は全文検索について知りたかったのですが全然情報が載ってません。
マックのせいだと思います。

昔、パソコンが詳しいクラスメートに宿題教えてもらおうとしたらなんか全然興味ないのにベラベラとよくわかんないことしゃべってあげくの果てに家まできてインストールするとかしないとか。
キモいから友達になる気ないし仮にも女で私の家に押し掛けるなんてアリエナイ。

そんなことがあったのを思い出しましたよ。

マックの人も大半はそんな感じなんでしょうね、あーキモい、おぇっ
32名無しさん@そうだ選挙にいこう:2005/07/16(土) 19:36:05
>>31
そうですね
あなたは正しいですよ
だからもう荒らさないで下さいね
33名無しさん@そうだ選挙にいこう:2005/07/17(日) 04:06:43
ってかマックってデザインだけはいいよね。

箱だけマックで中身ウインドーズにすれば機能もデザインもばっちりじゃね?
34名無しさん@そうだ選挙にいこう:2005/07/17(日) 11:02:42
MacはOSのデザインが良い。
35名無しさん@そうだ選挙にいこう:2005/07/17(日) 14:12:24
スレ違いの話題はそろそろ止めにしなか?
36名無しさん@そうだ選挙にいこう:2005/07/17(日) 17:30:28
1と2前半は良スレだったのにな〜
37名無しさん@そうだ選挙にいこう:2005/07/18(月) 05:09:48
ExpandFinderってメール検索できないじゃん!
ダメダメだわな。
38名無しさん@そうだ選挙にいこう:2005/07/18(月) 14:36:32
CS買えって事
39名無しさん@そうだ選挙にいこう:2005/07/19(火) 03:47:19
月刊アスキー2005年7月号
うらやましいぞ!MacOS X Tiger
http://www.ascii.co.jp/pb/ascii/special/200507_01/200507_01-01.html

読んだ人いる?
40名無しさん@そうだ選挙にいこう:2005/07/19(火) 06:03:16
立ち読みしたけど、予想通りの内容で飽きた。
てか、2ch巡回してりゃ常識なことばっかり書いてある。
スキン変えるとかWidget入れるとか。
41名無しさん@そうだ選挙にいこう:2005/07/19(火) 06:20:17
世の中2ちゃん巡回できる暇人ばかりだったらいいんだけどね
42名無しさん@そうだ選挙にいこう:2005/07/19(火) 10:40:03
グーグルのデスクトップ検索ってインデックス容量は4GBぐらいで
アウトじゃないか

これじゃぁ、使い物にならん
43名無しさん@そうだ選挙にいこう:2005/07/19(火) 19:03:45
4G以上文章を持ってる人がどれだけいるのかと・・・
100Gあっても足りない人はいるだろうし・・・
44名無しさん@そうだ選挙にいこう:2005/07/19(火) 20:22:54
>>43
でも、技術系のマニュアルや論文全部合わせたらそれくらい余裕で行きますが。。
45名無しさん@そうだ選挙にいこう:2005/07/19(火) 21:40:22
>>44
そういう人はGoogle Search Applianceを買えとGoogle様は仰っているようだ。
46名無しさん@そうだ選挙にいこう:2005/07/19(火) 23:58:28
あれ蓮っぽいから嫌い。
47名無しさん@そうだ選挙にいこう:2005/07/20(水) 03:21:30
>>44
そんな一部のオタクなんてどうでもいいと思われ
制限があるかぎりオタクは文句言うんだし言わせておけばいいよ
48名無しさん@そうだ選挙にいこう:2005/07/21(木) 02:47:23
47様が良いことをいいましたよ

そんな一部のオタクなんてどうでもいい。

マックユーザーにぴったりフィットな言葉をありがとう
49名無しさん@そうだ選挙にいこう:2005/07/21(木) 09:38:49
48 名前:名無しさん@そうだ選挙にいこう[sage] 投稿日:2005/07/21(木) 02:47:23
47様が良いことをいいましたよ

そんな一部のオタクなんてどうでもいい。

マックユーザーにぴったりフィットな言葉をありがとう
50名無しさん@そうだ選挙にいこう:2005/07/21(木) 21:53:15
Longhornを超えるか!? 200以上の新機能に要注目
Mac OS X v10.4 “Tiger”
http://review.ascii24.com/db/review/soft/os/2005/07/21/657072-000.html

アップル社が新OS、Mac OS X v10.4 “Tiger”(以下、“Tiger”)を発売開始した。
メタデータ検索機能やGPUを使った画像処理など、WindowsがLonghornで
搭載する機能を先取りしていると注目を集めている。
51名無しさん@そうだ選挙にいこう:2005/07/21(木) 23:16:48
いいなぁ…ほんといいなぁ…
52名無しさん@そうだ選挙にいこう:2005/07/22(金) 01:39:43
お恥ずかしい質問なのですが、Tigerの読みってタイガーですか!
それともティガーなのでしょうか?
53名無しさん@そうだ選挙にいこう:2005/07/22(金) 02:07:41
トラー
54名無しさん@そうだ選挙にいこう:2005/07/22(金) 03:52:51
家にはPowerMac、モバイルはPowerBook、そしてもちすろんiPod、
ええのぉ
55名無しさん@そうだ選挙にいこう:2005/07/22(金) 10:11:03
戦車好き>ティーガー
その他>タイガー
56名無しさん@そうだ選挙にいこう:2005/07/22(金) 12:13:41
ティーゲルだろ
57名無しさん@そうだ選挙にいこう:2005/07/22(金) 19:46:59
>>50
たしかにすばらすぃ。
しかし"Longhornを超えるか!? "っておかしくね?
もともとMacが圧勝してる部分なのに。。
58名無しさん@そうだ選挙にいこう:2005/07/22(金) 20:02:23
LonghornではTigerを超えられない。
その次でやっと追いつく。いったいいつになるんだろう?
その頃には、Macは王者Lionになっているぞ。
59名無しさん@そうだ選挙にいこう:2005/07/22(金) 22:54:58
サーチクロスで十分な俺は勝ち組
60名無しさん@そうだ選挙にいこう:2005/07/23(土) 11:28:59
grepで充分な俺は帝王。
61名無しさん@そうだ選挙にいこう:2005/07/23(土) 11:52:34
[スタートをくりく] -> [検索(s)をくりく] ->
で十分な俺は魔王
62名無しさん@そうだ選挙にいこう:2005/07/23(土) 17:03:27
>58

メタデータ検索なんてLonghornどころか、Windows2000だってできるだろ?
例えばNTFSのファイル付加情報を扱うインターフェイスがあればいいんだから。
今その辺に便利なソフトウェアが無いだけで、OSレベルの問題とは明らかに違う。

検索したいなら、インデックスサービスのフィルタを作ればいいだけだろうし、
ディレクトリツリーに代わるものとして使いたいなら、
ちょっとしたシェルの拡張で充分だろう。

なんでいつも、ソフトウェアとかユーザーインターフェースレベルの話が、
OSとかファイルシステムのレイヤーの話に擦り替えられるんだ?

わざと間違えているのか?
63名無しさん@そうだ選挙にいこう:2005/07/23(土) 21:11:17


   理屈はいーからさっさと使える様にしてください。


64名無しさん@そうだ選挙にいこう:2005/07/23(土) 21:41:38
>>62
同じドザとし恥ずかしいよ
タイガーのスポットライトは従来の検索とは概念が違うんだよ
Windowsは残念ながらこの分野では敗北したんだよ
65名無しさん@そうだ選挙にいこう:2005/07/24(日) 00:29:40
ってゆうかさ。
俺は主にテキストの「全文検索」がしたいの。
メールやPDFやワードetcも含めて。

なので、全文検索とは関係ない話はスレ違いなので他所でやってください。
66名無しさん@そうだ選挙にいこう:2005/07/24(日) 05:49:03
Macの方はファイルシステムのレベルでちゃんと考えて作ってあるんだろ?
それにひきかえWindozeときたら、いちいちガリガリやってるから目も当てられない。
67名無しさん@そうだ選挙にいこう:2005/07/24(日) 13:15:42
Longhornを超えるか!? 200以上の新機能に要注目
Mac OS X v10.4 “Tiger”
http://review.ascii24.com/db/review/soft/os/2005/07/21/657072-000.html

OSのベースは真性64bit
 最後にOSの基盤部分についても少し触れよう。ベースは64bitのUNIX OSだ。
64bit OSというと、同じ頃、発売された「Windows XP Professional x64 Edition」
(以下、x64)が思い当たるが、両者では対応するメモリー容量などに違いがある。
 Tigerは物理メモリは理論上4TB(テラバイト)、仮想メモリは(1プロセスあたり)
16EB(エグザバイト)以上をサポートする。
対するx64は物理メモリ128GB、仮想メモリ16TBだ。

 この仕様の違いはMacのCPU、PowerPCが32bit時代から64bit仕様を意識して
設計されていたこと、それだけにPowerPC G5が真の64bit設計であること、の影響
が大きい。このおかげで、Tigerでは32bit/64bitどちらのPowerPCでもネイティブ
動作する。
http://review.ascii24.com/db/review/soft/os/2005/07/21/657072-001.html?
68名無しさん@そうだ選挙にいこう:2005/07/24(日) 15:15:00
何でこんなところでMacの宣伝してんだよ。
何が面白くてAppleの犬みたいなことしてんの?
やめろとは言わないけど、Mac板かOS板でやってくれよ。
69名無しさん@そうだ選挙にいこう:2005/07/25(月) 01:29:03
REFTだかRAFTだかっていう検索のは有名ですか?

インデックス型とグレップ型両方できるみたいですよ。

DBインストールしたりとめんどくさそう
70名無しさん@そうだ選挙にいこう:2005/07/25(月) 02:10:22
>>68
1からして

>Mac最高 ドザは氏ね

って言ってんのに何でMacネタはダメなの?
検索と全く無関係のカキコに対してならわかるけど。
71名無しさん@そうだ選挙にいこう:2005/07/25(月) 02:29:18
勝手に1を改変しておいて何開き直ってんだ。
検索にかこつけてMacネタを展開するのがお前の目的・楽しみなんだろうが
Macに興味を持ち始めていた人々まで敵に回し始めたことにいい加減気付いてもらいたい。
72名無しさん@そうだ選挙にいこう:2005/07/25(月) 03:00:42
俺はWinしか使ったことないけど、このスレみて
マックに興味もったけど。。
73名無しさん@そうだ選挙にいこう:2005/07/25(月) 05:36:43
だよな〜。たとえ嵐みたいに見えても、こんだけ話題になるMacって
どんなもんなんだろう?って思うよ。

まぁそれでMacを買うかどうかは別問題だけどさ。
74名無しさん@そうだ選挙にいこう:2005/07/25(月) 09:21:52
おまえらのダメなとこは全文検索話題スルーでマック話するってとこだな。

まあマックがどうこう言ってるのは自演君だから相手にしないほうがいいよ
75名無しさん@そうだ選挙にいこう:2005/07/25(月) 10:31:43
粘着が約1〜2名貼り付いてるだけ
スルーしましょう。


76名無しさん@そうだ選挙にいこう:2005/07/25(月) 13:01:37
とりあえず’Macmini買った者ですけど、その後、PowerBookも買っちゃいました。
本格的に移行するつもり。
77名無しさん@そうだ選挙にいこう:2005/07/25(月) 16:23:37
相手にしてる人はなんでいるんだろ・・・
78名無しさん@そうだ選挙にいこう:2005/07/25(月) 22:15:37
ID付けて欲しいな。こうなると。
79名無しさん@そうだ選挙にいこう:2005/07/26(火) 01:14:50
Macの話でもいいじゃん。
それがきっかけで、全文検索がホットになっているんだから。
僕は、いろんな環境での全文検索の実際について知りたいよ。

でもさ、
「概念が違う」とか「ちゃんと考えて作ってある」とか、
糞小学生の糞寝言みたいな糞屁理屈しか書けない糞野郎は、
Win派だろうがMac派だろうがUNIX派だろうが、
もう少し遠慮してくれたらいいのに、と思う。

こういう検索機能のおかげで、こういうファイルを見つけることが出来た、
とかそういう話なら、OS自慢でも構わないんだけど。
80名無しさん@そうだ選挙にいこう:2005/07/26(火) 04:58:58
【なんだ】Spotlightで見つけた変なファイル。【これ】
81名無しさん@そうだ選挙にいこう:2005/07/26(火) 08:29:13
> それがきっかけで、全文検索がホットになっているんだから。
そりゃ誰の見解だ?
82名無しさん@そうだ選挙にいこう:2005/07/26(火) 09:00:10
いや煽りでもなんでもなく、本当に不思議なんだけど、このスレ立てた
>>1もMacの優位をうたい、前スレの関連スレにもMacが出てるのにな
んでMacに関連する(もちろん検索関連の)話はダメなのですか?
83名無しさん@そうだ選挙にいこう:2005/07/26(火) 12:20:12
ダメというか、モラルの問題でしょ。
Macの話題を振ると粘着信者が活性化してスレタイと関係ないOS自慢とWindows批判
を始めるから、しばらくMacの話題は無視しましょうということじゃないの?
84名無しさん@そうだ選挙にいこう:2005/07/26(火) 12:49:05
でもなSpotlightが与えた衝撃は大きいよ
今までリードしていたWindowsをあっという間に抜き去ってしまった。
無視できないのよ
85名無しさん@そうだ選挙にいこう:2005/07/26(火) 13:02:14
>>84
自演乙
ID導入するまでもなく上げてるのは君だけですから
夏厨以下ですね
86名無しさん@そうだ選挙にいこう:2005/07/26(火) 13:04:31
>>84
だからOSの話しにすり替えんなよボケ
87名無しさん@そうだ選挙にいこう:2005/07/26(火) 13:13:41
グーグルデスクトップサーチとウィンドウズデスクトップサーチ両方使った印象

グーグル
・インデックス容量は4GBでダメ
・検索結果はさすがにいい
・インデックスを作成したいフォルダ指定がめんどくさい
・インデックス作成後も常時更新している(みたい)で意識なく使える

ウィンドウズ
・インデックス容量は不明
・検索結果はイマイチ
・インデックス作成したいフォルダ指定は簡単
・一度インデックスを作成したら、更新するときは最初から全データを改めて見直してるみたいで
 更新は時間がかかる(みたい)
・プレビュー画面は便利

正しいかな?

俺としたらどっちもイマイチというのが印象、他に同分野のソフトがないから使ってる、ってとこかな
タダだし
Spotlightはわからん
88名無しさん@そうだ選挙にいこう:2005/07/26(火) 15:06:41
検索結果が良いとか悪いとかの基準についてもうちょい詳しく聞きたい。
8982:2005/07/26(火) 15:27:17
>>83
なるほろ、それなら良くわかりました。
他スレにもちょくちょく現れる方々wですね。

>>85
84は私ではないですよ。
90名無しさん@そうだ選挙にいこう:2005/07/26(火) 18:48:04
>>87

Spotlight
・インデックス容量は制限が無い模様
・検索はさすがに高速、結果も文句無し
  (結果は完璧。速度も全くストレス無し。これ以上のものは無いでしょう。)
・インデックスを作成したいフォルダ指定の面倒は無い
  (デフォルトで指定されてるから。逆に外したい時も、プライバシー設定
   ウィンドウに非対象にしたいフォルダをドラッグするだけ)
・インデックス作成はファイル保存と同時
  (そのため、アプリや当該ファイルによっては、「保存」がワンテンポ遅れ  
   る時があるような気がする。)
91名無しさん@そうだ選挙にいこう:2005/07/26(火) 20:01:27
でかいファイル全体が処理される保証はないけどな。無論もれることあるし。
92名無しさん@そうだ選挙にいこう:2005/07/26(火) 20:13:17
それって、全文検索じゃないってこと?
93名無しさん@そうだ選挙にいこう:2005/07/26(火) 20:41:35
>>92
Windowsではありがち
94名無しさん@そうだ選挙にいこう:2005/07/26(火) 21:41:16
Spotlightが全文検索でないとすると、スレ違いになるのだろうか
Googleの奴みたいだな
95名無しさん@そうだ選挙にいこう:2005/07/26(火) 21:51:42
これか?

>589 名前:名称未設定 投稿日:2005/06/12(日) 09:59:45 ID:75iI3fxg
>>584
>内容検索の速度面のオーバーヘッドはディスクアクセスによるものだからマシ
>ンスペックとはあまり関係無い。他のメタデータに比べて大きなインデックス
>ファイルが必要なのもオーバーヘッドです。
>それにSpotlightの内容検索はインデックス検索であって全文検索ではない。
>一部のキーワードを抽出しているだけだし、大きな文書全体が処理される保証も
>無い。Search KitやV-Twinの解説を一度読んでみると良い。
96名無しさん@そうだ選挙にいこう:2005/07/26(火) 23:18:12
>インデックス検索であって全文検索ではない。

ここでいう「全文検索」とはgrepみたいなやつの事?
97名無しさん@そうだ選挙にいこう:2005/07/26(火) 23:52:57
>>95
Spotlightは全文+キーワード登録が正解。
検索文章を探して見つからないときは、キーワード一致検索してくれる。
98名無しさん@そうだ選挙にいこう:2005/07/26(火) 23:54:48
>>95
Spotlightは全文+キーワード登録が正解。
検索文章を探して見つからないときは、キーワード一致検索してくれる。
99名無しさん@そうだ選挙にいこう:2005/07/27(水) 01:08:44
>>95
それ間違い
100名無しさん@そうだ選挙にいこう:2005/07/27(水) 01:14:44
インデックス検索と全文検索とキーワード一致検索の違いがわからん。
101名無しさん@そうだ選挙にいこう:2005/07/27(水) 05:11:13
MSN Desktop Search で新しいタイプの文書を検索対象に加えたいときには、
IFilter を書けばいいの? Indexing Service で認識できるものは
MSN Desktop Search でも認識できる?
102名無しさん@そうだ選挙にいこう:2005/07/27(水) 10:20:51
Google(デスクトップでなくgoogl.com)を全文検索システムとして認めるなら、
インデックス使ってても全文検索って言えると思うんだけど。

「記事の全文を検索対象とする検索機能」というのを全文検索の定義したとして、
全文とは何かということが問題になる。
・メールのヘッダは含めるのか
・OLEの属性やリソースフォークは含めるのか
・ACLの属性は含めるのか
といったことについては、ユーザの要求によって変わるので、固定的に定義できない。

つまり、検索対象の範囲や、検索洩れの多い少ないは、程度の問題だということ。
ある製品がたまたま自分の要求に合ってないからって、「こんなの全文検索じゃない」
とけなすのは厨房の振る舞いと言わざるを得ない。

大文字と小文字や片仮名と平仮名を同一視するとか、漢字を読みで検索するとかいう
技術も考えると、全文検索は単なるパターンマッチング以上の技術であることがわかる。
grep型に固執する人々はちょっとオールドタイプな感じでしょう。

というか、grep型(逐次探索)で大規模な検索システムを実用化するにはかなりの
分散処理が必要になるのはちょっと考えればわかるでしょ。このスレで語られている
ような個人利用のシステムでそれを期待するのは無茶だって。
個人的には、N-gram型のインデックスがこれから流行ると思っている。



103名無しさん@そうだ選挙にいこう:2005/07/27(水) 11:05:54
最低限、基本となる本文全体が対象として保証されていないと全文とはいえないのでは
104名無しさん@そうだ選挙にいこう:2005/07/27(水) 12:19:13
だから、その本文の定義が曖昧だっての。
105名無しさん@そうだ選挙にいこう:2005/07/27(水) 12:37:38
それを実現できてるのはMacのSpotlightだけですが。。。
106名無しさん@そうだ選挙にいこう:2005/07/27(水) 12:54:58
狭義な意味での全文検索の議論は不毛だけど

GDSもMSNSも文書全体の「全文」ではない。
だから使えないとは思わないし、
取りこぼしをどこまで認めるかは個人の考えだと思う。

grep型か
インデックス作成による
キーワード型(分かち書き辞書による)かN-gram型か
についても意見は分かれるけど、

grep型は数百MB以上では実質選択不可だし
N-gram型もKWIC Finderで使った限りでは
精度が高いとは思えなかった。
(でも辞書に頼らない部分で将来性はありそう)
キーワード型は辞書によって結果が変わりすぎ、、
(namazuでも辞書をいじれば十分に使える)

個人的には、いまだにサーチクロス&CSの組み合わせ。。。
(CSは決定打にならなかった)
マカーはスルーしる
107名無しさん@そうだ選挙にいこう:2005/07/27(水) 13:19:46
>>106
> サーチクロス&CSの組み合わせ。。。

Docuworks User の方ですか?
108名無しさん@そうだ選挙にいこう:2005/07/27(水) 13:29:33
サーチクロスは Type1 フォントを使った PDF ファイルから
正しくテキストを抽出できない。もちろん外部フィルタを使えば
抽出できるけど。なので、英文のPDFファイルがインデックスされない。
論文とかいっぱい蓄積しているはずなのに、何でヒットしないんだ〜
ってかなり悩んだ。

とりあえず MSN Desktop Search 使ってる。
でも独自のファイル形式があるんだよね、仕事で必要な。
サーチクロスだと、単なるコマンドラインフィルタでよかったんだけど、
MSN Desktop Search に新しいタイプをインデックスさせようとすると
IFilter を書かなきゃならないみたいなんで、COM から勉強しなおし。
109106:2005/07/27(水) 13:46:54
>>107
Ver.4くらいからのユーザーです。
検索の選択時はDocuに対応してるorフィルターが存在するのが前提
ですが、最近は苦労する事少なくなった。。。
>108
サーチクロスは、外部フィルタ使ってます。
xdoc2txtだっけ
Officeの文書なんかもこれを使った方が処理が早そうなので
つかってます。
純正より安定もしてるので重宝します。
110名無しさん@そうだ選挙にいこう:2005/07/27(水) 19:26:04
すんません。CSって何ですか?
111名無しさん@そうだ選挙にいこう:2005/07/27(水) 20:04:16
すんません。CSって何ですか?

すんません。CSって何ですか?

すんません。CSって何ですか?

すんません。CSって何ですか?

112名無しさん@そうだ選挙にいこう:2005/07/27(水) 22:20:30
インデックスの使用は当然で(形式はともかく)、
ちゃんと文書全体からインデックスを作っているかどうかがポイントかなぁ>全文

キーワード型は自動的に辞書を学習するようなればいいんじゃ?>>106
どこかが作ったって発表してた気がするし。
113名無しさん@そうだ選挙にいこう:2005/07/28(木) 07:22:08
デスクトップ検索ツールを作ってみた。
へぼいけど、よければ見てやって。

検索エンジンにはHyperEstraierを使ってる。
だから検索性能はHyperEstraierといっしょ。

http://migumi94.nobody.jp/destraier.html
114名無しさん@そうだ選挙にいこう:2005/07/28(木) 16:36:12
>>113age
115名無しさん@そうだ選挙にいこう:2005/07/28(木) 20:10:52
Hyper Estraierも同梱してインストーラ作ればいいのに。
ライセンス的には問題ないでしょ。
116名無しさん@そうだ選挙にいこう:2005/07/28(木) 20:22:22
age
117106:2005/07/28(木) 21:58:13
>>110
ConceptSearch
118113:2005/07/29(金) 11:14:54
>>115
そのライセンスがよくわからん。
ライセンス読んでも、どうすればいいのかが分かりづらい。
そのへんが明確になったら同梱するかも。
とりあえず同梱しなければ、制限を受けないようなので。
119名無しさん@そうだ選挙にいこう:2005/07/29(金) 12:39:26
LGPLなら、ライブラリのソースコード自体を改編しなければ、コマンドやDLLだけ
取り出して別のパッケージに含めても問題ないよ。スタティックリンクしたものを
配布できるんだから、DLLを同梱したものを配布できるのも当然といえば当然だね。
心配だったら作者に聞いてみれば?
120名無しさん@そうだ選挙にいこう:2005/07/29(金) 12:50:46
おれ、DocuWorksのデータがかなりあるんで、CSに惹かれているんだけど、
グーグルやウィンドウズがタダだと考えると、使う気になれん

富士ゼロックスはプラグイン作ってくれんかな
121113:2005/07/29(金) 13:59:50
>>119
今のところの理解では、DLLを同梱する場合は以下の条件が必要と思う。

・どれを取り出したのか明示する。
・Hyper Estraierのソースも同梱するか、HPでダウンロードできるようにする。
・LGPLライセンスファイルを同梱する。
・著作権表示をする場合は、Hyper Estraierも同時にする。

さらに、Hyper Estraierに同梱されているDLL(zlibやpthreadGC2等)は、別の作者だろうから、
そのライセンスも調べなければならんとなるとマンドクセ。

DLL全部取り出して使っていいよ、っつーなら楽なんだが。
122名無しさん@そうだ選挙にいこう:2005/07/29(金) 15:28:20
>>121
それ誤解だよ。GPLと混同してるのかな。
LGPLの場合、そのライブラリを組み込んだプログラムのソースを公開する必要は
ないよ。その点がGPLとLGPLの違い。

あと、GPLにもLGPLにも広告条項はない。だから、組み込んだライブラリを自分
で作ったと主張するのはダメだけど、「本ソフトウェアはHyper Estraierを利用
しています」みたいなことを表記する必要は全くない。使いたい奴が勝手に使えばいい。
zlibやpthreadGC2もその点では同じだね。むしろもっと制限が緩いはず。

結論としては、DLL全部取り出して使っていいと思うよ。
123113:2005/07/29(金) 16:43:14
>>122
いや、Hyper Estraierのソースを入れるのかなと。
「Hyper Estraierを配布する」わけだから、そのソースを手に入れられるようにすべきと読めるが・・・

↓こことか。
http://www.geocities.co.jp/SiliconValley-Cupertino/8526/wxWindows/license.html

わかりづらいなあ。まあ、急いでないし、だらだら調べるよ。
124名無しさん@そうだ選挙にいこう:2005/07/29(金) 18:02:14
HTMLファイルの検索で該当箇所にブラウザ表示でジャンプか色付けをしてくれるのはありますか?
125名無しさん@そうだ選挙にいこう:2005/07/29(金) 20:01:47
>>124
スレイプ
126蕪木ら某 ◆Googl8RmwA :2005/07/30(土) 00:06:15
127名無しさん@そうだ選挙にいこう:2005/07/30(土) 00:40:25
10年経ってもMacOSをパクリ続けるとは呆れ通り越して尊敬してしまいそうだ
パクってるのが見た目だけだから余計に始末が悪い
128106:2005/07/30(土) 00:47:32
>>120
Docuのデータだけで100GBくらいある。。。orz
いろんな検索試したけど、個人ベースでは
サーチクロスが使い勝手が一番良いと思った。
CS(実際はExpandFinder)も良いけど、サーチクロスの
方が自分の予測に近いものが検索される感じ
CSは想定外の文書が上がって来る楽しさ?はあるけど、、

業務であればnamazu+kakashi(辞書改)かな
GDSもMSサーチも文書先頭のみのインデックス化だから
業務では使えないし、、
(こんなの検索できない理由として他者に説明できない)

最近注目してるフォーマットはDWF
でもDocuWorks Deskの使い心地を知ってしまうと
他のフォーマットには中々手が出せませんね
129名無しさん@そうだ選挙にいこう:2005/07/30(土) 04:01:47
>>128
ちなみに、chmやmhtファイルもインデックス作れますか?
130106:2005/07/30(土) 07:18:36
>>129
GDSについてならchmは追加のプラグインでできたはず
mhtは
ttp://softfarm.net/ather/xdocgoogle.html
を使ってXdoc2txtを使えるようにしてやれば良いと思う。

サーチクロスはmhtは標準対応で、
chmは対応してなかったはず

CSは標準で対応してなければ諦めるしか、、
131名無しさん@そうだ選挙にいこう:2005/07/30(土) 08:11:46
CS は Outlook のメールをインデックスできないのでやめた。
サーチクロスは Type1 フォントを使った PDF ファイルと
UTF-8 なウェブページに対応していないのでやめた。
132名無しさん@そうだ選挙にいこう:2005/07/30(土) 09:56:22
生きてるのもやめたら?
133名無しさん@そうだ選挙にいこう:2005/07/30(土) 11:39:20
36歳無職童貞だから生きるのやめた。
134名無しさん@そうだ選挙にいこう:2005/07/30(土) 12:05:47
で、結局131は何使ってんの?
135名無しさん@そうだ選挙にいこう:2005/07/30(土) 14:37:16
どうせいつか死ぬんだし
136名無しさん@そうだ選挙にいこう:2005/07/30(土) 23:31:11
とりあえずMac使ってみれば?
驚愕するぞ
137名無しさん@そうだ選挙にいこう:2005/07/30(土) 23:32:21
M$ と Intel は、人類の歴史に残るクズだと思うよ。
明らかに、正常な技術の発展を阻害している。

自社に足すなとは言わないから、独占を利用して、
「他に引き算をしかけるな。」ってこった。
138名無しさん@そうだ選挙にいこう:2005/07/30(土) 23:46:38
結局、アップルがウィンドウズ版のSpotlightを出したら
全て解決だろ
139名無しさん@そうだ選挙にいこう:2005/07/31(日) 00:40:01
Spotlightはプレビューないから、いらん。
140名無しさん@そうだ選挙にいこう:2005/07/31(日) 01:18:01
Mac信者を137のように偏狭で排他的にさせる要因は何なのか。
彼らがどっかの雑誌やブログのヨタ記事を鵜呑みにしてその受け売り
を書き込んでしまうのはなぜなのか。興味は尽きない。

141名無しさん@そうだ選挙にいこう:2005/07/31(日) 10:09:35
実社会でスポイルされてる人間が
攻撃先をインターネットに見出してるだけ
彼らにとっては
「何かに影響を及ぼしてる」
つもりのようだが、
傍から見れば単なる自慰行為。

でも気付かなければそれはそれで幸せ
┓(´々`)┏
142名無しさん@そうだ選挙にいこう:2005/07/31(日) 11:36:13
自己紹介乙。
143名無しさん@そうだ選挙にいこう:2005/07/31(日) 14:40:04
>>139
>Spotlightはプレビューないから、いらん。
プレビューあるよ。
リスト表示をアイコン表示に変えると、現在の内容をプレビューできる。
マイクロソフトが誤解されるように言ってるけど、ビスタとの違いは、
MacはPDFなどの画像形式のプレビューを作成し、ビスタはワードとエクセルの
プレビューは作るけどPDFは作らないところなんだよね。

Tigerでワードやエクセルのプレビューアイコン(随時更新しない)作る
ユーティリティーためしてみたけど、見た目で中身が判断できず
全く役立たなかった。ワードのプレビューはあまり意味がない気がした。
144名無しさん@そうだ選挙にいこう:2005/07/31(日) 14:54:56
>>139
ドザは本当に無知だな
一度マックを使え
これは命令だ
145名無しさん@そうだ選挙にいこう:2005/07/31(日) 17:01:41
文書検索において、文書が確認できないプレビューに意味無い
146名無しさん@そうだ選挙にいこう:2005/07/31(日) 17:25:44
>>128
100G…すごいっすね。
自分もこれからDocuworksで書類を取り込んでいこうと決意したとこです。
MSNサーチ+フィルターでXDWも検索対象にできると教わったんですが、
106さんのカキコをみると、素直にサーチX買った方がいいですかね?
147名無しさん@そうだ選挙にいこう:2005/07/31(日) 17:36:34
>>143
プレビューアイコンじゃなくて、文章の検索なのだからヒットした部分の文書プレビューがほしい。
アプリケーションで開いて検索して確認、違うなら次の候補なんて効率悪いからね。
今あるユーティリティでも、ヒットした部分の周囲を次々プレビュー表示できるのは、普通だし。

>>144
IIfxから色々使ってきたけど、ついに処分したよ。マックは最近周辺環境わるすぎでさ。
148名無しさん@そうだ選挙にいこう:2005/07/31(日) 18:05:48
>>147
>文章の検索なのだからヒットした部分の文書プレビューがほしい。
それができるのってある?
>今あるユーティリティでも、ヒットした部分の周囲を次々プレビュー表示できるのは、普通だし。
Macでも、PDFならできるけど。ワードとかエクセルはできないな。
なぜかと言ったら、マイクロソフトの独自形式だから。
マイクロソフトがそういう仕様にすればできる。
149名無しさん@そうだ選挙にいこう:2005/07/31(日) 18:12:21
対応してるのもありますよ
150128=106:2005/07/31(日) 19:10:06
>>146
Docuへの取り込みは
スキャンの場合は最新版(V6)を薦めます
(OCRの精度がやっと業務レベルになった)
V6ならメール検索無しのConceptSearchも
付いてくるし、PDF書き出しも出来る

検索は無料に拘らなければサーチクロスを
持っておいた方が幸せになれると思う

たぶんWinFSが来るまでこれで十分かと思ってる
とうぶん先になりそうだけど、、、ヽ(`Д´)ノウワァン
でも急いで出したためにどっかの検索みたく
システムに負荷かけまくる、なんちゃってメタデータの
システムになっても困り物。。。
時間かけてもファイルシステムとの整合性のとれたモノを
作って欲しい
151名無しさん@そうだ選挙にいこう:2005/07/31(日) 20:21:02
>>148
>>文章の検索なのだからヒットした部分の文書プレビューがほしい。
>それができるのってある?
多分無い。
MacでPDFができるなら別だが。
152146:2005/07/31(日) 21:46:48
>>150
d。
サーチXについて「インデックス作成時にプロセスの優先度を下げてもフォアグラウンド
のプロセスが止まるという致命的欠点がある」のでGDSに変えたってヒトがいたのです
が、それ以外の部分(検索精度等)はサーチXの方がいいみたいですね。
153名無しさん@そうだ選挙にいこう:2005/07/31(日) 23:05:40
>>148
独自形式だからってのはあまり問題にならない、対応すればよいのだから。
OpenOfficeでも、KWIC Finderでも自力でワード・エクセルファイルを読み出している。

それに、そんなに難しいことは要求していない。文章が追えれば体裁は崩れてもよいので、
ヒットした単語のハイライト付きテキストを表示し、操作でヒットした単語間を移動してくれればよい。
ExpandFinderでもサーチクロスでも前述のKWIC Findeでもこのくらいはできる。

Googleですらハイライト付きのダイジェストを併記表示する。これが無ければ不便だよ。
ローカルなファイルを対象としているならダイジェストではなく全文であってほしいな。
154131:2005/07/31(日) 23:22:59
とりあえず、今はMSNデスクトップサーチ使ってる。
155名無しさん@そうだ選挙にいこう:2005/08/01(月) 00:04:17
>>153
一生M$の奴隷になってれば
156名無しさん@そうだ選挙にいこう:2005/08/01(月) 02:05:03
appleの奴隷が何を言ってんだ。
五十歩百歩という言葉を君に贈ろう。
157名無しさん@そうだ選挙にいこう:2005/08/01(月) 02:20:37
この場合は、「目糞鼻糞を笑う」が適切かと。
158名無しさん@そうだ選挙にいこう:2005/08/01(月) 02:21:55
ちょっと待てよ。
148の言うようなのがあるのか?
>文章の検索なのだからヒットした部分の文書プレビューがほしい。
それができるのってある?
159名無しさん@そうだ選挙にいこう:2005/08/01(月) 02:45:53
>>155
M$の話など出していないけどな。
ExpandFinderもサーチクロスもKWIC FinderもM$が作っている訳じゃないよ。

M$がどうの、Appleがどうのとかの中身のない問題で話をしているわけではない。
そのツールが使えるか、使えないかの問題だ、奴隷になる必要すらない。
160名無しさん@そうだ選挙にいこう:2005/08/01(月) 10:46:35
荒らしはスルー汁
161150:2005/08/01(月) 12:24:52
>>152
指摘の欠点は私の環境では経験無いですが、
データ量によってはインデックス作成時に不安定になることは
あります。
インデックスセットの切り替え(インデックス分割)で安定しますが、
(環境によるけど普通のオフィス文書で30〜40GBを
 1インデックスでも可能)

OLEよりもxdoc2txtを使った方が安定して感じられます。
(OLEで出来るものもxdoc2txtで処理させる)
使い始めは多少メンテしましたが、
ここ半年程は完全にメンテフリーです。

欠点というか改善して欲しいのは
インデックス分割しなくて済む安定性ですかね
162名無しさん@そうだ選挙にいこう:2005/08/01(月) 12:43:09
欠点と欠陥はマックの奴隷とマック自身
163名無しさん@そうだ選挙にいこう:2005/08/01(月) 12:45:50
欠点と欠陥はWINの奴隷とWIN自身
164名無しさん@そうだ選挙にいこう:2005/08/01(月) 12:49:32
アホの18番はコピペオウム返し低能に化ける事だな
165名無しさん@そうだ選挙にいこう:2005/08/01(月) 13:10:49
Hyper Estraier面白いね。
Windows版はもっとWindowsに特化した作り(GUIとか)にしてくれるといいんだけど。
RubyやJavaのフロントエンドがこれからでてくるのかな。
166名無しさん@そうだ選挙にいこう:2005/08/01(月) 13:51:44
誹謗せよ! 誹謗せよ! さすれば誹謗のみが残るであろう。

という言葉がありましてな。
嘘でも何でもただひたすら相手の評判を下げる話を垂れ流した挙げ句に、
最後にぽろっと「ほら、だって火のないところに煙は立たないっていうし」
とでも付け加えたら、あら不思議印象操作のできあがりって奴ですわ。


ネットなんか見てたら火が無くてもいくらでも煙出せるのわかってるはずなのに、

-------------------------
クソマカーの論理によく当てはまるね
今でも”火のない〜”の理屈で疑心暗鬼に陥る人間が後を絶たないわけで。
167名無しさん@そうだ選挙にいこう:2005/08/01(月) 15:14:24
根も葉もない噂
とも言うけど、悪い噂は良く広まるからねぇ。
168名無しさん@そうだ選挙にいこう:2005/08/01(月) 15:50:33
噂の真偽を自分で確かめず
盲目的に信じる馬鹿が多いのが困る・・・
169名無しさん@そうだ選挙にいこう:2005/08/01(月) 18:15:05
誹謗せよ! 誹謗せよ! さすれば誹謗のみが残るであろう。

という言葉がありましてな。
嘘でも何でもただひたすら相手の評判を下げる話を垂れ流した挙げ句に、
最後にぽろっと「ほら、だって火のないところに煙は立たないっていうし」
とでも付け加えたら、あら不思議印象操作のできあがりって奴ですわ。


ネットなんか見てたら火が無くてもいくらでも煙出せるのわかってるはずなのに、

-------------------------
クソドザの論理によく当てはまるね
今でも”火のない〜”の理屈で疑心暗鬼に陥る人間が後を絶たないわけで。
170名無しさん@そうだ選挙にいこう:2005/08/01(月) 19:43:29
copernicはいろいろなファイルのプレビューに対応してるよ。
インクリメンタルサーチもバリバリ動くから使いやすい。
日本語に弱いのが欠点だが。
171名無しさん@そうだ選挙にいこう:2005/08/01(月) 20:34:11
どう弱いんだ?
172名無しさん@そうだ選挙にいこう:2005/08/01(月) 22:14:23
7月28日に「Windows Vista」とともに発表された「Internet Explorer 7.0(IE7) beta 1」が、
早くも開発者の間に多くの話題を提供している。
まず、IE7 beta 1が公開されてほどなくして英テクノロジー誌の「Register」が、
IE7 beta 1ではGoogleツールバーとYahoo!ツールバーが消えてしまう問題を指摘し、
Microsoftがライバル企業に打撃を与えるようとしているのではないかとの憶測記事を掲載した。
この問題は他の多くの環境でも発見されたらしく、ブロガーたちが競ってこの話題を書くようになった。

http://internet.watch.impress.co.jp/cda/news/2005/08/01/8626.html
173名無しさん@そうだ選挙にいこう:2005/08/02(火) 00:03:54
サーチクロスはインデックスを2GBしか作れないんじゃなかったっけ
これじゃぁ、使いものにならんだろ
174名無しさん@そうだ選挙にいこう:2005/08/02(火) 00:55:05
うちの用途だと使い物になっている・・・
ま、自分で作ったビジネス文書数千と画像のファイル名数万くらいだからな、操作性もまあまあよし。

でも、GBサイズの2ちゃんねるのログ用にはやっぱ使いにくかった。軽快性無くなる感じ。
インデックス作成もオンメモリでやっているせいか終盤になるほど重くなるし。
175名無しさん@そうだ選挙にいこう:2005/08/02(火) 00:59:39
>>172 ←お子様
176128:2005/08/02(火) 01:34:44
>>173
どんな大きなDB作ってるんですか?(笑

でもインデックス分割したくないケースは
確かにありますよね。。。
>174
終盤になるほど、、は感じますね。
namazuも同様でした。
1インデックスが数百MBになると途端に、、
逆にnamazuはオンメモリでない為だと思ってましたが、
どうなんだろ???
たぶんサーチクロスのインデックス作成はオンメモリ
じゃないと思う。(単に過去の経験から)
177名無しさん@そうだ選挙にいこう:2005/08/02(火) 03:30:05 BE:62962867-#
>>175
むしろ負け犬のキチガイ
178名無しさん@そうだ選挙にいこう:2005/08/02(火) 08:38:14
2Gじゃ不十分な人もいますよ^^;
視野せますぎ
179名無しさん@そうだ選挙にいこう:2005/08/03(水) 08:37:32
>>161
私のところだと
インデックス作成時にATOKの入力が奪われますがね。
180名無しさん@そうだ選挙にいこう:2005/08/03(水) 09:29:10
うちのATOK15はインデックス作成時以外でも負荷に弱く
入力途中で引っかかるので、そんときだけMS-IMEにしている。
181名無しさん@そうだ選挙にいこう:2005/08/03(水) 09:46:36
おれのカスタムATOKはそんなのへっちゃら
182名無しさん@そうだ選挙にいこう:2005/08/03(水) 09:53:13
>>181
かみさま、おしえてちょうだい!
183名無しさん@そうだ選挙にいこう:2005/08/05(金) 16:46:27
ミスチルなんか聞いてる奴ってださすぎじゃね?
1回グレイ聞いてみ?
ミスチルなんか聞いてられなくなるからwwwww
184名無しさん@そうだ選挙にいこう:2005/08/05(金) 17:04:03
>>180
それはPCの問題だろ・・・
185名無しさん@そうだ選挙にいこう:2005/08/05(金) 18:18:19
>>182
普通のPCなら平気だぞ
180のPCがしょぼいか設定とかパフォーマンスがおかしいってだけだとおもう
186名無しさん@そうだ選挙にいこう:2005/08/05(金) 21:04:12
えー、MS-IMEなら問題なっしんぐなんだけど、だめか。
まあ、XP1.4Gセレ384MBだからハイパフォーマンスとは言い難いけど。
インデックス作成以外の負荷って、OCR連続処理なんだけど、
操作の要所要所で重いんじゃなくて、脈絡なしに時々2〜3秒無反応になるんだよな。
ATOKの先読み処理とかがHDD高負荷状態に向いていないんだと思っていたよ。
まあいいや、スレ違いなんでここまで。

平穏だな。
187名無しさん@そうだ選挙にいこう:2005/08/07(日) 16:39:16
>>186
後付いくない。
インストールに失敗してるか
PC環境の問題だとおもうぞ
あとけんか腰もいくない
188名無しさん@そうだ選挙にいこう:2005/08/07(日) 16:40:18
サーチクロス2.0を購入してみました。
インデックスの初期化中に「インデックスが大きすぎる可能性があります」と表示され
エラーとなってしまいます。 ファイル容量が数GB(ギガバイト)を超えるような場合、
サーチクロスの性能の限界との事で、インデックスを小分けして切替えながら使用し
ないといけないようなんですが、データ(txt,html,xdw,pdf)だけで100Gもあるのに数GB
づつに分けて切替えながら使うなんて現実的考えて...orz です。

何か使い方まちがってるのでしょうか? あるいはMSNやGDSに変えれば問題がな
くなるのでしょうか? アホと思われるかもしれませんが、どうか検索プロの方々の対
処方法をアドヴァイスしていただけないでしょうか。
189名無しさん@そうだ選挙にいこう:2005/08/07(日) 16:52:10
社員乙
今時サーチ買う馬鹿はいませんよ
190名無しさん@そうだ選挙にいこう:2005/08/07(日) 17:23:23
>>186 けんか腰な奴はしね。二度と来るなぼけ。
191名無しさん@そうだ選挙にいこう:2005/08/07(日) 21:08:56
>>188
前に話しが出てると思うけど、インデックスのサイズの壁が
2G位だったはず。(真偽は確かめてないけど)
→検索対象データ量の事じゃない。
純正のOLE使わずに極力xdoc2txtを使えば
検索対象30GBでも1インデックスで可能だけど?
192188:2005/08/07(日) 22:10:56
>>191
レスどもです。
なるほどxdoc2txtってのは良さげですね。 ただ一番多いデータが本
をスキャンしたxdwなんですけど、対応できないみたいですね...orz
サーチクロスは2ch.dat専用にするしかないかなぁ。
自分がスレを良く読むべきだったんですが、まさか今時2Gの壁がある
とは、、、ワタスのMP3プレーヤでも1Gはいるっつーに。。
193名無しさん@そうだ選挙にいこう:2005/08/07(日) 22:18:05
>>192
一言多い人って言われない?
前半だけでやめとけばいいのに・・・・
194名無しさん@そうだ選挙にいこう:2005/08/07(日) 23:37:20
GDSってGoogle Desktop Searchのことですよね?
ところで、GDSの全体的な使い心地はどうですか? 完成度とか?

私の場合、検索対象が40Gくらいあるので、大容量でも素早く検索できて、
chmファイルも検索出来るのをさがしているのですが。。

あと、namazuってchmファイルのindexをつくれないですよね?
195名無しさん@そうだ選挙にいこう:2005/08/08(月) 09:54:23
>>192
スキャンする文書に2Gの壁なんてないし
インデックス自体のサイズを問題にしてもな〜

先ずは日本語を読めるようになってから使えば?
それとも工作員?
196名無しさん@そうだ選挙にいこう:2005/08/08(月) 15:17:50
>>192
その論理展開でMP3プレイヤーを持ち出したのが分からない・・・・
197名無しさん@そうだ選挙にいこう:2005/08/08(月) 15:54:51
GDSは検索に漏れがあるから信用できなくなった
198名無しさん@そうだ選挙にいこう:2005/08/08(月) 19:34:51
>>195
>スキャンする文書に2Gの壁なんてないし

ここの意味がよくわからないのですが、xdoc2txtを使ってテキストにすれば2G
の壁はないって事ですか?
CD版に説明書がなかったので公式FAQみたら、「インデックス対象のファイル容
量が数GB(ギガバイト)を超えるような場合、サーチクロスの性能の限界」とあり
ますが…
xdoc2txtはよさそうなんですが、Docuworks文書に使えないです。
ためしにMSNの方を入れてみたらなんの問題もなくインデックス作成終了し、サ
クサク使えてます。(もちろんインデックス対象ファイルは同一です)

>>196
これは半分は冗談ですが、言いたい意味は以下の事です。
今時安価なPC買ったって30G〜40G位の容量のHDDは付いてくるじゃないです
か。 2G以下のPCを探す方が難しい。 ならばインデックス対象のデータが全部
使い切ってないにしても数10G位になるのは当然想定すべきではないかと。
CDのパッケージにも「PC内に”散在”している各種・・・快適に検索できる」とある
のだから、MSNの様に数10Gのデータくらい横断的に使えなくてどうするのかと。
(HDDですらないメモリのMP3プレーヤだって今時1Gなのに...orz)って事です。
            ↑ここはもちろんアホアホです、スンマソ。

自分が買ったものを失敗したと思いたくないので悪くは言いたくないですが、実際
使えないです。 むしろ自分の使い方or設定が悪いだけって事である方がずっと
いいですけど…
199名無しさん@そうだ選挙にいこう:2005/08/09(火) 00:08:42
>>198

>195は文書のサイズがどんなに大きくても、
サーチXが作るインデックスのサイズが2GB未満なら関係ない
って言ってるのですよ。

ttp://www.villagecenter.co.jp/cgi-bin/faq.cgi?software=SX
のQ.034は試した?
200198:2005/08/09(火) 00:28:39
>>199
解説ありがとうございます。

Q.034は「インデックス対象のファイル容量がGB(ギガバイト)の単位まで
満たない状況で」とあったので試してないですが、やってみます。
5回ほど初期化しなおす必要があるようなので、時間かかるかもしれませ
んが結果がでましたら報告させていただきます。
201名無しさん@そうだ選挙にいこう:2005/08/09(火) 01:14:52
>>198
2G問題は買う前から分かることなんだし
調べなかったあなたが悪いだけでは?

ただのアンチの発言にしか見えないんだよな・・・
202名無しさん@そうだ選挙にいこう:2005/08/09(火) 01:28:28
横槍だが、自分が悪いかメーカーが悪いかって議論は全くしてないだろう。
198は購入して使ってみたら使いにくかったという主観的事実を書いただけだ。
203198=188:2005/08/09(火) 01:37:27
>>201
初めてこの手のソフト買ったし使ったんで、アンチも何も。
CDパッケージをみて量販店でサクっと買ってしまったんですが、確か
に良く調べるべきでした。 その事は自分も上で書きましたけど。
何も「1Tで使えない」などと言ってるわけではないですし、今時まさか
数G程度の容量で問題があるとは思っていませんでした。
204198=188:2005/08/09(火) 01:40:06
>>202
あ、気持ち代弁していただきありがとうございます。
本当にアンチとか貶めてやろうとかはないです。
連投スマソ
205名無しさん@そうだ選挙にいこう:2005/08/10(水) 01:33:51
Switch「Macを始めた人たちの声」辛酸なめ子
http://www.apple.com/jp/switch/macstory/shinsan/

──Spotlight機能は、使ってみていかがですか?
試しに「霊」で検索したら,原稿の中で霊を使っているものが全部出てき
ました。すごく便利です(笑)。メールの内容で検索ができるんだったら、
「あの人、メールでこんな顔文字使ってたよね」みたいな検索の仕方もで
きるんですよね。

──スマートフォルダはいかがですか?
206名無しさん@そうだ選挙にいこう:2005/08/10(水) 02:11:00
ちくしょーーーーーーーーー!
うらやましいから来るな!!!
207名無しさん@そうだ選挙にいこう:2005/08/10(水) 02:38:40
広告記事を張っちゃダメでしょ。
鵜呑みにして騒ぐ人が出るから。
208名無しさん@そうだ選挙にいこう:2005/08/10(水) 02:45:32
──最後に、Tigerを使っていない人に何と言って薦めますか?

貴族的な生活が、Tigerで手に入ります(笑)。アイコン1つをとっても重厚感があって、
高級な応接室ぐらいの雰囲気になりました。執事みたいな感じです。
209名無しさん@そうだ選挙にいこう:2005/08/10(水) 12:10:10
>>203
一般人の感覚からしたら
2Gも1Tも五十歩百歩

車だって2〜5人乗れれば普通は十分でしょ。
210名無しさん@そうだ選挙にいこう:2005/08/10(水) 19:57:21
>>209 例えになってない。
五十歩百歩は程度の低すぎるもの同士を無駄に比較する場合の暗喩だぞ。
211名無しさん@そうだ選挙にいこう:2005/08/10(水) 21:08:58
どんぐりの背比べ、ともいうな。
212名無しさん@そうだ選挙にいこう:2005/08/10(水) 21:11:03
金があったらマック買いたい。
213名無しさん@そうだ選挙にいこう:2005/08/10(水) 21:40:36
カネを積まれてもマックは使いたくない。
正直、存在すら目障り。
214名無しさん@そうだ選挙にいこう:2005/08/10(水) 23:19:15
>>210
程度の低さは関係ないですよ^^;
他人の間違いを正すなら辞書を引いてからにしたほうがいいですよ
215名無しさん@そうだ選挙にいこう:2005/08/11(木) 20:27:13
辞書の短い説明だけ見て満足な中学生はそれでいいけどね、語源を考えれば
良いものや貴いものに対して五十歩百歩というと失礼にあたるのはわかるでしょ。
社会に出て恥ずかしい思いする前に正しといたほうがいいよ、日本語よりまずその態度をね。
216名無しさん@そうだ選挙にいこう:2005/08/11(木) 21:14:04
久しぶりにこのスレに来てみてxdoc2txtの存在を知って
早速サーチクロスのコマンドフィルターをOLEから変更。
インデックスの時間はかなり速くなっている感じ。

あとはビュアーの外部プログラムに何を使ったら良いか思案中。
激しく気になるぅぅ・・・
217名無しさん@そうだ選挙にいこう:2005/08/11(木) 23:40:49
変に慣用句使おうとせずに、ふつうに「大差ない」って言っておけばいいのにな。
218名無しさん@そうだ選挙にいこう:2005/08/12(金) 00:44:49
「大差ない」も「五十歩百歩」も大差ない。
ってか語彙が貧弱すぎ。
219名無しさん@そうだ選挙にいこう:2005/08/12(金) 00:53:06
貧弱!貧弱ゥゥッ!!
220名無しさん@そうだ選挙にいこう:2005/08/12(金) 02:00:41
http://review.japan.zdnet.com/software/apple-mac-os-x-version-10-4-tiger/editors/tiger.html

デスクトップ検索「Spotlight」がGoogle Desktopと異なる理由
221名無しさん@そうだ選挙にいこう:2005/08/12(金) 02:23:07
Macほしいなぁ…買っちゃおっかなぁ
222名無しさん@そうだ選挙にいこう:2005/08/12(金) 13:44:17
検索も魅力だけど、あのエクスポゼってやつに憧れてる。
223名無しさん@そうだ選挙にいこう:2005/08/12(金) 16:47:17
飾りだけのうんこマカーは巣に帰れ。
224198=188:2005/08/13(土) 00:53:40
>>199
Q.034を試してみましたがやはりダメでした。 エラーは同じ「インデックスが大きすぎる
可能性があります」でした。 更にインデックス対象から大量にスキャンしたxdwをはず
し、txt、html、jpg、pdf等のマイドキュメントとデスクトップ(9G弱)を選んでみたのですが
残念ながら同じ結果でした...orz

>>106さんは「Docuのデータだけで100GBくらいある」との事ですが、インデックス対象
をフォルダで小分けする方法を使ってるのですか?
225名無しさん@そうだ選挙にいこう:2005/08/13(土) 06:08:03
>>220 メンテナンスちゅうだとよ〜

>>205 全文検索モノ全般に言えることだけど、
「原稿の中で霊を使っているものが全部出てきました。」
ってのがくせ者なんだよな。本当に全部か?と言う問いに対して
自信を持って全部だと答えることができない。
全部かどうか分からないけどいっぱい出てきました、としか言いようがない。
226名無しさん@そうだ選挙にいこう:2005/08/13(土) 12:44:01
は?
grepのように指定文字列を含むものを全部出力するとわかっているツールと
対照実験すれば言えるだろ?
もちろん作り手ならそんなことしなくてもアルゴリズムから確言できるし。
227名無しさん@そうだ選挙にいこう:2005/08/13(土) 13:27:31
ところでSpotlightのインデックスの形式は何なの?
ハッシュ(分かち書き/N-gram)、Suffix Array、Patriciaとか考えられるが。

228106:2005/08/13(土) 14:16:25
>>224
勿論分割はしてる
家の環境だと
Docuだと20〜30GBを1インデクスでも大丈夫
9G弱でってことは他に原因があるのでは?
Q.035のようにログを取ってみると止まるファイルがあるのかも
(会社でnamazu使ってるときは特定のファイルで止まる事は
 良くあった)
インデックス分けるのは構わないけど、(←トラブル時のメンテが楽だから)
複数のインデックスにまたがって一括で検索できる仕様に
して欲しい、、、
229名無しさん@そうだ選挙にいこう:2005/08/13(土) 20:34:56
>>227
たしかSQLiteがバックエンドのはずだから、データ格納形式としてはB-Treeかな。
230198=188:2005/08/13(土) 22:42:59
>>228
レスありがとうございます。
確かに9Gってのは少なすぎる気がするのでログみてみます。
またDocu単一なら20〜30G位1indexでいけるというのは特に
参考になりますです。
231名無しさん@そうだ選挙にいこう:2005/08/15(月) 18:00:12
自然文検索ができる、デスクトップ検索「QuickSolution」無償提供
http://japan.internet.com/busnews/20050811/2.html
232名無しさん@そうだ選挙にいこう:2005/08/15(月) 19:31:58
>QuickSolution は 10GB(1,000万件)のテキストを0.1秒で検索可能

ってことは100Gでも1秒なのか、すげえな。
233名無しさん@そうだ選挙にいこう:2005/08/15(月) 21:15:49
>>232
負荷が O(n) ならそうだろうが、100GBで同じ性能になるかどうかは
難しいんじゃないの、とくにソートする場合とか。
234名無しさん@そうだ選挙にいこう:2005/08/15(月) 21:25:21
そのQuickSolutionに限らないことですけど、そういう売り文句を真に受けちゃいけませんよ。
「0.1秒で検索++可能++」というのは、「0.1秒で検索結果が表示される++こともある++」という意味です。
ヒット数が少ないなどの有利な条件で検索した結果を根拠にした主張である可能性があります。

これも一般論ですが、対象のテキストの規模だけでなく、検索条件の複雑さが検索時間に対する影響に
注意すべきです。むしろ、対象の規模と比較すべきはインデクシングにかかる時間の方でしょう。
235名無しさん@そうだ選挙にいこう:2005/08/15(月) 21:33:38
どうでも良いけど、対応フォーマットを増やして欲しい。 個人的にはchmファイルが
たくさんあるからそれ対応の。 現在、chmファイル対応のってコンセプトサーチだけか。
236名無しさん@そうだ選挙にいこう:2005/08/15(月) 22:42:04
それ案件の話? それとも個人でchm形式で物書きしてんの?
後者だったらかなり猛者かも。
237名無しさん@そうだ選挙にいこう:2005/08/15(月) 22:44:55
ヘルプから検索したいだけ何じゃないかと
238蕪木ら某 ◆Googl8RmwA :2005/08/15(月) 23:50:38
239名無しさん@そうだ選挙にいこう:2005/08/16(火) 12:37:43
やっぱり、OS組み込みじゃないとダメなのかもな。
240名無しさん@そうだ選挙にいこう:2005/08/16(火) 18:28:58
>>239
え?スレ読んでないの?
241名無しさん@そうだ選挙にいこう:2005/08/17(水) 17:35:15
ヤフーの日本語対応、まだ?
242名無しさん@そうだ選挙にいこう:2005/08/17(水) 18:06:46
釣りはもういいよ
243名無しさん@そうだ選挙にいこう:2005/08/17(水) 18:39:46
本文だけじゃなくて、各ファイル形式が持っている
メタデータ項目もできるだけインデックス対象にして欲しいな。

PDFのタイトルとか著者とかはほとんどの
全文検索ソフトで対応しているけど、
もっと、もっと、もっと〜〜〜〜〜
244名無しさん@そうだ選挙にいこう:2005/08/17(水) 20:52:45
サーチクロスで複数のシートがあるブックがヒットしたときにダブルクリックで
選択したキーワードがあるシートをサックリ開けたら最高なのにな〜

作者さんみてるw

googleなんてサーチクロスの足下にもおよばない・・・今のところ・・・
245名無しさん@そうだ選挙にいこう:2005/08/17(水) 21:53:17
>>243 自分でフィルタ書けよ。
246名無しさん@そうだ選挙にいこう:2005/08/17(水) 23:45:42
>>243
もうありますよ
247名無しさん@そうだ選挙にいこう:2005/08/23(火) 17:33:56
Google Desktop Search
MSN デスクトップサーチ
などのフリーのデスクトップ検索ソフトは、
全角半角などの同一視をしてくれない、気がする。
でも時々同一視してくれてるような検索結果も見る。
どっちなんだ。

上に上げた二つ以外にフリー載ってある?
Yahoo もフリーのデスクトップ検索ソフト出してた?
248名無しさん@そうだ選挙にいこう:2005/08/24(水) 10:11:39
>>247
使い方すら分からずいい加減なこと言わないでくれませんか
249名無しさん@そうだ選挙にいこう:2005/08/24(水) 11:59:59
「いい加減なことをいっている」ように感じるのか
250名無しさん@そうだ選挙にいこう:2005/08/24(水) 12:08:27
>全角半角などの同一視をしてくれない、気がする。
>でも時々同一視してくれてるような検索結果も見る。
ヘルプ嫁、ぐぐれ
251名無しさん@そうだ選挙にいこう:2005/08/24(水) 23:21:17
>>250
うるせえバカ
252名無しさん@そうだ選挙にいこう:2005/08/25(木) 00:12:07
>>251 若者よ、学べ。切れたら負けだぞ。
253名無しさん@そうだ選挙にいこう:2005/08/25(木) 01:31:49
>>252
ハイ、分かりました
254名無しさん@そうだ選挙にいこう:2005/08/25(木) 06:03:03
馬鹿は使うなってことだなw
255名無しさん@そうだ選挙にいこう:2005/08/25(木) 12:48:00
>>255=馬鹿
256名無しさん@そうだ選挙にいこう:2005/08/25(木) 14:12:14
自打球乙w
257名無しさん@そうだ選挙にいこう:2005/08/26(金) 01:05:39
>>255=馬鹿
258名無しさん@そうだ選挙にいこう:2005/08/26(金) 02:30:40
247みたいなアフォは多いぞ
そういう人に限って自分の勘違いを認めようとせず
バグだ不具合だと騒ぎ立てるし・・・
サポセンで働いていたオレがいうんだから間違いない
259名無しさん@そうだ選挙にいこう:2005/08/27(土) 10:23:11
折れ最初のマシンがW95だったな。
数枚の参考資料持ってアキバ行って部品買って組んだ。W95も一応すんなり入った。

よかったよ、W95が屑中の屑で。
1年待たずに見切り付けてLinuxに乗り換え。
今に至る。
最高パワーの反面教師として正しい道を示してくれたOS(モドキ)という意味で、大変感謝してる。

今後もハイテンションな屑を作り続けて人々に道を示して下さいね>MS様
260名無しさん@そうだ選挙にいこう:2005/08/28(日) 01:09:45
>>259
誤爆?
261名無しさん@そうだ選挙にいこう:2005/08/30(火) 15:34:41
Microsoft、WinFSを前倒しでβ公開
http://pc8.2ch.net/test/read.cgi/pcnews/1125371898/
262名無しさん@そうだ選挙にいこう:2005/08/30(火) 16:06:20
>>261 MSの焦りが感じられるのは俺だけかな。
263名無しさん@そうだ選挙にいこう:2005/08/30(火) 18:01:08
焦ってもらって結構
それがSpotlightのおかげなら
Spotlightもちっとは役に立ってるじゃん
よかったねマカーの皆さん
264名無しさん@そうだ選挙にいこう:2005/08/30(火) 18:48:57
まぁ、所詮Spotlightには叶わないがな。
265名無しさん@そうだ選挙にいこう:2005/08/30(火) 19:38:45
MacのシェアからしてSpotlightなんぞ歯牙にも掛けてないだろ
MSが意識してるライバルはGoogleであってAppleなんぞ相手にもしてない
266名無しさん@そうだ選挙にいこう:2005/08/30(火) 20:52:59
MSの後出しは戦略。

何でもかんでもMacに先んじては市場シェアが上がりすぎてしまうのでわざとやっている。
MacにOfficeだしてやっているようにお情けをかけてあげているようなモンだ。
267名無しさん@そうだ選挙にいこう:2005/08/30(火) 21:38:25
まぁ、Appleを生かさず殺さず、がMSの戦略だ。
268名無しさん@そうだ選挙にいこう:2005/09/01(木) 01:52:07
WinFSとSpotlightは、全然違うものなんですが・・・。
269名無しさん@そうだ選挙にいこう:2005/09/01(木) 22:54:19
>>268
パクリだから一緒
270名無しさん@そうだ選挙にいこう:2005/09/02(金) 10:52:04
わかってないな
271名無しさん@そうだ選挙にいこう:2005/09/02(金) 12:08:43
>>269
頭だいじょうぶ?
272名無しさん@そうだ選挙にいこう:2005/09/05(月) 02:07:16
Spotlightがシステムに近いと言ってもインデキシングにガリガリやるのは避けられないわけでしょ?
オフィスによっては数十GBのドキュメントを保存してるところもあると思うが
ネットワーク上のファイルサーバに対してもSpotlightは使い物になるわけ?
それともmacだからそういう使途は想定されていない?
273名無しさん@そうだ選挙にいこう:2005/09/05(月) 11:07:42
>>272
何言ってるの?
少なくともWindowsより遥かにマシなんだけどね
274名無しさん@そうだ選挙にいこう:2005/09/05(月) 12:51:55
Winならサーバでインデックスサービス走らせとけば
クライアントはブラウザとかで検索できるけど
macはそういう使途は想定されていない?
275名無しさん@そうだ選挙にいこう:2005/09/05(月) 13:40:59
>>273
それぞれについで、どうマシなのか答えてほしいよ。
さっぱり参考にならないよ、それじゃ。
Mac購入を考えている人だっているかもしれないんだから。
276名無しさん@そうだ選挙にいこう:2005/09/05(月) 14:06:24
ろくに使いこなせてないから質問にまともに答えられないのさ。
Spotlight持ってても仕事もろくにしないで、Macで遊んでばかりいるんだろ。
ここはあくまでビジ板だ。こういうどうしようもないマカーはとっとと巣に帰れ。
277名無しさん@そうだ選挙にいこう:2005/09/05(月) 18:33:17
>>276
どちらかというと、お前の方がどうしようもないな。
278名無しさん@そうだ選挙にいこう:2005/09/05(月) 18:36:38
人を呪わば穴二つ。
279名無しさん@そうだ選挙にいこう:2005/09/05(月) 19:47:11
女の子は穴三つ。
Macintoshは文房具。
280名無しさん@そうだ選挙にいこう:2005/09/05(月) 22:30:48
>>279
上の口もあるから4つだ
281名無しさん@そうだ選挙にいこう:2005/09/05(月) 22:40:27
鼻毛がチクチクしてすごくイイです。
282名無しさん@そうだ選挙にいこう:2005/09/05(月) 22:49:29
これってどうよ?

CyberFinder
http://www.cybersolutions.co.jp/product/cf/index.html
283名無しさん@そうだ選挙にいこう:2005/09/06(火) 01:36:15
与太話はいいからマカはさっさと質問に答えろよ
284名無しさん@そうだ選挙にいこう:2005/09/06(火) 01:54:48
マカーはバカーですから、まともな返事を期待してはいけません。
285名無しさん@そうだ選挙にいこう:2005/09/07(水) 08:18:03
>>280
人間には、
目:2 + 鼻:2 + 耳:2 + 口:1 + ヘソ:1 + 肛門:1
の9個の穴が有る。そして女はさらにもうひとつの穴が。

「九の一」 → くのいち

286名無しさん@そうだ選挙にいこう:2005/09/07(水) 12:41:01
オレは女ではないのでおしっこは目から出ます。
287名無しさん@そうだ選挙にいこう:2005/09/07(水) 19:45:00
知らなかったけど、PC系の板ではわりと有名な人らしい。
返答を期待するのは無駄では?

★050901 PC系板 通称「自動化」荒らし報告スレ
http://qb5.2ch.net/test/read.cgi/sec2chd/1125919274/
288名無しさん@そうだ選挙にいこう:2005/09/08(木) 10:56:11
粘着キモッ
289名無しさん@そうだ選挙にいこう:2005/10/18(火) 14:48:46
保守ついでに

デスクトップ検索ソフト「Google デスクトップ」のv2 日本語Beta版が公開
http://www.forest.impress.co.jp/article/2005/10/12/googleds2jpbeta.html
290名無しさん@そうだ選挙にいこう:2005/10/27(木) 20:12:25
最近Hyper Estraierのアプリ開発が熱いね。
http://freemind.s57.xrea.com/desktophe/index.html
http://august.oor.jp/logs/estraier/
291名無しさん@そうだ選挙にいこう:2005/11/13(日) 23:32:24
NTFSドライブのプロパティで設定できる「このディスクに
インデックスをつけ、ファイル検索を速くする」っての
MSNデスクトップサーチとかGoogleデスクトップサーチ使う時には
必要ないのん?
292名無しさん@そうだ選挙にいこう:2005/11/13(日) 23:37:16
関係ない
293名無しさん@そうだ選挙にいこう:2005/11/13(日) 23:43:13
あ、どうもサンクス
294名無しさん@そうだ選挙にいこう:2005/11/15(火) 02:31:19
サーチクロスが一番な気がしてきた
295名無しさん@そうだ選挙にいこう:2005/11/15(火) 02:47:05
サーチクロスのエンジンをHyperEstraierにすればいい
296サーチクロス使い:2005/11/15(火) 21:02:54
297名無しさん@そうだ選挙にいこう:2005/11/16(水) 02:18:47
xdoc2txtとHyperEstraierのやってることは別だと思うけど?
298名無しさん@そうだ選挙にいこう:2005/11/16(水) 10:48:36
MSN サーチ ツールバー非搭載「Windows デスクトップ サーチ」
ttp://www.forest.impress.co.jp/article/2005/11/15/windesksearch.html
299名無しさん@そうだ選挙にいこう:2005/11/16(水) 18:16:19
誘導されてきました。

ExpandFinderで
文書データベースを、ネットワークで共有する裏技はございませんか?

インデックスを共有したいのですが、サーチクロスだと同時にインデックスを参照できないようです。
対象文書はpdf、xdw(docuworks)です。
300名無しさん@そうだ選挙にいこう:2005/11/16(水) 21:01:28
>>299
300get
301名無しさん@そうだ選挙にいこう:2005/11/17(木) 02:18:15
>>299
ジャストシステムに見積もってもらえ
302名無しさん@そうだ選挙にいこう:2005/11/17(木) 11:37:05
>>256,297
xdoc2txtと同じ作者のKWIC Finderと比較すべきなのかな。

できることはだいたい同じだけど、HyperEstraierの方が大量の文書を扱えるし速い。
でも、Webサーバを立てなきゃいけないのが面倒くさい。

HyperEstraierはライブラリだから、できる人にとってはUIを自由に設計できる
点も評価できるんじゃないかな。
303名無しさん@そうだ選挙にいこう:2005/12/12(月) 23:26:41
Office/PDF/HTML文書やテキストを全文検索できるフリーソフト「探三郎」
インデックスで高速に全文検索、指定時刻や起動後の経過時間でインデックス更新
http://www.forest.impress.co.jp/article/2005/12/07/sin3rou.html

久々にフリーで良さそうなの出たんじゃね?
304名無しさん@そうだ選挙にいこう:2005/12/13(火) 00:11:12
>>303
これで日本で使用されているメールクライアントが制覇してくれれば・・・

305名無しさん@そうだ選挙にいこう:2005/12/13(火) 06:58:39
それhtmlファイルだとその場に飛ばないから使えない
306名無しさん@そうだ選挙にいこう:2005/12/15(木) 10:43:36
>>304 メールクライアントが制覇ってどういう意味?
307名無しさん@そうだ選挙にいこう:2005/12/21(水) 12:18:55
>>303
アイテム数が多いとメモリ不足発生。
308名無しさん@そうだ選挙にいこう:2005/12/22(木) 23:40:53
すみませんちょっとサーチクロスで2ちゃんのログをインデックス対象にしてる方に質問なんですけど
↓のスレ取得してるとエラー出ませんか?

http://qb5.2ch.net/test/read.cgi/sec2ch/1045495883/
309名無しさん@そうだ選挙にいこう:2005/12/23(金) 01:41:17
>>308
試したけど出ないよ
310308:2005/12/23(金) 01:52:07
>>309
試していただいてありがとうございます。
いつもそこでエラー出るんですが、こっちの環境に問題があったようです。
すみませんでした。
311名無しさん@そうだ選挙にいこう:2005/12/23(金) 15:31:39
バージョンも書かず何がしたいんだろう・・・
312サーチクロス使い:2005/12/28(水) 06:06:16
xdoc2txtにコマンドフィルター使ってるとインデンクス更新は
速くなるけど検索が遅くなる気がする・・・

5GBクラスのエクセルの検索で5秒以上かかってしまいます。
313名無しさん@そうだ選挙にいこう:2005/12/28(水) 08:51:33
PC環境くらい書けよw
ただの煽りなら乙
314名無しさん@そうだ選挙にいこう:2005/12/28(水) 16:11:28
普通の人は更新も検索も早くなるようなうまい話があるとは思ってないけどな
315名無しさん@そうだ選挙にいこう:2005/12/28(水) 20:34:03
>5GBクラスのエクセルの検索で5秒以上かかってしまいます。
「の」大杉w読みづらい
316名無しさん@そうだ選挙にいこう:2005/12/28(水) 21:43:55
5GBったってそのうちテキストがどれくらいか分からんと何とも言えんわな。
317名無しさん@そうだ選挙にいこう:2005/12/28(水) 22:57:44
え、1ファイルが5GBのエクセルファイルなんじゃないの?
そりゃー大変じゃろと思ってたんだけど。
318名無しさん@そうだ選挙にいこう:2005/12/30(金) 08:37:05
で、99.99995%が画像で残りがファイルフォーマット固有の情報と・・・
319名無しさん@そうだ選挙にいこう:2005/12/31(土) 04:19:48
Windows2000のファイルサーバー全文検索に、インデックスサービス+ASP使ってます。
namazuを入れてみたんですが、どうも日本語フォルダとの相性が悪くIndex作成してくれません。
WEBからみんなでWindowsファイルサーバーを検索できるような一番よいソフト(仕組み)はなんかないですか?
320名無しさん@そうだ選挙にいこう:2005/12/31(土) 15:32:16
HyperEstraier
321名無しさん@そうだ選挙にいこう:2005/12/31(土) 21:17:10
>>320 ありがとうございます。
Office文書もいけますかね?っていうかOffice文書検索がほとんどなんですが。。
322名無しさん@そうだ選挙にいこう:2005/12/31(土) 21:19:08
>>320 ありがとうございます。
Office文書もいけますかね?っていうかOffice文書検索がほとんどなんですが。。
323名無しさん@そうだ選挙にいこう:2005/12/31(土) 21:24:26
>>322
とりあえずそのサイトに行ってみれ
324名無しさん@そうだ選挙にいこう:2006/01/01(日) 03:14:43
>>322
いける。Windows版バイナリには、Office用のフィルタも同梱されているから、
コマンド叩くだけですぐ構築できる。
325 【吉】 【761円】 :2006/01/01(日) 12:06:35
fhew氏が復活しますように。
326319,321,322:2006/01/01(日) 22:09:40
ありがとうございます!
さっそく使ってみます。
327312:2006/01/11(水) 14:07:24
インデックス作りなおしたら高速になりました。
お騒がせしました。
328名無しさん@そうだ選挙にいこう:2006/01/12(木) 10:49:41
パソコン内のメールやファイルをすばやく探し出せるデスクトップ情報検索ソフトの新版
「ConceptSearch(R) /R.2」2月10日(金)発売
〜「Outlook 2003」や「Becky! Internet Mail Version 2.22」の
メール検索に対応〜
ttp://www.justsystem.co.jp/news/2006f/news/j01112.html

>ConceptSearchユーザーには、「ConceptSearch /R.2」にアップデートできる
>「アップデートモジュール」を、2月9日(木)より無償提供します。

>ConceptSearch /R.2では、新たに「Outlook 2003」や「Becky! Internet Mail
>Version 2.22」に対応し、これらのメールソフトで管理しているメールと
>その添付ファイルが検索できるようになりました。

>インデキシングの設定では、文書データベースのソースファイルの
>最大サイズを300MBから2GBに引き上げました。
>また、インデキシング時の一時メモリ使用効率を改善しています。
329名無しさん@そうだ選挙にいこう:2006/01/13(金) 00:57:04
googleデスクトップは、outlookの検索に便利だな。
なんせ、pstファイルが2GBにふくれあがっているものだから、通常の検索じゃあ
時間がかかってしょうがない。
ユーザインタフェースもブラウザ形式でわかりやすい。

それにしても、googleデスクトップが作り出すインデックスファイルは巨大だ。。。
ハードディスクの容量が少なくなって気づいた。
330名無しさん@そうだ選挙にいこう:2006/01/16(月) 21:53:43
>>329
自分のPCの能力も考えず
むやみに導入したあなたが悪いだけでは?
わかりやすいかどうかも人それぞれの問題だしさ・・・
331名無しさん@そうだ選挙にいこう:2006/01/18(水) 00:31:58
企業向け Windows デスクトップ サーチ
http://www.microsoft.com/windows/desktopsearch/ja/enterprise/default.mspx
332名無しさん@そうだ選挙にいこう:2006/01/18(水) 03:13:59
試しに入れてみたけどイイ
グーグルデスクトップから完全に移行する予定
333名無しさん@そうだ選挙にいこう:2006/01/18(水) 06:47:59
pstファイルだったらサーチクロスじゃね?
ソートとか出来るし。
334名無しさん@そうだ選挙にいこう:2006/01/18(水) 07:11:50
naamzuも出来るなw
市販ソフト進めてるやつって社員なんだろうな
335名無しさん@そうだ選挙にいこう:2006/01/18(水) 09:24:03
関係者乙
336名無しさん@そうだ選挙にいこう:2006/01/18(水) 10:38:11
また社員同士のいがみ合いか・・・
337名無しさん@そうだ選挙にいこう:2006/01/18(水) 11:59:52
>>334
PCオタばっかりじゃないし
イニシャルコストが高すぎ
338名無しさん@そうだ選挙にいこう:2006/01/18(水) 13:06:41
試しに入れてみたけどグーグルデスクトップの方が良い
グーグルはやはり時代の弔辞だな
339名無しさん@そうだ選挙にいこう:2006/01/18(水) 13:18:55
ググールデスクトップサーチだと検索で引っかからないファイル(ファイルサイズの
大きい物)があったからMSNに乗り換えてみたら結構いい感じだった。
今はどっちも消してサーチクロス動かしてる。
340名無しさん@そうだ選挙にいこう:2006/01/18(水) 18:05:02
僕の頭では、MSNもGoogleも使いこなせない。何されてるかわからない。
メール検索いらないし、サーチクロスがちょうどいい。ニーズにも合ってる。
341名無しさん@そうだ選挙にいこう:2006/01/18(水) 19:30:46
サーチクロス人気だな・・・

フリーだったら最高なんだが。
EXCEL検索でヒットしたあと複数シート検索マクロ使うのがかったるい。

出来れば検索→ヒット→ヒットしたシートを即表示して欲しい。
何とかならないかな・・・
342名無しさん@そうだ選挙にいこう:2006/01/18(水) 22:44:47
新しいConceptSearchにちょっとは期待してるんだヨ。
343名無しさん@そうだ選挙にいこう:2006/01/18(水) 23:36:20
>>342
いずれにせよインデックス作成に時間がかかる予感
とうか重すぎ
344名無しさん@そうだ選挙にいこう:2006/01/19(木) 01:52:47
>>44の補足

堀江君にとって最悪のシナリオは、「風説の流布」や、「偽計取引」による「罰金」
では収まらず、インサイダー取引としての立件、そしてその後のライブドアやライ
ブドアマーケティングの株価下落によってキャピタルロスを被った同社の株主が、
堀江君個人を民事訴訟するといった展開でしょう。
2005年春の騒動で、ライブドアの大株主に「無理やりさせられた」フジサンケイグ
ループだって、そうなったら黙っていないでしょう。

結局のところ、「ファイナンスに対する理解」がない人にとっては、ライブドアの
経営が「如何にインチキであるか」がわからないわけですから、困ったものです。
「わかってない人」が、このような企業の株価を支えているわけですからね。

ライブドア事件・・・これは、今見えている「容疑」の範囲では、全然収まらないでしょう。
当局がどこまでメスを入れるのか、それは僕にもわかりません。
しかし、ホリエモンだけではなく、その取り巻きの「多くのインチキ錬金術師」
たちは、ぶるぶるしていることでしょう。
この場で、具体的には書けませんが、僕の持っている情報、そして僕の知識から
観た場合、「ある一定のカテゴリー」に属する人々の事件へのかかわりが透けて
見えます。
メスを入れていけば、相当の膿が出てくることでしょう。
そのとき、みなさんにも僕の訴えたいことが、ようやくご理解いただけるのでは
ないかと思います。
345名無しさん@そうだ選挙にいこう:2006/01/19(木) 03:25:53
htmlファイルを検索して
該当箇所の前後をブラウザや内蔵の表示部分で表示してくれるものはありますか?
346名無しさん@そうだ選挙にいこう:2006/01/19(木) 09:21:30
>>345
さーちぺけ
347名無しさん@そうだ選挙にいこう:2006/01/19(木) 16:24:13
estraierで検索するときの検索対象の拡張子を増やす方法がわからない。
どなたかご教示してください
348名無しさん@そうだ選挙にいこう:2006/01/19(木) 20:10:11
>>347
Hyper Estraierなら、

find . -name '*.foo' -o -name '*.bar' -o -name '*.baz' -print | estcmd gather dbdir -fh -

とやると、カレントディレクトリ以下で拡張子がfooかbarかbazのものをHTMLとして登録できるよ。
-fhを-ftにすればプレーンテキストとして扱われる。旧Estraierでも同じような機能があるはず。
349名無しさん@そうだ選挙にいこう:2006/01/19(木) 20:59:55
>>345
namazu
kwic
nvu
350名無しさん@そうだ選挙にいこう:2006/01/19(木) 22:18:00
>348
おお、ありがとうございます
351名無しさん@そうだ選挙にいこう:2006/01/20(金) 07:48:28
>>345
microsoft index server ならできる。
昔、オプションパック時代にサンプルでついていた。

今、たしかサンプルプログラムついていないからな〜。
まあ、ぐぐってみてください。
352名無しさん@そうだ選挙にいこう:2006/01/20(金) 13:04:22
M$製品はだめだろw
353名無しさん@そうだ選挙にいこう:2006/01/21(土) 10:33:00
仕事メーカー営業。
10年ぐらい前の製品内訳を物件名だけでピンポイント検索。
電話で製品のデーターを即答してあげたら驚いてた。

ちょっとだけ自慢したい気分。
他の奴ら、こんな便利なソフトなんで使わないんだろ?
354名無しさん@そうだ選挙にいこう:2006/01/21(土) 10:35:51
きっちりデータを整理してあるから、
力任せの検索は必要ないからだと思われw
355名無しさん@そうだ選挙にいこう:2006/01/21(土) 23:36:49
>>354
あなたが扱うデータ量が少ないだけじゃない?
それか整理できるデータしか扱ってないかのどっちかだとおもう
356名無しさん@そうだ選挙にいこう:2006/01/22(日) 00:18:12
まだ学生なんだろ
357名無しさん@そうだ選挙にいこう:2006/01/30(月) 00:11:43
age
358名無しさん@そうだ選挙にいこう:2006/02/02(木) 20:06:50
MitakeSearchのwin版インストールがわからない
だれかやったことあるヤシいる?
359名無しさん@そうだ選挙にいこう:2006/02/03(金) 18:15:09
>>358
ん?何が分からないんだ?
特に躓くところはないとおもったけど・・・
360名無しさん@そうだ選挙にいこう:2006/02/04(土) 08:32:43
>>353
何使ってんの?
361名無しさん@そうだ選挙にいこう:2006/02/04(土) 13:43:32
>他の奴ら、こんな便利なソフトなんで使わないんだろ?
PCオタじゃなければ
導入コストには見合わないだろうね
煽りじゃなく普通の人には難しいよ
362名無しさん@そうだ選挙にいこう:2006/02/05(日) 12:09:35
会社では使うが自宅では使わない。
環境によっては激しく便利。
363名無しさん@そうだ選挙にいこう:2006/02/05(日) 12:40:35
俺は逆だな・・・
会社のデータはしっかり管理してるが
趣味のデータはばらばら
364名無しさん@そうだ選挙にいこう:2006/02/06(月) 10:11:36
インデキシングの時間が普通の人には何か嫌だと思う。
もっと気にならないようにインデックス作成出来るようになればね。
365名無しさん@そうだ選挙にいこう:2006/02/06(月) 11:43:22
普通の人ってなに?
むやみやたら一般化して
自分の意見=普通にするのやめようよ
366名無しさん@そうだ選挙にいこう:2006/02/06(月) 11:46:22
俺は普通だ!
367名無しさん@そうだ選挙にいこう:2006/02/06(月) 11:47:57
普通の人は、そんなこと気にしないとおもうけどな・・・
少なくともwindows標準でもなんかのインデキシングやってたり
8.3のファイル名やら作ってるけど
誰も気にしてないし・・・
368名無しさん@そうだ選挙にいこう:2006/02/07(火) 05:11:30
インデックスは↓タイマーoffソフト使って終了時に作成。
ttp://www.vector.co.jp/soft/win95/util/se178928.html

アイドル時や起動時はやりたくない・・・
369名無しさん@そうだ選挙にいこう:2006/02/07(火) 05:16:03
夜中にインデックス化するように設定すればいい
370名無しさん@そうだ選挙にいこう:2006/02/07(火) 08:40:59
インデックスにしないで夜中に検索かければいい
371名無しさん@そうだ選挙にいこう:2006/02/07(火) 12:30:47
>>368
アイドル時はなんで?
372名無しさん@そうだ選挙にいこう:2006/02/07(火) 12:59:06
なんとなく
373名無しさん@そうだ選挙にいこう:2006/02/07(火) 13:08:15
>>369
なんとなく嫌
374名無しさん@そうだ選挙にいこう:2006/02/08(水) 09:09:07
>>364
インストール直後はgrep検索で、バックグラウンドでインデックスこつこつ
作って、徐々に早くなるっていうのはどうだろう?
375名無しさん@そうだ選挙にいこう:2006/02/08(水) 12:06:09
知らないところで勝手に作られてもねw
364のいう普通の人はいやがるとおもうよw
376名無しさん@そうだ選挙にいこう:2006/02/08(水) 23:37:10
知らないのなら、いやがるまでもない。
377名無しさん@そうだ選挙にいこう:2006/02/09(木) 08:31:24
知識が無い人ほど理由がなくいやがるもんだよ
写真を撮られたら魂も取られるとかねw
378名無しさん@そうだ選挙にいこう:2006/02/09(木) 20:18:08
取られてますよ。気付いてないだけです。(`・ω・´)
379名無しさん@そうだ選挙にいこう:2006/02/10(金) 08:59:06
クレジット持たない人のいいわけに似てるw
380名無しさん@そうだ選挙にいこう:2006/02/11(土) 23:19:08
そして、あなたは気づいてないかもしれないが、インデックスも既に作られています。
381名無しさん@そうだ選挙にいこう:2006/02/12(日) 08:56:29
ConceptSearchやっとOutlook対応してくれたか
ちょっとは使えそう
382名無しさん@そうだ選挙にいこう:2006/02/12(日) 15:02:25
あ、もう体験版出てるのか。
忘れてた。

アンケートにSearchXがあるのがちょっとびっくり。
確かに数少ない製品ではあるけれど。

383名無しさん@そうだ選挙にいこう:2006/02/12(日) 18:38:20
8.3のファイル名も勝手に作るしな・・・
384名無しさん@そうだ選挙にいこう:2006/02/23(木) 20:40:53
インターネットブーメランを常用してるお^^;
385名無しさん@そうだ選挙にいこう:2006/02/23(木) 22:18:26
相変わらずインデクサは重めだねぇ>ConceptSearch
んでも、要約が表示されるのはちょっとよかった。
SearchXでも要約表示ができるようにならんかな。
386名無しさん@そうだ選挙にいこう:2006/03/10(金) 10:59:38
技術の広場
BYTE LAB「デスクトップ検索」(1)
http://itpro.nikkeibp.co.jp/article/COLUMN/20051208/225940/

 パソコンを起動して所望のファイルを開き,編集をして保存する。
この誰もが繰り返している一連の作業で,「遅い」と感じる場面は減りつつある。
ハードウェアの性能向上のおかげである。
ところが目的とするファイルの保存場所が分からなくなると,途端に無駄な時間を過ごすことになる。
(以下リンク先)


387名無しさん@そうだ選挙にいこう:2006/03/10(金) 16:18:10

  ;;;;;j,. ---一、 `  ―--‐、_ l;;;;;;    
 {;;;;;;ゝ T辷iフ i    f'辷jァ  !i;;;;;   日経バイト=アルバイト情報誌
  ヾ;;;ハ    ノ       .::!lリ;;r゙    
   `Z;i   〈.,_..,.      ノ;;;;;;;;>  そんなふうに考えていた時期が
   ,;ぇハ、 、_,.ー-、_',.    ,f゙: Y;;f      僕にもありました
   ~''戈ヽ   `二´    r'´:::. `!

388名無しさん@そうだ選挙にいこう:2006/03/15(水) 17:35:07
2006/02/11 08:53 更新
Google Desktop「使ってはいけない」――EFFが消費者に勧告
http://www.itmedia.co.jp/news/articles/0602/11/news009.html
389名無しさん@そうだ選挙にいこう:2006/03/15(水) 18:45:05
また懐かしいネタですねw
390名無しさん@そうだ選挙にいこう:2006/03/15(水) 19:41:17
googleへのインデクス集積の通信は暗号化されてるの?
中国なんかだとgoogleからの提出もさることながら、PCからgoogleまでの
間の通信を傍受されかねず、googleが提出しなくても中国政府に個人の
PCの内容をチェックする機会を与えかねない。


391名無しさん@そうだ選挙にいこう:2006/03/15(水) 20:01:45
>>390
されてるが信頼に値するかは人それぞれ
392名無しさん@そうだ選挙にいこう:2006/03/15(水) 21:14:00
>>390
グーグルで検索しただけでも一緒
393名無しさん@そうだ選挙にいこう:2006/03/15(水) 21:32:25
>>392
グーグルで検索しただけじゃ個人PC内のファイルに関するヒントは
流出しないだろ。アホか。
394名無しさん@そうだ選挙にいこう:2006/03/15(水) 21:36:51
>>393
>インデクス集積
395名無しさん@そうだ選挙にいこう:2006/03/18(土) 11:08:08
どっちにせよVista搭載の検索機能は現状のインデックスサービス、
MSNデスクトップサーチを基盤にしたもんだろ?
ならごちゃごちゃ言わずMSNツールバーインスコしとけば
将来的にも安心安泰じゃあるまいか

姿を見せ始めたWindows Vista(3)
http://pc.nikkeibp.co.jp/article/NPC/20060305/231743/
396名無しさん@そうだ選挙にいこう:2006/03/18(土) 18:49:44
>>395
違いますよ
嘘情報ひろめるのはやめてほしい
397名無しさん@そうだ選挙にいこう:2006/03/18(土) 22:36:45
Dim FoundCell

FoundCell = FoundCell.Offset(1, 0).Address


なにがダメなのでしょうか?エラーが帰ってきてしまいます。
398名無しさん@そうだ選挙にいこう:2006/03/19(日) 07:45:16
>>396
そいつ他スレでも拒否されてるんだな
399名無しさん@そうだ選挙にいこう:2006/03/23(木) 14:02:46
どっちにせよVista搭載の検索機能は現状のインデックスサービス、
MSNデスクトップサーチを基盤にしたもんだろ?
ならごちゃごちゃ言わずMSNツールバーインスコしとけば
将来的にも安心安泰じゃあるまいか

姿を見せ始めたWindows Vista(3)
http://pc.nikkeibp.co.jp/article/NPC/20060305/231743/
400名無しさん@そうだ選挙にいこう:2006/03/23(木) 20:31:48
>>399
age忘れてるよw
401名無しさん@そうだ選挙にいこう:2006/03/32(土) 11:09:22
Hyper Estraire でpdfファイル中のタイトルを(ファイル名ではなく)、
検索結果のタイトルにしたいのですが、どうやってやればよいのでしょうか?
windows版で、フィルタはxdoc2txtを使っています。
402名無しさん@そうだ選挙にいこう:2006/03/32(土) 13:04:00
>>401
xdoc2txtでは無理ぽ
403名無しさん@そうだ選挙にいこう:2006/03/32(土) 13:05:46

401です。

>>402
 お返事ありがとうございます。
 どのようなフィルターを使用すれば可能でしょうか?
 ググってみましたが、適当なものが見つかりませんでした。
 もし、ご存じであればご教示願えないでしょうか。
404名無しさん@そうだ選挙にいこう:2006/04/02(日) 00:03:40
>>403
Hyper Estraireというのはようわからんが
俺はNamazuでxpdfとか使ってる
ただしパスワード設定文書はIndex作成時完全無視される
405名無しさん@そうだ選挙にいこう:2006/04/02(日) 15:40:03
xdoc2txtってメタデータを出力するオプションなかったっけ。
406名無しさん@そうだ選挙にいこう:2006/04/02(日) 17:08:38
>>404
>ただしパスワード設定文書はIndex作成時完全無視される
出来るけどやったらあかんだろ・・・
407名無しさん@そうだ選挙にいこう:2006/04/02(日) 19:30:17
>>405
ないよ。
408名無しさん@そうだ選挙にいこう:2006/04/02(日) 19:31:25
え?
409名無しさん@そうだ選挙にいこう:2006/04/03(月) 02:16:53
>>406
できねえよ
アホか?
410名無しさん@そうだ選挙にいこう:2006/04/03(月) 23:08:28
ということにしとこう
411名無しさん@そうだ選挙にいこう:2006/04/03(月) 23:53:21
出来たら違法だしねw
412名無しさん@そうだ選挙にいこう:2006/04/06(木) 05:37:17
Archivarius 3000(ttp://www.likasoft.com/jp/index.shtml)っての見つけたんだけど
このスレ的にはこのソフトはどんなもん?
サーバー機能とか結構おもしろいんだけど。
413名無しさん@そうだ選挙にいこう:2006/04/06(木) 17:17:18
>>412
一太郎が検索対象に入ってないじゃん
どっちにせよVista搭載の検索機能は現状のインデックスサービス、
MSNデスクトップサーチを基盤にしたもんだろ?
ならごちゃごちゃ言わずMSNツールバーインスコしとけば
将来的にも安心安泰じゃあるまいか

姿を見せ始めたWindows Vista(3)
http://pc.nikkeibp.co.jp/article/NPC/20060305/231743/
414名無しさん@そうだ選挙にいこう:2006/04/06(木) 23:47:17
ConceptSearchはインデキシングの時間はともかく、テンポラリのファイルを大量に作らない?
あれどうにかして欲しいよ。
415名無しさん@そうだ選挙にいこう:2006/04/08(土) 16:52:11
昨日上がったサーチXのアップデータ、腐ってるんじゃあるまいか?
416名無しさん@そうだ選挙にいこう:2006/04/08(土) 17:43:35

どういうふうに?
417名無しさん@そうだ選挙にいこう:2006/04/08(土) 22:09:54
>>415
腐ってるね。。。。
ダウンロードしたファイルをダブルクリックしても
コマンドプロンプトが表示され、なにもなく終了。(インスコできない)
掲示板もリードオンリーになったし、だれか指摘汁!
418名無しさん@そうだ選挙にいこう:2006/04/08(土) 22:57:15
社長が代わって最初の仕事が、掲示板封鎖とコレじゃねぇ……

Indexを破壊されたような気もするが、これは別口かな。
419名無しさん@そうだ選挙にいこう:2006/04/09(日) 00:09:27
え、うそ、中村さん止めちゃったの!?
……ほんとだ。
この新社長は何やってた人なん?

まあそれはそれとして、SearchXのアップデータはちゃんとアップされてないね。
掲示板の書き込みもできないとなると、単なる容量不足だったりして(笑)


420名無しさん@そうだ選挙にいこう:2006/04/09(日) 11:01:23
>>412
一太郎に対応してないのに目をつぶれば
これ結構いいな。対応エンコードとかすごすぎ。
421名無しさん@そうだ選挙にいこう:2006/04/10(月) 06:52:52
Googleデスクトップ検索のBeckyプラグインって、インストール後に
来たメールしか検索できないんすか?
422名無しさん@そうだ選挙にいこう:2006/04/10(月) 18:55:18
VCオワタ
423名無しさん@そうだ選挙にいこう:2006/04/10(月) 19:27:03
サーチXのアップデータ。
あらこっそり差し替えたのね、と思ってデスクトップでクリックしてみたら、
そんなファイルねーよってorz

ルートにコピーして再度クリックしてみたらアップデートできたから、
半角カナ駄目とかスペース駄目とか、そんな話なんだろうけど・・・
424名無しさん@そうだ選挙にいこう:2006/04/14(金) 00:55:07
サーチ×を2.10に上げたらまともに検索できなくなったんだけど。。。
仕方ないので2.09に戻した。

大丈夫か?>VC
つか、社名も変えたら?
425名無しさん@そうだ選挙にいこう:2006/04/14(金) 07:23:07
>>424
indexを再構築しては? うちでは使えているよ。
426名無しさん@そうだ選挙にいこう:2006/04/14(金) 08:50:49
再構築したんだけど、駄目だった。
うーん、なんだろう。。。
427名無しさん@そうだ選挙にいこう:2006/04/14(金) 10:44:53
具体的にどう駄目なのかが分からんから、何とも言えんがね
428名無しさん@そうだ選挙にいこう:2006/04/18(火) 22:17:46
不正ユーザだから
429名無しさん@そうだ選挙にいこう:2006/04/22(土) 00:12:56
Web News においては既に告知済みですが、3月末日の創業者の退社により、株式会社
ビレッジセンターの代表取締役社長が交代いたしました。

パソコン通信創成期の頃より、日経MIX、NIFTY-Serve を経て、長年にわたって提供
して参りました電子会議室形式のサポート掲示板ですが、新社長の方針により、各
ソフトウェアのウェブ掲示板は本日を持って読み取り専用とし、今月内にも閉鎖さ
せて頂くことになりました。

テクニカルサポートは、これまで同様にお問い合わせフォームより受け付け、メール
でのご対応をさせていただきます。
今までのご利用に感謝致しますとともに、これからも弊社ソフトウェア製品を何卒よ
ろしくお願い申し上げます。
株式会社ビレッジセンター


\^o^/VCオワタ
430名無しさん@そうだ選挙にいこう:2006/04/22(土) 00:24:27
新社長の方針って曖昧だよな
客と直接関わる部分なんだからちゃんとその方針とやらを示せよ
431名無しさん@そうだ選挙にいこう:2006/04/22(土) 00:32:59
>>430
> 新社長の方針
っ掲示板封鎖
432名無しさん@そうだ選挙にいこう:2006/04/22(土) 00:38:49
なんか理由あるんでしょ
433名無しさん@そうだ選挙にいこう:2006/04/22(土) 02:36:20
あのユーザーと開発者との距離感の近さが取り柄だったのに。
434名無しさん@そうだ選挙にいこう:2006/05/09(火) 18:57:38
荒れてただけだな・・・
435名無しさん@そうだ選挙にいこう:2006/05/29(月) 12:11:40
>>412のArchivarius 3000、一太郎にも対応したらしい

・・・が、そもそも一太郎ドキュメントはバージョン別に複数の保存形式があるため、今後も強化するらしい。
http://xworks.org/archives/000226.shtml#more
436名無しさん@そうだ選挙にいこう:2006/05/30(火) 11:33:38
>>435
> ・・・が、そもそも一太郎ドキュメントはバージョン別に複数の保存形式があるため、今後も強化するらしい。

基本的にバージョン8方式が標準になってるんだけどね。
あとタブ付とかにすると最初のタブしか検索対象にならない
437名無しさん@そうだ選挙にいこう:2006/05/30(火) 11:44:12
2006.05.25
サーチクロス2.0のVer.2.10aを公開
・Ver.2.10 で、探す場所の絞り込みが機能しなかったバグを修正
438名無しさん@そうだ選挙にいこう:2006/06/01(木) 16:19:57
>>433
その距離感のせいで倒産寸前なんだって^^;
439名無しさん@そうだ選挙にいこう:2006/06/01(木) 22:52:10
>>438
え、マジで?
なんか買ってやろうと思ったけど、今のラインナップだと買うものがないんだよな……
(SerchXは既に買ってるし)

440名無しさん@そうだ選挙にいこう:2006/06/01(木) 23:42:10
ソフトイーサとセキュアVMのおこぼれでなんとかやってけるんじゃないの・・・
441名無しさん@そうだ選挙にいこう:2006/06/02(金) 02:55:50
無理だな
442名無しさん@そうだ選挙にいこう:2006/06/16(金) 13:57:15
キチガイマカーが去ってから伸びが鈍くなったね。
フリーのデスクトップ検索ツールが広まってる上に
OS標準ツールがデファクトスタンダードになっていくだろうから
もうこのスレもいらなくなるね
443名無しさん@そうだ選挙にいこう:2006/06/16(金) 20:04:57
アフォ?
普通の人には全文検索に魅力を感じないからスレが伸びないのかと・・・
444名無しさん@そうだ選挙にいこう:2006/06/16(金) 20:47:12
片付けは昔から苦手
445名無しさん@そうだ選挙にいこう:2006/06/16(金) 20:52:08
Mac板やLinux板では全体のユーザ数が少ないのに
もりあがってるからユーザ層の質の違いだろうね
446名無しさん@そうだ選挙にいこう:2006/06/28(水) 21:13:33
WinFSが開発中止だってさ
MSのアドバルーン商法はいつまで続くのかね
http://pc.watch.impress.co.jp/docs/2006/0628/hot434.htm
447名無しさん@そうだ選挙にいこう:2006/06/28(水) 22:35:38
ってことは、GDSの5000字制限が無くなるのを待つか
448名無しさん@そうだ選挙にいこう:2006/06/29(木) 06:21:59
待てるなんて
楽な仕事しかしてないんだろうな・・・
449名無しさん@そうだ選挙にいこう:2006/06/29(木) 13:00:21
「ボクは苦労人です」ってアピールしたいの?
キモすぎ
450名無しさん@そうだ選挙にいこう:2006/06/30(金) 10:02:56
待てる人はほとんどいないだろw
必要ないならともかくw
451名無しさん@そうだ選挙にいこう:2006/07/06(木) 10:59:36
もうサーチクロスでいいよ。これだけ長く重宝してる同類ソフトウェアはない
452名無しさん@そうだ選挙にいこう:2006/07/06(木) 14:11:23
JSクランチが良いよ
453名無しさん@そうだ選挙にいこう:2006/07/20(木) 17:23:04
これどうなんだろう。誰かテストよろ。

Turbo Searcher Network Edition
http://www.vector.co.jp/magazine/softnews/060720/n0607201.html?ref=rss
454名無しさん@そうだ選挙にいこう:2006/07/20(木) 20:08:51
遅い
455名無しさん@そうだ選挙にいこう:2006/07/28(金) 13:23:49
つうかVistaにはWindowsDesktopSearchがデふぉ搭載でしょ?
もうそれで決まりじゃん。このスレの存在意義もなくなるね
456名無しさん@そうだ選挙にいこう:2006/07/28(金) 13:29:23
WindowsFSじゃなかったっけw
457名無しさん@そうだ選挙にいこう:2006/07/28(金) 21:14:22
>>455
間違えて
恥ずかしい人ですね^^;
458名無しさん@そうだ選挙にいこう:2006/07/28(金) 21:29:11
WinFSって開発断念しただろ
459名無しさん@そうだ選挙にいこう:2006/07/28(金) 21:56:57
>>456
間違えて
恥ずかしい人ですね^^;
460名無しさん@そうだ選挙にいこう:2006/07/30(日) 14:31:51
>>458
名称が変わっただけだってw
461名無しさん@そうだ選挙にいこう:2006/07/30(日) 21:24:52
いや、やめますってアナウンスがあったはずだが
じゃあなんて名前になったんだ?
462名無しさん@そうだ選挙にいこう:2006/07/30(日) 22:16:37
463名無しさん@そうだ選挙にいこう:2006/07/30(日) 22:18:54
WindowsDesktopSearch ww
464名無しさん@そうだ選挙にいこう:2006/07/31(月) 01:00:04
>>461
そのあと再開されたのをしらんのか???
465名無しさん@そうだ選挙にいこう:2006/07/31(月) 11:36:34
それでなんて名前になったんだ?
466名無しさん@そうだ選挙にいこう:2006/07/31(月) 19:31:22
SuperWinFS
467名無しさん@そうだ選挙にいこう:2006/07/31(月) 19:53:53
>>465
それくらいググれよ
468名無しさん@そうだ選挙にいこう:2006/07/31(月) 22:56:30
>>467
おまえしつこいよ
そんなもんはない、あれは中止。
469名無しさん@そうだ選挙にいこう:2006/07/31(月) 23:57:17
ゲイシと共に去りぬってやつだな
470名無しさん@そうだ選挙にいこう:2006/08/01(火) 08:24:46
>>468
はいはいw
ないですよねwww
471名無しさん@そうだ選挙にいこう:2006/08/01(火) 12:22:02
>>470
馬鹿発見
w連打が格好いいと思っている
472名無しさん@そうだ選挙にいこう:2006/08/09(水) 22:35:07
粘着厨www
473名無しさん@そうだ選挙にいこう:2006/08/10(木) 13:47:06
敗北宣言乙
474名無しさん@そうだ選挙にいこう:2006/08/22(火) 16:21:14
新しい話題無いねー
475名無しさん@そうだ選挙にいこう:2006/08/22(火) 18:44:31
ネコちゃんにメールしろよ。
476名無しさん@そうだ選挙にいこう:2006/09/10(日) 14:44:39
サーチクロスを導入して2ちゃんログの全文検索をしようとしているのですが、インデックスの作成が出来ません。
サーチクロストップページからの導入方法にあるようにhtml2txtを導入してインデックスの作成を実行したら
インデックス対象が大きすぎると表示されました。

そのため拡張子をDATだけに限定して、フォルダも2ちゃんのログ保存フォルダだけにしたのですが、
【例外コード】
C0000005
【INDEXタイプ】
新規
【エラーの場所】
PickMimeInfo()
【メールオフセット】
124646
【ファイル数】
7113
【サイズ合計】
1009119830
インデックスが大きすぎる可能性があります。
[ツール]-[インデックスセットの切り替え]を使い、対象フォルダやフィルタイプで切り分けてみてください。

となります。ログサイズはたったの1Gしかありません。

これを回避するには板ごとにインデックスを作ってやるしかないのでしょうか?
試しに一番ログの大きいニュー速だけで作ったらきちんとできました。
477名無しさん@そうだ選挙にいこう:2006/09/10(日) 20:50:34
あー俺も出ることある
何度もやってると問題なくできたりもするよ
たぶん報告した方がいい問題な気がする
478名無しさん@そうだ選挙にいこう:2006/09/10(日) 22:55:47
>>477
ずっと前にメモリの少ないマシンで出続けて聞いたことがあります。
そのときの回答は「いっぱい小分けしてね♪」でした。
479名無しさん@そうだ選挙にいこう:2006/09/11(月) 05:06:01
インデックスの横断検索できるの?
小分けするのはいいけどさ
480名無しさん@そうだ選挙にいこう:2006/09/11(月) 09:29:53
Archivarius 3000ってDocuworksと2ちゃんdatに対応してくれないかな。
そしたら完璧なんだが。
481名無しさん@そうだ選挙にいこう:2006/09/14(木) 16:11:08
>>479
横断検索の要望は多いと思うんだが、まだ実現してないんだよなぁ。
実現したとしても、1GB近いインデックスをメモリに読み込んでは検索して、
また次のインデックスを読み込んで検索して‥‥と、分割数が増えれば
増えるほど、どんどん低速になっていかざるを得ないんで、実用度としては
厳しいかも。
482名無しさん@そうだ選挙にいこう:2006/09/14(木) 18:03:57
遅くなるのは仕方ないよ。
一々切り替える手前が面倒なだけだから要望しているんだろう?

483名無しさん@そうだ選挙にいこう:2006/09/15(金) 00:01:04
>>482
1つのインデックスが500MBと仮定して、4つのインデックスを横断検索すると
2GBのインデックスがメモリに常駐することになる。

単に「切り替えて順番に検索」ならインデックスは都度メモリから解放されるけど
横断検索は検索結果を表示したままにしないといけないからそうはいかない。
どんどん新規ウィンドウを開いていかないといけない。

かなりのマシン負荷がかかると思うし、実装されたらされたで不満でまくりになるんじゃないかな。
484名無しさん@そうだ選挙にいこう:2006/09/15(金) 04:07:51
馬鹿ですか?
485名無しさん@そうだ選挙にいこう:2006/09/15(金) 09:40:35
>>484
読解力無いな。いいから首吊って来いよ。
486あぼ〜〜ん:2006/09/15(金) 11:42:04
あぼ〜〜〜ん
487名無しさん@そうだ選挙にいこう:2006/09/15(金) 12:13:32
読解力w
485の馬鹿さ加減に拍手を送りたいw
488名無しさん@そうだ選挙にいこう:2006/09/15(金) 12:30:56
>>485
理由無く煽る馬鹿はいないよ
いい機会と思って反省したほうが君のため
489名無しさん@そうだ選挙にいこう:2006/09/15(金) 15:16:57
>>488
何を反省すんだよ。ヴォケが。
サーチクロスのあのでっかいインデックスをいくつも切り替えて
横断検索することに合理性があるのかって話だろ!?
490名無しさん@そうだ選挙にいこう:2006/09/15(金) 15:32:14
読解力無いな。
491名無しさん@そうだ選挙にいこう:2006/09/15(金) 15:51:32
サーチクロスが一番いいと思う。
ただし
◎doc,xls,rtf,pdf,jtdにはxdoc2txtを使うこと。OLE文書フィルタは不安定だし
 インデキシング中によくこける。
 http://www.villagecenter.co.jp/soft/searchx/help/cmdfilt.htm
 ↑を参考にxdoc2txtを組み込むこと
 xdoc2txt
 http://www31.ocn.ne.jp/~h_ishida/xdoc2txt.html
◎2ちゃんDATについては>>405の通りで、2通りの組み込み方があり、
 1つは1レス=1文書とした検索、もう1つはスレッド=1文書とした検索
 後者は使い物になると思う(ただしスレ名はクリックして確認しないといけないが)

namazuはいいと思うけど2ちゃんDATは検索できないと思う
GDSは長文の最初の方しか検索してくれないから駄目
WDSも2ちゃんDATのiFilterが出てないから駄目
 ただしDocuworksについてはifilterが出てるから検索可能
 http://www.fujixerox.co.jp/soft/docuworks/download402.html

ちなみに俺は通常はWDS(MSNサーチ)を利用してるが、2ちゃん過去ログだけは
サーチクロスを使っている。
492名無しさん@そうだ選挙にいこう:2006/09/15(金) 15:54:29
コピペ乙
493名無しさん@そうだ選挙にいこう:2006/09/15(金) 17:38:42
スレが伸びたとおもったら
間抜けが一人暴れているようだな
494名無しさん@そうだ選挙にいこう:2006/09/15(金) 18:42:20
          ____   
       / \  /\ キリッ
.     / (ー)  (ー)\      
    /   ⌒(__人__)⌒ \    < 間抜けが一人暴れているようだな
    |      |r┬-|    |   
     \     `ー'´   /
    ノ            \
  /´               ヽ              
 |    l              \
 ヽ    -一''''''"~~``'ー--、   -一'''''''ー-、.    
  ヽ ____(⌒)(⌒)⌒) )  (⌒_(⌒)⌒)⌒))



          ____
        /_ノ  ヽ、_\
 ミ ミ ミ  o゚((●)) ((●))゚o      ミ ミ ミ
/⌒)⌒)⌒. ::::::⌒(__人__)⌒:::\   /⌒)⌒)⌒)
| / / /     |r┬-|    | (⌒)/ / / //   <だってお www 
| :::::::::::(⌒)    | |  |   /  ゝ  :::::::::::/
|     ノ     | |  |   \  /  )  /
ヽ    /     `ー'´      ヽ /    /     バ
 |    |   l||l 从人 l||l      l||l 从人 l||l  バ   ン
 ヽ    -一''''''"~~``'ー--、   -一'''''''ー-、    ン
  ヽ ____(⌒)(⌒)⌒) )  (⌒_(⌒)⌒)⌒))
495名無しさん@そうだ選挙にいこう:2006/09/15(金) 22:36:29
長いことサーチクロス使ってるけど、
http://www.vector.co.jp/magazine/softnews/040410/n0404101.html
↑で作者が述べてるように形態素解析は使ってないってことで、
どういうアルゴリズムなのかずっと疑問に思っていた。

で、「サーチクロスは形態素解析によるインデックス化を行っておりません」という文章だけ
インデックス化してみたところ、次のような手法を採っていることが分かった。

(1)まず文章から記号類とひらがなを除去する
 「サーチクロス形態素解析インデックス化行」
(2)これを文字コードによりカナ・漢字・英字に分割
 「サーチクロス | 形態素解析 | インデックス | 化 | 行」
(3)分割された単語をN-gram法で索引化する
 「サ | サー | サーチ | サーチク ・・・・・・ッ | ック | ックス | 化 | 行」
 検索語が「チク」や「態素解」などでもヒットすることから確認
(4)5つの単語をN-gram法でインデックス化することで
 サーチクロス 6+5+4+3+2+1=21
 形態素解析 5+4+3+2+1=15
 インデックス 6+5+4+3+2+1=21
 化 1
 行 1
59単語が索引登録されることになる。

この単純なアルゴリズムが高速なインデックス化の秘密なのだろう。
ちなみに「先頭一致検索」にチェックを入れるとノイズは減るが、
「解析」で検索しても「形態素解析」はヒットしなくなる。

以上チラシの裏でした。
496名無しさん@そうだ選挙にいこう:2006/09/15(金) 23:19:07
ここは483が自分が何故馬鹿と言われるのかが理解できずに暴れるスレですね
AAに逃げる所からも彼の自分の頭で物を考えられない幼稚さがよく出ている
497名無しさん@そうだ選挙にいこう:2006/09/15(金) 23:34:15
  自分の頭で物を考えられない
  幼稚さがよく出ている
   ̄ ̄ ̄)/ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
     ( ^ω^)       ∧_∧
    /     \   (    )何言ってんだこいつ
.__| |    .| |_ /      ヽ
||\  ̄ ̄ ̄ ̄   / .|   | |
||\..∧_∧    (⌒\|__./ ./
||.  (    )     ~\_____ノ|   ∧_∧
  /   ヽ 氏ねよ      \|   (    )
  |     ヽ           \/     ヽ. オマエ馬鹿だろ
  |    |ヽ、二⌒)        / .|   | |
498名無しさん@そうだ選挙にいこう:2006/09/15(金) 23:59:08
>>495
ひらがなが検索できない点でそーやってるだろうってのはすぐ分かったけど、
N-gramの部分はもうちょっと工夫してるかもしれんと思ってた。
(そのやり方だと辞書が大きくなりそうだけど、そうでもないから)

499名無しさん@そうだ選挙にいこう:2006/09/16(土) 00:19:00
日本語、にほんご、nihongo
で検索できるのはありますか?
500名無しさん@そうだ選挙にいこう:2006/09/16(土) 00:25:42
>>499
日本語勉強した方がいいんじゃない?
501名無しさん@そうだ選挙にいこう:2006/09/16(土) 05:05:54
>>499
namazu使え
設定次第で出来る
502名無しさん@そうだ選挙にいこう:2006/09/16(土) 06:14:28
Tiger
503名無しさん@そうだ選挙にいこう:2006/09/16(土) 12:57:38
なんかサーチクロスで盛り上がってるから俺もサーチクロスの話題をw

複数のキーワードが「スレ」に含まれるんじゃなくて、「レス」に含まれてるのを
抽出できなかったから導入を諦めた。

かといっても他に代替ソフトが無かったので自分でそれ専用の糞ツールを作ったんだがな。
もう2年前の話だがこれが出来るソフトってもうあるの?
504名無しさん@そうだ選挙にいこう:2006/09/16(土) 13:04:50
サーチクロスのレスごとにわけられちゃう方ならできそうだが・・・
まあ流れわからなくなるが
505名無しさん@そうだ選挙にいこう:2006/09/16(土) 17:02:23
あとxdoc2txtにメタ情報抽出機能が付いて
サーチクロスにインデックス串刺し検索が付けば最強かな。

そういやWindowsデスクトップサーチではzipやメールの添付ファイルも
検索できるんだった。ただ2ちゃんDATだけはどうしようもないしな。。。
506名無しさん@そうだ選挙にいこう:2006/09/16(土) 17:35:10
壷を使えばHTMLとしてキャッシュしてくれるな
ただ機能が少ないのがちょっと、、、
507名無しさん@そうだ選挙にいこう:2006/09/17(日) 01:10:09
需要もないしな・・・
わざわざhtmlにする必要ないし
508名無しさん@そうだ選挙にいこう:2006/09/17(日) 03:04:34
いや、HTMLならWDSで使えるじゃん
509名無しさん@そうだ選挙にいこう:2006/09/17(日) 12:04:48
>>504
できる?
出来るならスレを専ブラで開けば流れは分かるから楽なんだが。
サーチクロスのデフォルト設定を使ったインデキシングがいつも失敗するから
1レス1文書のほうは成功したこと無い。
510名無しさん@そうだ選挙にいこう:2006/09/17(日) 12:33:57
>サーチクロスのデフォルト設定を使ったインデキシングがいつも失敗するから
PC環境が悪いんじゃね?
うちは失敗したことないし・・・
511名無しさん@そうだ選挙にいこう:2006/09/18(月) 17:53:53
>>510
XP2台と2000にも入れなおしてみたけど駄目だったよ。
どれか1台でもきちんと動作すればそれをファイルサーバーにしたいんだけどね。
512名無しさん@そうだ選挙にいこう:2006/09/18(月) 18:28:27
っxdoc2txt
513名無しさん@そうだ選挙にいこう:2006/09/18(月) 18:57:26
>>512
それ、スレ丸ごと。
レスごとは内臓を使わないと無理。
514名無しさん@そうだ選挙にいこう:2006/09/19(火) 18:23:10
サーチクロスのダウンロード販売いつの間にか終わってたんだな
515名無しさん@そうだ選挙にいこう:2006/09/20(水) 13:54:57
Windowsデスクトップサーチのインデクシング、サーチクロスなみに早いな。
本当に形態素解析使ってるのか?
体感でnamazuのインデクサ(mknmz)の10倍以上・・・
516名無しさん@そうだ選挙にいこう:2006/09/20(水) 22:22:20
BYTE LAB「デスクトップ検索」(2):ITpro
http://itpro.nikkeibp.co.jp/article/COLUMN/20051208/225942/

Googleデスクトップ検索とSpotlightは,インデックス生成の負荷とサイズを軽減するために,
抽出したテキスト情報の一部しかインデックスに含まない。重要な情報が先頭に位置することが
多い一般的な文書構造であれば問題ないが,大きなファイルの後方にある単語を対象に
したキーワードでは検索漏れが起こる。


GDSの5000文字制限は有名だったけどSpotlightもそうだったのね。。。
事実上、全文検索とは言えないじゃん。
前スレとかでSpotlightマンセーしまくってた連中はなんだったんだ?
517名無しさん@そうだ選挙にいこう:2006/09/20(水) 22:30:09
インデクッスである以上検索漏れはしょうがない
見つからなければ全文検索すればいいんだしさ・・・
518名無しさん@そうだ選挙にいこう:2006/09/20(水) 22:35:08
>>517
さて、ここのスレタイはなんだったでしょうか?
519名無しさん@そうだ選挙にいこう:2006/09/20(水) 23:15:32
517はMac教徒
520名無しさん@そうだ選挙にいこう:2006/09/21(木) 00:04:11
ConceptSearchって、2chのログも検索対象にできるのでしょうか?
そのためには、2chのビューワーも限られるのでしょうか?
それとも他のソフトでできるものがあるのでしょうか?
521名無しさん@そうだ選挙にいこう:2006/09/21(木) 00:31:53
>>520
専ブラのdatログに対応してるのはサーチクロスと
あと、GDSにプラグインがあったと思う。

ConceptSearchは自然文検索でGoogleに馴れた我々からすると
かえって検索しづらいそうだし、検索漏れも多いみたいだからおすすめできない。
522名無しさん@そうだ選挙にいこう:2006/09/22(金) 15:23:11
>>514
あそこは機能は少ないけどユーザーの要望をどんどん取り入れていつのまにか高機能で
バグの少ないソフトができあがるメーカーだったのにこれまでと対応が変わってきたからね。

コンシューマー目当てのソフト業界から撤退したりして。
523名無しさん@そうだ選挙にいこう:2006/09/23(土) 00:44:48
>>514
調べたらいちおう販売してるみたいっすよ。
ttp://www.villagecenter.co.jp/credit/?id=SX2

プロレジの利用料が割高だったんじゃね?
524名無しさん@そうだ選挙にいこう:2006/09/23(土) 00:46:03
http://www.vector.co.jp/magazine/softnews/050907/n0509072.html
探三朗 - ベクターソフトニュース
525名無しさん@そうだ選挙にいこう:2006/09/23(土) 00:51:02
>>524
作者乙
526名無しさん@そうだ選挙にいこう:2006/09/23(土) 14:54:42
411 名前:名無しさん@お腹いっぱい。 投稿日:2006/09/22(金) 10:32:16 392HYhyT0
唯一といって良いWindowsネイティブなフリー全文検索ソフト「探三朗」を使ってみた。

すごい小さいパッケージでインストーラも無し。適当なフォルダにおいて実行ファイルダブルクリックするだけ。
namazuとは正反対のお手軽さだね。

インデックス作成も煙草吸ってる間に出来上がるって感じ?サーチクロスと同等の早さじゃないかな?
検索インターフェイスも至ってシンプル。検索は一瞬で検索結果はスコア・パス・サイズ・日付でソート可能。

インデクシングのアルゴリズムはおそらくN-gram。だから「メータ」で「パラメータ」がヒットする。
インデックスは探三朗をインストールしたフォルダの\filterにsindex.datとsindexi.datという名前で保存される。
前者がインデックス本体?中身はテキスト+バイナリでインデックス化した全文がごちゃ混ぜで入ってる。
少なくとも転置インデックスの体裁は取っていない。何なんだ?このファイルは。

もう一つのsindexi.datはファイルパスが更新日付やサイズとともに1レコードずつ格納されている。
一体どういう手順でインデックスから文書を探してくるのか不明。
527名無しさん@そうだ選挙にいこう:2006/09/23(土) 14:59:25
表示がカスタマイズ出来ないなど
使いづらいんだよな・・・
無料で手軽だからいいけどさ
528名無しさん@そうだ選挙にいこう:2006/09/23(土) 22:10:10
検索したいモノの8割がメールだから、対応してないと結局使わないんだよね。。。


>表示がカスタマイズ出来ないなど
>使いづらいんだよな・・・

デフォルトが使いやすくなってればカスタマイズできなくても気にならないんだけどね。

529名無しさん@そうだ選挙にいこう:2006/09/23(土) 22:37:12
大体メールクライアント単体で標準装備しててもいい機能じゃない?>索引型全文検索

Windowsヘルプでさえ搭載してるっつうのに……
高価なOutlookでさえないもんな。
俺が知ってる限り、インデックスを使って検索ができる機能が最初から付いてきた
メールクライアントは「Notes R5 Client」だけだ。チョー使いにくかったけど。。。
530名無しさん@そうだ選挙にいこう:2006/09/23(土) 22:39:59
>高価なOutlookでさえないもんな。
嘘はいくないw
糞ソフトだけどさw
531名無しさん@そうだ選挙にいこう:2006/09/23(土) 22:48:17
メールだけでインデクッス型が必要な理由が分からん
532名無しさん@そうだ選挙にいこう:2006/09/23(土) 23:36:31
俺は全部Gmailに転送してる
テラ便利
しかしアレ正式サービスまでやたら長く掛かったな
533名無しさん@そうだ選挙にいこう:2006/09/24(日) 03:00:18
>>530
嘘でしたか。すみません。
一応チョコっと使ったことはあるんだけど気付かなかったな。
使い勝手はどうなの?>Outlookの検索
534名無しさん@そうだ選挙にいこう:2006/09/24(日) 05:19:35
>>531
全文検索型の方が漏れがなくていいのにな・・・
535名無しさん@そうだ選挙にいこう:2006/09/24(日) 10:22:41
Beckyに対応している全文検索ソフトは、サーチクロスとGDS + plug-inだけ?
536名無しさん@そうだ選挙にいこう:2006/09/24(日) 13:48:23
>>535
GDSは全文検索ではないと何回言えば・・・
537名無しさん@そうだ選挙にいこう:2006/09/24(日) 13:57:47
>>535
書き込む前に
ちょっとは調べろよ・・・
嘘情報を書いて信じる人がいたらどうする気なんだろう・・・
538名無しさん@そうだ選挙にいこう:2006/09/24(日) 21:52:58
先頭から5000語までなんだから、メールぐらいなら全文インデックス化すると思うが
でもこの「語」ってわかりにくいよなぁ、Byte制限にしてほしい
539名無しさん@そうだ選挙にいこう:2006/09/24(日) 23:10:32
つかGDSくらいオープンソースにしてくれよ
540名無しさん@そうだ選挙にいこう:2006/09/25(月) 01:08:59
byteのほうが分かりづらい
541名無しさん@そうだ選挙にいこう:2006/09/25(月) 01:18:28
>>538
5000語制限っていつの時代の話だ?
542名無しさん@そうだ選挙にいこう:2006/09/25(月) 01:55:04
>>541
一部緩和されたが今も同じ
ヘルプ嫁
543名無しさん@そうだ選挙にいこう:2006/09/25(月) 01:57:19
>>534
その「全文検索型」ってのはいわゆる「grep型」のことだろうけど、
会社のメールなんか1日10通以上来るし、それが7〜8年分溜まって
恐ろしいことになってる。

ましてや「受け付け」と「受付」であいまい検索とかしてると
1日中メールの検索にPC占有されちゃうよ。
544名無しさん@そうだ選挙にいこう:2006/09/25(月) 01:59:38
>>543
なんで片方しか使わない前提なの?
普段はインデックス型で
漏れが困るときは全文型とか使い分ければいいのに・・・
545名無しさん@そうだ選挙にいこう:2006/09/25(月) 02:01:25
>会社のメールなんか1日10通以上来るし、それが7〜8年分溜まって
これなら約3万通だし全文検索でも問題ないでしょ
いくらなんでも一日中占有されるのは言い過ぎ
546名無しさん@そうだ選挙にいこう:2006/09/25(月) 02:03:24
何が何でも全文検索型は否定しないと気が済まないんだろw
547名無しさん@そうだ選挙にいこう:2006/09/25(月) 03:23:55
grepは全文と言わずにgrepと言ってくれ
読みにくい
548名無しさん@そうだ選挙にいこう:2006/09/25(月) 04:13:03
何言ってるんだ
grepとは違うだろ
549名無しさん@そうだ選挙にいこう:2006/09/25(月) 05:16:31
>>547
grepが何か分かってる?
550名無しさん@そうだ選挙にいこう:2006/09/25(月) 06:29:07
わかってるよ
551名無しさん@そうだ選挙にいこう:2006/09/25(月) 11:57:52
>>545
一通がものすごく長文とか
添付が多いとかじゃね?w
552名無しさん@そうだ選挙にいこう:2006/09/25(月) 13:44:44
>>548
http://ja.wikipedia.org/wiki/%E5%85%A8%E6%96%87%E6%A4%9C%E7%B4%A2

grep型
一般に「grep型」と呼ばれる検索手法は、事前に索引ファイル(インデックス)を作成せず、
ファイルを順次走査していくために、検索対象の増加に伴って検索速度が低下するのが特徴である。
ちなみに「grep型」とは実際にgrepコマンドを使っているという意味ではないので注意のこと。
553名無しさん@そうだ選挙にいこう:2006/09/25(月) 14:35:59
>>550
ペン持ってる?って聞かれたら
普通はペンを貸してってことなのは分かる?
554名無しさん@そうだ選挙にいこう:2006/09/25(月) 22:11:57
>>550

>>553みたいな馬鹿はすぐに下らない例え話を始めて悦に入る
というところまでは分かった?
たぶん>>553はしつこいタイプだから放置した方が良いよ、君がレスしてまた>>553が大喜びで返してって続くとスレが読みづらくなるから
555名無しさん@そうだ選挙にいこう:2006/09/26(火) 01:46:00
メールだけでもインデックス型じゃないと
使えないっていってた人はどうしたんだ?
556名無しさん@そうだ選挙にいこう:2006/09/26(火) 02:42:56
>>552
検索速度が低下するわけじゃないよな
557名無しさん@そうだ選挙にいこう:2006/09/26(火) 03:12:46
するでしょ
558名無しさん@そうだ選挙にいこう:2006/09/26(火) 10:04:36
>>556
少なくとも数万件のメールログになると検索結果の表示に
えらく時間がかかるようになる。
検索するときってのは、そのときすぐに結果が欲しいもの。
だからインデックスは必須だし、メールソフトには標準搭載すべきだと思う。

>>530
Outlook2000で確認したところ逐次検索しか無かったよ
559名無しさん@そうだ選挙にいこう:2006/09/26(火) 12:18:55
量が多くなると遅くなるのは
どれも一緒では?
560名無しさん@そうだ選挙にいこう:2006/09/26(火) 17:53:05
>>556
そらそうだ
561名無しさん@そうだ選挙にいこう:2006/09/26(火) 18:00:59
>>559
インデックス型では量が多くなっても速度は落ちない。
562名無しさん@そうだ選挙にいこう:2006/09/26(火) 18:56:07
もし Google が grep 型だったら・・・
563名無しさん@そうだ選挙にいこう:2006/09/26(火) 19:06:15
AMDがウハウハ
564名無しさん@そうだ選挙にいこう:2006/09/26(火) 19:22:48
インデックス型の場合検索漏れはやむ無しというレスが>>517にあるけど
N-gram方式の場合は検索漏れはないし、サーチクロスみたく字種で切り分ける
手法でも検索漏れは出にくいよ。

検索漏れが多いのはNamazuやGoogleといったタイプ
565名無しさん@そうだ選挙にいこう:2006/09/26(火) 22:20:15
>>564
形態素解析で単語に分けてインデックスに登録してるタイプね>検索漏れ

最近は併用するのが流行りらしいけど。
566名無しさん@そうだ選挙にいこう:2006/09/27(水) 20:28:44
シェアなんだけど Archivarius 3000 って結構良くない
ttp://www.likasoft.com/jp/index.shtml

一応日本語にも対応してるみたいなんだけど
日本だとマイナーなのかな?
567名無しさん@そうだ選挙にいこう:2006/09/27(水) 20:29:35
>>561
いや落ちるよ
568名無しさん@そうだ選挙にいこう:2006/09/27(水) 22:06:02
>>567
そりゃ文書数が100から100万に増えればある程度は落ちるだろうさ。
でもgrep型みたいに1万倍遅くなったりはしない。

・・・ていうか今さらこのスレでこんなこと言ってるのっておかしくないか?
インデックス型全文検索の存在意義にかかわる話だし。
569名無しさん@そうだ選挙にいこう:2006/09/27(水) 22:12:09
>>566
一太郎にも対応してるしね。
でもシェアならサーチクロスが圧倒的だし、
フリーでGDSもMSNもある今となってはなぁ・・・

ところでサーチクロス使ってる人に聞きたいんだけど
一番デカいインデックスで単語数はどれくらいになった?
うちの「標準」インデックスは100万超えた所なんだけど
起動時の読み込み速度や検索速度からいってもまだまだ行けそう。
570名無しさん@そうだ選挙にいこう:2006/09/27(水) 22:38:30
>>568
grep型はソフトによって速度変わるぞ
571名無しさん@そうだ選挙にいこう:2006/09/28(木) 23:30:24
>>569
うちのは現在325万2960です。
572名無しさん@そうだ選挙にいこう:2006/09/29(金) 15:52:00
>>495
(1)と(2)はそんな感じだろうね。

ただ
> (3)分割された単語をN-gram法で索引化する
というのは違うと思う。

(2)で分割された単語テーブルがsxindex.lstで
「先頭一致検索」の時はこのリストをバイナリサーチして
sxlink.dat(転置ファイル?)→sxpath.dat と辿って
結果表示してるんじゃないか?

で、「先頭一致検索」のチェックが外れてるときは単語テーブルを
Grepで検索してる。
だから「チク」で「サーチクロス」がヒットするけどその分時間がかかる。
(マニュアルによると先頭一致検索の10倍以上)
先頭一致〜にチェックを入れると、「チク」で「サーチクロス」はヒットしなくなるけど
結果表示は一瞬になる。
573名無しさん@そうだ選挙にいこう:2006/09/29(金) 23:29:05
>>569
標準       525万語     209MB
2ちゃん     382万語     908MB
ニュース板    239万語     491MB

「cache」フォルダがデカいんだよな。
これって文書フィルタ通すときに使うだけでしょ?
消してもいいのかなぁ。。。と思って消してみた!

結果は検索には影響ないみたい。ただ検索結果をプレビューするごとに
新しい「cache」フォルダが作られて、どんどん溜まっていく。

キャッシュを除いた容量を書くと、、、

標準       525万語     165MB
2ちゃん     382万語     102MB
ニュース板    239万語     57MB
574名無しさん@そうだ選挙にいこう:2006/10/03(火) 15:50:40
家ではサーチクロス使ってんだけど、会社のPCにWindowsデスクトップサーチ入れてみた。
インデックス作成はやっぱ時間かかるね。初日は電源入れっぱなしで帰宅した。

ネットワークサーバーも検索対象に指定できるし、インデックス保存場所も
カスタマイズできる。こういいたところはGDSより優れてるね。

検索結果はファイル名・フォルダ名・メタデータまで検索するから
かなり件数が多くなるけど、漏れがないという点ではこの方がいいかも。
あと、複数インデックスへの対応、リムーバブルメディア対応、2ちゃんDATのiFilterとか
が出てくれば最高なんだがなぁ。。。
575名無しさん@そうだ選挙にいこう:2006/10/03(火) 16:33:40
漏れはあるだろ・・・
基本が分かってない奴のレポはゴミだな
576名無しさん@そうだ選挙にいこう:2006/10/03(火) 20:18:05
>>575
その程度で玄人ヅラですか( ´,_ゝ`)プッ
ファイル名・フォルダ名・メタデータまで網羅しているという意味の「漏れがない」
N-gramでない限り検索漏れはあるに決まってるし、それはサーチクロスも
GDSもConceptSearchも同じだから比較にならない。
577名無しさん@そうだ選挙にいこう:2006/10/04(水) 02:58:59
N-gramでも漏れはありますよ

>それはサーチクロスもGDSもConceptSearchも同じだから比較にならない。
漏れ具合が違いますから比較する意味はあるよ
検索に対するアプローチも全部違うしね
578名無しさん@そうだ選挙にいこう:2006/10/04(水) 05:35:26
どれも五十歩百歩じゃないかな
漏れが気になるならgrepしか無いと思われ
579名無しさん@そうだ選挙にいこう:2006/10/04(水) 05:56:59
うるさいな
N-gram最高なんだよ
580名無しさん@そうだ選挙にいこう:2006/10/04(水) 08:10:18
N-gramに漏れはないよ。漏れがあるなんて何を根拠に言ってんの?
581名無しさん@そうだ選挙にいこう:2006/10/04(水) 08:12:58
>>580
はいはい
嘘までついて乙
582名無しさん@そうだ選挙にいこう:2006/10/04(水) 08:16:54
そもそもWDSは「全文」検索じゃないだろう、と今更
583名無しさん@そうだ選挙にいこう:2006/10/04(水) 08:27:22
次スレではスレタイ考えた方がいいね
584名無しさん@そうだ選挙にいこう:2006/10/04(水) 09:09:45
検索漏れがあったら「全文検索」じゃないんだったら
grep以外は全文検索じゃなくなるのか?
じゃnamazuも「全文検索」じゃないってことだな
585名無しさん@そうだ選挙にいこう:2006/10/04(水) 09:17:36
namazuは設定次第だろ
これだから馬鹿は・・・
586名無しさん@そうだ選挙にいこう:2006/10/04(水) 10:41:15
N-gramはノイズが大杉
587名無しさん@そうだ選挙にいこう:2006/10/04(水) 11:22:30
>>585
namazuを設定次第でGrep検索できると思いこんでる馬鹿発見!!
588名無しさん@そうだ選挙にいこう:2006/10/04(水) 11:27:24
>>581
「全文検索」
http://ja.wikipedia.org/wiki/%E5%85%A8%E6%96%87%E6%A4%9C%E7%B4%A2

> N-Gram
> (中略)
> たとえば「全文検索技術」という文字列の場合、「全文」「文検」「検索」「索技」「技術」と2文字ずつ分割して
> 索引化を行ってやれば、検索漏れが生じず、辞書の必要も無い。

577 名前:名無しさん@そうだ選挙にいこう 本日のレス 投稿日:2006/10/04(水) 02:58:59
N-gramでも漏れはありますよ
577 名前:名無しさん@そうだ選挙にいこう 本日のレス 投稿日:2006/10/04(水) 02:58:59
N-gramでも漏れはありますよ
577 名前:名無しさん@そうだ選挙にいこう 本日のレス 投稿日:2006/10/04(水) 02:58:59
N-gramでも漏れはありますよ
577 名前:名無しさん@そうだ選挙にいこう 本日のレス 投稿日:2006/10/04(水) 02:58:59
N-gramでも漏れはありますよ

馬鹿皿仕上げ
589名無しさん@そうだ選挙にいこう:2006/10/04(水) 11:52:43
N-gram信者って
なんで必死なの?
590名無しさん@そうだ選挙にいこう:2006/10/04(水) 12:03:06
>>588
インデックスを作る段階で漏れるだろw
591名無しさん@そうだ選挙にいこう:2006/10/04(水) 12:20:48
N-gramは他のインデックス型に比べたらいいのは事実だからね
ただ漏れがないとか信者発言は痛いよな・・・
592名無しさん@そうだ選挙にいこう:2006/10/04(水) 12:53:13
http://www.blwisdom.com/word/key/000876.html
> N-gram方式
> (中略)
> N-gram の長所として、検索漏れがない、文法解析をしていないので多言語展開が容易などがあり、
> 漏れがないという利点を利用して特許情報の全文検索に用いられたりすることがある。

理論上検索漏れがないのはどこのソースを見ても明らか。
「ギリシア」で「ギリシャ」がヒットしないから漏れがある、とか言ってんじゃねえだろうな
593名無しさん@そうだ選挙にいこう:2006/10/04(水) 13:15:12
馬鹿発見w
594名無しさん@そうだ選挙にいこう:2006/10/04(水) 13:16:12
>>592
>「ギリシア」で「ギリシャ」がヒットしないから漏れがある、とか言ってんじゃねえだろうな
どこを読んだからこんなことが言えるんだ???

それと単語だけじゃなくて文でも考えてみろよ
595名無しさん@そうだ選挙にいこう:2006/10/04(水) 14:03:43
だから「N-gramに検索漏れがある」という具体的事例なり
ソースなり示してみろよ。フォルスドロップと検索漏れをごっちゃにしてんじゃねえだろうな
596名無しさん@そうだ選挙にいこう:2006/10/04(水) 14:07:35
ギリシアに行った。
だとアに行とかで引っかからんよ
単語によっては結構あるのよ
597名無しさん@そうだ選挙にいこう:2006/10/04(水) 14:10:03
今はインデックス型とgrep型両方使うしかないんだよな
N-gramはゴミも多いしいつ使っていいか分からん
検索も遅く漏れもあるしさ・・・
598名無しさん@そうだ選挙にいこう:2006/10/04(水) 14:14:59
うるせいよ馬鹿
N-gram最強なんだよ
599名無しさん@そうだ選挙にいこう:2006/10/04(水) 14:16:23
>>595
お前は普段使ってるのか?
使ってる人なら理屈を知らなくても
漏れがあるのは知ってるはず
600名無しさん@そうだ選挙にいこう:2006/10/04(水) 15:36:10
>>599
N-gram式ならQuickFinder2.0を使っていたし、
平凡社の「世界大百科事典第2版」の全文検索もたぶんN-gram。
最近ならDesktopHE(Hyper Estraierのスタンダロン)を試用したことがある。

いま、ためしに「ギリシアに行った。」と記したテキストを保存して
DesktopHEでインデクシングかけてみた。
結果は「アに行」でも問題なくヒットした。

N-gramに検索漏れがあるとか言ってる奴はサーチクロスをN-gram と勘違いしてんじゃねえの?
601名無しさん@そうだ選挙にいこう:2006/10/04(水) 15:40:13
原理通り全部インデックスにしてれば漏れはない気がするが
602名無しさん@そうだ選挙にいこう:2006/10/04(水) 16:01:54
原理通りなら元のファイル容量を大きく超えないか???
603名無しさん@そうだ選挙にいこう:2006/10/04(水) 16:03:27
うむ。それを実装してるとは思えない。
だから漏れはあると俺も思う。
604名無しさん@そうだ選挙にいこう:2006/10/04(水) 16:06:42
ギ、リ、シ、ア、に、行、っ、た、。
ギリ、リシ、シア、アに、に行、行っ、った、た。
ギリシ、リシア、シアに、アに行、に行っ、行った、った。
ギリシア、リシアに、・・・
605名無しさん@そうだ選挙にいこう:2006/10/04(水) 16:09:47
信者はたぶんNの値が小さい時の場合しか考えてないんでしょ
全パターンをインデクシングしてるのもあるんだろうか?
606名無しさん@そうだ選挙にいこう:2006/10/04(水) 16:14:26
>>600
「ギリシアに行った。明日はドイツに行くつもりです。」
を「アに行った。明日はドイツに行くつもりで」でも出る?
607名無しさん@そうだ選挙にいこう:2006/10/04(水) 16:16:48
http://www.ipa.go.jp/jinzai/esp/2004mito2/mdata/4-4.html
> Hyper Estraierの方式では、インデックスサイズを対象文書のサイズの半分以下に抑えることができる。
> これにより、普通のパソコンクラスのリソースがあれば100万件(10GB)以上の文書を
> 対象とした検索システムが実用的に使えるようになった。

N-gram 方式のインデックスは通常、バイナリ圧縮されてるし、同じ文字のリピートが
多いから圧縮率も高くなる。
おまけにHyper Estraierみたいに位置情報をもたせない仕組みを設けて
いっそうサイズを小さくする工夫がなされているものもある。

>>603
だから「思う」じゃなくて、実際にN-gram で検索漏れが発生している実例を出してくれよ。
まあ、漏れがある時点で「純粋なN-gram」であるはずは無いんだけど。
608名無しさん@そうだ選挙にいこう:2006/10/04(水) 16:19:02
>>607
>まあ、漏れがある時点で「純粋なN-gram」であるはずは無いんだけど。
漏れがあってもN-gramだぞ
公式を嫁
609名無しさん@そうだ選挙にいこう:2006/10/04(水) 16:19:57
>>606
やってみた。問題なくヒットする。
疑うんならDesktopHE を入れて試してみればいいよ。
適当なフォルダに解凍してダブルクリックするだけのシンプル設計だから。
610名無しさん@そうだ選挙にいこう:2006/10/04(水) 16:20:35
>>607
596の例でも
bi-gramならヒットしないよね
つまりN-gramはNの値と検索文字数によって漏れが出るのはしょうがない
611名無しさん@そうだ選挙にいこう:2006/10/04(水) 16:22:51
長い文字列じゃ検索シネーヨで終わる予感w
612N-gram信者:2006/10/04(水) 16:22:58
参考までにHyper Estraierのデモサイトを紹介しとくよ
http://athlon64.fsij.org/~mikio/wikipedia/estseek.cgi?clip=8

どんな半端な文字列でもヒットする。
しかも相手はあの巨大なWikipedia。

>>608 公式ってなに?
613N-gram信者:2006/10/04(水) 16:28:28
>>610
はぁ?
Bi-gramでもヒットするに決まってるじゃん。

(index)ギリ、リシ、シア、アに、に行、行っ、った、た。
(query word)アに行

query wordは「アに」と「に行」に分解されてindexに対してAND探索かけてみたら
結果は明白だろ。
614名無しさん@そうだ選挙にいこう:2006/10/04(水) 16:29:51
>>610
Nが無限のもあるにはあるぞ
ただ実用的じゃないがなw
615名無しさん@そうだ選挙にいこう:2006/10/04(水) 16:30:43
>>613
茶々入れるのはよせよ
理解してないならレスするな
616名無しさん@そうだ選挙にいこう:2006/10/04(水) 16:33:07
>>613
そうか!
mono-gramでインデックスを作ってAND検索すれば漏れないじゃんw
俺天才だな
617名無しさん@そうだ選挙にいこう:2006/10/04(水) 16:38:22
>欧文は単語を単位にして検索され、それ以外の言語(中国語、日本語、韓国語、アラビア語など)
>は文字を単位にして検索されます(N-gram方式)。

これにより「どんな半端な文字列でもヒットする。」ってことはないね
事実

http://ja.wikipedia.org/wiki/2%E3%81%A1%E3%82%83%E3%82%93%E3%81%AD%E3%82%8B

に「BBSではハンドルネーム」という部分があるが
「BBSではハンドルネーム」なら引っかかるが
「BSではハンドルネーム」とか「Sではハンドルネーム」
では引っかからないんだぜ?
618N-gram信者:2006/10/04(水) 16:40:30
>>615
理解してないのはお前だろ。
Bi-gramを「2文字ずつスライドさせてインデックス化する方式」とでも
思ってんのか?
619N-gram信者:2006/10/04(水) 16:43:39
>>617
N-gram 方式を謳ってるエンジンの多くは
@まず文字種ごとに区切る
AそれをN文字(ふつうは2〜3)単位で索引化

だから違う文字種が混ざると漏れが出るわな。
Hyper Estraierはそれでも優秀な方だし実用上問題はないだろ
620名無しさん@そうだ選挙にいこう:2006/10/04(水) 16:45:24
>>597
共起関係を調べたりでしょ
検索で使ってる人よりも多いしさ
621名無しさん@そうだ選挙にいこう:2006/10/04(水) 16:46:02
漏れがないって人は
根拠を示して欲しいな
リンク先は都合のいい部分しかかかれてないし・・・
622名無しさん@そうだ選挙にいこう:2006/10/04(水) 16:46:59
信者は絶対に認めないよ
AND検索まで持ち出したのは笑ったw
623N-gram信者:2006/10/04(水) 16:47:40
>>621
「N-gram」でググればいい。どこのサイトにも「検索漏れがない」って書いてあるだろ
624名無しさん@そうだ選挙にいこう:2006/10/04(水) 16:47:53
N-gram戦争中
全文検索ユーティリティ統一スレッド part3
ttp://pc8.2ch.net/test/read.cgi/bsoft/1120649196/
625N-gram信者:2006/10/04(水) 16:51:56
>>622
だから理解してないんならしゃべんなよ。
「AND探索」ってのは検索エンジンがクエリワードをN字ごとに切り分けて
転置ファイルの文書IDをAND条件で拾ってくるってことだ。
N-gram方式の場合は必ずこれが行われている。

実際、Hyper EstraierはBi-gramだけど>>600にあるとおり、
ヒットしてるし。>>610の理解してるBi-gramってのはどういうモンなんだ?
626名無しさん@そうだ選挙にいこう:2006/10/04(水) 16:53:25
N-gramってどうやって使うんだ?
627名無しさん@そうだ選挙にいこう:2006/10/04(水) 16:53:48
細かいことはもうどうでもいいよ
事実、漏れはあったし
628名無しさん@そうだ選挙にいこう:2006/10/04(水) 16:57:18
>>623
N-gram 検索漏れがない の検索結果 約 29 件中 1 - 16 件目 (0.21 秒)
N-gram 検索漏れがある の検索結果 約 880 件中 1 - 100 件目 (0.26 秒)
629名無しさん@そうだ選挙にいこう:2006/10/04(水) 16:58:07
>>625
お前こそ理解してないだろ・・・
Estraierがないのは当たり前
だからといってN-gramでもないとは言えないんだよ
630名無しさん@そうだ選挙にいこう:2006/10/04(水) 16:59:34
>>625
上の方でギリシアとギリシャがあったけど
どちらで検索しても漏れがないgrepやインデックス型もあるけど
だからといってgrepやインデックス型の特徴とはいわんだろ
631N-gram信者:2006/10/04(水) 17:03:41
「BBSではハンドルネーム」が「Sではハンドルネーム」だと引っかからない。
これは英字と日本語を分離させてからN字に区切るHyper Estraierの
アルゴリズムに起因する問題だろ。(そもそも実用上問題ないが)

N-gramアルゴリズム自体には検索漏れが生じる隙間はない。
たぶん世の検索エンジンで「N-gram」を名乗るものには
字種で切り分けてからインデックス化するタイプが多いんだろう。
だから>>596みたいなとんちんかんな話が出る。
632N-gram信者:2006/10/04(水) 17:08:06
>>629
だから実例で示せっつってんのに。

>>623
Googleは検索 | 漏れ | が | ある で区切って検索してるから
そんな結果になるんだろw
633名無しさん@そうだ選挙にいこう:2006/10/04(水) 17:11:08
>>629
言える
634N-gram信者:2006/10/04(水) 17:11:42
>>623 じゃなくて >>628だった。。。
635N-gram信者:2006/10/04(水) 17:16:03
おれは>>600で具体的にどんなソフトを使ってきて、
「N-gram 方式には検索漏れがない」って言ってるわけじゃん。

でも「検索漏れがある」派はアルアルと繰り返すばかりで
どういうシステム、またはアプリで検索漏れが発生するのか
全然示そうとしないね。

要するに連中はN-gram の仕組みを理解してなかっただけだろ。

>>629なんてその典型。
636名無しさん@そうだ選挙にいこう:2006/10/04(水) 17:23:58
>>610
> つまりN-gramはNの値と検索文字数によって漏れが出るのはしょうがない

このあたり全く理解出来てないのが丸見えだな。
Nの値は検索速度に影響してくるが、漏れの発生件数とは何の関係もないのに
637名無しさん@そうだ選挙にいこう:2006/10/04(水) 17:25:45
漏れはあるじゃねえか!(>>617
638名無しさん@そうだ選挙にいこう:2006/10/04(水) 17:48:27
>>626
nyで落とせ
639名無しさん@そうだ選挙にいこう:2006/10/04(水) 18:10:07
漏れの証拠が出たら一気に沈静化したなw
640名無しさん@そうだ選挙にいこう:2006/10/04(水) 19:12:59
>>637
estcmd create [-tr] [-apn|-acc] [-xl|-xh] [-sv|-si|-sa] [-attr name type] db
インデックスを作成します。
-trをつけると、既にインデックスがある場合にも新しいインデックスを作成します。
-apnをつけると、全ての言語をN-gram法で処理します。


-apnをつけると、全ての言語をN-gram法で処理します。
-apnをつけると、全ての言語をN-gram法で処理します。
-apnをつけると、全ての言語をN-gram法で処理します。
641名無しさん@そうだ選挙にいこう:2006/10/04(水) 19:15:18
それを使ってないってことはインデックスが馬鹿でかくなるのか?
でも、圧縮できるといってたよなぁ
なぜわざわざパフォーマンスが落ちるものをデモにしてるんだ
642名無しさん@そうだ選挙にいこう:2006/10/04(水) 19:28:35
>>641
なんのためにN-gram使ってると思っているの?
日本語が分かち書きされていないからだよ?
643名無しさん@そうだ選挙にいこう:2006/10/04(水) 19:53:58
>>642
何言ってるの?
違うよ
644名無しさん@そうだ選挙にいこう:2006/10/04(水) 19:57:00
>>640
そこじゃないから^^;
645名無しさん@そうだ選挙にいこう:2006/10/04(水) 20:02:04
>>639
いや、どうひいき目にみても>>617は、いわゆる「検索漏れ」ではないだろ。
形態素解析の検索ソフト(GDSやWDS、CB)つかってみろよ。
「紗綾」で「入江紗綾」がヒットしないとかマジあるし。
646名無しさん@そうだ選挙にいこう:2006/10/04(水) 20:07:17
N-gram法に漏れがあるなんて言ってる奴はアルゴリズム理解してないんだろ。

http://www.gengokk.co.jp/zenbun.htm
↑の「N文字インデックス法による全文検索」ていうの読めば分かる。
原理上、漏れはあり得ない。その代わり索引サイズはデカくなる。
647名無しさん@そうだ選挙にいこう:2006/10/04(水) 20:21:26
>>632
ある の検索結果 約 916,000,000 件中 1 - 100 件目 (0.19 秒)
ない の検索結果 約 583,000,000 件中 1 - 100 件目 (0.29 秒)
「ある」と「ない」で2倍程度しか差がないのに
628では20倍も差ができてるから
お前の理屈はおかしい
648名無しさん@そうだ選挙にいこう:2006/10/04(水) 20:29:11
>>647
「普通の全文検索では検索漏れがあるが、N-gram法ではない」っていう文章が多いんだろ。
              ~~~~~~~~~~~~~~~~~
だいたい、形態素解析を使ってるシステムを紹介するページだと、わざわざ自分の弱点である
検索漏れについて触れることすら少ないしね。
「検索漏れ」という単語を多く含んでいるということはそれだけN-gramに検索漏れがない
証拠とも言える
649名無しさん@そうだ選挙にいこう:2006/10/04(水) 20:56:08
>「検索漏れ」という単語を多く含んでいるということはそれだけN-gramに検索漏れがない証拠とも言える
なんで???
650名無しさん@そうだ選挙にいこう:2006/10/04(水) 20:57:30
>>649
頭悪いな。>>648を100回嫁よ
651名無しさん@そうだ選挙にいこう:2006/10/04(水) 20:57:56
>>648
>「検索漏れ」という単語を多く含んでいる
どこから多くなんて結論が出たんだ?
他のソフトで検索でもしたのなら書いて欲しい・・・
652名無しさん@そうだ選挙にいこう:2006/10/04(水) 20:58:38
N-gram派が遊ばれてる・・・
653名無しさん@そうだ選挙にいこう:2006/10/04(水) 20:59:58
>>648
普通はソフト名+バグなら
バグを含んでるととらえるよな
いくら信者でもさすがにその理屈はおかしいよ
654名無しさん@そうだ選挙にいこう:2006/10/04(水) 21:03:54
>>653
バグと検索漏れじゃ単語としての使用頻度が違うだろ。

つうか、Googleの検索結果で「ブッシュ 悪」が 819,000 件だから
「ブッシュは悪だ」っていう判断と同じだろそりゃ。

いいからN-gramでググってまずアルゴリズムを理解するところから始めろよ
655名無しさん@そうだ選挙にいこう:2006/10/04(水) 21:05:28
姉妹スレでもN-gramはこう評価されている。

http://pc7.2ch.net/test/read.cgi/software/1103114707/91
デスクトップ検索総合スレ Part1
91 :名無しさん@お腹いっぱい。:2005/05/29(日) 03:48:47 ID:cubYVqwD
Hyper EstraierとAN HTTPDの組み合わせを結構簡単に動かせた。
N-gram方式による漏れのない全文検索か
656名無しさん@そうだ選挙にいこう:2006/10/04(水) 21:36:43
>>655
そんな一例だけもってこられてもw
ググれば評価はいろいろだよ
657名無しさん@そうだ選挙にいこう:2006/10/04(水) 21:50:36
いいからさっさとN-gramの検索漏れの実例を出せよ。
658名無しさん@そうだ選挙にいこう:2006/10/04(水) 21:50:38
信者は都合のいい意見しか記憶に残らんから^^;
659名無しさん@そうだ選挙にいこう:2006/10/04(水) 21:51:08
>>657
何度も出てるだろw
660名無しさん@そうだ選挙にいこう:2006/10/04(水) 21:54:03
>>657
氏ね、アホ w
661名無しさん@そうだ選挙にいこう:2006/10/04(水) 22:02:30
>>617 の事?

>欧文は単語を単位にして検索され、
>それ以外の言語(中国語、日本語、韓国語、アラビア語など)は文字を単位にして検索されます(N-gram方式)。

って書いてあるけど??

BBSがBSで引っかからないはN-gram使ってないからだろ?
662名無しさん@そうだ選挙にいこう:2006/10/04(水) 22:04:36
N-gramで検索漏れをなくしたら
grepより遅くならんかな
663名無しさん@そうだ選挙にいこう:2006/10/04(水) 22:13:08
結局は理屈の上では検索漏れをなくすことが出来るってだけなんだよな
664名無しさん@そうだ選挙にいこう:2006/10/05(木) 04:54:21
今北産業

とりあえずN-gramは、理論的には漏れは無いはずだ。
アルゴリズムをちゃんと理解すればそれは分かるはず。

で、N-gramには適合率(ノイズが多いってことね)が下がるという欠点があるわけで、
それを補うために検索ソフトが様々な工夫を凝らしている訳だ。

その結果、適合率が上がったが、
N-gramを謳いながらも検索条件によっては検索漏れが生じる事になった。

という事でN-gramに検索漏れはないけど、
N-gramを使った検索ソフトには検索漏れがある場合はあるとういう事でFA?
665名無しさん@そうだ選挙にいこう:2006/10/05(木) 05:14:22
ソフトのせいじゃないだろw
666N-gram信者:2006/10/05(木) 08:28:00
>>664の見解でほぼFAでしょ。

おそらくLivedoorブログあたりの「N-gram 方式」を謳うエンジンで
漏れを経験したもんだから、アルゴリズムも知らずに「検索漏れはある」
と強弁してたんじゃないかな。

実際、ノイズと漏れとは逆比例の関係にあるから、実装上は
インデックスサイズの最適化も考慮して、ある程度の漏れを
許容してるのが普通だしね。
667名無しさん@そうだ選挙にいこう:2006/10/05(木) 09:17:49
漏れがないソフトを書けよ
668名無しさん@そうだ選挙にいこう:2006/10/05(木) 13:06:59
>>667
HyperEstraier

>>640にあるとおりオプション付ければ英文字もN-gram法で処理してくれる。

あと、>>526にもある「探三朗」。実際使ってみたけど
レポート通りのN-gram。たぶん文字種による切り分けもやってないのか
http://ja.wikipedia.org/wiki/2%E3%81%A1%E3%82%83%E3%82%93%E3%81%AD%E3%82%8B
の全文をテキストにしてインデクシングかけたら
「BSではハンドルネーム」とか「Sではハンドルネーム」
でもヒットした。

ただ、インデックスサイズの最適化を考えるとEstraierの方が
賢いやり方だとは思うがね。

で、「N-gram に検索漏れはある」派はその理論的根拠なり、
実例なりを準備できたのかい?
>>617については>>661でN-gram法使ってないことが指摘されてるし。
669名無しさん@そうだ選挙にいこう:2006/10/05(木) 13:16:24
estraierは純粋なn-gramじゃないんじゃない?
670名無しさん@そうだ選挙にいこう:2006/10/05(木) 13:22:44
Ngramって曖昧検索は出来んの?
671名無しさん@そうだ選挙にいこう:2006/10/05(木) 13:31:26
yes
672名無しさん@そうだ選挙にいこう:2006/10/05(木) 13:41:55
>>670
あいまい検索はシソーラスを内蔵してるかどうかだから
インデクシング方式とは関係ない。

grep式でも曖昧検索は出来る。(一太郎の全ファイル検索とか)
673N-gram信者:2006/10/05(木) 13:47:19
なんかいろいろサーチエンジン入れるハメになっちゃったんで
この機会に性能比較してみた。

対象フォルダ
70MBのtxt,doc,xls,html,mht混在フォルダ

サーチクロス インデクシング22秒 インデックスサイズ971KB(cache含まず)
DesktopHE インデクシング1分54秒 インデックスサイズ4.8MB
探三朗 インデクシング10秒 インデックスサイズ1.1MB

※探三朗以外は文書フィルタにxdoc2txt.exe使用

「溶接」でサーチ
サーチクロス 5件、DesktopHE 5件、探三朗 2件
理由は探三朗でヒットしなかったファイルは探三朗で未対応の*.mhtファイルだったため

意外と探三朗は優秀か?ただもっと大規模な文書群を索引化してみないと
ノイズや検索時間の問題が出てくるかも分からんから断定は出来んが
674名無しさん@そうだ選挙にいこう:2006/10/05(木) 14:05:48
ついでにGREPでもヨロ
あと長い単語も
675N-gram信者:2006/10/05(木) 14:24:23
>>674
GREPじゃ「インデクシング0秒」「インデックスサイズ0B」に決まってんじゃないか。

とりあえず、Office SuiteやPDF文書フィルタを備えたgrepソフトなんてないから
WindowsXPの検索で同じフォルダに検索かけてみた(一太郎やPDFのiFilter導入済み)

検索時間50秒で4件ヒット。サーチクロス&DesktopHEと比べて
1件少ないのは、mht文書が1件漏れているから。
その文書には確かに本文に「溶接」の文字が含まれているのだが
Windowsの逐次検索ではヒットしない。フィルタの質が悪いんだろうな
676名無しさん@そうだ選挙にいこう:2006/10/05(木) 14:46:48
本論は最初から実装として漏れがあるって話だったじゃん
それをN-gram自体はってのにすり替えて勝利宣言かよwwwwwwwww
677N-gram信者:2006/10/05(木) 15:07:41
>>676
「実装として」なんて話なかったよ。
おれが>>576で「N-gramでない限り検索漏れはあるに決まってるし」と
いったところ、>>577が「N-gramでも漏れはありますよ」というので
>>580で「N-gramに漏れはないよ」と返したところ、議論になっただけ。

べつに勝利宣言するつもりもないよ。
実装レベルで(文字種による切り分け)でN-gram法でも検索漏れが
出るという認識は俺もほとんど持ってなかった。

ただアルゴリズム上は漏れは出ないという認識は正しいはずだし、
>>617レベルの漏れは実用上なんの問題もない「漏れ」だとは
思うけどね。
678名無しさん@そうだ選挙にいこう:2006/10/05(木) 15:14:03
このスレはなんで昼間に伸びるの?
679名無しさん@そうだ選挙にいこう:2006/10/05(木) 15:29:52
業務用として使われることが多く、詳しい人は管理者であり
管理者特権を行使している人が集うから。
680名無しさん@そうだ選挙にいこう:2006/10/05(木) 15:37:55
ついに認めたなアホ
漏れがあることを認めたんなら、他の形式のソフトと同じと言うこと
もう出てこなくていいよおまえ
「理論上は」と「実装した場合」の区別をわざとつけずに詭弁を弄するだけの馬鹿は消えろ
681名無しさん@そうだ選挙にいこう:2006/10/05(木) 16:04:02
679の訂正
業務用として使われることが多く、詳しい人は管理者であり
管理以外の仕事を任せてもらえない人も多いようだ。
682名無しさん@そうだ選挙にいこう:2006/10/05(木) 17:13:31
N-gram "検索漏れがない" の検索結果のうち 日本語のページ 約 6 件
N-gram "検索漏れがある"に該当するページが見つかりませんでした
683名無しさん@そうだ選挙にいこう:2006/10/05(木) 18:47:22
AN HTTPDとnamazuでLAN内検索システムってのを
前に作ったことがあるんだけど、これからはHyper Estraierだってんで、
同じように挑戦してみた。
●Active Perlが無くても動く
●*.cgiはEXEとして実行可能にしておく
●-pc CP932 オプションを付けてインデクシングする

と、いった感じで進めていった。
インデックスも無事できて検索画面で検索もできるんだけど、
ファイル名に日本語名が入ってると、ブラウザからのリンクが効かないんだよね。
ファイル名がURLエンコードされたままになってるからじゃないかと思う。

mknmzなら-U オプションで解決したんだけど、
Hyper Estraierではやり方が分からん。。。namazuと比べると
WEB上の資料も乏しいし、誰か分かる人いませんか?
684名無しさん@そうだ選挙にいこう:2006/10/05(木) 18:52:52
>>681
俺のレスを勝手に修正すんな基地外

>>681=信者
685名無しさん@そうだ選挙にいこう:2006/10/05(木) 19:49:08
>>675
Grep以外は全文検索じゃないとか言ってた奴がいたが、
そのGrepが一番精度低いとは笑えるな
686名無しさん@そうだ選挙にいこう:2006/10/05(木) 21:01:02
>>683
設定ファイルの
showlreal: true
は指定してみた?
687名無しさん@そうだ選挙にいこう:2006/10/05(木) 22:34:19
>>685
精度?
馬鹿?
ああ、馬鹿でしたね
688683:2006/10/05(木) 23:04:02
>>686
すげー!THX!
confいじってからインデックス作り直したらバッチリ動いたよ!

あとはnamazuみたいに複数のインデックスをチェックボックスで切り替えられたらなぁ。
公式みたところでは@genre によるジャンル絞り込みしかできないみたい。
689名無しさん@そうだ選挙にいこう:2006/10/05(木) 23:05:03
全文検索ユーティリティ統一スレッド part3
http://pc8.2ch.net/test/read.cgi/bsoft/1120649196/577-

N-gramによる検索時に検索が発生するか否かの議論。

また、以下ではサーチクロスの実装パターンの推測が行われている。
http://pc8.2ch.net/test/read.cgi/bsoft/1120649196/495
690名無しさん@そうだ選挙にいこう:2006/10/05(木) 23:14:55
検索時に検索が発生するか否かの議論
691名無しさん@そうだ選挙にいこう:2006/10/05(木) 23:36:38
閑話休題。N-GRAMの変形を実装した、OracleのinterMedia Text (現在はOracle Text) という
製品では、ワイルドカード検索で予期しないふるまいをするという解説記事があるよ。

ちなみにワイルドカードは、 '_' は任意の1文字に、'%' は0個以上の文字列にマッチする。

ttp://otndnld.oracle.co.jp/products/oracle8i/intermedia/htdocs/imt.htm
692名無しさん@そうだ選挙にいこう:2006/10/06(金) 00:22:51
>>687
はいはいGrep信者は専用スレでも立ててそっち行ってね。
ここはインデックス型高速全文検索スレだから
693名無しさん@そうだ選挙にいこう:2006/10/06(金) 03:55:07
>>692
えーと君は精度って言葉の意味を調べた方が良いよ
煽りに煽り返すんじゃなくてさ
694名無しさん@そうだ選挙にいこう:2006/10/06(金) 07:18:47
ていうか、喧嘩はもうやめよう。
適合率(精度)と再現率の定義から始めないと議論が噛み合わないぞ。
695名無しさん@そうだ選挙にいこう:2006/10/06(金) 10:47:53
>>694
定義も何も>>646のリンク先にすでに出ていることじゃないか。

適合率が高い=ノイズが少ない
再現率が高い=検索漏れが少ない

両者は反比例する。

「精度」っていう場合は、適合率のことをいう。
http://www.r.dl.itc.u-tokyo.ac.jp/~nakagawa/infoDB/ir-esti.ppt
http://itpro.nikkeibp.co.jp/article/COLUMN/20051208/225947/

ノイズが少ない検索エンジンが「精度がいい」。
いまもって形態素解析が検索エンジンの中核を担っているのはそういうことなのかもね。
696名無しさん@そうだ選挙にいこう:2006/10/06(金) 12:23:27
>>695
「ノイズが少ない」では定義として不十分でしょ。
さらに一歩踏み込んで、シグナルとノイズの定義を明確化せねば。

697名無しさん@そうだ選挙にいこう:2006/10/06(金) 13:06:21
ノイズの定義は明らかでしょ。
まず、フォルスドロップ、ついで単語の切り分けに失敗したケース
「相撲」で検索→「航空相撲殺」がヒット
「スキー」で検索→「ドストエフスキー」「スキーム」がヒット

いずれにせよ上記のようなノイズはN-gram 方式では技術的に不可避だから
WWW検索みたいな大規模な検索エンジンにN-gramを使うのは自殺行為だろうね。
Hyper Estraierのようにハイブリッド式って方向もあるだろうけど
698名無しさん@そうだ選挙にいこう:2006/10/06(金) 14:32:25
                    ,ィ⊃  , -- 、
          ,r─-、      ,. ' /   ,/     }     ち
          {     ヽ  / ∠ 、___/    |
   署     ヽ.      V-─- 、  , ',_ヽ /  ,'      ょ
           ヽ  ヾ、  ',ニ、 ヽ_/ rュ、 ゙、 /
   ま        \  l  トこ,!   {`-'}  Y        っ
             ヽj   'ー'' ⊆) '⌒`  !
   で    , 、      l     ヘ‐--‐ケ   }        と
        ヽ ヽ.  _ .ヽ.     ゙<‐y′   /
   来     }  >'´.-!、 ゝ、_  ~  ___,ノ
         |    −!   \` ー一'´丿 \
   い    ノ    ,二!\   \___/   /`丶、
        /\  /    \   /~ト、   /    l \
699名無しさん@そうだ選挙にいこう:2006/10/06(金) 20:20:16
>>697
ところが、細かいところでノイズの捉え方は異なる。
そしてその細かい違いに拘るユーザが多いということがこういった論争を引き起こしている
ような気がする。

例えば「検索」で「全文検索」を該当させるべきか否か。
わかち書きの場合、「全文検索」が辞書にあれば、
そのフレーズは「検索」というクエリではヒットしないことになるが、
それが「ノイズ除去」なのか「検索漏れ」なのかは、ユーザが「全文検索」
というフレーズをどうとらえているかによる。

つまり、「単語の切り分けに失敗」したかどうかが各ユーザの主観に委ねられてしまう
ので、宗教論争になりがちなのだと思う。

ノイズや検索精度の定義が自明でないことを踏まえて、統計的なアプローチをとるのが
賢明なんじゃないかなぁ。
700名無しさん@そうだ選挙にいこう:2006/10/06(金) 23:56:03
estaierはbi-gramとhashだから
まったくの別物だよ
701名無しさん@そうだ選挙にいこう:2006/10/07(土) 00:19:36
>>700
スペル間違ってるし、いきなり何言ってるのかも分かんないし・・・
702名無しさん@そうだ選挙にいこう:2006/10/07(土) 06:51:37
Estraier検索漏れあるじゃん

全文検索エンジンEstraier
ttp://pc8.2ch.net/test/read.cgi/unix/1100221699/

>>701
NM-gramってことでしょ
703名無しさん@そうだ選挙にいこう:2006/10/07(土) 10:20:50
>>702
完全N-gramモードで動かせば検索漏れは無くせる。
704名無しさん@そうだ選挙にいこう:2006/10/07(土) 10:23:12
それはもはやN-gramじゃないですからw
705名無しさん@そうだ選挙にいこう:2006/10/07(土) 11:19:52
>>702
アフォですか?
Estraierってのは形態素解析を使ったH.E.の前世代エンジン。
検索漏れはあって当然。

Hyper Estraierはデフォ設定だと漏れはあるが
設定次第で完全N-gramにできるから漏れはゼロにできる。
706名無しさん@そうだ選挙にいこう:2006/10/07(土) 11:33:00
検査漏れもいいけれど、表示の優先度はどうするよ?
707名無しさん@そうだ選挙にいこう:2006/10/07(土) 11:34:10
つまるところ、ググルのページランクみたいなものだが、実質的な使い勝手
はソート順の方が効いてくる希ガス。
708名無しさん@そうだ選挙にいこう:2006/10/07(土) 12:02:12
>>705
設定次第なら大抵のソフトでも検索漏れないなw
709名無しさん@そうだ選挙にいこう:2006/10/07(土) 12:14:48
>>707
ページランクって被リンク先のランクと数から重み付けする方式でしょ?
WWW検索では有効かも知れないけど、イントラネットや個人のアーカイブなら
やっぱりタイトル(ファイル名)と本文に含む数で順位付けするしかないんじゃない?

>>708
namazuはどんな設定しても漏れまくりですが何か?
710名無しさん@そうだ選挙にいこう:2006/10/07(土) 22:28:36
ずいぶんスレ伸びたね。N-gram論争で。
でもここは個人向けの全文検索スレだよね?
もうじきVistaが出荷されるよね。
VistaにはWDSと同エンジンのインデックス検索が標準で付いてくるよね。
君らみたいなマニア層じゃない人はもちろんそれを使うよね。

「すげー、Excelの中身まで一瞬で検索するよ」
「mp3のID3タグやPDFのメタデータまで検索してくれるわ」
「インデックスとか良く分からないけど、いつのまにやら作ってくれてる。便利だなー」
「やっぱシェル統合だね」

オタクは「MSNエンジンは形態素解析の精度がどうのこうの」いうかも
知れないけど、結局サードパーティの変なソフト入れて、インデックス作成に
メモリ大量消費したり、途中でこけたりするサーチ○ロスとかNa○azuとか○straierとか
Concept○earchみたいのはあっという間に淘汰されていくんだろうね。
711名無しさん@そうだ選挙にいこう:2006/10/07(土) 22:32:27
           ムシャ         |
             ムシャ       |
      ∩___∩              |  ぷらぷら
      | ノ      ヽ        ((   |
     /  ●   ● |         J  ))
. ((  |    ( _●_)  ミ ・
    彡、   |∪}=) ,ノ ∴
     /    ヽ/^ヽ ヽ  。
     |      ヽ \ |
     |      ヽ__ノ
712名無しさん@そうだ選挙にいこう:2006/10/07(土) 23:33:24
>>710
そんな感じだろうね。
713名無しさん@そうだ選挙にいこう:2006/10/07(土) 23:45:18
Vista 使わないな。XPと2000で間に合う。
714名無しさん@そうだ選挙にいこう:2006/10/08(日) 00:53:43
2ちゃん専ブラの過去ログ検索にこだわってサーチクロス使ってきたけど
いい方法考えた。

(1)まず http://tatsu01.at.infoseek.co.jp/ でDAT2HTMLを入手
(2)c:\Program Files に「dat2html」フォルダを作って解凍したファイルを
  全部突っ込む
(3)次のファイルをメモ帳で作る
path c:\Program Files\dat2html
c:
cd c:\Program Files\hzb2\users\USER_NAME\log\2ch ←専ブラによる
dat2html /c /t /s
pause conversion is finished
(4)「dat2html.bat」とでも名前を付けて適当な場所に保存
(5)上記バッチファイルをダブルクリックで、専ブラのログ保存場所に
  html形式に変換されて保存される
(6)バッチファイルをタスクスケジューラで3日に1回くらい実行させておく

これでGDSやMSN、はてはnamazuでもスレッド単位で過去ログ検索が可能になる
オレって天才!
715名無しさん@そうだ選挙にいこう:2006/10/08(日) 00:56:59
>>714
バッチファイルの中身を訂正

path c:\Program Files\dat2html
c:
cd c:\Program Files\hzb2\users\USER_NAME\log\2ch ←専ブラによる
dat2html *.dat /c /t /s        ←「*.dat」が必要
pause conversion is finished
716名無しさん@そうだ選挙にいこう:2006/10/08(日) 01:50:17
>>714
それで満足できるなら問題ないけど。ファイルサイズがが大きくなっちゃうとか。

あと、GDSはサイズ制限でイマイチだと思います。
717名無しさん@そうだ選挙にいこう:2006/10/08(日) 08:00:34
サーチクロスって無料?
718名無しさん@そうだ選挙にいこう:2006/10/08(日) 14:57:27
719名無しさん@そうだ選挙にいこう:2006/10/08(日) 15:33:54
>>714
面倒じゃね?
メリットもあんまりなさそう・・・
720名無しさん@そうだ選挙にいこう:2006/10/08(日) 16:12:18
>>719
タスクスケジューラで一度設定しとけばあとは自動的にやってくれるから面倒じゃないよ。
でもログのサイズが倍増するのが玉に瑕。。。

あと、差分だけの変換ってのができないから、実行のたび一から変換になっちゃう。
ログサイズによっては結構時間かかるんだよね〜。

2ちゃんの過去ログを宝の山と思う人でなおかつサーチクロス使わない人は
試す価値あるんじゃないかな?
721名無しさん@そうだ選挙にいこう:2006/10/08(日) 17:00:47
やっぱりN-gram最高だったな
ttp://preferred.jp/sedue/benchmark.htm
722名無しさん@そうだ選挙にいこう:2006/10/08(日) 21:18:35
Hyper Estraierってデフォルトでファイルサイズ32MB、テキストサイズ128KBの
制限があるんだよね。どうりで文書の最後の方が引っかからないと思った。。。

で制限を緩めてファイルサイズ512MB、テキストサイズ2048KBにして
Gatherer走らせてみた。テキストサイズの方は何とかなるんだけど、
うちにある透明テキスト入り480MBのPDF(テキスト自体は1MB程度)が「Out of Memory」でこける。

しゃーないから仮想メモリを1024MBまで増やしたんだけど、それでもダメ。
ちょっとメモリ食い過ぎじゃないの?xdoc2txtでテキストをテンポラリーに抽出してから
インデックス化すればいいだけだと思うんだがなぁ。

これじゃ書籍をスクラップしてPDF化した奴はかなり弾かれることになる。
ちなみにこのファイル、サーチクロスやWDSではすんなりインデックス化されるんだよね。
723名無しさん@そうだ選挙にいこう:2006/10/08(日) 21:58:17
使う前にヘルプ読むなりするから
デフォルトが糞でも問題ない
724名無しさん@そうだ選挙にいこう:2006/10/08(日) 22:21:42
N-gramを使うまでは、僕はまったくもてませんでした。
2ちゃんねるやWarez、最新アニメの話で彼女をひきつけようとしても、白けられるばかりでした。
N-gramを使ってからは全てが変わりました。
全文検索の話で盛り上がり、彼女はもう僕にめろめろです。
素敵な彼女のハートをつかむことを助けてくれたN-gramに僕は大感謝です。
725名無しさん@そうだ選挙にいこう:2006/10/08(日) 22:51:33
>>722
そういうフィルタを書けばいいんじゃね?
estxfilt.batを適当に改造するだけだから多分簡単ぽい。
726名無しさん@そうだ選挙にいこう:2006/10/08(日) 23:08:14
>>722
480MBのpdfを作業フォルダにコピーしてからestxfilt.batで変換するようになってるみたいだけど
こけるのは480MBのコピーのときかな?
727名無しさん@そうだ選挙にいこう:2006/10/09(月) 00:30:52
-fzオプションでコピーを抑止して、estxfilt.bat の中で
%ESTORIGFILE% から読み込むようにすればいいんじゃね?
728722:2006/10/09(月) 01:45:53
estxfilt.bat の中身って単なるxdoc2txtのコマンドだよね。
とりあえずコマンドプロンプトから正常にテキスト抽出できるかどうか試してみたら
「abnormal terminal」と出て、動かない。

物理メモリ512MB、仮想メモリ2048MBのクライアントでGatherer走らせたら
インデックス化できました。結局クライアントがしょぼすぎたっつうことで。。。
xdoc2txt.exeってファイルサイズ分を実メモリに読み込んで処理するんだね
729これわろた:2006/10/09(月) 18:37:44
【desktop】Google デスクトップ Vol.3【検索】
http://pc7.2ch.net/test/read.cgi/software/1153406994/l50

329 名前:名無しさん@お腹いっぱい。 投稿日:2006/10/04(水) 11:22:45 sDrCWpEr0
さっきこれ入れてみました。
かのGoogleがやることに間違いはないだろうと楽しみでしたね。
さすがにインターフェイスがわかりやすいです。
スケジューラーないなーと思ってたんですけど探したらカレンダーがありました。
よくわかんないけどユーザー登録して苦労しながら使ってみたら、
いちいちブラウザ立ちあがんのかよと思いましたけどまあいいかな。
そんな間にもデスクトップはPCを検索してくれます。
アイドル状態じゃないと検索しないのかよと思い、すぐ検索を選択。
CPUを80〜90%ずっと使ってます。重い。。。でも意外に遅い。。。
だけどむしろ終わったときに喜びましたね。 いい感じじゃ、さすがグーグル様。

で、感動しながらディスク容量を見たときにびっくり。 なんか1GBとか減ってんの。
調べてみたらデータベースね。 馬鹿かと。 なんでデータベース作んのにそんな容量使うねん。
多分ファイルの内容とかも全部読み取ってんだろうけど、個人的にそこまでしなくていいよ。
題名でだいたい分かるし。勘弁して。 しかもさらに調べたらプロセスが4つぐらい常駐してんのね。メモリ馬鹿食い。

むかついてとっさにアンインストールしようとしたんだけど、 ちょっと待って。
そうか容量食うんだったらデータベースを全部消せばいいんだよな。
よし探し出してShift+Deleteと。 あとGoogleDesktopCrawl.exeを消せばHDDの検索機能止まるから完璧。
しかもGoogleDesktopCrawl.exeのプロセス1個減るからメモリにも優しいっていう。
天才かもしれない。

こんな感じでうまく使いこなせそうです。
みなさんもお試しあれ〜。
730名無しさん@そうだ選挙にいこう:2006/10/09(月) 19:30:50
釣りだろ。下の中。
731名無しさん@そうだ選挙にいこう:2006/10/10(火) 00:16:16
関連スレ
Vistaの高度な検索機能と整理機能を使いこなすスレ
http://pc8.2ch.net/test/read.cgi/win/1151723516/l50
732名無しさん@そうだ選挙にいこう:2006/10/13(金) 03:38:41
NTTデータが全文検索エンジン「Ludia」をオープンソースとして無償公開
http://itpro.nikkeibp.co.jp/article/NEWS/20061012/250485/
733名無しさん@そうだ選挙にいこう:2006/10/13(金) 05:07:14
Sennaの薄いラッパーにすぎないのに、まるで自社開発の検索エンジンであるかのような
宣伝のしかたはうまいよなー。
734名無しさん@そうだ選挙にいこう:2006/10/13(金) 05:26:44
>>733
文盲か?
735名無しさん@そうだ選挙にいこう:2006/10/13(金) 07:19:05
>>734
ちゃんと中身を見てからイチャモン付けような。

>>733とは別人だけど、実際はSennaのPostgreSQLバインディングなんよ。
しかもちょっと手が加えられたpg_sennaにconfigureを加えただけと言っても過言ではないようなステキ構成。
それをさも独自開発のように宣伝するのは凄いw
pgestraierやpg_rast(むしろRast本体)に動きが見られない現状、
PostgreSQLに対応したものを出してくれるだけで十分ありがたいんだけどね。
736名無しさん@そうだ選挙にいこう:2006/10/13(金) 07:34:56
俺も読んだけど
>まるで自社開発の検索エンジンであるかのような
になるのはおかしくね?
737名無しさん@そうだ選挙にいこう:2006/10/13(金) 08:28:41
738名無しさん@そうだ選挙にいこう:2006/10/13(金) 08:30:54
>>735
どこに独自開発のように宣伝してる部分があるの?
739名無しさん@そうだ選挙にいこう:2006/10/13(金) 10:15:58
何も但し書きがない状態で自社サイトに載せてて自社開発でないと思うほうが難しいだろ
740名無しさん@そうだ選挙にいこう:2006/10/13(金) 10:42:33
そんなこと言ってたら全ての漫画家は手塚治虫のパクりだろ
741名無しさん@そうだ選挙にいこう:2006/10/13(金) 11:14:19
( ・?ω・?)喧嘩が好きですね
742名無しさん@そうだ選挙にいこう:2006/10/13(金) 11:18:15
そんなことよりも、サーチクロスで、PDFのフォントとかに制限のないフィルタを探してくれ。
743名無しさん@そうだ選挙にいこう:2006/10/13(金) 12:40:47
>>739
だからそう言ってるじゃん
744名無しさん@そうだ選挙にいこう:2006/10/13(金) 13:54:11
>>742
xdoc2txt
745名無しさん@そうだ選挙にいこう:2006/10/13(金) 14:21:16
type1 はむりだべ。
746名無しさん@そうだ選挙にいこう:2006/10/13(金) 14:58:07
type1をフィルタリングできるのは海外にあったけど
標準出力が出来ない。ファイルには出せるけど。
だれか探してくれ。
747名無しさん@そうだ選挙にいこう:2006/10/13(金) 15:01:30
出来るでしょ
748名無しさん@そうだ選挙にいこう:2006/10/13(金) 15:21:53
N-gram使えば解決
749名無しさん@そうだ選挙にいこう:2006/10/13(金) 16:07:18
N-gram・・・
とっつきにくそうだな。調べる気にもならなくなるなぁ。
サーチクロスのフィルタとして使えるの?

簡単に説明してちょ。
750名無しさん@そうだ選挙にいこう:2006/10/13(金) 16:22:41
円記号問題がないソフトはありますか?
751名無しさん@そうだ選挙にいこう:2006/10/13(金) 18:08:04
>>750
HyperEstraier なら"¥"で検索できる。
ちゃんと半角もヒットする。
752名無しさん@そうだ選挙にいこう:2006/10/13(金) 18:12:13
>>745
type1 フォント使ってるPDFを紹介してよ。
抽出できるかどうか試してみるから
753名無しさん@そうだ選挙にいこう:2006/10/13(金) 22:14:27
そのludiaとやらは、まがりなりにも「オープンソース開発センタ」を名乗っている
部署が作っているわりには、派生元であるSennaに対するリスペクトがなさすぎるよな。
というか、ソース見る限り、わざわざ商標までとるような仕事なのかと小一時間…

$ wc -l pgsenna2.c pgsenna2.h
751 pgsenna2.c
93 pgsenna2.h
844 合計

おとなしくpg-sennaとして出してればよかったのにな。
754名無しさん@そうだ選挙にいこう:2006/10/14(土) 06:47:54
なんか妬んでけちをつけてるようにしか見えないよな
755名無しさん@そうだ選挙にいこう:2006/10/14(土) 23:35:23
でも正直、商標はやりすぎだろ
756名無しさん@そうだ選挙にいこう:2006/10/14(土) 23:42:28
>>755
なんで?
AVEXくらいなら分かるけど
これは何の問題もないとおもうぞ
757名無しさん@そうだ選挙にいこう:2006/10/15(日) 00:06:30
商標=金儲けの感があるからじゃね?
758名無しさん@そうだ選挙にいこう:2006/10/15(日) 00:59:15
放っておくと勝手に名前を使われて信用を害されたりするから、防衛的に商標登録することがある。
大会社は信用の保護のために、こういう金にならないものであっても無策ではいられないのだよ。
759名無しさん@そうだ選挙にいこう:2006/10/15(日) 17:26:30
ヤクザな企業が後から商標を取って
「ねー、おたくの会社、うちの名前を勝手に使うってどういうこと?お金払ってよ」
と訴えられるのを防ぐために商標とってるだけ。>>758のいうとおりです。
760名無しさん@そうだ選挙にいこう:2006/10/15(日) 18:00:32
755には、なんでやりすぎなのか説明してほしいw
761名無しさん@そうだ選挙にいこう:2006/10/15(日) 20:49:47
ようするにNamazuのパッケージに新規開発した文書フィルタ追加して
「Hyper NTT SearchSolutionSystem (HN-3S)」とか商標とって
公開してるようなもん?
762名無しさん@そうだ選挙にいこう:2006/10/15(日) 20:54:06
全然違うだろ
732をよくよめ
763名無しさん@そうだ選挙にいこう:2006/10/15(日) 22:12:30
>>761
作者は違うと主張するだろうけど、
傍目に見るとそんなレベルだよな。
764名無しさん@そうだ選挙にいこう:2006/10/15(日) 23:25:11
フィルタとラッパーは同じものなの?
765名無しさん@そうだ選挙にいこう:2006/10/16(月) 00:37:12
サーチクロスでUnicode(UTF-16),UTF-8のテキストファイルが
インデックス化できないのは有名だが、txt htm html shtml に対しても
xdoc2txt.exeを文書フィルタとして使えば抽出できるようになるんだな。

テキストとHTMLのインデックスを作り直すか。。。
766名無しさん@そうだ選挙にいこう:2006/10/16(月) 08:36:06
>>752
ありがとうございます。ただ、該当フォントを使ったpdfは新たに作ることも出来ず
機密ではなくとも外に出せる文書ではないため、うpできませぬ。
再度国内HPで紹介され、試用できるものは試してみましたが、やはりだめやった。
どうもありがとう。
767名無しさん@そうだ選挙にいこう:2006/10/16(月) 11:39:11
>>759
みかかが勝手に商標を取って
「ねー、おたくの会社、うちの名前を勝手に使うってどういうこと?お金払ってよ」
と訴えるんじゃないかってことだろ。
もともと他人のフンドシに自分の名前を書いてるんだから
勝手に名前を使われて信用を害されたりするなんて因縁つけるのは本末転倒。
大会社と違ってボランティア組織は金が無いから、こういうことに無策で食い物にされそう。
768名無しさん@そうだ選挙にいこう:2006/10/16(月) 16:08:05
アンチの論理はおもしろいなw
769名無しさん@そうだ選挙にいこう:2006/10/16(月) 16:52:02
商標って勝手に取れるものなの?
770名無しさん@そうだ選挙にいこう:2006/10/16(月) 17:26:08
探三郎、使ってみた。

検索結果から直接文書を開けるのと
結果一覧が見やすいのはイイ!

これで、大文字・小文字を区別するかどうかを
選択できれば完璧なんだが。
771名無しさん@そうだ選挙にいこう:2006/10/16(月) 17:44:33
行に飛んでくれない
検索結果の画面がカスタマイズできない
もなんとかしてほしい
772名無しさん@そうだ選挙にいこう:2006/10/16(月) 18:29:21
プレビューで行に飛ぶってこと?
そんなソフトサーチクロス以外にあるの?

あと、探三朗(Vectorなど)なのか探三郎(公式)なのかもはっきりして欲しい
773名無しさん@そうだ選挙にいこう:2006/10/16(月) 18:36:29
>>772
Copernic Desktop Search2も飛ぶよ
774名無しさん@そうだ選挙にいこう:2006/10/16(月) 19:46:39
namazuやkwicも飛べる
775名無しさん@そうだ選挙にいこう:2006/10/16(月) 19:47:31
>あと、探三朗(Vectorなど)なのか探三郎(公式)なのかもはっきりして欲しい
吉とよしのやの「よし」が同じなのと一緒
776名無しさん@そうだ選挙にいこう:2006/10/16(月) 20:44:45
> 吉とよしのやの「よし」が同じなのと一緒
それは違うだろw
777名無しさん@そうだ選挙にいこう:2006/10/16(月) 22:45:29
今時の検索エンジンは朗も郎も同一視するから問題ない
778名無しさん@そうだ選挙にいこう:2006/10/16(月) 22:45:57
一太朗
779名無しさん@そうだ選挙にいこう:2006/10/17(火) 00:55:19
サーチクロスは標準でUTF-8のHTML文書がインデックス化されないんだよね。
xdoc2txtを外部フィルタとして使えば、UTF-8だろうがUnicode Textだろうが
インデックス化される。

でも、HTML文書ってデフォルトで外部フィルタ選べないようになってんだよな。
で、標準HTMLフィルタはオフにして、「新しいファイル形式」から拡張子とxdoc2txtを
登録する。これでUTF-8な文書も検索できるのはいいんだけど、
今度はHTMLプレビューが使えなくてプレーンテキストになっちゃう。

諸刃の剣やなぁ。なんとかしてよヴィレッジさん
780名無しさん@そうだ選挙にいこう:2006/10/18(水) 17:07:01
サーチクロス掲示板過去ログ検索
ttp://www.villagecenter.co.jp/cgi-bin/searchx3.cgi?0=search

・・・なんかしょぼいなぁ。しかもこれwwwsrch.cgi みたいなgrep式エンジンじゃないの?
閉鎖するんならログを全部プレーンテキストで公開してほしかったな。
781名無しさん@そうだ選挙にいこう:2006/10/18(水) 17:12:42
掲示板ないソフトは総じて不親切な気がする
いや、ちゃんとした会社だと別なんだけどさ・・・
782名無しさん@そうだ選挙にいこう:2006/10/18(水) 18:06:29
掲示板があるだけマシだからな
783名無しさん@そうだ選挙にいこう:2006/10/18(水) 19:55:16
僕もソフト屋のはしくれだけど、掲示板は怖い。
それに面倒くさい。
掲示板を管理してくれる専用の業者に頼むほど予算もないし。
784名無しさん@そうだ選挙にいこう:2006/10/22(日) 02:32:30
サーチクロス、圧縮ファイルとリムーバブルメディアに対応して欲しいなぁ。
Open Office形式に対応できてんだからzip対応は簡単そうなんだが……
785名無しさん@そうだ選挙にいこう:2006/10/24(火) 13:41:56
テスト
786名無しさん@そうだ選挙にいこう:2006/10/24(火) 16:06:13
>>776
つち吉はU+20BB7でコード化されてる。メイリオや小塚明朝には入っている。
787名無しさん@そうだ選挙にいこう:2006/10/29(日) 21:00:32
サーチクロスでファイル名のみの検索って出来る?
うちの環境だとファイル名検索をチェック入れると必ずこける。
いつもこけるフォルダを除外に入れても位置がちょっとあとにずれるだけでやっぱり
サーチクロスごとこける。

どうにかならんもんかね。
788名無しさん@そうだ選挙にいこう:2006/10/30(月) 08:58:01
>うちの環境だとファイル名検索をチェック入れると必ずこける。
単に君のPC環境の問題でしょ
バグならもっと話題になってるはず
789名無しさん@そうだ選挙にいこう:2006/10/30(月) 14:48:44
サーチクロスは環境ごとに不具合の出方も違うしね。
うちではフレーズ検索の絞り込みが中途半端にしかされない問題がある。

あと>>787の場合「こける」が何を意味してんのか分からんし答えようもないよ。
一般保護エラーでアプリが落ちるのか、エラーメッセージとかが出るのか
790名無しさん@そうだ選挙にいこう:2006/10/30(月) 16:26:21
787は単にグチってるだけなのかもね
791名無しさん@そうだ選挙にいこう:2006/10/30(月) 20:25:05
>>788
PC3台ともこけるんですが。。。
自社エンジンがこけまくってても直さずにxdoc2txtを薦めるソフト会社ですが。。。



こんなことぐちりながらも他にいい商品が無いから使ってる俺も俺ですが。。。

>>789
スマソ。アプリごと落ちる。
792名無しさん@そうだ選挙にいこう:2006/10/30(月) 21:42:29
>>791
詳しい状況かけよ
バカなの???
793787:2006/10/30(月) 21:51:32
ばかはてめえだ
794名無しさん@そうだ選挙にいこう:2006/10/30(月) 21:56:28
質問すらまともに出来な奴はスルーしたほうがいい
優しくて損したなw
795名無しさん@そうだ選挙にいこう:2006/10/30(月) 22:18:10
>>792
詳しい状況も何も対象フォルダをCドライブ全体を指定してIndexを作るだけ。
これでサーチクロスが丸ごと落ちる。
フォルダの範囲を小さくするとまともに動く。でもCドライブを丸ごと指定すると駄目ぽ。

>>793
あんただぁれぇ?
796名無しさん@そうだ選挙にいこう:2006/10/30(月) 22:27:39
>>791
ひょっとしたら「こける」のはインデクシング最中にってこと?

>>787の書き方だと検索をするときにこける、みたいに読めてしまう。

もしインデクシング中にこけるんであれば、単に搭載物理メモリに対して
インデックス対象ファイル数が多すぎるだけだと思う。
経験則からいくとメモリ1GBに対してファイル20,000個が限界。

うちではインデックス作成の時に少しずつ対象フォルダ&対象拡張子を
増やしていき、一度のインデクシングで対象を1万数千ファイル程度に抑えてる。
対象フォルダや拡張子を増やすときに「一から作り直せ」みたいなメッセージが出るが
無視して「更新」し続けていれば、いつかは完成する。

一度出来上がれば、あとは適当な頻度で更新すれば、もう強制終了することもなくなる。
797名無しさん@そうだ選挙にいこう:2006/10/30(月) 22:53:46
>>796
レスどうも。そうです。インデクシング中にこけます。
メモリは4G乗せててOSに3.5G、RAMディスクに500M割り当ててます。

一から作り直せって言われても無視して更新すればいいんですね。
やってみます、と書いてやってみたら出来ました。
ありがとうございました。

あともう一つ教えて欲しいのですが、全ドライブを検索対象に入れる
いい方法は無いでしょうか。
マイコンピュータ自体を指定不可なので、今はCとDドライブのインデックス、
Eドライブのインデックスと分けています。
798名無しさん@そうだ選挙にいこう:2006/10/30(月) 23:26:13
>>797
???また良く分からんことを・・・

「インデックス対象」ってとこに新規で「フォルダ1=c:\」「フォルダ2=d:\」って
つくるだろ。そしたらもう1回、「新規」ボタン押して好きなドライブ追加していきゃ
インデックスは1つ(標準)だけでできるだろ。

ただ、そこまでやるとインデックスが肥大化しすぎて、
読み込みに何十秒もかかるようになって実用に耐えられないんじゃあるまいか
799名無しさん@そうだ選挙にいこう:2006/10/31(火) 00:18:36
>>797
いつどこで何をしてたら
どうコケるのか書けよ
基本的なコミュニケイト能力がないな・・・
800名無しさん@そうだ選挙にいこう:2006/10/31(火) 00:29:58
うるせー
801名無しさん@そうだ選挙にいこう:2006/10/31(火) 00:30:19
すみません、自己解決しました。
お騒がせしました。
802名無しさん@そうだ選挙にいこう:2006/10/31(火) 00:32:29
>>798
す、すまん。馬鹿だった。許してたもれ。

試しにwindowsでファイル名のみにチェックを入れて検索してみたら、
readme.txtとかが大量にヒットした。原因はフォルダ名にWindowsを含んでるだけ。。。orz
使えないっす。。。
803名無しさん@そうだ選挙にいこう:2006/10/31(火) 07:27:29
おまえら優しいな
俺はバカに答える気になれんわ
804名無しさん@そうだ選挙にいこう:2006/10/31(火) 22:17:08
>>802
フルパス名が検索対象になってるからいいんじゃないか。
「windows」なんかで検索すなよ。アホかっちゅうの
805名無しさん@そうだ選挙にいこう:2006/10/31(火) 23:20:09
>>802
いや、それは正しい挙動だろ?>windowsを検索でフォルダ名にWindowsを含む
それが探せないほうが困る。

というか、基本的にはシステムディレクトリ(c:\winntとかc:\windowsとか)は
外したほうがいいんじゃね?
場合によってはc:\program filesとかも外したほうがよさげ。
(上記は別indexにしたほうが便利)

806名無しさん@そうだ選挙にいこう:2006/11/01(水) 00:38:08
バカばっかりだな
807名無しさん@そうだ選挙にいこう:2006/11/01(水) 07:51:03
自己紹介乙
808名無しさん@そうだ選挙にいこう:2006/11/01(水) 11:06:30
>>804
何を必死になってるのか知らんがファイル名のみで検索するオプションなんて
どんなファイラーの検索コマンドにもあるぞ。
フォルダ名を含むか含めないか選択させればいいだけの話だろ?
809名無しさん@そうだ選挙にいこう:2006/11/03(金) 21:13:07
804はアンチが煽り失敗したようにみえるよな
かいたときはみんな賛同してくれると思ってたんじゃないかな
810名無しさん@そうだ選挙にいこう:2006/11/03(金) 22:45:59
もうVistaの検索でいいやん。
お前らも次PC買い換えるときはVista入ってるだろ。
セットアップしたら有無を言わさずインデックス作成してくれてるよ。
811名無しさん@そうだ選挙にいこう:2006/11/03(金) 23:42:19
宣伝乙
812名無しさん@そうだ選挙にいこう:2006/11/24(金) 14:44:37
超漢字V
(p)http://www.amazon.co.jp/gp/product/B000IOF66G/sr=8-2/qid=1164097185/

商品紹介
Windows上で動くTRONソフト。
OS切替もスムーズでデータのやり取りもらくらく操作。
プリンタやネットワークなど対応周辺機器も大幅に増加。
メニュー操作でインストールも超簡単。
813名無しさん@そうだ選挙にいこう:2006/11/24(金) 15:24:22
社員乙
814名無しさん@そうだ選挙にいこう:2006/12/04(月) 08:21:32
815名無しさん@そうだ選挙にいこう:2006/12/04(月) 22:55:26
>>814
この記事は一太郎とWEB検索との連動についての記事。
CSはデスクトップサーチだから関係ない。
816名無しさん@そうだ選挙にいこう:2006/12/06(水) 03:33:18
これはどうよ。

全文検索エンジン「JiroSearch」がGPLで公開
http://slashdot.jp/developers/06/12/01/1414210.shtml
817名無しさん@そうだ選挙にいこう:2006/12/08(金) 17:52:04
>>816
ジローサーチ?次郎さんが開発したのか?
818名無しさん@そうだ選挙にいこう:2006/12/09(土) 12:17:30
サーチクロスって起動して即フリーズ。
なんだよ、この糞ソフト。
アンインストールも上手く出来ないし。糞過ぎるぞ。
819名無しさん@そうだ選挙にいこう:2006/12/09(土) 13:15:32
>>818
割ったやつだからじゃないの?
820名無しさん@そうだ選挙にいこう:2006/12/09(土) 15:04:41
>>819
金払ってるワイ。
貧乏割れ厨と一緒にすんな。ここはビジネスsoft板だ、経費だよ、経費。つーても2000円程度だったなw
金ならある、まともな検索ソフト教えれ。
821名無しさん@そうだ選挙にいこう:2006/12/09(土) 15:07:03
茨城県
822名無しさん@そうだ選挙にいこう:2006/12/09(土) 16:26:17
>>820
普通に使えてる人もいるしPC環境のせいでは?

823名無しさん@そうだ選挙にいこう:2006/12/09(土) 20:35:20
818はただのアンチだろ
824名無しさん@そうだ選挙にいこう:2006/12/10(日) 00:57:39
>>818
> サーチクロスって起動して即フリーズ。

ありえねえし。どうせOSがMeかなんかだろ
825名無しさん@そうだ選挙にいこう:2006/12/10(日) 15:04:00
Copernic Desktop Search 2のバージョンが2.02になったみたい。変更点は以下の模様

Changes & improvements
Toolbar now compatible with Firefox 2.0
Improved previewing of plain text email messages
Improved plug-in support

Fixes
Fixed index update issues with non-permanently connected network drives
Other stability and performance tweaks
826818:2006/12/10(日) 17:48:52
>>824
インスコ直後は普通に使えていたんだけど、そのうちに起動しても枠だけ表示されてボタンとかが全く表示されなくなった。
これは最小化してから元のサイズに戻すと表示されていたので使えてた。
その後は起動直後にフリーズ。インデックスが大きすぎたのかな??
結構、お気に入りのソフトなので使えれば使いたいですよ。
827名無しさん@そうだ選挙にいこう:2006/12/10(日) 20:42:24
> サーチクロスって起動して即フリーズ。
> なんだよ、この糞ソフト。
> アンインストールも上手く出来ないし。糞過ぎるぞ。

> 金払ってるワイ。
> 貧乏割れ厨と一緒にすんな。ここはビジネスsoft板だ、経費だよ、経費。つーても2000円程度だったなw
> 金ならある、まともな検索ソフト教えれ。

お気に入り、ねぇ……
828名無しさん@そうだ選挙にいこう:2006/12/10(日) 23:24:14
>>826
昔から、かわいさ余って憎さ百倍というじゃないか。
そういう人情の機微が分からないようじゃ、世渡りが大変だろうな。
829名無しさん@そうだ選挙にいこう:2006/12/11(月) 13:47:18
>>826
工作員乙
830名無しさん@そうだ選挙にいこう:2006/12/11(月) 14:00:34
>>826
いったんアンインスコすれば?
831名無しさん@そうだ選挙にいこう:2006/12/28(木) 11:50:12
うはwwwww Vistaの検索最強!wwwww
サーチクロスもGDSもイラネwwwwwww

ttp://www.asoopenschool.jp/column_vista1.htm
832名無しさん@そうだ選挙にいこう:2006/12/28(木) 17:44:53
JS検索ツール最強
検索するときに正規表現つかえるし。
833名無しさん@そうだ選挙にいこう:2006/12/28(木) 20:03:47
>>831
Docuworksに対応してない。






終了
834名無しさん@そうだ選挙にいこう:2006/12/28(木) 20:06:50
あれ、インデックスサービスのフィルタ使えないの?
835名無しさん@そうだ選挙にいこう:2007/01/08(月) 07:04:04
秀丸エディタでGREP検索
これ最強
836名無しさん@そうだ選挙にいこう:2007/01/11(木) 15:47:08
秀丸って検索遅くない?
837名無しさん@そうだ選挙にいこう:2007/01/12(金) 21:07:41
そうでもないか。
838名無しさん@そうだ選挙にいこう:2007/01/15(月) 18:17:54
Grepなんか使えるか。1000や2000のドキュメントじゃないんだ。
839名無しさん@そうだ選挙にいこう:2007/01/19(金) 11:05:34
だれかHyperestraierでifilterを使えるようにしてくれないかな。
xdoc2txtだと漏れがある感じ。
840名無しさん@そうだ選挙にいこう:2007/01/22(月) 06:43:00
>>838
それでは、OS付属の検索使え

スタート→検索→ファイルやフォルダ

841名無しさん@そうだ選挙にいこう:2007/01/22(月) 07:14:55
>>839
ググれよ
842名無しさん@そうだ選挙にいこう:2007/01/31(水) 14:02:02
>>840
アフォ、それもGrepと同じじゃ
843名無しさん@そうだ選挙にいこう:2007/02/01(木) 10:56:17
Vistaの検索って結局どうなんだろう?
エクセルのセルに書いたのやPDFやXDWとかも大丈夫なんかな?
844名無しさん@そうだ選挙にいこう:2007/02/01(木) 12:26:13
ファイルのセキュリティ設定次第だろ
845名無しさん@そうだ選挙にいこう:2007/03/14(水) 22:38:15
age
846名無しさん@そうだ選挙にいこう:2007/03/23(金) 10:37:42
897 名前:名無しさん@お腹いっぱい。 投稿日:2006/10/12(木) 14:05:02 wcjlsRxk
プトレマイオス朝時代のエジプトには、当時世界最大の図書館「アレクサンドリア大図書館」があり、
70万もの蔵書を誇っていたという。
蔵書のほとんどは巻物だったが、1巻200ページ相当として、300dpiでスキャンした場合、1頁500KBとして
1巻100MB、それが70万巻ということは70TBか。
TeraStation 2TBを35台つなげればアレクサンドリア図書館に匹敵するデジタルアーカイブが完成するな。

文字数を見ると、1頁に2000文字のアルファベットが書き込めるとすると、
2000文字×200頁×70万=280,000,000,000文字の知識が詰まっていたということになる。
1文字1バイトなら280GB、UTF-8みたいに1文字3バイトなら840GBか。テキストだけ抜き出せば
個人のPCでも何とかなりそうだな。

さて、これを全文検索かけるとなるとNamazuの場合、対象ファイル数は90万弱が限界みたいだから
http://www.namazu.org/FAQ.html#index-scale
何とかなるかも。
Hyper Estraierの場合、
http://hyperestraier.sourceforge.net/uguide-ja.html#tips
にあるように「一つのインデックスに登録できる文書の総量の目安は、プレーンテキストなら300GB」
とのことなので、1文字1バイトならぎりぎりいけそう。UTF-8なら3つくらいにインデックスを分けて
P2P連係させないといけなくなる。
847名無しさん@そうだ選挙にいこう:2007/03/23(金) 11:16:06
やれば?
848名無しさん@そうだ選挙にいこう:2007/03/25(日) 18:56:34
MitakeSearchあぼーんだって
849名無しさん@そうだ選挙にいこう:2007/03/25(日) 22:28:19
>>846
あと20年もすれば一瞬で検索できるようになってる。
850名無しさん@そうだ選挙にいこう:2007/03/25(日) 23:25:49
まぁ机上の空論だがな
851名無しさん@そうだ選挙にいこう:2007/03/26(月) 13:19:04
違うだろw
覚えたてか?
852名無しさん@そうだ選挙にいこう:2007/03/28(水) 07:42:36
853名無しさん@そうだ選挙にいこう:2007/03/28(水) 09:17:05
何が言いたいんだ?
854名無しさん@そうだ選挙にいこう:2007/05/19(土) 21:51:53
IBM OmniFind Yahoo! Editionってどうよ?
855名無しさん@そうだ選挙にいこう:2007/06/18(月) 09:57:44
>>854
http://internet.watch.impress.co.jp/cda/news/2006/12/14/14241.html
> 推奨要件は3GHzの2プロセッサ、2GBのRAM、250GBのミラーハードディスクなどとなっている。

なにこれ?クライアント向けじゃないの?
856名無しさん@そうだ選挙にいこう:2007/06/18(月) 18:50:27
低スペック向けのソフトばかりじゃつまらんよ
857名無しさん@そうだ選挙にいこう:2007/06/19(火) 02:32:18
>>856
サーバーかクライアントの話だろ?
858名無しさん@そうだ選挙にいこう:2007/06/19(火) 18:06:22
>>857
>利用するための環境だが(ry
>Windows XP SP2、Windows Server 2003 SP1(ry
>ハードウェアの最小要件は1プロセッサ、1GBのRAM、80GBの空き領域、(ry

対象OSにXPが入っているからクライアント機で使えますよ。

まあ書いて有るように個人向けでは無く企業向けだけど。
859名無しさん@そうだ選挙にいこう:2007/06/19(火) 18:41:12
855はそういうことを言いたいんじゃないとおもうぞ
単に愚痴ってるだけじゃね?
860名無しさん@そうだ選挙にいこう:2007/07/02(月) 16:59:44
結局GDSのひとり勝ちか。もうこのスレの存在意義もなくなったな
861名無しさん@そうだ選挙にいこう:2007/07/02(月) 21:48:41
DesktopHEいいよ。

インデックスファイルの更新とメールへの対応をのぞけば
サーチクロスと同等かそれ以上。
862名無しさん@そうだ選挙にいこう:2007/08/08(水) 15:51:47
namazu以外でもっとこう簡単に全文検索サーバって立てられないのかね。
GDSはバージョンアップでDNKA(だっけ?)が使えなくなっちゃうし。

手軽におひすでフルテキスト検索サーバを立てたいんだよ俺は
863名無しさん@そうだ選挙にいこう:2007/08/09(木) 14:17:40
HE
864名無しさん@そうだ選挙にいこう:2007/08/13(月) 01:56:48
DesktopHE(・∀・)イイ!!微妙にアップデートしとる。
865名無しさん@そうだ選挙にいこう:2007/08/19(日) 00:14:41
OEに未対応じゃん>デスクトップHE
866名無しさん@そうだ選挙にいこう:2007/08/19(日) 00:54:18
OEなんか使うなよ……
867名無しさん@そうだ選挙にいこう:2007/08/26(日) 23:49:33
DesktopHEスゴいね。
これで、変更があった部分のみのインデックスの差分更新が
出来るようになったらサーチクロスを完全に喰ってしまうんでないかい?
868名無しさん@そうだ選挙にいこう:2007/08/27(月) 22:44:50
>>867
DesktopHEのインデックスは変更のあった部分だけだと思うぞ。
GUIでかったりぃーと思うなら,直接”estcmd”にオプション付けたbatにすればよい
ここを参考に
http://hyperestraier.sourceforge.net/uguide-ja.html

本家のゲストブックから受売りだけど,うちの例

インデックスする
estcmd gather -il ja -sd -cm -pc CP932 -lf 8 "インデックス作りたいパス”
複数ある場合は,繰返し書けばいいと思う,
直列でかける区切りは知らん(セミコロンとかやったけど,並列で動いたので未確認)

消した物は消す
estcmd purge -pc CP932 "インデックスのパス"

キーワード抽出する
estcmd extkeys -um "インデックスのパス"

最適化する
estcmd optimize "インデックスのパス"

これをコマンドランチャーから気が向いたときに,バックグラウンドで実行してる。
869名無しさん@そうだ選挙にいこう:2007/08/27(月) 23:34:14
>>868
> 消した物は消す
> estcmd purge -pc CP932 "インデックスのパス"

↑これってやらないかんものなの?
俺はestcmd gather だけで新規作成、更新も済まして、週一でoptimizeかけてんだけど
870名無しさん@そうだ選挙にいこう:2007/08/28(火) 02:17:47
>>869
つ込まれても困るが,

こちらの環境では一瞬なので無視してます。(へたれ)
871名無しさん@そうだ選挙にいこう:2007/08/28(火) 21:20:21
>>868-869
ありがとう。知らなかった。
よく分からないので毎回インデックス削除して、再作成していたよ(´Д`;)
872名無しさん@そうだ選挙にいこう:2007/09/13(木) 05:28:46
DesktopHE使ってみた。
ツール構成がシンプルでいいね。

残念なのがxdoc2txtでうまく内容を拾えないpdfがあること。
ScanSnapの付属ツールScanSnapOrganizerでOCRしたpdfの中に
xdoc2txtでテキストが抽出できるものとできないものがあって
その境界がよくわからん……。(xdoc2txt単体で試してみた)

GDSでも透明テキスト付pdfの一部でやはりうまく内容が拾い出せないし
WDS3.0はiFilterとの連携がうまく作動しないし(俺の環境が悪そう)
WDS2.6はpdfに関しては問題ないけど検索精度が悪すぎる。

透明テキスト付pdfをきちんと利用できる環境が整わなん。
873名無しさん@そうだ選挙にいこう:2007/09/14(金) 00:37:32
ウチの環境(Win XP x64), WDS3.0, Acrobat Pro 7 (現在Pro 8)で、
透明テキスト付pdfの全文検索できてますよ。

pdfファイルはWDSのプレビューペインで表示されずに、直接Acrobat
で開きますが。

それに、たまにインデクスしないpdfファイルもあるけど(ネットで拾ってきた
やつ)。なぜか、MicrosofのOOXML仕様書のpdfファイルがWDSで
インデクスされないんだよね。
874872:2007/09/14(金) 12:45:46
64bitのpdf用iFilterあったんか、と思って調べたら
FoxitReaderのiFilterがあるんだね。
うちは32bitXPだけどadobeのからこれに入れ替えてインデックス作り直したら
WDS3.0でもうまく透明テキスト付pdfの内容が拾えるようになったよ。
ヒントをくれた873氏、ありがとう。
875名無しさん@そうだ選挙にいこう:2007/09/14(金) 18:29:28
アドビ以外で作られたPDFも必要なら
NAMAZUとかで自分で設定しないとダメ
一般向けのソフトでは対応がマチマチ
876名無しさん@そうだ選挙にいこう:2007/09/19(水) 13:37:17
xdoc2txtがいまいちすぎる

ソースよこせば改造してやるのに
877名無しさん@そうだ選挙にいこう:2007/09/19(水) 14:16:31
xpdfを使え。
878名無しさん@そうだ選挙にいこう:2007/09/23(日) 12:31:59
DesktopHE使ってみた。
検索結果当初は良い感じだけど、安定して動作しないことない?

フォルダ名の最後が"表"(別の漢字だったかも。うろ覚え)で終わるフォルダは
gather時に全てエラーが発生してインデックスが作れなかったり
正常にインデックス作成できた分も1月ぐらいするとインデックスが壊れちゃったりした。
repairすると復旧できるようになるけど、漏れる率がだいぶ上がっちゃうし。

ちなみに対象ファイルは80Gバイトの100万ファイルぐらい。
うちのPCが不安定なのが悪いのかな〜
879名無しさん@そうだ選挙にいこう:2007/09/25(火) 17:41:17
試しにやってみたけど
きちんとインデックス作れたよ
1TBをインデックスしてるけど
特に不安定とは感じたことないな
880名無しさん@そうだ選挙にいこう:2007/10/13(土) 10:16:45
サーチクロスなんだけど
二つのエクセルシートへ
100000-1で検索すると
-1以外も検索され
ちゃうんだけど
7箇所ヒット!俺だけ?

ファイル1 ファイル2
100000-3  100000-3
100000-2  100000-2
100000-4  100000-4
100000-1
100000-6  100000-6
100000-0  100000-0
100000-5  100000-5
881名無しさん@そうだ選挙にいこう:2007/10/20(土) 13:51:10
DesktopHEのインデックス
早いね
882名無しさん@そうだ選挙にいこう:2007/10/20(土) 14:06:00
>>880
試したけど
そんな風にならんかったよ
883名無しさん@そうだ選挙にいこう:2007/10/21(日) 09:29:31
>>882
ビュアーをテキストでなく
OLEにするとダメみたい
884名無しさん@そうだ選挙にいこう:2007/11/11(日) 18:26:29
Vistaの検索使えあげ
885名無しさん@そうだ選挙にいこう:2007/11/15(木) 07:12:42
>>884
あれ使い物にならん。
結局、従来のインデックスサービス使ってる。
886名無しさん@そうだ選挙にいこう:2007/12/08(土) 16:46:12
>>885
どの辺がだめ?
887名無しさん@そうだ選挙にいこう:2008/01/18(金) 14:04:36
ネタないねあげ
888名無しさん@そうだ選挙にいこう:2008/02/11(月) 02:52:53
>>886
検索結果にノイズ多すぎ。
全然関係無いものばっかり引っかかる。
詳しいドキュメントも持って無いから細かい設定法もわからん。
従来のインデックスサービスのほうがよっぽど役に立つ。

従来のインデックスサービスについてなら
レジストリの設定法まで載ってる詳しいドキュメントを持ってるから
うまく使いこなせるが
Vista検索の詳しいドキュメントを持ってないから使いこなせてないだけかもしれないが、
そういう詳細な日本語ドキュメントを用意してないMSが悪いとも言える。
889名無しさん@そうだ選挙にいこう:2008/02/11(月) 10:57:43
ノイズが多いのは単にお前が使えてないだけだ
890名無しさん@そうだ選挙にいこう:2008/02/28(木) 13:11:23
DesktopHEでファイルサイズとテキストサイズの上限を調整する方法教えてくれよ。
891名無しさん@そうだ選挙にいこう:2008/02/28(木) 17:53:14
公式のBBSできいたら?
892名無しさん@そうだ選挙にいこう:2008/02/28(木) 18:39:00
>>890
本家のBBSからメモっておいたもの デフォは128KBらしい

>[設定]-[上級者向けインデックス設定]の
>「テキスト、HTML、MIMEファイルインデックスコマンド」に文字列を追加してください。
>ファイルの先頭512KBまでを解析させたいのであれば、「-lt 512」
>という文字列を追記してください。
> 数値にマイナスの値を指定すると、無制限になりますが、
>インデックス時にメモリ容量が足りなくなる可能性があります。
893名無しさん@そうだ選挙にいこう:2008/03/24(月) 03:17:03
DesktopHE使ってみたがいい感じ。
サーチクロスから変えたいけど個人的に検索結果がまだ若干悪いのが惜しすぎる
894名無しさん@そうだ選挙にいこう:2008/03/24(月) 20:13:06
俺は画像とテキスト文書の検索にしか使わないんだが、
グーグルのは巨大テキストファイルは文の後半を読まない。
MSのは検索精度は相当優れているんだが、ビュワーが遅い遅い。
画像管理ならPICASAが相当早くて最強なんだが日本語検索が
まったく使い物にならない。

てことで今はCOPEMIC使ってます。
まあこれも検索精度の点じゃMSのより不満があるけど、ユーザーインターフェース、
速度、機能のバランスが一番いいかな。
895名無しさん@そうだ選挙にいこう:2008/03/24(月) 20:13:57
COPERNICの間違い
896名無しさん@そうだ選挙にいこう:2008/03/25(火) 13:09:49
COPERNICは日本語が弱いんだよねえ。
ファイル名ならひっかかるけど、内容はまったく無視。
897名無しさん@そうだ選挙にいこう:2008/03/25(火) 21:50:44
グーグルは後半も読むでしょ
898名無しさん@そうだ選挙にいこう:2008/03/26(水) 02:48:35
>>897
サイズ制限なかったっけ?
899名無しさん@そうだ選挙にいこう:2008/03/26(水) 03:09:40
COPERNIC日本語引っかかるぞ?
900名無しさん@そうだ選挙にいこう:2008/03/27(木) 11:19:11
>>896
んなこたーないぞ?
俺の環境では。
メールの文字は化けてるけどね
901名無しさん@そうだ選挙にいこう:2008/03/27(木) 11:52:16
文字化けするなら日本語弱いと言われても仕方ないのでは・・・。
902名無しさん@そうだ選挙にいこう:2008/03/27(木) 12:31:46
>>901
は?わざとやってんのか?
903名無しさん@そうだ選挙にいこう:2008/04/06(日) 11:55:35
>>902
わざとってなにを?
904名無しさん@そうだ選挙にいこう:2008/04/06(日) 13:37:14
902「わざと文字化けしてんのか?」
905名無しさん@そうだ選挙にいこう:2008/04/06(日) 19:44:15
>>900
それで本文引っかかる?
引っかかっても文字化けして読めないなら
あまり意味が無いと思うけど・・・

906名無しさん@そうだ選挙にいこう:2008/04/06(日) 21:08:31
>>905
導入してみればええやん
結論から言うとかかるし読める
907名無しさん@そうだ選挙にいこう:2008/04/06(日) 22:02:57
900の環境だけで文字化けするなら
一行目は変じゃね?
908名無しさん@そうだ選挙にいこう:2008/04/08(火) 20:20:51
GoogleデスクトップがVer5になってるけど、結局全文検索ならぬ先頭検索?
909名無しさん@そうだ選挙にいこう:2008/04/08(火) 22:12:48
yes
910名無しさん@そうだ選挙にいこう:2008/04/08(火) 22:38:59
高須
911名無しさん@そうだ選挙にいこう:2008/04/08(火) 23:01:11
HIT率が一番良いのはWDSなんだよなぁ
重いけど
912名無しさん@そうだ選挙にいこう:2008/04/09(水) 00:21:50
こんなん出てた。
全文検索エンジンLux
http://luxse.sourceforge.net/

ToDo のところに
# 削除・更新
# 全角半角かなの同一視
とか書いてあるあたり見ると、まだ全然未完成みたいだけど。
913名無しさん@そうだ選挙にいこう:2008/04/09(水) 00:24:47
Linux 板と間違えた
誤爆スマソ
914名無しさん@そうだ選挙にいこう:2008/05/12(月) 12:11:44
◆ハードディスクD ドライブの中のフォルダ D:¥txt 内にある10個のサブ
フォルダ txt01〜txt10 に散らばって保存してある文書ファイル計814本の中から、
「恐慌」の文字列を持つファイルを全て検索する grep のテスト結果
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
EmEditor professional  1秒以内 (マッチした件数を表示しない)
EdTex Editor        2秒以内 (マッチした件数を表示しない)
WZ Editor         3秒以内 (2件ありました、と表示する)
NotePad++         3秒以内 (find result-2 hits、と表示する)
915名無しさん@そうだ選挙にいこう:2008/05/12(月) 20:01:24
>>914 訂正です
◆ハードディスクD ドライブの中のフォルダ D:¥txt 内にある10個のサブ
フォルダ txt01〜txt10 に散らばって保存してある文書ファイル計814本の中から、
「恐慌」の文字列を持つファイルを全て検索する grep のテスト結果
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
EmEditor professional   1秒以内 (マッチした件数を表示しない)
EdTex Editor         1・5秒以内 (検索ファイル数とマッチ数を表示する)
WZ Editor           3秒以内 (2件ありました、と表示する)
NotePad++          3秒以内 (find result-2 hits、と表示する)
916名無しさん@そうだ選挙にいこう:2008/05/12(月) 20:39:51
Linux 板にでもどうぞ
917名無しさん@そうだ選挙にいこう:2008/05/15(木) 15:16:28
>>914
参考にはなる人もいるかもしれんがスレ違いだから
出来たら書き込む前にテンプレ読んでくれ
918名無しさん@そうだ選挙にいこう:2008/05/19(月) 07:52:26
DesktopHE使い始めたんですけど、
テキストファイルの内容だけじゃなくて、
ファイル名にもヒットするようにできないんでしょうか?
919名無しさん@そうだ選挙にいこう:2008/05/19(月) 09:48:58
できる
920名無しさん@そうだ選挙にいこう:2008/05/19(月) 13:18:57
>>919
どうしたらいいですか?
特にDesktopHEって設定項目が少ない上にヘルプも貧弱で良く分かりません・・・
921名無しさん@そうだ選挙にいこう:2008/05/19(月) 22:39:39
>>920
公式サイトの「使い方 検索」
http://freemind.s57.xrea.com/desktophe/
922名無しさん@そうだ選挙にいこう:2008/05/20(火) 07:01:14
>>921
すみません言葉足らずだったかも知れません
name:を用いた検索だと、txtやxlsなどは出てきても
mpgやaviなどが検索できないのです
そういうのも検索したいのですが・・・
923名無しさん@そうだ選挙にいこう:2008/05/20(火) 22:15:59
だからググれよ
ここを特定のサポート代わりにつかわないでくれ。

せめて有益な情報もかいてあれば
別なんだが・・・
レビューとかさ
924名無しさん@そうだ選挙にいこう:2008/05/21(水) 05:29:25
ググってもでてこねいな
俺も知りたいから教えてくれ
925名無しさん@そうだ選挙にいこう:2008/05/21(水) 11:53:33
テキストファイルとみなせばいいんじゃね?
926名無しさん@そうだ選挙にいこう:2008/05/21(水) 14:37:40
>>925
kwsk
927名無しさん@そうだ選挙にいこう:2008/05/21(水) 22:32:02
お前ら優しいな
928名無しさん@そうだ選挙にいこう:2008/05/22(木) 00:01:12
やってみたけどできないな
うまく行った人いたら詳しく教えて
929名無しさん@そうだ選挙にいこう:2008/05/22(木) 01:31:17
>>926
インデックス設定でテキスト〜に対象拡張子を追加

>>928
試しにやってみたが一応出来た。
930名無しさん@そうだ選挙にいこう:2008/05/22(木) 09:17:06
*.c *.cpp *.pl *.py *.cgi *mpg *.avi *.zip *.rar *.lzh *.mp3
こんなふうにやってるんだがうまくいかんな
一回インデックス消して作り直さないとだめなのかな
931名無しさん@そうだ選挙にいこう:2008/05/22(木) 10:46:07
>>930
ちゃんと公式サイトの解説読め
932名無しさん@そうだ選挙にいこう:2008/05/22(木) 22:04:48
教えて君に関わるとろくなことにならないな・・・

>>930
なんでまだ質問するの?
933名無しさん@そうだ選挙にいこう:2008/05/25(日) 20:47:49
俺もうまくいかね
934名無しさん@そうだ選挙にいこう:2008/05/26(月) 01:38:10
*
935名無しさん@そうだ選挙にいこう:2008/05/26(月) 12:06:02
公式サイトすら読まない馬鹿ばっかだな
936名無しさん@そうだ選挙にいこう:2008/05/26(月) 15:30:45
公式サイトがわかりにくいからしょうがないよ
937名無しさん@そうだ選挙にいこう:2008/05/26(月) 15:41:44
あれ分かりにくいとか、どんだけゆとりだよw
938名無しさん@そうだ選挙にいこう:2008/05/26(月) 16:24:56
公式サイト云々言ってる奴はバカだな
このスレの意味ねーだろ
939名無しさん@そうだ選挙にいこう:2008/05/26(月) 18:05:30
( ´,_ゝ`)プッ
940名無しさん@そうだ選挙にいこう:2008/05/26(月) 18:27:30
俺も公式は分かりにくいと思うわ
肝心なことがきちんと記述されていない
せめてヘルプぐらいつけろと
941名無しさん@そうだ選挙にいこう:2008/05/26(月) 18:54:07
>>940
肝心なことって何?
942名無しさん@そうだ選挙にいこう:2008/05/26(月) 20:23:54
上級者向け設定の項目とか、上でも出てる拡張子の書式とか
肝心なことはなーんも書いてないやん
もう少しマジメにヘルプ書けと
943名無しさん@そうだ選挙にいこう:2008/05/26(月) 21:16:50
>>942
日本語読めないの?
944名無しさん@そうだ選挙にいこう:2008/05/26(月) 21:20:31
確かに書いてないな
945名無しさん@そうだ選挙にいこう:2008/05/26(月) 21:22:09
煽ってる暇があったらよ〜く理解なさってる>>943先生がヘルプ作ってやれよ
946名無しさん@そうだ選挙にいこう:2008/05/26(月) 21:25:02
>>945
ほれ
http://freemind.s57.xrea.com/desktophe/manual01_index.html

まぁ、俺が書いたんじゃないけどな
947名無しさん@そうだ選挙にいこう:2008/05/26(月) 21:28:50
書いてねえじゃん
948名無しさん@そうだ選挙にいこう:2008/05/26(月) 21:29:43
こんなマイナーなソフトを使えるぐらいで優越感を持たれても失笑しか出てこんあ
949名無しさん@そうだ選挙にいこう:2008/05/26(月) 21:30:08
>>946
確かに書いてないな
950名無しさん@そうだ選挙にいこう:2008/05/26(月) 21:31:43
>>949
そうだね
951名無しさん@そうだ選挙にいこう:2008/05/26(月) 21:32:36
プロテインだね
952名無しさん@そうだ選挙にいこう:2008/05/26(月) 21:44:21
>>948
こんな単純なソフトすら使えない人って…
953名無しさん@そうだ選挙にいこう:2008/05/26(月) 21:52:54
>>952
悔しかったの?
954名無しさん@そうだ選挙にいこう:2008/05/26(月) 21:58:01
>>952
俺はバカでいいから上級インデックス設定についてヘルプ書いてくれよ
単純なソフトなんだからすぐ書けるよね?
955名無しさん@そうだ選挙にいこう:2008/05/26(月) 22:06:13
>>954
ヘルプなら既にあるじゃん
956名無しさん@そうだ選挙にいこう:2008/05/26(月) 22:13:35
>>954
■DesktopHE -Hyper Estraierを使用したWindows用デスクトップ検索ツール-
http://freemind.s57.xrea.com/desktophe/
■使い方 インデックス作成
http://freemind.s57.xrea.com/desktophe/manual01_index.html
■使い方 検索
http://freemind.s57.xrea.com/desktophe/manual02_search.html
957名無しさん@そうだ選挙にいこう:2008/05/26(月) 22:15:14
お前ら優しすぎ
958名無しさん@そうだ選挙にいこう:2008/05/26(月) 22:48:37
>>954
上級設定知りたいならこっち読むといいよ

全文検索システム Hyper Estraier
http://hyperestraier.sourceforge.net/
959名無しさん@そうだ選挙にいこう:2008/05/27(火) 12:09:22
やっぱりDesktopHEをちゃんと理解してる人はいないみたいだな
960名無しさん@そうだ選挙にいこう:2008/05/27(火) 13:31:14
なんでこのスレって煽り口調の人が多いの?
961名無しさん@そうだ選挙にいこう:2008/05/27(火) 13:45:52
>>959
インデックス対象の種類を追加するとか基本的な使い方なら
本家のページさえ読めば書いてあるからできるはずなんだけどね。
出来ない人は読んでないか本当に日本語を理解できないか
ただの荒らしかだろう
962名無しさん@そうだ選挙にいこう:2008/05/27(火) 17:03:00
対称の拡張子を追加するってのやってみたんだが、
estcmd I/O errorってなってうまくいかないのが既出?
963名無しさん@そうだ選挙にいこう:2008/05/27(火) 17:04:55
estcmd: ERROR: .cpp: I/O problem
こんなかんじな
964名無しさん@そうだ選挙にいこう:2008/05/27(火) 20:29:55
で、すべてのファイル名を検索するには?
965名無しさん@そうだ選挙にいこう:2008/05/27(火) 23:08:30
>>964
CDSかGDSかWDS使えばおk
966名無しさん@そうだ選挙にいこう:2008/05/28(水) 00:05:43
>>964
犬呼べよ
967名無しさん@そうだ選挙にいこう:2008/05/28(水) 01:27:18
CDSかGDSかWDSを使いたくないからDesktopHE使ってるんじゃないの
968名無しさん@そうだ選挙にいこう:2008/05/28(水) 02:34:12
次スレ

全文検索ユーティリティ統一スレッド part4
http://pc11.2ch.net/test/read.cgi/bsoft/1211909584/
969名無しさん@そうだ選挙にいこう:2008/05/28(水) 23:51:51

だが早すぎではなかろうか
970名無しさん@そうだ選挙にいこう:2008/05/29(木) 09:04:39
半年早いと思う
971名無しさん@そうだ選挙にいこう:2008/05/29(木) 10:46:56
>>968
972名無しさん@そうだ選挙にいこう:2008/05/30(金) 15:19:44
2ちゃんねるスレッド全文検索・・・ThreadSearch
http://pc11.2ch.net/test/read.cgi/software/1204107839/
973名無しさん@そうだ選挙にいこう:2008/05/31(土) 01:58:04
Janeの標準ログ検索でデスクトップサーチ使えるぜ。

WDS使用
【54 件見つかりました】(検索時間:5秒)

WDS未使用
【78 件見つかりました】(検索時間:89秒)
974名無しさん@そうだ選挙にいこう:2008/06/02(月) 13:47:43
WDS3.1って検索精度低い?
関係ないファイルまでヒットしまくるんだけど
975名無しさん@そうだ選挙にいこう:2008/06/02(月) 14:40:34
パスが検索対象になってるからか・・・
これOFFにできないのか

例)D:\マニュアル\デジカメ\CANON EOS 5D.pdf
キーワード:"マニュアル"
ヒット結果:CANON EOS 5D.pdf
976名無しさん@そうだ選挙にいこう:2008/06/03(火) 00:08:04
>>973
Janeで一つのレスの中に指定した複数のワードが含まれてるレスを
全文検索する方法なんて無いかな?
977名無しさん@そうだ選挙にいこう:2008/06/03(火) 17:21:29
janeでやるしかないんじゃないかな?
978名無しさん@そうだ選挙にいこう:2008/06/04(水) 09:11:11
>>977
Janeではできないぞ?
一つのスレの中に単語が含まれてるかどうかを検索するだけで、レスの中に含まれるかの
判断はしない。
979名無しさん@そうだ選挙にいこう:2008/06/04(水) 10:11:07
出来るよ
全部のjaneで出来るかは分からないけど
980名無しさん@そうだ選挙にいこう:2008/06/04(水) 19:42:51
OpenJaneDoeだとできない。
JaneDoe Viewだとできる。
981名無しさん@そうだ選挙にいこう:2008/06/05(木) 18:25:14
Jane Styleでも出来るね
982名無しさん@そうだ選挙にいこう:2008/06/05(木) 23:59:24
>>981
えっ?俺Jane Doe Style使ってるけどできないぞ?
983名無しさん@そうだ選挙にいこう:2008/06/06(金) 11:55:39
ログから検索(G)じゃだめ?
984名無しさん@そうだ選挙にいこう:2008/06/07(土) 01:48:44
>>982
やり方がまちがってるんじゃね?
985名無しさん@そうだ選挙にいこう:2008/06/07(土) 09:30:07
>>983
それは指定したキーワードが「スレ」に含まれているかどうかを検索するんでしょ?
俺が言ってるのは「レス」
986名無しさん@そうだ選挙にいこう:2008/06/07(土) 11:51:07
>>985
実際に使ってから出直してこい
987名無しさん@そうだ選挙にいこう:2008/06/07(土) 12:12:52
>>985
レス単位でも出来ますよ

988名無しさん@そうだ選挙にいこう:2008/06/07(土) 12:51:38
ごめん。できた。
通常検索じゃなくて、マルチワードにしないと駄目なんだな。
ありがとう。

あと半年もたす予定のスレを13も減らしてすまってほんっとすまん。
989名無しさん@そうだ選挙にいこう:2008/06/07(土) 16:22:34
最後はどうでもよくね?
990名無しさん@そうだ選挙にいこう:2008/06/07(土) 17:22:20
次スレ

全文検索ユーティリティ統一スレッド part4
http://pc11.2ch.net/test/read.cgi/bsoft/1211909584/
991名無しさん@そうだ選挙にいこう:2008/06/07(土) 20:02:40
>ビジネスでもプライベートでも必須の環境となりつつあります。
テンプレのこういう書き方はどうかとおもうけど・・・
992名無しさん@そうだ選挙にいこう:2008/06/07(土) 20:08:51
>>991
聖書読んだことあるか?ひどいぜ。
993名無しさん@そうだ選挙にいこう:2008/06/07(土) 21:27:40
毎日 全文検索してる人はほとんどいないんじゃないかな
一週間、一月単位でもね
994名無しさん@そうだ選挙にいこう
基本フォルダ分けしてるから毎日は使わないけど、
どこに入れたか思い出せないときとか
1週間に1回ぐらいの頻度では使うかな俺は。