1 :
デフォルトの名無しさん:
あーゆーのってどういう言語で作るんですか?
素人でも作れるんですか?
プログラム詳しい方、教えてちょんまげ〜〜〜
利用することもできんやつには作れん。
-----------------------終了-----------------------
3 :
デフォルトの名無しさん:2001/05/27(日) 06:07
まずは仕様がはっきりしないとわかんないよ。
ローカルのgrepなのか、インデックス付の高速なものなのか、
webの特定サイト内のものなのか
webを巡回してデータをかき集めるようなものなのかとか
4 :
デフォルトの名無しさん:2001/05/27(日) 06:08
プログラミング言語はあまり関係ないと思う。むしろ
- データからキーワードを抽出するための自然言語の理論
- 適切な重み付けを行うための数学
- 大量のデータから適切なデータを検索するためのデータベースシステム
の方が重要でしょ。簡単なサイトなら、フリーソフトウェアの namazu なんかを使
えば作れる。
>>2 ワラタ
5 :
1じゃないよ:2001/05/27(日) 07:06
http://www.nda.co.jp/himichu/2.htmlから抜粋 「るるる」の開発は、Winsock2の練習が はじまりだ。
ある日本のNIC機関に、いろいろと ポートを開けて パケットを送るソフトの実験をしているとき、
「なんだよ これなら検索エンジンができるじゃん」
とわかり開発を開始。
infoseek並みの スパイダー能力と AltaVista と同等の高速インデックス検索能力を有するまでに、1週間とかからなかった。
1677万件のURLインデックスサーチに i486-66MHzで 0.03秒(31ms)である。
すでに「誰かがやっている」という「メタ情報」が 私にはあったから、最初に それを実現した彼らと 対等に語るのはフェアではない。
しかし、これは TCP/IP制御の「練習中」の産物である。
しかも、インターネットをはじめて 1年も経たぬ私ができるのである。
これこそ「練習中」という「基礎研究=応用研究のかたまり」のような作業で作られた証明だ。
んー、これってどういう話なんだ?
Web pageを巡回してキャッシュから検索ってわけじゃなさそうだし。
誰か解説キボソ。
∧∧ ┌─────────────
( ´ー`) < 1の身内はイネエカーヨ?
\ < └───/|────────
\.\______//_______
\ ∧∧ <イネエカーヨ?
∪∪(´ー`)_/| ̄ ̄ ̄
UU-uU
9 :
なもし:2001/05/30(水) 04:01
∧∧ ┌─────────────
( ´ー`) < なもし?
\ < └───/|────────
\.\______//_______
\ ∧∧ <なもし?
∪∪(´ー`)_/| ̄ ̄ ̄
UU-uU
10 :
デフォルトの名無しさん:
検索するための元データ収集プログラムの情報希望
Spiderとか?