検索エンジンを作りたい!!

このエントリーをはてなブックマークに追加
1デフォルトの名無しさん
あーゆーのってどういう言語で作るんですか?
素人でも作れるんですか?

プログラム詳しい方、教えてちょんまげ〜〜〜
2デフォルトの名無しさん:2001/05/27(日) 06:05
利用することもできんやつには作れん。


-----------------------終了-----------------------
3デフォルトの名無しさん:2001/05/27(日) 06:07
まずは仕様がはっきりしないとわかんないよ。
ローカルのgrepなのか、インデックス付の高速なものなのか、
webの特定サイト内のものなのか
webを巡回してデータをかき集めるようなものなのかとか
4デフォルトの名無しさん:2001/05/27(日) 06:08
プログラミング言語はあまり関係ないと思う。むしろ

- データからキーワードを抽出するための自然言語の理論
- 適切な重み付けを行うための数学
- 大量のデータから適切なデータを検索するためのデータベースシステム

の方が重要でしょ。簡単なサイトなら、フリーソフトウェアの namazu なんかを使
えば作れる。

>>2
ワラタ
51じゃないよ:2001/05/27(日) 07:06
http://www.nda.co.jp/himichu/2.htmlから抜粋


「るるる」の開発は、Winsock2の練習が はじまりだ。
ある日本のNIC機関に、いろいろと ポートを開けて パケットを送るソフトの実験をしているとき、

「なんだよ これなら検索エンジンができるじゃん」

とわかり開発を開始。
infoseek並みの スパイダー能力と AltaVista と同等の高速インデックス検索能力を有するまでに、1週間とかからなかった。
1677万件のURLインデックスサーチに i486-66MHzで 0.03秒(31ms)である。
すでに「誰かがやっている」という「メタ情報」が 私にはあったから、最初に それを実現した彼らと 対等に語るのはフェアではない。
しかし、これは TCP/IP制御の「練習中」の産物である。
しかも、インターネットをはじめて 1年も経たぬ私ができるのである。
これこそ「練習中」という「基礎研究=応用研究のかたまり」のような作業で作られた証明だ。


んー、これってどういう話なんだ?
Web pageを巡回してキャッシュから検索ってわけじゃなさそうだし。
誰か解説キボソ。
6デフォルトの名無しさん:2001/05/27(日) 07:51
   ∧∧     ┌─────────────
  ( ´ー`)   < 1の身内はイネエカーヨ?
   \ <     └───/|────────
    \.\______//_______
      \    ∧∧ <イネエカーヨ?
       ∪∪(´ー`)_/| ̄ ̄ ̄
            UU-uU
7Anonymous:2001/05/27(日) 10:47
>>1 >>4
Linux板から出張じゃ

Linux板にはnamazuを利用したものが既にweb上で稼動しているぞ
http://cocoa.2ch.net/test/read.cgi?bbs=linux&key=989179375
8デフォルトの名無しさん:2001/05/27(日) 12:50
「全文検索 技術と応用」
http://shopping.yahoo.co.jp/shop?d=jb&id=30481967
 内容が古いけど、基礎からどーぞ。
言語は何でもいいよ。
9なもし:2001/05/30(水) 04:01

   ∧∧     ┌─────────────
  ( ´ー`)   < なもし?
   \ <     └───/|────────
    \.\______//_______
      \    ∧∧ <なもし?
       ∪∪(´ー`)_/| ̄ ̄ ̄
            UU-uU
10デフォルトの名無しさん
検索するための元データ収集プログラムの情報希望
Spiderとか?