自宅サーバーの底力。。。

このエントリーをはてなブックマークに追加
1MYFILER.NET
はじめまして。MYFILER.NETをはじめました。
詳細は、http://www.myfiler.net/
現在、どこにでもありそうな検索エンジンっす。
というか、自宅サーバーでロボット型の検索エンジンはスペック的に
無理がある!絶対ある。実際ある。
そこで、賛同者の自宅サーバーを連携させて他の検索エンジンに
負けないシステムを作ろうと考えたのですが、
馬鹿なので、何も思いつきません。というわけで、先輩方の
アイデアを募集!!ぜひよろしくお願いします!!
2DNS未登録さん:05/02/03 04:11:07 ID:???
スレタイと内容が違うスレッド立てるな氏ね。

それとクラスタリングくらい勉強して来い。
3DNS未登録さん:05/02/03 16:15:21 ID:???
googleにゃ勝てないし2ch過去ログ検索くらいが現実的で実用的じゃまいか
4DNS未登録さん:05/02/03 21:13:48 ID:???
なんだ・・・こんなスレだったのか・・・・・
5DNS未登録さん:05/02/03 22:16:16 ID:RX90lFlO
6DNS未登録さん:05/02/03 22:27:45 ID:???
今日の日記を書いてやったぞ。
コピペしとけ

---コピーここから---

おっ 怒られた〜〜

2chの自宅サーバ板で...

2chの自宅サーバ板でmyfiler.netを宣伝してみた...
トピックと内容が違っていたらしく、おそらくかなり若いと思われる少年に
怒られた...
ごもっともな内容のため、反論できず...
がんばります...

---コピーここまで---
7MYFILER.NET:05/02/04 00:25:07 ID:6QRb5MwT
あぁぁぁ また怒られてしまいました...
反論はまったくありません...すみません。

自宅サーバの底時からは、他社の検索サイトと同等の
検索サイトが自宅サーバー郡でできれば面白いかと
思ってつけました。。いずれにしても、わかりづらかったですね。
すみません...

クラスタリングよいですね。ロードバランサーを導入して
賛同者(いればれすが)と実際に行ってみるのもよいかもしれません。
ただ、ロードバランサーの負荷は結構なものになりそう...
インターネット経由でクラスタリングってできるのでしょうか。
ちょっと調べてみます。

データベースについては、現在考え中。。。
データの量が膨大すぎて、自宅サーバ1台では、およそ
ページ10000000分がやっとといった感じです。
なんで、レプリケーションではなく、NASか、NFSをインターネット
経由で行うのが良いかと思ってるんですが、調査不足で
とにかくインターネット経由で上記のようなことがスムーズに
行えるか調査してみます。

しばらくは、ちびちび1台の自宅サーバーでがんばります...
最後に、改めまして失礼しました!!
8MYFILER.NET:05/02/04 00:26:39 ID:6QRb5MwT
あっ。何度もすみません。
自宅サーバの底時からは ではなく
自宅サーバーの底力でした。。。
ブラインドタッチから勉強します。
9MYFILER.NET:05/02/04 00:28:08 ID:6QRb5MwT
というか全体的にぼろぼろですね。
日本語から勉強します!
10DNS未登録さん:05/02/04 00:35:58 ID:BkBtQ1pe
私みたいな小学生から見てもウザイわ。
11MYFILER.NET:05/02/04 00:39:24 ID:6QRb5MwT
DNS未登録さん厳しいね。。。
うざがらないで!!
12DNS未登録さん:05/02/04 00:52:17 ID:???
全国2ch・PINKちゃんねる共催模試 実施結果:
受験者数:1642016人
合計点:900点
最高点:894点
最低点:11点
平均点:564点

MYFILER.NETの国語の偏差値:28.4
13DNS未登録さん:05/02/04 00:53:20 ID:???


MYFILER.NETの5教科偏差値:30.2
14DNS未登録さん:05/02/04 00:55:12 ID:???
MYFILER.NET、がんばれ。応援してるよ。
そう簡単に検索エンジンなんて作れないしね
15MYFILER.NET:05/02/04 01:04:29 ID:6QRb5MwT
14さんは、多分知り合いですね〜〜
ありがとうございます!

30.2は低いですね。。もうちょっとあげてくれ!
16DNS未登録さん:05/02/04 01:06:49 ID:???
>>15
あなたの努力次第です。
1年で30台前半から70台までageた人もいます。
17DNS未登録さん:05/02/04 01:08:48 ID:???
本7Jr.登場?
18MYFILER.NET:05/02/04 01:10:36 ID:6QRb5MwT
了解です。ありがとうございました。
まだまだバグバグの状態ですが、努力して、偏差値上げます。
では、メンテして今日は寝ます!
19DNS未登録さん:05/02/04 13:35:45 ID:???
そもそも、ロボット型やるなら、

・クロール用ボットを走らせるマシン
・DBサーバ
・Webサーバ
の3つはいると思うんだけど、どれもそれなりの数がいると思う。

とりあえず、Webサーバの部分をインターネット経由でいろんなサーバに分けることを考えると、
ロードバランサーよりもDNSラウンドロビンの方が手軽じゃないかと思う。

クロール用ボットを走らせるマシンは、UDとかFolding@Homeのような分散コンピューティングのように、
ある程度(例えば10サイト)クロールしたら、中央サーバにそのデータを送信する見たいな形がいいかもしれない。
20DNS未登録さん:05/02/04 13:36:43 ID:???
あと、スポンサー広告ちょっとでかすぎない?
テキストリンクにするか、右側に移したほうが見やすそう。
21DNS未登録さん:05/02/04 17:36:03 ID:???
この検索システムって全部1が作ったの?
22MYFILER.NET:05/02/05 04:29:21 ID:6IKxeKRc
怒られるのが恐くて18以降見てませんでした。
返信ありがとうございます。
19さん>
現在、クロール用マシン/Web+DBサーバ の2台で動いています。
金銭的な問題で2台になってます。。。
なので、自宅サーバー郡で何とか他の検索サイトに匹敵するものを
作りたかったのですが。。。難しそうですね。

20さん>
スポンサー広告はとりあえず張ってみたというのが現状です。
今、検索キーワードに合わせた広告表示機能の作成に加えて
配置を考えています。20さんの意見を元に配置を考えてみます。
ありがとうございます。

21さん>
バグバグですが、なんとか一人でやってます。

皆様に認めて頂けるようなサイトを目指して頑張ります。
23DNS未登録さん:05/02/06 18:05:30 ID:???
あれ、落ちてる?
24( '.') ◆nftMKBxOs. :05/02/06 20:29:03 ID:???
落ちてるね・・・。
25DNS未登録さん:05/02/06 20:47:05 ID:???
P2P型の検索ロボット は面白そうだね (ー。ー)ボソォ
26DNS未登録さん:05/02/06 20:58:45 ID:???
>>3 同意
もっと対象を絞ったほうがよいと思うよ。
2ch検索とか、RSS検索とか、アイディア勝負で。
んでユーザ増えて負荷が上がったら分散なりなんなりやればよい。
って落ちてるのか。
27DNS未登録さん:05/02/09 15:01:05 ID:???
>>25
それほとんどワームだなw
28DNS未登録さん:05/02/09 17:58:05 ID:???
もっと軽くしる!
検索が重すぎる。
29DNS未登録さん:05/02/12 10:59:28 ID:Il/eX79R
age
30DNS未登録さん:05/02/12 11:13:31 ID:???
空で検索を押したら
Warning: mysql_fetch_assoc(): supplied argument is not a valid MySQL result resource in /usr/local/apache2/htdocs/lib/action/default/search2Action.php on line 143
ってエラー出たぞ^^;
PHPだね
31DNS未登録さん:05/02/12 11:14:14 ID:???
オマケに3347899078978660715 件 - 0.111569秒とか出てるし^^;;;
32DNS未登録さん:05/02/12 11:21:22 ID:???
33MYFILER.NET:05/02/12 18:07:18 ID:/Z/o3EgL
あぁぁ ご指摘ありがとうございます。
Warning: mysql_fetch_assoc(): supplied argument is not a valid MySQL result resource in /usr/local/apache2/htdocs/lib/action/default/search2Action.php on line 143
↑は、どうしようか悩んでいます。。。
検索結果が0件の場合、でてしまいます。というのも、検索SQLに
SQL_CALC_FOUND_ROWS(MySQL) を使用して検索しているのですが、
mysql_fetch_assocする前に、SELECT FOUND_ROWS()で検索結果の件数を
取得すると、当然、検索結果はクリアーされてしまいますので、
0件の場合、mysql_fetch_assocしないという処理が、できません。。
たぶん回避方法はあるので、勉強して直します!
accelerator調べてみますね!ありがとうございます。
34DNS未登録さん:05/02/13 02:27:07 ID:f2cPbV3t
>↑は、どうしようか悩んでいます。。。

単に@を付けてエラーを抑制しておいて
裏側でエラー取得して回避すりゃいいだけじゃないかと。
35MYFILER.NET:05/02/13 02:34:09 ID:Iby1Vd1g
34さん>返信有難うございます。
「@」←でエラーを制御出来るのですね。まだPHPは始めてまもないため
恥ずかしながら、それほど詳しくありません。
「@」について調べてみます。有難うございます。
36DNS未登録さん:05/02/13 03:14:53 ID:???
よーしパパ有り金はたいてWayback Machine作っちゃうぞ。
37MYFILER.NET:05/02/13 05:08:26 ID:Iby1Vd1g
パパさん>その際は是非機能を提供してください!
38DNS未登録さん:05/02/13 09:55:29 ID:???
>>1
どうでもいいけど、アフ「ィ」リエイトな。

後広告出したいんだけど受け付けてもらえる?
その場合の料金の目安もおしえて。
39DNS未登録さん:05/02/13 10:30:54 ID:???
















40MYFILER.NET:05/02/14 02:51:30 ID:ZmQalUFA
38さん>アフ「ィ」リエイトでした。
このまま一生間違って生きていくとこでした。ご指摘有難うございます。
>後広告出したいんだけど受け付けてもらえる?
>その場合の料金の目安もおしえて。
アフ「ェ」リエイトと間違えるほど、広告のことがわかっていませんので
詳細をお聞かせください。
41DNS未登録さん:05/02/14 05:42:03 ID:???
>>40
そっちのPVによるけど、月いくらで469x60程度のバナー広告出したいです。
42DNS未登録さん:05/02/14 23:33:58 ID:???
>>41
遠慮せずに800x600くらいいっとけ。
男は勢いが大事だ。
43DNS未登録さん:05/02/15 01:56:50 ID:???
>>42
もはやバナーじゃないなw
44DNS未登録さん:05/02/15 09:54:28 ID:???
>>40
投資してくださるみたいだし甘えてぼっておきなさい(笑
45MYFILER.NET:05/02/16 02:42:03 ID:4vqe6F9e
バナーの種類など詳細を教えてください!!
[email protected]
上記までお願いします。
ただ、現状はあくまでBETA版なので、システムがしょっちゅう止まる情况です
ので、ご期待に添えないかとおもいます。
PVは、TOP頁のアクセスログを参照してください。(あまり詳しくは私もわかりません)
46DNS未登録さん:05/02/16 13:30:56 ID:???
自分で検索エンジン作ったの?性能うんぬんはおいといて
俺にはできないから、素直に尊敬するよ。がんばってね。
47DNS未登録さん:05/02/16 16:31:17 ID:???
Likeしてたら1000件くらいで重くなるから検索方法を考えないときついよね
48DNS未登録さん:05/02/16 16:36:52 ID:BPv3xUiL
49DNS未登録さん:05/02/16 18:14:06 ID:???
>>48
phpSiteAnalyser −サイトアクセス解析システム− TOP

ぐぐるだけでアクセスはせんw
50DNS未登録さん:05/02/16 19:36:10 ID:BPv3xUiL
>>48は1が運営してる奴ね。
51DNS未登録さん:05/02/17 00:16:02 ID:yE9WZj1L
>>50
とりあえず違うと思います
52MYFILER.NET:05/02/17 01:16:42 ID:3DfWmHZA
50さん>違いますが、非常にお世話になってます。アクセス解析する際はぜひ。
47さん>Like文ではなくNグラムで検索しています。
性能についてですが、検索スピードは他には劣りますが、ADSL+サーバー1台で
やってる割には速いほうかと思っています。
何より問題は、HPの評価方法ですね。。。
Googleと検索しても、Googleは後ろの方にしかでてきません。。。
実際にほしい情報を検索するために使用するというよりは、
なんか面白そうなホームページないかな〜〜くらいの時に使って
いただくと便利かもしれません。。。
53DNS未登録さん:05/02/17 13:41:40 ID:???
>>52
私もNグラムによる方法を利用してサーチエンジンをPHPで作った事があるのですが、
評価で悩んでしまいますね。利用者を巻き込むという点では利用者に判断させる方法
もあるのですが、これだと不正が横行してしまう可能性もあるので厳しいものがあり
ます。本文から判断する方法、キーワードランキングによる方法などもありますが、
これもやりようによっては不正に評価をあげる事が出来てしまいますしね。
どのみちヒットする情報を厳選するなり特殊分野に拘るなりの特色がなければ競合
するサーチエンジンからは抜きに出る事が出来ないかも(-_-;)と想って私の
サーチエンジンは放置しております。笑
54MYFILER.NET:05/02/18 00:45:27 ID:1pCnG7OC
53さん>
なるほど、26さんもおっしゃっていましたが、検索対象を特殊分野に絞った
方が良さそうですね。
検索対象についてじっくり考えてみます。
>私のサーチエンジンは放置しております。笑
ぜひURLを!参考にさせてください!
55DNS未登録さん:05/02/18 01:51:58 ID:???
ベイズ理論とかどうよ。
56DNS未登録さん:05/03/01 00:30:33 ID:DJ636/hP
終わったな
57DNS未登録さん:05/03/01 07:14:05 ID:???
何か違うサイトになった?
58DNS未登録さん:05/03/05 18:25:09 ID:???
>>2
今更だがお前が氏ね
59DNS未登録さん:05/03/14 18:11:53 ID:???
でも、Yahoo!とかググールとかは大手だから、今作っても使われないとおもわれ。。。。。
60DNS未登録さん:05/03/14 19:32:30 ID:???
>>1
マシンは提供できないけど、クローラー公開すれば手元のマシンで走らせるよ
61DNS未登録さん:05/03/14 21:58:28 ID:???
>>1 さん。応援してます。
>>60 さん同様に俺も協力しますよ。公開してくれれば。
62DNS未登録さん:2007/07/02(月) 18:14:09 ID:???
2は死ね
63DNS未登録さん:2007/07/03(火) 00:14:02 ID:RvVwFJUb
過疎掲示板なら動くみたい
http://kowloon.ddo.jp
64電脳プリオン:2011/11/13(日) 15:52:09.52 ID:??? BE:638518379-2BP(1960)
>>1のリンク先が見れないんだが
65DNS未登録さん:2013/07/23(火) NY:AN:NY.AN ID:vrrTvxRi
>大阪府三島郡島本町の小学校や中学校は、暴力イジメ学校や。
島本町の学校でいじめ・暴力・脅迫・恐喝などを受け続けて、心も身体も壊されて廃人同様になってしもうた僕が言うんやから、
まちがいないで。精神病院へ行っても、ちっとも良うならへん。教師も校長も、暴力やいじめがあっても見て見ぬフリ。
そればかりか、イジメに加担する教師もおった。 誰かがイジメを苦にして自殺しても、「本校にイジメは
なかった」と言うて逃げるんやろうなあ。
島本町の学校の関係者は、僕を捜し出して口封じをするな

>島本町って町は、暴力といじめの町なんだな

>「口封じ」なんかしません。どうぞ、気が済むまでお書き込み下さい。


 島本町は日本の恥!島本町は日本の迷惑!
66DNS未登録さん
54