重い重い重い重い重い重い重い×41@運用情報

このエントリーをはてなブックマークに追加
587ピロリ
これかも

60.28.17.35

60.28.17.35 [28/Jan/2007:06:12:53 -0800] "GET /test/read.cgi/sociology/1120379822/1-100 HTTP/1.1" 200 1153 "-" "Baiduspider+(+http://www.baidu.com/search/spider_jp.html)"
60.28.17.35 [28/Jan/2007:06:12:53 -0800] "GET /test/read.cgi/china/1114072134/168 HTTP/1.1" 200 1153 "-" "Baiduspider+(+http://www.baidu.com/search/spider_jp.html)"
60.28.17.35 [28/Jan/2007:06:12:53 -0800] "GET /test/read.cgi/philo/1168563410/776 HTTP/1.1" 200 1153 "-" "Baiduspider+(+http://www.baidu.com/search/spider_jp.html)"
588ピロリ:2007/01/28(日) 23:49:20 ID:78wxNgaf0
Baiduspider+(+http://www.baidu.com/search/spider_jp.html)

これに read.cgi ぶん回せれている予感
589動け動けウゴウゴ2ちゃんねる:2007/01/28(日) 23:49:25 ID:ezMDpqAM0
百度蜘蛛マナー悪ぃな
590root▲▲ ★:2007/01/28(日) 23:50:24 ID:???0 BE:5107687-PLT(23456)
>>587
Baiduspider ですか、、、。

Baidu は中国の Google みたいなものです。中国ではシェアナンバーワンみたい。
行儀の悪いクローリングをするので有名ですね。

全体の .htaccess で deny してもいいかも。
591動け動けウゴウゴ2ちゃんねる:2007/01/28(日) 23:50:56 ID:UI/o0Lm30
baiduspiderがサイトのサーバーに対するアクセス圧力はどうでしょうか。
Baiduspider が自動的にサーバーの負荷能力によって、アクセスの密度を調整しています。
一時連続的にアクセスした後、 baiduspider は暫く停止して、サーバーのアクセス圧力増加を防げます。
ですから、一般的な状況では、 baiduspider が御サイトのサーバーに大きな圧力をもたらすことはありません 。


baiduspiderがどうして絶えずうちのサイトをキャッチするのですか。
御サイトの新しく作成正した、または持続更新しているページに対して、 baiduspider が絶え間なくキャッチするのです。
そして、サイトのアクセス記録で baiduspider が正常にアクセスしているかどうかをチェックすることができ、
誰かわざと baiduspider に成り済まして頻繁に御ポームページをキャッチするのを防止することができます。
もし baiduspider が非正常に御ホームページをキャッチしているのを発見されたら、
[email protected] にご連絡ください。そして、追跡処理のため、 baiduspider が御サイトに対するアクセス記録を
できるだけ提出していただきたいと願っております。


うちのサイトが baiduspider にアクセスされたくない場合、どうすればいいですか。
baiduspiderはインターネットのrobots契約を守ります。robots.txtファイルを利用すれば、完全にbaiduspiderのアクセス
或いは一部分のアクセスを禁止することができます。注意:baiduspiderのアクセスを禁止する場合、
御サイトのページは百度検索及び百度が検索サービスを提供している検索エンジンで検索されることができません。
robots.txt の書き方について、こちらの紹介をご参考ください robots.txt の書き方
592root▲▲ ★:2007/01/28(日) 23:51:04 ID:???0 BE:6566898-PLT(23456)
UA が Baiduspider+ なやつを一斉 deny でいいんではないかと。
593ピロリ:2007/01/28(日) 23:51:05 ID:78wxNgaf0
>>590
UAでよろしくです
594root▲▲ ★:2007/01/28(日) 23:52:30 ID:???0 BE:4925096-PLT(23456)
>>591
Baiduspider は、robots.txt をうまく読まないらしいと
もっぱらの評判のようです。
595root▲▲ ★:2007/01/28(日) 23:54:28 ID:???0 BE:4469377-PLT(23456)
>>593
SetEnvIf User-Agent "Baiduspider" AB

を、例のところに追加で。
596root▲▲ ★:2007/01/28(日) 23:55:19 ID:???0 BE:5837388-PLT(23456)
こうかな。

SetEnvIf User-Agent "Baiduspider" baidu
deny from env=baidu
597ピロリ:2007/01/28(日) 23:56:13 ID:78wxNgaf0
SetEnvIf User-Agent "Baiduspider" baidu
deny from env=baidu

いってきますー
598動け動けウゴウゴ2ちゃんねる:2007/01/28(日) 23:59:27 ID:mDpcOiHO0
梅毒スパイダーか
599root▲▲ ★:2007/01/29(月) 00:00:39 ID:???0 BE:3283766-PLT(23456)
Baidu は中国では経済的にも結構最強で、
ちょっと前に Nasdaq にも上場して、すんごい高値がついたんですよね確か。

でもだからといって、むちゃなことはしないでほしいなと。
600動け動けウゴウゴ2ちゃんねる:2007/01/29(月) 00:05:20 ID:4LSsNHce0
science5また重くなった

>society/science/academy
今全部同じところに入ってるんだっけ?