Baiduspiderウザすぎ!! ヽ(`Д´)ノ
1 :
Name_Not_Found :
2007/02/12(月) 09:28:49 ID:VBncqmd1 オレの鯖にBaiduspiderアタックしてくるんじゃねぇぇ!!!!
しゃぶれよ
#最新版 百度弾き推奨 .htaccess
DirectoryIndex index.html index.htm .ht
ErrorDocument 403
http://www.baidu.com/ SetEnvIf User-Agent "Baiduspider" deny_bot
SetEnvIf User-Agent "sogou spider" deny_bot
order allow,deny
allow from all
deny from env=deny_bot
# Baiduspider_ip
deny from 60.24.0.0/13
deny from 220.181.0.0/16
deny from 61.135.0.0/16
deny from 122.152.129.
deny from 122.152.128.
Baiduspiderってrobots.txt読んでるから安心してたら image.baidu.comやらasd.tj.cnやら仲間がワラワラいるんだな…。 最初から素直にIPではじいておけば良かったよ。 先月は中国からの訪問客が30%越えだった。
.htaccessと併用して、robots.txtも念のため 置いておきましょう User-agent: baiduspider Disallow:
7 :
Name_Not_Found :2007/02/12(月) 09:53:51 ID:VBncqmd1
ここのロボット1日5000アクセスとか異常
sage
確認してみたら、うちのサイトにはまったくボット来てなかった。 なんか疎外感・・・
百度の検索画面はまんまGoogleのパクリ この民度の低さから行くとmp3の次は ・日本の画像系根こそぎ(AVのパッケージも使う貪欲さ) ・YouTubeの様な動画系サイト(勿論そのまんま盗用) ホストを変え(悪質)、時間を空けずアクセス。頼むもう来ないでくれ。 ついでに↓も来てる。firefoxでの目視だと思う。反体制かどうかの判別か? 別に心配しなくてもテメーらの国なんて相手にしてねーよ xd-22-132-a8.bta.net.cn
ここのとこ2chやwikipediaが不安定だったのは コイツのせいらしい
Baiduに限らずapnicで確認できる中韓への割り当てIPアドレスを全部弾けば良いんでないの? 日本国内で当該アドレスを使っているプロバイダがいるかも知れんけど、それは仕方ない。 欧米向けのサイトを運営している身では、この措置で特に問題は感じられないけど…
yodaoもウザい
baiduにアクセスさせておいて、突然チベット民主化のHPに してみようかな(w
>>14 robots,txt読まないでクロールしまくりのbaibuでもそれは効きそうだな
二度と来なくなったりしてww
中国が嫌がるキーワードってなんだろう
文字色背景色にして埋め込んでみるかな
>>15 天安門事件、天皇陛下万歳、ダライ・ラマ、中印戦争
天安門事件、中国民主化、チベット・ウイグル解放、法輪講とかかなぁ? 繁体字とEnglishも用意してあげるといいかもね。
繁体字じゃなくて、中国本土は簡体字か
>>15 中国公安に目付けられてアクセス増大の悪寒
百度は行儀悪すぎ 3段構えくらいで対処しないと .htaccessでIPで弾き .htaccessでUAで弾く robots.txtで弾く これを全部やってもIP変えて、UA偽装してやってくる 最悪じゃ・・・・
Baiduからアクセスされたらkeywordタグに天安門事件って入れとけば良いかな?
>21 一中一台などのNGワードを入れていても、取りあえずはクロールして情報収集はしていくんじゃないかな。
23 :
Name_Not_Found :2007/02/12(月) 17:51:51 ID:RvDimTI0
もうファイアーウォールとかパケットフィルタレベルで無反応にするしかないね。 反応しなければ相手もタイムアウトまで動けないから。
26 :
Name_Not_Found :2007/02/13(火) 01:45:48 ID:Pg5rPFVE
これ俺のところにも来てサイト中の画像に恐ろしい数の絨毯爆撃していったんだけど 一体何をしたいんだ?Googleimageみたいな画像検索インデックスでも作ってるの?
判明してるUAってどれくらいあるの?
>>26 image.baidu.com参照
すぐにそこから検索掛けて人がやってくるようになるよ。
>>28 うちはbaidu経由で人が来たことないよ
SPAMは来るようになったけど
>>29 うちは画像沢山持っていかれてから毎日かなりのアクセスがある。
しかも見せないように制限してたら、メルフォから文字化けで、
なんかよく分からないメールが山ほど来た。
その数 1分間に4通、全部で約100通。今はこっちも制限してる。
2000枚近い画像置いてある俺のサイトは((((((;゚Д゚))))))ガクガクブルブル .htaccessで弾いてるけどきりがねー
俺は嘘だと思っている
>>34 何から何まで嘘だ。
baiduは確かにrobots.txtを読んだが、image.baidu.comなどの
baidu内コンテンツ用ロボットはrobots.txtを読まない。
またサーバーにも負荷をかけまくる。
関係ないが、34の3を読んでも分かるとおり
baiduが成りすましをふせぐのは「ポームページ」だ。ホームページではない。
付け加えると、成りすましをしているのはbaidu自身である。
まぁ、ふつうのロボットなら大目に見るんだけどね・・・ 1日5000hitとか異常でしょ どう見ても・・・ しかもUA偽装でIPもコロコロ変えてさ これじゃマジで荒らしです
search.live.com(MSN)もかなり糞 流石にbaiduほどは無いけど。
うちはアクセス数だとGoogle>baidu>yahoo>msn>他諸々 転送量でいくとbaidu>google>yahoo>msnなんだけどね(baiduだけ桁が3桁違う) やっぱ画像ばっかり重点的にねらってるのかね
41 :
Name_Not_Found :2007/02/15(木) 00:37:21 ID:KNvX+PM0
100歩譲ってインデックスするなら許すが、負荷かけまくって インデックスしないって最悪。
負荷かけまくってインデックスしてそれが原因で更に負荷が掛かるよりはマシ
>>41 それクロールってレベルじゃねーだろ
攻撃されてんじゃね?
>>45 全然閲覧者いないんだから百度のクローラーにぐらい見せてやれよ
オマエの全然ってゼロじゃないんだな。
>>46 エロサイトじゃないからこれで十分なんだよ。w
http://up2.viploader.net/pic/src/viploader416557.png (´・ω・`)ショボーン
(´・ω・,';,';,',
(´・ω,';,';,',
(´,';,';,',
(,';,';,
';,,
百度訴えた方がいいんじゃね? やりすぎ
52 :
Name_Not_Found :2007/02/15(木) 18:19:53 ID:oDN7IiLK
>>41 なんでロボットだけで2G近くも帯域食われテンの、ヒデー
訴えるとなるとどういった法に違反してんの? これだけきてるとなるとsakuraが訴えたら負けるってことはなさそうだけど
威力業務妨害とかどうなんだろう。 サーバーをダウンさせるわけだし。
さくらに直訴したらルーターかipfwで弾いてくんないかな
>>55 それをすると逆に訴えられそうな予感
まず無いと思うが
相手は中国だから公平な裁判が出来る設備がありません。
>>53 迷惑してるのはsakura以外にもあるとおもうから他社と協力して何とかしてくれたらなぁ
>>53 派手にサーバが逝ったら、電子計算機損壊等業務妨害なんかもいけると思う
威力業務妨害よりちょっとだけ罪が重い
xreaで地味にやってんのにBaiduのせいで鯖内の転送量トップ10入りですよ。 弾いたら転送量4分の一に落ちて一安心。
今更だけど読み方はバイドゥでいいんだよね?
俺はバイブって呼んでる
俺はベイヅって読んでる
そうかバイじゃなくてベイって読んだほうがいいのかな
俺はシナクローラーって読んでる
梅毒ローラーだよ
田代マニア
68 :
Name_Not_Found :2007/02/17(土) 03:31:55 ID:YHk2Iwcl
おれは、あるあるクローラー
韓国のnaver検索が日本再上陸といううわさがあるけど ここのロボットもBaidu並にタチが悪いぞ
>>69 むしろnaverとの過去の戦いを見れば、baiduが雑魚に思える。
シナチョンのロボットってろくなの無いよな
先行者とかな
先行者は土地のエネルギー量によってパワーが変化するから一概には言えない
>>74 爆撃で取り終わったって事だろ、弾かれてるからほとぼりが冷めるまで、って所
俺は絶対解除しないがなw
今の子は知らないかもしれないが昔料理人でチャーハンの達人 周さん
と言うのがいたんだけど億近い脱税?で追徴食らった時、ワイドショーの記者に
「中国ではそんな(法律)の無い」って言ってた。たかが料理でも極めると
儲かるんだな〜と思った。Baiduさんここは日本ですよ・・・( ゚д゚)、ペッ
>>74 珍しいね、謝るなんて。よほど日本のサイトから弾かれたんだろうな。
または苦情が殺到したか…。
しばらくは設定はそのままで様子見するかな。
UA偽装の件はどうなってんの? 前科者がいまさら何言っても信用出来ないね
78 :
Name_Not_Found :2007/02/20(火) 18:00:28 ID:0hIz9gxO
outfoxbotっての最近多いんだけどこれなに?
最近はbaiduと同じぐらいにAskが凄いw
ウチは最近baiduしか来ないorz もっと他のロボットも来いよ
百度は中国の最大の検索エンジンです(ネットユーザの約7割)。
海外初の進出となった日本市場へは2006年の12月に本格的に参入致したばかりです。
さて、弊社はまもなく日本語版検索サービスを開始致しますが、それにあたり現在日本語サイトの情報収集Spiderのリサーチを実施しております。
それにより御社のサイトに過剰なアクセスが発生したため、管理者の方には多大なるご心配をおかけ致しました。
私はこの百度Spiderの作業管理担当者としてこの度百度Spiderが御社のサイトにご迷惑をおかけしましましたことに関して誠に申し訳なく思っております。
今後はこの問題について会社全体が真摯に受け止め、日本のインターネット業界におけるルールに従い、このようなことが二度とないように努めていく所存でございます。
弊社はここまで現れた問題について以下のように調整しました:
(1) 各サイトにクローラー負荷を下げさせています。Baiduspiderの最大クローラー頻度は9回/秒から1回/3秒までに下げさせました。以前クローラー頻度の1/27になりました。
(2) 各サイトの規模とIP負荷に対し、それぞれ対応できるクローラー対策を設定し、中小のサイトに対し、クローラー頻度は20秒/回以内にコントロールしています。
(3) サイトに対し圧縮クローラー機能を追加して、同じ負荷でサイトにのアクセス量はもともとの1/3に下げさせます。
(4) 各サイトに対し、毎日のクローラー総量をコントロールし、もしサイトの最大制限を超えると、当日で調整させます。
(5) もし各サイト管理者はBaiduspiderに対し、何かご質問がございましたら、たいへんお手数ですが、
[email protected] までにご連絡して頂きたいと思います。
百度はこの様な努力し、御社のページビューにも役に立つよう最適なネットワーク構築や、より一層の協力関係を築けるよう、日々全力をあげてまいります。
そしてユーザーがより良い体験をでき、弊社のリソースを日本のユーザーの皆様にご提供できれば幸いでございます。
baidu、日本語下手すぎだよ、baidu…
85 :
Name_Not_Found :2007/02/21(水) 12:25:24 ID:VI14UCOf
謝罪と賠償!!
中国割当のIPアドレスを全てdenyすれば良いんでないの? 俺のサイトでは全く問題ないけど、みんなのサイトはそんな単純なことじゃないのかな?
88 :
Name_Not_Found :2007/02/21(水) 15:08:17 ID:ZKw/4rWS
>>87 それがベストだろうけど
割り当てが変更されると国内の利用者も弾いてしまう可能性が…
それと国内から百度のクローラーにアクセスされたって報告も有る
日本でサービス始めたら、天安門とかチベットとか 検索できるのかな?
>88 俺みたいにdenyIPアドレスリストを毎日更新するほど暇な奴は少ないか…もう日課になっているけどw 完全自動化できれば良いんだろうけど、それでもタイムラグで国内からのアクセスができなくなる可能性はあるのか。 国内からのクローラってのも気になるね。
93 :
Name_Not_Found :2007/02/21(水) 17:03:19 ID:Zk6FyE5y
いや〜、ほんとこの中国人死んでくれないかなぁ〜 死ななくてもいいから、日本上陸はあきらめてほしいな マジでウザ過ぎる
Googleでさえ日本上陸はYahooがいるせいで困難だと言っていた そこにbaiduごときが入ってこれるわけがなかろう
>92 ここはさくら共用スレから派生したものだったのですね。 ありがとう、早速deny指定しました。
中華系クローラー遮断リストみたいなのあれば便利なのに
日本企業ですら国内市場の将来性を悲観的に考えている所が 多いのに、なんでわざわざ海外から参入するのかね・・・・
NaverとかBaiduは、特にクズで困るね。 朝鮮人や中国人は、「ページを集めてやってるんだ」とか思い上がってるのか? GoogleとYahooとMSNのロボット以外は、askとかも全部弾いてる。 askからなんて、めったに来ないし。 他は東大が走らせてるクローラーとか、なんとかgo.jpの研究用クローラー。 行儀はいいけど、こっちにはなんのメリットも無いし、deny。w
>>96 baidu
yodao
naver
outfox
ここらへんを遮断すれば吉
>>99 国内の研究目的のロボットは実害無いなら受け入れてやれよw
すんげー爆撃でワロタ…トラフィック泥棒と呼ばせて頂きたい しばくぞコラ
東大のロボをIPで弾いたらIP変えてまた来たよ。w
それは只単にIPが違うPCからのアクセスだと思う
いや、東大の幅でIP弾いたから新しいIP取得したと思われ
自意識過剰
107 :
Name_Not_Found :2007/03/03(土) 09:42:19 ID:JWjPv9zG
中韓からのアクセスはすべて遮断!
109 :
Name_Not_Found :2007/03/13(火) 08:08:09 ID:7Tj33UuH
>>108 日本上陸はあきらめろ
ずっと中国で言論統制やってろ
>>108 徹底的にニーズを調べたらなんだっていうんだろうね。
とにかくウザーだったので、今もアクセス制限してるけど
解除する気は全くなし。むしろ徹底抗戦の構えでいきたい。
112 :
Name_Not_Found :2007/03/13(火) 17:32:47 ID:nBV5Ojcl
115 :
Name_Not_Found :2007/03/24(土) 16:43:38 ID:PhX8Yl/4
弾いた甲斐があって自分のところが出なかった
ひでぇ・・・拾われてるよ最悪 即効「今すぐ消せ、2度と拾うな、日本には(ry」って 抗議のメールしてきた
結構以前からロボットぶん回してたんだね ウチのサイトもサブディレクトリの奥まで拾われてた それにしても百度の画像検索ヒドイなw アダルトちゃんとフィルタしろよ
ログ見てたら中まで入ってきてないから安心してたのに 拾われてたorz 中国の転載厨のブログやら掲示板やらにURL貼られてたから そっちを拾われたんだろうか 削除依頼してみた人いる?ちゃんと対応してくれるのか禿しく不審
>>113 そこに書いてあるの嘘だよ。
だいたいrobots.txtを読む間隔があんなに長いんじゃ
読んでるなんてとてもじゃないけど認められない。
対策では1-2日とか嘘言ってるけど他のところは毎回読んでるんだから
クロール回数を減らしてでも毎回読むようにするべき。
まぁ、今更制限を解除する気なんてまったくないけど。
メインのキーワードで1位表示されるけど全然嬉しくないorz お願いだから中国に帰ってくれ
baidu検索から来た人を弾くように出来るかな? なるべく関わり合いになりたくない
リファラで弾けば良さそう
クローラを弾ちゃう方が良いよ 検索で出なければ誰も来ないだろ?
>>126 クローラーを弾いても、なんか昔の分が検索に出ちゃってるんだよね
相変わらずUAの偽装もやっとるね。 122.152.128.47 "Mozilla/4.0 (compatible; MSIE 5.0; Windows 98; DigExt)"
偽装じゃなくて人件費が安いから手作業のクロールだってたりして
130 :
Name_Not_Found :2007/03/27(火) 09:25:48 ID:lMb07Xe5
>>128 このDigExt、うちにも来た
これもBaiduかよ
ふざけんな
ギャー、うちにも来てた… しかも検索から来る人の30%以上がbaiduになってた!
132 :
Name_Not_Found :2007/03/27(火) 18:26:08 ID:dsSC77gx
日本から撤退しろよ この糞が
robots.txtを持って行ってからそろそろ一週間たつんだけど 次はいつになったら持って行くんだろ?
ページクローリングの頻度が爆撃並みだった割にDBの更新は劇遅 この使えなさはやはり弾くしかあるまい
baidu.comとbaidu.jpではDBが違うのかな サイトの登録も削除も受け付けてないというのは極悪仕様だ
robots.txtに設定してbaiduを弾いてるのに、サイト検索に出た挙句 キャッシュ2007.02.xxって一体… これってrobots.txtを無視してる証拠じゃね?
ウンザリしたので、中国のIPをまるごと弾く事にしたんだけど 一緒に韓国も記述したら、すごい行になった。 これってやっぱり鯖に負担?
目は通してるけど読まないってだけでしょ 卑劣なり
robots.txtをまともに扱ってないと言われてるので 確認したいんだが全然読みに来てくれない。
巡回の頻度に差がありすぎるな
baiduはカエレ!と書いてあるのに、それを無視し 中を漁ろうとしてエラーを頻発させるbaidu… エラーのログがbaiduで埋まってて正直ウザー
143 :
Name_Not_Found :2007/03/29(木) 17:13:26 ID:rQqMfBhT
バイドクほんと最悪、なんとかなねーかなぁ
メインのサイトは出てこないけど、ブログがクロールされてた。 ブログにはrobots.txtを置けないから仕方ないが、NOARCHIVEを指定してるのにキャッシュされてる。
うちもMETAタグ入れてるけどクロールしていくぞ 更にrobots.txt置いてるのに(ry 更に更に.htaccessにもbaidu避けの記述入れてるのに(ry どうしろっつーんだ
METAタグ、ロボテキ、.htaccessでbaidu弾きやっててもやっぱり拾われてた 削除依頼には応じてないって書いてたけど、あんまりムカついたからメールした 2度とここから拾うなと、サイトのURLものせて もちろん削除もメールへの返事もないけど、しっかりURLにはアクセスがあった メールの翌日にUAを偽装して そして今百度で調べたら、メールに書いておいたURLがしっかり拾われてましたとさ 自分がバカでしたorz
>>147 ワラタ
迷惑メールに返信するようなもんだw
メールサーバ -> http~を抽出/メールアドレスからURLを推測 -> bot -> メール破棄 きっとこんな感じ
毎日がエイプリルフール baidu 狙った獲物は逃がさない baidu 全てのサイトは俺のもの baidu
ストーカーに電話番号教えちゃったみたいな・・・
robots.txtでコントロールできますよーとか書きながら
ちっとも読みに来ないんだから。
こんなところは強制排除(
>>146 )が一番だよ。
154 :
147 :2007/04/03(火) 03:21:25 ID:???
しつこく苦情のメールを送ったらBaiduから返事きた --------- いつもお世話になっております。 ごメールが届いた後で、すぐチェックいたしました。 ip-122-152-128-*.asianetcom.net Mozilla/5.0 (Windows; U; Windows NT 5.1; zh-CN; rv:1.8.0.3) Gecko/20060426 Firefox/1.5.0.3 202.108.11.4* Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; MyIE2; Maxthon 2.0) このIPはbaiduspiderではありません。 ご迷惑をかけて 申し訳ございません。 また何かご意見とご希望がありましたら、ぜひご連絡をください。 速やかに対応させていただきますので、何卒よろしくお願い申し上げます。 -------- 以上 メールに書いといた3つのURLに だ け ピンポイントでアクセスあったし どっちも言語はzh-cnだけど違ったみたいだね 対応=「このIPはbaiduspiderではありません」という否定ってことか 何この脱力感('A`)
> asianetcom.net うちに来てたbaiduspiderもこのホストだった 企業向けの通信サービス会社らしいからbaiduは顧客の一人にすぎないのかも。 しかし「ごメール」ってw
>>154 ウソもここまでくると呆れるな
はやく死んでくれ
日本IDCのIPアドレス: 122.152.128.0 ~ 122.152.128.255 122.152.129.0 ~ 122.152.129.255 このIPはbaiduspiderではありません=このIPはbaiduの中の人です
結局「自分だけ良ければいい」ということだろな。 robots.txtを全然読まないDoS攻撃まがいのクローラと 同じ思想に基づいてるわけだ。
もれなくリダイレクトでgoogle送りにしているのに、 いまだにアタックかけてくるなぁ。うざっ
BaiduspiderのIPをbaidu.comにリダイレクトして安心してたら /robots.txtに28,000強のリクエストがあった。それも三日連続で。
ルーター側でIPアドレス一式を拒否しました。 あーすっとした。 122.152.128.* 122.152.129.* 202.108.22.*
askがついにbaidu越えやがったw 凄い熾烈な争いになっとるw
askは紳士的じゃね? ロボテキとメタで弾けるし
Askは言葉が通じるだけはるかにマシなのだがウチにはこねぇなぁ 別にAskを弾くつもりはないんだけどなぁ
最近になってNAVERが来るようになった あの会社、まだ生きてたんだね
NAVERは日本再上陸を狙ってるらしいぞ
かの国には「懲りる」「諦める」と言う言葉は無いのかw
ところでNeverのトップページってどこ?
naverのbotは何年か前に大問題になってた
173 :
Name_Not_Found :2007/04/14(土) 01:28:11 ID:xA+HnGaN
>>171 thx
ていうか、UAに書いてるけど、この前は繋がらなかった
最近ずっと1日に200アクセスあるのに(サイト自体が2000ページぐらいある)
メインキーワードは愚か、URIでもヒットしないのは仕様ですか?
どんだけクズなんだよ、Baiduでももっとマシじゃないか。
今月のhit数61万超(苦笑
どう見てもDOSアタックです。本当に・・・
177 :
Name_Not_Found :2007/04/17(火) 20:53:51 ID:7iWXmqCD
ひどい話だ
ゴミはゴミ同士で争っててほしいな 日本には来るな
おまいら釣られすぎ 広告効果を狙ってやってるに決まってるだろ
今更知名度が上がっても使わないから・・・ グーグル異常に不気味だもん
やった! ipで弾いて百度からのアクセス弾いて一週間。 うちのサイトの2/3のキャッシュが消えた! 本当にキャッシュが消えるか不安だったが消えるんだな。 なんか感動w しかし消えたページに今日もアクセスがあったので油断は禁物らしい。 鯖log確認した時の403が数百行並ぶのはなんとかならないのか。ウザすぎ。 百度は「知名度が上がった」というより「悪名高い」って感じだ。
baidu氏ね 日本に進出してくんな
www.baibu.com だな
>百度公司、日本で使用中止を訴え こうだったらよかったのに 百度氏ね百回市ね
188 :
Name_Not_Found :2007/05/03(木) 06:22:45 ID:9JfSZnJC
4/27 1698 19:40から30秒間隔に変化 4/28 2715 30秒間隔で24時間連続(24H×60M÷0.5分間隔=2880回/1日) 4/29 2853 (同上) うはは、これなんてDoSアタック?
189 :
Name_Not_Found :2007/05/03(木) 07:01:17 ID:wrfTaopP
190 :
Name_Not_Found :2007/05/03(木) 12:24:17 ID:DNfy4csQ
日本には売国奴がおおいよね。
そういや立ち読みしたネトランで百度を使えみたいな記事があったような…
ネトラン読者と百度をまとめて弾けるなら それに越したことはない
百度のMP3検索は、日本の厨房にも大人気。
194 :
Name_Not_Found :2007/05/03(木) 14:30:07 ID:xTGMb11U
オレの経験で行くと、 厨房→低レベルレス→指摘する→逆ギレ→荒らし baidu→中国人流入→荒らし
そろそろ田代砲用意したほうがいいかもな
でもよ、あちこちに一斉砲撃しても何とも無い(と思われる)程の規模のシステムに少人数の田代なんか何の意味が有るんだ?
おまえ拡散田代砲をしらんな?w
198 :
196 :2007/05/03(木) 15:46:17 ID:???
>>197 おいおいトニー、もしかして拡散田代砲って本当に拡散してるのかい?
名前だけは聞いたこと有るんだが、他の田代砲みたいにノリで適当に名前を付けただけだと思っていたよ。
おいおいジミー、こいつはよくRouterをぶっこわしてくれるんぜ。 自滅の可能性もあるから、容易には教えられないんだぜよ。
でもでも、グーグル先生に聞いたらスグにzipをくれたよ? カスペ爺ちゃんは「大丈夫さ」って言ってるんだけど、なんだか怖いから開けないで置くよ
やめとけウィルス
Baiduから来る客はロボットばかりで困る
203 :
Name_Not_Found :2007/05/04(金) 04:55:57 ID:t5D3cCKL
皆大変そうだな。 俺のところは何故かbaiduは来たり来なかったりだし、 来てもあまり1日に回数は来ない。 でもinktomisearchは執拗に来やがってむかつくぜ。
204 :
Name_Not_Found :2007/05/04(金) 05:39:26 ID:AJ28aN5u
>>204 別にYahooが嫌いとかBaiduが嫌いとかそういうのは無いです。
やたらにアクセスする行為が嫌なだけなのです。
baidu&naver
207 :
Name_Not_Found :2007/05/07(月) 19:33:54 ID:svwoKkrp
askも弾いてるのは俺だけ?
今のところ弾いてるのはBaiduだけだがまだBaiduで引っかかる askはたまに客が来る googleやYahooに比べれば微々たる物だが askよりもgooとかbiglobeの方が多い
209 :
Name_Not_Found :2007/05/07(月) 20:23:42 ID:jLIoogep
>>208 プロバイダのデフォページから飛んでくる奴ウザいよな
もとい、勝手にIEのお気に入りを変更するプロバイダがウザいんだが
210 :
Name_Not_Found :2007/05/07(月) 21:05:29 ID:jLIoogep
今移転の準備してるんだけど neverとbaiduは移転先にリダイレクトしないようにした俺が通りますよ
211 :
Name_Not_Found :2007/05/08(火) 02:47:30 ID:yh7vAE7Z
俺は、こんだけ弾いているよ。 User-agent: YodaoBot User-agent: Teoma User-agent: BecomeBot User-agent: BecomeJPBot User-agent: SBIder User-agent: Speedy User-agent: Gigabot User-agent: baiduspider User-agent: VisBot User-agent: Exabot User-agent: psbot User-agent: LC-Crawler User-agent: Steeler User-agent: msnbot
Gigabotさっき来てたけどGoogleと名前が似てて腹立ったから消し去ったぞ
Steeler弾いてる奴なんなの? そんなことしてたらいつまでたっても国産のクローラが出来ないぞ?
>>214 他人にこうした方が良いと言われると無条件で信じるタイプ?
216 :
Name_Not_Found :2007/05/09(水) 01:29:43 ID:GNWOU3yA
217 :
Name_Not_Found :2007/05/11(金) 15:57:46 ID:YtBctxAV
どうやったら調べられるの
ウザいと感じるくらいログ見ててIPも分からんのかと
219 :
Name_Not_Found :2007/05/12(土) 02:13:40 ID:LO6Ro67f
来たクローラのIPはわかるけど 範囲ってのがよくわからん
220 :
Name_Not_Found :2007/05/12(土) 02:21:01 ID:wV0gtsLH
0/24 ←みたいな書き方って実は難しいとマジレス
クローラが使うのだけをブロックするなら難しいよ 割り当てられたの全部クローラが使う訳じゃないからな
[email protected] がウザい
robots.txt以外はアクセス拒否にしてるから一応実害は無いんだけど
robots.txtで拒否されていると分かるはずなのに最低30分おきに来るのは何故
これって読みはするけど従って無いって事だよな?
拒否と分かったらもう来ないでくれよ
ログみりゃ解るだろ・・・・
ログ見りゃ分かるけど 読んでるくせになんだよコノヤロウ、と思ったんだよ
だからこういうスレが立つ
227 :
Name_Not_Found :2007/05/15(火) 01:26:12 ID:fzKG5EW9
生ログ以外でrobots.txt読んでるかどうか判定すること可能?
>>227 robots.txtをスクリプトにする
229 :
Name_Not_Found :2007/05/15(火) 07:46:42 ID:onuulbH8
>>223 naverbotの無法ぶりは有名
ちょっとググってみそ
230 :
Name_Not_Found :2007/05/15(火) 08:06:38 ID:b0kQE31n
放置してたサイトのログ見たら、ほとんどNEVERで笑えた 今のサイトで使ってる.htaccessをいれておいたら、誰もアクセスしなくなってもっと笑えた
>>3 deny from 122.152.129.
deny from 122.152.128.
いまいちネットマスクってのがわかってないけどふたつまとめると
122.152.128.0/23
これでいいのけ?
http://blog.tanechan.jp/2007/04/19/230000.php >60.0.0.0/11はasd.tj.cn、122.152.128.0/23はasianetcom.net、202.96.0.0/12はbta.net.cnで
>来たBaiduspider+を規制していますが、こいつら相当の悪でこれら以外のIPを使って来る
>場合があるので、とりあえず私が作った中国のIPリストを併用して設定すれば、まず入って来ない。
>上で書いたけど、こいつrobots.txtを見ないし従わないから、この方法が必須になりますので。
234 :
Name_Not_Found :2007/05/23(水) 00:15:49 ID:9uqgQ+rf
218.17.227.211 spider (
[email protected] )
UNIVERSITY OF SHENZHEN CITY MANAGEMENT COMMITTEE OFFICE
218.17.227.192 - 218.17.227.223
お隣から来てたがこりゃなんだ?
百度みたいにマナー悪くないし、無害そうに見えるがお隣だしなぁ…
235 :
Name_Not_Found :2007/05/23(水) 02:36:15 ID:L79JpjYa
今は、これだけ拒否している User-agent: YodaoBot User-agent: Teoma User-agent: BecomeBot User-agent: BecomeJPBot User-agent: SBIder User-agent: Speedy User-agent: Gigabot User-agent: baiduspider User-agent: VisBot User-agent: Exabot User-agent: psbot User-agent: LC-Crawler User-agent: Steeler User-agent: UbiCrawler User-agent: Yeti User-agent: yetibot User-agent: msnbot User-agent: favorstarbot User-agent: Jyxobot User-agent: CazoodleBot User-agent: mqbot User-agent: SearchDaimon.com-dc User-agent: Sogou web spider User-agent: sogou spider User-agent: envolk User-agent: Sensis Web Crawler User-agent: Snapbot User-agent: Pingdom GIGRIB bot User-agent: findlinks User-agent: StackRambler User-agent: ConveraCrawler User-agent: e-SocietyRobot User-agent: Twiceler User-agent: VoilaBot User-agent: SynooBot
msnbotも弾いちゃうんだ? 最近画像を拾おうとやたら熱心だが
uaで弾いてもなぁ
baiduのIPってどうやって抜くんですか?
IPを「抜く」って言う奴まだ存在してたんだな・・・
いつの時代の人だw ログとwhois参照して調べろよww
和んだw
Naverってちょこちょこ変えてくるからいやらしい
yetiって名前のbotもいるよね>naver
なんかいっぱい来てるけどTwicelerって何?
Twicelerのサイトへ行ってみたけど情報無さすぎて意味不明 ぐぐってみるとやはり正体がよくわからずあちこちで不気味な子扱いされてるな
どっかの大学の研究用だけど、微妙にバカアクセスするし目的不明で気味悪いね
IRLbotウザ
トレンドマイクロきたわ IPの最後の番号だけ微妙に変えてるあたり頭おかしいと思う
tmを排除する意味がわからん
>>252 おまえのサイトにきたことないからだろ
一度来ると1回毎にIP変えて、3,4時間アタック続ける
被害妄想じゃね?
255 :
Name_Not_Found :2007/06/21(木) 11:49:50 ID:GMKcWSaI
教えてちゃんでスマソ あまりにしつこいから百度にページ削除を依頼したら 個人情報晒せって言われたんだが、なんか物凄くモニョるんだが。 個人情報晒してまで、削除依頼した方が良いのだろうか? 宜しく頼む。
>>255 止めとけ、としか思えん
他は指定の記述をサーバーにアップするとか
そういう特定の仕方をしているし
何より百度を信用できない
>>255 個人情報を晒したら負けかなと思ってる
百度だけアク禁しておくがいい
それとrobots.txtに排除記述しておけば、数日〜数ヶ月で中身までは覗いてこなくなるよ
258 :
Name_Not_Found :2007/06/21(木) 13:04:09 ID:Jjwrix6j
女の子じゃあるまいしw それに大した個人情報でもあるまいw 他人が成り済まして削除依頼する事も考慮して本人確認したんじゃかいか?
> 数日〜数ヶ月で おまえどういう忍耐力してるんだよww 修行僧か何かか?wwww 実際、webarchivesも削除名乗り出たところでサイト管理者だと信じてくれないらしいね metaに向こう様が指定した文字いれるとか、そういう方法を取る発想はないのかな? 他スレに投下したネタの焼き回しだけど選別にどぞ- RewriteEngine on RewriteCond %{HTTP_USER_AGENT} ^Baiduspider.* RewriteRule ^.*$ - [F,L]
>>258 本人確認なら指定の記述をサーバーにアップしてくれ、という
webarchivesやgoogle形式でいいだろうと思うから胡散臭い
何より百度は個人情報言っても結局消さないでとぼける気がする
261 :
Name_Not_Found :2007/06/21(木) 13:58:35 ID:PdGX6qg8
>>260 著作権違反という言葉が実質存在しないパクリ天国だからな。。。
個人情報を晒したら255の所に山のようなスパムメールが来る に100度 ちゅーかさ、個人情報って具体的に何か知りたい。
住所氏名電話番号とかかな? そんなもん送られたところで、当該サイトの管理人かどうか ますますわからないと思うんだがw サイトで自分の個人情報晒している人間ってそんなにいないだろ。
>>259 バーローww魔法使いだよwww
俺はmod_rewrite使わずにこうしてるよ
IPで弾いてもいいけど
[.htaccess]
SetEnvIfNoCase User-Agent "Baiduspider" deny_robots # 噂の百度
SetEnvIfNoCase Referer "^
http://image\.baidu\.com " deny_robots #百度の名無しエンジン
order allow,deny
allow from all
deny from env=deny_robots
<Files robots.txt>
Allow from all
</Files>
[robots.txt]
User-agent: baiduspider
Disallow: /
まあ好きにやればいいんじゃね? 大して目新しい事してるとも思えんけど。
268 :
267 :2007/06/22(金) 12:58:36 ID:???
>259 そんな話も聞くけどwebarchivesで普通に削除してもらえたぞ 中二レベルの英文で削除依頼したらちゃんと削除された上、 消したから確認してねって中の人から報告メール来た 当然個人情報を求められる事もなく応じてくれたよ 百度が消えないんで削除依頼メールしようと思ってたが ここみてそれも無駄だと分かった悪徳業者かよ ふざけんな百度
> 消したから確認してねって中の人から報告メール来た テラ親切ww
271 :
267 :2007/06/22(金) 15:39:10 ID:???
も一個あった 122.152.129.0/17
> 消したから確認してね 不覚にも萌えたwww
273 :
Name_Not_Found :2007/06/28(木) 23:34:58 ID:plbJmISM
毎日来る…何しても来る…
そりゃやり方が悪いんだよあんた
何が悪いのかわからん…
来るけど帰ってるんでしょ? そのうち疎遠になるよ(来るけど)
しかし一度でも来て拾われると消えない
ほんと消えない 消えた人は方法教えてくれないか?
百度で消えた事がある人は今の所いないのでは
拾われたら最後と
百度の社外取締役に、元SONYの社長である井出氏が向かい入れられたんだってねぇ。 それだけ、危機的状況なのかも知れないね、実際皆から総スカン食らってるし。
282 :
Name_Not_Found :2007/07/01(日) 13:45:31 ID:X58JT3mF
>>281 んなことしても、ダメだろ
早く日本から撤退してくれ
特にbaidu攻撃で2chとwikipediaと各blogサービスが 不安定になったのは絶対に許せん
>>283 ソースくれ
ブログのネタにしたいくらい魅力的な話だ
inhoster.comとかいうホストから意味不明な爆撃に近いアクセスがあるんだが何ね?
sakura.ne.jpからBaiduspiderが来てる。
なんじゃそりゃ?
deny from .sakura.ne.jp
ほ
これだけロボット巡回させても全く使い物にならない検索サイトってどうよ
日本の利用者にとってはそうだよな
じゃあどこに利用者がいるってんだ
baiduは中国ではトップなんだが
>>296 それは知ってる
でもそれは、中国国内のサイトを検索するのが大半だろ?
今は、日本でクロールされた情報を、誰が利用していうかって話しだろ
Baidu中国とBaidu日本はデータベース違うじゃん Baidu日本は中国国内からアクセスできなくなってるし
日本で成功すれば世界でも成功するみたいな感じで始めたのかな
つ 素直に間違いを認めるのも勇気
在日
くそ、Baiduの悪口書きまくったら、俺の知らないIPできやがったww 122.152.140.205
>>92 のasianetを全部禁止したほうが良さそうね
イメージ検索だけは使ってる エロいのいっぱい出るからな
>>306 googleも一回英語モードにしてフィルター外せばエロイのでるよw
>>306 おまえまさか知らなかったってことはないよな?
うちの息子以下か?w
309 :
Name_Not_Found :2007/08/14(火) 01:17:46 ID:ASASf7jU
age
310 :
Name_Not_Found :2007/08/26(日) 22:03:23 ID:bIMds1WG
これから大量に来てた ip-122-152-140-175.asianetcom.net 122.152.140.175
*.asianetcom.net ここってBaidu以外の利用者なに?
313 :
Name_Not_Found :2007/08/27(月) 10:24:13 ID:DcU1PlzK
拒否でいいな deny from 122.152.0.0/16
最近YodaoBotとかいうのがウザい Baiduの親戚か?
>>315 「有道」っていう検索サイトのロボット…らしいよ。
>>315 兄さんじゃね?
Baiduより昔からいる
ついに有道出人がボット走らせ始めたか!とオモタ
319 :
Name_Not_Found :2007/09/11(火) 16:14:38 ID:n37Guxjz
yodaobotうぜぇぇ
キャッシュから消せとメールしたら消えた。返事はないけど。
>>320 依頼してからどのくらいで消えた? メールは英語でOK?
322 :
320 :2007/09/12(水) 10:39:12 ID:???
>>321 baidu.jpだから日本語でおk。
でも2通目の苦情を送ったら、サーバ管理者か確認したいから
「会社名(又は団体名、個人名等)、ご担当者名と電話番号連絡先」
を教えろと返事が来て、消えてたキャッシュが復活した。
3通目でrobots.txtとmetaタグを無視する理由を尋ねたところ。回答待ち。
個人情報を教えたら腹いせに悪用するよな、絶対
別にキャッシュされてもいいじゃん
ロボテキを無視してクロールし 消せと要求しても対応せず 田代砲並みに爆撃 こんな行儀の悪い会社にキャッシュなんてされたくねぇ
更に個人情報要求とか考えられない
327 :
320 :2007/09/12(水) 20:56:22 ID:???
3通目での質問に対する返事きた。 質問には答えずに、今度はクローラがアクセスしたときのログよこせだと。 クローラがどんなアクセスしてるか把握してないなんてどうなの。
手もつけられないくらい暴走してるんだろ
329 :
320 :2007/09/12(水) 22:25:33 ID:???
うちはキャッシュは諦めてクローラーを弾くことにした 範囲はクローラーのIPアドレスをwhoisして出た帯域全てだから最近は平和そのもの
332 :
320 :2007/09/13(木) 06:36:52 ID:???
>>3 の修正。
DirectoryIndexとdeny fromの2カ所。
#百度弾き推奨 .htaccess
DirectoryIndex index.html index.htm
ErrorDocument 403
http://www.baidu.com/ SetEnvIf User-Agent "Baiduspider" deny_bot
SetEnvIf User-Agent "sogou spider" deny_bot
order allow,deny
allow from all
deny from env=deny_bot
# Baiduspider_ip
deny from 60.24.0.0/13
deny from 220.181.0.0/16
deny from 61.135.0.0/16
deny from 122.152.128.0/23
DirectoryIndex index.html index.htm ↑ これいらねーよ
334 :
320 :2007/09/13(木) 10:16:19 ID:???
>>333 >>3 の意思を尊重ってことで。
それはさておき、ようやくキャッシュが消えたし、巡回も止まった。
いや、Whoisによると 122.152.128.0/23 でおk 追加すると他のが巻き込まれる inetnum: 122.152.128.0 - 122.152.129.255 descr: Baidu Kabushiki Gaisha country: JP a. [IPネットワークアドレス] 122.152.0.0/20 (122.152.0.0 - 122.152.15.255) f. [組織名] フリービット株式会社 a. [IPネットワークアドレス] 122.152.16.0/20 (122.152.16.0 - 122.15.31.255) f. [組織名] 岡山県 a. [IPネットワークアドレス] 122.152.64.0/19 (122.152.64.0 - 122.152.95.255) f. [組織名] 大分ケーブルテレコム株式会社
202.96.0.0/12は?
>>337 >>232 に書いてあるアドレスだが/12は広すぎる。
先頭部分202.96.0.0/18は中国に割り当てられてる。
inetnum: 202.96.0.0 - 202.96.63.255 ●202.96.0.0/18
netname: CNCGROUP-BJ
descr: CNCGROUP Beijing province network
descr: China Network Communications Group Corporation
descr: No.156,Fu-Xing-Men-Nei Street,
descr: Beijing 100031
country: CN ●中国
ついでに書いておくと
60.0.0.0/11
>>232 60.24.0.0/13
>>3 他
も広すぎるから絞ったほうがいい
Mozilla/5.0 (compatible; YodaoBot/1.0;
http://www.yodao.com/help/webmaster/spider/; )
inetnum: 60.191.80.0 - 60.191.83.255 ●60.191.80.0/22
netname: GUANGZHOU-WANGYI-LTD
country: CN
descr: Guangzhou Wangyi Computer Systems Co.,Ltd.
スレタイも読めない奴はカエレ
BaiduとYodaoは兄弟なんだからカエレはないだろ
Baiduspiderと愉快な仲間たちウザすぎ!! ヽ(`Д´)ノ これでおk! たまに思うんだけど、別に規制範囲が広くてもそれが中国ならいいんじゃないか。 実際にスパマー多いしさ。
> たまに思うんだけど、別に規制範囲が広くてもそれが中国ならいいんじゃないか。 スパマーの非常識な態度を非難してるんだから もっと良識ある態度とろうぜ?
IPで中国を簡単に弾けるなら弾きたいので 多少巻き込まれるくらいは願ったりかなったり
>>346 じゃあ、中国割り当てのIP全部iptableにいれて弾けよ
>>347 膨大な量になるからそこまではやらん
そこまで中国相手に必死になるつもりもない
わけのわからん検索エンジンを拒否しておけば充分。 極端な話、グーグル大先生だけで他は不要。 新しい検索エンジンなんか作らなくていい。
> IPで中国を簡単に弾けるなら弾きたいので > そこまで中国相手に必死になるつもりもない 支離滅裂なこと言うなよ
>>350 だから
>簡単に
と書いた
簡単にできるならやってるマンドクセからやらん
だからBaiduに巻き込まれて見れないのが中華圏ならいいやって話
ああ、ごめん iptableなんて知らなかったんだね
何でもそうなんだが、手間を省くためのスキルがない人がかわいそうで
日本語と対人のスキルもつけとけよw
まだわかってない奴がいるな
可哀想なんだから言うなよ
中華圏の人間のウザさを改めて思い知ったわけで アメリカやらドイツやら攻撃してる奴らが好かれるとでも
>>359 ペンタゴンを攻撃するような国は嫌われて当然
ってことも読解できないとは大陸の人ですか?
この座敷牢には情報が入って来なくてだな
Baiduspiderがやってきた。 robots.txtを読んだようだが、全然理解してない。 User-agent: *のセクションは無視するのかな・・・ 2chのdatログとそれらをHTML化したものを置いている。 datはrobots.txtでDisallowしてあるんだが、Baiduspiderはこれを 無視なさる。 datをクロールしても無駄だと思うけどね〜・・・ご勝手にどうぞ。
122.152.140.0/23 追加
>>363 Whoisで隣接ブロックが他の組織であることを確認した。
ヒマなときにbaidu.jpに問い合わせてみようかね。
inetnum: 122.152.140.0 - 122.152.141.255 ●122.152.140.0/23
netname: BAIDU-NRT-NETBLK02
descr: Baidu Kabushiki Gaisha #2
descr: Asia Netcom NRT HUB
country: JP
deny from 60.24.0.0/13
deny from 220.181.0.0/16
deny from 61.135.0.0/16
deny from 122.152.128.0/23
deny from 122.152.140.0/23
>>362 User-agent: *を書いた上でUser-agent: baiduspiderも書いてるのに、
それも無視するからあきれる。
さらに個人情報よこせ・ログよこせだからな。
>>365 baiduspiderはdatとhtml両方のクロールを続けています・・・
さぞかし見づらい検索結果となるでしょうw
Baiduの次に来始めたので
Yeti/0.01 (nhn/1noon,
[email protected] , check robots.txt daily and follow it)
IPv4 Address : 61.247.192.0-61.247.223.255 (61.247.192.0/19)
Network Name : NHN-NET
呼んだはずのgooglebotはいつまで待ってもいらっしゃらないのに 呼んでもいないBaiduspiderがいらっしゃる。 これは何ぞや。
BaiduspiderはハイパーリンクになっていないURLも拾って収集する。 気をつけよう。
問題ないよ お前以外は
余計にアクセス多くなったりとかしないかなってね。 設定してみる
ついにBaiduわけわからんアドレスにアクセスしてきやがった 無論403だが GET /ASIN/4901631705 GET /KEY/BKJ/\xa5\xef\xa1\xbc\xa5\xb0\xa5\xca\xa1\xbc/6 なんじゃこれ?
>>374 アマゾンと勘違いされてるんじゃね?www
2つ目クソワロタw なんだその日本語ドメインの偽物みたいのは
近代デザイン史 ワーグナー
2つ目ってなにでデコードすればおk?
EUC-JPじゃまいか
Vadixbotってのが爆撃してきたんだがこれも親戚?
IPアドレス出して
>>381 rrcs-67-78-34-174.sw.biz.rr.com
rrcs-67-78-34-170.sw.biz.rr.com
rrcs-67-78-34-166.sw.biz.rr.com
アメリカだったみたい
67.78.0.0/15 問題なければこれでアクセス禁止にすればOKかな?
384 :
Name_Not_Found :2007/10/20(土) 13:06:20 ID:dHM+XRl0
要はBaidu用ロボットにSEOスパムすればいいんだな?
386 :
Name_Not_Found :2007/10/21(日) 17:26:47 ID:iuguB25r
国単位でBaiduにリダイレクトって 中国アホすぎだろ(w
baiduspider!収集したいなぁ!お金が欲しい〜
389 :
Name_Not_Found :2007/11/05(月) 17:35:49 ID:NYNUppOM
>>389 削除依頼に個人情報要求する百度が何をやってるんだと
新しいサイトを作ってみたんだが 百度すら来ないww
スパマーをみんな百度にリダイレクトしてやった
アダルトサイトを運営してるんだが、中国人がよくアクセスしてくるよ。 それだけで不安w
うちは二つサイトを独自ドメイン運営しているんだけど、 普通のサイトの方は一度アクセス禁止にしたら来なくなった。 でも、もう一つのblogサイトはアクセス禁止にしても毎日やってくる。 しかも1回のアクセスじゃなくて5回も。なんなんだよ。 はっきりいうが、百度は嫌いなんだよ。二度とアクセスしてくんな! 日本人のマナーの悪さもウンザリだが、中国人の度を超えたマナーの悪さには反吐が出そうだ!
ぶっちゃけ、もうずっと拒否してるから、どんなクローラーなのかも忘れちまったが それでもbaiduが嫌いなのはなぜだろう
robots.txt無視で根こそぎ落としていくから嫌い
robots.txtだけ読めるようにしてる俺でさえ、このクローラーは嫌いだ
robots.txtだけ1日2回も律儀に読みに来る。 相手が可愛い女ならすごい萌えるんだけどなぁ。 Baiduだと借金取り並にウザいわ
400 :
Name_Not_Found :2007/12/04(火) 03:30:00 ID:r9oOozK8
サーバーに関しては素人なんですが。 百度の爆撃は大したことなんですが、最近、naverのロボットからのとんでもない絨毯爆撃にさらされていて、 急いで.htaccessで防いだんですが、当然エラーログが無限に吐き出されています。 .htaccessで防いでいる場合はサーバーに負荷はあまりかかって無いと考えていいんでしょうか? それにしてもしつこい。丸一日ずっーとindex.phpにすさまじいちょっかいを出してます。
naverも一応今はrobots.txt読んでないか? ただdenyするだけでなくrobots.txtだけはどいつでも アクセス出来るようにしといてはどうか。 そしてそこにもお帰り下さいと書いとくと。
403 :
Name_Not_Found :2007/12/04(火) 16:17:52 ID:r9oOozK8
ありがとうございます。よくわかりました。 門を閉めるだけじゃなくて、門に「韓国ロボットお断り」と 札を貼った方が良いということですね。
百度また新しいIPで来やがった
ロボテキにおまい来んな(#゚Д゚)ゴルァ!!と書いておいたら来なくなったぞ
ヒント:UA偽装
ロボテキ以外のファイルはhtaccessで蹴ってるさー
>>402 > NHNでは現在、α版の検索エンジン開発を終えてテストに入っている状況だ。
> 日本で本格的にサービスを提供するのは「2008年上半期中」(NHN)になる。
マジで・・・
勘弁してよ・・・
ルータで弾くからいいや
★百度の王湛生CFO、海上で不慮の事故死
中国国内最大の検索エンジン・百度から12月30日に得た情報によると、同社の王湛生CFO(37歳)は
先ごろ海南島で年次休暇を過ごしていた際に、海上で不慮の事故により亡くなったという。
王氏は西北工業大学に学び、1989年に渡米。世界5大会計事務所の1つであるプライスウォーター
ハウスクーパース(PwC)のニューヨーク事務所で4年働いた後、ロンドン、香港を経て2003年に北京へ。
この間、中国証券監督管理委員会の顧問を1年間担当、同時にPwC国際資本市場市本部アジア地区の
最年少パートナーとなった。
王氏は2004年9月に百度へ入社、首席財務官を担当し、2005年8月には同社の上場を成功させた。
この間同社の業績は数10倍に膨れ上がり、現在の市場価値は130億ドルを突破しているという。
また同社は、米国のナスダック100指数に初めて採用された中国企業でもある。
なお王氏は、百度の約1%の株式を所有しており、現在の市場価値は1億3000万ドル、人民元に換算すると
約10億元相当となるという。(編集AH/A)
(日中経済通信 2008/01/02(水) 13:50:48)
http://www.newschina.jp/news/category_9/child_30/item_8423.html
ずっと残ってたインデックスのキャッシュが消えたー! ロボテキとタグでお帰りくだしあを2年ぐらい続けたら表示しなくなった でもアドレスを変えた昔のファイルが未だにキャッシュされている 新しいアドレスは拾われていないが、インデックスと同じ時期に 拾われたファイルなら一緒に破棄されるとみてたんだが、 どうも違うみたいだ、謎だ…
413 :
Name_Not_Found :2008/01/08(火) 03:04:42 ID:Og8Bx0il
試験的に一部のサイトでBaiduを許可してみたが、俺がバカだった コンテンツを盗用されただけorz
415 :
Name_Not_Found :2008/01/09(水) 16:45:18 ID:BgLvwh7Q
それなんてハニートラップ?
>>417 HEAD技術ってHEADしてくるの見たことねぇよ!GET爆撃ばっかじゃないかwwww
419 :
Name_Not_Found :2008/01/13(日) 16:56:55 ID:pGDkgQ22
百度は滅べ
百度に問い合わせた人いたみたいだけど、送信に使ったメールアドレスにスパムが来てたりして。
うざいのでindex以外は認証式にした。
百度(Baidu)の社名の由来
ttp://www.baidu.jp/search/name.html 「百度(Baidu)」の名前は、この中国宋時代の古い漢詩の一節に由来しています。
「…人込みの中を幾度となく探し回った。ふと振り返ると、あの人はいた 消え入りそうな灯火のそばに」
文字通り、幾度も探すという意味の「Baidu」という言葉は、 検索エンジンのカタチそのものです。
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
ロゴ、ダサイよな正直
>>424 そのスレのどこをどう読めば
不自然なほどすごい期待されていると見えるのか
428 :
Name_Not_Found :2008/01/24(木) 22:00:25 ID:jlEtavMz
クローラー酷すぎ 早く撤退してほしい
429 :
Name_Not_Found :2008/01/25(金) 11:06:57 ID:hIuxdRgT
日本のポルノを検閲してやがる。
キャッシュ早く消せよ アタックしまくりなのに何を読みに来てんだ?
http://trendy.nikkeibp.co.jp/article/column/20080131/1006625/ > 「百度」自身はセールスポイントとして挙げていないのだが、ここまで注目され、中国人に絶大な支持を得ているのは、
>MP3形式の音楽ファイルをダウンロードする機能なのだ。欧米や日本ではMP3形式の音楽ファイルを勝手にインターネットに
>アップロードしたりダウンロードすることは著作権の関係から違法とされている。しかし、「百度」を使うと現在でも
>MP3ファイルが検索でき、その情報をたどってダウンロードすることも可能だ。「百度MP3--全球最大中文MP3搜索引?」の
>サイトは日本からでも利用できる。見た目は中国語でしか検索できないかのようだが、英語でも日本語でも検索できる。
なんでマスコミはもっとたたかないんだ。
死ねよ支那人
61.135.220.28,"","-",GET,"/sounds/Kenge_Kenge-Kenge_Kenge.mp3","","1.1",403,25,"-","","Mozilla/5.0 (compatible; YodaoBot/1.0;
http://www.yodao.com/help/webmaster/spider/; )"
61.135.220.28,"","-",GET,"/sounds/Oriental_Brothers-Oh_Dear_Jesus.mp3","","1.1",403,25,"-","","Mozilla/5.0 (compatible; YodaoBot/1.0;
http://www.yodao.com/help/webmaster/spider/; )"
61.135.220.28,"","-",GET,"/sounds/Cumbia_Palenquera-Las_Mujeres_Amargadas.mp3","","1.1",403,25,"-","","Mozilla/5.0 (compatible; YodaoBot/1.0;
http://www.yodao.com/help/webmaster/spider/; )"
61.135.220.28,"","-",GET,"/sounds/Oriental_Brothers-Oh_Dear_Jesus.mp3","","1.1",403,25,"-","","Mozilla/5.0 (compatible; YodaoBot/1.0;
http://www.yodao.com/help/webmaster/spider/; )"
61.135.220.28,"","-",GET,"/sounds/Arturo_Zambo_Cavero-El_Alcatraz.mp3","","1.1",403,25,"-","","Mozilla/5.0 (compatible; YodaoBot/1.0;
http://www.yodao.com/help/webmaster/spider/; )"
61.135.220.25,"","-",GET,"/sounds/Kiko_Kids_Jazz-Tanganyika_na_Uhuru_Kids_Jazz.mp3","","1.1",403,25,"-","","Mozilla/5.0 (compatible; YodaoBot/1.0;
http://www.yodao.com/help/webmaster/spider/; )"
61.135.220.25,"","-",GET,"/sounds/Calibre_ft_DRS-Hustlin.mp3","","1.1",403,25,"-","","Mozilla/5.0 (compatible; YodaoBot/1.0;
http://www.yodao.com/help/webmaster/spider/; )"
61.135.220.71,"","-",GET,"/sounds/Kiko_Kids_Jazz-Tanganyika_na_Uhuru_Kids_Jazz.mp3","","1.1",403,25,"-","","Mozilla/5.0 (compatible; YodaoBot/1.0;
http://www.yodao.com/help/webmaster/spider/; )"
61.135.220.71,"","-",GET,"/sounds/Kenge_Kenge-Kenge_Kenge.mp3","","1.1",403,25,"-","","Mozilla/5.0 (compatible; YodaoBot/1.0;
http://www.yodao.com/help/webmaster/spider/; )"
61.135.220.71,"","-",GET,"/sounds/Madilu_System-Ya_Jean.mp3","","1.1",403,25,"-","","Mozilla/5.0 (compatible; YodaoBot/1.0;
http://www.yodao.com/help/webmaster/spider/; )"
433 :
Name_Not_Found :2008/02/06(水) 08:15:06 ID:Cb3Cr3VB
大手レコード会社3社、中国最大手の検索エンジン「百度」を著作権侵害で提訴
国際レコード・ビデオ製作者連盟(IFPI)は現地時間2月4日、中国の大手検索エンジ
ン「百度(Baidu)」に対して、著作権侵害で提訴したことを発表した。
百度は、中国国内で最大のシェアを誇る検索サービス。MP3やWMA、rmファイルなど
の音楽データの検索サービスを提供しており、2005年3月に中国のレコード会社の上
海歩昇音楽文化伝播有限公司が著作権侵害で提訴をしたのをはじめ、大手レコー
ド会社から相次いで訴えを起こされている。
今回提訴したのは、Universal Music、Sony BMG Music Entertainment、
Warner Music Hong Kongの3社。百度では、検索結果を数十万にわたる楽曲をホス
ティングするサードパーティーのサイトへ違法にリンクしているが、3社はこれを削除するよ
うに求めていた。
しかし「数カ月にわたる交渉が決裂したため、訴訟に踏み切った」と、IFPIは説明して
いる。同様に、中国のポータルサイト「SOHU.com」を運営する、捜狐(SOHU)と、その
関連会社である探狗(Sogou)に対しても、百度を提訴した3社に加えて、Gold Label
Entertainmentが北京の民法院に訴え出たことが明らかにされた。
また、IFPIに加盟するレコード会社が2007年1月に北京高級人民法院に提訴した、
Yahoo! Chinaの著作権法違反行為に対する訴訟では、Yahoo! China側に21万元の
罰金を科す有罪判決が下され、その後のYahoo! Chinaの上告は2007年12月に棄却
されている。
しかしIFPIによると、Yahoo! Chinaはその後も裁判の結果に従わなかったため、1月に
著作権侵害行為を止めるよう親会社である米Yahoo!に対して要請を行ったことを明ら
かにしている。
http://japan.cnet.com/news/media/story/0,2000056023,20366635,00.htm
bi du ポルノ解禁しているヨ
435 :
Name_Not_Found :2008/02/16(土) 12:58:28 ID:0HChUl5N
436 :
Name_Not_Found :2008/03/02(日) 22:39:07 ID:Twve1cfz
437 :
Name_Not_Found :2008/03/14(金) 03:19:44 ID:vPrZO2kD
438 :
Name_Not_Found :2008/03/16(日) 13:03:36 ID:gKId1Mt3
チベット弾圧に抗議したら、百度も来ないかな?
>>433 いまさらだけど、これ、google八分みたいなことしろって言ってるんだな
441 :
Name_Not_Found :2008/03/17(月) 17:29:42 ID:Dd3CK9Ru
どうしよもないね中国人は
CNCもうざい
443 :
Name_Not_Found :2008/04/28(月) 08:53:02 ID:wu1h1qH2
最近どうよ? ちっとは大人しくなったみたいだが ロクな訪問者は誘導されてこないけどなー
どうもこうも… 先週何度も全ページクロール来た 全部htaccessで弾いてるけど403ログの羅列うぜぇ robot.txtは読ませてるはずなんだが 一度何ページか拾われたせいで いつまでたっても数ページは拾われたままだわ キャッシュ消えないわ…いつになったら消えるんだろう
>>444 403ログだけで大量の容量喰うんだよなぁ
死ねるよ
446 :
Name_Not_Found :2008/04/28(月) 23:33:35 ID:gk9mC4iH
>>444 403で弾いても大量のページがある場合には403のメッセージ表示のバイト数で相当のトラフィックが発生する。
そのため、403のメッセージだけでは、テキストの簡易メッセージにして尚且つ、Baiduspiderのような無法者は
iptablesのファイアウォールで弾く必要がある。
ブロックしておくべき百度のIPアドレス 60.28.17.0/24 119.63.192.0/21 ← New! 122.152.128.0/23 122.152.140.0/23
449 :
Name_Not_Found :2008/05/01(木) 08:58:29 ID:lnVAXZNK
相変わらずロボテキ読まねーな
★<ソフトバンク>中国のネット大手を買収、傘下へ
・ソフトバンクは30日、中国のインターネット大手、オーク・パシフィック・インタラクティブ
(OPI)の株式の約14%を約100億円で取得し、二十数%分の新株予約権を得た
ことを明らかにした。OPIの業績が順調に伸びれば、予約権の期限の11年までに
出資比率を約40%に高め、傘下に収める。投資総額は約400億円。
両社は7日、契約を結び、ソフトバンクの孫正義社長がOPI取締役に就任した。
OPIは、会員数約2200万人の学生向けサイト「校内網」を運営し、ネット上で友人や
知人が情報を交換するソーシャル・ネットワーキング・サービス(SNS)を提供。
ソフトバンクは急拡大する中国・アジアのネット市場を制し、世界規模で成長する
中長期戦略を描いており、すでに、中国で企業間電子商取引の70%のシェアを
握るアリババグループに約30%出資している。OPIへの出資で、企業向けから
個人向けまで、中国でのネット関連事業の基盤が整うことになる。
http://headlines.yahoo.co.jp/hl?a=20080430-00000021-mai-bus_all
OPIでは印象が薄いのでオッパイと呼ぶことにする
その勢いで百度つぶしてくれよ
マジでバイ100度勘弁
★現在中国の検索サイトでは「家楽福」検索できません
報道によると中国の、baidu(百度)、google、 soso 、sogou 、yahoo(雅虎)の5大検索サイトにおいて
「家楽福(カルフール)」が検索できなくなっているという。
北京市公安局公共信息網絡(情報ネット)安全監察所の宿直員によると、「家楽福」関連のニュースは
中仏関係に影響するものが多く、また「藏独」(藏はチベットの意)と同様にそのニュースの内容が法律・
法規的に合わない可能性があるので開示できないのではないかと解釈している。
カルフール北方地区総部の関係部門担当者はこの状況をすでに2日前から把握しており、消費者には
「何かあれば直接店舗に来てポスター等で確認するか、電話で問い合わせして欲しい」と言っている。
(エクスプロア中国 2008年05月01日掲載)
http://www2.explore.ne.jp/news/article.php?id=9004&r=sh
456 :
Name_Not_Found :2008/05/01(木) 22:27:00 ID:12gRAtXA
Googleの携帯サイト用のロボットもrobot.txtを読まない。 あんまし煩いからIPで遮断してやった
一時期ものすごかったけど、ひたすら404返してたら来なくなった クローラーが来なくなって1年程度でキャッシュもやっと消えたようだが、 いつまでたっても気が抜けん
baiduウザイよー。 ルーターではたき落としてるけど。
はたき落としてるなら、もうウザくないじゃん…
460 :
Name_Not_Found :2008/05/05(月) 23:16:42 ID:S/JZ3E2a
はたき落としても来てる事実がウザイだろ
カルフールって言葉を入れておけばこなくなるんじゃね?
頭いいな
おまじない 天安門事件(四五天安門事件、六四天安門事件) 、法輪功、反共産主義 民主政治、台湾問題 (台湾独立、中華民国総統選挙)、Taiwan Tibet、チベット独立(チベット動乱、ダライ・ラマ)、密輸(走私) 多党制、専制、激流中国、中国共産党、文化大革命、毛沢東、 ポルノグラフィ(色情) 六合彩、ギャンブル(賭博)
464 :
Name_Not_Found :2008/05/26(月) 02:57:56 ID:GR/dGS+A
その手があったか
豆知識 脱毛というキーワードを入れておくと 脱毛沢東思想ととられて中国から隔離される うそだけど
>>448 それブロックしてもまだ来ますぜ!
htaccessじゃ無理なの?
来るものは来る、というかログには残るけど404や403掴ませてればおk そのうち来なくなる
ぐぐる、やふー、MSNよりエグくクロールしてくるのに先月のbaidu.jpからの来訪者一人だた いらねーな
cgiファイルだけにアタックかましてログファイルぶっ壊して行くのがなあ 他のテキストや画像ファイルはスルーする 一体何を目的にクロールして行ってるんだか
初めてbaidu.jpからの来訪者キタ━━━━(゚∀゚)━━━━!!!! 一人っきりな
バイドゥーを弾くんじゃなくて、バイドゥーーから来た訪問者を閉め出すってのは? 「ごめんなさい、バイドゥーからの訪問は固くお断りさせていただきます」って ま、早い話がバイドウの顧客つぶしになるんだけど。
ここのクローラー、今のとこ来るたびに弾けてるけど 毎回既に鯖上に無いファイルを一つだけ掴んでく跡が残ってるんだよな・・わけ分からん 依然拾われた事のあるファイルなんだが これ向こうのキャッシュが何か関係してんのかね
>>471 がbaidu.jpにアタックかけて潰せばおk
重労働になりそう
天安門事件,四五天安門事件,六四天安門事件,中國六四真相,六四事件,民主政治, 臺灣問題,中華民國総統選挙,密輸走私,多黨制,専制,文化大革命,情報統制,言論弾圧, 西藏獨立,新強獨立,六合彩,賭博,自由,九評共産黨,大紀元時報,喇嘛,達ョ喇嘛,土伯特, 唐古特,人権,民主主義,6月4日,法輪功,反共産主義,臺灣獨立,密輸,公金,支那,色情 Taiwan,Free Tibet,The Epoch Times,Dalai Lama Human Rights in China,Human Rights in Tibet,Human Rights in Tubet Nanjing Massacre is anti-Japan propaganda by the Chinese Communist Party. In a battle of Nanjing of 1937, the massacre by the Japanese armed forces was not taking place. When a battle happened in Nanjing, the population of Nanjing was about 200,000 people. The Chinese armed forces were taught to the military adviser of Nazi Germany and it was modernized and was strong. The Chinese army was about 50,000 soldiers. About 30,000 Japnanese soldier were killed in battles, and the Japanese armed forces became about 70,000 soldiers. When a battle of Nanjing was over, the population of Nanjing was about 270,000 people. Conclusion: There was not the massacre by the Japanese armed forces in Nanjing of1937.
、,;'"´'"´´``ヽ (゙゙゙''''⌒"´``'゙゙゙''''ー-'"´``'゙''"´ 支 ノ ヽ 滾 支 男 那 | : 出 那 盜 豬 | | 去 豬 女 | |. ! 娼 ) | 、,.;'"´'"´´`‖ (⌒"´``'゙゙゙''''ー-'"´``'゙''"´ ‖ . ‖ ‖ ‖ /'⊃`i, ‖ / ノ‖゙ i"⊂i, , ,/ ヽ ‖`ヽ、 ∧__,,∧ /,,/ ゙ヽ、 .ヽ,_ ( ^ Д^)/ / `\ `'ヽ '" / ヽ、 ,゙ i i i | i |
477 :
Name_Not_Found :2008/06/13(金) 01:31:49 ID:BpU38tLL
481 :
Name_Not_Found :2008/06/19(木) 18:04:06 ID:YcKlXf7V
baiduって名前が気にくわない。
482 :
Name_Not_Found :2008/06/19(木) 20:01:54 ID:fICmOPHX
>>478 記事にするのはいいけど、IPと対策も載せてほしいわな
面倒なのでbaiduはバイブと呼んでる
>>484 61.135.168.97は中国本土になってるな
61.128.0.0/10が61.135.168.97を含む中国本土になってる部分
遮断するが良ろし
>>484 うちも確認した(61.135.163.*)
ルーターで遮断してるのも関わらずHTTPログに残ってるんだけど ルーター超えしてくるの?百度は
489 :
Name_Not_Found :2008/06/23(月) 17:21:22 ID:oRQLPVoN
ライブドアもブロックだな、こりゃ
百度の日本法人、ライブドア向けに画像検索エンジン提供
中国のネット検索最大手、百度(バイドゥ・ドット・コム)の日本法人は
23日、ライブドア(東京・新宿)が提供するポータルサイトに同日から、
「Baidu.jp」の画像検索エンジンの提供を始めると発表した。百度が
日本で検索エンジンを外部提供するのは初めて。今後は利用者が
ライブドアのサイトで画像を検索する場合、百度の検索エンジンを
介して探すことになる。
百度は1月に日本語版の正式運用を開始した。同業者への提供を
通じてブランドの浸透を狙う。 (14:08)
http://www.nikkei.co.jp/news/main/20080623AT3K2300D23062008.html
うちは画像が無いから関係ねー
一通りクロールされたら大人しくなったかな 画像はリファラ規制だな
むかしbaiduにごっそりとられたサイトの写真が、livedoorの画像検索に そのまんま出とる… しかもこっちは著作権があるとも書かれていない
>>489 ヽ
つ
わ
ぁぁ
あぁ
ああ
ぁあ
ヽ\ //
,、_,、 。
゚ (゚jコ゚)っ ゚
(っノ
`J
中国から規制されてるサイト一覧 www.greatfirewallofchina.org/test/
naverだけど最近になってちょいちょい来るようになった 絨毯爆撃はしないがhtaccessも無視してページ拾ってく どうしろっていうんじゃ
どういうhtaccessだよ
>>496 IPで弾いてる…はずなんだが、毎回来てはピンポイントに2,3ページだけ拾ってくんだ
他はちゃんと404返せてるようなんだが
弾いてるのはこれ
202.179.176.0/21
220.88.0.0/14
61.247.192.0/19
404を返すのは弾いてるとは言わん
>>497 これを弾け
60.28.17.0/24
119.63.192.0/21
122.152.128.0/23
122.152.140.0/23
やだおボットって新しいbaidu?
>>503 前からあるでよ
百度と同じく「有道」っていう大陸の検索サイト
119.63.193.190
119.63.193.225
119.63.193.191
119.63.193.223
119.63.193.193
この辺はUAがBaiduspider+(+
http://www.baidu.com/search/spider_jp.html )できてたが
119.63.193.224はMozilla/4.0 (compatible; MSIE 5.0; Windows 98; DigExt)だったんだけど
これって百度じゃないの?
ピンポイントで拾っていく挙動が百度と一緒なんだ
119.63.193.ではじいてるから拾われてはいないようだけど偽装するようになったのか?
[whois.apnic.net]
% [whois.apnic.net node-2]
% Whois data copyright terms
http://www.apnic.net/db/dbcopyright.html inetnum: 119.63.192.0 - 119.63.199.255
netname: BAIDUJP
descr: Baidu, Inc.
descr: Roppongi-Hills Mori-Tower 20th Floor,
descr: 6-10-1 Roppongi Minato-ku, Tokyo 106-0032 Japan
country: JP
admin-c: JNIC1-AP
tech-c: JNIC1-AP
status: ALLOCATED PORTABLE
remarks: Email address for spam or abuse complaints :
[email protected] changed:
[email protected] 20070122
mnt-by: MAINT-JPNIC
mnt-lower: MAINT-JPNIC
source: APNIC
507 :
Name_Not_Found :2008/07/18(金) 09:29:01 ID:LH/qEghb
119.63.192.0 - 119.63.199.255 を弾くのってこの書き方でOK? deny from 119.63.192.0/119.63.199.255
119.63.*.*ってルーターで弾いてるのにApacheで200を返してるよ なんでだろうか? ルーターではすべてのプロトコルで119.63.*.*は弾いてるのにな・・・ わからん
設定がうまくいってないんだろ
510 :
508 :2008/07/18(金) 13:44:23 ID:???
>>509 設定見直してみた119.63.192.0/12ってなってたスマソ
それで早速書き換えたけど今度は403を返してると
Apacheがなんで反応してるのかな?
ルーターはフレッツの住友電工のCTU
ルータの後ろにサーバがあるんだろ? サーバが反応しているって事はルータで制御できてないって事 DMZとかになってるんじゃないの?
百度からの集客を真面目に考えたいのだが、 みかたにするべきか敵にするべきか考えています。 どうなんだろう? 今はルーターで百度からのアクセスを弾いています。
ここ1ヶ月でBaidu.jpからは10人と来なかったな ぐぐるの10マソ分の1、やふーの1マソ分の1の割合だな
514 :
512 :2008/08/03(日) 19:37:50 ID:???
まあ昔みたいにアフォなアクセスはしてこないから蹴るまでもないかと 最近はやふーの方が狂ったクロールしてくるねえ
516 :
512 :2008/08/04(月) 09:21:29 ID:???
百度はサイトマップを申請する仕組はないのかな?
最近、このIPから百度が来るようになった。 61.135.168.97 61.135.168.34 61.135.168.107
>>433 MP3検索試してみたら、MP3置いてあるのがpodcache.cctv.comで吹いたわw
国営放送がMP3違法に保管してるのなw
>>506 六本木ヒルズ森タワー20階に100℃日本支局
入ってんのかー。意外だな。
BaiduSpider弾きチェックして欲しい人手あげれ。
(と言っても、UAのBaiduSpiderもどきだけど。。。)
>>519 ならそのうちヒルズの呪いとやらで死滅するんじゃね?
いや、してください。
中華と姦からのアクセスを全部はじけば済む話
ぐぐるややふーも来なくなっちゃうけどナー
>>526 ヤフーは特定の会社のアフィ入れると著しくランク下がったりで
実質弾いても影響が無い、とかなんとかYST板
リアル交流があったり、メディアミックスがあると口コミ効果で済む
検索ロボなんて画像略奪の負荷マシーンに過ぎない。ユーザの持ち出しに
悩む所だけど・・・
中韓全部弾いてるがgoogleはちゃんとインデックスされる Yahoo!はされない
ロボテキでBaiduspiderだけ弾いてもだめなんだな Baidusupider+も弾くようにしたらこなくなった
User-agent: Baiduspider Disallow: / User-agent: Baiduspider+ Disallow: / User-agent: BaiduImagespider Disallow: /
六四天安門事件・天安門大屠殺 Red China army killed great number of Chinese democratization's people in Tienanmen Square in 1989 Jun .Their China military's tanks killed many democratic citizen . It was awesome and shocking ! 文化大革命 Over 40 million Chinese were massacred by red China of Mao Zedong in Chinese culture revolution (1966-79) .It's awesome cruel !! , communism that ... , just a mad dog ! Unbelievable ! But that's truth that all .Cause , red China is the bloody red beast or Satan's country and area in Bible's John's holy prophecy . 人權 Human Rights 民運 Democratization 自由 Freedom 獨立 Independence 多黨制 Multi-party system 胡耀邦 趙紫陽 魏京生 反共 法輪功 北京之春 激流中國 大紀元時報 九評論共産黨 獨裁 專制 壓制 侵略 掠奪 破壞 屠殺 民族浄化 ?臟器官 蛇頭 游進 走私 六合彩 賭博 色情 中華民國 Republic of China 西藏 Tibet 達ョ喇嘛 Dalai Lama 東突厥斯坦 East Turkistan
535 :
Name_Not_Found :2008/12/12(金) 08:28:08 ID:MuoWsE+/
ウィルコムオワタ \(^o^)/
168.238.88.202.asianet.co.inってのが回って来たんだけど ちなみにxreaのレン鯖だから、鯖自体は日本にあると思う
レン鯖屋がasianetcomのインドのデータセンタの鯖を借りて貸してるんじゃないの?
今見たら、上位はNTTになってるけど・・・ あと、鯖はやっぱり日本にあるみたいだ
539 :
Name_Not_Found :2008/12/20(土) 20:39:51 ID:IKwnn9qV
htaccessで弾いたら一秒間に20回のアクセスというふうに暴れだしたw エラーログが大変なことになっております。
ファイヤーウォールで弾け
541 :
Name_Not_Found :2008/12/20(土) 22:13:20 ID:IKwnn9qV
ファイアーウォールを確認したら、こんなのがw ちなみに、これはごく一部。恐ろしいほど永遠に続いている。 Dec 20 21:46:06 ns1 pop3[7639]: badlogin: adsl.hnpt.com.vn [203.210.192.154] plaintext amor Dec 20 21:46:11 ns1 pop3[7640]: badlogin: adsl.hnpt.com.vn [203.210.192.154] plaintext amy Dec 20 21:46:16 ns1 pop3[7641]: badlogin: adsl.hnpt.com.vn [203.210.192.154] plaintext an Dec 20 21:46:20 ns1 pop3[7642]: badlogin: adsl.hnpt.com.vn [203.210.192.154] plaintext ana Dec 20 21:46:25 ns1 pop3[7643]: badlogin: adsl.hnpt.com.vn [203.210.192.154] plaintext anabel Dec 20 21:46:30 ns1 pop3[7644]: badlogin: adsl.hnpt.com.vn [203.210.192.154] plaintext anais Dec 20 21:46:34 ns1 pop3[7650]: badlogin: adsl.hnpt.com.vn [203.210.192.154] plaintext analiese Dec 20 21:46:39 ns1 pop3[7653]: badlogin: adsl.hnpt.com.vn [203.210.192.154] plaintext analisa Dec 20 21:46:44 ns1 pop3[7654]: badlogin: adsl.hnpt.com.vn [203.210.192.154] plaintext analyn Dec 20 21:46:48 ns1 pop3[7655]: badlogin: adsl.hnpt.com.vn [203.210.192.154] plaintext anastasia Dec 20 21:46:53 ns1 pop3[7656]: badlogin: adsl.hnpt.com.vn [203.210.192.154] plaintext andi Dec 20 21:46:58 ns1 pop3[7657]: badlogin: adsl.hnpt.com.vn [203.210.192.154] plaintext andra Dec 20 21:47:02 ns1 pop3[7662]: badlogin: adsl.hnpt.com.vn [203.210.192.154] plaintext andralyn
こんな感じでやればIPレベルでブロックできますかね? まだ足りないところあります? もう少しスマートにできそうな気もするのですが。 あ、いくつか重複してるっぽい(^^;; order allow,deny allow from all deny from 122.152.128. deny from 122.152.129. deny from 60.24.0.0/13 deny from 60.28.17.0/24 deny from 61.135.168. deny from 61.135.0.0/16 deny from 119.63.193.0/21 deny from 119.63.192.0/21 deny from 122.152.140.0/23 deny from 122.152.128.0/23 deny from 203.226.0.0/15 deny from 220.181.0.0/16
deny from 122.152.128. と deny from 122.152.129. は deny from 122.152.128.0/23 で1行に出来る deny from 61.135.168. は deny from 61.135.0.0/16 の 中に含まれてるから削れる deny from 119.63.192.0/21 と deny from 119.63.193.0/21 は 119.63.192.0/21 で完全に百度をまとめられる 後は百度が関係なさそうだから答えないでおく
544 :
542 :2008/12/29(月) 14:53:04 ID:???
>>543 ありがとでしたー。これで試してみます。
547 :
Name_Not_Found :2009/01/25(日) 20:40:11 ID:w+rp5y72
エロ動画専用エンジン、エロスパイダーと名告げるよう
548 :
Name_Not_Found :2009/02/03(火) 07:57:23 ID:lC7Jq/zl
>>545 パクっても、そっちで見れなきゃ違反じゃありませんってか
噴いたw すごい著作権対策があったもんだな。
>>545 ちうごくのロボットは日本にも来るなと言いたい
ノーガード戦法なみのインパクトがある
糞Baiduのお陰で、糞bot排除に目覚めた。 とりあえずBaidu一式(Baiduspider・Baiduspider+・BaiduImagespider)はrobots.txtは 読むものの従わない事が理解できたので、.htaccessで403吐かせてたらそこから2日 後にパタリと来なくなった。 Baiduとは関係なさげなんだけど 150.70.84.24 150.70.84.46 こいつ何? 今回のBaidu排除作業上、改めてlog精査してみたら、うちのindexに定期的(キッチリ 2hに1度)にping打ってきてる事が判明。 今回こちらが気付いて、.htaccessで403吐かすまで、ずーーーーーーっと 150.70.84.24 から定期ping打ってきてて、.htaccessで403吐かせたら、次の日から 150.70.84.46 で再び同様の定期ping活動を再開。 クローラーでもなさげだし、何だろうと思って具々ってみたら、他所のサイトのアク解 ページても頻繁にこのip出てくる。 何なのコレ? 気持ち悪くてかなわん。
150.70.84.24 150.70.84.46 Asia Pacific Network Information Centre だと 何の為に定期的にうちに?
554 :
Name_Not_Found :2009/02/14(土) 12:32:59 ID:cnvB4FYY
150.70.84.* の中から全て同じ動きで来るから 150.70.84.0/24 で弾くが良い しばらく放っとくと、来なくなるみたい。正体は未だ不明
555 :
Name_Not_Found :2009/02/14(土) 13:00:46 ID:cnvB4FYY
調査ありがと。 バスターが絡んでるのか… バスター使ってるんだけど、2009になってクソ重くなったし、検出率なんかもやたら落ちたと評判だから、ちょうど他に乗り換えようかと思ってたとこ。 まあ 150.70.84.24 150.70.84.46 の定期pingも、糞Baiduほど負荷かける挙動はしてなさげなのでしばらく様子見るけど、あまり酷くなる様ならまた対策考えますわ。
基地外と言ってもいいくらいのアクセス頻度じゃねーのか トレンドマイクロ 全部Biaduにリダイレクトしてやってるが
222.141.50.175
こいつくそうぜええええ
560 :
Name_Not_Found :2009/03/30(月) 12:44:30 ID:RNLtfV7M
これはいい事聞いた
それ時々話題に出るけどさ、今のところはおまじない程度だと思うよ。 うちのトコや周辺サイトで実験したけど中国系BOTの襲来や中国のspamは止まず、 有意差は確認できなかった。金盾は存在しているのかもしれないけど、現時点では効果が 微妙と見る。そもそも国策検索エンジンの色もあるbaiduだけ穴を開けているかもしらん。 そういう単語が効果があると妄信して2chのあちこちにマルチポストして規制された馬鹿が居たんで、ま、程ほどにな。
百度からの集客って、意味ある? 百度からのクロールを許可している人で見解を聞きたいです。
今ははっきり言って意味茄子 数年後は分からん 素人向けのサイトつくればやふーからばっかりだしマニア向けのサイトつくればぐぐるからばっかりだな
566 :
564 :2009/04/10(金) 18:08:59 ID:???
>>565 そうですか。。。
私の場合、
gとyとmからの集客は
g>m>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>y
です。
百度は昔アク禁にして、
再考するとどうなるかな?
と思った次第です。
うちのサイトのケースだと、 GとYは共に一万越えているのと同じ期間で(この両者はほぼ同数)、 百度から来たのは2人だけ。集客力はその程度。 わざわざ許可しても意味ないので、ブロックできているならその方がいいと思う。
以前のようにエグいクロールはしてこなくなったから蹴ってはいないけどね とりあえず画像やドガファイルへのアクセスはdenyしてる ロボテキのdisallowにも従ってはいるみたいだが信用はしない
コイツに拾われて良い事なんて無いから 永久追放
うちもぐぐるから1マソアクセスある間に百度1アクセス 日本語な人で百度なんて使うのいるのかね・・・ それよりも最近MSNがウザいな
MSNは最近ロボ増やした? 猛烈にアクセスあってびびったんだが
クロールするなら客連れて来いってんだよなあ
百度使ったのはエゴサーチしてみたときのみ 画像検索も別にたいしたことないし
575 :
Name_Not_Found :2009/05/12(火) 21:16:20 ID:RLcvy2vM
定期的にbaiduを弾くIP範囲を教えて欲しい
最近はロボテキでおk
本当にどうでも良い事だが、ロボテキっていうキモい略語はどこから産まれたんだろうか。
「二つの単語で構成されている名詞の略称は、それぞれの単語の頭二文字を足したもの」 ってのは、日本ではかなり昔から一般的じゃね?パソコンなんてない時代から。
579 :
Name_Not_Found :2009/05/30(土) 08:03:31 ID:oKcoe+Qa
百度はエロ画像検索の分野では既に日本でもトップシェア
追加 123.125.66.0/24 ただし確実ではないんで安心を選びたいなら 123.112.0.0/12 で弾くのが吉
Baiduのロボット拒否してるけど、Baiduから「解除してくれないか」ってメールが来た。 ロボットばっかりで、それに見合う人を送り込んでくれないサーチエンジンは塵以下。
>>581 そんなこと言ってくるの?
うぜぇぇぇぇぇぇ!!!
拒否するに限る
お約束のAA貼り付けて返信するだろ
最近spinn3rとかいうのがウザいわ 久しぶりにロボテキ読むくせに爆撃してくるクローラー見た
UA詐称するにしても、もうちょっと上手くやれよ(w
別に中国嫌いではない自分でも、中国人全体が信用できなくなる今日この頃
61.135.163.156 - - [13/Oct/2009:04:13:10 +0900] ****** "Baiduspider+(+
http://www.baidu.jp/spider/ )"
61.135.163.156 - - [13/Oct/2009:05:13:13 +0900] ****** "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.0)"
中国人は人口多いからロボトもすごくたくさん。たくさんね。これからもと増えるよ。
IPブロックと「公式の」拒否の意思表示タグ使ってるけど、
それでもまだまだクローラーとか山ほどきやがる。
当然httaccessではじいてるけど、はじくだけでもエラー出力して
サーバーの負担になるんだよな。いい加減にしろよ。
>>581-582 でも話題になったメール、うちにも来たけど無視。
どういうサイトにくるの?大手なんかな
590 :
Name_Not_Found :2009/12/26(土) 10:01:01 ID:yOvbc0R3
baiduをrobots.txtで弾いたら狂ったように / にアクセス来てるんだが つーか / も禁止してるんだよ糞クローラー UAも偽装してるし >119.63.193.70 - - [25/Dec/2009:01:09:55 +0900] "GET / HTTP/1.1" 200 953 "-" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1)"
とりあえず「六四天安門事件」と「天安門大虐殺」あたりのワードをサイト内にちりばめといたら?
592 :
Name_Not_Found :2010/01/05(火) 15:09:54 ID:n8ScyYOG
User-Agent: Baiduspider disallow: / User-Agent: Baiduspider+ disallow: / User-Agent: BaiduMobaider disallow: / User-Agent: BaiduImagespider disallow: / ってrobots.txtに書いてもクロールするってどうしてなの? もちろんロボテキはドメイントップにおいてる
593 :
Name_Not_Found :2010/01/05(火) 16:33:22 ID:JMvrZzB6
クロールしたいからだろかと。 好きなんだよ勝手にクロールするのが
ダライ・ラマ14世の画像でもサイト内に貼っといたら?w シナ国では彼の画像(写真)を保有するだけでも公安の取締対象になるらしいしw
595 :
Name_Not_Found :2010/01/05(火) 19:52:06 ID:n8ScyYOG
dw Baidu www まじしねw
Baiduがちゃんとロボテキ読んでるか? .htaccessに変なコト書いて読めなくしてたり
597 :
Name_Not_Found :2010/01/05(火) 21:47:14 ID:24GNap0I
ロボットテキストにアクセスはしているが、読んでいるとは限らない。 とにもかくにも、なんでもかんでもアクセスしたらいいと思っているようだから、 ロボットテキストも単なるアクセス対象でしかないかとw
中華の情報統制ってどんな感じでやってんだろ? あやつらの事だからバリバリ人海戦術で、 「アイヤー またこんなサイト見つけたアルよー」 「アイヤーこっちも」 「アイヤー…」 ってな感じなんだろうか そもそもクローラーも実は人力手動収集だったりして
599 :
Name_Not_Found :2010/01/14(木) 23:15:29 ID:VnufXfq/
百度のクローラーが急にこなくなった。
600 :
Name_Not_Found :2010/01/15(金) 11:33:58 ID:0qVZrY1p
CS2からCS4に移行しても いまだにイマイチ理解できないブリッジ 使いこなせていないだけなのか、 はたまたファイル・データ管理能力にわたたしが優れているだけなのか ・・・存在理由がわかりませんw
601 :
Name_Not_Found :2010/04/02(金) 10:11:10 ID:bojmH/JP
中国はgoogleだけじゃなくて baiduspiderも遮断してくれ
糞百度はもちろんだけど、Sogouも大概ウザくないかい? なんで中華って揃いも揃ってアレなんだろう・・・
以前からXoopsサイト運営してて データーベース重いなぁ、仕方ないか安物鯖だしと思ってたんだけど たまたまこのスレも含めBaiduspider弾くと吉という情報を知って 試しにロボテクでBaiduspider弾いたら・・・ 凄い、はえーようちのサイトwww 俺涙目 これまであまりアクセスログ見なかったので過去のデータ検証してみたら 今までBaiduspiderが5秒ごとにうちのサイトのいろんなページに同時に何個もアクセスしまくってたorz 全て中国人のせいだと知った今日の出来事でした。
ロボテキで弾ける時代でよかったな
605 :
Name_Not_Found :2010/06/09(水) 23:01:58 ID:9amhemXZ
日本も楽酷天でしょ
またBaiduのクローラーがUA名乗らなくなったな
608 :
Name_Not_Found :2010/12/14(火) 05:49:28 ID:GIK5URm7
たまにはage
609 :
Name_Not_Found :2011/01/12(水) 18:05:01 ID:OYZIc+I0
wordpress3.0で「検索エンジンをブロック」にチェックを入れても baiduspiderだけアクセスしてきたw 最高にウザ過ぎるw
610 :
Name_Not_Found :2011/01/24(月) 17:08:52 ID:HFpLT/G3
BaiduMobaider 「BaiduMobaider」は、モバイルサイト検索向けのクローラーです。 取得した情報はモバイル検索のインデックス構築に利用されます。 ※BaiduMobaiderの利用するIPアドレスの範囲は [119.63.195.0/24(119.63.195.1-119.63.195.254)] となります。
611 :
Name_Not_Found :2011/02/01(火) 08:38:01 ID:gMdgdYPg
わたしの国ではそれ当然よ 何もわるいことしてないよ みんながただで見られてすごくべんりなのに何言ってる! おまえばかか!
Baiduブロックしてて、よかった〜 (^o^)
ぶろっくしてもわたしUAぎそうしてアクセスするよ! いやがられても関係ないよ! おまえのものはおれのもの おまえの領土もおれの領土 中華のろぼとをばかにするな!
615 :
Name_Not_Found :2011/02/19(土) 10:00:17 ID:fI/N/ShU
最近また活発だよ死ね!
創価死ね 創価死ね 創価死ね 創価死ね 創価死ね 創価死ね 創価死ね 創価死ね 創価死ね 創価死ね 創価死ね 創価死ね 創価死ね 創価死ね 創価死ね 創価死ね 創価死ね 創価死ね 創価死ね 創価死ね 創価死ね
創価死ね 創価死ね 創価死ね 創価死ね 創価死ね 創価死ね 創価死ね 創価死ね 創価死ね 創価死ね 創価死ね 創価死ね 創価死ね 創価死ね 創価死ね 創価死ね 創価死ね 創価死ね 創価死ね 創価死ね 創価死ね 創価死ね
(゚听)イラネ
偽装UA Mozilla/5.0 (Windows NT 6.1; WOW64; rv:18.0) Gecko/20100101 Firefox/18.0 リファラー www.baidu.com 使ってたIP アクセス元は中国 123.151.39.34〜123.151.39.43 IPの範囲 123.150.0.0 - 123.151.255.255 存在してないファイルを1時間に数万回、合計で数十万回のアクセス。
アンインストールしたのに何時の間にか復活。 再びアンインストールするもプログラムファイルにはファイルがきっちり残ってるwww 削除しようとすると「別のプログラムがページを開いています」と拒否。 数ヶ月後「Hao123をホームページに(ry」 確認すると、何時の間にやらBaidu IME復活wwwwwwww ゾンビかてめぇは
アンインストールしたのに何時の間にか復活。 再びアンインストールするもプログラムファイルにはファイルがきっちり残ってるwww 削除しようとすると「別のプログラムがページを開いています」と拒否。 試行錯誤の末に何とか削除完了。やれやれ。 数ヶ月後「Hao123をホームページに(ry」 確認すると、何時の間にやらBaidu IME復活wwwwwwww ゾンビかてめぇは。
初期設定を送信しないにしても、入力全文、PCのID、使用しているソフトの情報が過去4年間漏れていた。
■中国最大手の検索サイト 入力情報を無断送信
12月26日 4時17分
>中国最大手の検索サイト「百度(バイドゥ)」が提供する日本語の入力ソフトが、パソコンに
打ち込まれたほぼすべての情報を、利用者に無断で外部に送信していたことが分かりました。
>このソフトは、初期設定ではパソコンの情報を外部に送信しないと表示していますが、セキュ
リティー会社のネットエージェントなどが分析したところ、実際には国内にある百度のサーバー
に情報を送信していることが分かりました。送っている内容は、利用者がパソコンで打ち込んだ
ほぼすべての情報と、パソコン固有のID、メールやワードなど利用しているソフトの名前です。
また、百度がスマートフォン向けに提供している「Simeji(シメジ)」という人気の日本語入力ソフト
も、情報の送信を行っていることが確認されました。
全文
ttp://www3.nhk.or.jp/news/html/20131226/t10014117561000.html