935 :
ロボ:2007/11/04(日) 00:52:10 ID:O5vkxBfZ0
ヤフのインデックス数が70超過になってたw
この前までは無かったのに、ロボテキ入れてなかった頃の内部ページが
今見たらごっそり拾われてる。
定期的にディレクトリ変えてるからそこにはもう何もないんだけどなー
トップしか引っかからなかったのにうちも60ページくらいインデックスされてた
メタタグも無視されてるっぽい
937 :
ロボ:2007/11/05(月) 17:55:10 ID:y3n3VJEO0
938 :
ロボ:2007/11/05(月) 18:10:04 ID:ucSo9/8j0
百度は悪名高いが
動画検索って同人にあんまり関係なくないか?
939 :
ロボ:2007/11/06(火) 00:08:23 ID:K7xkHEla0
同じプロバイダでドメインのお尻がxxx.ad.jpとxxx.ne.jpと違うのが解析に引っかかったんだけれど、
これは提供元のプロバイダが同じでも何か違う?
初めてのことなんでよくわからないので教えてもらえるとありがたい。
940 :
ろぼ:2007/11/06(火) 00:11:02 ID:zgj8PH/a0
>>939 多分、それは元々からドメインを持っていたプロバイダと
後から傘下に入った(吸収合併された)プロバイダでドメイン変えているんだと思う
うちがそうだから。
941 :
ロボ:2007/11/09(金) 09:43:41 ID:gd5BndDX0
marunouchi.tokyo.ocn.ne.jpって昔にちゃんで規制されてたじゃん
今もかどうかは知らないけど
しつこいクローラーだったりするし
ここの皆は弾いたりしてる?
942 :
ロボ:2007/11/09(金) 11:06:44 ID:SXxetpMc0
えっそれクローラーなの?
うち来てるよ…普通の閲覧者さんのアクセスだと思ってたorz
943 :
ロボ:2007/11/09(金) 11:13:24 ID:MaYJ5s7l0
それ友人のプロバだw
このプロバのクローラーというのは知らないが
同プロバを利用しているユーザの誰かが
自前で設置して動かしているものじゃないかな
944 :
ロボ:2007/11/09(金) 11:16:06 ID:WjDAy2sm0
945 :
ロボ:2007/11/09(金) 13:28:50 ID:73tuk8Sd0
*marunouchi.tokyo.ocn.ne.jpと*osakakita.osaka.ocn.ne.jp
は大きな掲示板運営してるとこは、ほとんど弾いてるはず。
某所では、ホストがこれらの場合は
プロバを変更した方が、これからの自分のためですよ書かれてるw
*.ap.yournet.ne.jp *.ap.gmo-access.jp *.o-tokyo.nttpc.ne.jp
*.d-osaka.nttpc.ne.jp *.p-osaka.nttpc.ne.jp
この辺もスパムばっか。
自分も確かにスパムでくるのは、ocnばっかなんだよね。
メルフォ名変更してるから、手当たり次第の文字羅列で
アタックされるだけで、投稿出来ないんだけど。
はてなもmarunouchiで、特にウザイなーと感じるホスト。
友人がいるから弾かないけどw
946 :
ロボ:2007/11/09(金) 13:53:28 ID:G+vu7Swh0
>945
両方来てら…orz
947 :
ロボ:2007/11/09(金) 14:11:46 ID:B8qxqabC0
948 :
ロボ:2007/11/09(金) 14:19:25 ID:rfZEQxvu0
>945
普通に自宅のがモロそれだ…掲示板書き込んだりしないから
気づかなかったけど規制されてんのか
>946-947
普通の閲覧者の可能性も高いので弾かないであげてください…
949 :
ロボ:2007/11/09(金) 14:20:50 ID:73tuk8Sd0
>>946-947 いやいや、書き方が悪かったけど普通の閲覧者だって多い上で
スパムも多いねって話だよ。全部がスパムじゃない。
どういう割り当てがわからないけど、友人は
埼玉の東京から最も遠い地域に住んでるのに、marunouchi.tokyo.ocn。
950 :
ロボ:2007/11/09(金) 17:05:52 ID:G+vu7Swh0
>949
いや、どっちにしろうちにきてる粘着っぽかったから弾こうかどうしようか悩んでたんだ。
951 :
ロボ:2007/11/09(金) 17:45:46 ID:gd5BndDX0
そか
普通の閲覧者もいるんだな
鯖負荷の具合みて大丈夫な限りは弾かないで様子見するよ
参考になりました
ありがとう
最近ヲチ関係スレで何か進展あったのか?
953 :
アク解:2007/11/10(土) 00:58:33 ID:HlHijtCn0
はてなアンテナは丸の内のOCN使ったりns.hatena.ne.jpになってみたりするのが不思議だ
954 :
きゃら:2007/11/10(土) 04:37:57 ID:VcfbgTHQ0
追加。
イベント後必ずといっていいぐらい出てくる他所のサークルリアルヲチ話。
売上がどうだ箱の搬入数がどうだはまだしも(まあこれも充分ウザイが…)、
コピ製本会場でやってて…とかスペ前でオフすんなとかモサオタ格好どうにかしろとか。
違反を注意する度胸も無く、自分のことは棚に上げてただ不躾に観察してグダグダ話題にしたいから
イベント来てんのかこいつらは?
本を売るのも含め、他人と比べて自分の方が上と認識したいが為にイベントにでてるようにしか思えん。
marunouchi.tokyo.ocnは都内のネカフェもだよ。どこだったか忘れたけど。
あと、フリースポットもOCNのところが多い。
ホテルのフリースポットはたいがいここなんじゃないかな。AえぬAと東ヨコはOCNだった。
956 :
ろぼ:2007/11/12(月) 00:43:43 ID:DVsHap1w0
ダウンローダー来たら自動で弾けるようにしたいんだが、トラフィックで遮断するのってやっぱローカル自鯖しか無理だよなあ・・・
Apacheの知識もないし、レンタル鯖な自分はどうしたらいいんだろうか
957 :
ロボ:2007/11/12(月) 11:11:49 ID:kpqlRPjK0
ローカル自鯖ww
ローカルなのにダウンローダーきたら驚くわw
959 :
ロボ:2007/11/12(月) 18:49:53 ID:kHSGaWeH0
いや、ローカルヒキの人は自分のサイトに自分で荒らしたりするらしい
だから自分でダウンローダー使うんだろう
楽しそうだな!
960 :
ロボ:2007/11/12(月) 18:52:51 ID:s/wTPs5K0
ローカルでダウンローダーというと
ウイルスに感染してHDの中身がばら撒かれているというイメージも。
>959
自分でダウンローダー使って、自分で弾いて攻防戦か
楽しそうだなw
自分でローカルロボット検索サイト作って
自分のローカル内にクローラーを走らせて「なんど弾いても拾われる」のもいいかもしれん
962 :
ロボ:2007/11/13(火) 00:05:18 ID:+D/5q4R90
つまんねえんだよ屑共
963 :
boro:2007/11/14(水) 03:35:26 ID:GVaqIKeC0
大阪で生まれたぁ〜女やさかい♪
堪忍してぇな
964 :
t:2007/11/16(金) 07:00:41 ID:AoxwJVeK0
HTTP_USER_AGENTMozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 1.1.4322; .NET CLR 2.0.50727; .NET CLR 3.0.04506.30; msn Optimized IE build03;JP)
msn Optimized IE build03;JPてことはロボかね?
966 :
炉ボ:2007/11/16(金) 15:32:32 ID:nkpcqXOr0
>>965 あー、それうちにも来てた。
忍者では拾われていていなかったけど、鯖のアク解で解った。
967 :
ロボ:2007/11/19(月) 19:10:44 ID:u8lt/iAB0
とりあえず.htaccess使える人は検索避け支援にあるリストの追加をおすすめ
たいていはそれでなんとかなる
968 :
ロボ:2007/11/21(水) 02:42:44 ID:Gqmrq1G60
cgiの解析を外部ファイルで記述してるんだが
そのファイルのみ覗いてる人が数人いる
これはロボが悪さしてるのかな?気持ち悪いが大手なんで弾きづらい
>968
解析部分のジャバスクを外部にしてるが
ブラウザの仕様でリンク元がその外部ファイルになることがある
所謂誤爆じゃね?
970 :
ロボ:2007/11/21(水) 10:56:24 ID:j0n/TSNh0
ところでジャヴァスクって何?コーヒー学校?
971 :
ロボ:2007/11/21(水) 11:32:35 ID:bP5R+9R50
コーヒー学校わーおもしろーい!バロス腹いてえ!^^^^^^
972 :
ロボ:2007/11/21(水) 23:16:40 ID:Gqmrq1G60
誤爆かーなら問題なさそうだな>969ありがとう
毎回必ず誤爆している人がいるが気にしないでおくよ
973 :
ロボ:2007/11/24(土) 01:48:23 ID:t7Yb2K0P0
誤爆もあると思うが
鯖によってはlogファイルがブラウザから見えることがあるから注意
ぐぐるにキャッシュされてることもある
変なホストやUserAgent調べるのにぐぐったら
アク解のログがずらずら出てきた
974 :
ロボ:2007/11/24(土) 03:02:55 ID:4ryfxAsR0
>>973 968の外部ファイルってたぶんjsだと思うんだけど、ログとは違うでそ。
jsなら見ようと思えば、いくらでも見えるよ。
お勧めアク解スレでも、昔話題になったけど
ぐぐるに引っかかる解析ログは、パスがかかってない事が多いよ。
自分も解析を外部ファイルにしてた時、必ず同じ人がjsの誤爆してった。
975 :
・:2007/11/25(日) 23:30:00 ID:51d9Z0hn0
・
なんかヤフって行儀悪くなってる?
今までひろわれてなかったアドレスが拾われているようだ…。
ヤフブクマの足跡があるけどそのせいなのかたまたま同時期だったのか。
入れかけてやめてあった.htaccessを早くやらなきゃだめだなあ。
同じくヤフにいきなり拾われるようになった
うち登録されてないしここでも何度か言われてるからブクマは関係ないと思う
被リンク数が多いと拾われやすいって話もあったよね
でも被リンクもブクマも変化無かったのに急に掛かるようになったから違う理由かも
それよりいまだに百度からキャッシュが消されないのが嫌だ
403じゃなく404返してみたが意味ないみたいだ('A`)
978 :
ロボ:2007/12/01(土) 11:21:02 ID:VIEE/UWC0
ヤフ、ブクマは関係ないっぽい。
うちはブクマされてるインデックスは拾われてないのに
別のページ(ブクマ無し)が拾われてる
.htaccessのおかげで中身は拾われてないから
URLで検索でもしない限り出てこないんで、別にいいや。
きっとヤフがバカなだけだと思っておく。
979 :
ロボ:2007/12/02(日) 08:00:58 ID:eAbYhYOU0
同じくMETAタグとロボテキ仕込んでるのにヤフに急にトップページ拾われるようになったからここ来てみた
トップ以下は拾われてないようだしリファラで弾いてるので
とりあえずは何も知らない人がコピペしてまで入ってくることはないと思いたいけど、どうなってんだ
980 :
ロボ:2007/12/02(日) 08:58:03 ID:8qC52HwH0
どうなってんだってヤフーの仕様が変わっただけだろ
バイズと同じ中国企業なんだから騒ぐだけ無駄
981 :
ロボ:2007/12/02(日) 10:09:00 ID:wpwB9mlF0
>>980 もし仕様変更があったならそのソースを知りたい
そう思うもんだ
騒ぐだけ無駄って思う奴がここにいる事が自体が無駄だし意味不明
982 :
ロボ:2007/12/02(日) 10:22:07 ID:NPHXpBeT0
自分は逆に消えた。ずっとインデックスされて、どうにもならなかったのに…
ブクマは関係ないと思うけど、リンク先は関係してかもしれない。
某サイトに2つサイトをリンクされてたんだけど、そこが閉鎖したら
2つとも消えたんだよね。偶然かな?
983 :
ロボ:2007/12/02(日) 10:44:16 ID:8qC52HwH0
984 :
ロボ: