同人サイトのロボ避けアク解について 4

このエントリーをはてなブックマークに追加
1ロボ
一般人や版元に見つかると、何かとマズーなことが多い同人サイト運営。
なるべくひっそり楽しむために、.htaccessやrobots.txt等を用いた
検索避け・アクセス解析・アクセス制限などについて語り合いましょう。

robotx.txtや.htaccessを使いたいなら有料池
■同人OK鯖総合スレまとめ
ttp://f43.aaa.livedoor.jp/~sils/

関連リンク
■ロボテキについて(※英文)
ttp://www.robotstxt.org/wc/norobots.html
■.htaccessテンプレ
ttp://www.ii-park.net/~nanashi/htaccess2.html
■ドットHTアクセス メーカー
ttp://html-time.com/tool/htaccess_maker.htm
■裏サイトオーナーのためのSmall Tips
ttp://sp999.oheya.jp/tips/
■禿げしくガイシュツでうんざりしている質問のFAQ
(2ch web制作管理板 ロボット型検索エンジンスレFAQ集より)
ttp://f3.aaa.livedoor.jp/~zwgxodue/gaishutu.html
■ちょっとまったFC2ブックマーク(問題と対処)
ttp://www.geocities.jp/no_no_bookmark/
■PHPであれこれ。(FC2ソーシャルブックマークに関してのスクリプト)
ttp://www.geocities.jp/moyashi_de_go/

前スレ
http://changi.2ch.net/test/read.cgi/doujin/1196876804/
2ロボ避け:2009/05/06(水) 14:03:29 ID:g3IaiPd40
>>1
乙〜
3ロボ避け:2009/05/06(水) 15:57:58 ID:VZEGz9TTO
>>1
お疲れ様でした。
4ロボ:2009/05/06(水) 16:56:40 ID:vDprM/qF0
>>1
乙なんてなんたらかんたら
最近無自覚にPathtraqインストールしてアクセスしてた人がいた
前スレのおかげで弾けてたよありがとう
5ロボ:2009/05/06(水) 20:17:28 ID:pWby9GRt0
乙だけどここのリンク先もう役に立たないみたい

■.htaccessテンプレ
ttp://www.ii-park.net/~nanashi/htaccess2.html

■裏サイトオーナーのためのSmall Tips
ttp://sp999.oheya.jp/tips/
6ロボ:2009/05/07(木) 08:07:09 ID:CWOAPg+Z0
>>1
乙です
7ロボ避け:2009/05/07(木) 10:49:58 ID:V2NPHlL20
百度死ね
8ロボ:2009/05/07(木) 22:19:16 ID:xYOWmrrz0
>>1
おつです!
9ロボ:2009/05/09(土) 19:12:28 ID:2J+ntAUw0
一乙
10ロボ:2009/05/13(水) 17:28:39 ID:oOPrDGrs0
>>1

今日は秘密やが重い。
11ロボ:2009/05/15(金) 20:09:44 ID:OR35uVnI0
1乙

■同人OK鯖総合スレまとめ

これはもう情報が古すぎて
テンプレからは外した方がいいかもしれないとオモ
12ロボ:2009/05/18(月) 07:03:37 ID:CTaJF+9n0
すみません
lint避けるにはどう書けばいいのでしょう?
13ロボ:2009/05/18(月) 18:00:46 ID:uaT41PJ30
deny from lint
14ロボ:2009/05/19(火) 22:23:52 ID:Z7CIVBdk0
PCサイトだけど携帯で閲覧できるなら別にいいか、と放置してたんだけど
とある携帯訪問者が、その人の携帯のみではうちのサイトが閲覧できないらしく
PCサイト変換サイトから来るんだけど、そのサイトからくると
いつも一緒にグーグルボットを連れてくる
最初は気のせいか?って思ってたけど、変換サイトの後に絶対くっついてる
グーグルボット弾いてるから入ってくることはないんだけど
毎回毎回なのでウザくて仕方ないのでその変換サイト弾いたよ
別の変換サイト使ってくれ
15ロボ:2009/05/20(水) 08:15:19 ID:8RnBsj9U0
>>14
それ、Google Wireless Transcoder?
自分もうざいと思ってた。
IPがコロコロ変わるからUAで弾けばいいのかな、
でもせっかくの閲覧者がなあ…とか悩み中。
16ロボ:2009/05/20(水) 08:34:16 ID:G5VFi1ti0
携帯でアクセスするようなのはDQNだからイラネ
17ロボ:2009/05/20(水) 21:51:27 ID:EQNBIT7a0
>>15
いや、クローラーなんだ
crawl-66-249-73-162.googlebot.com
18ロボ:2009/05/21(木) 03:50:33 ID:KsrYth1f0
海外IPを全部弾いてる

鯖の生ログで、エラーログの方には99.153.216.189だの99.31.233.154だの
海外IPが乗っているのに、アクセスログの方を同じIPで検索しても引っかからない
通常は403返した時もアクセスログに乗るはずなのに

これは一体どう考えればいいんだ?
19ロボ:2009/05/21(木) 08:36:09 ID:ZpNmkOJW0
>>17
ごめん
pc変換サイトがグーグルワイヤレスなの?って意味ですた
20ロボ:2009/05/21(木) 22:52:01 ID:DgtrVqkd0
>>19
いや、ぐるっぽとかいうサイト
21ロボ:2009/05/22(金) 13:27:17 ID:kkKTafD90
Deny from 74.125.0.0/16 って 74.125.74.154 も含まれるよね?
Google Wireless Transcoder弾こうと思って自分でアクセスしてみたら
74.125.0.0/16で弾けなくて74.125.74.154だと弾ける。なんでだ?
22ロボ:2009/05/25(月) 20:41:46 ID:KL/CQy0V0
何かこんなんができてた

原寸画像検索
ttp://k52.org/gensun/

キーワード検索は可・画像は不可にしたいんだけど
今のサイトはMETAタグしか使えなくて
それだとYahooの画像検索は拒否できないようで……引っ越すかなぁ
23ろぼ:2009/05/26(火) 11:51:10 ID:ssw7KhRy0
こんなホストからアクセスあった
button-kokan.com

ぐぐったらここ?
ttp://www.aboutus.org/Button-kokan.com

バナーエクスチェンジなんていらないんですけど
24ロボ:2009/05/26(火) 13:59:04 ID:eaCAyNp/0
s53.coreserver.jpからアクセスがあるんだが

ぐぐってもWebサービスも何も引っかからない
もちろんリンクを貼られているわけでもない(アカウント名.s53.coreserver.jpになってない)

レン鯖から直接アクセスされるなんてことがあるのか?
25ロボ:2009/05/26(火) 14:10:09 ID:rRZKTFt4O
それたぶんGENOチェッカー
GENOウィルスのせいで携帯からアクセス増えたけど
弾いてるから申し訳ない感じだ。

自分も聞きたい事があるのに、規制されて
携帯からで思うように投稿できない。早くても来年5月って酷い…
26ロボ:2009/05/26(火) 17:16:45 ID:LvDhc3KZ0
日本以外のアクセスを弾きたい時ってどう記述すればいいのかな
まとめサイト便利だったのに無くなってて困ってる…
逆に日本だけ許可するようにこんな感じ?

order deny,allow
allow from jp
deny from all
27ロボ:2009/05/26(火) 17:28:26 ID:eaCAyNp/0
>>24だが

>>25
>それたぶんGENOチェッカー
マジでか、ビビって悪禁しちまった
ウチも携帯弾いてるから悪いことしたな

>>26
日本IPのみallowにしたらいい
リスト公開してるサイトあったよ
28ロボ:2009/05/26(火) 18:16:35 ID:6qNfhyQp0
>>26
order allow,deny
allow from .jp
deny from env=shutout

うちはこう書いてる
.jpでも弾きたいところをenv=shutoutで指定して更に弾く
.jpじゃない日本のISP(YBBとか)はallow fromで許可を出す
というやりかた
29ロボ:2009/05/26(火) 19:05:26 ID:rRZKTFt4O
「各国アクセス許可/拒否リスト」でぐぐると、allow記述済みのリスト出てくるよ。
自分は定期的にチェックして、IP羅列してる。
28も書いてるけど、弾きたいIPが追記できる
「Order Allow,Deny」
の方がいい。
30ロボ:2009/05/27(水) 00:02:27 ID:QHvPG8UT0
レストン!ぐぐってくる
31ロボ:2009/05/27(水) 06:39:13 ID:IU1pxnJV0
28だけどenv=shutoutじゃないと弾けないみたいに書いてしまった
deny fromでIPやリファを追記しても弾けます、ごめん

上でも出てたGENOチェッカーだけど
弾いているのにサイトをチェッカーにかけると安全度0%と出る…
あてにしないほうがいいと言われてるけど本当にあてにしないほうがいい
32ロボ:2009/05/27(水) 10:41:41 ID:UTXZEggM0
アクセス解析をみたら、HTML Ggtというのがありました。
ググってみたのですが、メソッドがどうとか記述に関することのようで、
具体的に誰が何をしたらこう出るのかがわかりませんでした
これはロボットなのでしょうか?
33ロボ:2009/05/27(水) 13:07:30 ID:bpNAKsKN0
>>32
ttp://www.geocities.jp/mieki256jp/software/m256morehtmlgeteasyedit.html
コレのことかなーと思ってるけど確かめてない
34ロボ:2009/05/27(水) 21:21:16 ID:Jla9N9IE0
>>22
これ、はてな使ってるようだからはてな弾けば済む話じゃね

つか、METAしか使えないような鯖使ってるんじゃいろいろ諦めるしかないぞ
引っ越しな
35ロボ:2009/05/27(水) 21:22:56 ID:C2zWyFWz0
はてなは弾いてる
使ってるのはYahoo画像検索のようだけど
36ロボ
何かmsnbotが毎日特定の単語(凄い一般的な英単語)の検索結果ページから来るぽ
良く分からん