1 :
名無しさん@どーでもいいことだが。 :
04/02/12 18:35 ID:hzzZW8RX メタタグをせっせと貼ってロボ避けしているサイトさんを結構見かけますが、 まったく無駄な努力だと思います。 みなさん、どうですか?
>1がなぜ無駄だと思うのかがわからん。
じゃあワシがやってる事も無意味ってかぁ?
無駄と思うならやらなければいい。 他人がやることにいちいちケチ付けてたら切りが無いよ。
ロボ避けについて語るスレかと思ったら、>1が脳内理由だけでイチャモンつけるスレ? せっかくだから自説をがっちり披露してみりゃいいのに。
6 :
名無しさん@どーでもいいことだが。 :04/02/12 22:13 ID:hzzZW8RX
糸冬 了
ロボ避けスレにしたら?やり方知らない人も居るかもよ。
>6=1 いきなり終了してないで、スレ立てた責任を取ってなぜ無駄だと思うのか語れ。
META+.htaccess+robots.txtだろ、やっぱ。 しかし、自分とこにリンク張ってるサイトがロボ避けしてなかったら意味なし。
ロボ避けより意味のない暴走族風の当て字は何とかならんか 同人誌印刷屋やイベント名や一般名詞の当て字ウザ
>リンク張ってるサイト リンクしてのサイト紹介ならほとんどトップページにリンクされている筈なので 注意書きも目に入る筈。検索からいきなり本文に飛ばれるよりはマシ。
12 :
1 :04/02/13 01:42 ID:cIy3wK9s
メタタグ貼っても無駄だと思ったのは、 9さんの言うようにリンクページにロボ避けサイト以外からのリンク禁止の旨を 記しても平気で非ロボ避けサイトがリンク張ってるのをみかけるから。 あと一通りロボ避け対策講じてロボ避けサイト標榜しておきながら 堂々と非ロボ避けの同盟(ジャンル違いや性格等)やサーチに 登録しているサイトをよくみかけるからです。 この辺は不文律ですか? こういった理由からロボ避け徹底することは不可能に等しいので ただのロボ避けのスレに転向することを希望します。すみません。
>>10 な/に/が/し/い/ん/さ/つ
みたいな表記でも、検索よけに充分なるんだけどね
>>12 ちょっと疑問なんだけど
そもそも何のためにロボ避けしてるの?
私は同人がなんたるかを全くしらない一般人が、間違って迷い込まないようにとの理由からなんだけど。
だからロボ避けしてないサイトさんからリンクされててもあまり気にならないなあ。
わざわざ一般人が冷やかしにリンク辿ってまでくるとは思えないし。
あ、ナマモノとかだと別の危険な理由とかがあるのかな。
それから素朴な疑問として、サーチでロボ避けしてる場合ってどうやって見つけるんだろう?
みなさん永年のカンとかで辿りつけるのですか?
今ちょっとはまりかけのジャンルがあるんだけど、なかなか検索にひっかかってこなくて。
どうにか1つでもみつからないかなあと溜息の日々です。
ところで皆メタタグって字をみるとメメタァに見えないか?
見えないが…。
17 :
名無しさん@どーでもいいことだが。 :04/02/14 09:34 ID:o+3bp1Bl
なんだかんだ言っても、検索避けだけで済ませてるところは 完璧に潜る気はないんだろ?同志には辿り着いて欲しいんだろ? だったらあまり徹底する必要はないのでは… 中身のページはいきなり見られないようにする必要はあるが。 オフィシャルが厳しいナマモノとかなら、入り口パスワード制+ アクセス制限くらいは必要だろうに。 検索避けだけに頼ってたらいかんだろ。
一般人避けという意味で、ロボ避けは充分意味があると思う。
ロボ避けだけ徹底すれば完全に隠れられると思ってる
>>1 が間違ってる。
悪意でも無知な善意でも、どこかに晒されたら終わりじゃん。
19 :
15 :04/02/15 00:03 ID:+UaRpvZr
>16 そっか…見えないか……
同人的ロボ避けについて語るスレだと解釈。
ロボってよくわかんねんだよ。
robots.txtしかやってないって無駄?
>そもそも何のためにロボ避けしてるの?
100質とか置いてて検索に引っかかるとウゼェと思うヤシがいるらし。
あとは
>>18 が言ってる様に一般人避け。
>robots.txtしかやってないって無駄? robots.txtを無視するロボットも多いからな。偽装するロボもいるし。
ホモとか関係なく普通に絵が見たいときには隠してあると探すのマンドクセ 生物だと絵が描いてあるのってヘタレな似顔絵サイトとバリケード有りのホモしか無え
ロボ避けは、検索で探してくる外人避けでもある。
お話通じる(言語以前で)外人さんなら、来て欲しい。 お話通じない外人さんは、お話通じない日本人同様来て欲しくない。
締め付け緩めのジャンルだけど 内部ページに直で飛ばれたくないから検索避け入れている。 「キャラA キャラB」+「エロ単語」でぐぐってトップページ経由せずに 小説だけ読んでいく人が多かったんで。 リンク先やサーチが検索に引っかかってもトップページから入ってこられる だけだから自分的には問題なし。
>26 そんな単語でグぐるのは同士しか居ないから別に検索よけしなくてもいいのでは。 あ、カウンター回らないから嫌って意味か。でも今は同人知らん一般人避けについて話してるんだよな カウンター数云々な低次元の話はどうでもいいのだが低脳
28 :
名無しさん@どーでもいいことだが。 :04/02/19 13:58 ID:xlqfaZqb
>27 A×BとB×Aの間には深くて広い溝があったりするから、 お互いのためにも入り口(サイトの傾向について確認できるページ)から来て欲しいってことじゃないの?
ゴメンあげてしまった。
つーか、robots.txtてルートのトップに置かないと意味ないんじゃ? 自鯖ならともかくレンタル鯖なら普通は置けない。
>30 レン鯖でも置けるとこあるよ。 どっかのスレで見たけど、ルートじゃなくてもrobots.txtが効く鯖もあるそうな。
>31 あれ? そうなの? 「効果がある」っていうのは、ある種のロボに効果があるってことじゃなく? ルートのトップじゃなくても、特定の鯖なら全てのロボを弾いてくれるの? 確か、robots.txtが鯖のトップ以外の場所にあると拾っていくロボもいるので、 ロボ避けのつもりなら、トップにおかないと全てのロボははじけないから、 意味がないと聞いたが。
サブドメの鯖だといけるっぽい>robots.txt でもその辺まったくわからずにrobots.txt置けばいいと思ってる人も多そうだけど。
どのロボかはちょっと失念したが、robot.txtで拒否されると そのディレクトリ以下のファイルはチェックしないというロボがいるので 置くだけ無駄ということは無いと思う それとは別に、ルートの意味が良くわからず 自分のweb領域のうち一番上に置けばいいと思ってる人も いるかもしれないなあ
うちはサブドメだけどrobots.txtは効くっぽいよ。 もちろんrobots.txtを無視するロボットもいるけど。 SetEnvIf User-Agent "ia_archiver" BadRobot ↑これで弾けるよね…?
robots.txtは結局
http://ドメイン/robotx.txt っていうのを読むみたい
だからサブドメインが設定されてる鯖なら有効ってことらしい。
>35
それで全部のロボのUAを登録すれば弾けるよ
でも大変だから、METAタグやrobots.txtを
読まないものだけにした方が楽だし
鯖への負担も少ないんじゃないかな?
定期的にUAを変更してるロボもいるみたいだし
>35 おお、ありがd。 感謝の意を込めて漏れも某所で拾ったMETAタグでも投下しとくか。 <meta name="robots" content="noindex,nofollow,none"> <META NAME="ROBOTS" CONTENT="NOARCHIVE"> <META NAME="GOOGLEBOT" CONTENT="NOARCHIVE"> <META NAME="ROBOTS" CONTENT="NONE,NOINDEX,NOFOLLOW,NOARCHIVE"> <meta name="robots" content="none,noindex,nofollow,noarchive"> <META NAME="robots" CONTENT="none,noindex,nofollow,noarchive"> <meta name="robots" content="nothumbnailindex"> <META name="robots" content="noindex,nofollow"> <meta name="ROBOTS" content="NOINDEX,NOFOLLOW"> <META NAME="LIBWWW-PERL" CONTENT="NOINDEX,NOFOLLOW,NONE,NOARCHIVE"> <meta http-equiv="Pragma" content="no-cache"> <meta http-equiv="Cache-Control" content="no-cache"> <meta name="robots" content="noimageindex,nomediaindex"> <META name="robots" content="nosnippet"> <META NAME="GOOGLEBOT" CONTENT="NOSNIPPET"> <meta name="robots" content="noimageclick">
しまった。>36タンにお礼ですた。
一応補足しておくと全文は↓ね。わかってたらスマソ 一行目をボットのUAの分だけ羅列すればオケー あと最後の行の改行を忘れずに SetEnvIf User-Agent "ia_archiver" BadRobot Order Allow,Deny Allow from all Deny from env=BadRobot
良スレage
41 :
名無しさん@どーでもいいことだが。 :04/03/15 11:07 ID:Fvj7SvGd
NAVER避け用のタグってありますか?
>43
User-Agent: NaverBot-1.0 (NHN Corp. / +82-2-3011-1954 /
[email protected] )
Disallow: /
robots.txtで弾くしかないんじゃない?
ロボ避けに意味があろうとなかろうと、 検索結果のページに自分の書いた801小説の一場面が出たら恥ずかしい。 だから避けるんだYO! …って人も多いと思う。
何気に良スレ どっかで見たような話題だが。。
自分が初めてサイトを作った時は検索でひっかける為の タグが必要だなんて知らずにそんなタグ入れずに作成してたのですが、 最近メタタグの存在を知ると同時にロボット避けという言葉も知りましたが、 最初から何もいれなきゃ検索にひっかからないんでは?と思うのですが。 "ロボット避け"という言葉にひどく違和感を感じます。
49 :
名無しさん@どーでもいいことだが。 :04/03/26 00:53 ID:G35Q9Xpq
>48 馬鹿?
よっぽど運がよければ拾われてないだろうけどねw 避けとか何にもしてないと自動的に <meta name="robots" content="index,follow"> (意訳:ロボットさんへ。このページを拾っててもいいし、この先のページも拾っていいよ) という設定になってしまう。 だからロボに拾って欲しくない場合には <meta name="robots" content="noindex,nofollow"> (意訳:ロボットさんへ。ここのページ拾わないで。この先もダメ。) と意思表示をするわけだ。 多分47の言う「検索でひっかける為の」タグって <meta name="keywords" content="キーワード"> <meta name="description" content="説明文"> とかのメタタグの事だよね。 これはサイトのキーワードとか説明を書いといて、検索から適切にサイトにお客様を 導くためのもの。これが無いとロボットが来ないとかそういうことじゃない。
52 :
48 :04/03/26 01:39 ID:HQg0SrRF
ありました……。 うわどうしよう、凄い恥ずかしい。 前調べた時はなかったはずなんだけど。 今から全ページにメタタグいれてこよう。指摘ありがとう。
53 :
名無しさん@どーでもいいことだが。 :04/04/17 00:19 ID:X863oYzF
あげ。
hosyu
55 :
名無しさん@どーでもいいことだが。 :04/05/08 11:42 ID:MDXdYwu2
むしろage
上がった所で。 ロボット避けに関する事で質問なのですが… 今までロボ避け対策をしなくて既にロボットに拾われてるサイトに メタタグやrobots.txtを使用し ロボット避け対策を施したとして。 次にロボットがそのサイトに来た後にはそのサイトの情報やキャッシュは データから消去して貰えるのですか? 何処かで「拾われる前に(ロボット避け)入れなくちゃ意味が無い」という情報を聞いて気になったもので。
このスレ続行するのはいいと思うんだが、
一応は自分で調べた上で質問するのをマナーにしようぜ。
>>56 消してくれる。
けど、ひとまず今までのファイル名を書き換えるのを薦めます。
板違い。
60 :
56 :04/05/08 19:06 ID:bQmRODNp
>>57 ありがとうございました。ひとまず安心しました。
一応ロボット避け等で検索しても解らなかったので質問させて頂きました。
板違いのようなので、
これからは58さんの貼ってくれたスレで調べてみようと思います。
うちはINDEX,NOFOLLOWにして、ぐぐるキャッシュも残さないようにしてる。 とりあえずロボ君達にはちゃんと読んでってもらえてるみたいなんだけど 最近INDEXも引っ掛からなくなってきた。 うちがピコピコだからかなあ…
他からのリンクが少ないページや 更新頻度の低いページは ロボのランキングが下がるらしい
よっしゃ、ヒキコモリサイト一丁あがり! なわけだな。 オーライオーライ。
ホッシュ
robots.txt置いてたのにia_archiverに拾われた・・・ちくしょう 個別にユーザーエージェント指定してなかったのがまずかったか
>66 .htaccessで弾いてみれば?
保守
69 :
名無しさん@どーでもいいことだが。 :04/07/28 19:20 ID:RIPNktVP
age
70 :
名無しさん@どーでもいいことだが。 :04/08/02 20:48 ID:UNAjlpnr
age age
ロボ避けしてないのにヤフーに引っ掛からなくなりました(・∀・) しかしぐぐるではトップにヒットするマイサイト。
>71 ぐぐるはすぐ削除出来るよ。 一番厄介なのはmsnだorz
ロボ避けしておかないと、思いも寄らないキーワードでヒットして
意図していないお客さんがやってきて「ダマサレタ」とか言うことが。
例えば、私が書いた「よかったよ」という感想の一部分だけが
「最悪だ」で検索したのと同じ状態ヒットしちゃったときは凄く焦った。
>>72 マジでmsnは厄介。
特定の文字列で検索するとウチのURLがトップにくるんだけど
サムネイルは全く別のサイト。いったいなんなんだ‥‥orz
msnどうしたら良いんだ メタタグ+robots.txt+.htaccessで弾いてるのに 定期的に来るよ…酷い時は2時間おきに来る どうなってんだ _| ̄|○ 私の設定が間違ってるのか… 実際に検索かけても引っ掛からないから まぁいいかとは思うけど
msnはほんっとに厄介だよなorz 下記ので弾いてるけど、これで合ってるよね…? Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; .NET CLR 1.1.4322; MSIECrawler) Mozilla/4.0 (compatible; MSIE 5.01; Windows 98; MSIECrawler) Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; MSIECrawler) Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; Q312461; MSIECrawler)
>>75 deny from .search.msn.com
deny from msnbot64124
私はコレ・・・
>>75 deny from .search.msn.com
deny from msnbot64124
私はコレ・・・
2重カキコ すみません
良スレage
うちも一応メタタグを付けてるけど、NOFOLLOWが何処まで入ってるかが非常に気になる。 例えばインデックスに付けたとして あるページ→リンクページ→他所様へのリンク →イラストページ→イラスト とかの構造の場合、あるページまでがリンク先なのか、他所様ページまで引っかからなくなるのか……
>81 NOFOLLOWは「そのページにあるリンクを辿っちゃダメ」というタグだよ 素直にしたがってくれるロボはそのページのリンクを辿らない
ホッシュ
補補補補補
香港yahooからのアクセスが最近増えてて、拒否したくてhtaccess設置したんだが 全然はじかれて無いみたいなんだ…!私の設置の仕方がいけないんだと思うんだけど どうしたらいいと思いますか…。メタタグは入れてるんだけどどうにも無理っぽい。
>85 検索で来てるの?掲示板から来てるの?
検索なんですけどどうにもこうにも…
>85 香港ヤホーのURLの末尾に「/」入れても駄目?
サブドメインの連鯖使ってるんだけど、robots.txtを勝手に置いたが、鯖独自のロボットとかは回ってこないのだろうか? 回ってきて中見えないとかなんたら言われて垢消されたりしないのだろうか? 一応隠し&エロは可の鯖なのだが。 消されたら消されたで移転だけどな〜。
それはそこのサポートに訊けないことなん?
>>91 サポートないんよ。
2ちゃんみたいな掲示板があるだけ。
消されたら消されたでいいけど、なんとなく。
>90 ιぃサイドのサブドメ鯖使ってます。 ここはサバログが閲覧できるところなんだけど、 ログを見ているとロボットがやってきてrobots.txtだけ読んで そのまま帰って行った後が残ってたりします。 ところで鯖独自のロボなんてあるの?椅子とかの無料鯖?
94 :
90 :04/09/12 00:52:45 ID:ixoDvVJO
>>93 塩はあるらしいときいて。
自分の所はもちろん塩じゃないけど、他の鯖でもあるんかなーとオモって。
まー、サポートがユーザーの助け合い掲示板で代用されてるぐらいの鯖でロボットなんか走ってるわけないかw
塩は特殊だよな・・・。
>85
これでも駄目?
<Limit GET POST PUT>
setenvif referer "
http://search.yahoo.co.hk/ " bad_referer1
order allow,deny
allow from all
deny from env=bad_referer1
</Limit>
メールで削除要請したら消してくれると思った
調べてみてもちょっと判らなかったので。 ロボ避けタグ入れても引っかかってしまうとこってあるの?
>>99 あります。検索エンジンによってはmetaタグ無視。
metaタグの記述方法(大文字・小文字)によっては、弾いてくれないロボットもあるようです。
メジャーな検索でひっかかるなら、やり方間違えてる可能性もある罠。
あと、全文検索のあるサーバはロボ避け無効です。
質問さしてください 漏れのサイト(メタタグで検索避け)のURLをヤフーで検索して、その検索結果から飛んでくる人がいます URL知ってるならいちいちヤフー通す必要もないと思うのですがこれはどういう意図があるのですか? そしてこの検索結果を出ないようにできるんでしょうか。
ブックマークできない環境から見てる人 学校の共用とか。 やふーってメタタグ無視するのか? なんにせよ、URLを知ってる人を回避せんでも… さらしの可能性もあるはあるか
>101 これは自分の場合だけど、自分とこの解析に残ったリファや どこかのサイトで、あるいは晒しでなく2ちゃん内で紹介されたサイトが ブラクラやトラップ、業者のアダルトサイトとかじゃなくて ちゃんとしたサイト(同人系や単なるファンサイトやノウハウ系etc)か どうかを確認してから飛ぶためにヤフやぐぐるを一旦通すことがある。 ちょっとでも不安があったら、結果として正規サイトだったとしても行かない。 簡単にポンポン飛ぶと何があるかわかったもんじゃないのが今のネットだし あと、厨やイタタっぽいサイトだったらアクセスするのやめたりね そんな使い方もあるってことで
ヤフはメタ無視するっぽい うちのロボ避けヤフ以外は殆どよんでくれてるのに ヤフだけ一匹狼ですよ
>104 ヤフはロボ変更で有効タグも変わってるけど チェックしてる?
>>101 ウチのサイトもまったく同じ事されてる。
一瞬別のスレで投下した自分の投稿かとオモタよw
「裏を探してる」とかそういう意見もあったよ。
>101です、いろいろありがとうございました。そういうこともあるのですね 検索結果にサイトのページタイトルがヅラっと並ぶのを見てしょっぱい気分になったので… まー気にせず放っておく事にします。
そんな検索をするのはキミだけだ。安心しろ。 ところでしょっぱい気分ってナニ?
アーカイヴって申請あったら消してくれるの!? 昔の好きサイトを今のうちに保存しとかないと(゚Д゚;≡;゚д゚)
>109 とかいいつつ自分のは消して欲しい人多そう。このスレ。
良スレage
113 :
名無しさん@どーでもいいことだが。 :04/11/17 11:08:41 ID:RoFbhZAt
age 二次ゆえにmetaタグとrobot.txtで検索よけ。 が、検索よけをしていなかった頃から検索で引っかかったことがない。
字が一切ないとか。 レンタル鯖自体が検索除けしてたり、とかあるのかなぁ?
ありきたりな単語ばかりも埋れるから良
>>114 代金が手ごろな価格ならいかに潜るかで神経使ってるドジン者には天国のような鯖だな。
検索よけしていたのに転送アドレスでぐぐるにひっかかった。 転送アドレス設定内の「サイト名」に記入したせいだと思うのだが 広告がつく転送アドレスは要注意なのかもしれない。
>118 あるよ。 私の借りてる有料鯖はrobots.txt設置してくれる。 でもエロ禁止だけどw
さくらとか普通にできるけど。 でもMSNなんかは無視しやがるので、htaccessで弾かないとだめくせぇ。
厳重にロボ避けしてる人って、リファはサーチやリンク+ブクマだけなの? ホト数は満足してる?
>リファはサーチやリンク+ブクマだけなの? そうだよ。ホト数アホほど多くないけど、別にアクセス乞食じゃないし。 本当に好きな香具師だけ来れるようにと思ってるから。虹だし。
満足もなにも、それ以外で来られる方がマズイ。 自分も虹なので
リンクとお気に入りで150ホト回る虹なのでサーチもいらない 121は虹だとしても規制の緩いジャンルなんだろう
ロボだけでなく大学や企業からのアクセスも弾いてるから そりゃその分ヒット数は減るけど、アクセスされるほうが困る品
学校、企業関係はさっくり規制。 ホト数なんてジャンルサーチだけで十分。 自分も へたにあほーやぐぐるに引っかかる方が怖いよ虹者だから。 キャラ名でぐぐると、虹エロ作品ページにばっちり引っかかるサイトなんかは、見ていて生暖かい気持ちになる…
>>121 そうだよ。
専用サーチからとブクマだけ。
リンクページとリンクについての説明はないのでリンクからはナシ。
たまにマイヤホーのトップとかメール見たあとの痕跡もあるけど、
一般のサーチとかが引っかかってたらマズイって。
ロボ除けしてないオリジナルイラストのサイトもやってるが、
ロボ除けしてる方の方が、アクセス多いぐらいだよw
1日800〜1000ぐらい。殆どブクマ。
薬屋でもrobots.txt置けるって最近気付いて置いてみた まあ虹とはいえ健全ほのぼの、で身内避け程度だから htaccessまでは置いてないけど やっぱ学校と企業関係は弾いた方がいいかなあ? 昔、メーカーの中の人が個人的にサイト見ますた!ってメールくれた事あったけど お前個人的ってどういう事なんだ会社としてはオケなんか オケじゃなかったらウヒョアー、とひたすらびびった。 (結論としてはメーカーサイドはファンサイト容認姿勢、 メールくれた人は自宅からアクセス…だったが)
>126 その人、自分はメーカー勤務だぞ、ってのを自慢したかっただけでは… メーカー側から虹創作への忠告等でないのならわざわざ職場を名乗る必要ないとオモ。 個人的なら尚更。 …と、誰からも感想がもらえないので僻んでみるorz
虹で801なし健全男女カプサイトなんだけど、 版権元もさほど同人にうるさくはないけど、歓迎もしてないってスタンスで、 一応ロボ避けは一通りしてるんだが、 最近、ジャンルサーチとか千波とかの検索結果が グーグルに引っかかるようになっちゃって、どうしたもんかと悩んでる。 私がどんなにロボ避けしても、ジャンルサーチが引っかかっちゃったらなぁ…
>>130 それはもう、そういうサーチに登録しないようにするしかないわけで。
でも、検索結果が出るとアイヤヒーと思うけど、自分のサイトのトップから入ることになるから、
中のページが出てこないだけマシと思う、と。
版元は見るかも知れないが、一般人は興味もないと思ったら帰るでしょ。
ああもうmsnマジuzeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeeee 弾いても弾いても来やがる。
>130 二次の男女・801両方やってて検索避けは一通りしてるけど 検索登録でひっかかるのは諦めてる。 引っ掛かってもサイト飛ぶ前のだし、飛んでも注意書き ページだし、この程度は自己責任で判断してくれってことで。 いきなり中身がひっかからなければいいやって思ってる。
>133に同意。 そのために入り口の注意書きは欠かせないな。 INDEXから同人絵まるだしの壁紙だったり、厨くさくくどい注意書きにしないよう気をつけてる。 そういえば前に同人サイトの注意書きを語るスレがあったような。落ちたのかな?
うちはプロバの鯖なのでrobots.txtやhtaccessが使えない。 とりあえずメタタグでロボ避けしてたんだけどとうとうヤフに拾われてしまった。 拾われたのはINDEXのみ、中はしょっちゅうファイル名を変えてるせいか拾われず。 拾われたINDEXには仕方がないからMETA NAME="DESCRIPTION"で 「オタクサイトなので要注意(意訳)」と書いておいた。 さてどうなるか。
実に参考になる
アホーのヘルプの通りにメタタグ書いて、robots.txtも置いてるのに アホーにインデックスされた。 ロボットの中野人も、インデックスはしたけどサイトの内容出る所と、サイトのタイトルは、拾えなかったみたいで アドレスだけ載ってしまっている。 サイト名で検索すると、一番上に出るよ_| ̄|○ タイトル出ないけどあどれすがバッチリと。 アホーのあほー! .htaccessでアホー弾くと、なぜか自分も403になるし 諦めるしかないものか。 なんでひっかかるねん! ちゃんとrobots.txt読めやー!
>137 それは137のサイトをリンクしているサイトがアホーにひっかかったからでは? >タイトル出ないけどあどれすがバッチリと。 リンク先をロボが読もうとしたけれど、そこでrobot.txtがあるから読み込めない という典型的パターンではだいだろうか。 生ものなんかは、そんな理由でロボ除けが成功しているサイトからしか リンクさせないけど。
139 :
137 :04/12/17 20:52:42 ID:ie2MJ38m
>>138 成る程。リンク先読もうとして引っかかったのか。
リンクしてくれてるところも、ぞろぞろ引っかかってました。
ナマモノじゃないけどエロだから、
トップはジャンル名書かずに、カプ名もジャンル者だけが分かる暗号にしてるけど、
検索で出てくると、手緩い感じで不覚!!_| ̄|○
アホーはロボが変わってから避けにくくなって
早速.htaccessでお引き取り願うことにしました。
上手く逝くといいな。
で、別鯖でやってる非同人で同人とは全然関係ないサイトは
ロボ除けしてないのにインデックスされていない。
糞ロボだなアホー。
検索で辿り着いた同人サイトの中のページに 「検索から来た人は一度トップへ戻ってください」と書かれててちょっとモニョ
トップに注意書きがあるだけだと思うが。
142 :
名無しさん@どーでもいいことだが。 :04/12/26 17:43:00 ID:a1aBKOB6
>>140 そうしないとフレームが表示されないって場合があるよ。
じゃあ、全てのページにでもフレームへのリンク貼ればよかろう。
素人んまるき
すべてのページにって……「お客様」ですか? 書く方も趣味なら読む方も趣味だ。 お互いに同列だと思えば 「快適な閲覧のためにtopから見直してくださいね」 位は気にしなくてもいい範囲じゃないのか? 嗜好の違いによる不快を避けるための注意書きや、 快適な閲覧操作のためのフレーム表示を勧めてるなら。 読ませてやってるんだからカウンタ回せ、なら無視していいと思うが。 もちろん同様に、 読んでやってるんだから全部からリンク張れ、なら読まんでよろしい。
>>145 言いたいことには同意できるが、なんで煽るかね。
>>145 もちけつw
なににそんなに熱くなってるんだい。
見たい情報のページだけ見ればいいので「TOPに戻れ」って言われても戻る気なし。 それ以前に同人サイトなら中身のロボ避けして欲しい。 この間、昔見たCMの事調べてたらいきなりホモ小説本文にひっかかってびびった。 ジャンル、半生だし。
ホシュシュ
hosyu
hosyuu
hoshi
naver検索なくなったね
>135だけど、狙い通り検索結果の一行目に注意書きが出るようになりますた。 INDEX以外は通常のメタタグロボ避け&ディレクトリ名をたまに変更して 今のところロボにも拾われずキャッシュも残ってない状態。 当分この方法で行きますが、中のページにブクマしてる人には申し訳ない気分。
メタタグだけで避けても、indexは他サイトからリンク貼られる事も多いから 拾われるけど、index以外はディープリンク貼られない限り ファイル名変えなくても拾われない筈だけどね…。 昔robots.txtは置けたけど、.htaccessは置けない鯖にいたが、 .htaccessも置ける鯖に移転。 移転前はindexは拾われていたのに移転したら、拾われていた跡地が いつの間にか、検索から消えていた。 移転したせいで、一気に被リンクと更新が減ったからだろうか?
>155 前半 理屈上はそうなんだろうけど、参照数が多いとどうしても拾われる罠。 ところで鯖によってウェブアーカイブに拾われやすいところと拾われにくいところと 差が有るように思うのだが、気のせいかな。
.htaccessで弾いてもインデックスするぐーぐるいってよし。
158 :
名無しさん@どーでもいいことだが。 :05/02/11 17:34:24 ID:uEjVO1UG
ぐーぐるまたきてやがる!! .googlebot.comで弾いてるはずなんだけどなー。どういうことだろう?
ageてしまった・・・スマソorz
160 :
名無しさん@どーでもいいことだが。 :05/02/13 00:57:10 ID:jdu/nHpS
完全に検索から逃れる方法ってないの?
wwwで公開しなければよい
つい最近色んなスレを見て検索避けの大事さを知り、タグを検索しました。 検索避けのサイトは親切に説明してあるので、分かりやすくタグの事を勉強出来ました。 ただ、タグの数がめちゃくちゃ多い。 ズラッと。 検索避けタグをただ今二個付けてますが、普通は一個で足りるのですか? スレ違いでしたらすいません。
とりあえずどんなタグ書いてんのか晒してみ
>>162 タグをずらずら書くよりrobots.txtと.htaccess入れた方が
いいと思う。
そうすれば、メタ要素は1行で平気。
165 :
162 :05/02/13 21:31:15 ID:DupgfA/5
<META NAME="GOOGLEBOT" CONTENT="NOINDEX, NOFOLLOW"> <META NAME="ROBOTS" CONTENT="NOARCHIVE,NOINDEX,NOFOLLOW"> の二つです。 この二つを<HEAD></HEAD>の間に入れています。 一つ一つに<HEAD></HEAD>で挟まないと駄目なんでしょうか? 何か間違えてたらご指摘お願いします。
>>165 頭が二つあったら変だとは思わないか?
いろいろ議論されてるが、NOINDEXがあるから、
アーカイブされないと考えて、NOARCHIVEは省略する。
<META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW">
の1行にする。
なぜなら、
<META NAME="ROBOTS" CONTENT="NOARCHIVE,NOINDEX,NOFOLLOW">
にすると、"NOINDEX, NOFOLLOW" が上手く解釈されない危険があるから。
NOARCHIVEを書いているサイトがたまにアホーやぐぐるにインデックスされていたりする。
で、それだけ書いて、他は.htaccessやrobots.txtを入れる。
使えない鯖なら、移転を考える。
メタは保険というか、おまじない程度と考えた方がいい。
いや、
>>162 はマジモンの初心者のようだから.htaccessやrobots.txtまでは
もうちょっとちゃんと勉強してからのほうがいいと思う…
どういうサイトやってんのかわからないけど、もしオリジナルなら
そう神経質にならなくていいし、とりあえず
>>165 のメタを入れてな
このスレの過去ログざっと読めばヒントはいっぱい出てくるから
もう少し色々調べてみるといいよ
間違えたー
>>166 のメタ、だ
あと、オリジナルのエロ無しなら、だな…
検索避けしていないので、いつ指摘・通報・非難されるかワクワク待っている。 開設半年、反応無し。 一般人が見ても大抵スルーするもんなんだろうか?
170 :
162 :05/02/13 23:44:51 ID:DupgfA/5
>>166-167 色々教えて下さり有り難うございます!
まだまだ勉強不足なので、タグや検索避けの事をもっと調べてます。
ちなみにエロは無いですが、虹小説サイトです。
過去ログ読んだのですが、時々意味が分からないのでまだ勉強不足だと痛感しました。
本当に有り難うございました。
>>169 知識か良心かやる気か、どれかが足りないかわいそうな人なんだろうなと思って生暖かくヲチ。
172 :
名無しさん@どーでもいいことだが。 :05/02/14 00:30:05 ID:LU6bTu2M
良心が、むしろ有るから。 グレーゾーンな現況が嫌なんだ。
訴えられるのを待つとかいう生ぬるいことをしていないで やっていいかどうか個人の責任で問い合わせればいいだろう。 他人を巻き込んでどうにかなろうとか、誰かがどうにかしてくれるのを待つとか、甘ったれるな。
>>172 良心は知らんが他の人間に対する気づかいは欠落してるな。
>>169 一般人だったころ、同人サイトに迷いこんだけど
「うわ気持ち悪い最悪消えろクソが!」と思って終わり。
関わりたくもないからスルーしてた。
あ、当たり前のようにレスしてたけど
>>169 ,172は同じ人間だよね?
こんなん二人以上居られたら迷惑だ。
迷惑だな。 漫画家志望の友人に引きずられて同人に首つっこんだけど、 あの嫌悪感を覚えてるから検索避けは徹底してるよ。
178 :
名無しさん@どーでもいいことだが。 :05/02/14 03:56:06 ID:LU6bTu2M
甘ったれるな、ね。 版権元の黙認に甘えて同人活動してる人が、それを言えるわけ。 良心との間で揺れながら活動するより、何らかのガイドラインが欲しいんだ。 匿名で密告したら版権元は動いてくれるかな。 他のサイトやサークルを密告するんじゃないんだ。 良心的だろ。
単純に不思議なんだが、なんらかのオタワードをわざわざ検索するような オタ(予備軍としてもいいけど)が、 虹に引っかかって嫌悪して、そして今なぜ同人板にいるんだ?
一般人だって原作のタイトルやキャラ名で検索ぐらいするだろう。 原作を購入する前にネットでレビューを調べたらオタなのか?
LU6bTu2M あ、お前携帯スレで同人つぶれてもいいって言ってたヤツじゃん。 とりあえず、お前のサイトのアド晒せや。 そしたら通報してやるから。 自分じゃ通報できないんだもんな?
>原作を購入する前にネットでレビューを調べたらオタなのか? わりとオタだな(w で、二つ目の質問に答えてくれよ。 なんでそこまで虹を嫌悪したのに、この板にいるんだ? 今も嫌悪しているのか?
初めて同人サイトを見つけた一般人の年輩の人なら 「盗作ではないかあああ!出版社に通報(r」と思うかも知れないけど 普通の一般人は、ヲタサイトかよキモ。で終わりだと思う。 一般人でも、迷い込んだのがヲタ臭の少ない神サイトなら中まで見るかも知れないけど、 そのままブラウザのバックで戻るんじゃないか? でもお互いの為にも避ければいいし。
ていうか一番かわいそうなのがお子様でしょう… 「陰/陽/大/戦/記のコ/ゲ/ン/タってかっこいい〜 コゲンタの絵、グーグルで探す〜」 「あらあらまーくん(仮)もパソコン使うなんて大人ねぇ」 「わーいわーい」
何そのイメクラに居そうなお子様
グロからエロまで溢れてるのに平気でガキに PC使わす親ってなんだろうな〜。
>>186 心配する親御さんならフィルタリングソフトとか入れてるんじゃ?
効果の程は知らないけど。
もう少し前の世代ならば
「出会い系サイトも見られる携帯を支払能力も無いガキが(ry」
とか思ってるだろうし、更にその前にはQ2が問題になった。
PCに限らず道具の進化と利用者の若年化は仕方ないかと。
だからこそ大人も努力(検索避け含む)が必要なんじゃないかと思うよ。
フィルタリングソフトで思い出したんだけど セルフレイティングっていうのは効果があるのかな?
>>188 IE6だっけ? いま窓の最新のIEには効果がない裸スィ。
でも、オンラインフィルタリングとか、フィルタリングソフトを
親が別に組み込んでいれば、効果がある。
あと、個人のエロサイトなんかはフィルタリングしていれば、
もし親から苦情が来た場合
「こっちはレーティングして配慮している。だからフィルタリングするのは親の義務」
って言うことは出来るかもね。
×個人のエロサイトなんかはフィルタリング ○個人のエロサイトなんかはレーティング
>>178 >良心との間で揺れながら活動するより、何らかのガイドラインが欲しいんだ。
それは178の気持の問題でしょ。
何でそれを自分で消化しないで版権元に労力を求める事が甘えてるんだって。
仮に版権元がガイドラインを示してもグレーゾーンは無くないよ。
同人活動は版権元にとっても、それなりに利益に繋がる要素もあるし、
「ガイドライン作成」「判定」「取り締まり」に対するコストを秤にかけた上で
黙認してたり、規制したりしてるんだって。
著作権侵害で犯罪となるか、ファン活動の一環として捉えるかはジャンルや版権元、
原作者の意向、サイトの性質とかの複数の要素によって決まる事だから、
それくらいの自己判断が出来ないなら同人活動は無理なんじゃない?
178の言い分って「自分の頭が良いと思い込んでる中学生の屁理屈」みたい。
ある意味正しいかも知れないけど、現実味が無いし、検索避けの必要性から話がすり替わってる。
>188 自サイトはレーティングしてる。 理由は、189が最後に書いた事ズバリで 「18歳未満のお子さんを持つ親御さん対策」だよ。
ノシ 漏れも親対策wでレーティングしてる。 日本のとicraのと。 関係ないけど、.htaccessとロボッツ.txtいれてたのに ぐぐるに説明文なしでインデックスされてたから、 自動削除申請したら、あっさり消えた。 ぐーと、いんふぉしーくにも載ってたのに、全部消えた。 robots.txt読んでいった形跡があったのに、 申請しないとだめなのかね。
説明文なしでインデックスって、どっかのリンクからそこまできて robots.txtを読んだからそこで止まったっていう状態じゃないの? 中身は見られてないんだから、URLを直接ぐぐられなければかからないよね?
そうなんだろうね。 そういう引っかかり方なら、うちがぐぐるに引っかかってるのに気が付いた他人が見ても 「避けてないのか( ´,_ゝ`)プッ」とは思わないかも知れない。 例えばサイト名が「2ちゃんねる」だとすると「ちゃんねる」とかでぐぐったひとが 1ページ目に出てくる、その説明文がない浮いてるうちのサイトをクリックしたりするのがごくたまにあって。 どうせ自分のサイトを消しても、リンクしてくれてるサイトがバンバン引っかかってるんだけどねw 自己満足なんだけど、なんか消えたら嬉しくなってしまったw
へー。タイトルは入っちゃってたのか。それはひっかかる可能性あるね。 うちはURL生でしか入ってなくて、これはURL知らない人はどうしようもないなと思って放置だ。
urlにリンクされてる状態で、検索結果にタイトルは出ないんだけど、 タイトルでぐぐるとひっかかる。 もし、その状態でひっかかっていていたら サイト名で検索してみると、完全一致なら上位に出てくると思う。 試しにドゾー。 ほかのいろんなサイトはタイトルと説明文などで載っているのに、 そこにひとつだけ、ぽつんとタイトルも内容も書いてないのがあると 余計クリックしたくなるらしい…。
うちもレイティングやってるよ。5日位悩んで全ファイルの格付けを決めた。
日本基準のSafetyOnline2のタグしか入れてないんだけど
icraも導入した方がいいのかなぁ。
引っ掛かると言えば、諸事情でアク禁にした人を屋府日本に飛ばす設定にしていたら
表題のタイトルと、ハイパーリンククリック後に実際に飛ぶURLは「屋府!日本」なのに
最下段に書かれているURLが丸々全部うちのトップページという恐ろしい物が
検索に引っ掛かるようになった事がある。例えばこんな感じ(↓)
・Yahoo! JAPAN
Yahoo! JAPANは2005年スペシャルオリンピックスを応援します。
もっとYahoo! ... Copyright (C) 2005 Yahoo Japan Corporation. All Rights ...
http://www.uchino_url.net/~doujin_site/ - 36k - 2005年2月16日- [www.www.uchino_url.netから検索]
仕方がないので、プロバイダで貰っているスペースに作った空白ページに一旦飛ばして
そこからジャバスクリプトで屋府に飛ばすようにしたら、幸いな事に一週間で消えてくれた。
メタタグのおまじないって、解説サイトではよく 全部大文字で書かれてるけれど、 あれって大文字の方が効果があるっていうことなのかな? NOINDEX,・NOFOLLOW・NOARCHIVEはいっぺんに 書かないで、一行ずつ記述した方が効果があるのかな? 前にどっかでNOINDEXとNOFOLLOWを,で区切って 書くと読まないロボットがあるってみた気がする。
>199 HTMLの正しい文法では大文字で書くというルールになっているらしい
201 :
名無しさん@どーでもいいことだが。 :05/02/28 22:49:42 ID:O+Xs+JQh
ロボ避けのメタタグ入れてるのに、ヤフーで自分のサイト名入れてみたら 見事に検索結果に表示されてしまった。 >検索結果からサイトへのリンクや説明文、キャッシュなどの、特定のページを検索結果から削除する場合は、 >下記のHTMLを記述します。 ><META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW"> まさにこの通りにメタタグ入れてるんだけどなあ…。 小文字で書いてるからだろか。 >199さんの >NOINDEXとNOFOLLOWを,で区切って >書くと読まないロボットがある これかもしれないので分けて書いてみる。robots.txtは置けないからなあ…
おっとっと。ageてしまった、ごめん…
>>201 うちも同じだ!
おまじない効果無いのか!?
すみません、質問です。 フレームページに検索よけタグを入れたいのですが何処に入れたらいいのかわからないので だれかご教授お願いできませんか?
普通にヘッド内に入れなよ。 フレームページにもヘッドはあるべ。
あ、そうなんですか! ありがとうございます 日にち変わってしまったけど204です。
う。 うちもサイト名の一部で矢風にヒットする…… まぁサイト名があまりに特殊かつ長過ぎる+ジャンル無関係なので サイト名直球で検索してくる分には大丈夫と信じたいけど…
サイト名でヒット!! と思ったら、同名別ジャンルサイト… しかもナマモノ…
サイト名で検索した結果を報告するスレとなりますた。
ぐーぐると違ってやふーは検索結果から削除してもらうよう 申請するページが無いんだね。 だったらせめてメタタグを正確に読み取る精度を上げてほすい。
やふーは検索結果画面からのアクセスを制限すれば良いんじゃないか? うちはそうしてる。誰かがサイト名じゃなくアドレスを丸ごと 登録したらしく(何の意味があるのかわからんが)やふーからのアクセスが あったので検索画面からはアクセスできないようにした。 やふーからのアクセスはなくなったよ。
>検索結果画面からのアクセスを制限すれば良いんじゃないか? これって.htaccessでできる? うちのサーバはrobots.txtが置けないんで、やふー対策はメタタグしか現在やれてない状況。 しかも私もサイト名じか打ちして検索すると出て来てしまう。
>>212 > これって.htaccessでできる?
調べもしないで訊こうとするなよ。
検索結果だけじゃなくて、ヤフーのロボ自体も
.htaccessが使えるなら弾けるのだから、
ヤフー対策はメタタグでしかできない訳でもないだろうし。
うーごめんよ。 そんな方法もあるんだーと思ってつい尋ねてしまった。
>212 屋風のロボに拾われたことあるんだけど、 メタとrobots.txtと、ついでに.htaccessで屋風ロボを弾く設定にしてみたら、 検索結果画面の自サイトのタイトルが「403」になっていて、 クリックすると普通にうちに飛べるようになってた。意味ねー。 で、Web板かどっかの.htaccessスレで、特定ページからのアクセスを弾けるか聞いたら、 それはジャバスクだって教えてもらった。
屋風を弾くのって普通にこれじゃ駄目なの? setenvif referer "yahoo.co.jp" bad_referer1 deny from .inktomisearch.com ↑屋風のロボ
.htaccessが置けないので robot.txtとMETAで今まで登録されずにやっていたのに ヤフに拾われてしまったよ(´・ω・`) 少しはMETA読んでいるらしくサイト名とURLしか出ないけど困る。 もう移転するしか対策はないんだろうか・・・。
>>218 因果関係が分からないので不確かだけど、
ぐぐるの自動削除にrobots.txtのアドレスで登録したら
ぐぐるの検索結果から消えた途端、アホーからも消えたよ。
偶然なのか、何かしら関係があるのかはちょっと不明。
ノシ 自分も因果関係は分からないんだけど ある時ヤフに拾われてる事に気がついて 拾われてる分のアドレスを細かくチェックしてみたら ぐぐるのロボ除けのMETAが入ってるページだけ拾われてなかった。 試しに拾われてたページにも入れてみたら次の巡回で削除されたよ
ぐぐる限定のロボ避けタグを入れておけば やふからも避けられるってことかな。不思議。
218です。 一応ググの避けも入っていたのですが、ググの方にも拾われていたため (もしかしたら誰かが登録したかもしれませんが) ググの削除依頼からrobot.txt読ませてmetaでページ削除もしました。 ググの方からの検索は消えましたので、ヤフに拾われているほうに NONE,NOINDEX,NOFOLLOW,NOARCHIVEと書いていたものを 一つづつの指定になおしてみました。 これで上手くいけばいいのですが……。消えたらまたレポします。
>222=218 乙。 私も.htaccessが置けないので人事ではないです。 レポ、待ってるよん(´・ω・`)ノシ
224 :
名無しさん@どーでもいいことだが。 :05/03/06 22:41:07 ID:k8Vg5cL3
良スレage 参考になります
225 :
名無しさん@どーでもいいことだが。 :05/03/07 08:10:06 ID:N/WPB6Uf
なるほど・・・アレとかコレとか中々検索に引っかからないと思ったら みんな必死こいてこんなことしてるのか・・・ 全く、ネットの世界は奥深いな! その昔、HTML作った人は頑張って検索性を高めた設計にしたと言うのに… 本末転倒だけどまぁ潜りたい気持ちも分かるなぁ・・・
ひたすら検索に出ない様に極めるのも楽しいモンだよ。 逆SEOっていうかw
227 :
名無しさん@どーでもいいことだが。 :05/03/08 00:40:36 ID:g8Kq7AaZ
切実にサイト探してる者からしたら…(*´д`;) 秘境にあってこその楽園ですか…
オリジならともかく虹はなあ。版権元が推奨してるとかいうのでもない限り、 潜らざるを得ないでしょう。 >227 同人サーチやジャンルサーチでがんがって探せ。
>218 >222です。 ググを消去してから3週間ほどたったのですが、ヤフーはまだ消えてません_| ̄|○ ヤフの方も消えた方はどのくらいで消えたか詳しく覚えておられますでしょうか? 今はググロボ拒否のMETAを先頭にMETAを数十個と、 robot.txtがいれてある状態です。
>>229 やっぱりヤフは.htaccessじゃないと弾けないかも。
自分はググを消去したらアホーから消えたけど、
ぐぐにロボテキ申請したときに.htaccessも見直しした。
あと、meta要素を数十個も入れてると、アホーはメタを無視する。
アホーのヘルプに載ってるタグ一つに絞って、
他の検索の為のメタは削って、ロボテキで弾け。
ファイルも重くなるし、メタの羅列はロボテキが入ってるなら、無意味。
屋風は更新されるの遅いのかも。 自分215なんだけど、12月にrobots.txtと.htaccess入れてぐぐに削除申請したら、 ぐぐは一週間くらいで削除してくれたんだけど、屋風といんほしーくはそのまんま。 で、じりじりしながら待ってたら、2月に入ってやっと更新されたはいいけど、 .htaccessで403返してたもんだから、サイトタイトルが403になってて、 クリックすると普通に自サイトに飛べる状態だった。(キャッシュは403画面) ちなみにいんほしーくもなかなか削除してくんなくて、メールも送ったけどダメで、 最後はぶち切れてカスタマーズサービスだかにメール送ってやっと削除してもらった。
.htaccessで、 ・ヤホーのロボのIPを弾く ・ヤホーのロボをUAで弾く ・ヤホーからのリンクを全面的に弾く …のコンボをしてるからか、ヤホーには全く拾われてないよ。 ロボ避けしていないサイトからもガンガンにリンク貼られてるけど。(漏れんとこは参加型サイト) ちなみに漏れがやってるロボ避けは、 .htaccess、robots.txt、robot.txt、全ページMETAタグ。 robots.txtを置くなら、robots.txtだけでなくrobot.txtも置くべし。 ロボの中にはrobot.txtしか見ないロボもあるんだって。 あと、ルートディレクトリじゃなくてどの階層に置いてあっても見たくれるロボもあるみたいだから、 駄目元でも一応置いてみるといいかも。
>見たくれるロボ 見てくれるロボ _| ̄|○
229です .htaccessは置けないのでMETAを一つに絞って ヤフんほ記述通りのNOINDEX,NOFLLOWだけに差し替えてみました。 巡回の記録がちょうどググで削除した日でとまっているので、 これでもう少し様子見て見ます。 駄目ならあきらめて引っ越すことにします。
235 :
220 :05/03/18 17:34:53 ID:ZBq+BgWW
私は <meta name="GOOGLEBOT" content="INDEX, NOFOLLOW, NOARCHIVE"> コレを入れたらヤフからも消えた 入れてるのは全部で <meta name="ROBOTS" content="INDEX, NOFOLLOW, NOARCHIVE"> <meta name="robots" content="index,nofollow,noarchive"> <meta name="robots" content="index, nofollow,noarchive"> <meta name="GOOGLEBOT" content="INDEX, NOFOLLOW, NOARCHIVE"> これだけです。 ヤフは消えるまでに2.3ヶ月かかったと思う
まちがった(;・∀・) <meta name="ROBOTS" content="NOINDEX, NOFOLLOW, NOARCHIVE"> <meta name="robots" content="noindex,nofollow,noarchive"> <meta name="robots" content="noindex, nofollow,noarchive"> <meta name="GOOGLEBOT" content="NOINDEX, NOFOLLOW, NOARCHIVE">
237 :
名無しさん@どーでもいいことだが。 :05/03/19 02:20:40 ID:qUB7Bqr/
良スレなんで 上げますよ〜 検索避け徹底厨がうるさいから(´_ゝ`)
<meta name="robots" content="noimageclick"> <meta name="robots" content="noimageindex"> サイト表示画面をキャプチャして検索結果に表示させる ロボットもあるから、noindex,nofollow,noarchiveに加え ↑のも入れてる。 あとrobot(s).txtと.htaccess。
とりあえず>236のメタタグと>217のサイトにある .htaccessテンプレ一括を入れておけば まあまあ大丈夫・・・ということなんだろうか 私のサイトは <META name="robots" content="noindex,nofollow,noarchive"> <META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW,NOARCHIVE"> だけでアホーはじけてるみたいなんだけど、アホーは 大丈夫だったりダメだったりの基準がよくわからんね
このスレ見て先日慌ててrobots.txt入れたんだけど コレってTOPから入ってくるロボにしか効果ないの? サイト内のページの1部がヤフにヒットしてるんだけど 待ってたら次の更新のときにはずしてくれるのかな?(メタも入れた) それともページのアドレスを変更しないと難しいんだろうか msnのページプレビューも対応したいんだけど User-agent: * Disallow: / User-agent: searchpreview Disallow: / ↑こう書けばいいのかな? それとも上2行だけでいいの? 聞いてばかりで申し訳ないが教えてください
242 :
240 :2005/03/25(金) 15:49:47 ID:/9W8YseC
>241 やっぱりですか。 ありがとうございます。ディレクトリ名変えて来ます。 生ログ見るとヤフロボットがrobots.txt読んでるみたいなんですけどね。 立ち読みしただけで行っちゃったのかな…?
243 :
名無しさん@どーでもいいことだが。 :2005/03/26(土) 04:06:01 ID:FS3eWHwn
ageよ(・∀・) 良スレだ
>218 私も.htaccessが置けないので、メタタグでやってる。 ググルもアホ―もずっと拾われなかったのに、ある日突然アホーに拾われた。 飛んでみたら非常にもにょるが、一目で好意で登録されたらしいとわかる 表記方法だった。誰かが「あなたのお奨めを登録してね」を鵜呑みにして、 勝手にしたんだろうな。アホーに拾われわしたが、ググルは相変わらず 拾われてない。 そういう状態なら、次にアホ―が巡回して消してくれる日を待つしかないよ。
245 :
244 :2005/03/27(日) 02:08:54 ID:Ntvyo6Vc
すまん、つづき。 手動登録されてしまうと、削除手段はアホ―の言うメタタグいれて、次にロボが 巡回した時にそのメタタグを読んで削除してもらうしかない。 ちなみに登録される時(登録ではなく、正しくは『ページの一致』に表示される) 時は、メタタグを無視して推薦されたURLをそのまま拾う。 その状態でも、キャッシュ禁止とかは生きるみたいだ。
>>244 アホーのディレクトリに登録されたの?
登録されたらメールが来るが?
言ってることがよく分からない。
ディレクトリに載せられたら、やめてくれって言えるけどね。
ディレクトリに登録されてメールが来て、そこから飛んだ、と言う意味では?
アホーのMETAいれてrobot.txt置いて巡回来たはずなのに それでも消えない場合どうしたらいいのかな? もう諦めるしかないのだろか・・・
244はなにか勘違いしてるか、言葉の選び方を間違ってないか? どこかのリンク集がひっかかってたの? 「ページとの一致」に載るのは推薦されたサイトでもないし、 このスレ的には「拾われた」だけであって「登録」とも違う。 アホーと具ぐるは検索が別になったから、ぐぐるにURL申請してもあほーは関係ない。 アホーのロボット検索(ディレクトリではなく)のURL申請窓ってあったっけ? 具ぐるにはあるが。 で、「ページとの一致」にスタッフは紹介文付けない。 「登録」されてるのは「Yahoo!登録サイトとの一致」のほう。 あんまり同人サイトには詳しい説明文つけられてないけどね。 んで、ロボットを呼ぶ申請は「推薦」とはあんまり言わないじゃない? ぐぐるは無理矢理日本語訳にしてるから「推薦」って言葉を使ってるかも知れないけど。
>>248 robot.txt? robots.txt
アホーは.htaccessでしか弾けない。
index.htmlが引っかかっていてアドレス変えられなければ諦めるしかない。
ひっかかってるのはindexではないのだけど 検索結果を見るとtitleとアドレスしか読んでない感じ。 なので、titleのとこを消してみてもう少し様子見てみる。 ヤフーはほんとやっかいだな〜。拾われたら最後か…
オリジナルメインで創作もちょっぴりのサイトだったから 全部のページにメタタグのnoindexだけを入れていた。 最近このスレを知って改装ついでにnoarchiveも カンマで挟んで入れるようにしたら、いきなりグーグルに 拾われるようになった orz メタタグではじく場合はnoindexだけの方がいいのかもしれない。 参考までに。
noindexが入ってるからアーカイブもされないけどね。
>>252 グーグルはお行儀が良いのでロボテキ読んだらUターンしてくれるよ
拾われたキャッシュは削除してもらって、ロボテキ入れればOK
こちらで良いのか迷ったのですが、 相談というか質問させてください。 長文で失礼します。 .htaccessの設置不可のバイダ、robots.txtもルートディレクトリには 置けないが一応置くだけは置いて、メタタグで検索避けしているサイト。 最近、急に検索から訪問する人が増えたので辿ってみると ぐぐるとあほー、msnに拾われていました。 ある程度は仕方が無いと覚悟はしていましたが、問題は 検索ワードが自分のリアルネームだったことです。 もちろんサイト上には一切記載していません。 また、サイト名が違っています(サイト名の補助説明的に 添えた単語が拾われている)。 その間違ったサイト名は、あるスポーツを連想させる可能性があり、 もしやと思ってその単語でぐぐってみたところ スポーツ関連サイトに混じって 自サイトが上位に入ってしまっていました。 取り急ぎぐぐるには削除申請をしましたが、 原因はなんでしょうか。 また、今後の対処法としてはどのような事が考えられるでしょうか。
>255 .htaccessが使えない鯖でのロボ避けは難しいよ。(特にmsn) 月125円くらいから格安鯖が幾らでもあるから、移転したほうが早いとおも。 .htaccessもSSIもCGIもsendmailも使える鯖もある。大手だから簡単に見つかる。 検索に引っ掛かるのはindexだけなの? サイト中身も引っ掛かっているの? 中身も引っ掛かっているのなら、index以降のページをサブディレクトリに入れて、 そのサブディレクトリの名前を定期的に変更するとか。 indexも拾われたくないのなら.htaccessじゃないと無理ぽ。
ソース内に名前が入ってるなんて事はない? ワードだかフロントページだかでウェブページ作成すると PCのユーザ名がソースに入っちゃうような気がした。 それをロボに拾われてる、とか。
屋ほーを.htaccessで弾けていて、今の鯖に移ってから4ヶ月ぐらい拾われていなかった。 一時期載ってしまったのだが、具ぐるの削除申請をした途端に消えていた。 でも、とあるサイトでリンクは貼らずにサイト名と内容を公開されたところ、 サイト名で検索してくる人が激増。 最初の頃は、自サイトのトップは引っかからないので リンクしてくれてるページのキャッシュとかから来る人が多かったんだけど、 そのうち、急にサイトのトップも拾われてしまった。 説明文はなしだが、サイトのタイトルが何故かhtmlに付いているタイトルではなくて、 リンクしてくれたサイトがスペルミスしたそのままの名前になっている。 アホーに載ったらmsnにも_| ̄|○ よく調べられる単語でデータ取って、拾ってきたりするのだろうか。 いままでrobots.txtは全てのロボットに読ませていたけど アホーにはrobotstxtすらも読ませないようにしてみた。 これでうちのサイトのファイルは全部403になるはず。 消えてくれればいいのに、アホーほどのサイトで削除申請できないなんて不親切だよ。
255です。 〉256、257 拾われているのはindexだけです。 それ以下のページはすべて検索避けタグを入れ、 〉256後半の対策を取っています。 サイトはタグ打ち支援ソフトを使って手打ち、 ユーザー名等はソース内をさらってみてもまったく入っていないので なぜ拾われるのかは謎のままです。 ただ、サイト名については 〉258 〉サイトのタイトルが何故かhtmlに付いているタイトルではなくて、 〉リンクしてくれたサイトがスペルミスしたそのままの名前になっている。 に該当していることに気付きました。 ……本当にデータを取って検索結果に反映させているのかも。 対策としてはやはりサイト移転が一番のようですね。 サイトが大きくなったらいずれは移転を と考えてはいたので、早速鯖をあたってみます。 ありがとうございました。
売/国テレビでググるとテービーエスが出てきちゃう仕組みの関係か? サイトじゃなくて本とかどこかで本名公開してるなら有り得るのかも 可能性は禿しく低そうだがナー
>260、261 ありがとうございます。大変参考になりました。 リンク先の単語が検索結果に反映される可能性など、 考えたこともありませんでした。 まだ仮定の段階ではありますが、さしあたってサイト名間違いのリンク先に 状況説明と表記変更のお願いをしてみます。 本名については、もちろん公表はしていません。 オンの同人活動と実生活は、自分の認識としては 交友関係も含めかなり厳密に線引きしているつもりでいたので、 余計に不可解で気になってしまったのでした。 スレ違い気味になってしまい、申し訳ありません。 名無しに戻ります。
アホーが避けられねぇ。 ロボテキだけは読ませてて拾われたので、 ロボテキもDenyにしてもやっぱり拾ってくる。 うぜえええええええ。 ジャンル名やジャンル名とカプの組み合わせではひっかからないけど サイト名でばっちりと。 造語のサイト名だからうちのサイトと、うちへリンクしてるところしか出てこないけど、 サイト名で検索掛けてくる人たくさんいるんだよ_| ̄|○ ロボテキもMEATも.htaccessもはいってるから サイトの説明文も出てこないけど、 サイト名で引っかかってたらプゲラと思われるのかな_| ̄|○ ジャンルは版権元も黙認だけど、健全サイト多いからで ガッチュンエロなんかはやっぱりマズーだろう。
アホーお行儀悪いよね。 あんまりむかついて、ヘルプからメール出したことある。 「METAも入れてるしロボテキも入れてるのに拾われた挙句、 何ヶ月経っても削除されないがどういうことか。 METAもロボテキも読む気ないならヘルプにそう書いておけ」 という趣旨のことを、丁寧に訊ねてみたところ、 「うちのロボットは2〜4週間に一度回ってるから、 タイミングによっては登録削除されないかもね、気長に待ってね」 という内容のテンプレメールが届いた。 …だから何ヶ月も拾われっぱなしつってんだろーが……。
>263 アホーの検索結果のページからのアクセスは弾いてる?
>>264 アホーは口先だけのうそつきメールを寄越してくるんだな。
まさにアホー。
先月末に拾われて腹が立って.htaccessを強化して、
手ぐすね引いて待っていた。
で、先週ろぼきたー!
ロボテキ読んで帰った。
ロボテキにアホーのみは読めないようにしてるのに読みやがった。
そして翌々日、しっかり更新しやがった。
削除フォーム作れよアホー。
もう一つやってるオリジエロなしサイトは
アホーのディレクトリに載っていて、アクセスそこからかなりあるし、
そのサイトがアホーに載ってるのは嬉しいから、一般の人がアホーに載るのが好都合な気持ちも分かる。
でも誰でも彼でもアホーに拾われるのが嬉しいと思ってんなよアホー!!
あれだけの検索エンジンだからこそ拾われたくねーんだよ!
何のためにそのオリジサイトとは別の鯖借りてるとおもってんだよ!!!
リンクして「おらぁこんなサイトもやってるよ」と紹介したくても、
アホー対策のためにリンクもしてねーよ!!
267 :
263 :2005/04/12(火) 19:49:13 ID:GxxHHOf2
>>265 一時期はじいてた。
そしたら今度は文書のタイトルが
「403 Forbidden」になっただけで現状は変わらなかった。
(もうこの辺りでアホーのロボは馬鹿だとしか言いようがない)
自分の場合は、サイト名そのままか、URL以外ではヒットしないのと
サイト名が他の用事で検索するようなものでもないので
そこから来てる人はうち目当ての人だと思うけど、
自分の場合はアホーから来るのが困ると言うより、
あほーの検索結果に自サイトのトップが載ることが我慢ならないです。
リンクしてくれてるページはいっぱい引っかかってるので
来るならそっち回ってきて欲しい。
なにか良い案ないだろうか。
>>267 私264なんだけど、今ふと最近解析で見てないなーと思ってアホーで検索かけたら、
どうやらサイト削除されたっぽい。
フォームから苦情言うのはもしかしたら効果があるかも。
(苦情言う前にサイト名検索して確認済みだったから、苦情後に削除されたのは確実)
「ページとの一致」ヘルプの一番下にある
「まだ解決していません。問い合わせします。」からフォームに行けるから、
ページ検索・キャッシュについてを選択して、2番にメアド、3番に自サイトURL、
詳細のとこにいつ拾われていつから対策してて削除されないか書いて送信。
METAはもちろんアホーのヘルプに書いてある通りのMETAタグだけ入れとく。
もしうちが削除されたのが苦情言ったおかげだったら、
263も削除されるかも知れない。されなかったらスマソ
うちも先週いきなりアホーに拾われた。 アク解見たらアホーからサイト名で来てる人発見して_| ̄|○ METAもロボテキもいれてるのに…_| ̄|○ サイト名(とある単語)での検索結果が 一覧の一番上なんて勘弁してくれまじで……削除させてくれよおおお
deny from .inktomisearch.com ↑屋風のロボ これでアホーのロボを弾いてる?
271 :
263 :2005/04/13(水) 01:45:37 ID:G/vxLyyp
>>268 サンクツ。試してみる。
>>270 それ知らなかった。入れてみる。
うちにロボテキ読みに来てるのは、ぐぐるとmsnとYahoo! Slurpなんだ。
一つ一つのアクセスをチェックするのは生ログ1日分で10万行有って無理なので
ロボテキへのアクセスだけ抽出してた。
そのUA初めてみたからアホーのロボはマジでロボテキ読んでない?
>>270 ヤフはinktomiのエンジン使ってたのか!納得したよ。アリガトン
漏れは2月にinktomi系(msnとヤフ)に拾われたキャッシュが
先日やっと削除されたのでほっとしたよ。
Internet Archiveに過去拾われたキャッシュの削除申請って、 ロボテキ置けない場合はやっぱり英文でメール出すしかないよね。 昔誰かが削除申請用英文メールのテンプレ作ってたのを、 ちらっとどこかのスレで見たことがあるんだけど、 誰かそのテンプレお持ちの方はいますか?
>273 数字板の派生サイトに残ってるんで転載しとく 983 名前: 風と木の名無しさん これをテンプレにしろ、と言うわけじゃありませんが(w このぐらいの英文で対処してもらえると思いまつ。 ++++++++++++++++++++++++++++++++++++++++++ [挨拶とかしたければ適当に] I found my website archived in your collection at [url]. (見つけたぞ、ゴラァ) I do not want my internet materials to be collected in your collection, or any other internet archives whatsoever. (コレクションすんじゃねー) [optional. もしも、消したいサイトが今の鯖と同じ鯖に置いてあったもので、同じURLが使えるなら] My intention to forbid any copies, reproduction, or collection of my materials has been claimed at [URL] (無断転載厳禁だって、とっくに言ってあるんだぞ、ゴラァ) [もちろんこのURLに自分のサイトに無断転載厳禁などの英文を置いておくこと。] Since I cannot place the robots.txt, I request you to remove the above mentioned collection of my internet documents from your web archive ASAP. (漏れはrobots.txt置けないから、そっちでアーカイブから削除しろ、すぐにだ!) I also request you to make sure that, from now on, the internet documents in my website should not be gathered nor made available in your collectoin or Wayback Machine. (それから、もう二度とロボット寄越して、ブツ持って行ったり、公開したりするなよ) If there is anything you need to verify my claim of ownership, please email [メアド] so that I could comply with your verification. (何かこっちでやることがあるなら、やってやるから言ってこい) Thank you in advance for your kind efforts. (よろしくね) +++++++++++++++++++++++++++++++++++++++++++ …いや、括弧内の和訳のような口調ではありませんが(w きつい口調ではあるので、もっと表現を和らげたかったら、want → would like とか、手はありますけれど ということでガンバレ>273
>>274 乙!だけど、文中 'materials' とあるから、
これ、素材屋さんの文面じゃないかな?
一般のサイトだったら、materials → pages に変えた方がいいかも。
>>274 あ、そうですこれです!
ぐぐったりかちゅのログ漁ったり、
散々探したのに見つけられなかったので、すごい助かりました。
どうもありがとうございます。
…それにしても最後だけ「よろしくね」なのが何かツボるなぁw
>>269 うちも先週くらいに拾われてトップに出てきて困る
サイト名が比較的メジャーな単語で、何かの技術用語でもあるらしいから
調べて飛んでくる人がいる
グーグルはタグの記述ミスで拾われちゃったことがあったけど
申請したら次の日には削除してくれていたのに
昨日の>273です。 274の文章の冒頭に「ハロー」くっつけて、「やってやるから言ってこい」の後に、 「ただし自分は英語が不得意だから、言ってくるなら簡単な文章にしろ」 と付け加えて出したところ、今朝作業完了メールが返ってきて(確かに簡単な英文だったw)、 めでたく削除が完了しました! こんな作業早いと思わなかった。 アドバイスくれた人達、マジでありがとう。
>>281 どんな英文だったん?
よければ詳しく!
>281じゃないけど 私はこれだけで2件お願いしたけど特に問題なく削除してもらえた。 Hello. My page is reprinted without permission here. 「サイトURL」 Please delete it. We wish to express our gratitude of you for the act. 返信はテンプレ風で3行メール。 詳しい文は忘れたけど訳すと 依頼された処理が終わったので確認ヨロ って感じでした。
>>282 返ってきた英文は、
「Hello,
Your site has now been excluded from the W○yback Machine.
If you have any other questions or concerns, please let me know.」
これだけだったよ。(一応伏字にしてみた)
実際見たらきっちり削除されてたんで、速い仕事に感激した。
アホーに見習って欲しいね
286 :
名無しさん@どーでもいいことだが。 :2005/04/20(水) 14:46:26 ID:oP6gBZ3i
あげ
MSNとアホーに同時に説明文なしでインデックスされたので、 「今すぐ消せ。メタとロボテキ実装済み。二度とロボよこすな」 というようなことを数十枚のオブラートに包んでカスタマーに送った。 帰ってきた返事が、文字化け。 付いてきた添付ファイルは展開できたので読んでみると、 「インク富のロボ使ってるから、インク富に従ってねミ☆ でも、インク富の仕様は公開されてないのれ〜ミャハ☆ だからMSNちゃんよくわからないから消せないの。 手動でも消せないの。 ごめんね。ミャハ☆」 というような(意訳)メールが来た。 そんな管理できないようなロボ使うなボケ。 .htaccessで弾いてもすり抜けてくるあたり腹たつー。 インク富から削除されれば、アホーやぐーからも消えて嬉しいのだが。
インク富はロボテキ読んでってくれるロボだと思ってた うちには日に2回くらいの割合でほぼ毎日来てるけど ロボテキだけ読んでサクッと帰ってくよ
>>288 ロボテキ読まないよ。うちでは
印苦富め……
でも
>>270 で弾いたら入ってこなくなったyo!
弾いてしばらくしたらキャッシュも消えてた。
290 :
287 :2005/04/21(木) 09:47:18 ID:6tlTItTH
インク富、ロボテキだけ読んで中身はみないで帰る。
でもキャッシュも説明文もないけど、
htmlのタイトルとは違うタイトルで、インデックスだけされてる。
インデックスからも消えて欲しい。
>>270 で弾いても、ロボテキはAllow from allしてるせいか
読んだ時点でサイトの存在を知ってしまうらしくて、
ロボテキも読ませないようにしてみたのだが、それでもしっかりインデックスしやがる_| ̄|○
他のお行儀のイイロボの検索にはのってないので、ロボテキの記述が間違ってるわけでもないのだが。
>288 何て記述してるの?<ロボテキ
>290 苦情言ったのはMSNだけ? アホーにも言ってみたら?>268の例もあるし。
293 :
287 :2005/04/21(木) 15:17:42 ID:6tlTItTH
>>292 アホーへは言ってない。
別の鯖でやっている、非同人サイトがディレクトリに載ってるので、
サーファーの機嫌次第で「こっちも消してやれ」とやられたらと思うと
チキンで言えてないです。
そんなことは無いとは思うけどw
串&捨てアドで苦情言ってみようかな。
こちらのスレにも関係あるかと思うので貼っておく。
検索避け・.htaccess共に効かない模様。誰か解決策はないものか。
841 名前:風と木の名無しさん sage 投稿日:2005/04/23(土) 20:53:33 ID:IfniC3f0
話、豚ギリスマン。
気をつけた方がいいかも、というサイトを見つけたよ。
f/c/2/ブ/ッ/ク/マ/ー/ク
ttp://bookmark.fc2.com/ 今日から始まったサービスだけど、
登録されたサイトが、新着サイト一覧で 誰 で も 見れる。
(参考URL:
ttp://bookmark.fc2.com/s/ )
個人用ブクマだから、サイトのリンク集と違って、
自分の見たいページを登録するでしょう…。
サムネイルをとられるし、
BASIC認証を使ってないサイトは、
ここに登録されたら、内部URLが漏れる可能性があるよ。
( Д) ゚ ゚
>294 (((((((((( ;゚Д゚)))))))))ガクガクブルブルガタガタブルブル htaccessきかないって?! 使えないサーバーではどうしようもないな・・・
もうかなり登録されてるね…同人サイトも大漁大漁。 Web拍手の管理画面とか登録してる人もいる。 こりゃこえーな…。
298 :
名無しさん@どーでもいいことだが。 :2005/04/24(日) 23:30:49 ID:kwEPJcs9
BASIC認証ならとりあえず回避はできるという事でいいの?
認証でもスクショは撮られるけど、侵入はできないみたいね
とりあえず登録されちゃったら、ジャバスクで FCブクマからのリンクを全部屋風あたりに吹っ飛ばすとか、 そのくらいしか対抗策が思いつかない…。 ジャバスク切ってたら意味ないけど、やらないよりはマシだろうし。
サンクス。 仲間内にも注意を喚起せんとやばいな〜。
でもサイトで「ソーシャルブクマしないで」とも言えないし 注意喚起するのも、かえって厨喜ばせそうだし 天然ちゃんに登録されたら困る。 指銜えてみてるしかないのか? BLサイトが沢山登録されてるが 天然で登録してるのか、悪意か?
まぁ意図は本当のところはわからんし、どっちであっても迷惑なのは変わらんしなー しかしグロとのいたちごっこを延々続けるつもりなのかねあれ
>>302 とりあえずはサイト持ちでまだこれを知らない人間に伝えるよ。
日記や注意書きに関しては今は様子見。
これ、リファラどういうの吐くんだ? リファラがfc2とは限らないよな。空かも試練。 空なら弾けない。
307 :
305 :2005/04/25(月) 00:07:55 ID:MskJ75XT
>>306 試しにアクセス解析を1ページにつけたあと、FC2ブクマで一つ自分のページを登録して、
リファラを調べてみるか。
>>306 試してみた。
http://bookmark.fc2.com/s/ これがリンク元URLになってたよ。
新着から飛ぶと、allってディレクトリが後ろにくっつく。
自分のブクマページから飛ぶと、自分のユーザー名ディレクトリが後ろにくっついた。
つーか登録して即削除したのに、
ばすばすアクセスがあって正直ガクブルした。
じゃあ.htaccessでhttp://bookmark〜を弾けば大丈夫か? スクショは仕方ないとして。
>309 今オチ板で祭真っ最中だからね…
>309 教えてチャソで悪いけど、スクショは任意のページなの? それとも登録したアドレス(indexなど)のページ?
>>313 ユーザーが自分のパソで開いてるページ。
htmlだろうが画像だろうがフラッシュだろうがBASIC認証内だろうが
お構いなし。
ずっとこのままならTOP、注意書きページにf/c/2/ブ/ッ/ク/マ/ー/クを使用しないで下さい。 という文もデフォになる日が来るのか。 っつかなんとかしろ…馬鹿f/c
>314 サンクス。 (((( ;゚Д゚)))ガクガクブルブル
せめて個人単位で見れる仕様(他人のブクマは見れない) とかにしてくれないかF/C/2・・・ なんでブクマを共有する必要あるんだヴォケ
318 :
305 :2005/04/25(月) 00:33:50 ID:MskJ75XT
SetEnvIf REFERER "bookmark.fc2.com" Ref1 order allow,deny allow from all Deny from env=Ref1 .htaccess使える人はこれでどうだ? リファラ無しは弾けないが… 試せる人、実験キボン
320 :
306 :2005/04/25(月) 00:37:47 ID:hO7WCPLn
>>309 ,305
サンクツ&乙!
リファラで弾けそう。
htmlを避けられるか不安な鯖だがやってみる。
リファ弾いてもページにURL書かれてるからコピペされたら無意味じゃね?
>>321 全体数は減るだろうから、
対処が幾分楽になるんじゃないかな。
>309 ありがとう!君は勇者だ! >321 それは2ちゃんに晒されても同じ事だから目をつぶる。 少しでも全体数が減らしたいからリファラ弾くわ。
324 :
305 :2005/04/25(月) 00:45:37 ID:MskJ75XT
あんまり、手の込んだ事が出来ない人は上記で既出の「忍者ツールズ」の「煙巻きコントロール」を使って、
1、リファラに
http://bookmark.fc2.comを含むものは全てアクセス拒否 2、JAVAを無効にしている場合も拒否(忍者はJAVA制御なので)
3、指定されたページ(たとえば自サイトのトップなど)からのみアクセスを許可する
この条件を設定したJAVAソースを直接アクセスされたくないページに貼ればおk。
詳しい使い方は忍者ツールズで調べてくれ。
325 :
305 :2005/04/25(月) 00:47:47 ID:MskJ75XT
>>321 >>323 自分が話題に上げてるヤツは、ブックマークや直接アドレス入力も弾くことが出来るよ。
「指定ページからのみアクセスを許可する」といった具合に。
>325 ノーdあたりはデフォでリファラ吐かないようになってるんじゃなかったっけ? そうするとノーdユーザーはどこのページに進もうとしても弾かれる気がするんだがどうか。 (自分はノーd使ったことないから分からんけど) 巻き込まれる人が大量にいそうだから流石に弾けない…。
他板へ誤爆してレスいただきましたが、こちらにも投下させてください。 bookmark.fc2.comをIPアドレス検索かけたら 64.125.250.218 という結果 これをdeny fromで弾いてみることにしました。
>>319 試してみたよー
普通にアクセスできますた。
>>327 それも試してみたよー
…やっぱりアクセスできちゃうな。
.htaccessではやっぱ難しいかもしれない。
>>328 出来るんかい_| ̄|○
鯖はどこ?
画像ファイルは利ふぁで弾けても、htmlは許可する鯖が有るんだよな〜。
うちもだけど。
>>327 あっちで、固定だから出来るって書いたものだけど、
よく考えたら、ユーザーのIPではないからDenyできるのかな。
SetEnvIfかmod_rewriteが必要か?
mod_rewrite書ける人いるかな。 自分は詳しくないから書けないや。
>>330 >SetEnvIfかmod_rewriteが必要か?
薬屋鯖はそれ使えない仕様……orz
.htaccessも駄目かよーちくしょー! …つかさあ、まだ自分らは趣味の範疇だからいいよ(良くもないが)。 もし企業の、一部の人しかアクセスが許されてないページが 悪意の第三者に晒されたらfc2はどう責任を取るつもりだろう? 企業のセキュリティはそんなに甘くないだろうけど 可能性としては起こりうるわけで。
>329 やはりダメですか… ローカルをキャプって持ってくようなので意味無かなと覚悟してましたが。 ありがとうございます。 >330 alexa.comみたいにツールバーユーザーの履歴を後からロボが拾いにくる タイプなら有効なんでしょうね。もうダメポ
ナマモノや半ナマやってる人は特に危険だよな、このブクマ。
あ、ごめん!!すごいごめん、319で弾けた!! コピペ失敗してただけみたい。マジですまそ…。
>338 焦らせんな、このー!!(w ほっとしたところで自分は寝る。
うわー良かったあああ!! 実験ありがd!!
安心して寝られます。ありがとうございました!
>>338 差し支えなければ鯖どこか教えて。
薬屋?
そういえば、白紙のページが403出てたのあったよ。
>>344 多分それ自分w
某プロバの提供鯖。
かなり何度も何度も実験で自サイト登録かましたので、
それ以上はごめんね。
>>346-347 だろうねー一瞬なのにえらいアクセスだったもんorz
ここで実験結果報告したのに免じて忘れ去って下さいorz
乙!人柱本当に感謝。 FC2なんてことをしてくれたんだ! これMETAも入れないような人とか 閲覧側であまり詳しくない人だったら普通に便利で 使っちゃうよな……。 生と半生は.htaccessが使えないサーバーだとこの先運営できないジャマイカ!
生と半生は.htaccessくらい使える鯖でやるのが当然じゃないか?
幸いな事に非生非半生だけれども虹も扱ってる手前、
表立って人目に触れる事は出来るだけ避けたい。
しかしながら、うちの鯖じゃ.htaccessが使えない('A`)
気休め程度だが、せめてもの抵抗でJavaScriptを置いてみた。
<SCRIPT type="text/JavaScript">
<!--
reff=document.referrer;
if(reff.indexOf('bookmark.fc2.com')!=-1)
{
location.replace('
http://www.google.com ')
}
//-->
</Script>
これでFC2→ググルと飛ばせるかと思われるのですが、
なにぶん人柱になれないチキンでスマソ。
根本的解決にも成らないし、事と場合によっては引越しも検討しなければ…。
FC2逝ってよしウワァァァァァァヽ(`Д´)ノァァァァァァン!
.htaccessが使えても スクショとりまくりやURLが出る時点で 生や半生は厳しいとオモ
正論だ
>>350 だよね。
何を馬鹿なこと言ってるんだと思っちゃったよ。
よく見たらこれ.htaccessとかあんまり意味ないサービスですね。 人柱のテストページがいくつか上がってるようだけど、 登録されたら弾こうがどうしようがURLは参照できちゃうのでは コピペで飛べるし弾く意味もなくなってしまうのだが…。 FC2側で対策してもらえないことにはどうにもならないのかな?
コピペで飛べるのは、 2ちゃんに晒されるのもそうだし、あのブクマに限らないから 防げないにしても、スクショが問題だよ。 なに勝手にスクショ撮ってんだよ。 悪名高きmsnでもスクショ撮らせないように出来るのに。
ここのサイト何?くらいの人なら わざわざコピペしてまで飛ばないと思いたい。 しかし、同人をしらないか悪いイメージしかない 人達にも同人サイトが晒されてるわけだからしゃれにならないよ。
こういうのって、何かの法的問題にならないものなのか? オリジナル創作のサイトとかでも、公開したくない人もいるだろうに。 あとは前述の、秘匿されてるページとか。有料会員専用ページとかさ。 しっかり自サイトを登録してるツワモノもいたが_| ̄|○
週末出かけてたから乗り遅れたorz
mod_rewriteの書き方。
RewriteEngine on
RewriteCond %{HTTP_REFERER} ^
http://bookmark\.fc2\.com [NC,OR]
RewriteCond %{REMOTE_ADDR} ^64\.125\.250\. [OR]
RewriteCond DUMMY CONDITION
RewriteRule ^.*$ - [F]
がんがん登録されてるよ… 御丁寧にオンリーからサーチから もうアボガd…(ry
マジかよ!il||li _| ̄|○ il||li
ああああ、もうホントやめてー リファは弾く様に設定したけど、晒されたらどうしようもないよネ…orz
ウチのサイトもキタ━━(゚∀゚)━━ッ!! アナタダレヨ…orz エロは無いけど一応虹だから、改装中を装って慌てて仮閉鎖状態にした。リングとかが巻き添え食らったら嫌だしナー。 抗議メールしてみたので、このまま対応待ちする。ここって返事とか来るのかよ。 現状ではスクショ対策無理なんだよね?.ht〜でアク禁だけしとくか。 このスレほんと助かるよ。おまいらありがd
裏ページも登録されてるな…。 うちの自ジャンル寝る前はないから安心したのに起きたら既に登録されてた。 どうするんだよ、うちの神が閉鎖したらどうするんだよ! でもURL晒されたらどうしようもないよねー…。
て言うか昨日うちに誤爆しまってたページと同じ所が登録されてるってことは下手したらうちも登録されるのか? 一応indexにFC2ブクマへの登録止めてくださいってこれから書いてくる。 痛いって思われようが自衛するしかないよ(´・ω・) なんで駄目なのか、その問題点を纏めたページ作ります。 はっきり言ってこのサービス同人系エロも無差別さらし状態なのが一番の問題だとオモ。 何の為に警告挟んでるのか、理解して欲しいよ。
>>366 諸刃の剣とは言え、天然ちゃんもいるからな。難しい所ですね。
ネカフェでPC使う人には便利なのかもしれんが、F/C/2で無くていいだろと小一時間。
つうか、自分でサイト作ってない人の中には、検索避けって言葉さえ知らない人いるだろうしナー
368 :
名無しさん@どーでもいいことだが。 :2005/04/25(月) 15:06:44 ID:MExRdOzP
とりあえずageておこう。一大事だし
せめて登録した人になんらかのコンタクトがとれるようであれば、 削除してくださいとかお願いできるし、 登録されたくないサイトに対するMETAのようなものがあれば、 こんなことにはならなかったのにな・・・。 全てのページが誰でも簡単に見られてしまっては、 アダルトサイトの認証もワンクリ詐欺も防ぎようがないではないか。 一体どうするつもりなんだろう。
もうだめぽ…(´・ω・`) うちは弱小サイトだから、多分登録してくれるような人いないだろうけど 大手の人とかキツイだろうなと思う。テラアリエナス…
エフ氏2は厨企業だからな、以前ここの無料HP使ってたけど本当にひどかった。 鯖落ちは日常茶飯事、なのに障害情報は出さない、問い合わせは徹底ヌルー、 その苦情が助け合い掲示板に集まると中の人が削除しまくり、終いには掲示板ごとアボーン。 マジでDQN。メール送ってもムダ。 そんな暇あったら自衛に励んだ方がいいと思われ。
このスレ登録したのはここの人か?
検索サイトとしては使えないと思うけど。 すぐ廃れるよ。
嫌がらせの人もいるが、徹底抗戦構えの有志も人もいるね 昨日から2の有志の人達がかなり頑張ってるよ… とりあえず自分も自衛はしてるが、F/C/2に抗議メール出してきた。 華麗にヌルーだとしても、意思表示だけはしとこうと。
このスレ普段はちまちまとしかレスがつかないのに 最近レス数増えてるなあと思って覗いてみたら、なんて怖いんだソーブク… なんか、某飛翔系忍者漫画同人に怨み持ってる人間が あの機能悪用してるようにみえるね。 「うちのサイトをソーブクへブクマ登録するのはやめて下さい」という注意書きを 自サイトに載せるのが難しいという人は、とりあえずは 「同人サイトに限りリンクフリー。不特定多数が閲覧可能なブクマサービスへ このサイトを登録するのはご遠慮下さい、非同人サイトからのリンクと同じです」 とかは駄目かな。結局言ってる内容は同じだけど…
解析見たらFC2からばんばん来てるよー とりあえず登録してる人やめてねお願いページでも作って そっちに飛ばすか…… この超都市前の忙しい時に何さらすんじゃ( ゚Д゚)ゴルァ!! そしてハラシマでネト断ちしてた人たちが復帰する今週は あちこちで閉鎖の嵐か?
ヲチ板を本部に抗戦まとめサイトの動きがある 設置する鯖情報など出せる人は連携よろしく
>>360 神キタ━━━━(゚∀゚)━━━━!!!
ありがとん。頂いていきます。
>375 ブクマする人(サイト持ちじゃない人)はリンクに関する注意書きなんて読まないと思う。
トップに目立つ大きい字で書くしかないよ。 登録した本人も見るだろうし、 悪意がなければ消してくれるはず。 好きなサイトならね。
>>360 凄く初歩的な質問でごめんなさい。
これはどこに挿入すればいいんですか?
>>382 藻前さんはweb初心者スレから始めることをお勧めする。
>>382 どこって。
まさかhtmlに挿入する気ではあるまいな?
このスレを先頭から読め。
全く関係なくて申し訳ないんだけどさ… 挿入って単語は エロい な
>382 鯖によっては使えないから気を付けるんだぞw
387 :
382 :2005/04/25(月) 16:46:49 ID:7NnwWJZ9
即レス有難うございます。 慌ててたとはいえ、頭から読まずにすみませんでした… orz
mod_rewriteが自鯖で使えるかどうかというのは鯖屋にメールするしかない? Apatchのバージョンが問題ではなく、鯖屋が禁止してるかどうかなんだよね?
>388 その通り、鯖管次第なので千差万別。 レン鯖板に借りてる鯖のスレッドがあれば情報があるかも。 メルする前に探してみては。
.htaccessが使える鯖なら、faqに使えるかどうか載ってるんじゃない? mod_rewrite使える鯖って少ないけどね。
ついでに、変な構文書くとすぐ無限ループするからお気をつけてノシ
dクス FAQには載ってなかったからスレ探してみる
ここをみて慌てて解析見たら、ぐーぐるに引っかかっていた。 metaタグ入れていたのに何故orz 幸いFC2には登録されていなかったのでほっとしましたが。 プロバイダーの鯖使っていたけれど、そろそろ有料鯖に引っ越すべきか。
FC2会員登録して詳しく見てみたら このブクマをサムネごと自分のブログに貼ることも出来る つまり'bookmark.fc2.com'をよけただけではダメかも…
>396 ( Д ) ゚ ゚ …FC2は、同人サイト撲滅運動でもやっとんのか…? ジャンル仲間の何人かがFC2鯖だったが、今回の件で解約すると言っていた。
>388 なんでもいいから拡張子を.phpにして <? phpinfo() ?> の3行コピペしてうpしたら確認できるんじゃないかな? Apacheだと思うんだがその鯖のPHPの仕様が出るから ブラウザで「mod_rewrite」を検索。(Loaded Modulesのとこ) PHP使えるかどうかくらいは鯖仕様書に書いてあるはずだけど。
追加説明。ブックマークのサービスの1つでありました ブックマーク貼り付けタグ テキストボックス内のタグをページに貼り付けると、ページ下部のようなコンテンツがページ内に表示されます。 ご自身のページやブログ、WIKIなどに貼り付けることができます。 (略) これを貼り付けると どこでも自分のお薦めブクマサイトがサムネ付きでお薦めできます…ってコラ!
挙句に無断転載推奨かよ 本当にロクでもねーな
ブクマした人のコメントが「更新遅い」とかで笑えない リア厨と思しき登録者が18菌サイトバリバリ登録してるのも笑えない
>399 やってみましたがmod_rewriteはありませんでした。 そもそもLoaded Modulesという項目が無く・・・使えないということでしょうか。 とりあえず問い合わせメールは送ってあるので返事を待ってみます。
まとめサイトも登録されてるね。 うちもバナーはろっかな。。
もまいら移転汁! ……そう簡単には無理かorz
移転したところでどうにもなんねっての。 根本的解決方は無い。 数ヶ月毎に移転を繰り返すなら別だけど。
だよなあ。 移転移転、ってわけにもいかんし。 そもそもそんな面倒なサイト、神サイトでもなきゃ人が来ねえよ…orz
さして需要があるとも思えないこのアホウなサービスを fc2がさっさと止めてくれることに期待するしかないのかorz 漏れもブログに投稿してこよう
>>400 wikiにも貼れるのかよ!!
もう対応無理歩
カテゴリーがごちゃごちゃだから 自分とこが晒されてるかどうか調べるのも一苦労だよ。 虹なのか?同人なのか?作家なのか? 誰だよ、たこやきなんてカテゴリー追加したのは! それ以上増やすな!
>414 サンクス!さっそく調べてみる。 でも、これで自分ちが見つかったら見つかったで切ないぜ…orz
こりゃひでぇ…
ちょっと待て・・・・・ 夕方は無かったのに今みたら自ジャンル登録されてら… 流れも読んだが、ブクマは弾けるが、他のは対処ないじゃないか!
>>417 うちも自ジャンル来ちゃったよ・・・・。
>412 それ導入しようかな
その検索、全データから検索できてるのか? 自サイトのサイト名の一部で検索すると、 時間によって、出てくるサイトが変わってる。 出てこなくなってるのもあるし。 ヒットしてくるのは一般のサイトだけど、 出てきてないのは消されたのだろうか。 これだけカオス化してると、自ジャンルだと登録する人いなそうだけど 登録されたらどうしようもないし、解析に引っかかるまでまったりできるかな。 ただ、解析付いてないページにされたらアウトだが…。 鯖ログの提供は2日後だし。
利用規約、追記されてるぞ!!
で、プライバシーポリシーとやらはどこに書いてあるんだよ… 相変わらずわけわからん。
>>422 プライバシーポリシーは
明後日辺りに追加されるんではないか。多分w
同人ナマモノサイト結構やられてるね かわいそう…
>425 予言っつーかお決まりのパターンだよな。それ。
そしてブログは苦情ごと記事あぼーん 素晴らしい対応ですね'`,、('∀`) '`,、
まぁ、過去にも都合の悪いものは消し去ってきたし・・・今更・・・今更・・・ とは言わず、さっさとこのシステムあぼんしろよ、中の人。
壊滅だ、もうジャンルは壊滅だ。 _| ̄|○
生ホモサイト集中的に晒してる奴がいるな。
一夜明けたらものすごい勢いで増えてるな。 そして日登はいつの間にか消えてる…。早ッ
リファラで弾いたページに説明文と 登録した人おながい削除してって文章入れたら 当人が見てくれたのか うちを登録してた人のIDでは同人系のサイト消されてたよ。 日参してくれてありがとう。 落とす気配濃厚な超都市ハラシマに戻ります_| ̄|○
fc2って会社概要が全く解らないところだな。 普 通 の 真 っ 当 な 会 社 な ら 本社の住所や代表取締役名、従業員数、取引銀行その他を 明らかにした自社HPがあって然るべきなんだが。 そんな怪しげな会社を利用したがる香具師の気持ちが分からん。 もっとまともなレン鯖は探せば幾らでもあるだろうに。
>>434 きちんとそういう情報見る人はそもそもFC2なんか(ry
436 :
434 :2005/04/26(火) 10:39:18 ID:fC3cp/jT
スマソ、概要あった。 だが日本での問合せ先はないんだな…
昨日入稿で、それまで修羅場中だったから、ネトオチしてて、全然知らんかったよ・・・ うちはピコだし晒される事はナイト思うが、 帰ったら対策だけはしておこう・・・orz
>433 オツカレ、良かったね 結局のとこ、嫌がらせとか晒しの登録じゃなかったらそれが一番効果的なんだね。 天然で登録する人は自分で使うためにオンラインブクマに登録したつもりなんだろうし。 マトモなサイトの登録数増やして共有ブクマを充実させると、却って定着してしまうと 思うんで、ヲチ板の人達にはそろそろ祭りに飽きてもらいたい。
tu-kaヲチじゃねえだろあれ。特攻大杉。 ところで、実験用に登録したページに速攻でGooglebotがやってきた件 こっちがどんなに必死で検索避けしてても、 f/c/2ブクマに登録されるとロボがやってくるってどうなの
IDがozn…
資本1000万、従業員7名。 普通なのかもしれないが7人じゃ対応大変なんだろうなぁ でも問題ありすぎだろ…
>>441 >一応、著作権無視厨対策を取るようだが
詳しく
7人も居なくても立派なシステムやソフトウェアを提供してる会社なんてザラにある 人手不足じゃ済まされないよ…
ていうかあれだよね、人手が足りなくて苦情に対応できないなら そもそもこんなに手を広げてサービス展開するな、っていう…。
あの7人って何人が日本人なんだろ。 応対は何人体勢でやっているのか知りたい所だ。
447 :
446 :2005/04/26(火) 17:00:23 ID:84BAMb6X
変な日本語スマソ。 「あの7人のうち、日本人は何人なんだろ。」です。
意味は分かったよ。 でも日本人が入ってるとも限らないかもね。 全員あっちの人。日本語が分かる人が二人ぐらいいるとか。
449 :
441 :2005/04/26(火) 19:35:20 ID:5sLxTDqJ
>443
よく読んだら著作権厨防止策はされないようだ、期待させてスマソ…。
>これまでにNAVERブログで投稿していただいた、
>・ブログ記事
>・写真
>・コメント
>・掲示板への書き込み
>データは、そのままCURURUでもご利用いただけます。
ってあるから、今直リン&パクッてる画像はそのまま持ち越しになりそうだ。
しかも今度はブラックリスト機能も追加。
さらに「サークル」と呼ばれるサービスには
・年齢や性別などの入会制限
・他の人には一切見られなくする
等の機能があり、パク&直リン隠しに一役買いそうだ orz
説明するより読んでもらったほうが早い。↓
【NAVERブログからCURURUへのお引越しに関する詳しいご説明】
ttp://blog.naver.co.jp/hikkoshi/info/index.html
プロバイダー提供鯖から早速引っ越すべく、 有料鯖と契約してきた。 健全だけれど版権元がおっかないし、メタタグ入れていたのに拾われていた挙句、 とうとうFC2キタ━━━━(゚∀゚)━━━━ !!!!! 連休はPHPと.htaccess、ロボテキの勉強に励みます
ほいみん ふらぐぽいんと 氏んでくれよもう!
神サイトが登録されてる… 閉鎖しちゃったらどうすんだよフザケンナ 登録してる側にやめろと言えるなら何万回でも言うのに。
452が登録者に何万回も「閉鎖しちゃったらどうすんだよフザケンナ」を言うオフ
同人板でも、FC2ブクマスレ別にたてて、ー利用しないーとかいれて age続けたほうがいいんじゃないだろうか。
>>454 あっちでも言われたけれど
・来訪者増量、カウンターぐるぐる、大歓迎の、
検索避けに無知、アンチが必死になる
・逆に、晒し・荒らし目的で登録する私怨ちゃんが必ず出てくる。
検索避けに関心のあるサイト運営者なら、
おそらくこの騒動へのアンテナは立っていると思うし、
情報も得ている・・と思いたい。
>456 で、拒否する為にはFC2にこっちの情報を提示せにゃならんのかと。 アボガドバナナだなまったく。
四葉ってヴァカなの?
ぱど街を髣髴とさせるなぁ>拒否りたけりゃ個人情報よこせ
事態は良い方向に進展している…と見ていいのだろうか fc2のことだから、どうなるんだかな。まだ信用できないよ。 そういう対応はもっと早くやっておけと
思い出しますねー。 あの時は拒否したい管理人が自サイトに「拒否したいと申請してるのはこのサイトの管理人ですよゴルァ」ページを作って そのurl、「迷惑かけといて個人情報寄越せとは何事だゴルァ」とあわせて申請したんだっけ?
>>463 きてますた とか言ってるから、おそらくチャネラだろうな
>463 その人、どっかに降臨してたよ。 さーてfc2はまだ拒否対応してないみたいだし今のうちに .htaccess、CGI&PHP、生ログで遊びまくるかなー!腕がなるわ! 版権元、それほど厳しくないけどなw
その人、昨日は どっかのスレで腐女子叩きに忙しかったみたいw
豚切りすみません、アーカイブに削除依頼のメールを出そうと思って サイト内を探したんですがメールアドレスが見つかりませんでした 過去にメールを出して削除にこぎつけた方、 現在も有効なメールアドレスをご存じの方いらっしゃいますか? ググルで検索をかけて情報ページを見つけたんですが そこで削除依頼の連絡先として紹介されていたアーカイブの (おそらくメールアドレスが載っているであろう)ページが現在はなくなっていました 試しにアーカイブを使ってそのアーカイブのurlを出したら(orz) メールアドレスは出てきたんですけど現在も有効なものなのかわからなくて… 一応3日前に送信してみましたが音沙汰はありません 対応が早いと過去ログに載っていたので不安になり、お聞きした次第です 説明が長くなってすみませんが、よろしくお願いします
468 :
名無しさん@どーでもいいことだが。 :2005/04/27(水) 16:24:56 ID:YloAtnSr
豚切りって馬鹿かお前?ww
>>467 サイトトップからFAQいって、
How can I remove my site's pages from the W○yback Machine?
のとこのexclude.phpに貼ってあるリンクをクリック。
ロボテキの書き方とか書いてあるページに出る。
で、いっちゃん下の方に、藻舞んとこでロボテキ置けなかったらここにメルしてねーと、
メアドが書いてある。
そこにメル凸すると削除してもらえるよ。
467は屠殺業者の人なんだよ。
豚切りが解らない人は同人板の住民じゃないな。
つーか、豚切りっていうのがウザいんだろ。 ふつーに話し始めればいいわけで。 何でもかんでも、豚切りトン切り。 解体屋かっつーの。
473 :
467 :2005/04/27(水) 16:51:51 ID:u+bdhjdb
469 ありがとうございます!! すみません何をツッコまれてるかもわからないので 無視してやってください…泣
まぁ今は興味本位で覗く人も居るだろうしね。 その板ごとの2ちゃん語は、他の板の住民じゃ理解出来ない事もあると思う。まぁマターリしましょう。
そうか?普通に意味が分かってなかったんじゃね? 今はこのスレもいろいろと変なのが見てるみたいだしな。
スマソ リロしてなかったよ。
専ブラ入れたのにネトヲチみれない… もう来ねぇYO!!
捨てセリフはいらん、黙って消えろw
エフシーの拒否設定の穴 Basic認証かけててもSSとれてurl晒しができてしまう件
┐(´∀`)┌ すでに故意ブクマ登録晒しで潰されたサイトもある件
>481 四葉ちゃんすごかったもんなー。 更新するまで晒してやる!!はやくはやくはやく!!って全ページブクマして、 サイトあぼーんしたら「更新してないくせになんで閉鎖しちゃうの!?」だもん。 彼女のブクマ見てるだけで、最悪システムだということが良くわかるよ…。
四つ葉はネタだろう 故意のサイト潰し 今登録してるページみると面白がってるのがわかる
四葉消えてる… ということは解決したのか?
規制のほぼ無いジャンルで管理人が天然の場合 素で「アクセスUP!ヤッタネ ミャハ☆彡」とか思ってそうなんだが
>486 天然で自サイトの解析晒してたところの 解析結果を見てしまったんだが 設置当日のみ通常の3倍で その後は埋もれたみたいで戻ってたよ。 そして今ID見てみたら >エラー発生 >このブックマークはプライベートモードに設定されています だった。
全ページMETA入れ直して登録出来るか確認してみた。
結果は「登録不可」。
ツールバーは入れてないからスクショなし。
だけど、CGIなら登録出来てしまうんだよね…orz
しかもそれがリンク集とか日記とかだから余計にイタイ。
ちなみにリンク集は
ttp://www.t-okada.com/cgi/のヤツ 。
どうにかならんものかな。
やっぱりHTMLで作り直すべきなのか。
日記はレンタルのお絵かき掲示板oebit使用。
とりあえず、どっちにもMETA仕込ませてくれと泣きついてみたけど
無理っぽ…orz
ダウンロ−ドして設置するフリ−ソフトとか有料CGIはMETA仕込めるんじゃない?
アリガトン。 どこをどうしたらいいのか分からなかったけど 自力でがんがって仕込めるか見てみる。 それが無理なら作り直します(´Д`)
>488 自分で設置したcgiなら、ほぼ仕込める。 うち、違うリンク集スクリプト使ってるけど、全ページ最初から仕込んであるよ。 レンタルのものは、無料だと不可能だと。(レンタル先的には引っかかってなんぼのもんだと思うから)
>>491 ありがトン。ザッと見たけど、仕込めるっぽいので試してみます。
問題は、どこにどう記述するかサパーリな自分の頭だけですが
それが一番の壁っぽいです(藁
ググって初心者向け解説サイト探してきまつ(ノД`)
今まで検索避け不要のジャンルだっただけに今回の件は涙ものだ…orz
>>492 CGIスクリプトのコメントに
「ヘッダ部分」だとか、「広告を挿入する場合はここ」とか「タイトル部分」とか書かれている所を探す。
そこらへんに
$属性(headとかtitleとかそれらしい属性) = <<"HTML";
ってのがあるので、その下に
タイトルタグやメタタグなどの見慣れたhtml記述があったら
そこにメタを仕込む。
便乗。 print "<META HTTP-EQUIV=\"Content-Type\" CONTENT=\"text/html;charset=EUC-JP\">\n"; の下に<meta name="robots" content="noindex,nofollow,noarchive"> でいいのかな。
>494 まぁ一回やってみれ。間違ってたら500エラー出るから。 合ってたらソース見たらちゃんと記述されてっから。
四葉復活したな・・・
>495 必ずしも500で済むとは限らない。 >494 cgiの記述ミスでおかしくなったりする鯖もあるので慎重に。 > print "<META HTTP-EQUIV=\"Content-Type\" CONTENT=\"text/html;charset=EUC-JP\">\n"; > の下に<meta name="robots" content="noindex,nofollow,noarchive"> でいいのかな。 この場合は print "<META HTTP-EQUIV=\"Content-Type\" CONTENT=\"text/html;charset=EUC-JP\">\n"; print "<meta name=\"robots\" content=\"noindex,nofollow,noarchive\">\n"; 改行ごとにprint "〜\n"; "の前には\
499 :
494 :2005/04/29(金) 18:04:43 ID:gLgnp+Q6
>>498 ありがとうございます。
一度やってみようと思ったけど、エラーじゃすまないこともあるから
分からないなら何も書くなって言われたことがあったんで
ありがたいです。
むしろ”を記述しないという手もある
考えるの面倒なら print <<"EOM"; <meta name="robots" content="noindex,nofollow,noarchive"> EOM でもよかよ。 「print <<"EOM";」と「EOM」の間には普通にHTMLを書けば良い。
print qq|<meta 〜>|; ならば間に""(ダブルクオート)が入ってもエスケープの必要なし。 perlにおいては qq<>とかqq||とかqq//とかはダブルクオートと等価だから覚えておくといいかも。
その辺は違う板で調べればよいのでは
えふしーで盛り上がり中にスマソ。 以前ヤフに拾われてどうしても消えないと嘆いていたものですが、 やっと消されました。 .htaccessが使えないのでサーチからのアクセスはjavaで 鯖側のデフォルト404に弾いていたんだけど、 それが直接の原因かは不明ですがついに表示結果に出なくなりました。 .htaccessが使えない方は試してみてもいいかもしれません。
>>505 javaって。JavaScript?
JavaScriptで弾いた方が消えるのかな。
どんな方法にしろ、ヤフからのリンクが長期間弾かれていれば デッドリンク扱いになってそのうち下がって消えるよね .htaccessで弾くにしても、全ファイルをphpかcgiにしリファ取って 弾くにしても、javascriptで弾くにしても、ヤフから繋がらないなら消せる。
ttp://dmoz.org/World/Japanese/ ↑ここに知らない間に登録されてて、ドカドカ人が流れ込んでくるんだけど、
これ、登録の削除って登録者しか出来ないのかな。
一通り検索してみたけど、どこにも削除ページないし。
しかも色んなサーチがコレを基準に拾うから次々登録されてるし。
ロボ避けも.htaccessも入れてるのに丸つぶれ。
いっそ移転しかないのかな・・・
URL変更の届けはできるみたいだから、適当なURLに書き換えて理由のところに 「登録されると迷惑だから」とか書くのを繰り返すくらいしかなさそうだな。
>>508 そのオープンディレクトリ、載りたい人はほんとに載りたいらしいけどねw
サーチも「自分のサーチに登録されて喜ばないはずがない」みたいな運営方針は止めて欲しいよな。
ロボ避けについて検索してたら、メタで対策する場合は <META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW"> <META NAME="ROBOTS" CONTENT="NONE"> の2行を入れないと効果がないとか、 逆に複数行入れると相殺されて効果が出ない場合があるとかも書かれていた。 どっちが正しいんだ……
ロボの種類によって色々。 あっちを立てればこっちが立たずというのが現状だね。 metaとかrobotsが大文字では読んでくれないなんてのもある
タグを入れても意図的にそれを無視して読み込んでいくようなロボットもいるから METAだけで完全に弾くのは無理だろうね
>>513 >>514 かたじけない。.htaccessとかが置けないサーバなので参考になります。
検索大御所をざっとまわって見てみたが
<META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW">
でいけるところが多かった。しかし大文字だと弾けない場合もあるのか…
>>515 今をときめくFC2ブクマは小文字でないと意味がないらしい。
小文字を一番上にして、二つ目に大文字。 いっそのことタグ記述内に「FC2来るな」と書いてれば拒否とかだったら まだよかったのに…。アハハハ…(ノ∀`)。・。もうメンドクサーになってきたよ
どのくらいの数行で相殺されてしまうんだろうか <meta name="robots" content="noindex,nofollow,noarchive"> <META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW"> <META NAME="ROBOTS" CONTENT="NONE"> <meta name="ROBOTS" content="NOINDEX, NOFOLLOW, NOARCHIVE"> <meta name="robots" content="noindex, nofollow,noarchive"> <meta name="GOOGLEBOT" content="NOINDEX, NOFOLLOW, NOARCHIVE"> 自分これだけ入れているんだけど、相殺されてしまってかな。
>518 小文字fc2用が一番上だとOKらしい。 ヤフに登録されてはしばらくするとクロールで消えてをもうかれこれ何回か繰り返している。 何が原因か解らない。 robots.txtもMETAもいれて弾いているのだけど 何故登録されてしまうのか・・orz
.htaccessで弾こうぜ
>519 やふに強力に収集されてるサイトからリンクされてるから?
noindex,nofollowを入れた時はnoarchiveを入れてはいけないと前に聞いた。 とすると>518の一番上はまずいことになるんだけどfc2はこれで平気なん?
>522 平気。
>noindex,nofollowを入れた時はnoarchiveを入れてはいけないと前に聞いた。 どこで聞いたか知らないけど、特に問題無いよ noarchiveを入れないとWebArchiveに容赦なく拾われるので注意
>メタ複数行で相殺 メタタグ20行も入れても無駄ってこと?
ものによっては無駄になる。
だいぶ前にグーグルに引っかかってしまったので ロボテキ、メタタグを入れてグーグルに削除の申請をした 今日また引っかかっていた 何か記述ミスがあったんだろうかorz
再びググに拾われてしまった? うちはヤフだけ削除・登録を繰り返しているけど、 上のほうにある拾われまくりのリンク先の履歴が残っているものらしい。 グーグルは一回消してロボテキ入れればまず二回は拾われないので、 記述ミスチェックしたほうがいいと思います。
削除したページが半年くらい経ってもいまだに載り続けてるのはどうにかならんものか
前のサイトのアドレス、ググキャッシュも ヤフも消えてから解約したのに、 先日サイト名でググッたら404ページが引っかかってる。 何でだ?!と思ったら多分リンク貼ってくれたまま放置したサイトの リンクページからの記録が出てるようでした。 こうなるともう対処できないので見ているしかない・・・。 こんな事になるなんて思わなかったorz
キャッシュに残ってるのが自サイトのならどうにかなるけど 検索サイトとかのだと手が出せないよね… 漏れも一昔前結局拾われなくなるまで我慢したなあ
自サイトはほぼ完全にロボ避けできてるんだけど 管理放棄されたサーチが引っかかってて、そこからバンバン飛んでくる…orzタノムカラヘイサシテクレ
引っ越せば?
ホイホイ出来るもんじゃないよ>サイトの引越し
>>533 javaや.htaccessで、そこから来る人をアホーや自作404に飛ばすのは?
そのサーチが検索に引っかかるのはどうしようもないし・・・
簡単に出来るけど。
>536 有料サイトか無料サイトか 検索サイトに登録しているかどうか(変更手続き等) コンテンツ量(ファイル量) CG・PHP等のI設置の有無 いろいろ考えてごらんよ。 そのサイトによっては「簡単に引っ越しができない」だけの コンテンツ量や手間暇を抱えているかもしれない。 藻前のサイトは簡単にできても、他人はそうではない。 それだけの話し。
一文字欠けた。 CGはCGIの間違い。
管理放棄されたサーチを閉鎖させるよりかはまあ簡単だと思う>引越
うん。
ECJv5bbZが何かうざい
サーチから登録削除自分でできないタイプなの?
プチもめの種になっててスマソ 独自ドメインな上に、サーチはTブックマークなので 管理人がどうにかしないと手の施しようがないんだorz そこから飛んで来る人を弾く方向で考えてみます
まあ、悪いのは引っ越せない管理人じゃなくて 放置しっぱなしのサーチ責任者だわな つか、検索避けしてないサーチは入る気にならん 厳しめのジャンルだから・・・
RSSのロボ避けってどう記述すればいいんでしょうか
検索避けしてない検索サイトって存在価値あるんか? 検索サイト自体が二次創作してるわけじゃないから検索避けをする必要もないし強要することもできん罠 厳しいジャンルなら専用サーチもそうならざるを得ないのかも試練が
サイトもサーチも検索避けしてたら、新規はどこからそのジャンルにたどり着けるの?
>検索避けしてない検索サイトって存在価値あるんか? ごめんね、まちがいだよ ただしくはこう 検索避けしてる検索サイトって存在価値あるんか?
「ロボ避け処置をしてないサイトからのリンクはお断り」の一文を リンクページの片隅に入れておけば良いんじゃないかな 以前いたジャンルの大手サクルさんのサイトにはそういったお願い文が載ってて、 それを無視してリンク張ってくるサイトからは飛んで来れないように弾いてたみたいだった。 そのサクルのお陰なんだか何なんだか、あのジャンルはサイト作成初心者が 多いような印象があるにも関わらずロボ避け率は高かったように感じた。
>>534 >>543 も言ってるけど、独自ドメインだとサイトの引っ越しは無意味。
独ドメの利点に引っ越しをしてもURLは変わらないと言うところがあるからね。
ただ、独自ドメインの人は引っ越しをしなくても、URLを返られる利点もある。
自分の独ドメにサブドメインを作って、今もし
ttp:// ○○.com/というドメインを持っていたら、
そこには白紙のindex.htmlを置いて、理論上破棄する。
で、新しいアドレスを
ttp://適当なサブドメ. ○○.com/にする手もある。
もちろんDNSの設定も変えるだよ。
それか
ttp:// ○○.com/適当なディレクトリ名/
なら、独ドメじゃなくてもできるけど。独ドメでも出来るし。
.htaccessで弾いた方が楽だと思うけど。
検索避けしてあるサーチにだけ登録してますが何か? サイト名とか管理人名で検索かけられて辿りつかれたくない管理人もいるんですよ
まぁまぁ喧嘩腰になるなよ
いちばん外側の入り口だけ検索にかかるようにして、 サーチの中身(登録サイトの情報が出る部分)は検索避け、 というサーチはけっこうあるとオモ 何かややこしいな。
最近やけに携帯からのアクセスが多いと思ったら、
ttp://crooz.jp/ ここに拾われてた。メタタグもロボテキも入れてるのに。
うちに来てたロボットさんの情報。
210.188.228.87
DoCoMo/J-PHONE/KDDI/UP.Browser/1.0 (CROOZ)
>サイト名とか管理人名で検索かけられて辿りつかれたくない なら最初から「検索かけて辿りつくための」サーチになんか登録するなよ、と喧嘩腰レスに挑戦
METAタグとか一切無視して掘り返していくロボットもあるから完全には防げないと思われ
>>554
挑戦されてもw
553みたいなサーチだと安心して登録できる。 サーチの検索結果画面が、キャラ名とかでググって出てくると…。
>>556 言葉足らずだったけど、そのCROOZっていう検索サイトには
ロボテキもメタタグも見ますよ〜って書かれてあるんだよ。
なのに、うちのサイトは拾われちゃったんだよね…('A`)
ロボテキもメタも解説どおりに置いてるのに無視するアホーのために .htaccessをはじめて置いてみた これで検索結果から無くなればいいな
アホーのロボを.htaccessで弾いてるのに拾われ続けている。 なのでアホーの検索結果からのアクセスも弾いている。 それでも拾われ続ける自サイト。 検索結果が更新されるたびに、.htaccessを見直し、 403で弾いているのも確認しているのに。 アホーのロボは月に1度クロールしているというのが一般的な情報みたいだが、 リンク貼ってくれてるリンク元が400〜500件ぐらいあるせいか (アク解に引っかかるリンク元の数) 自サイトの情報は週に1度のペースで更新され続けている。 泣きたくなる。 この攻防戦をもう数ヶ月も続けている。
>561 リンク元がアホーに拾われまくりだともう何しても無駄です。 弾く以外はない。あとはアドレス変更。 しかしリンク先が避けてないと(ry の∞ループなので、現状で何とかするしかないと思われ。
.htaccessでパス付けているサイトに、 アクセス解析つけても解析できないの?
??
(?∀?) ヽ(?ー?)ノ (?д?)ハァ?
>563 できる。
567 :
名無しさん@どーでもいいことだが。 :2005/05/21(土) 21:31:21 ID:YtHQiF/h
下にあるべきスレじゃない。age
熱帯アソシエイトは検索に引っかかりますか。
<title>と</title>の間にサイト名入れると ロボ避けのメタタグ入れてても拾われる? サイト名を直打ちしたらうちのサイトが検索結果に並んだけど、 管理人名を直打ちしてもうちのサイトは並ばなかった。 この違いの原因は何かなーと思ったらtitleタグかなあと思ったので…
>569 関係ねー
572 :
569 :2005/05/30(月) 22:18:15 ID:wFNxGZWb
あーなるほど、頓珍漢なこと聞いてすんまそ。 売国新聞社と打つと朝日新聞HPが表示されるのと同じ原理か。
自分もサイト名でインデックスがアホーに拾われちゃったよー。 サイト名が書いてあるのは<title>サイト名</title>のみなのでそれで拾われたとしか…。
だから、タイトルタグに書いてあるタイトルで リンク貼ることが多いからでしょ。なぜループする。 自分はタイトルタグに 「2ちゃんねる」がサイト名だとしたら「2ちゃん」みたいな感じで 略して書いてあるが、アホーにインデックスのみ引っかかっている。 そのリストの、あのページタイトル出てる所。 余所のサイトがうちにリンク貼るときに、スペルミスしたスペルで載ってる。
ロボ避けタグを入れられない転送URLを使っているサイトは登録禁止 っていう幸を見かけたのですが、転送URLって引っかかりますか? 転送先のURLのみを登録するタイプのを使っているのですが。
転送URL、引っかかってたよ。 何でだろうね。 その言葉自体、テキストに入ってる訳でもないのに。 …登録されたんだろうか?
2to・3to系はそのまま引っ掛かる
自分の使っている転送アドレスも引っかかる。 登録時のサイト名で引っかかったと思って編集しようとしたが エラーが出て編集できなかったorz いろんな人に連絡したから変えられないし・・・。 転送は要注意だとオモタよ。
>576 > 何でだろうね。 転送のurlって、あれのしくみはフレームだからじゃない? 画面を区切ってないフレームでその中身を、転送先のurlを表示してるだけだから 転送後のファイルをいくら検索避けしても、 転送アドレスのフレームのhtmlまではいじれないからねぇ。 だから転送アドレス使うとトップは検索避けしてないことと同じことになる。
ダイレクト転送でも?
>580 うちダイレクト転送。 .htaccessとロボテキとメタタグでロボ避けしてるからか、検索には一切引っ掛かったことないよ。 約200サイト(大半がロボ避け無し)からリンク張られてるけど。 やっぱ.htaccessの効果なのか。
>581 参考までに.htaccessの記述が知りたい 何で弾いてる? ホスト?それともUA?
>>582 サイト管理人ならば自分で調べろ。
まずはぐぐれ
借りようかと思ってるサーバが 「同人サイトとしての利用可」と謳ってるんだけど、 一方で「トップページを.htaccessでアクセス制限する行為は禁止」とも謳ってる。 二次創作を扱うので.htaccessで弾く必要がある旨をメールで伝えた上で 借りる申請を上げようかと思ってるんだけども、 こういう禁止事項を設けてるサーバは問答無用で.htaccess禁止なのかなあ。
>584 申請結果キボン
>584 トップページ以外の場所(一段下の階層とか)に作品を置けば いいような気もするけど、 でも何で制限禁止なんだろう。
同人サイトとしてって先方が考えてるのが、イラストや小説でのエロと 個人売買程度の商用利用だったりするんじゃないか? 制限ってのがトップからのパスワード制は禁止っていう意味で ロボ避けとかの意味じゃないって可能性もあるけどな。
>>586 584がどんな鯖を借りるつもりなのかはわからないが、
そういう規約がある鯖は、トップページが行き詰まりだったり、
機能していないのも禁止だったりすることが多いんだよね。
自分が見た鯖の規約ではindex.htmlにアクセス制限が掛かってると、
見ず知らずの人がアクセスしたときに、迷惑だかららしい。
一般人から見れば、確かに迷惑だよな。
ロボよけの必要性や、ロボよけとはどういう物かって
一般人に説明しても、ちゃんと理解して貰えなかったり。
>582 >581でつ。 ホスト+IP、UA、ヤホーetcの検索からのリファラで弾いてる。 過去ログに出た数字板派生のロボ避けサイトを基本に、あとはググッて自力で調べて追加した。 ちなみに.htaccessのサイズは約70KB。
>>589 70KB!?7.0じゃなくて?何をそんなに書くことがあるのか正直教えて欲しい。
同じルートを辿って作成した漏れの.htaccessは2.35KB…orz
ロボテキ1KBも併用してはいるが。
ウチのは4kくらいだった。 なので589が何書いてるのか激しく気になった。
70KBは凄いな。 私も頻繁に書き足してるけど20KBダターヨ。
うちは.htaccess13KB、ロボテキが8KBだ でもしっかりロボ弾きできてるよ ロボテキのみオール許可にして、 日本以外からのアクセスと主要ブラウザ以外を弾けば大体カバーできる あとはUA詐称してくるのをホスト/IPで弾けばオケ サイト4年目だけど、今のところ検索に引っ掛かった事はない
寂しいサイトだな
>70KB ・大手検索のリファラ(キャッシュ含む)だけで100行以上。 ・ロボのUA+巡回ソフト(少々)だけで100行以上。 ・残りはIP+リモホ。→ロボ、海外、公共機関(ac.jpじゃ弾けないからu-tokyo.ac.jpで) ちなみにロボテキは20KB以上。 まあ徹底的にやっといたほうが自分が安心出来るからだけどね。日登系なんでorz
596 :
名無しさん@どーでもいいことだが。 :2005/06/08(水) 01:58:12 ID:IG8dwJzc
>595の.htaccessが欲しいと思う同ジャンルな漏れノシ 漏れは12kだよ
クレクレウザー
クレンザー
漏れのサイトは全く検索避けしていないんだが。 今回、ナマモノのイベントがあるので検索を避ける必要が発生、 面倒なのでテキストからナマモノの文字を全部削除して、文字の代わりに文字の形をしたgif画像を埋め込んだ。 これで1ヶ月維以上経つが、クグルもヤフーも検索しても出てこない。
そんな自慢は聞きたくない('A`)チャント避ケロヨ
メタタグ入れずに裏やってるサイトを見付けたんだが、 これは.htaccessとロボテキだけで防げるもん? どうもそのサイト、表はメタで検索キーワード入れてるくらいだからロボテキで避けるなんてことも考えてなさそうなんで、 いきなりメールで教えるのも気が引けるしなぁ…と様子見中。
>601 ロボ避けしてないアダルトサイトなんて腐るほどあると思うけど。 版権きついジャンルか生なの? 知り合いじゃないならほっとけ。
自分のサイトの.htaccess調べたら120バイトだった。6行… 皆一体何書いてるんだろう。 ちなみにうちの.htaccess内の記述は、.co.jpと.ac.jpと.go.jpの訪問お断りくらいだ。 あとはロボテキが置けないサーバなのでhtmlファイル1つ1つに ロボ避けのメタタグを1行入れてる。 サイト名直打ちするとトップに出て来てしまうけど ジャンル名やカップリング名で検索しても出てくる事は無いので これで良いかーと思ってるけどもっと記述増やした方が良いかな。
>603 現状でいいと思うなら今のままでいいんでない? 漏れはarchiveに自サイトが残るのは嫌だから徹底的に避けてるけど。
InternetArchiveなら削除要請で消せるし1行で回避もできるんじゃまいか?
.co.jpと.ac.jpはドメインで弾けないのがあるから IPで弾くための記述で結構ずらずらと
ドメインで避けると、アクセスの多いサイトは 表示が遅くなる。 DNSの逆引きするから。 IPで避けるのが正解。
htaccess自体の容量が大きくても表示に影響でるんじゃなかったか? 画像ファイルもHTMLファイルもCGIもすべて1つ読み込むたびにhtaccessを読むから アクセスの多いサイトは鯖に与える負荷も相当なものになる
ヤフーの検索結果なんですが、
サイト名
http://xxxx.yy.com/ - 50k - 2005年6月11日 [xxxx.yy.comから検索]
と表示されているのですが、
サイトの何処にもサイト名を文章で書いていないのに
検索結果に反映されているのはどのような理由からでしょう?
<title></title>にはサイト名でなく無意味な記号をいれてあります。
おまいのサイトにリンクしているページを片っ端から見てみろ おまいのサイト名の文字列からおまいのページにリンクしてあったらそれが原因だ
上のほうにあるリンク先が拾われていると…っていう部分に該当するんですね。 良く解りました。 弾いて消えるのを待ちます。
携帯から画像アップロード出来て、カテゴリー分けの出来る日記が欲しいのですが インストール型blogで検索避けしてping使わなければ大丈夫でしょうか?
うちはsbだけど 最初pingがよくわからなくて送ってしまったから何度かひっかかったけど .htaccessとロボテキとmetaタグとコメント・トラバ拒否してこうさぎの「他のblogと連携した機能」もオフで 今は避け切れてるみたい。…100%保証はできないけど。 でもどっかのスレでRSSもオフにしないといけないって読んだことあるよ。
ロボよけしてるとRSS自体が無効になるみたい。 ロボよけしているサイトの中に、一部一般人に見つかっても問題のない内容のページがあり、RSSがある。 RSSを切ろうとしたのだがphp改造できないから、まあいいか、とRSSついている。 試しにRSSリーダーのソフトと、アホーのRSSリーダーで読んでみたが、 読めなかった。 更新しても何の更新情報も入ってこない。 検索にも引っかかってない。
マジ? 俺METAタグもロボテキも.htaccessも仕込んでるけどRSS使えてるよ。 今は検索にも引っかかってないけど駄目なのか・・・
618 :
615 :2005/06/13(月) 13:10:39 ID:xhBBfzu+
うち こうさぎに記事読ませてるからRSS機能してるし 火狐のRSSリーダーで更新読み込めるよ 芸能でも版権厳しいジャンルでもないのでロボ避けを甘めにしてるせいかな?
じゃあ、自分のページのRSSがおかしいのかも。
620 :
618 :2005/06/13(月) 14:49:06 ID:xhBBfzu+
>>619 ごめん。今自分で試したらアホーのRSSリーダーは自分も読めんかった
つか登録自体できない。「そんなアドレスないよ」って言われた。
621 :
617 :2005/06/13(月) 16:15:16 ID:8JdjjAfI
RSSリーダーによって違うのかな? 俺はチェックする数も少ないのでOpera付属の使ってるけど。
ppBlogだとpingもRSSも最初から切れる。 画像もうpできる。 ただ、恐ろしく自由度が低い。 スキンサイト1つしかないし、そこは激しく悪寒。
>614です。s/b設置して試してみます。 ありがとうございました。
新サイト立上準備でblog借りてそれだけ稼動させてたんだけど、 一応メタタグ入れてたものの、やっぱ引っかかったらしく、身知らぬリファラが。 版権にそこまで厳しくないから、徹底してた訳じゃないけど。 CEEK.JPって初めて知った・・・弾く方法あるんだろうか。 それより何より、CEEK.JPとやらで、 自分のすっかり忘れて放置していた作りかけのサイトを見つけて眩暈起こした。 やべー・・・削除しなきゃ。パスワードどこやったかな・・・_| ̄|○ 今までサイト名で引っかかった事なかったから、削除されてると思ってた。
>>625 CEEK.JPは全てのメジャーサーチから避けないと引っかかる。
アホーやMSNはたちの悪いロボ送ってくるので、徹底して弾け。
そうなんだ。 別サイトの方が.htaccess、ロボテキ、メタとで弾いてるから引っかかった事はないけど、 今回は版権緩いから、そこまで徹底してなかったんだよね。 メタタグしか使えなかったし。 本格稼動までにちょっと研究して見ます。
いんほしーく勘弁してくれ…_| ̄|○ 1.サイトひっかかる (META入れてたけどヘルプ見るとnoarchiveは入れちゃいけないっぽい?) ↓ 2.ヘルプ通りのMETA入れるが削除されない ↓ 3.ヘルプにあった通りに削除申請メールを出す ↓ 4.一ヶ月間待つも無視 ↓ 5.「削除されなかったらこちら」のフォームから苦情を出してやっと削除 ……が、半年前の経緯だったんだが、 今見たら何事もなかったかのように登録が復活しやがってんの_| ̄|○ あのなぁ、META入れて苦情まで出して削除したんだから、 ブラックリストにでも放り込んどけよ!再登録するなよ!! しかも「登録日:2003年〜」ってなんじゃそりゃ!一度削除したのはなかったことにしてんのかよ! また3からやり直しじゃねーか。本当に勘弁してくれ……。
>>628 .htaccessで簡単に弾けるのに…
>>628 METAタグはただの「おまじない」程度しか効果は期待できないと
どのロボ避けサイトにも書いてるよ。
>629 .htaccessも628の5の段階で入れたんだよ。 一応削除が完了する前に弾いちゃったらまずいだろうと思って、 削除されてるのを見てから入れた。 だから登録日が「2003年〜」なのかも知れん。 METAについては、いんほしーくが自分で「こういうMETA入れろ」って言ってるので、 今更「おまじない程度だから見ないよ」ってのは通用しないと思う。 見る気ないなら最初っから「ロボテキしか見ないよ」って書けばいいわけで。
>>631 で。ロボテキ入れてないの?
.htasseccで弾くのは、拾われたらそこからのお客さんもだけど、
ロボットを弾くんだから、削除前に弾いても問題ない。
ロボテキ読むからロボテキ入れればいいじゃん。
ルートにしか置けない事になってるけど、
サブドメじゃない連鯖でも案外効く。
というか、自分インフォシークの存在を忘れてたよw
それぐらい綺麗にロボテキだけみて、サイト拾わずに帰っていくよ。
「.htasseccで弾く」の意味が食い違ってる気がする。 IP見てロボットだったら弾く。 リファラを見てサーチのURLだったら弾く。 UA見てロボだったら弾く。 全部「.htasseccで弾く」でひとくくりだからなー
>>632 ロボテキは鯖に確認したら、置けないって言われた。
効くんだったらダメもとで置いてみようかな。
削除前に弾かなかったのは、屋風でいつまでも403のまま登録されたことがあったから。
だったら削除されてからの方が話が早いと思って。
>633
.htaccessでSetEnvIf User-Agent "InfoSeek" shutoutって入れてる。
この記述間違ってる?
ロボ避けのサイトとか参考にしたんだけど。
>634 SetEnvIf User-Agent "InfoSeek" shutout ↑ ↑ ↑ ↑ 設定する UAが インフォシークだったら この値を なので、shutoutに設定したものを弾く行がこれより下に必要 deny from env=shutout また、SetEnvIf は使えない鯖も多いので、 うまく弾けてないならそれが原因かも。 これは自分のUAをインフォシークにして、確認してみるといいかな。
>>635 レスありがとう。一番下に、
order allow,deny
allow from all
deny from env=shutout
ってちゃんと入ってる。
SetEnvIfが使えない鯖かどうかについては、
FC2ブクマ騒動の時に
SetEnvIf REFERER "bookmark.fc2.com" Ref1
order allow,deny
allow from all
Deny from env=Ref1
で弾けてたから、使えないってこともないはずなんだよね。
…そうなるとやっぱり、以前の登録が復活しただけって気がする。
とりあえずメールは出したので、様子見てみる。
助言ありがと。
>>634 それ1行だけ抜き出されても有効かどうか、たにんにはわからん。
SetEnvIf User-Agent "InfoSeek" shutout
まさか、これ1行だけ書いているわけではないよね?
これ↓もいる。書いてあると思うけど。
Order Allow,Deny
Allow from all
Deny from env=shutout
ついでにこれもどうかな。
SetEnvIf User-Agent "InfoSeek Sidewinder" shutout
さらにルートじゃないところにロボテキおいたなら
ttp://www.google.co.jp/remove.html ここのページを隅から隅まで読んで、3ヶ月に1度自動削除に
ロボテキのアドレスを送ってみる。
インフォシークのじゃないけど、具ぐるに動きに従うかも知れない。だめもとで。
リロって大事やね。スマソ
ID変わっちゃったけど636です。 >637-638 ぐぐるはMETA入れて削除申請送って以来、登録されてないんだ。 だから今でも引っかかってるのはいんほしーくだけ。 SetEnvIf User-Agent "InfoSeek Sidewinder" shutout も入れてみる。色々ありがとな。
ぐぐるは <META NAME="GOOGLEBOT" CONTENT="NOINDEX, NOFOLLOW"> ↑これを入れておけって書いてあるけど、 ここにnoarciveが一緒に入ってたらダメなのかな。 今現在のメタタグはnoindex,nofollow,noarciveをまとめて書いてる状態。
つ 過去ログ
642 :
名無しさん@どーでもいいことだが。 :2005/06/18(土) 09:40:25 ID:ShTDatPn
レン鯖にて.htaccess内のmod_rewriteで RewriteRule ^(.*)$ - [F] と書いてロボを弾いてるんですが どうせmod_rewrite使えるなら403より410返した方がいいんでしょうか?
>>642 410は 永 久 に そのアドレスに何か置かれることがない時に出す。
「二度と置かれることがない」と強くアピールしたいときに使うエラー。
もしも連鯖のサブドメインを使っているなら、このエラーを出すのは自分勝手じゃないか?
微妙 まぁ普通やらないねぇ
というよりアフォ
煽りたいだけならどっかいけ
あおられて642は逃げたんですか?
逃げたとか逃げないとか勝つとか負けるとか どうでもいい
かわいそうな子に触っちゃダメだってw
メタタグの<meta name="ROBOTS" content="NOINDEX,NOFOLLOW">って、 "NOINDEX,NOFOLLOW"って2個並べるとき2個目の前にスペース入れないとダメとかあるのかな? 対策サイトからコピペして使ってたんだけど、どうもまだ拾われてるみたいなんで アホーとぐぐるのヘルプ見てみたら <META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW">←ヘルプからコピペ どちらもNOFOLLOWの前に半角スペースがあるように見えるんだけど…
>>651 アホーやmsnのヘルプにあるやつは半角スペースあるよ。
あってもなくても。アホーとmsnはメタ読まないけどねw
.htaccessじゃないとよけれない。
でも被リンクが多いサイトはどうしても、どんなにUAでロボ避けしても
サイトが存在しているだけでインデックスは拾われてしまう。
>651 不安なら、半角スペースがあるメタと、半角スペースのないメタの両方を書いといたら。 652タンも言ってるけど、アホーとmsnは.htaccessじゃないと避けれないけどね。 .htaccessさえ置いとけばメタなしでも検索には引っ掛からないよ。 どのロボットもググルくらいいい子だったらいいのにねぇorz
ググル、昔はメタタグもロボテキも読まない人だったんだよな… 変われば変わるものだ
やはり具ぐるロボの中には人が…
656 :
651 :2005/06/23(木) 13:55:54 ID:I0OmmkXn
652-653 ありがとう。 半角アリバージョンなしバージョン両方書いてみるよ。 実は.htaccessとロボテキも置いてるんで、 そっちの記述もどっか間違ってるのかもしれなくて見直さないといけないんだけど… つかアホーのイメージ検索に一回捕まったら2度と逃げられないんだろうか URL変えてしばらく経つのにまだHitしてるし…
>656 setenvif referer "yahoo.co.jp" bad_referer1 setenvif referer "yahoofs.jp" bad_referer2 ロボのIPとUAとリファラの全部を弾くと拾われなくなると思うよ。
>>657 yahoo.co.jpをまんま弾くと、ヤフブックマークやマフメから飛んでくる人も弾くことになるから
うちでは"yahoofs.jp"だけ弾いてる。
拾われた後、URLは変えなかったが2ヶ月位で消えてたよ
>657-658 651じゃないがありがd ヤフメ・ブクマも弾きたいんで勉強になりました
Options -Indexes <Limit GET POST PUT> setenvif referer "yahoo.co.jp" bad_referer1 setenvif referer "yahoofs.jp" bad_referer2 order allow,deny allow from all deny from env=bad_referer1 deny from env=bad_referer2 deny from .inktomisearch.com </Limit> 漏れはこれでヤフ弾いてるよ。…多分弾けてるはず…
ロボ避けのタグってトップだけじゃなくて全ページに貼らないといけないんですか?
その通り。
>>663 ありがとうございます。
大変なんですね…今からしてきます。
関係ないのがしれっと混じってたからだろw 例えるなら ・冷し中華はじめました 【校則】 ・廊下は走らない ・前髪は眉の上まで ・… ↑こんな感じでw
>667 オマイの例えにワロタw
いやいや>661は>660に「ディレクトリの中身丸見え防止をつけたして」とあったから 知らない人の為に追加してみたんだよorz
というか>666のレスこそ不可思議で藁えるんだがw
Options使える鯖少なそう。
672 :
660 :2005/06/27(月) 16:09:36 ID:gjLtOn82
>672 403と404は外のサイトに飛ばしてるの?
674 :
672 :2005/06/27(月) 17:05:19 ID:gjLtOn82
>>673 自分のサイト内の自作403/404ページです。
>>672 さくらは Optionsつかえないんだって。
つーか、コンパねから一覧表示防止は設定できるので
.htaccessつかうなら、ます鯖のfaqぐらいは読もうよ…
677 :
672 :2005/06/27(月) 17:39:58 ID:gjLtOn82
>>677 話が通じないっぽいので、リファレンスぐらいはよんでおいで。
>677
自作の.htaccessにヤフ弾きを追加したいのなら、
<Limit〜>から</Limit>の間に通常通りに↓の必要な部分だけ挿入すればOKだよ。
<Limit GET POST PUT>
setenvif referer "yahoo.co.jp" bad_referer1
setenvif referer "yahoofs.jp" bad_referer2
order allow,deny
allow from all
deny from env=bad_referer1
deny from env=bad_referer2
deny from .inktomisearch.com
</Limit>
「ディレクトリの中身丸見え防止」をしたいのなら、
鯖の「サーバコントロールパネル」とやらからやってみて。
【.htacceassの参考サイト】
ttp://mikeneko.creator.club.ne.jp/~lab/ ttp://www.shtml.jp/htaccess/
.htacceass →.htaccess
gooブログの検索機能が強化されるらしい。 国内有名サービス全部と、個人で立ち上げててping出してないのも含むって。 ブログ使っててping&トラバなしとかで簡易検索避けだった人がいたら しばらくしてからチェックしてみた方がいいかも。
個人的には、Blogは「情報発信のためのツール」だから、 検索除けするようなものをかいとくのはおすすめしないです…
しかしブログで虹サイトやってる人が 検索よけしないってのも問題じゃないか? 基本はわかるけど、実体として。
ウェブサイトだって情報発信ツールだろう。 同じものが好きな仲間にだけ情報発信したいって世界なんだから仕方ない。
そんなこと言ったら元も子もなくなってしまう(´д`;)
翻訳サイトから飛んできてる人がいた。 どうやら、うちのサイトのURLを翻訳にかけたみたいなんだけど、 そんなことして何になるんだろう? キモチワルイ。
日本語読めない人もWeb上にはいるさ
>682 同意。 ブログ以外の日記ツールは沢山あるんだから、わざわざブログにする必要もないよな。 ブログっつーのは元々検索に引っ掛かりやすい作りになってるんだから。
>688 ブログと同機能の日記があれば乗り換えます。 ずっと探しているけど見つからない。
>>686 おまいさんの読みたいページが、英語や韓国語で書いてあったらどうする?
英語や韓国語のまま読むか、読まずに帰るか以外に。
>ブログっつーのは元々検索に引っ掛かりやすい作りになってるんだから。
WWWそのものが検索に引っかかりやすい作りですが?
pingやTBさえ打たなきゃブログも自分でHTML直打ちする日記と変わらんし、
>>681 なんて実質塩の内部検索と同じだろ。
ましてやブログ以外の日記ツールなんて
自分でスクリプトやスキン書き換えて検索避けしたものを
自鯖に設置してるんでなければブログと同じ。
ブログは敢えて、自サイト内へのリンクを増やしたり、 h1タグやタイトルタグを工夫してたり、 虎場などで被リンクを増やしたりして、検索上位に上がりやすくなってる。 引っかかりやすいというより、上位にいきやすい。 だから検索すると用のないブログばっかり上位に出てきてウザス。 ブログで日記やりたければ、サイト丸ごと、もしくはブログのディレクトリ まるごと検索避けして、どこからもリンクされなければニッキのCGIと変わらない。 使いたければ使えばいいと思う。 レンタルの使ってる人は、日記をレンタルすりゃいいのにとは思うけど、 内容が、ちょっとヲタク臭い日記程度、萌え語りのない日常日記なら いいんじゃないの? 一般人の日記も漫画やゲームの話ぐらい書いてる。 エロ話、ホモ話ならちょっと…と思うけど。
自分でブログと似たよーなCGI組むか改造すれば。
ブログから同人サイトにリンクを貼らず、 キャラ名を全部伏字や当て字で書けば 検索に引っ掛かることは無いんじゃね? たまたま読んだ人も同人サイトの日記とは思わないかも。
>694 それが一番無難かもね。
689>696 お?ここは知っていましたが、携帯から更新できるようになっていたとは。 ありがとうございます。試してみます。
>689 sbは? pingもTBもRSSも出力しないようにしてる。テンプレにロボ避タグも入れてる。 解析見た限り今の所拾われた形跡ナシ。
2年前からPHPのブログ使ってるが .htaccessで弾いてるから一度も拾われたことない。 拾われるか拾われないかに関しては普通のhtmlやcgiと何もかわらんて。
アホーが消えない…_| ̄|○ .htaccessもmetaもrobots.txtもやってるのに。 検索画面で出てくる日付ってクロールした日だよね? お前、おとつい来た癖にコノヤロウ! robots読ませるのも止めた方がいいのか? ぐぐるは拍子抜けするほどあっさり消してくれた アイラブユー
>>702 超ありがとうございます。
さっそく送信してみたよ。こんなフォームがあったとは…
MSNにも同じようなのがあったけど、
うち林檎だからmクロソフト paスポート networkアカウントなんて
持ってないyo シット
>>623 のRSSをなくすプラグインをもう一度アップしてもらえませんか
よろしくお願いします
>>704 テンプレートのhtmlから
<link rel="alternate" type="application/rss+xml" title="RSS" href="{site_rss}" />
<link rel="alternate" type="application/atom+xml" href="{site_atom}" />
の一文を削って、ついでに
<li><a href="{site_rss}">RSS1.0</a></li>
<li><a href="{site_atom}">Atom0.3</a></li>
も削っておけばいいだけなんじゃないだろうか。
これ削ってもまだRSS出力されてるの?
>>702 速攻でヤホーから返事がきました。反応の速さにビビリ。
今、indexにこのスレか何処かで見た
<META NAME="robots" CONTENT="none,noindex,nofollow,noarchive">
<META NAME="ROBOTS" CONTENT="NONE,NOINDEX, NOFOLLOW, NOARCHIVE">
<META NAME="robots" CONTENT="none,noindex, nofollow,noarchive">
を貼ってるんですが
これじゃメタタグが正確に解釈されない場合があるよ!という事ですた
ヤホが次のクロールに来てくれるまで
<META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW">
単品にしておく事にしました。
自分のミスのようでした。失礼いたしました。
707 :
702 :2005/07/14(木) 02:35:35 ID:HH+XPsAd
>706 でもrobots.txt置いてるんでそ? だったらその「メタの記述が云々」ってのは、単なる言い訳に過ぎないようなw 屋不が自分で「メタ書くかロボテキ置くか汁!」つってるんだからね。 ま、自分の時も色々と言い訳ぐだぐだ書き連ねて返してきて、 何言い訳してやがんだと思ったら数日後に登録削除されてたから、 多分何か一言は言いたいだけなんだろうねw なんにせよレスポンスあってよかった。とっとと削除されるとよいね。
>705
それじゃ表向きは見えなくなっただけで、出力はしたままだ。
ここで聞く前にサポサイトで一度調べような>704
ttp://sbuser.sakura.ne.jp/patio2/patio.cgi?mode=view&no=224 このとおりにすれば恐らくRSSリーダー引っ掛らないと思う。
>706
自分も>706 と同じメタいれてるが、確実にコレでいいのか自信なくなってきた…
<META NAME="ROBOTS" CONTENT="NONE,NOINDEX, NOFOLLOW, NOARCHIVE">
だと引っ掛るって過去ログにあったけど、結局下ので間違いないんだろうか。
<META NAME="ROBOTS" CONTENT="NONE,NOINDEX, NOFOLLOW">
>>707 お世話になりました。ありがとうございました
robots.txtももちろん置いてます。
.htaccessと共に、こちらのサイトのを拝借しました↓
ttp://sp999.oheya.jp/tips/ ヤホー的にはロボテキかメタかどっちか片方でもあったらいいんですよね?
しかし返事のメールではロボテキにも.htaccessにも一言も触れられてませんでした。
メタがヤフにとって最上級なんでしょうか…
>>706 で書いたメタ単品だと、ヤフはいいけど
他のに拾われやしないかちょっと心配です
で、さっき検索してみたらヤフから消えてました。早!
しかしヤフ検索ベータ版に拾われてる罠_| ̄|○コノヤロウ…
>>705 ,708
なぜかサポートの存在が頭から抜け落ちてました。同意図の質問があったんですね…!申し訳ありません!
これでブログ設置に踏み切れます。ご親切にありがとうございました!
metaで <META NAME="*" CONTENT="noindex"/> 使ってる人いる? m/s/n見たらこれが一番効きそうな感じだったんだけど。 普通のメタの方が読んでもらえるのだろうか。 あと最後の/の意味が分からん。構文エラーが出るんだ…
>>711 > あと最後の/の意味が分からん。構文エラーが出るんだ…
XMLの文法じゃないかと言ってみる。
/の前に半角スペース入れとけばエラーは出ないよ。
>>712 ,713
thx
XMLか…知らなかったよ。勉強します。
んでもって上のmeta入れといたらアホーに早速拾われとるがな…
元々前から来てたけど更新はされてなかったのにヽ(`Д´)ノ
たまたまクロールの時期とあっただけかもしれないけど
自分も702さんのを参考にメール出してきたいと思います
ヤホー消えて喜んでたら復活しやがったヽ(`Д´)ノ なぜ?! 一回消した後で新しくクロールに来たのではなく 前のデータがそのまま復活してる。なぜ戻す?!意味不明 禿め…
>>715 いんほしーくでデータ復活されたことあるよ。
メールで「なんで復活したのか教えれ」と聞いたら、
それには触れず「削除しますた。じゃ!」みたいなメールが来てそれっきりだった。
本当に、なんでデータが復活するんだろうな。
データ戻しについてahooに文句言ったら コピペ臭い返事かえってキター レスボンスの早さには感心するが 結局「次のクロールまで待て!」って内容で 戻っちまってる事に関してはスルーだよ…。 どうせ次クロールしても拾うんだろうが。 しかしコピペ文の癖に >ただし、更新頻度が低いサイト等、サイトによっては時間がかかる場合 >があるようです。 がちょっぴり強調してあってウワァアァンヽ(`Д´)ノワルカッタナー!!
ヤフは、あの通りのメタタグじゃないとダメみたいだね。 それをトップにもっていったら、わりとすぐに消えた。
ぐぐるぼっと用のメタタグと併用してるけど <meta name="GOOGLEBOT" content="NOINDEX, NOFOLLOW, NOARCHIVE"> これは一緒に並べても平気みたい。 今日調べたら消してくれてた。ベータ版も。 とりあえず一言イヤミは返すけどなんだかんだ言って 消してくれるヤホーたん(*´∀`) ツンデレかお前は
>719 >ツンデレかお前は その一言でヤフを好きになれそうだw
アフーは受けなの? 攻めなの?
年齢をクリアしてるなら つ 数字板を[無機物]で検索
Microsoft URL Control - 6.00.88xx を弾きたいんだけど弾いても弾いてもやってくる。 自動巡回系のスクリプトではあるらしいのだけど、 業者書き込みのUAもこれを良く見かけるから 気になって仕方ない。
724 :
名無しさん@どーでもいいことだが。 :2005/07/29(金) 03:22:38 ID:l+8jcXEg
http://www.di-do.net/ この日記サービスは
・ボット避けタグ自動挿入
・訪問時には必ず注意書き文の書いてあるCookie書き込みページを経由
しないと日記が読めない機能
・上の機能に加えて注意書きページで正しいパスワードを入力しないと
Cookieが書き込めず日記が読めない機能
・会員登録された特定の相手にしか表示されない記事を個別に書くことが
できる機能
・記事ごとの公開期限設定ができ、期限の切れた記事を閲覧するにはパス
ワード入力が必要となる機能
を提供しているそうだ。
METAの入れる場所間違ってるサイトが気になる 和塩と2スタイルでよく見かけるけど、ファイルアップロードの問題かなにかで headにタグ入れれない仕様なの? 版権厳しいジャンルだから意識するのはいいのだけど、読み込み遅くなるんだよね body要素の一番最後あたりに入れてるんだけど、それじゃ意味ないと思うし 拍手なりでそれとなく示唆したいんだけど、どう説明したらいいんだろう
>724 有料だけどなかなかいい感じかも。 日記つながりの話題で恐縮だけど、 Nicky!を使ってみようと思ってるんだがこれってヘッダに検索避けタグ入れられるかな?
>726 Nickyはかなりカスタムし放題だからMETAも入れられるよ。 なかなか自由度が高いのでおすすめ。
>726 ヘッダ・フッタの編集で入れられるよ
729 :
名無しさん@どーでもいいことだが。 :2005/08/05(金) 22:11:22 ID:Tjd8FkiO
保守
質問なのですが、.htaccess設置不可で、メタタグで検索除けをしています 学校からのアクセスがあり、その後履歴をたどって二回ほどその学校からアクセスがありました 学校などの公共の施設からのアクセスは遠慮してくれとTOPに表示しています なので、その学校からのアクセスをはじきたいのですが、.htaccess以外に方法はありますか_| ̄|○
731 :
730 :2005/08/07(日) 12:39:02 ID:U0w1NQEq
できますた、スマソ。パニ食ってた
>730
.htaccessが設置できる鯖に移転するしかないんでね?
ジャバで弾いてもジャバ切ってたら無意味だし、メタタグだけじゃロボ避け出来ないよ。
有料でも年に2000円以下の鯖なんて腐るほどあるんだから移転をお勧めするよ。
同人OK鯖総合スレまとめ
ttp://f43.aaa.livedoor.jp/~sils/
733 :
730 :2005/08/07(日) 14:49:11 ID:U0w1NQEq
レスまりがとう ニンジャの煙/巻/きってのを借りてみた 灰汁解でドメイン名とかは分かってるので、たぶん学校からのアクセスははじけるとオモ でも有料考えてみるよ。こんなの続いたら心臓に悪い・・・_| ̄|○
うちもed.jpとかはケムマキで弾いてるよ。 でもケムマキの制御履歴見ても全然引っかかってなくてちゃんと弾けてるか心配。 設置したのが先月中ごろだから、夏休みに入った→学校から繋ぐことがなくなった と解釈してとりあえず落ち着いてます。別設置の解析にも引っかかってないし… しかし夏休み明けが怖い
おいらの母校では「安全のため」 JavaもJavaScriptもCookieもデフォルトで切ってあった という怖い話をしてあげやう
アクセス制限を試すなら自分のIPをまず弾けばいい。 それで弾けてたら効いてるし、ダメならなんか間違ってる。 きちんと効いてるのがわかったら自分のIPは制限解除すればいい、だけですよ。
737 :
730 :2005/08/08(月) 10:27:37 ID:O45rA6zt
また学校からアクセスが・・・_| ̄|○ しかも拒否ログに残ってないから、たぶんはじけてない TOPで引き返してくれてるけど('A`) 大学の学生さんはレポートでもしているのか? ところで、今までは××.ne.jpだった自分のドメイン名が△△.ne.jpに変わる事ってありますか? 久しぶりに自分のドメイン名調べたら変わってた ちなみに自分はちゃんとはじけてた
>学校などの公共の施設からのアクセスは遠慮してくれとTOPに表示 これって書いても無意味だと思うなぁ。 これ見て遠慮してくれるような人は最初から学校から閲覧しないと思う…。
光とかケーブルで自宅からでもed.jpあるらしい。寮とかも。
>739 大学の寮でac.jpがあるのは知ってたけど、ed.jpも…? でもそれは要するに教育関係者ってことだよね。だったら弾いちゃっていいやw
漏れは使ったことないから知らんが、忍者はcookie切ってると、 閲覧拒否できるシステムなかったっけ。 前にクッキー切った状態でwebさ迷ってたら、忍者タンにクッキー入れろやと 怒られて閲覧拒否になったことがある。
>741 管理人の設定次第だね。
どうしても見たければ串を使ってもらう以外の選択肢は無いので 問答無用でac.jpもed.jpも弾いているな。 自分が安心してサイト管理するのととジャンルのためには仕方がないと思っている。
その両ドメインを避ける本音の理由が知りたい 「常識」とか「周りがやってるから」てのじゃなくて
>743 その二つが学校のドメインという浅い知識だけで弾いている。 学校で見ているという事は見たくない人の目に触れる可能性があるし 良く知らない人が履歴などから迷い込んでくるのは自分としても嫌だから。 流石にネカフェまでフォローできないけど go.jpとかその他公的機関ドメインも弾いてる。
うちed.jpは徹底的に弾いてるけどac.jpは弾いてないな。 弾く理由は18禁サイトだから。 ac.jpって大学と大学寮くらいだよね?一応18歳以上だからスルー。 ed.jpは教育関連施設全般だったと思うので弾きまくり。
>746 ○○大附属の中学や高校って可能性は?<ac.jp 随分前だけど、オン知り合いの母校がそれで割れたよ。
18禁サイトに学校から接続しようとするヤツには 自サイトが18禁じゃなくても見られたくないな・・・
そういえば、ナマモノ(某バンド)のホモ小説を大学で読んでる人がいた うちも18禁じゃないけど、ナマモノを学校で読むような人はお断りだ・・・ >744 ドジン知らない人の目に触れたくないから 検索の履歴たどってこられたら困る 因みに今借りてる解析は、ドメイン名だけでなく↓まで出るから確実 [組織名] ○○大学 [組織種別] 大学
学校からホモ小説が簡単に見られるナマサイトもどうなのかと… ナマについてはよく知らんが
検索かかりまくりの携帯サイトでやってるような奴もいるからな>生
>749 凄いな。どこの解析?
>>752 749ではないが、とりあえず薬屋は出る。
マンソンで専用線だと、マンション名も出るよ。
今見てびっくりした。
昔O/C/Nの専用線使ってだけど、自分のIPチェックしたら マンション名は勿論、○○号室まで出てびびったよ_| ̄|○
そりゃ怖いな
うちも薬屋つけてるが、プロバの統計で出るやつだよね? 普段生ログと詳細ログしか見てないからそんな機能があるとか知らなかったw 面白がってじっと見てたら、「mil (米・軍事機関)」キターーーー!!! ホストもカッコ内の串情報も両方milなんだけどこれって本物?
>753 752は、A/C/R/W/E/B 部屋番号まで出るのkoeeeeeeeeeee!!! ナマでも、隠語知ってれば引っかかるところもあった 同人だけじゃなく、一般の人も知ってる隠語だったから、避けにはないけど
>757は、避けにはならないけど。といいたかった
ケムマキって2chからのアクセスもはじけるのか… 使いたくはないが、いざというときは便利だな('A`)
>>760 2chに晒される時って、URLを書き込まれるから、
ime.nuや2chからのアクセス弾いても、
アドレス欄にコピペされればブックマーク扱いになって
誰でも見られるんだから無意味だよ。
h抜き多いし。
ime.nuからアクセスが403で、
手打ちでアクセスできたら、それだけでプゲラされて祭りになってしまう可能性もある。
>>761 そうなんだ…
普段から晒されないように努力して
晒されたら我慢するしかないのか…
2chてひどいところだな
ちょwwwおまwwww 面白いこと言う香具師だな
変なことしてなきゃ私怨乙でスルーされるからほっとけ
べつに、なんて事無いサイトだったら カウンタがいつもより回るのと 「晒されてますよ」っていうカンチガイちゃんの 特攻が少々くらいじゃないの? >762がそんなに怯えるほどの酷い事が起こるの?
スレ違いだが、友人リンクとしてリンクしてくれている友人がカプがきにくわね私怨で晒された。 しかし晒しスレでもオチスレでもヘタレスレでもないジャンルスレで晒したもんで、私怨乙とスルーどころか 「このカプ探していたんだよー」というファンがついた。 そして友人リンクでリンクされていた自分のところにも人が流れてきた。カウンタをがんがん回して有り難うだ。 こういうこともあるさ。
>765 自ジャンルではパクトレースが発覚して ヲチで晒されたけど忍者ではじいてるイタタがいるよ
ごめんなさい送信してしまった >764の言うとおり、私怨には防御しないでスルーが一番
>>762 晒されても、ログが流れていくうちに違う話題になって
スレの流れにもよるが、2〜3日で何事もなかったように忘れられるよ。
単独スレ立てられるような奴は別だろうけど、
よっぽどでない限り、単独スレなんか立てられないからw
寧ろ宣伝にn(r
>>765 大昔ならヲチ板やネットアイドル板、一昔ならν速、ちょっと前ならVIP
こういう板に晒されると
痛くなかろうが私怨だろうが荒らされることもあるので何とも言えない
ネットアイドル板はやり過ぎたらしくて今はなくなっちゃったけど
>>770 エロなのでヌー即、VIPによく画像が晒されるが、
そういう板はあっという間にスレが落ちるし流れも速いから、
人は案外来ないよ。
>762 お前どこに書きこんでるのよ 冗談だよな?そうといってくれw
話豚切りでスマンけど。 たまに生物サイトで「urlを検索サイトで直接検索するのは絶対にやめて!」ってあるのは あれなんでなんだろう? ロボットとかに拾われやすくなるから? それとも別の理由?
>>773 アク解で見つけたとき心臓に悪いからとか。
拾われやすくなるという説があるから。 確かweb archiveあたりが顕著だったような。
web archiveってこっちから申告しないと消えないんだっけ? 最近のは弾いてるけど昔のが残ってんだよなー… 見る人いないと思うけど気になるから消えて欲しい。
ロボッツ.txt入れるだけで消えるし、保管もされなくなったけど。
778 :
名無しさん@どーでもいいことだが。 :2005/08/29(月) 03:44:42 ID:nxN7yQq6
私怨ついでにageんな屑マルチ厨
過去ログ見て>280を参考にメールを送ったらリテイク出された…(ロボテキ置け、とか云々) ロボテキ置けない環境なので今度は>274で出してみる。 それにしてもレスが早くて感動。
782 :
781 :2005/08/31(水) 14:50:33 ID:JMvO1kAL
本日無事削除されました。 お礼メールしたほうがいいのかな。あっちも仕事だしいちいちリアクション起こさない方がいいのかな。 過去に削除してもらったことのある方、メールとかしましたか?
そんなのいらんって
784 :
名無しさん@どーでもいいことだが。 :2005/09/02(金) 20:58:42 ID:+8Cx62iX
スパムに配信停止のメール送るタイプだな
ワロタ
>784には笑ったけど、正直>781-782の気持ちもチョトわかる。 かわいいジャマイカ
ceek.jpにキャッシュが残されてた… ヘルプにキャッシュは10年間消さないと書いてあったので気にかかっています。 こちらから削除依頼はできないのでしょうか?
>>788 > クッキーにオプション設定の内容を保存します。
> 保存期間は最終設定日時より10年間です。
これのことだったら、設定の保存のことだけど…
どこか他のところに書いてあったのかな?
ceekの「過去の内容」の事?これはarchive.orgに削除依頼すればいいのでは。 違うとこ見てたらごめん。
791 :
名無しさん@どーでもいいことだが。 :2005/09/19(月) 12:22:40 ID:AC1g3cDZ
私怨乙。だから何? 早くおまえが呪われればいいねw
ていうか、こいつがロボットじゃないのかっつーくらいスゲーなw よくこんだけのスレに書き込めるもんだ。
しかもスレのないようによって微妙に変えてるしね 時間があって羨ましい
>>677 の記述をした人の中で、一部のアホーBBからのアクセスができなくなってしまった人っていますか?
相互リンク先の人に「あなたのサイトいつ行っても403で入れない」と言われました。
その人はアホーBBらしいです。鯖生ログを確認したらアホーBBでもアクセス出来てる人もいました。
生ログの403に数百のアクセスがあったので不思議に思っていたのですが…
他の記述との兼ね合いで、こういうこともあるのでしょうか?
ミケネコさんやその他のサイトで勉強しても自分には難しくて無理そうなので、怖くて今は.htaccessをはずして
いるのですが、このスレには初心者さんもいると思ったので一応報告してみました。
ちなみに元々
>>660 のサンプルを使っていて、そのときには大丈夫だったようです。
>>795 リファラとホストは関係ないから、
他の部分の記述がおかしいんじゃないか?
BBユーザーだからって、アホーのリファラ経由する訳じゃないし。
その.htaccess自分のサイトに入れてるが、
BBユーザーの自分のアクセス出来ているし、
生ログもBBユーザーが403になっていると言うわけでもない。
BBユーザーのホストにyahoo.co.jpという文字列は入っていないし、
アホーのメールボックス経由で来ているひとが、795のサイトに多いとか、
BBユーザーはアホーブクマやマイアホーを使う可能性が高いからか?
アホーに拾われていることについ昨日気付きますた… 今まで検索避けはちゃんとしているつもりだったのにショックダターヨorz .htaccessと、さらに同じメタタグを全ページに埋め込んであるのですが、 インデックスだけロボットに拾われている様子… しかも昨日見た時はサイト名の最後の一文字が足りなかったのに今日見たら ちゃんと増えてるじゃねぇかYOOOOOOO!!!!!また巡回来て拾ってったのかYOOOOO!!! 一つ下層にフォルダ分けて作ってる別サイトもインデックスだけ拾われてた …他のページと同じメタ埋め込んであるのになんでインデックスだけ…? もしかしてPHPなのがいかんのですか…orz アク解で気付いたんだけど仕様上いつからアホーに拾われているのかは よくわかりませんでしたよヾ(*´∀`*)ノキャッキャ
>797 ログ嫁
>796 ここが掲示板だと意識できていない 独り言はチラシの裏へ。 あとログ読めば解決すると思うよ。
某大手プロバイダの閲覧者さんが、週一くらいの割合で robots.txtを覗こうとしている。(生ログ見てて気付いた) トップディレクトリでなくルートディレクトリに置いてあるから当然404に なる訳だが、一体何がしたいんだろう。 ちなみにそうやって数回覗こうと頑張ったあとは、普通にサイトのコンテンツを覗いていく。 ただもうひとつ気になるのが、拡張子cssを呼び出す時に限って UAが「Java/1.5.0_05」というものになってる事。 htmlやcgiを閲覧しているときは普通のUAなんだが。 ひょっとして新手のロボかと思いつつ、様子を見ているが誰かこんな現象を見たことある人いないか?
>801 ダウソソフトで最初にロボテキ探しに来るやつがあった気がする
803 :
801 :2005/10/10(月) 04:08:22 ID:I7CBvkl9
>802 なるほど、それかも知れない。 ありがd、様子みてみるよ。
日参サイトのトップページのソース覗いてみたら ロボ避けmetaが30行以上にわたって書いてあったときは さすがにちょっと引いたな。
避けてるんなら引かない。 キーワードで客寄せしてたりBODYに反転文字で作品名とか入れてるのを 見つけたときは引いた。神だと思ってたサイトなのに。
30行もmetaに書くならロボテキ入れろよとは思う。
ごめん、ロボテキ入れた上で何行にも渡ってmeta入れまくってる…… さらに.htaccessでロボ弾いてもいる。 うん、わかっちゃいるんだけどさ。
ロボ的は入れられない鯖もあるから・・・ 漏れはmetaと.htaccessとjavaでなんとかやってる。
>30行もmetaに書くならロボテキ入れろよとは思う。 ロボテキ入れられない鯖なんて無いと思ってる人なんだなとは思う。
ソースになに書こうと管理人の勝手じゃないの? 覚書な場合だってあるんだし 覗いといて文句つける神経ってw
ソースに管理人のメモ書きがしてあるサイトだってあるぞ。 メタ30個だろうと40個だろうと別にいいと思うが。
>808 私も同じ事やってる。 別板を参考にした時念には念を……という人が多かったので 自分も真似させて貰ってた。 おかげで3年経っても検索に引っかかったことがない。
>>813 自分もまったく同じだ
が、黙リンク先が避けていないおかげで、ググルとURLだけ引っかかるんだよな
サイト名自体は何千何万とあるので、自サイト目当ての人が検索かけている
のだろうと思いスルーしているけど
トップページだけが亜ほーとmsnに拾われて、 独自ドメイン取ってそっちで運営するようにしたら、 サイト名で検索すると 鯖のサブドメと独ドメの二つが引っかかるようになっちまった。 サイト名まるごと一致で他のサイトや、他の何かが出てくることはないから うちのサイトを探しているんだと思っているのと、 トップページが、注意書きとエンターボタンしかないから かませ犬だと思ってあきらめた。
816 :
名無しさん@どーでもいいことだが。 :2005/10/21(金) 18:26:38 ID:dn3caKwP
すみません、質問させて頂きたいのですが、 ロボ避け必須として運営している同盟に、 携帯サイト(ポ/ケ/○/ペ)から登録申請を頂きました。 そこでは、〜</HEAD><BODY>の後に<HEAD>が再び始まり、 そこからロボ避けのMETAタグが打ち込まれていました。 <BODY>の中に<HEAD>を組み込んだとして、 そこに書かれたMETAタグは有効なのでしょうか? どなたか、御教示頂けませんでしょうか。お願いいたします。
読んでくれるかもしれないけど、正しい記法ではないので、 読まないかもしれない。 ロボ避け必須なら却下しといたほうがいいと思う。
>817 816です。レスありがとうございました。 申請して下さったサイトの管理人さんへは、 METAタグの記述方法に触れつつ、やんわりとお断りの返信を させて頂くことにしました。
.htaccess置いといたら、幸管理人さんを弾いちゃったらしくて、 幸登録を削除されちゃった。 でも正直、.htaccess眺めてても、どれが原因で管理人弾いたのかが良くわからん。 ヘッダ見ると管理人さんは屋風BBで、 確かに屋風BBの香具師をひとりアク禁にしてるけど、 ヘッダのIPとアク禁してる香具師とのIPじゃ、数字部分が全然違う。 SetEnvIfNoCase User-Agent "Yahoo" shutoutってとこがマズイのかなぁ… でも他の屋風BBユーザーは普通に見て、メールもくれるしなぁ…。 忙しいだろうし、幸管理人さんに検証つきあってもらう訳にいかないから、 幸登録復活はもう諦めてるけど、何か微妙に納得がいかない。 どの記述が原因で、あの管理人さんはアク禁に巻き込まれちゃったんだろう。
…書いてから思ったけど、スレチだったかも。ごめん。 .htaccess絡みだからこっちかなと書いちゃったけど、中身はアク禁だから違うね。
幸管理者としては、間違って削除したのは報告して欲しいな。 ミスで大量削除して復旧作業に泣いた思い出がある。あれは辛かった(涙)。 大量削除の一月後くらいに、過去のデータを眺めていて偶然気が付いたんだが、 後から考えるとどうも利用者さんたちは知っていたようだった。 知ってたんなら注意してくれよ〜(涙)と、心の底で八つ当たってしまったよ……。 こんな駄目管理人も居るので……。是非ご検討を……。
>>821 や、報告したんだわ。そしたら403で弾かれてるから削除したって返事が来た。
再登録申請するんならアク禁解いてくれって言われたんだけど、
弾いてる香具師は半年以上もうちのサイト粘着してる池沼だから弾いておきたいし、
そもそもIP微妙に違うから、そいつのアク禁解いても解決するかわかんないし、
UAでロボ避けしてて、個人閲覧者を弾いちゃうなんて事例聞いたことないし、
管理人さんが閲覧できるようにするにはどうすりゃいいのか、全然わかんない。
けど管理人さんの「自分が確認できないサイトを登録しておくわけにはいかない」
って理屈も充分よくわかるんで、登録復活は諦めたんだ。
そこでちょっくら串でも刺してみるかと考える幸管理人は少数なんだな…
巡回の度に串なんて差してられないよ 幸管理人が見られないサイトは削除でも文句はないと思う
>>823 そこのサイトからの逆アクセスがずば抜けて多いから登録していて欲しいとか、
幸管理人が好きなサイトだとか、幸管理人から見て神サイトとかじゃなければ、
管理人が通常の方法のアクセスで確認できないサイトの登録を継続するために
串刺したりしないと思うよ。
幸管理人からすれば「あんたのサイト見えないから、登録しなくてもいいよ」というのが本音なんじゃないか?
アク禁する時は、巻き込む人間に幸の管理人がいないか注意ってことだな。 幸管理人のIPなぞ知らんけどw
幸管理人の立場から言うけど、自分がアク禁に巻き込まれてるってことは、 自分以外の同じプロバイダの幸利用者も巻き込まれてる可能性があるってことなので、 「幸利用者が閲覧できないサイト」と判断して登録を削除するよ。 屋風BBの特定の人間をアク禁したいのならIPで弾けばいいんでねーの? ピンポイントでその人だけ弾けるよね?
幸=さ/ー/ちなのか。ようやくわかった。ありがとう。
>827 819はIPではじいてるんじゃないのかな。 でも何故か管理人さんもまきこまれてる、と。
.htaccessの記述の仕方を間違ってる可能性は無いか? 思い込みでずっとそうしてる、とか…
>829 それが不思議なんだよね。 deny from yahoobb数字.bbtec.net これでヒンポイントで弾けるはずのに。 User-Agent じゃ他の人も巻き込まれるからIPかリモホで弾くほうがいいと思うんだがなぁ。 これだけだとスレ違いなんで、ググルのロボ弾き。 deny from .googlebot.com
>>831 819でつが、deny from yahoobb数字.bbtec.netで、ピンポイントに弾いてるんだ。
で、管理人さんはこの数字部分が全然違ってるにも関わらず弾かれてる。
他のやふBBユーザーは普通に入ってきてるし、それで謎だなぁと。
一度もういいかなーと↑の記述消したら、早速荒らし戻ってきて暴れまくって、
慌ててアク禁戻したらぴたりと治まったってことがあるから、記述は間違ってないと思う。
一応自分のIPとかでテストもしたし。
スレチなのに色々レスくれてごめん。ありがとう。
数字、ピンポイントに書いてるよね? *とかワイルドカード使ってないよね?
>>833 ありがと。数字はピンポイントに書いてるよ。
解析チェックしてるけど、やふBBユーザーのアクセスが極端に減ったってこともないし、
総アクセス数自体にも目立った変化はないみたい。
ちなみにロボ避け記述のみの.htaccessは、幸登録時点で置いてたので、
ここの部分で管理人さんを弾いたりしたってことは、多分ないと思う。
延々とマジでスレチごめん。ありがたかったです。
>834 幸管理人の管理メールアドレスが屋風メールってことない? んで、ロボ避けの関係で屋風からのリファラを弾く設定にしてたら大当たりって気がするんだが。 管理メールアドレス=幸に登録した時に自分のとこに送られてくる内容確認のメールが届く先ね。
ああ、それありそうだな。 かくいう自分も幸管理人で、通知メールからそのサイトへ飛ぶから。
実は幸管理人が粘着している池沼。
ID変わってると思いますが819です。色々まりがとん。
>>835 屋風リファは確かに弾いてるんだけど、
search.yahoo.co.jpを弾く設定にしてあるので、
屋風メール(mail.yahoo.co.jp)は弾いてない(実際飛んできている人もいる)。
管理人さんから来たメアドも屋風じゃなく、独ドメと同じドメインのメアドだった。
ヘッダにあるメーラーはOutlookだったし、その線は薄いかも。
>>837 もしそうなら管理人さんのIPは池沼と一致すると思うw
>837 漏れも一瞬そう思ったが、IPが違うみたいだから別人でね?
木綿。リロ忘れ。
というか、その池沼が串を刺すようになれば 屋風を弾く理由もなくなってある意味解決じゃね?
CGI置けない鯖なんだけど、ジャンル名とかで拾われてしまうのを防ぐ場合 語句の間にコメントを入れたらちょっとは効果あるかな? 「ジャ<!--なんたらかんたら-->ンル名」 みたいに。
>>842 ここで聞く前に、本を読むなりぐぐったりして、
もっといろんなところで勉強してきたほうがいいと思う。
>842 意味ないと思う。
ブラウザに表示される情報ではなくソースを収集していくわけだから 無駄ではない…かな?
>>842 CGIを置けない鯖だということと、ジャンル名にコメント挟んで拾われないようにするのと関係あるのか?
ロボテキ置けないってこと?
メタタグ入れていれば万が一拾われていても、
ジャンル名で具具ってサイト出てこないよ。
ジャンル名でリンク貼られているとかでなければ。
ログ嫁
役に立ちそうな情報集めてまとめサイト作ったら便利そうだよね。
でも情報ってもメタ記述とロボテキと.htaccesと、パスワード認証とか…? それだったら801板の姉さんが作ってくれたまとめサイトがあるけども。 あったなら便利っちゃ便利かな。
>>65 に貼ってあるけど、このスレ派生のも欲しいってことかい
別にいらないでしょ
過去に数回、アホーに拾われて 消してくれ→消したぞ→何故か復活→消してくれ→消したぞ とやり取りを繰り返したのだが、 何故か最近また復活… 今度は問い合わせもスルーされてますorz 三回目以降はBListにでも入れられる事になってるのかな
そろそろ.htaccess書き換えたほうがイイのかなーと思うが あまり頻繁に変えるもんでもないのかね。 なくなった検索サービスとか外しちゃいたいし 新しいサーチができてたらそれは弾かなきゃなんないし 最新版作るのすげーめんどい。
アホーブクマにブックマークされてるとアホーに拾われ続けるって聞いた
アホーブクマも弾いてる漏れんちはアホーに拾われたことがないな、そーいや。
>>854 書き換えればいいじゃん。
なくなった検索のが書いてあっても無くなったのならなんの影響もないし。
けむまきコントロールの新規レンタル終了したんだね。 CGI使えないので、借りたの大事に使おうっと。
突如msnbotが頻繁に来はじめた。検索除けはしてたんだが 自サイトのサイト名で検索すると一番目に出ることを確認orz 対策のやり直しだヽ(`Д´)ノ
もうね、一番メジャーなぐぐるで拾われてなかったらいいかと 諦めかけている…orz でもやっぱまだアホーがトップなのかな? .htaccessでもメタ入れてもロボテキ入れても拾っていって そのくせ削除問い合わせはスルー って手強すぎ…もうだめぽ
ネット初心者や一般ピーポーほど アホーを使ってるからね・・・
とりあえずINDEX以外はオールクリア。 INDEXは仕方ないから、同人とかいう言葉自体知らない人にも 分かるような文で警告入れてる。 うちは801とかじゃないから一般人が入ってきてもあまり気にしないけどね。
>860 アホーからのリファラを弾いてみれば? 漏れんとこはアホーからのリファラ、アホーロボのIPとUAを弾いてるけど、 一度も引っ掛かったことないよ。(漏れんとこへのリンク数もアクセス数もそれなりにあるが)
>>863 今日突然アホーから返事がきて
削除されてた!ヽ(・∀・)ノ
でもまたいつ復活しやがるかわからないから
リファラ弾きは最終兵器として準備しておきます。情報サンクスコ
ところでヤホーの返事の文中に
>なお、「ウェブ検索結果」については、Yahoo! Inc.が運営するロボッ
>ト型全文検索サービスが独自に収集したデータベースによるもので、
>その表示順、キーワード設定はYahoo! Inc.のシステムに準じたもの
>となっています。
>こちらはYahoo! JAPANのデータベースに一致するサイトデータが存
>在しない場合に自動的に引継がれる検索結果になりますので、個々
>の調査およびご質問への回答をいたしかねます。
とあったのだが、あまり詳しくないのでよくわからないんだけど
「自動的に引き継がれる」ってのは、ロボットが拾ってこれなかったら
昔の情報を引っ張り出してきて引き継ぐってこと?
だから復活するんでしょうか?
>>864 その回答文を見る限り、
>「自動的に引き継がれる」ってのは、ロボットが拾ってこれなかったら
>昔の情報を引っ張り出してきて引き継ぐってこと?
で合ってるっぽいな…
つまりアホーに一回拾われたらもう駄目ってことなんか…?
AddHandler cgi-script htaccessを記入してるだけでロボットがひろわない んなことはないよね
fc2って.htaccessでロボットや学校からのアクセス制限かけても大丈夫だっけ? 「第三者に制限をあたえる可能性のある(パスワード認証など)ページのアップロード禁止」ってあるんだけど .htacsess自体はhtmlページじゃないからセーフ? というか鯖移転したほうがいいかな…
それ以前にfc2って.htaccess使えるの? あそこ無料だとCGIすら使えないよね。 有料なら大丈夫かもしれないけど。
.htaccessつかえないだろ。 ファイルマネージャーでパスワード設定する以外は。
使えるよ 試しに自分のホスト弾いてみたら 403に飛んだ 規約的に使っちゃだめかどうかについては機能してるから一応おkなのかも FAQにも載ってないから詳しくは解らんけど>使用の可否
使われたくなかったら使えないように設定してあるはずだもんな fc2のことだから、忘れてただけかもしれんけどw
あるあるwww マジであそこなら普通にありかねん
873 :
名無しさん@どーでもいいことだが。 :2005/12/07(水) 13:30:28 ID:+HhJGAf4
>>873 拒否はロボテキのみかー
.htaccessでac.jp弾いてる場合は弾けるかな?
や、自分はac.jpはじいてるんだけどそれでも入ってきてた。 htaccessでこのユーザーエージェントをはじくのはいけるんじゃないかと思って ロボテキと共に書き直してみたけど。
>>875 レスd
ac.jp弾きだけじゃダメか。
とりあえず3月以降の解析ログチェックしたけど、うちにはまだ来てないっぽい。
うちはロボテキ置けないから、.htaccessでUA弾いてみる。
閲管スレにのってたネチケット系URLで >URL請求制でどこからもリンクしていなくても、 >Googleツールバーをインストールしている訪問者がそのページを閲覧しただけで、 >そこのURLはGoogleに知られてしまいます。 って読んだんだけどこれって本当? 自分ツールバー入れてるんだけど、本当だったら自ジャンルに多大な迷惑を かけてたことになるorz
んー、検索避けは確かに必要だけど、 できてなかったから自ジャンルに多大な迷惑をかけてた、とまで卑屈になる必要はないと思うけど。
>>877 グーグルのツールバーをインスコするときに、
その>>閲覧すると情報がグーグルにいくように設定します、しません、っていう
項目があるはずだけど。
「情報をグーグルに送ります」にチェック入れたの?
>>877 ぐぐるツールバー入れたときに、情報提供しますか?って出たでそ。
あのときに「嫌だ」ってしてた?
してたら閲覧サイト情報はぐぐるに渡らないので無問題。
したかどうか覚えてなくて不安だったら、一度アンインスコして、
再度インスコ→情報提供拒否で入れれば気が楽になるんでないかい。
リロって大事だね…ケコーンすまそ。
>>879-880 あ、それは「お断りだ」にチェックしました。
だったら大丈夫なんですね。よかった。
質問。 レンタル鯖にデフォでついてるカテゴリナビがあるんだが あれって任意じゃなくて強制登録なんだろうか? ちなみにfc2。
問い合わせる場所を間違えてる
いつから漏れらfc2のサポセンになったんだよw
アホな質問をひとつしてもいいですか。 BASIC認証をかけた場合、その先(=下位ディレクトリ)に ロボは入ってこないと解釈してよろしいのでしょうか。 .htaccessにロボ避けみっしり書いたら、心なしかサイト表示が 重くなったので、コレで済むなら少しはラクかなーと思ったんですが。
>>886 ロボよけタグを.htacessにずらずら書いた場合
IPでdenyしていればいいのだが、なんとかロボ、何とかロボ…と
ずらずら書くと、
例えばトップページに画像を10個使っているとすると
10個全部のファイルにアクセスするときに
チェック始めるから重くなるよ。
BASIC認証書ければ下位ディレクトリにはロボ来なくなる。
>>887 回答ありがとうございます。
ならば、BASIC認証を導入した方がよさそうですね。
とりあえず、色々試してみます。
保守
BecomeBotとかいうのがクロールしてきて、Web拍手まで押してった。
UserAgent:Mozilla/5.0 (compatible; BecomeBot/2.3; MSIE 6.0 compatible; +
ttp://www.become.com/site_owners.html )
IP:64.124.85.210
エキサイト翻訳にかけてみたら
「BecomeBotは以下のIP範囲を使用します: 64.124.85.0 突き抜ける、64.124.85.255。」
ってなってたからとりあえず.htaccessで弾いてみた。
サイト見る限り拒否はロボテキのみなんだろうか。メタタグに関しては言及してなかった。
うちは27日に来てたけどロボテキのみ読んでいったよ
>>890 サイトの記述通りにロボテキ書いたら、ロボテキだけ読んで帰っていくよ
ロボテキ置いてたはずなんだけど年末にサイト移転した際に要れ忘れたみたいだ… みごとにヤフーもぐぐるにも反映されてる 急いでロボテキ追加したけど本当に大丈夫かな いざロボに発見されると不安でしかたない 変わったサイト名だからうちのサイト一発表示だし心許ないやorz
>>893 ぐぐるなら削除申請出した方が、確実に速攻で消してくれるよ。
やふは自分の経験上、一度登録されるとロボテキ入れようがMETA入れようが
メールで直接削除申請しようが、なかなか削除してくれない。
リファで弾いて403を返してやるのが、一番早く削除される方法だった。
アドバイスd ただヘルプ見たらやふは『削除申請の正当性の確認ができないため応じられない』とあった たぶんそのせいかな>反映されない とりあえず駄目もとで削除申請してくるよ
>なお、Yahoo! JAPANでは個別のサイトや検索結果に表示される内容について >削除のご依頼をいただきましても、そのご依頼の正当性や、 >削除権限の有無を確かめることができないため、ご依頼を受け付けておりません。 これか… ロボテキやメタをちゃんと読んでくれりゃいいけどさぁ…
うちも何回も削除お願いメールを出したけど ことごとくスルーされました(´∀`)モチロンmetaイレテタヨ 今は「アホーから来る人=一般人or初心者」と見なし、 .ataccessで弾いて403返してます
aじゃなくてhだよ。スマソ・・・
自分の時はロボテキ入れてメタも記述してんのに拾われてんですが という内容のメールを送ったら タイムラグだよ、しばらく待てって返事が来て数日で削除された。 アンタんとこのロボットさんは2,3ヶ月もロボテキ読まないのに メールが来たらいきなり読むんですか、フーンて気分になった。 >削除権限の有無を確かめる これは、サイトにHTMLファイルでメールと同じ文章アップして メールにそのURLつければ証明できるよね。アホーが対応するかはわからんが。
>>899 自分そういうメール送ったら、
やっぱり「タイムラグだよ、もちっと待ってね」とメールが来て、
もう半年待ってんだよゴルァと思いつつ削除されてほっとしてたら、
1ヶ月後に登録が復活して、思わず殺意が沸いたことがあったw
(登録日が昔だったので、再登録ではなく、登録が普通に復活してた)
403返してやったら再削除されて、たびたび登録復活するけどそのたび削除されてる。
いい加減学習しろよ…とちと思う。
>>900 >>855 みたいにアホブクマ利用してる人がいるんじゃないのかな
403返し続けてもアホーに拾われ続けてる人もいるみたいだし
本当にアホーだなorz
自分のトコは検索よけしてあるけど、うちにリンクしてるとことが 思いっきりヤフに登録されてて、検索よけ意味ねー。 版権ものはサーチや同盟以外みんな検索よけすればいいのに。
「検索よけしてないサイトからのリンクお断り」と出しておくとか。
ただのマナーですから
>902 むしろサーチや同盟が検索避けしていないと登録できねぇorz
>905 自ジャンルのオンリーワンサーチが ジャンル名で検索すると一番上に来るジャンルの俺が来ましたよ 原作も厳しいはずなんだがorz
(゚Д゚)ゴルァアホー!いい加減に来るの止めろ!
908 :
ふんどし :2006/01/23(月) 18:52:13 ID:gHOTqASo
ふんどし
909 :
893 :2006/01/25(水) 05:01:08 ID:6uyGk6jX
ロボテキ入れ忘れてアホーとぐぐるに拾われた者です あれからいそいでロボテキ入れなおしたよ 今日チェックしてみたら検索結果からキャッシュ消えてて一安心 油断できないけど。
保守?
911 :
海老の水餃揚げ はまぐりのすまし汁 :2006/01/28(土) 04:35:34 ID:MrQiPD5q
某マナサで、口混みはメタタグ入れても反応しないと書かれてて口混み使いの自分は冷や汗かいた。 その後ヤホとかググルで検索したけど大丈夫だったから安心はしてるのだが…まだ不安。
非常に初歩的な質問で申し訳ないのですが 調べても分からなかったので・・・ ロボが来たとか、ロボテキ読んで帰ったとかは 全部アク解でわかりま・・・す?
どのファイルにアクセスしたか順番に全部解る鯖があるから、それじゃない? うち(桜)は生ログくれるけど、ロボがロボテキにアクセスしたとかまでは解らないよ。 ロボテキのアクセス数を見て、ロボらしきUA見て 「ああ、ロボがロボテキにアクセスしたっぽいな」と想像するだけだな、漏れは。
2行目でわからないといってるけど、3,4行目でしっかり推測できてるじゃないかw
数スレ前までは生ログ解析ツールがどうとかそういうネタが出て面白かったのにね、このスレも。 もうあきれて去ったんだろうな。 オレも去る。
えっこれまだ初代スレだよ?!
解析スレと間違えたんではw >915 いや、たまにロボテキの中身を見る為にアクセスする人がいるからさw 別に見られて困るもんでもないからいいんだけどね。
913っス。 やっぱり完璧には分からないトコもあるんですね・・・ふむ。 有難うございました!!
921 :
名無しさん@どーでもいいことだが。 :2006/02/03(金) 03:01:17 ID:tI+dvJh8
>914 桜の生ログロボがロボ的読んだのわかるよ。 ロボ的だけのアクセス抽出すると、ぐぐるとかアホー、msnあたりは読んでる。 読んでそこだけ見て帰るんだが、アホーはロボ的読むとインデックスしやがるからな。 アホー対策はロボ的を置かずに.htaccessだけの方が有効かも試練。 ただ、そのロボ的を読んでいるのが本当にロボかどうかは別の問題だが、 UA偽装してロボ的だけ読む人間はメリット特にない品。 ブラウザから普通に見られるし。 他の検索のロボがググルボットに偽装していることはよくあるが。
>920 サンクス!!! もっと勉強しやす。
過疎りがちで微妙に話題も被るこのスレとアク解スレを合わせて 同人サイト運営に役立つ技術的なことやツールを語るスレがあるといいなぁと思った アク解スレまだ新しいの立ったばっかだからアレだけど
TOP(インデックス)にはるだけでいいの? 特に避けたい裏があるんだけど、タグはTOPにしかつけてないんだ。 自分で具具っても出てこないからいいのかなと思っているわけだけど。
君は自分のサイトを具具る前にロボ避けについてを具具ったらどうかな。
素朴なギモン。 よくダミエンであふーとかぐぐるに飛ばすサイトあるけど、ああいうことしても 拾われたりしないのかな?
それは、 1.飛ばすことによって検索避けの効果はありますか? 2.飛ばすことによって(逆に)拾われる可能性はありますか? のどっち? 答えは「どっちも無い」だお
保守
930 :
名無しさん@どーでもいいことだが。 :2006/02/17(金) 00:33:13 ID:fWKmapGA
とりあえずホッシュ
931 :
名無しさん@どーでもいいことだが。 :2006/02/18(土) 23:39:03 ID:xhEtvS0r
定期保守
932 :
名無しさん@どーでもいいことだが。 :2006/02/23(木) 22:19:01 ID:EHfzEK0x
定期保守
てすと
てすと
てsつ
てすと
てとす
938 :
nanasi :2006/02/25(土) 18:19:19 ID:voz9Xgfc
(;´Д`)ハァハァ
939 :
ちょと確認 :2006/02/25(土) 23:09:52 ID:n+nsHU14
感染しないぽいが念のためidチェック。
ごめんね、漏れもIDチェックさせてね
何でここでやってんだ?
何のチャックしてるんだ?
■□■ 現在、同人板はウィルスによるスクリプト爆撃を受けています ■□■
過去に半角二次元板で確認された、AntiLoウイルス(の亜種)のようです。
自分が感染していないかウイルススキャンをお願いいたします。下記サイトを参照して下さい。
ttp://security.s182.xrea.com/ ・ウイルス混入のファイル実行で感染?(感染源ファイルはまだ不明)
スレ見ただけでは感染しないからおちけつ
・ウィルス感染者は、同人板閲覧者・2ch閲覧者とは限りません
・専ブラによるあぼーん機能の使用推奨
※該当スレがあるのでIDチェックを関係ないスレで行うのは止めてください
次スレどうする?
ここはマターリしてるし970ぐらいでいいんじゃないの。
次は「検索・ロボ避け総合スレ」にしてみたらどうだろう
検索って単語入れるとコピペ爆撃の被害に遭うぞ
ロボだけじゃなくてアクセス制限全般まで話題を拡げてみるのはどうか どうせなら同人サイト運営に関わるツール全般の話までしたいところだが 雑談スレと被るかな JSやCGIもカバーできると便利な気がするけど
949 :
ウイルス蔓延中!要感染確認@自シ台スレ :2006/03/06(月) 02:38:39 ID:2jTx9rkm
ナマサイトでコス写も載せておいて、2次元のサーチに登録してる椰子がいる。 検索避けする意味ねぇし。 よっぽど死にたいらしい。
>949 マルチ乙
同人サイトを運営する上でのTipsみたいの、
>>948 の言うようにアクセス制限とかそういう話もできたらいいなと。
広げて、アクセス解析とかに関しての話もいいんじゃないかと思うのだが…
しかしこのスレには本当にお世話になった。
ここを参考に全般的に.htaccess見直ししてから、今のところロボをほぼ完全遮断できてる。
アク解は専スレあるからなあ。
yahooマジうざいわ。 あとceekも。
アク解スレも過疎りがちだからいずれ合流してもらうようにしたらどうかな お互い話題よく被るし それかここの次スレしばらく待ってアク解スレへお邪魔させてもらうとか? どうしても合流させたいわけじゃないからダメなら別にいいんだけど とりあえずあまりいいスレタイが思いつかないが 【ロボ避け】同人サイトでアクセス制限【アク禁】 【CGI】同人サイト運営ツール【アク禁】
だったら↓のほうが良くね? 【ロボ避け】同人サイト運営ツール【アク禁】 このスレからデータになりそうな部分をピックアップして天婦羅にするとか。
アク解スレに合流賛成。
955に賛成 アク解スレも巡回してるけどこことかぶるような話題は あまりないと思う。
ロボの話や「こんなのがキテタ!ガクブル」「←弾け」みたいな話結構あったけどな>解析
アク解スレはそもそも解析が同人サイトで流行り出した頃に、解析ってどうよ、みたいな
議論目的で立てられたとこもあったから、今はもう専用で必要なスレでも無い気がする
専スレもある解析使ってる人多いからWebやレン鯖行くし
どうよ、って辺りをやりたいときは雑談とか他にスレもできたし
とりあえずここだけで話してるのも何なんでアク解と雑談に話振ってみます
あと次スレにはこれおながい
ttp://www.ii-park.net/~nanashi/linksitetech.html
>>958 そこ21禁板発生サイトだし
過去ログも簡単に見れちゃうからどうかと思う
そこのサイトの801抜きにした専用ページ無かったっけ
>>959 こっちとか?
tp://sp999.oheya.jp/tips/
過去ログ簡単に見れちゃうのが何故いけないの?
全年齢板にpink貼るな、ってのと同義
>955のスレってどこの板?
近々サイト移転してCGI可、ロボテキも置ける鯖に行く予定。
今はプロバの鯖で、メタタグだけ入れてるけど、今度はちゃんと.htaccessとかロボテキ入れる。
…と思って書き方をぐぐってみても、これでいいのかなーって悩んじゃう。
アーカイブ(
ttp://www.archive.org/ )避けるのも
User-Agent: *
Disallow: /ディレクトリ名/
だけで大丈夫なのか?本当か?
とりあえずこう書いとけ、っていうそのものズバリ書かれてるサイトないかな。
アーカイブはプロバ鯖使ってたときにわざわざメール送って削除してもらったので
今回はそんな手間かけたくないし、かけさせたくない…
たった1000弱のレスも読めない人は一生悩んでたらいいと思います
【CGI】同人サイト運営ツール【アク禁】 ツール全般を語るとなるとやっぱりCGI関係の話が多くなりそうだから スレタイには入れておきたい気がするな この手のスレを必要とするような初心者にも見つけやすいだろうし ロボ避けもアク禁の一種と考えてみたけど 【CGI】同人サイト運営ツール【ロボ避け】 このほうがわかりやすいかな
>>966 うん。このスレから派生したスレになっていくわけだし、
【ロボ避け】 の文字は入れて欲しいな。
ていうか、
【ロボ避け】 同人サイト運営ツール【CGI】
の順番でどうだろうか。
【ロボ避け】 同人サイト運営ツール【.htaccess】 は?
「CGI」って入れるとおすすめアク解の紹介スレだと思う人いないかな?
>>969 それは注意書きして専用スレに誘導すればいいとおもう
確かプログラム板にあった
運営ツールって何?
【ロボ避け】サイト管理ツール【アク解】 はどうかな?
ごめん、久し振りに来たからツールってのがわからなかった。 【ロボ避け】【アク解】のソフトがダウンロードできるのかと思った。 【ロボ避け】同人サイト管理ツール【アク解】では長いの?
同人サイトのロボ避けアク解について はどうかな
>>974 それに一票。一番勘違いされにくいそうモ。
「管理ツール」ってついてると
拍手とかCGIスクリプト全般も連想されそうな気がする。
いちいち誘導する手間もない方がいいかと。
ロボたん