【Robots】Googleアーカイブが嫌い【NoArchive】

このエントリーをはてなブックマークに追加
458Name_Not_Found
ミスしたら、直せばいいだけ。
保存されるのがイヤなら初めからアップロードしなければよいヨ。
459Name_Not_Found:03/09/14 07:41 ID:s5HrIGwF
保存ならぜんぜんいいけど、祭りになると手がつけられんのよ。
企業のミスだってそうでしょ。周りが静かに、運営元に連絡して
やりゃいいのに、かってにでかくして、被害者増やして、
ログを保存して骨の髄まで貪り祭る。
もう、ハイエナ系ちゃんねらーはうぜー。
まぁ、企業の場合の方が楽かもね。ある意味。
個人サイトがこれにあうとほんとつらいぜよ。
著作権関係はもうあきらめた。
警告しても次から次とでてくるから、もう放置だよ。
460Name_Not_Found:03/09/14 07:47 ID:???
安心汁、喪前のサイトごとき誰も騒がんよ
461Name_Not_Found:03/09/14 08:01 ID:s5HrIGwF
ある程度ヒットするサイトつくってみ。
否が応でもここが(2ch)ネックになってくるから。
誰もが感じてる事だろう思うけど。
462Name_Not_Found:03/09/14 19:13 ID:???
評判されるのが怖ければサイトなんて作りなさんなってことだ。
463Name_Not_Found:03/09/14 21:24 ID:???
>>461
そりゃ厨が集まるようなサイトだからだろ
464Name_Not_Found:03/09/14 21:41 ID:???
>>461
被害妄想ではなくて?
そもそもInternet Archiveを使ってまでミスを指摘して騷ぐ奴なんて見かけるか?
騷ぎ立てる馬鹿者どもは、Wayback Machineとか見たこともない無知な連中ではないのかな。
465(*∠_*) ダカラドーシタ:03/09/27 17:13 ID:hW5Ywwz+
■日本人プログラマーよGoogleを攻略せよ 2003年09月24日 CNET Japan - 梅田望夫・英語で読むITトレンド: http://blog.cnetnetworks.jp/umeda/archives/000697.html

Google Code Jamというプログラミングコンテスト(CNET Japan速報記事「米グーグル:「プログラミングコンテスト出場者を求む」」をご参照)が10月から11月にかけて開かれる。
参加資格は18歳以上(世界中の誰でも)。予選はオンラインで、決勝(トップ25人)はシリコンバレーのGoogle本社で行なわれる。
腕自慢の日本人プログラマーたちには、この機会にぜひその実力を発揮してほしい。

Google Code Jamのファイナリストといえば、これから腕一本でプロとして生きていきたい若い人にとっての大きな勲章になる(中途半端な学歴なんかよりうんと価値がある)。
ファイナリストに残る日本人がいれば、日本人プログラマーの実力が世界でもトップレベルにあるという事実を、広くアピールできるだろう。
さて、コンテストの仕組みとスケジュールであるが、

参加者全員から500人にふるい落とす「Qualification Rounds」、
500人を250人に絞る「Online Elimination Rounds 1」、
250人から25人に落とす「Online Elimination Rounds 2」。
ここまではすべてオンラインなので、自宅から参加できる。
そして、ファイナリスト25人はGoogle本社での「Onsite Championship Round」に進むことができる。

★google code jam 公式サイト(excite翻訳) http://www.excite.co.jp/world/url/body?wb_url=http%3A%2F%2Fwww.topcoder.com%2Fpl%2F%3F%26module%3DStatic%26d1%3Dgoogle%26d2%3Dgoogle_overview&wb_lp=ENJA&wb_dis=2
466Name_Not_Found:03/10/07 01:04 ID:y1JMCMQG
昔やっていたサイトがとあるサイトの劣化コピー品で、著作権所有者に怒られて閉鎖しました。(謝罪は行い、許しも頂けました)
そのサイトがWebArchiveにまだ残っていて、非常に困っています・・・

存在する事はWebArchiveが出てきたばかりのころに気付いていたのですが、
愚かな自分の愚行を見たくなく、精神的に逃げてしまい、削除依頼も出していませんでした。

何とか消してもらいたいのですが、
どの様なメールを出せば削除又は非公開にしてもらえるのでしょうか?
英語はほとんど解りません…

いくら罵倒されてもかまいません。どなたかご教授下さいお願いします。
467Name_Not_Found:03/10/07 11:32 ID:???
死ねばいいんじゃん?




なんちゃって
468Name_Not_Found:03/10/07 19:41 ID:8Jadebqv
メリケンが削除なんかするわけ無いだろ
469Name_Not_Found:03/12/25 11:28 ID:2q2FDX/X
参考になったので保守
470Name_Not_Found:04/01/03 22:50 ID:???
http://recall.archive.org/

Internet Archiveの110億ページを検索できるサーチエンジン「Recall」
 http://internet.watch.impress.co.jp/cda/news/2003/09/08/377.html
Internet Archive を検索できる検索エンジン Recall ベータ版公開
 http://www.sem-research.jp/sem/search_engine_news/20030909001857.html
471Name_Not_Found:04/01/21 23:01 ID:FZXzAsgq
みなさん教えてください。
googleのキャッシュを手動で消そうと思い、ユーザ登録を行いました。
ユーザ登録のURLはこちらです。
http://services.google.com:8882/urlconsole/controller?cmd=reload&lastcmd=login

登録を行って1時間は経ったのはずですが、登録確認メールが来ません。
どなたか同じような現象や対処方法をご存知の方はいませんか?
よろしくです。
472Name_Not_Found:04/01/21 23:03 ID:???
経ったのはず
473471:04/01/21 23:18 ID:???
自己レスですが解決しました
474Name_Not_Found:04/01/23 23:46 ID:???
>>471-473
なんなのだ(w
475Name_Not_Found:04/01/29 10:06 ID:nKGkPLGP
robots.txtを置いてGoogleキャッシュ削除の手続きをしたのですが、
robots.txtの場所を入力して削除ボタンを押すと以下のようなメッセージが
あらわれました。

robots.txt ファイルの管轄外にある URL には、次の規則が適用されます。
DISALLOW /

これって正常に削除されているんですか?削除ステータスには何もあがってこない
のですが…。手順が間違っていたら教えてください。
476Name_Not_Found:04/03/24 13:13 ID:NeSHP/bm
archive.org に削除してもらおうと思ったら[email protected]
にメールすると戻ってきちゃう(つД`)  
[email protected]にメールでも大丈夫かな?
477Name_Not_Found:04/03/29 11:41 ID:???
477 名前:Name_Not_Found[sage] 投稿日:04/03/25 21:03 ID:???
>>476

>>446で紹介されてる[email protected]に送ったら、対処して貰えたよ。


478 名前:476[sage] 投稿日:04/03/26 12:43 ID:???
>477
メール送ったら、すぐに返事がきて「削除したよ」とのことです。
確認したらきちんと削除してありました。

ありがとうございました。
478Name_Not_Found:04/06/14 02:09 ID:???
保守
479Name_Not_Found:04/07/01 13:34 ID:???
【衝撃!】消し去ったはずのWebページga保管する
http://pc2.2ch.net/hp/kako/1004/10041/1004183621.html

一度は公開したページを消したがるのは、卑怯者。男らしくないぞ。
480Name_Not_Found:04/07/08 04:45 ID:???
消したがるのって腐女子が多い気がするから確かに男ではないのだろう
481Name_Not_Found:04/07/12 20:24 ID:???
Web制作板とか言って厨多すぎですね
482Name_Not_Found:04/08/03 01:34 ID:???
そうですね
483Name_Not_Found:04/09/02 20:36 ID:???
<meta name="Robots" content="NoArchive">
これをファイルごとにかいてアップロードすればキャッシュが残らないんですか?

それともrobots.txtってファイル作って
↓をかいてうpしておけばいいの?
User-agent: *
Disallow: /

484Name_Not_Found:04/09/03 19:52 ID:???
俺の恥を残したくない。

最初作ったHPをローカルに置いてあるが3年前それを見て驚愕して
最初のページだけ見てエクスプローラーの×を押し目を伏せたことがある。
あれから3年・・・恐ろしくて開けないってのにそんなもんを未だに
全世界に向けて保存しとくなバカ
485Name_Not_Found:04/09/03 19:54 ID:???
>>484
だったら最初から公開しなければよかったのに。
インターネットはもともと公の場だよ。
486Name_Not_Found:04/09/03 20:11 ID:???
>>485
最初からすげー洗練されたページ作れりゃ誰も苦労はしない。
そんな事も感覚的にわからんのか?
487Name_Not_Found:04/09/03 20:55 ID:???
洗練されてから公開すればいいんです。
488Name_Not_Found:04/09/04 05:57 ID:???
>>484
わかるわかる。
何かものを作るってのは、そういうもんだ。

>>487
それだと一生何も物を作れない罠。
489Name_Not_Found:04/09/04 10:01 ID:???
>>486
そんなことはわかっている。そんな問題じゃなくて
インターネットが本来どういう場所でどうあるべきなのか考えたほうがいい。
何もすげー洗練されたものを最初から作る必要はないが
公の場だということを踏まえて作るべきではあると思うよ
490Name_Not_Found:04/09/06 20:27 ID:???
>>489
リアル消防に官が企画的に作り方教えるのが必修な今の世で
んな自分だけを正当化してる馬鹿丸出しな発言されてもなあ。

何も金もらって作ってるわけじゃねえし最初から洗練されたもの作れりゃ誰も
苦労しないってことがわかってないから>>485みたいなピンボケ発言できるんだよ。
まぁ煽り抜きで全部痛烈なるマジレスな。
491Name_Not_Found:04/09/08 15:47 ID:???
>>489

http://homepage1.nifty.com/kanda/net42.htm

まぁもう少し世の中ってものを勉強してから出直して来い
492Name_Not_Found:04/09/08 16:52 ID:???
後から恥ずかしいと文句言うなら公開するなってことでしょ。
493Name_Not_Found:04/09/10 00:25 ID:???
>>492ってマジレスするのも呆れるほどマヌケなレスだな。
こういう曲げ厨の相手すんのってめんどくさい事この上ない。。。
494Name_Not_Found:04/09/13 15:56:42 ID:???
技術用語「cache」が政治的な言葉として拡大利用される
http://d.hatena.ne.jp/HiromitsuTakagi/20040912#p1
495Name_Not_Found:04/09/17 23:05:46 ID:???
検索・登録対象から除外しているディレクトリの特定のファイルを
検索・登録対象にする場合のrobots.txtの記述は下のような感じでOKですか?

User-Agent: *
Disallow: /example/
Allow: /example/test.html
(空行1行)
496Name_Not_Found:04/09/17 23:06:32 ID:pmLRZwgG
質問なのでageさして下さいね
497Name_Not_Found:04/09/21 12:57:30 ID:???
理論上はそれでいいはずだけど
ロボットがAllow:に対応してるとは思わないほうがいいよ
498Name_Not_Found:04/09/21 15:43:27 ID:???
>>497
レスdクス

一晩待ってレスが無かったので、別スレで問合せた所、
AllowはGoogleに対しては、効果がない、との回答もらいました
499495:04/09/23 12:57:10 ID:???
Googleから回答が来ましたので、報告
---------------------------------------------------------------------------------------
Googleへご連絡いただきありがとうございました。
ロボットがクロールできるようにrobots.txtを作成するには、
以下のように「Allow:」で始まる記述を「Disallow:」で始まる記述の前に記載していただく必要があります。
---------------------------------------------------------------------------------------

User-Agent: *
Allow: /example/test.html
Disallow: /example/
(空行1行)

上のような記述であれば、OKみたいです
500Name_Not_Found :04/10/07 11:41:11 ID:???
archiveに削除依頼したら
担当した人によって対応の仕方がちがうのか
本当に貴方のサイトなのか?という返事が返ってきた・・・
サーバーのメルアドで丁寧な英語メールを出したのに・・・
少しムッとしたがドメインとサーバー使用の領収書を添付して
きつーい言葉で削除しろともう一度メールしたら朝一で消されていた

強気の方が対応が早いのか?
501Name_Not_Found:04/10/19 00:24:11 ID:VDGHMVfN
499>>(空白1行)には何の意味があるのですか・・・?
502Name_Not_Found:04/10/19 00:30:27 ID:???
>>501
何も書かない行を1行入れておくって意味でしょ。
503Name_Not_Found:04/10/26 17:47:37 ID:???
Recallアクセスできなくなってる
504Name_Not_Found:04/10/26 18:09:01 ID:???
Recallはよく落ちてるよ
505Name_Not_Found:04/11/08 08:23:28 ID:Q2nUkUnd
>>483
要するに、METAに
meta name="Robots" content="NoArchive"
とさえ書いておけばgoogleだろうがweb archiveだろうが絶対にHPを保存されないわけだ。
アーカイブアーカイブって言っても、それほど怖くないじゃん。
506Name_Not_Found:04/11/08 11:46:41 ID:???
なんで怖がるのか、何故そんなに過去を湮滅したがるのか、不可解。
507Name_Not_Found:04/11/09 14:48:57 ID:???
>>505
ネイバーにはアーカイブされる予感
508Name_Not_Found:04/11/27 02:09:21 ID:AXv4F7JJ
509Name_Not_Found:04/11/29 02:35:05 ID:LObmcSR6
知識無かったらまずいね。
これ、意外と知られてない事実じゃない?
中学生の頃遊びで作ったHPがネイバーなどに知らないうちに一字一句年代順に完璧にコピーされ
半永久的に出回り続ける・・・
更新しようが何しようが、とにかくたったの一瞬でもネット上に情報が出回ったら取り消す事は出来ない。

著作権法を盾に禁止しようにも、ネットは世界中と繋がっているから、たとえ日本国内で制限しても
法律なんか知ったこっちゃ無いような国がゴロゴロいるので不可能。
その著作権法ですら現行のままではグレーゾーン。

最初からそんなものを出すなと言われそうだが、誰しもただの日記にまで一字一句気を付けて書く事等できないわけで。
現実ではそんなことを知らされずにHPを作ってしまった人はこのスレッドにもたくさんいるが
どうしようもない…

web製作者にこのことをちゃんと知らせる決まりを作った方がいいのでは。
それがされてないのなら、「気軽に」HPを作ってみよう!なんて番組や雑誌、プロバイダは詐欺と一緒だよ。
HPを作ることは、未来に対して相当のリスクを背負っている事を実感する。

もしこのスレにそうした運動(HP製作など)が出来る人がいれば協力してほしい。
少なくともrobots.textの作り方などは詳しく書いておくべき。
510Name_Not_Found:04/11/29 09:57:26 ID:???
最初からそんなものを出すな。何でそんなに過去を消したがるのかね。
511Name_Not_Found:04/11/30 16:11:47 ID:???
>>509
がんばってくださいね(プゲラ
512Name_Not_Found:04/11/30 16:18:37 ID:2AxQnSSg
間違っていようが入るまいが知りません自己責任で
513Name_Not_Found:04/12/05 15:00:45 ID:???
>>451
例えばどんなロボット君ですか?
514Name_Not_Found:04/12/06 10:07:42 ID:???
で、どのタグが正しいの?
Googlebot? Robots?
515Name_Not_Found:04/12/06 12:37:41 ID:br9lpgB/
>>509
Archive.orgの問題に関しては、一昔前に割とあちこちで議論になってたけど、
ウェブサイト作成初心者の目に触れていたかどうかは疑問だな。

ネットリテラシーをちゃんと教えずに、便利さばかりを強調する商業出版物は
淘汰されていかなくちゃな。
ただ現在の時点で、漠然と「なんとなくインターネットには怖い側面もあるらしい」ってことは
印象としてネットに疎い人にも伝わっていると思うから、むしろそういうことをちゃんと記事に
入れ込めるほうが、信頼度は上がると思うよな。
516Name_Not_Found:04/12/14 17:05:06 ID:AqBMwuq6
国会図書館、webサイト保存を06年から開始
http://news19.2ch.net/test/read.cgi/newsplus/1102405883/l50
517Name_Not_Found:04/12/16 14:18:38 ID:FT/redux
<meta name="robots" content="noindex,nofollow,noarchive">
<meta name="googlebot" content="noindex,nofollow,noarchive">
518Name_Not_Found:04/12/19 16:49:59 ID:???
metaタグ入れたけど
キャッシュは残らないものの検索にはひっかかる
519Name_Not_Found:04/12/19 17:14:43 ID:???
何も知らない頃に作ったぼくのほおむぺえじを卑怯にもコソーリ保存しとくと言う
卑屈且つ姑息な手段が許せん。今ならいくらでもかかってこい状態だがなw
520Name_Not_Found:04/12/19 23:33:28 ID:???
卑屈とか姑息とか意味解って使ってるかチミー?
521Name_Not_Found:04/12/20 00:23:59 ID:TG6/tWaN
姑息ってのは大半が間違って使っていた&覚えていたってのが
最近のニュースであったな
522Name_Not_Found:04/12/20 07:07:31 ID:qKm8hCZP
>>520-521
融通が利かない
523Name_Not_Found:04/12/20 08:21:52 ID:???
融通などきかせるな
524Name_Not_Found:04/12/20 11:51:31 ID:vv8rHpnV
>>515
まったくの正論だ。

で、さしあたってはweb製作板あたりに立てるのが一番だと思うが
どういうタイトルにするかなど難しい点が多い。
http://pc5.2ch.net/hp/
525Name_Not_Found:04/12/21 11:54:44 ID:???
>>509
洩れ自身は、Net上から「日記コーナー」とかbぉgとか、役に立たんものは消えて無くなれとか思ってるけど、
現状社会は逆に動いてるでしょ。

そも、Archiveの役割がよく解らん。
Net上の物を記録してどうしようってのよ?
後で恥かしい文章やFileを見せて人を脅迫しようってのか?

多人数が必要だと思う情報なんて、
収集業者が無理しなくても、誰かが保存して役立てようとするか商売に使うもんだろ。

著作者が収集回避出来ない仕組みなんて論外だな。
526Name_Not_Found:04/12/21 13:26:25 ID:???
>>525
23世紀くらいに「20世紀のインターネット」なんていう
展示会をやるときにでも使うんでしょ。アーカイブっていうくらいだから。
もう著作者は死んでるだろうから、問題ナシです。

博物館に江戸時代の絵巻が展示されていて、
みせものにされたり、研究材料に使われたりするのと同じ感覚かと。
527Name_Not_Found:04/12/21 22:28:27 ID:Oe5KwH9M
>>526
それが「未来に対しての無限大のリスク」の
ほんの一部だね。
528Name_Not_Found:04/12/21 22:36:20 ID:???
529Name_Not_Found:04/12/22 00:06:50 ID:???
>>484タソは、同じファイル名で別の内容もう一回うpすればいいんじゃ?
530517:04/12/22 00:28:09 ID:XV1IYZrR
http://www.toonippo.co.jp/news_too/nto2003/0103/nto0103_4.html
のソースは、
<meta name="robots" content="noindex,nofollow,noarchive">
<meta name="googlebot" content="noindex,nofollow,noarchive">
になってるから、これが正しい記述&最強の回避方法?

<meta name="robots" content="noindex,nofollow">
ならしょっちゅう見るが。
531Name_Not_Found:04/12/22 00:54:36 ID:2V9rDwhI
グーグルはじいたら、訪れるやついなくなるぜ。
532Name_Not_Found:04/12/22 01:54:10 ID:???
身内だけにしか知られたくない場合それでいいんじゃない?
グーグル弾き+パスワード制で。
533Name_Not_Found:04/12/22 03:19:30 ID:???
>>530
nameは大文字が正しいんじゃないの?小文字でもOKなのは拡大解釈してもらえるだけで。
contentは NONE ALL NOINDEX INDEX NOFOLLOW FOLLOW を , で区切って記述。
NONEはNOINDEX,NOFOLLOWと、ALLはINDEX,FOLLOWと等価。
contentのNOARCHIVEはアーカイブするロボットの勝手な拡張。
あとどっかのNから始まるロボットはDoSアタックしてくるから
パケットフィルタレベルで拒否w
534Name_Not_Found:04/12/22 05:21:54 ID:???
しかしrobotstxt.org的にはcase-insensitiveなんだよな
535Name_Not_Found:04/12/22 14:39:57 ID:???
>>533
要するに何なんだ?
そんなに小難しく説明するより、あんたが
模範的な記述をここに書いた方が速いぞ
536Name_Not_Found:04/12/22 14:44:06 ID:???
<META NAME="robots" CONTENT="noindex,nofollow,noarchive">
<META NAME="googlebot" CONTENT="noindex,nofollow,noarchive">

↑これが模範例じゃないかな?


>>533の日本語を正確に再現すると
<META NAME="robots" CONTENT="NONE,ALL,NOINDEX,INDEX,NOFOLLOW,FOLLOW">
ってことだが。矛盾しちゃう。
多分、↓こうしろということをいいたのだろうけど。

<META NAME="robots" CONTENT="NONE,NOARCHIVE">
537Name_Not_Found:04/12/22 14:46:54 ID:???
権威の論証みたいになっちゃうけど、
プロの人でも小文字で
メタを記述してるから小文字でもいいんじゃないの?
拡大解釈してもらえるなら結局はいっしょなわけだし。
http://www.wdd.jp/index.html
538Name_Not_Found:04/12/22 14:48:11 ID:???
content内を大文字が正解

<meta name="robots" content="NOINDEX,NOFOLLOW">
539Name_Not_Found:04/12/22 15:33:20 ID:???
NOINDEX,NOFOLLOWは大文字のほうがいいんだっけか
540Name_Not_Found:04/12/22 15:54:10 ID:???
実際には小文字でも通用するけどね
541Name_Not_Found:04/12/22 17:45:30 ID:???
大文字小文字を間違えるとまずいのはDTD宣言。
それ以外はハッキリ言ってどちらもでいい。
作成ソフトやエディタでも小文字で吐くやつもあれば大文字で吐くやつもあるし。
542Name_Not_Found:04/12/22 18:32:23 ID:???
>>541 XHTMLではタグは小文字と決まってるんだが。
543Name_Not_Found:04/12/22 22:07:18 ID:r13JxYwv
弾きたい人は弾いておいたほうがいいかもね。
202.217.35.12
ndl-japan-research-robot-1.0 (http://www.ndl.go.jp/jp/aboutus/bulkresearch20
04/index.html)(http://e-public.nttdata.co.jp/bulkresearch2004/index.html)
544Name_Not_Found:05/01/02 20:32:51 ID:???
            
545Name_Not_Found:05/01/07 15:31:49 ID:???
    
546Name_Not_Found:05/01/22 16:29:09 ID:t9lcvif7
保守
547中島:05/01/25 19:16:00 ID:???
どちらの書き方が正しいのでしょうか?

@----------------------------
User-agent: searchpreview
User-Agent: ia_archiver
Disallow: /
A----------------------------
User-Agent: ia_archiver
Disallow: /
User-agent: searchpreview
Disallow: /

googleで検索すると、Aは効果がないらしいとの事ですが
ある複数のロボットを指定したい場合どちらが効果があるのでしょうか
よろしくお願いします
548Name_Not_Found:05/01/26 03:32:55 ID:???
質問なら上げてみてはどうか
549Name_Not_Found:05/03/01 09:52:29 ID:GxsRpJVb
>>547
Aの方法の場合、間に一行開けると良いと聞いた。こういう風に

User-Agent: ia_archiver
Disallow: /

User-agent: searchpreview
Disallow: /


で、やってみたが効果はなかった。
@はやったことはない。
grub-clientも俺は弾きたい。
三つ弾きたい。どうやったものか。

550Name_Not_Found:05/03/02 19:03:39 ID:???
発想を変えてみる。
Googleとslurpだけ許可したいとき。

User-Agent: *
Disallow: /

User-Agent: Googlebot
Disallow: /hoge/

User-Agent: slurp
Disallow: /hoge/

/hoge/ は存在しないディレクトリを指定する。
551Name_Not_Found:2005/03/25(金) 01:55:01 ID:wVs+2Lpf
Googleから削除されない・・
552Name_Not_Found:2005/03/26(土) 13:33:19 ID:x5rjTlqC
Google

削除要請出して、削除完了 となっているのに未だにインデックスされてる。
迷惑この上なし。

不人気サイトは掲載されないし、人気サイトは削除してくれっつっても掲載
される。削除依頼にも応じない。なんか、上場してからおかしくなってきたね。
553Name_Not_Found:2005/03/26(土) 17:24:02 ID:???
>>552
うーん。
robots.txtちゃんと設定してる?
554Name_Not_Found:2005/03/26(土) 22:32:26 ID:x5rjTlqC
削除完了 となっている
555Name_Not_Found:2005/03/26(土) 22:33:33 ID:x5rjTlqC
>>553

metaタグに noindex noarchive 入れてる。そして完了となった。
556Name_Not_Found:2005/03/26(土) 22:41:07 ID:???
>>555
とりあえず、もう2ヶ月ほどまってみなよ。
それで駄目なら、自動 URL 削除システムとやらを使って消しちゃおう。
557Name_Not_Found:2005/03/30(水) 10:16:34 ID:???
>>556

その自動URL削除システムを使って削除したんですよ。
そして、削除完了 とステータスがなっているにも関わらず未だに掲載中。

さらに、未だに掲載されているのでもう一回削除システムに削除依頼だしたら
受け付けてくれなかった。

それなりに人気があるサイトなんだけど、人気サイトは削除しませんってこと
なんだろうか。

逆に掲載してほしいのにいつまでたっても掲載してくれないサイトもあるし・・・
558Name_Not_Found:2005/03/30(水) 10:23:50 ID:???
>>557
あれは確か、受け付けてから実際に消えるまで、多少時間がかかるよ。
559Name_Not_Found:2005/03/31(木) 19:44:38 ID:bA0sz/rm
質問なのであげさせて下さい。
Internet Archiveに削除依頼を出したのですが
返信に そのHPにあなたの使ってるメアドを載せてくれ
というような内容がありました。
つまり本人確認をしたいという感じの内容でした。

ですがそのHPはもうアカウントも削除していて
現在は存在してないのでできません。他の方法を
ぐぐっても削除に成功した方の例は皆現在も
そのままHPを運営している方々達の話ばかりでした。
本人確認ができないと却下されそうな感じの内容
だったので返信に困っています。

今は存在しない過去のサイトの削除依頼に成功した方
いらっしゃいましたらアドバイスお願いします。
560Name_Not_Found:2005/03/31(木) 22:40:41 ID:???
なんでそんなに過去を消したがるのかねえ。
561Name_Not_Found:2005/03/31(木) 23:17:22 ID:???
>>559
相手に聞いてみたら?
562Name_Not_Found:皇紀2665/04/01(金) 00:38:43 ID:???
>>557,558
即、消すなら、robots.txtが必要じゃないかな。
ほら、

注意: 緊急を要し、Google が次回サイトをクロールするまで待てない場合は、
自動 URL 削除システムをご使用ください。 この自動プロセスが機能するためには、
Web マスターがまず robots.txt を作成して問題のサイトに配置する必要があります。

って書いてある。
563Name_Not_Found:皇紀2665/04/01(金) 04:19:52 ID:???
ただ、これ使うと使った記録がいつまでも残りやがる。
564Name_Not_Found:皇紀2665/04/01(金) 13:31:16 ID:???
>>559
前に同じ状況で依頼した事あるけど、すぐ消してくれたよ。
メアドも何も聞かれなかった。
鯖移転したのでrobots.txt置けない(サイト弄れない)とか書いてメールした気がする。
565Name_Not_Found:皇紀2665/04/01(金) 15:11:26 ID:???
>564
そうなんですか、そういう事例聞けると励みになります(TДT)
(何で自分の時は身元証明求められるんだ…orz)
本人証明できる手段はないけど消してくれというような文を
とりあえず再度送ってはいるのですが
承諾されるのかどうか返事待ちの状態です。
(1回目の依頼の時すぐ返信来たのに2回目は中々来ない)

あと無断使用禁止の注意文を載せていたページも
キャッシュされていたのでそのページと文を主張して
前から意思表示している事も伝えました。
これでなんとかなればいいのですが。
566Name_Not_Found:livedoor06/04/01(金) 16:21:31 ID:KkiLYdYH
Googleはカスラックに通報されてください
567Name_Not_Found:livedoor06/04/01(金) 16:26:11 ID:???
今グーグルって死んでる?
アクセスできないのだけれども。
568Name_Not_Found:livedoor06/04/01(金) 22:32:23 ID:???
URL自動削除システムで削除完了となっているにも関わらずしつこく掲載。。
つまり人気サイトにボイコットされるのを怖がっている検索エンジン各社。

不人気サイトは掲載すらしない、人気サイトは削除してくれない。お行儀悪い!

不人気サイトでも質が高ければそのうち人気サイトになるんだから、掲載してやれよ。
人気サイトでも、これ以上人を増やしたくないサイトもあるんだから、削除してやれよ。
569Name_Not_Found:livedoor06/04/01(金) 22:33:59 ID:???
>>562

robot.txtがなくても、metaタグに記載すれば削除する と書いてある。
実際に普通のサイトだとすぐにそれでも削除される。

今回分かったのは人気サイトは削除依頼をして、ステータスが{削除完了}
となっても人気サイトは削除されないということ。
570しつこいな:livedoor06/04/01(金) 22:36:14 ID:???
>robots.txtが必要
metaタグに記入してURL削除システムで申請。それでいいんだって。


>あれは確か、受け付けてから実際に消えるまで、多少時間がかかるよ。
だからぁ、いつまで経っても消えない。以前はすぐに消えたのに。。
571Name_Not_Found:livedoor06/04/02(土) 12:25:25 ID:???
559=565です。
一応報告。無事今日消されました。
英語は苦手だったから神経使って凄い疲れたorz
572Name_Not_Found:2005/04/07(木) 14:18:03 ID:???
あったお(゚ρ゚)

>Internet Archiveに削除依頼を出したのですが
>返信に そのHPにあなたの使ってるメアドを載せてくれ
>というような内容がありました。
>つまり本人確認をしたいという感じの内容でした。

アーカイブしえっ
573Name_Not_Found:2005/04/07(木) 14:21:16 ID:???
誤爆すみません
574Name_Not_Found:2005/04/07(木) 22:36:25 ID:???
どこの誤爆かわかった
575Name_Not_Found:2005/04/09(土) 14:34:31 ID:???
テニスの王子様サークルヲチスレ
http://aa5.2ch.net/test/read.cgi/nanmin/1112846205/424
576Name_Not_Found:2005/05/01(日) 18:51:58 ID:???
俺もGoogleから削除されなくて困ってる。
全くもって誰も訪れないファイルなんだけど。

もう最初の申請してから半年経つのに。
577Name_Not_Found:2005/05/01(日) 19:01:27 ID:OL89ggIB
http://www.asahi.com/national/update/0501/TKY200504300227.html
>国会図書館、ネット情報収集へ 保存して一般公開
>収集対象とするのは、日本を示す「.jp」が末尾に付くウェブサイトなど日本発の情報のうち、
>一般に公開されていて、だれでも入手できるもの。メールやインターネット電話、放送などは該当せず、
>パスワードなどで管理された制限アクセス情報なども対象外だ。
578Name_Not_Found:2005/05/02(月) 14:20:29 ID:???
orgなうちのサイトは対象外か
579Name_Not_Found:2005/05/03(火) 04:16:06 ID:???
.npは?w
580Name_Not_Found:2005/05/06(金) 00:35:16 ID:???
581Name_Not_Found:2005/05/21(土) 14:04:04 ID:???
>>578
IPアドレスがJPNIC管理のサイトも対象
http://www.ndl.go.jp/jp/aboutus/internet_view.html
> ◎「日本国内において発信された」とは、 JPドメインを持つサイト及びJPNIC管理の
> IPアドレスを持つサイトから発信されたものとします。
582Name_Not_Found:2005/05/23(月) 14:48:48 ID:diri+SYx
Googleって何で糞なんだ?

Googleで違法ファイルはバンバンDLできるし。どおりで
Google使ってる奴って厨だらけなんだな
583Name_Not_Found:2005/06/30(木) 08:37:12 ID:???
国会図書館、情報保存はお堅いサイト限定 反対多く転換
http://www.asahi.com/national/update/0630/TKY200506290346.html
>「jp」の前に「go」「lg」「ac」「ed」「or」がつくサイトのみを収集対象と
>することにした。
584Name_Not_Found:2005/07/01(金) 05:40:00 ID:???
>>583
フェアユース規定がある米国とない日本の越えられない壁だな
585Name_Not_Found:2005/07/01(金) 05:40:06 ID:???
>>583
フェアユース規定がある米国とない日本の越えられない壁だな
586Name_Not_Found:2005/07/03(日) 14:03:58 ID:???
俺のバカサイトは収集対象なんだな
587Name_Not_Found:2005/07/07(木) 01:05:38 ID:mAGgz0/E
過去にも同じ内容のカキコがありますが、質問させてください。
Internet Archiveの削除依頼の件で困っています。
依頼をメールで出したのですが、一向に反応がありません。
通常はどのくらいで削除してもらえるのでしょう…。
588Name_Not_Found:2005/07/07(木) 23:13:24 ID:???
>>587
削除依頼専用フォームから出したか?
589Name_Not_Found:2005/07/24(日) 15:45:20 ID:hhRGE6oz
無料鯖だと、ろくに.htaccessもrobots.txtも置けないから、はじくの難しいんだよね。
特にweb.archive.orgが一番困る。

漏れは今のところ、metaタグはデフォとして
・ハイパーリンクに、flashやjsを使う
・サイト内にフレームなどを多用して、なるべく1枚のhtmlにすべての情報をおかないようにする(収集確率が少し減る?)
とかやって、少しでも収集確率減らそうとあがいてるけど、他に何か良い手はある?
590Name_Not_Found:2005/07/24(日) 17:50:24 ID:???
>>589
有料鯖に引っ越す
591ラブ天使:2005/07/24(日) 18:38:46 ID:+a13nFAd
ァ  ∧_∧ ァ,、
 ,、'` ( ´∀`) ,、'`
  '`  ( ⊃ ⊂)  '`
     ∧_∧ ミ ギャーッハッハッハッ! >>590め、何言ってんだかー!!
 o/⌒(. ;´∀`)つ
  と_)__つノ  ☆ バンバン
592Name_Not_Found:2005/07/25(月) 16:13:05 ID:???
web.archive.orzは文章中のURLっぽい文字列も拾うからなぁ
location.href='http://www.2ch.net/';
程度じゃ無意味。
593Name_Not_Found:2005/07/25(月) 16:19:13 ID:???
>>587
すぐやってもらえたのは3年前位までだよ。
その時もlennyタンは協力してくれなくて悲しいよって反応だったし、
頼めば消してもらえると思われてることを知っちゃったみたいだね。
594Name_Not_Found:2005/07/27(水) 02:25:40 ID:???
ちゃんと探せば無料鯖で.htaccess使えるところあるし
595Name_Not_Found:2005/07/30(土) 12:11:29 ID:???
最近はサブドメイン仕様でrobots.txt置ける無料鯖も多いし
596Name_Not_Found:2005/07/31(日) 03:17:29 ID:y3ZdRS3x
Googleにrobots.txtを使ったURL削除申請をした後で、そのURLを復活させるのはどうすればいいのだろーか。。。
いったん削除申請して完了されてしまうと、金輪際それを含むURLはヒットしないのかなぁ。。。orz...
597coq ◆OOOOOkCOQc :2005/08/01(月) 13:22:29 ID:???
>>596
robots.txtを戻してURL申請してみなされ
598596:2005/08/01(月) 21:25:01 ID:???
>>597
状況かわんねっす。。。

180日間の喪があけるのを待つしかないのかなぁ。。。
599596:2005/08/27(土) 10:36:01 ID:n7Cn7bQi
URLの削除の申請から180日経過してもまったく状況が変わりません。
URLの削除のところにログオンしてもステータスは「完了」のまま。
2003年のキャッシュの削除の申請については「期限切れ」になっているんだけど。

Googleの問い合わせられるフォームやらメールやらは英文も含めて全部問い合わせたけど、音沙汰無し。

まあ、Yahoo!やらMSNやらでは普通に検索ヒットするから別にいいんだけど、
今の状態だとGoogle AdSenseが使えないというのがなかなか痛い。。。
600596:2005/09/03(土) 00:28:19 ID:2ZE2QuAW
この件ですが、何日か遅れて期限切れ扱いとなり、無事表示されるようになりました。

ただ、Googleから「こっちでサーチしたら引っ掛かるよん」という返信メールがあって確認したらそうなっていたので、
ひょっとしたらGoogle側で何かダマテンで作業をしてくれて、そのお蔭で復活したのかも知れません。
601Name_Not_Found:2005/09/23(金) 03:44:51 ID:???
作成時にrobots.txtをおいて
metaタグまで記入したのにグーグルから検索できたんだけどどういうこと?
602Name_Not_Found:2005/09/24(土) 15:18:41 ID:???
スペルミスとか。
603Name_Not_Found:2005/10/13(木) 17:12:06 ID:???
web.archive.orgやalexaでhomepage2.nifty.comなど一部のドメインがブロックされてる模様。
604Name_Not_Found:2005/10/14(金) 10:22:56 ID:???
blocked site error
605Name_Not_Found:2005/11/12(土) 15:41:29 ID:7prfaJLI
         ,. -─‐- 、
         , '´        ヽ
       /  /ヽ\     ヽ
     /  /   `、 \ ヽ   ゙,
      .i   i     ヽ、`ヽ、 \ ',
     i   !.  ==、  `ヽ、`ヽ、!
     |  l丁 ̄ ̄`i-f´ ̄`ヽ、ヽ !
     |  !.ヽ --‐'  `ー‐一1ヽi
     |  i     i  丶   ! ,'
      !  !    `ー '"   ,' i      ホームページのダウンロードや印刷は禁止します
     i  /ヽ    ー一'  /ヽ、!       アーカイブも禁止します
       V   \ ,、     .// ヽ 、_
  .r'"´ ̄ |.   /,へっ‐'" /  i  ``'‐- 、
 /  / | / く★へ ,. へ、. l         ヽ
./   ⌒ /     /`)   ヽ/        i
606Name_Not_Found:2006/01/12(木) 16:40:19 ID:5QN9UFCO
dobai
607Name_Not_Found:2006/01/14(土) 11:27:45 ID:aiwZtVb5
あどふぃ
武運
608Name_Not_Found:2006/01/16(月) 23:49:28 ID:???
このスレ初めて読んだ。

まあWebArchiveだとかGoogleCacheだとか嫌がる人はいるだろうなとは想像できるけど、
ネットに公開している以上そんなの気にしていられない、というのが個人的感想。

はっきり言って、世の中の大半の人にとっては
俺たちが過去にどんなサイトを作っていたのかなんて全く興味ないわけで。
なんだかとっても自意識過剰っていう感じ。
609Name_Not_Found:2006/01/17(火) 00:04:03 ID:???
>>608
同意。問題は著作権なんだよな。
転載みたいなものだし…
610608:2006/01/17(火) 01:28:35 ID:???
>>609
URLで出所が明示されているわけだし転載じゃなくて引用でしょ。
引用は著作権的にOKだから問題ないと思うけど。
611Name_Not_Found:2006/01/17(火) 12:02:53 ID:???
自分のサイト内の該当ページを既に削除していたとしても、
検索エンジンに該当ページがキャッシュとして残っていた場合、
そのキャッシュが原因で企業からヤバイ警告とか来ますか?
612Name_Not_Found:2006/01/17(火) 15:58:58 ID:???
Googleのキャッシュはまだしも、Webarchiveみたいに自分が削除しても半永久的に残るのは嫌。
613Name_Not_Found:2006/01/20(金) 06:54:27 ID:???
>>610
日本の法律での引用の条件を満たさないので、引用とはみなされない。
出典の明示だけじゃなくていろいろ条件があるから調べてみれ。

普通に考えれば、まるごと転載して「引用です」なんて通るわけがないわな。
614609:2006/01/20(金) 17:56:51 ID:???
>>610
あれは、引用ではなくて「まるごと転載」…。
転載も出典を表示してれば問題ない…ということはない。

613も言ってるように、引用と転載はまるっきり違う。
615Name_Not_Found:2006/01/21(土) 19:59:15 ID:u1WfF9rt
Yahoo!検索の[ウェブ検索]で利用しているインデックスクローラー(検索エンジン用ロボット)は
Yahoo! Inc.が管理、運営しています。なお、Yahoo! JAPANでは個別のサイトや検索結果に表示
される内容について削除のご依頼をいただいても、依頼内容の正当性や、削除権限の有無を確か
めることができないため、ご依頼を受け付けておりません。
http://help.yahoo.co.jp/help/jp/search/indexing/indexing-12.html

ってあるんだけど404を返すdeadlinkについては正当性も糞もないよね
プライバシー上の理由で早急に削除しないといけない場合もあるのに
これはきつい
616Name_Not_Found:2006/01/21(土) 20:10:39 ID:???
キャッシュ(アーカイブ=書庫)って何のためにあるの?
リソースが削除されても見れるように?
617Name_Not_Found:2006/01/21(土) 20:14:27 ID:u1WfF9rt
そうそう……
でも一応「次回のクロール時にnot foundなら削除」とは書いてあるのね
で、いつ次回のクロールが来るかはyahooが決めるわけ
これっておかしくない?
その文書の著作権者がcacheも管理すべき
618Name_Not_Found:2006/01/23(月) 06:46:29 ID:???
ファイル自体を消すより内容を空白に書き換えたほうが
実質的に速くキャッシュから消せるということ?
619Name_Not_Found:2006/01/23(月) 15:30:09 ID:???
全然違う
620Name_Not_Found:2006/01/24(火) 14:49:29 ID:+15fj1G5
昔作っていたHPがググルのキャッシュに残っている事を知り、
今日の朝、緊急で削除申請したらキャッシュは無事削除された・・・
でもまだ検索結果にページタイトルと以前ページに書いてた文章が表示されるんだよね
この表示結果も削除したいんだけどどうすればいいの?
621Name_Not_Found:2006/01/24(火) 15:13:08 ID:???
もっと待て。
それから、過去を隠すな、女々しいゾ。
622Name_Not_Found:2006/01/24(火) 18:53:57 ID:???
女々しいとかそういう問題じゃないだろ?
なんでそういう根性論精神論に持ってく馬鹿ばっかなんだろう
やってらんないね
623Name_Not_Found:2006/01/24(火) 19:42:55 ID:???
冗談のわからん奴よな。>>75既出。
624Name_Not_Found:2006/01/24(火) 20:29:40 ID:???
既出ってか自分の書き込みだろw
625Name_Not_Found:2006/01/25(水) 17:00:48 ID:???
>>624 いまさら何を。女々しいぞ、ト。
626Name_Not_Found:2006/01/26(木) 04:48:19 ID:???
差別語を連呼
627Name_Not_Found:2006/01/28(土) 14:07:20 ID:???
キ○ガイさんはスルー。
議論もできない腰抜けか
どっちが女々しいんだか
628Name_Not_Found:2006/02/13(月) 06:10:27 ID:???
>>615
告訴しろ。前例を作るのだ。
629Name_Not_Found:2006/02/27(月) 18:01:28 ID:???
でらえもん調査局の話しようぜ
630Name_Not_Found:2006/03/04(土) 19:03:01 ID:???
         ,. -─‐- 、
         , '´        ヽ
       /  /ヽ\     ヽ
     /  /   `、 \ ヽ   ゙,
      .i   i     ヽ、`ヽ、 \ ',
     i   !.  ==、  `ヽ、`ヽ、!
     |  l丁 ̄ ̄`i-f´ ̄`ヽ、ヽ !
     |  !.ヽ --‐'  `ー‐一1ヽi
     |  i     i  丶   ! ,'
      !  !    `ー '"   ,' i      ホームページのダウンロードや印刷は禁止します
     i  /ヽ    ー一'  /ヽ、!       アーカイブも禁止します
       V   \ ,、     .// ヽ 、_       法律は糞くらえだ俺が嫌だと言っている
  .r'"´ ̄ |.   /,へっ‐'" /  i  ``'‐- 、
 /  / | / く★へ ,. へ、. l         ヽ
./   ⌒ /     /`)   ヽ/        i
631Name_Not_Found:2006/03/20(月) 13:10:38 ID:fAWO+d9M
アーカイブ使えばフラッシュ取り放題だぜー
632Name_Not_Found:2006/04/23(日) 16:38:55 ID:???
ぅーん…。
ずっとこのままなのかな?
嫌って思う人の方が多いんだったら、
アドレス入れて削除ボタン押したら削除できるように…

とか、しなきゃいけなくなると思うんだけどなぁ〜…

Archive.orgとかの存在を知ってる人が増えるほど…
読まれたくない・読まれて嫌な思いをした…って人も増えるし…

「消したくなったら消せるから」って気持ちだって、大事にしてあげよう?
633Name_Not_Found:2006/04/23(日) 17:13:45 ID:???
>嫌って思う人の方が多いんだったら、
>アドレス入れて削除ボタン押したら削除できるように…

はっきり言って気にしてる奴は圧倒的に少ないと思われ。
ネットに公開する時点でそんなの気にしてられん。

まあ、

>「消したくなったら消せるから」って気持ちだって、大事にしてあげよう?

この意見には賛成だけどね。
保存されない自由というのもあって然るべきだとは思う。

ただしそうなると本人の確認手段が必要になるね。
サイトを持ってる段階ではその主張もできるけど(GoogleSitemapのようなチェックで)
サイトを消した後での本人確認は非常に難しいわけで。

それらを考えていくと結局、
archiveとしてとっておくメリット>archiveを消すメリット
になってしまうんだと思うよ。企業側からすれば。
634Name_Not_Found:2006/05/24(水) 18:38:25 ID:RLRAkZWR
ドバイ
635Name_Not_Found:2006/05/24(水) 21:45:24 ID:???
載せたなら消すな
消すなら載せるな
636Name_Not_Found:2006/05/31(水) 18:34:46 ID:XWp1MCwY
Wayback Machine 止まってる?
637Name_Not_Found:2006/06/01(木) 10:37:04 ID:XDJ6fNww
たぶん
使えないと不便
638Name_Not_Found:2006/06/01(木) 10:52:08 ID:???
Page not found
We’re sorry, the page you have requested is not available.
639Name_Not_Found:2006/06/02(金) 07:41:47 ID:???
やはりそうか
早く復旧しないかな
640Name_Not_Found:2006/06/04(日) 00:25:58 ID:???
>>636-639
復活したようだ
641Name_Not_Found:2006/06/04(日) 00:39:18 ID:???
>>640
見られるページと見られないページに分かれてないか?
見られるページも文字化けばかりだし見られないページは開いても真っ白だし
642Name_Not_Found:2006/06/06(火) 11:29:43 ID:???
文字化けは、エンコードを日本語にしてやれば読めた。
しかし、たしかに前はそんな手間は要らなかったな。
643Name_Not_Found:2006/06/06(火) 23:17:26 ID:???
Robots.txt置いてもう2週間経つけどWayback Machineからまだ消えない・・・
8週間以内に本当に消えますか?
644Name_Not_Found:2006/06/07(水) 00:36:43 ID:???
載せたなら消すな
消すなら載せるな
645Name_Not_Found:2006/06/20(火) 06:54:14 ID:???
今、Wayback Machine 止まっている?
しれとも他の人はアクセスできてる?
646Name_Not_Found:2006/07/05(水) 16:35:26 ID:???
今、止まってますね。“HTTP 400”になるよ。
http://web.archive.org/collections/web/advanced.html
647Name_Not_Found:2006/07/05(水) 21:31:26 ID:???
英語できる人強制的にUTF-8にすんなってフォーラムに書いてきて
648Name_Not_Found:2006/07/06(木) 06:41:01 ID:C+JEbk+S
Googleのキャッシュ死んでね?
649Name_Not_Found:2006/07/09(日) 22:13:08 ID:???
【ネット】すでに閉鎖された貴重なホームページ、国会図書館で10日から利用可能に
http://news19.2ch.net/test/read.cgi/newsplus/1152443555/
650Name_Not_Found:2006/07/29(土) 20:02:14 ID:???
>>642
リンク開く度に文字化けするね
651Name_Not_Found:2006/08/21(月) 16:19:07 ID:gH4KSLoP
webarchive見られないぞ!?止まってんの???
652Name_Not_Found:2006/08/21(月) 16:37:20 ID:c635FeOr
最近調子悪いな
653Name_Not_Found:2006/08/22(火) 05:34:43 ID:???
そうなんだ。そのまま消滅してくれても構わんっていうか、消えて
しまえと思うことが時々あるけどなw
654Name_Not_Found:2006/08/22(火) 21:27:01 ID:???
誰かgoogleに有用な検索ワード入れてコピって
このページはグーグルのキャッシュのキャッシュです。
っていうのやらないか?

最近のgoogleは広告多いし、検索精度落ちてる気がする。
655Name_Not_Found:2006/08/24(木) 11:34:28 ID:???
>>654
「googleは広告多いし、検索精度落ちてる」以上、そのキャッシュもいずれ
精度が落ちるね。
なので、グーグルのキャッシュのキャッシュのキャッシュが必要になる罠。
656Name_Not_Found:2006/09/30(土) 10:23:26 ID:d4gTnwcg
Google検索っておかしくないか。。。w
「php」で検索してすぐに”国境なき医師団日本”だの”FM802”ってw
657Name_Not_Found:2006/10/03(火) 23:22:36 ID:???
なんかGoogleからメールが来た。
robots.txtがあるからクロールできないので、クロールできるように書き換えてくれって。
いや、クロールされたくないからrobots.txt置いてるんだけど。
658Name_Not_Found:2006/10/03(火) 23:44:34 ID:???
まじで?Googleからそんなメールが本当に来るんか・・・?詳しくきぼん
659Name_Not_Found:2006/10/04(水) 19:45:20 ID:???
件名: Google インデックス登録お願い

こんにちは、お客様のサーバーでは robots.txt ファイルを使って検索エンジン
からのアクセスを制御しているため、現在、Google では、お客様のサイトをク
ロールすることができません。 そのため、携帯電話をお使いのユーザーが、
Google を使ってお客様のサイトを見つけることができません。 インターネット
ユーザーの大多数は Google を使用して検索を行っており、検索エンジンからの
参照のうち 50 % 以上は Google からの参照です。 Google の使命は、Google
独自の検索エンジンにより、世界中の情報へのアクセスを可能にし、ウェブ上の
検索経験をより実りのあるものにすることです。 Google では、ユーザーや顧客
がお客様のサイトを簡単に検索できるようお客様のサイト
xxx.xxx.co.jp を Google のインデックスに登録したいと考えて
おります。 Google からのクロールを許可していただける場合は、robots.txt
ファイルに次の行を追加していただくようお願いいたします。 User-agent:
GooglebotDisallow: クロールを許可していていただいてから 4 〜 6 週間後に、
Google のインデックスにお客様のサイトが登録されます。 Google のインデッ
クスにお客様のサイトを登録する方法の詳細については、下記の URL をご覧く
ださい。http://www.google.co.jp/webmasters/. Google がお客様のサイトをよ
り効率良くクロールするようにするには、サイトマップを作成することをお勧め
します。 詳細については、下記の URL をご覧ください。
http://www.google.com/webmasters/sitemaps/docs/ja/about.html今後とも
Google をよろしくお願いいたします。今後、Google インデックスへの登録に関
するメールが不要な場合は、メールにてご連絡ください。お客様のメール アド
レスを Google のメーリング リストより削除いたします。ChrisGoogle クロー
ラーチーム



このメールアドレスは、以前サイトの削除依頼(インデックスからの)を
したときに使ったもので、その時リストに登録されたのかも。
ただ、依頼したサイトと今回のサイトは違うところなんだが。
サイトもメールアドレスもinfoseekのものなので、そっち絡みかもしれん。
660Name_Not_Found:2006/10/04(水) 22:02:53 ID:???
ひぇ〜 検索される価値のあるサイトってことか…
661Name_Not_Found:2006/10/04(水) 22:06:48 ID:???
ネタだよ、ネタ。
今は、英語による回答のみだよ。
662Name_Not_Found:2006/10/04(水) 22:19:29 ID:???
Googleは高度な機械化がモットーなのに、そんなメールを送信してるとでも?
663Name_Not_Found:2006/10/04(水) 23:48:12 ID:???
ノリ悪いなw
664Name_Not_Found:2006/10/11(水) 18:42:42 ID:???
自分もそのメール来たよ。移転跡地とはいえクロールしてほしくないから
放置してたら、返事の催促メールみたいなのも来た。
今回メールの対象になってるアドレスがinfoseekなんだが、やっぱり
>>659の言うようにinfoseek関連なんだろうかね?
665Name_Not_Found:2006/10/14(土) 19:24:53 ID:???
666Name_Not_Found:2006/10/28(土) 20:10:15 ID:???
>>587
Internet Archiveに何としても削除させたい奴は行動を取れ。
うちは口調の厳しい英文で数回抗議して削除させた。
90年代の、METAタグでアーカイブ除けをしてなかった頃のページをな。
相手は横柄な外人だ。
生易しい「お願い」では無視される。
多少厳しい口調で抗議しても一回目は
「ようジャップお前本当にそのサイトの管理人か?」とからかわんばかりの返事が来た。
うちは昔から無断転載禁止と明記していたので
「何勝手に載せてんだこれが読めねぇのかゴルァさっさと消せ」という意味の抗議文を送ってやっと削除された。
667Name_Not_Found:2006/10/28(土) 21:19:01 ID:???
>>666
よっぽど残されてほしくないコンテンツ持ってたんだな。

>>1-665
みんなで集団突撃してウェブ魚拓潰そう!
668Name_Not_Found:2006/10/28(土) 21:35:50 ID:???
>>630
ネタレスなんだけどスレ住人の総意はマジそれだよな
669Name_Not_Found:2006/10/30(月) 11:35:23 ID:???
魚拓ってBasic認証下のページって取れるの?
670Name_Not_Found:2006/11/05(日) 18:19:55 ID:??? BE:793166459-2BP(0)
age
671Name_Not_Found:2006/11/22(水) 23:39:58 ID:zcCiYH1d
検索はして欲しいんだけどキャッシュは表示しないで欲しいんだ
robots.txtでNOARCHIVEと同等の設定ってできないのかな
672Name_Not_Found:2006/11/23(木) 00:11:55 ID:eZeUCLRG
         ,. -─‐- 、
         , '´        ヽ
       /  /ヽ\     ヽ
     /  /   `、 \ ヽ   ゙,
      .i   i     ヽ、`ヽ、 \ ',
     i   !.  ==、  `ヽ、`ヽ、!
     |  l丁 ̄ ̄`i-f´ ̄`ヽ、ヽ !
     |  !.ヽ --‐'  `ー‐一1ヽi
     |  i     i  丶   ! ,'
      !  !    `ー '"   ,' i      ホームページのダウンロードや印刷は禁止します
     i  /ヽ    ー一'  /ヽ、!       アーカイブも禁止します
       V   \ ,、     .// ヽ 、_       法律は糞くらえだ俺が嫌だと言っている
  .r'"´ ̄ |.   /,へっ‐'" /  i  ``'‐- 、
 /  / | / く★へ ,. へ、. l         ヽ
./   ⌒ /     /`)   ヽ/        i
673Name_Not_Found:2006/11/23(木) 02:15:32 ID:???
>>669
htaccessが効いていたので、多分取れないとオモ。
674Name_Not_Found:2006/11/25(土) 04:23:09 ID:nj0PJAEF
<meta name=”robots” content=”noindex,nofollow”>

<meta name="Robots" content="NoArchive">

ここでは下段のメタタグが上げられていますが、
上段のタグとの違いは何でしょうか。

http://www.archive.org/web/web.php
また、上記でアーカイブされちゃっているページを削除願う方法を
どなたか伝授下さい。
675Name_Not_Found:2006/11/27(月) 01:22:45 ID:2xMnqAKU
>>674
別スレに書いてあるよ
676Name_Not_Found:2006/12/09(土) 02:29:41 ID:???
InternetArchiveにしつこくメールしてやっと消してもらえた。
>>666を参考に毅然と。
OK Robots.txt置いてありますねーわかりましたそのうち消しますね
的な返事が来て、でもいつまで経っても消されないからまたメール送る
→そのうち消しますねーという返事→メール送る→返事→・・・
を4,5回繰り返した。
[email protected] じゃなくて [email protected] にメールしたら
やっと消してもらえるっぽい対応の返事が来た
(でも送るアドレス変えたことが本当に対応してもらえるきっかけだったかどうかはわからない)
>>666みたいなの、そのサイトの管理人だと証明しろっていう内容
証明方法は自鯖にそのサイトの管理人でありArchiveから早く削除しろってtxtをうp
今は解約しちゃってもううpできない古いサイトも一緒に消してもらいたかったんで
「解約しちゃったから証明文うpできないけど、古いサイトに書いてある管理人名も
 今のサイトの管理人名も一緒でしょ」って説明したらわかってもらえたらしく削除成功
677Name_Not_Found:2007/01/07(日) 00:01:32 ID:???
>>676
日本語でおk?
678Name_Not_Found:2007/01/07(日) 00:33:15 ID:???
なんでそんなに過去を消したがるのか、理解に苦しむ。
679Name_Not_Found:2007/01/10(水) 09:25:04 ID:???
>>677
英語で。メール内容はこんなかんじのを送りつけた
翻訳エンジンで英語にしたものそのまま貼り付けただけだけど

私のサイトデータを消しなさい
二度とクロールするな
Robots.txtを置いたから早く見ろ
出来る限り早く削除しろ
680Name_Not_Found:2007/01/12(金) 22:39:28 ID:T/oe9OZb
so-netってRobots置けないんだけど、これがインデックスされない原因かな?
681Name_Not_Found:2007/01/14(日) 11:23:40 ID:???
>>680
インデックスされないのと、 robots.txt は関係ない。
682Name_Not_Found:2007/01/22(月) 09:29:10 ID:???
私のサイトデータを消しなさい
二度とクロールするな
Robots.txtを置いたから早く見ろ
出来る限り早く削除しろ
683Name_Not_Found:2007/02/07(水) 00:48:24 ID:hRhfg3VX
>>678
本人に無断で、しかも商用で使われてるのが気にいらないだけ。しかも公にも公表してない。
過去を消す云々はどうでもいい。

一言「あなたのサイトを保存して半永久的に商用に利用していいですか?」
というメールがこれば少しは納得するかもな。
でも答えは「No」だがな。
684Name_Not_Found:2007/03/14(水) 20:58:48 ID:DbBA7I/r
削除依頼送ったがどの程度で返信が来るのやら。
685Name_Not_Found:2007/03/14(水) 21:46:19 ID:???
>>683
つまり>>672と言いたいわけだね。
686Name_Not_Found:2007/04/01(日) 23:28:42 ID:aRFJeamt
激しくすれ違いだけど他にアーカイブスレがないので、ここで聞かせてください。
ウェブアーカイブで検索結果のうらるに「sr_nr_」を反映させるには、
フォームタグ内にどんなvalue= name= を既述したらいいのかなあ(´・ω・`)
687Name_Not_Found:2007/04/01(日) 23:38:00 ID:???
日本語でおk
688Name_Not_Found:2007/04/01(日) 23:45:00 ID:???
>>688
スマソ(´・ω・`)
689Name_Not_Found:2007/04/08(日) 19:02:58 ID:???
>>686>>688
自己解決しました(´・ω・`)
690Name_Not_Found:2007/05/09(水) 13:04:56 ID:???
marsflag.comとかいうリファラが残っててクロールされてることを知ったが
こいつを拒否する方法がさっぱり分からん。
サイトにも拒否方法はまったく書いてないし、偽装してるのかアクセスログからもそれらしき物が見つからない。
とりあえずリファラを弾いておいたが、何か知っている人いたら情報求む。
691Name_Not_Found:2007/05/09(水) 21:49:21 ID:???
ttps://www.marsflag.com/contact/other.html
各種お問い合わせ その他
MARS FLAG では、たくさんのご利用者様からのご意見などの
お問い合わせを受け付けております。 お気軽にお問い合わせください。
692Name_Not_Found:2007/05/17(木) 21:00:40 ID:???
IPで弾け
693Name_Not_Found:2007/06/18(月) 17:49:46 ID:TbINCN0g
>>一言「あなたのサイトを保存して半永久的に商用に利用していいですか?」
>>というメールがこれば少しは納得するかもな。
>>でも答えは「No」だがな

↑ 
ギャグです。
笑ってあげてください。
694Name_Not_Found:2007/06/18(月) 18:53:22 ID:???
にはは
695Name_Not_Found:2007/06/18(月) 20:38:27 ID:???
>>693
>>一言「あなたのサイトを保存して半永久的に商用に利用していいですか?」
コンテンツを金で売る企業があるのか。
2chのdatなら買ってやってもいいがw
696Name_Not_Found:2007/06/20(水) 02:20:51 ID:???
勝手にいい加減なタグを書き加えてデタラメなHTMLにされるのが嫌だからnoarchiveしてる。
そんなくだらない理由で?って思われるだろうけどね。
697Name_Not_Found:2007/07/18(水) 22:33:31 ID:iOvf6p4K
うん、思う。
神経質っていうか病的って言うか、キモい。
698Name_Not_Found:2007/07/19(木) 00:06:01 ID:???
世間じゃGoogle八分にされたとか喚いてる人もいるが・・・

robots.txtで拒否し、NOINDEXと書いてても、Googlebot君は熱心に
巡回に来ては、検索結果に載る俺のサイト。。。
699Name_Not_Found:2007/07/22(日) 15:46:42 ID:???
>>698
うちもそう。いくらrobots.txtで拒否、NOINDEXと書いてもスルー。
あらゆる検索エンジンに登録されまくり。index削除をお願いしても無視。

もう、.htaccessしかないね。
でも近いうちにGoogleにだけは弾くのを止めるつもり。検索エンジンの中では
もっともタグ指定に素直だし更新頻度も早く、アクセスして欲しいキーワードで
きっちりと上位に来るから。

ぐぐれは最強やね。
700Name_Not_Found:2007/07/22(日) 16:25:36 ID:???
うちも。
いちおう、noarchiveが効いているのか、キャッシュはされないし
titleの表示やbodyのダイジェストは表示されないものの、
きっちり検索結果に載る・indexはされている んだよなぁ。謎。
701Name_Not_Found:2007/08/12(日) 00:37:02 ID:qMvVwwmB
ウェブ魚拓うぜえな
702Name_Not_Found:2007/08/12(日) 03:51:14 ID:???
前弾き方を紹介してるサイトを見つけたんだけどなくなってるみたいだから転載
やり方メモっておいただけなんでほんとうにこれで弾けるかどうかは知らない


利用しているサイトのディレクトリトップに、
こういった名前のファイルをまず作る。

.htaccess

これが何かはとりあえず無視しておいてくれ。
ファイルの内容に以下の文を記述する。

Deny From 216.237.124. 59.106.19.92

少し幅を取っているが、
これで魚拓されなくなる。
少し解説しておこう。
.htaccessとはApacheというWebサーバのディレクトリ単位の設定ファイル。
さくらインターネットの様なレンタルサーバを使っている場合、
大体これが搭載されている。
703Name_Not_Found:2007/08/12(日) 03:53:58 ID:???
Deny Fromというのは
「ここからのアクセスは禁止しますリスト」のことで、
IPアドレスやドメイン名を指定することが出来る。
SPAMを排除したりする場合に利用される。
まぁ、ようするに「ウェブ魚拓」をSPAMリストに入れるって事だ。
ウェブ魚拓のIPアドレスは
216.237.124.114
その他のサービスは
59.106.19.92
で行っているようだ。

59.106.19.92はさくらインターネットのアドレスのようなので、
苦情はさくらインターネットにした方が良いかもしれない。
「〜がやっているサービスで迷惑してます」的な内容をさくらインターネットに送ってあげると良い。
704Name_Not_Found:2007/08/12(日) 04:10:42 ID:???
igWebCapもウゼェ。baiduやnaverより酷い。
705Name_Not_Found:2007/08/12(日) 07:51:23 ID:???
そして「ニコニコブックマークうぜえ」とは誰も言わないのが2ch的だなw
706Name_Not_Found:2007/08/13(月) 01:31:11 ID:???
そもそも存在感がない
707Name_Not_Found:2007/08/16(木) 02:58:53 ID:S/Pi5JeB
marsflag 怖ぇよ。文面1,2行しか出てこない。
画面のキャプからは、元の文面なんか当然読み取れない。
利用者勘違いするって。

で、登録の削除を依頼しようとすると、名前だのメールアカウントだの要求してくんのな。
708Name_Not_Found:2007/08/16(木) 10:00:23 ID:???
robots.txtもmeta(noindex,nofollow,noarchive)も無視しておいて
利用者向けにはごちゃごちゃと規制を掲げてやがるし、まじウザイよな。
709Name_Not_Found:2007/08/16(木) 10:14:23 ID:NLv7PFsp
俺の心境はまさしく>>672だわ。
ブラウザでの閲覧以外認めたくないし、手元に残されたくもない。

つかみんなで魚拓潰さない?
どうでもいい大容量のページの魚拓とらせまくってディスク浪費させるのはどうよ。
710Name_Not_Found:2007/08/16(木) 19:54:32 ID:???
marsflagの足跡を確認している人、IPを報告してもらえたら助かる。
そうすれば禁止できるIP範囲を把握できると思うから。

ウチはまだ形跡が無いんで協力できないが…。
711Name_Not_Found:2007/08/17(金) 17:08:51 ID:4OFyLBfX
【くやしいのう】  はだしのゲン公式サイトがグーグル八分  【ギギギ…】
http://news23.2ch.net/test/read.cgi/news/1187336779/

はだしのゲン公式サイトがグーグル八分?

「くやしいのう。くやしいのう。」で有名な(っていうか、原作読んだこと無い)、「はだしのゲン」の
公式サイトがグーグル八分されているらしい。
http://www.kamatatokyo.com/home.html

調べてみると確かに検索にはヒットしないし、「サーバーの設定でキャッシュを禁止」するなど、
技術的にGoogleに嫌われる要素も存在しないようだ。グーグル八分表示は出ないが、アメリカ
Googleで検索しても表示されないため、全世界グーグル八分が行われている可能性がある。
すなわち、それは「アメリカの法律に反している」ということを意味する。
原爆の悲惨さを伝えるのは、アメリカでは違法なのかな?
http://beyond.cocolog-nifty.com/akutoku/2007/08/post_4be4.html

「はだしのゲン」でググった結果は↓
http://www.google.co.jp/search?hl=ja&q=%E3%81%AF%E3%81%A0%E3%81%97%E3%81%AE%E3%82%B2%E3%83%B3&btnG=%E6%A4%9C%E7%B4%A2&lr=
712Name_Not_Found:2007/08/18(土) 04:57:10 ID:???
とりあえず「Google 宛に送られた法的要請に応じ(ry」の文面は出ないっぽいな
713Name_Not_Found:2007/08/18(土) 15:30:18 ID:???
うちが使ってるWeb魚拓弾きおいとくわ

#Web魚拓
deny from 216.237.112.0/12
714Name_Not_Found:2007/08/20(月) 10:08:12 ID:???
>>710
marsflagにアーカイブされているのを見つけたんでアクセスログを漁ったが
特定が出来なかった。どうもほかのbotみたく特徴的なHost名やUA吐いては
居ない気がする。画像じゃなく普通にページのキャッシュを閲覧できるのなら
ページに埋め込んでいるunix timeで特定できたんだがな・・・・
715Name_Not_Found:2007/08/26(日) 19:26:22 ID:f5wQWLb9
質問です。
/index.php?page=1, 同page=2, 同page=3 ...というURLのファイルをrobots.txtで拒否するとき、
「pageではじまる全てを拒否する」ように指定するには、どう書いたらよいでしょうか?

全てのjpgファイルならば、
User-agent: *
Disallow: /*.jpg$
でよいようですが、それとも一つ一つ書くしかないのでしょうか?
716Name_Not_Found:2007/08/26(日) 19:42:06 ID:???
METAタグ書けば?
717Name_Not_Found:2007/08/26(日) 20:05:24 ID:f5wQWLb9
レスどうもです。やはり正規表現ではできませんか。
meta要素でも一つ一つ書いていくしかないような?
718Name_Not_Found:2007/08/26(日) 20:30:56 ID:???
鯖設定で弾いた方が早そうだ。
719Name_Not_Found:2007/08/26(日) 20:33:45 ID:???
>>715
Googleのロボットは、

User-agent: Googlebot
Disallow: /*.jpg$

は理解できるはずだよ。
だけど、ロボット全部に対応するなら、htaccessの方がいいと思う。
720Name_Not_Found:2007/08/26(日) 21:22:52 ID:f5wQWLb9
>>718
あ、たしかに。

思えばphpで吐いてるんだから、meta要素を挿入するのもそんな手間でもないんでした…
721Name_Not_Found:2007/08/26(日) 21:30:29 ID:???
困ったらなんでも仕様書見るといいですよん。
http://www.robotstxt.org/wc/robots.html
見れば分かるけど、こった事なんて全然出来ない。正規表現やワイルドカードだって
規定されてない。
http://www.robotstxt.org/wc/norobots-rfc.html
ってのも有るけど提案のレベルらしい(1997年に提出された案なのにその段階
にとどまっているという事は…)。
W3Cのまとめた物もある。
http://www.w3.org/TR/1999/REC-html401-19991224/appendix/notes.html#h-B.4.1.1


正規表現は現状Googlebot独自ルール状態。更にrobots.txtは紳士協定なので
従わないbotだってゴマンといる。.htaccessで処理した方が早いと思うよ。

Googleだけで良いのなら、Googlebotの解説を読めばよろし。
http://www.google.co.jp/support/webmasters/bin/topic.py?topic=8843
あなたの例なら以下の記法でいけます(実際ウチは似たような設定で成功している)。

User-agent: Googlebot
Disallow: /index.php?page=*
722Name_Not_Found:2007/08/28(火) 23:50:02 ID:???
googleに限って言えば、
sitemap生成してるんなら、あとは全部ブロックしてもよくね?
723Name_Not_Found:2007/08/28(火) 23:56:03 ID:???
全部ブロックしたらクローリング出来ないじゃん
724Name_Not_Found:2007/08/28(火) 23:58:52 ID:???
ああ、sitemapも獲れんかw
725Name_Not_Found:2007/08/29(水) 00:55:45 ID:???
バカスw
726Name_Not_Found:2007/08/30(木) 08:06:16 ID:???
User-agent: ia_archiver
Disallow: /
727Name_Not_Found:2007/09/05(水) 01:34:42 ID:???
http://web.archive.org/ が、昨日からずっとつながらないよ。どうしたんだ一体。
……と思ったら、たったいま復活した。
728Name_Not_Found:2007/09/22(土) 02:56:03 ID:???
このところ接続悪いな。 http://web.archive.org/
729Name_Not_Found:2007/09/22(土) 19:19:32 ID:???
検索避け支援wiki
http://www34.atwiki.jp/norobot/
730Name_Not_Found:2007/10/15(月) 22:36:54 ID:dzVJS6LE
162 名前: ekken [[email protected]] 投稿日: 2007/07/18(水) 12:38:17 ID:eO6yKRYW
いいじゃないか
アンタらのブログはアクセス数にこたわらなければならないほど、立派なないようなのか?

↓コイツ、バカだねぇ

70 名前: 名無しさん@八周年 投稿日: 2007/07/18(水) 12:31:04 ID:wL1uswPu0
http://ibuling.blogspot.com/

2007年7月14日
Googleの広告審査能力は0に等しいのね(´・ω・)

名もなきネット人狙い撃ちで陰口を叩き、独り悦に入る魂の障害者、それがekken
時流に乗った新興産業の個担当者部分に媚を売り、おこぼれに預かろうとするコバンザメネット業者、それがekken
現在ネット上には八百萬のekkenがいる…

投稿者 ? 場所 16:52

つーことで、 どいつもこいつも
http://d.hatena.ne.jp/mobanama/20070911#p1
http://18.dtiblog.com/n/nekora/file/22362134.htm
http://d.hatena.ne.jp/kana-kana_ceo/mobile?date=20070928
http://homer2007.blog86.fc2.com/
http://ahonosatoshi.blog82.fc2.com/
http://3.dtiblog.com/h/homer2006/file/21470389.htm

自らはブログサービス提供はおろかパーツひとつ貸し出しもせず、登録者がオール他社サービスで作成したブログ記事をPING送信させて広告掲載頁に表示し座したまま広告収入を得、
ひとたび広告に対する苦情がでるや広告元を悪者にしていい子になり、更にはうっとうしいスパムメールを送りつけるだけでは飽き足らず自らの管理義務の一部を登録者に押し付けた挙句、権限濫用で都合のいいように頁を改竄し外面をよくして新規登録者を誘い、
あまつさえ無料サービスだと大威張りで恩を着せる「にほんブログ村」ことムラウチドットコム。

匿名であろうと実名であろうと、図々しい人が得をする。
731Name_Not_Found:2007/10/25(木) 00:52:55 ID:oli8Gpf6


俺はグーグルADを踏まないように、

↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓

C:\WINDOWS\system32\drivers\etc\hosts

hosts をメモ帳で開く

127.0.0.1 localhost
0.0.0.0 pagead2.googlesyndication.com

保存

↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑

ってしてんだけど、みんなは?


もちろん、TV新聞雑誌に広告を出してる会社は
何か悪いことをしてるから口封じにアドを使って
糞カスゴミ・広告代理店に献金してるんだと思うよ。

732Name_Not_Found:2007/10/26(金) 23:29:40 ID:???
ttp://web.archive.org/collections/web.html
これにキャッシュとられっちゃったらもう消す方法ないですか??
733Name_Not_Found:2007/10/27(土) 17:40:57 ID:???
robots.txtで消える
734Name_Not_Found:2007/10/27(土) 19:14:58 ID:???
キャッシュ取られたサイトはもうないんです・・・
735Name_Not_Found:2007/10/27(土) 21:07:59 ID:???
諦めるがよい
736Name_Not_Found:2007/10/27(土) 21:57:33 ID:???
このサイトって管理人にメール送れないんですかね・・・
737Name_Not_Found:2007/11/13(火) 05:13:58 ID:???
サイト作るときは必ず<meta name="Robots" content="NoArchive">入れてる
738Name_Not_Found:2007/11/13(火) 06:24:21 ID:???
         ,. -─‐- 、
         , '´        ヽ
       /  /ヽ\     ヽ
     /  /   `、 \ ヽ   ゙,
      .i   i     ヽ、`ヽ、 \ ',
     i   !.  ==、  `ヽ、`ヽ、!
     |  l丁 ̄ ̄`i-f´ ̄`ヽ、ヽ !
     |  !.ヽ --‐'  `ー‐一1ヽi
     |  i     i  丶   ! ,'
      !  !    `ー '"   ,' i      ホームページのダウンロードや印刷は禁止します
     i  /ヽ    ー一'  /ヽ、!       アーカイブも禁止します
       V   \ ,、     .// ヽ 、_       法律は糞くらえだ俺が嫌だと言っている
  .r'"´ ̄ |.   /,へっ‐'" /  i  ``'‐- 、
 /  / | / く★へ ,. へ、. l         ヽ
./   ⌒ /     /`)   ヽ/        i

元ネタよくわからんがいい言葉だよね。
739Name_Not_Found:2007/11/13(火) 10:26:12 ID:uNh/ZiIw
裏ワザ?バグ?Googleで検索した画像が踊りだす技
http://news.ameba.jp/hl/2007/11/8504.html
740Name_Not_Found:2007/11/14(水) 18:38:29 ID:???
何がバグだwwwwwwwwwwwwwwwwwwww
741Name_Not_Found:2007/11/14(水) 21:41:38 ID:W9+BbGvR
教えてください。
インターネットの、過去に消されたページを見ることができるらしいいのですが、
その方法を教えてください。
アドレスをどうすれば、そのアドレスの過去を見ることができるのでしょうか?
742Name_Not_Found:2007/11/14(水) 21:59:18 ID:???
スレチ
743Name_Not_Found:2007/11/16(金) 21:07:33 ID:???
744Name_Not_Found:2007/11/17(土) 10:36:48 ID:???
アンチアーカイブスレで何紹介してんだw
745Name_Not_Found:2007/11/18(日) 10:52:38 ID:???
ここInternet Archiveの話題もおK?

削除済みの古いコンテンツ拾われてたの気付いて
慌ててロボテキ入れたら、無料鯖だけどすぐブロックされてほっとした
それはよかったけど、半年くらい置いてサイトごと削除したら
またキャッシュ復活しちゃうんだろうか?
746Name_Not_Found:2007/11/20(火) 12:43:10 ID:???
>>745
他板に専用スレがある。

Internet Archive総合 (web.archive.org) #1
http://pc11.2ch.net/test/read.cgi/esite/1189771222/
747Name_Not_Found:2008/01/21(月) 14:38:46 ID:Uj+n6EGk
ウェブアーカイブというサイトで、
昔消えたサイトを復元できますが、それをされないようにサイトを作ることはできますか?

HPの製作者が消した後なら、
ウェブアーカイブに残らない、なんてことを聞いたこともありますが、
そんなことありえないですよね?
あるいは、文字化けして、どっちみち見れないようなものとして表示される、
とも聞きましたが、それも間違いですよね?
748Name_Not_Found:2008/01/21(月) 19:53:47 ID:???
>747
なんですぐ一つ上のレスも読めないのかと。
さすがGK。
749Name_Not_Found:2008/01/23(水) 13:24:48 ID:sYWQkDAr
任豚きめえ
750Name_Not_Found:2008/02/10(日) 10:26:57 ID:???
↓対策はスレ違いですか?
ttp://www.existingproof.jp/
751Name_Not_Found:2008/02/13(水) 23:18:14 ID:???
>>738
ちょwオサレ先生www

元ネタは、ジャンプ連載漫画「ブリーチ」の作者が、
Webサイトで絵を公開してたときの日記。

>法律もウェッブルールもクソ喰らえだ。 俺が嫌だと言ってる。

少し改変されてるな。
752Name_Not_Found:2008/02/14(木) 09:50:30 ID:???
>>750
ウェブ魚拓臭漂うサービスだね
リモートホスト:www.existingproof.jp
IP:210.250.55.120
UA:Java/1.5.0_11
キャッシュする時にこれらを吐いてくるからdenyするとよろし
リファラは吐かなかった
753Name_Not_Found:2008/02/25(月) 05:55:52 ID:???
ウェブ魚拓も>>750のところも自分の所は保存できなくしてるな
754Name_Not_Found:2008/03/10(月) 23:38:28 ID:???
検索避けwikiが死んどる
755Name_Not_Found:2008/03/30(日) 21:45:26 ID:???
webarchiveさー、robots.txt置いて、何度もクローラー読み込ませてるのに
普通に過去のデータが出るんですけど…
たまにRobots.txt Query Exclusion.が出るだけで…

なんなんだこのサイト運営してる連中は…?
本人確認できないと削除しないとか…

サーバ契約延長期限ギリギリに気づいてよかった…
756Name_Not_Found:2008/03/31(月) 19:30:43 ID:dPBuO0MW
魚拓のFAQに、

(1) 以下のMETAタグをHEADタグ内に書く
<meta name="robots" content="noindex,nofollow">

(2) ルートディレクトリにrobots.txtを設置して、"Megalodon"が取得不可能なパスを指定する
なお、robots.txtはキャッシュしておりますので、変更が反映されるまで長くて3日かかります。

って書いてあるんだが、


---------------------------
User-agent: Megalodon
Disallow: /
---------------------------

これで弾けると思う?
てか、魚拓のUAって一定だったっけ?

魚拓はじきの情報が載ってるのって、検索避け支援WIKIだけだったからな……
757Name_Not_Found:2008/03/31(月) 19:33:29 ID:dPBuO0MW
しかしむかつくのは、レンタルブログなどの場合、ロボテキもHTACCESSも設置出来ないから、
メタタグを仕込むことになるけれど、(1)のタグだと他のまともな検索エンジンまで巻き添えで
弾くことになっちゃうじゃないか。どんだけ悪質なんだよ魚拓。
758Name_Not_Found:2008/03/31(月) 20:23:13 ID:???
>>756
ちょとと違う話だが、

ルートディレクトリをさわる権限が無くrobots.txtはおけず、Google等には
indexされて欲しいけど、魚拓は拒否りたい…って場合でも

<meta name="robots" content="noindex,nofollow,noarchive">

しか受け付けてくれないんだよなぁ。

<meta name="Megalodon" content="noindex,nofollow,noarchive">

に対応して欲しいが、問い合わせも無視され中。
759Name_Not_Found:2008/04/01(火) 21:03:57 ID:???
>>758
deny from 216.98.130.25
deny from 216.98.130.26
deny from 71.6.145.82
deny from 71.6.145.92

今はこれで弾けるみたい
760Name_Not_Found:2008/04/01(火) 21:09:48 ID:???
ごめん、>>756に対してだった
ちなみにウチにくる魚拓はFirefoxを偽装してくるんだがこんなもんなのか?
761Name_Not_Found:2008/04/02(水) 02:50:39 ID:???
>>759
.htaccess使えればいいんだけどねぇ
762Name_Not_Found:2008/04/02(水) 18:39:19 ID:???
>>755
削除してもらえよ
763Name_Not_Found:2008/04/02(水) 20:26:40 ID:???
>>762
日本語でおk
764Name_Not_Found:2008/04/02(水) 23:02:44 ID:???
>763
削除依頼メール出して手動で削除してもらえって意味だろ。
日本語でおkって返すほどのレスじゃない。
765Name_Not_Found:2008/04/02(水) 23:31:37 ID:???
>>755 本人確認できないと削除しないとか…
766Name_Not_Found:2008/04/03(木) 22:01:25 ID:???
サーバ契約中なら削除できるぞ
767Name_Not_Found:2008/04/03(木) 22:11:57 ID:???
768Name_Not_Found:2008/05/01(木) 11:20:45 ID:???
OrgName: Google Inc.
OrgID: GOGL
Address: 1600 Amphitheatre Parkway
City: Mountain View
StateProv: CA
PostalCode: 94043
Country: US

NetRange: 66.249.64.0 - 66.249.95.255
CIDR: 66.249.64.0/19
NetName: GOOGLE
NetHandle: NET-66-249-64-0-1
Parent: NET-66-0-0-0-0
NetType: Direct Allocation
NameServer: NS1.GOOGLE.COM
NameServer: NS2.GOOGLE.COM
NameServer: NS3.GOOGLE.COM
NameServer: NS4.GOOGLE.COM
Comment:
RegDate: 2004-03-05
Updated: 2007-04-10

OrgTechHandle: ZG39-ARIN
OrgTechName: Google Inc.
OrgTechPhone: +1-650-318-0200
OrgTechEmail: [email protected]

# ARIN WHOIS database, last updated 2008-04-30 19:10
# Enter ? for additional hints on searching ARIN's WHOIS database.
769Name_Not_Found:2008/05/01(木) 23:24:47 ID:???
http://bookmarks.yahoo.co.jp/promo-about

Myブックマークをほかの利用者に公開することもできるので、情報・知識を共有でき、新しい発見が生まれる!
770Name_Not_Found:2008/05/08(木) 15:32:46 ID:0YC6zoKl
魚拓みたいなのをとられるのが嫌でこんかい初めてrobots.txtなるものを
自サイトにも上げて、とりあえずウェブ魚拓からのアクセスは禁止にしたん
だけど、他に似たようなサイトはどんなのがありますか?

そういうの嫌いなんで片っ端から拒否したいんですけど、よければ
みなさんのrobots.txtの設定を教えてくださいませんか。
771Name_Not_Found:2008/05/09(金) 18:17:06 ID:???
>>770
もううざいから拒否型じゃなく許可型にしてる
どうせgoogle.yahoo,msぐらいだからな
772Name_Not_Found:2008/05/10(土) 01:29:57 ID:???
ものすごく本末転倒感が
773Name_Not_Found:2008/05/11(日) 20:18:23 ID:IfKUE9t9
ブログで魚拓を拒否するにはどんなタグを入力したら良いんでしょうか?
普通のサイトみたいにrobots.txtをアップロードするというやりかたができないので
よくわからなくてちょっと困ってます。
774Name_Not_Found:2008/05/12(月) 20:42:53 ID:???
noindex
775Name_Not_Found:2008/05/16(金) 22:44:27 ID:???
>>771-772
Basic認証にする方が手間かからなくていいよね
776Name_Not_Found:2008/05/28(水) 22:18:24 ID:???
「ウェブ魚拓」に音声投稿機能、「音声を証拠として残すために」
ttp://internet.watch.impress.co.jp/cda/news/2008/05/28/19728.html

懲りない連中だ
777Name_Not_Found:2008/06/03(火) 09:49:15 ID:???
「丸ごと」はGoogleやYahooなどの検索エンジンのキャッシュと同レベルの強さしかありません。
それらのキャッシュと同様に、「インターネットに公開されているコンテンツは、より広く知られることを望まれているはずだ」という
暗黙の前提のもとに無断利用しているだけなので、本人から削除依頼が来たら原則的に削除しなくてはなりません。

「引用」はそうではありません。
「引用する」で取得する場合の「範囲を絞る」「特定のリンク元からのアクセスでしか表示しない」は、日本の著作権法を
考慮して本人から削除依頼が来ても合法的に削除を断れるように考えられています。
どうすれば魚拓を削除せずに済むのかを考えて作った機能なので、ぜひ利用していただきたいです。

あまりにも素敵過ぎるQ&Aに( ゚д゚)ポカーン
778Name_Not_Found:2008/06/03(火) 15:17:54 ID:???
>>777
その手の物言いしてると、民事じゃなくていきなり刑事でやられるかもね。
779Name_Not_Found:2008/06/03(火) 20:51:52 ID:???
魚拓の中の人って、きっと過去に

おっと、誰か来たようだ。
780Name_Not_Found:2008/06/04(水) 05:42:26 ID:???
ページの丸ごと転載やら音声のアップロードやら、鬱陶しいことばかりしてるな
ところで魚拓の中の人のブログが昔はあった気がするんだが誰か知らない?
781Name_Not_Found:2008/06/04(水) 10:44:37 ID:???
要領の悪い、いじめられっこだった。てとこか?
782Name_Not_Found:2008/06/04(水) 22:30:20 ID:???
         ,. -─‐- 、
         , '´        ヽ
       /  /ヽ\     ヽ
     /  /   `、 \ ヽ   ゙,
      .i   i     ヽ、`ヽ、 \ ',
     i   !.  ==、  `ヽ、`ヽ、!
     |  l丁 ̄ ̄`i-f´ ̄`ヽ、ヽ !
     |  !.ヽ --‐'  `ー‐一1ヽi
     |  i     i  丶   ! ,'
      !  !    `ー '"   ,' i      ホームページのダウンロードや印刷は禁止します
     i  /ヽ    ー一'  /ヽ、!       アーカイブも禁止します
       V   \ ,、     .// ヽ 、_       法律は糞くらえだ俺が嫌だと言っている
  .r'"´ ̄ |.   /,へっ‐'" /  i  ``'‐- 、
 /  / | / く★へ ,. へ、. l         ヽ
./   ⌒ /     /`)   ヽ/        i

師匠に100%同意!!!
783Name_Not_Found:2008/06/13(金) 10:53:28 ID:yvKvBp/F
http://www.netart.jp/homuhen/gyotaku.htm

ウェブ魚拓回避回避ってのがあったんだけど
よくわからん
784Name_Not_Found:2008/06/13(金) 11:19:34 ID:???
引用には要件があるからそれを満たしてないと引用にすらならんのに。
一部だけを抽出したものは引用とはいわんだろ。

質的にも量的にも、引用先が「主」、引用部分が「従」の関係にあること。
引用を独立してそれだけの作品として使用することはできない。
785Name_Not_Found:2008/06/13(金) 11:29:01 ID:???
利用規約とかに作者のお人柄がにじみ出ているようですねw
これ使うとホム変というところに過去の作品としてURLが晒されるんだな

netart.jp
202.172.28.53
s52.coreserver.jp
202.172.28.53

これだけdenyすれば弾けると思うけど確信は無い
弾けるか試してみようにも、自分のサイトのURLが晒されるからなんか嫌だな・・・
786Name_Not_Found:2008/06/13(金) 12:45:20 ID:???
魚拓がやってる丸ごとと引用は実質一緒だけどな。

引用っていったって引用部分だけ外部に提供してるからただの部分転載。
引用ってのなら引用してる部分も含めて保存しないと引用にならん。
787Name_Not_Found:2008/06/13(金) 13:28:25 ID:??? BE:1431788696-BRZ(11184)
>>785
202.172.28.53で間違いないぽいよ。
http://www.netart.jp/homuhen/proxy-402.htm

あとこのタグで回避できるって
<meta name='manko' content='chinko'>

あほw
788Name_Not_Found:2008/06/13(金) 18:36:08 ID:???
おまいらtumblrはどうでもいいのか
789Name_Not_Found:2008/06/13(金) 20:57:19 ID:???
>>787
確認ありがとうございます。引き続きアク禁リストに加えておく事にします。
このサービスは放置していてもあまり害は無さそうだが、作者の言葉が癇に障るから好きになれんよ。
790Name_Not_Found:2008/06/15(日) 05:02:33 ID:???
.htaccess使用不可&robots.txt置けないブログやってる
リファラにWebarchiveがあって見に行ったらうちのサイトはまだアーカイブされてなかった

<meta name="Robots" content="NoArchive">

メタタグこう入れてるんだけど大丈夫ですよね?
791Name_Not_Found:2008/07/09(水) 14:10:26 ID:???
>>790
<META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW,NOARCHIVE">
にしたほうが良い。
三つの効果があり、それに普通は大文字だ。
792Name_Not_Found:2008/07/09(水) 17:36:27 ID:hnNIe0ml
インターネット・アーカイブに保存された、自分の昔のHPを削除できる方法があるなら、
教えてください。
また、保存されたのが今も続いているHPなら、HTMLにロボット禁止のタグを入れると、
削除できると聞きましたが、それは可能ですか?
793Name_Not_Found:2008/07/09(水) 19:30:45 ID:???
過去ログ嫁
794Name_Not_Found:2008/07/09(水) 20:57:11 ID:hnNIe0ml
>>793
具体的なレスはありませんよ?
795Name_Not_Found:2008/07/09(水) 21:13:31 ID:???
>>794
あるじゃねーかよハゲ。読まないで無いとか言ってんじゃねーよ。
796Name_Not_Found:2008/07/09(水) 21:17:17 ID:???
dat落ちの前スレとかっていうならまだしも(その場合でも読める仕組みはあるし)
現スレ内で何度か出てるわけで、現スレくらいはちゃんと読んでくださいね。
797Name_Not_Found:2008/07/10(木) 00:22:06 ID:oBfVO//6
>>795 >>796
いや、それを訊いて、結局答えになっていないレスはありますが、
実際に解決したレスは無いでしょう。
798Name_Not_Found:2008/07/10(木) 00:34:28 ID:???
メタタグを入れると削除されるのでは?
そうレスにあるはずですが。

解決していないのは、一度キャッシュされたウェブをロボット拒否で消しても、
そのサイトを消すと、また以前にキャッシュされた内容が保存されてしまう、
という問題でしたね。
799Name_Not_Found:2008/07/10(木) 00:56:18 ID:???
>>797
あるっつーの。グタグタ言ってないで頭から読み返せクソ野郎
800Name_Not_Found:2008/07/10(木) 01:02:57 ID:???
<META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW,NOARCHIVE">
を入れるとキャッシュなどを拒否できるらしいですが、
これを入れておくと、以前にアーカイブなどに保存されたものも消えるのでしょうか?
そのような話を聞いたのですが、どうなのでしょうか?
801Name_Not_Found:2008/07/10(木) 01:04:44 ID:oBfVO//6
617 :Name_Not_Found:2006/01/21(土) 20:14:27 ID:u1WfF9rt
そうそう……
でも一応「次回のクロール時にnot foundなら削除」とは書いてあるのね



↑もう削除してから7年以上経っても消えていないサイトがありますよ。
802Name_Not_Found:2008/07/10(木) 01:12:20 ID:oBfVO//6
<META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW,NOARCHIVE">
を入れるとキャッシュなどを拒否できるらしいですが、
これを入れておくと、以前にアーカイブなどに保存されたものも消えるのでしょうか?
そのような話を聞いたのですが、どうなのでしょうか?

保存されたのを消す方法があれば教えてください
803Name_Not_Found:2008/07/10(木) 01:18:23 ID:???
>>801
インターネット・アーカイブの話を振ってたくせに、
なんでヤフーに関するレスを引っ張ってきてんだよ、おまえ。
真性の間抜けだったのか。付き合いきれんわ。
804Name_Not_Found:2008/07/10(木) 01:19:21 ID:???
>>802
過 去 ロ グ 嫁

終了。ウザイから二度と書き込むんじゃねークソが。氏ね
805Name_Not_Found:2008/07/10(木) 01:26:32 ID:oBfVO//6
>>804
読みました。
メールで削除要請するしかない、ということですか?
タグ挿入でどうにかならないのでしょうか?
806Name_Not_Found:2008/07/10(木) 02:01:06 ID:???
グーグルは削除されたページを何年でも出し続けますよ
インデックス数の水増しのためでしょうけど
更新されたページでもキャッシュはほとんど変えません

もし自分のブログに変なこと書いてしまったら
グーグルが永久に出し続けます
その後訂正してもグーグルは訂正してくれません

あなたが取り消したい記事であればあるほど
グーグルは残そうとします
グーグルはサイトオーナーの評価が最も低くなるような形で検索結果を操作しています

実際ググればわかりますが他人をほめるような記事は絶対に上に出てきません
ネガティブなキーワードを優先的に拾うなどしているのでしょう
807Name_Not_Found:2008/07/10(木) 02:26:42 ID:???
妄想乙w
808Name_Not_Found:2008/07/10(木) 02:37:58 ID:???
>>806
やっぱりそうか!
俺も漠然とそう思ってた
809Name_Not_Found:2008/07/10(木) 03:15:28 ID:???
このスレの水面下にあった結論を>>806が見事表現してくれた
ありがd

グーグル工作員の態度の悪さもムカツク
810Name_Not_Found:2008/07/10(木) 03:50:59 ID:V66zTRw3
>>809
誰が見ても自作自演の自己レスすんなw
811Name_Not_Found:2008/07/10(木) 04:22:31 ID:???
と必死な工作員なのでした

俺も>>806に禿同
812Name_Not_Found:2008/07/10(木) 12:49:01 ID:???
ここはアーカイブが嫌いな人が集まるスレなんだから、
802のような質問には真剣に答えるのが当然だろう。
813Name_Not_Found:2008/07/10(木) 13:02:34 ID:???
質問する前に過去ログを確認したり、ググるのが当然なのでは?
安易に訊いて、簡単に教えて貰おうとする姿勢が透けて見えるから
答えてもらえないんだと思うけれど・・・。
814Name_Not_Found:2008/07/10(木) 13:12:27 ID:???
んだ
815Name_Not_Found:2008/07/10(木) 13:41:04 ID:???
何言ってんのクソ工作員
べつに安易に聞いたっていいじゃん
知ってる人がいたらそのほうが早い

だいいちググれと言われてググるほどみんなバカじゃない
環境変数グーグル社に持ってかれるから
ここに書き込む奴はそのくらいわかってるよ
816Name_Not_Found:2008/07/10(木) 13:47:58 ID:???
>>815
仮に知ってたとして、何でお前に教えてやらなきゃいけねーの?
お前の検索ワードをググルに持っていかれようが、
こっちの知ったことじゃないんだが。
817Name_Not_Found:2008/07/10(木) 14:14:08 ID:???
顔真っ赤にしてやがる。おもすれーww
818Name_Not_Found:2008/07/10(木) 14:16:04 ID:???
>>815
ゆでダコだなw
16歳以上だとしたら哀れみを感じずにいられない
819Name_Not_Found:2008/07/10(木) 14:25:10 ID:???
だから答える気もないなら書き込むなよクソ工作員
820Name_Not_Found:2008/07/10(木) 14:31:50 ID:???
火病?
821Name_Not_Found:2008/07/10(木) 14:32:15 ID:???
工作員だ何だと決め付けて煽るだけの奴も逝けよ。

インターネットアーカイブはキャッシュされる前に対策するのが当たり前。
ちなみにmetaに書いただけですぐに消える保証なんて当然ない。
メールで連絡を試みても依然とは比べ物にならんほど対応も遅い。
822Name_Not_Found:2008/07/10(木) 15:05:48 ID:???
工作員だなんだ言ってるやつが、答えをもらえない質問者でしょ
823Name_Not_Found:2008/07/10(木) 16:14:02 ID:???
いいから答える気もないなら書き込むなクズ
824Name_Not_Found:2008/07/10(木) 16:20:22 ID:???
なんで急に荒れたかというと>>802が本質を突いてしまったからだ
グーグルは絶対にアーカイブは消さない
一時的に非表示にすることはあっても決して消さない

だから態度の悪いグーグル工作員と思しき奴も>>802に答えられないし
必死に話をそらそうとしている

>>806が正しい
もし消えないなら東京地裁に著作権侵害を訴えて掲載削除の仮処分申請をするといい
(グーグル日本法人の本社は東京都渋谷区)
825Name_Not_Found:2008/07/10(木) 16:23:54 ID:???
826Name_Not_Found:2008/07/10(木) 16:29:37 ID:???
マジかよ
鬼畜犯罪企業Googleイラネ
827Name_Not_Found:2008/07/10(木) 16:32:42 ID:???
http://pc11.2ch.net/test/read.cgi/hp/1212507582/

378 :Name_Not_Found:2008/07/08(火) 16:10:17 ID:???
社長逮捕に工作員が反応したのかw
でも実際に著作権者がyoutubeの件で刑事告訴したらグーグルは終わりだろ
Winnyの作者は営利でやってなかったけどグーグルは営利企業だからさらに悪質

今のところは事後的に金払って揉み消してるけどあくまで事後的になw
ホント薄汚い企業だよ

そのうち金額で折り合いが付かなくなって大事になるぞw

389 :Name_Not_Found:2008/07/08(火) 23:01:27 ID:bS5+vImF
違法サイトと違法動画がないと潰れてしまうグーグルって哀れだ・・・
828Name_Not_Found:2008/07/10(木) 16:39:04 ID:???
Internet Archiveの話なのかGoogleキャッシュについての相談なのか
そもそも>>802はどっちなん?
829802:2008/07/10(木) 23:32:12 ID:???
>>828
どっちもです。
とにかく、過去に保存されたのを消したいんです。
830Name_Not_Found:2008/07/11(金) 01:55:46 ID:???
>>829
だから法的手続を執るしかないんだって
グーグルはそういう会社

他のアーカイブは気にしなくていいよ
グーグルが出しさえしなければ事実上何の問題もない
とにかくグーグルが諸悪の根源だからよく覚えておくように
831Name_Not_Found:2008/07/11(金) 02:31:41 ID:???
とりあえずGoogleの方はキャッシュされたのと同じファイル名で
特に意味のない内容のファイルを生成しなおしてうpしてはどうか。

キャッシュが新しい無意味な内容のに切り替われば目的は達成できるんじゃね。
832Name_Not_Found:2008/07/11(金) 03:09:32 ID:w8KgCjVv
ねーよw
いくら無意味な内容に切り換えても無視されるだけ

グーグルはあくまで誰かにとって都合の悪い記事を残そうとする
そういうふうにアルゴリズムができている
しかもネガティブなキーワードを拾うだけでなく
社員が絶えず見て回ってネガティブな記事を残そうと努力している

だからこそ他社と比べて上位が圧倒的な中傷記事で占められる
上に書いてあるように法的措置をとるしかない
833Name_Not_Found:2008/07/11(金) 03:23:27 ID:???
だからいまだに『ケンタッキー』でゴキブリがあんなに出るのか。。。
今ググって来たが相変わらず酷いもんだ
834Name_Not_Found:2008/07/11(金) 03:27:12 ID:???
例えば、レンタル掲示板にスレを立てられて誹謗中傷されたり
個人情報を晒された場合、掲示板の鯖管の判断でスレが削除
されても、そのスレは検索にヒットし続けて、キャッシュで中身も
見れると言う事?
835Name_Not_Found:2008/07/11(金) 07:21:08 ID:???
802はグーグル叩きじゃなくてなんとかする方法やアイディアを希望してるんだと思うのだが
836802:2008/07/11(金) 11:41:01 ID:mt6qWS6t
831さんのを試すと良さそうですね。

でも、ロボットを禁止にしておけば、
次に回ってきたときにキャッシュが消えるのではないのでしょうか?
837802:2008/07/11(金) 11:42:04 ID:mt6qWS6t
>>835
そうです。ただ自分のキャッシュを消したいだけです。
838Name_Not_Found:2008/07/11(金) 14:23:31 ID:???
削除リクエストじゃだめなの?
839Name_Not_Found:2008/07/11(金) 14:36:51 ID:???
禁止しただけじゃ消えないことも。
その辺は試してみればわかる。
840Name_Not_Found:2008/07/11(金) 14:48:30 ID:???
>>834
まさにその通り
被害者が大量にいるからこれだけグーグルが叩かれる
841Name_Not_Found:2008/07/11(金) 14:51:35 ID:???
>>837-838
5年以上前に消えたページもGoogleでは平気でヒットするぜ
まず消せないと思え
842802:2008/07/11(金) 15:03:57 ID:mt6qWS6t
831さんの方法だとどうでしょうか?
843Name_Not_Found:2008/07/11(金) 15:14:31 ID:???
Googleの場合は、既に自分の管理下に無いサイト(アドレス)なら別だが、
管理下にあるサイトならWebmaster tools使えば、自力で削除等可能だね。
844Name_Not_Found:2008/07/11(金) 15:41:08 ID:VH/OWixD
ダメなんだなそれがw
845Name_Not_Found:2008/07/11(金) 16:36:07 ID:???
とりあえず>>802はやれそうな対策から試せや
846Name_Not_Found:2008/07/11(金) 17:52:22 ID:???
>>844
なんでだよ、おれんとこ消せるよ。
847Name_Not_Found:2008/07/11(金) 19:11:24 ID:???
グーグルは個人情報も消さないしな
848Name_Not_Found:2008/07/11(金) 20:11:08 ID:???
843で消せるよな。
844は釣り
849Name_Not_Found:2008/07/12(土) 20:03:51 ID:pD8MPyEZ
http://mamono.2ch.net/test/read.cgi/newsplus/1215743862/l50

【毎日・変態報道】「robots.txt」で、毎日新聞英語版が「Web引きこもり」設定中
1 名前: 窓際店長見習φ ★ 投稿日: 2008/07/11(金) 11:37:42 ID:???0
 熱が収まるどころか、ネットではますます盛り上がってしまっている、毎日新聞の低俗英語
サイト問題。「Mainichi Daily News」で削除済みの「WaiWai」のWebページには、メタタグに
「hentai」とあったものだから、「毎日変態新聞」との表現もネットで頻繁に見かける。問題の
記事については、毎日新聞は訂正することなく、Webサイトから完全に削除してしまったため
に、ネットユーザーには証拠隠滅と映り、反感をますます買ってしまった。念の入ったことに、
検索エンジンがWebページを収集する「ロボット」の動きをコントロールする「robots.txt」にも、
「User-agent: *」「Disallow: /」と、すべてを拒否する設定が書き込まれている。タイムスタンプを
見ると、6月27日の深夜に書き換えたことになっている。この記述がどういう意味なのか、Google
の説明が詳しい。つまり、MainichiDaily Newsはどこで検索しても結果に表れない、引きこもり
状態なのだ。ただし、2行の間に不要な空行が入っているため、設定が有効かどうかは怪しい。
robots.txtはブックマークするようなファイルではないのだけれど、はてなブックマークでは、
人気の「IT戦士」を取り上げた日刊サイゾーの記事を超えるブックマーク数になっている。

http://internet.watch.impress.co.jp/static/yajiuma/2008/07/10/
850Name_Not_Found:2008/07/13(日) 09:40:29 ID:???
このスレにある魚拓対策をhtaccessに書いて、全文取得をブロックすることはできたんだが、
引用とかいうふざけた機能はブロックできない。
一部とかいって、ページ単位ならほぼ全部保存することができるし。
これをブロックできている人いるかな?
851Name_Not_Found:2008/07/13(日) 09:55:04 ID:???
robots.txtじゃなくて.htaccessで魚拓のIPとかドメインを拒否しててダメなの?
852Name_Not_Found:2008/07/13(日) 13:20:28 ID:???
>>759で弾けるんじゃない?
853Name_Not_Found:2008/07/14(月) 12:39:42 ID:kdnYWebS
グーグルはキャッシュの更新はほとんど行わないから
どんなツール使っても無駄ですよ
854Name_Not_Found:2008/07/14(月) 12:50:52 ID:???
キャッシュの削除指定もWebmaster toolsで。

すでに存在しない(管理下を離れた)サイトだったら_
855Name_Not_Found:2008/07/14(月) 23:25:01 ID:???
サイト閉鎖したって著作権あるんだぜ
犯罪企業グーグルさんよぉ

勝手に使うんじゃねーよ
あ?
856Name_Not_Found:2008/07/14(月) 23:31:22 ID:???
ネット弁慶さん、ようこそ^^
857Name_Not_Found:2008/07/15(火) 04:58:00 ID:Y8KbqON6
つまりグーグルは過去に存在したページだと嘘を言えば
どんなデマ情報もキャッシュの名目でばらまくことが出来るわけだな

しかしこんだけネットで嫌われてよくやってられるなw
858Name_Not_Found:2008/07/15(火) 06:36:40 ID:???
サイト管理者が表示したくないからページを削除したのに
グーグルが勝手にキャッシュに出し続けるってのは
犯罪なんじゃないの?

どうよこの犯罪体質のグーグル社
米国でも裁判起こされまくってるし
859Name_Not_Found:2008/07/15(火) 06:49:24 ID:???
>>858
ここはキャッシュ対策を話し合うスレであって
グーグルに対する恨み辛みをぶちまけるスレではない。

よそでやれ。
860Name_Not_Found:2008/07/15(火) 08:26:38 ID:???
>>859
スレタイよく見やがれ池沼
861Name_Not_Found:2008/07/15(火) 09:12:55 ID:???
ネット弁慶さん、ようこそ^^
862Name_Not_Found:2008/07/15(火) 09:22:25 ID:aQVV+EP4
グーグルではトップページに表示されても
クズサイトに囲まれてるからぜんぜん来てくれないんだよな

むしろサイトオーナーに迷惑かけてるんだから
ページ使用料と損害賠償金を払ってほしいよな

特にキャッシュを残すというのであれば
不特定多数への配布が可能になるわけだから
書籍に換算して最低十万部くらいの値段をサイトオーナーに払うべきだね

他の検索エンジンは無料で構わないよ
むしろ宣伝になるから有り難い
863Name_Not_Found:2008/07/15(火) 09:47:45 ID:???
こんなところで喚いて満足なら安いものだね。Googleは痛くも痒くもなかろう。
864Name_Not_Found:2008/07/15(火) 10:32:54 ID:???
>>860
スレタイよく見やがれ池沼
865Name_Not_Found:2008/07/15(火) 11:39:03 ID:???
>>862
さっさと訴訟すれば?
866Name_Not_Found:2008/07/15(火) 14:00:50 ID:???
少額訴訟なら個人でも簡単に起こせるんだから、ぜひやってよ。
画期的な前例となるよ。
世界からも注目されると思う。
867Name_Not_Found:2008/07/15(火) 14:54:58 ID:/KYu37tl
つーかグーグル掲載拒否しているサイト大杉だろw
だからこそゴミサイトばかり出てくるわけで
868Name_Not_Found:2008/07/15(火) 15:19:35 ID:???
グーグルって典型的なネット弁慶だと思ってたけどどうやら違うみたいだな
>>865-866見ると相当追い詰められて弱気になっていることがわかるw
869Name_Not_Found:2008/07/15(火) 16:59:27 ID:???
>>868
ネット弁慶の意味が分からないなら使うなよw
870Name_Not_Found:2008/07/15(火) 18:02:25 ID:???
ワラ
871Name_Not_Found:2008/07/15(火) 20:59:51 ID:???
俺持ってるサイト全部NOARCHIVEだが
872Name_Not_Found:2008/07/15(火) 23:57:49 ID:???
簡単なBasic認証での制限もしないで、そういう紳士協定に依存して、違反したらファビョって…なんなんだよそれ。
873Name_Not_Found:2008/07/16(水) 00:02:13 ID:???
>>872
そんな制限したらせっかく来てくれる客に迷惑だろjk
874Name_Not_Found:2008/07/16(水) 00:12:40 ID:???
robots.txtで拒否し、META NOINDEXも書いてても、被リンクがたっぷりある
サイトだと、検索結果の堂々1位を飾ってくれちゃってたよ・・・

ただし、<title>の中の半角アルファベットはすべて小文字になってたり、
NOINDEX,NOSNIPPET同様にダイジェストは載らなかったり、いろいろ半端な
対応だったな・・・
875Name_Not_Found:2008/07/16(水) 13:27:37 ID:Sx+P1pDg
グーグルワロス
いくら人気ページが出ないとまずいからって
手動登録はないだろw
876Name_Not_Found:2008/07/17(木) 00:20:43 ID:???
サイト消した後もずっと残るってのがあれだよな
痛いプロフとか書いてた場合、永遠にそれが全世界に晒され続ける

まあそういうの書いてた奴の自業自得なんだが
877Name_Not_Found:2008/07/17(木) 01:26:37 ID:???
自業自得じゃねえだろ
人の弱みを永久に晒し続けるグーグルこそが異常だと知れ

まあその結果グーグル自身も世界に晒されてるわけだが
こっちはまさに自業自得だなw
878Name_Not_Found:2008/07/17(木) 01:28:32 ID:/eeRgg+n
夏だなぁ
879Name_Not_Found:2008/07/17(木) 02:07:49 ID:???
         ,. -─‐- 、
         , '´        ヽ
       /  /ヽ\     ヽ
     /  /   `、 \ ヽ   ゙,
      .i   i     ヽ、`ヽ、 \ ',
     i   !.  ==、  `ヽ、`ヽ、!
     |  l丁 ̄ ̄`i-f´ ̄`ヽ、ヽ !
     |  !.ヽ --‐'  `ー‐一1ヽi
     |  i     i  丶   ! ,'
      !  !    `ー '"   ,' i      ホームページのダウンロードや印刷は禁止します
     i  /ヽ    ー一'  /ヽ、!       アーカイブも禁止します
       V   \ ,、     .// ヽ 、_       法律は糞くらえだ俺が嫌だと言っている
  .r'"´ ̄ |.   /,へっ‐'" /  i  ``'‐- 、
 /  / | / く★へ ,. へ、. l         ヽ
./   ⌒ /     /`)   ヽ/        i
880Name_Not_Found:2008/07/17(木) 09:19:54 ID:???
いやだから自サイトの使用制限は合法だから

×法律は糞くらえ
○グーグルは糞くらえ
881Name_Not_Found:2008/07/17(木) 10:22:10 ID:???
だよね
リンク禁止だってこっちの管理者の勝手だよね
882Name_Not_Found:2008/07/17(木) 21:07:56 ID:???
教えてください
グーグルにキャッシュされた場合、
キャッシュされても良い内容にHPを書き換えてから、
次にロボットが回ってくると、キャッシュは書き換えたないように変わりますか?

あるいは、次ロボットが回ってくるときにロボット禁止にしていると、
以前にキャッシュされた内容は消えますか?
883Name_Not_Found:2008/07/17(木) 21:18:02 ID:???
>>882
書き換えた内容にキャッシュが更新された事は普通にある。
それ以外については自動では中々消えないかも試練。
自分で色々工夫して結果報告よろ。
884Name_Not_Found:2008/07/17(木) 22:13:11 ID:???
いじりようがない過去のサイトとかじゃないのなら、Webmaster toolsを使うと楽っつーか話が早い。
885882:2008/07/17(木) 22:56:56 ID:???
一応、まとめて質問します。

以前にグーグルにキャッシュされた内容を変えたいのですが、
その場合、ロボットが次に回ってくるまでに内容を書き換えておけば良いのですか?
その場合、ロボットを禁止にしていると、以前にキャッシュされた内容が消えるのか、
あるいはロボットが回ってこずに、以前の内容だけが残ったままなのか、
どちらでしょうか?
886882:2008/07/17(木) 22:57:41 ID:???
>>883
いろいろ試してはみますが・・・

>>884
それも調べてみます
887882:2008/07/17(木) 23:30:39 ID:???
もし885の方法を取る時、
ロボット禁止にして、内容を書き換えた場合、
キャッシュに残るのは以前の内容のままってことになりますか?
一度ロボットに新しいキャッシュを取らせる必要があるのでしょうか?
888Name_Not_Found:2008/07/17(木) 23:32:13 ID:q45JfFv5
クロールはしても更新はしないよ
グーグルはそんな技術力も良心もやる気もない
889Name_Not_Found:2008/07/18(金) 00:01:53 ID:???
とりあえずウェブマスターToolsを使ってみ

ttp://www1.axfc.net/uploader/He/so/120386.png (google)
890882:2008/07/18(金) 11:42:22 ID:???
>>888
無責任ですよね。金儲けの都合でしょうが...

>>889
すいません。検索してますが、その画像のようなページは見つかりません。
ソフトをダウンロードする場所も見つかりませんし、いったいどこでどうするのでしょうか?
初心者ですいません。
891Name_Not_Found:2008/07/18(金) 12:44:39 ID:???
892Name_Not_Found:2008/07/18(金) 15:20:42 ID:???
炎上した発言を揉消すためにアーカイブ反対なわけですね。わかります。
893882:2008/07/18(金) 21:32:14 ID:???
>>891
それのどこに画像のページがあるのでしょうか?
もしかして、登録しなければ駄目ですか?
しかも英語サイトですが・・・
894Name_Not_Found:2008/07/18(金) 21:45:19 ID:dfAmfq1l
グーグルに自分のサイトをキャッシュされてないかどうかを調べるにはどうすればいいですか?
検索欄にアドレスを入れてもページが見つかりません、と出ます。
895Name_Not_Found:2008/07/18(金) 22:01:30 ID:???
>>893
日本語でおk
896Name_Not_Found:2008/07/18(金) 22:02:09 ID:???
>>894
つまりキャッシュもされてない
897882:2008/07/19(土) 01:10:19 ID:???
>>895
以前にアップされたウェブマスターツールの操作画像のページに行けません。
そこに行くまでにはどうすれば良いのでしょうか?
891のサイトでどうすれば?
教えてください・・・
898Name_Not_Found:2008/07/19(土) 01:44:16 ID:???
882が何を言っているのか
教えてください・・・
899Name_Not_Found:2008/07/19(土) 14:26:24 ID:???
                           ヽ
              _,,.,、、,.ィ-- ti- 、、、....,,,,_   ',
         ,,..、、ri':'゙/~   レ     '  ゙ヘ:l : : : :~,>
   _,...r:::''"::/ l/ .l:/-=ニ二,'_ー- 、、   !l!;: r '"
'''<:::::::::::::;、r'          `'' ‐-`.、 /
-、 l::::::::::::l           <"゙'i;ソ'   ',
~.ヽ l:::::::::::l             ~'     '、
/ .) .l::::::::::!                    '、
 ヽ .l:!l:::::l ヽ                  '、
\ '  l! l::!l! ヽ                    ,'
  ゙    ヾ               ‐'" ,. r ゙
ー-‐i               ,.r,,iilll鬚髯ヲ    そんなに何も見えてないんじゃ
.   l            `''' ‐‐ ---t‐'     
 ̄ ̄ ̄ ̄ ̄ ̄~"''、' ‐ 、       ー‐ノ      生きてても面白くないでしょう
             ',  ヽ       l
               l   l       l
              l    l     ノ
900Name_Not_Found:2008/07/19(土) 17:32:30 ID:GXerprWQ
要するにグーグルはサイトオーナーから情報だけ勝手に盗み取って
サイトオーナーの利益を侵害するような使い方をしている犯罪企業ってこと
901Name_Not_Found:2008/07/19(土) 18:30:13 ID:???
Q.
GoogleのキャッシュとYahooのキャッシュの違いを述べよ(文字数は自由)
902Name_Not_Found:2008/07/19(土) 18:52:34 ID:???
答えると何かくれるのか?
903Name_Not_Found:2008/07/19(土) 19:21:03 ID:dbTyQDC4
答えるとグーグル社長の刑期が縮むのか?
904Name_Not_Found:2008/07/19(土) 19:39:24 ID:???
縮みこんでるのは削除されねーと吠えてる奴の玉袋くらいなもんJARO
905Name_Not_Found:2008/07/19(土) 23:23:58 ID:???
ωωω
906Name_Not_Found:2008/07/28(月) 10:46:51 ID:Ha+Fu9pi
他人の著作物を永久に勝手に利用するまでの権利はグーグルにはないぜ
まあ泥棒にはわからねえか
907Name_Not_Found:2008/07/28(月) 13:03:02 ID:???
今日もネット弁慶ご苦労さん
908Name_Not_Found:2008/07/28(月) 23:10:51 ID:???
         ,. -─‐- 、
         , '´        ヽ
       /  /ヽ\     ヽ
     /  /   `、 \ ヽ   ゙,
      .i   i     ヽ、`ヽ、 \ ',
     i   !.  ==、  `ヽ、`ヽ、!
     |  l丁 ̄ ̄`i-f´ ̄`ヽ、ヽ !
     |  !.ヽ --‐'  `ー‐一1ヽi
     |  i     i  丶   ! ,'
      !  !    `ー '"   ,' i      他人の著作物を永久に勝手に利用するまでの権利はグーグルにはないぜ
     i  /ヽ    ー一'  /ヽ、!       まあ泥棒にはわからねえか
       V   \ ,、     .// ヽ 、_       
  .r'"´ ̄ |.   /,へっ‐'" /  i  ``'‐- 、
 /  / | / く★へ ,. へ、. l         ヽ
./   ⌒ /     /`)   ヽ/        i
909Name_Not_Found:2008/07/28(月) 23:47:37 ID:???
(・∀・)ニヤニヤ
910Name_Not_Found:2008/08/04(月) 12:34:07 ID:tNzNVLiz
ヤフーのロボットがFirefoxにUA偽装してくることがある
非常にウザイ
911Name_Not_Found:2008/08/21(木) 13:53:47 ID:F7Evthvn
いまこそ Google に立ち向かおう!
来週あたりから血祭りになるよ。
http://changi.2ch.net/test/read.cgi/ms/1219225690/
912Name_Not_Found:2008/09/14(日) 16:10:02 ID:tpuACtry
うちのサイトなんだけどさ、.htaccessでGoogleとYahooを拒否したんだ。
そしたらどうなったと思う。Googleは素直にクロールするのをやめて消えたんだ。

Yahooはといえば、サイトのURLでアクセスに拒否されたページを取得してる。
おいおいどこまで粘着なんだよ。Yahoo! Japan! ww
913Name_Not_Found:2008/09/17(水) 05:43:22 ID:???
素直にrobots.txtで教えてやれよ
914Name_Not_Found:2008/09/22(月) 13:11:13 ID:???
>>14
おまえのような奴は市役所に勤めて
まな板みたいなオッパイの女とせっせと子作りしていればいいのさ。
915Name_Not_Found:2008/09/22(月) 18:36:15 ID:???
誤爆?
916Name_Not_Found:2008/09/22(月) 19:19:48 ID:???
だって>>14みたいな事言ってたら、他人のメールの内容をスキャンして興味ありそうな広告を表示しようなんてアイデアは実現しないもん。
917Name_Not_Found:2008/09/23(火) 19:10:21 ID:yavOXsmv
そうだな。
918Name_Not_Found:2008/09/23(火) 19:56:18 ID:Sqi/+f5w
有力サイトのオーナーはグーグルにコンテンツ使用料を請求したほうがいいぞ
919Name_Not_Found:2008/09/23(火) 21:47:50 ID:???
100$/ページが最低限だな
920Name_Not_Found:2008/10/30(木) 02:39:25 ID:???
921Name_Not_Found:2008/11/04(火) 23:54:39 ID:gBF9JGWz
紳士協定だから、Googleは何ヵ月か後に有効になったけど、
百度(Baidu)は平気で無視して情報集めてるみたい。
全部、中国からの百度(Baidu)を.htaccessで拒否していたら、
いつの間にか日本にあるサーバでも集め始めた。びっくり!
拒否、拒否・・・
922Name_Not_Found:2008/11/05(水) 09:08:44 ID:???
百度w
923Name_Not_Found:2008/11/05(水) 10:42:06 ID:???
確かに勝手に複製され、許可なく公開しているのはおかしい
世の中の利便性を考えれば、このままでいてほしいけどやっぱりおかしい
924Name_Not_Found:2008/11/18(火) 06:29:41 ID:???
利便性があるのにできないほうがおかしいんだ。
925Name_Not_Found:2008/12/06(土) 23:00:04 ID:???
926Name_Not_Found:2008/12/07(日) 00:30:24 ID:???
Baiduspiderウザすぎ!! ヽ(`Д´)ノ
http://pc11.2ch.net/test/read.cgi/hp/1171240129/
927Name_Not_Found:2009/01/07(水) 21:17:13 ID:???
【中国】グーグルから軍事機密守れ、隠ぺい新技術を開発[01/05]
http://gimpo.2ch.net/test/read.cgi/news4plus/1231112455/

グーグルから軍事機密守れ、隠ぺい新技術を開発―中国
http://headlines.yahoo.co.jp/hl?a=20090105-00000004-rcdc-cn
928性懲りもなく:2009/01/15(木) 00:43:46 ID:sH92gu3g
929Name_Not_Found:2009/02/01(日) 22:23:46 ID:???
魚拓とはてなブックマークアク金にしたら
マジで魚拓もスクリーンショットもブックマークも取れなくなってて笑ったw
魚拓ざまあww

アク金きもちいいわ
930Name_Not_Found:2009/02/04(水) 01:11:24 ID:???
>>929
という香具師に限ってページはパスワードもかけてないんだよな
931Name_Not_Found:2009/02/05(木) 10:30:13 ID:???
魚拓は取られていいことないから徹底的にアクセス禁止するべき

オンラインブックマークとか気持ち悪すぎる
はてなとか犯罪者が出るくらいブックマーク中傷の宝庫だし
932Name_Not_Found:2009/02/05(木) 11:50:23 ID:???
よう腐女子
933Name_Not_Found:2009/02/26(木) 02:57:10 ID:OVH/kr0n
htp://www.yomiuri.co.jp/national/news/20090225-OYT1T00066.htm
http://anchorage.2ch.net/test/read.cgi/bizplus/1235530516/
http://mamono.2ch.net/test/read.cgi/newsplus/1235546684/

ホムペ運営者としても防衛策を強化する必要がありそうだ。
934Name_Not_Found:2009/03/02(月) 21:41:32 ID:???
BackupUrl.com - Create a cached copy of any url!
http://backupurl.com/

こんなのができたみたい。
どうすれば防げるか教えて。
935Name_Not_Found:2009/03/03(火) 08:28:50 ID:???
環境変数を取得するページを取得してみた。
http://backupurl.com/cache/zm2rn7.html
特徴は「UAが空白」(!)、「IPは66.71.253.25」、「それ以外は全く環境変数がない」。
この辺で弾ける条件を絞り込めばいいと思う。IPで弾くのが無難か。
936Name_Not_Found:2009/03/03(火) 10:03:14 ID:???
>>934
認証かけろ
937Name_Not_Found:2009/03/03(火) 10:05:13 ID:???
>>935
0.0.0.0/0 で弾くのがいいな
見られたくない奴には絶対に見られないぞ
938Name_Not_Found:2009/03/04(水) 15:21:58 ID:???
診断くん Ver 0.80a
Home/Feedback/N/Vote

一般的な情報
REMOTE_HOST 66.71.253.25 
REMOTE_ADDR 66.71.253.25 
HTTP_REFERER (none) 
HTTP_ACCEPT . */*
HTTP_HOST . taruo.net
その他の情報
HTTP_CONNECTION . (none) 
判定
66.71.253.25 (66.71.253.25)
判定:プロクシです proxy判定箇所が 1箇所、疑惑点が 0箇所ありました。
漏れ判定:漏れてはいないようです
総合評価:A+

極めて物静かなproxyです。proxy経由であることを示す情報がほとんどありません。
939Name_Not_Found:2009/03/05(木) 04:41:30 ID:???
>>935

deny from 66.71.253.25
でとりあえず防げたみたい。どうもありがとう!
940Name_Not_Found:2009/03/05(木) 10:17:08 ID:???
>>939
まあ、漏れが手でぶっこぬいてうpろだに上げれば防げないがな
941Name_Not_Found:2009/04/24(金) 14:14:40 ID:???
ttp://pc11.2ch.net/test/read.cgi/esite/1189771222/171-

171 名前:98[sage] 投稿日:2009/04/22(水) 21:00:27
>>170
元々キャッシュされてないとか、
robots.txt で撥ねられてたら無理だな。

172 名前:名無しさん@お腹いっぱい。[sage] 投稿日:2009/04/22(水) 22:47:15
robots.txtは地味にうざい

174 名前:名無しさん@お腹いっぱい。[sage] 投稿日:2009/04/23(木) 13:04:52
特に、ページは読めてもファイルが置いてあるところはrobots.txtでブロックされていると目茶苦茶にがっかりする
942Name_Not_Found:2009/04/24(金) 22:21:05 ID:???
Internet Archive総合 (web.archive.org) #1
http://pc11.2ch.net/test/read.cgi/esite/1189771222/
943Name_Not_Found:2009/06/29(月) 21:39:06 ID:G3F3dC2/
944Name_Not_Found:2009/10/06(火) 08:06:39 ID:duqXacb0
945Name_Not_Found:2009/12/08(火) 22:40:25 ID:???
>>814
【ストレージ】MEGAUPLOAD メガ被害者の会【総合】
http://pc11.2ch.net/test/read.cgi/esite/1260002862/20,29

この人?俺質問答えた野郎だけど。
946Name_Not_Found:2009/12/28(月) 10:05:39 ID:???
保守
947Name_Not_Found:2009/12/30(水) 02:37:05 ID:XOW+yb0L
保守
948Name_Not_Found:2010/02/06(土) 03:30:57 ID:So1LXrA4
そもそも、いまのネット空間はアメ公の創作空間。
そのアメ公の空間でアメ公の大きな会社を批判することは無駄。
アメ公空間の創設になんの貢献もできない>>1は身の程を知るべし。
アメ公空間のルールはアメ公が作るのが常識だww
949Name_Not_Found:2010/04/19(月) 23:42:30 ID:???
950Name_Not_Found:2010/05/13(木) 00:00:21 ID:???
951Name_Not_Found:2010/05/14(金) 17:41:09 ID:???
952Name_Not_Found:2010/08/05(木) 21:44:51 ID:???
953Name_Not_Found:2010/09/07(火) 03:03:11 ID:NUgZhqHU
954Name_Not_Found:2010/11/23(火) 01:57:02 ID:???
955Name_Not_Found:2010/11/27(土) 21:54:17 ID:???
956Name_Not_Found:2010/12/16(木) 16:40:35 ID:???
                           ヽ
              _,,.,、、,.ィ-- ti- 、、、....,,,,_   ',
         ,,..、、ri':'゙/~   レ     '  ゙ヘ:l : : : :~,>
   _,...r:::''"::/ l/ .l:/-=ニ二,'_ー- 、、   !l!;: r '"
'''<:::::::::::::;、r'          `'' ‐-`.、 /
-、 l::::::::::::l           <"゙'i;ソ'   ',
~.ヽ l:::::::::::l             ~'     '、
/ .) .l::::::::::!                    '、
 ヽ .l:!l:::::l ヽ                  '、
\ '  l! l::!l! ヽ                    ,'
  ゙    ヾ               ‐'" ,. r ゙  そんなに何も見えてないんじゃ
ー-‐i               ,.r,,iilll鬚髯ヲ   
.   l            `''' ‐‐ ---t‐'     生きてても面白くないでしょう
 ̄ ̄ ̄ ̄ ̄ ̄~"''、' ‐ 、       ー‐ノ
             ',  ヽ       l
               l   l       l
              l    l     ノ  
957Name_Not_Found:2011/01/11(火) 02:02:56 ID:???
2011
958Name_Not_Found:2011/08/26(金) 18:39:20.48 ID:???
959Name_Not_Found:2011/12/23(金) 03:16:37.69 ID:???
960Name_Not_Found:2012/02/03(金) 07:01:03.27 ID:???
>>800
チンレスだけどググルウェブマスターツールでキャッシュ削除。あとは
meta name="robots" content="NOARCHIVE,NOIMAGEINDEX,NOIMAGECLICK,NOSNIPPET"
で今後のキャッシュ拒否、説明文とインスタントプレビュも拒否
がいしゅつならスマソ。
961Name_Not_Found:2012/02/03(金) 07:03:49.00 ID:???
自己レス:NOIMAGEINDEX,NOIMAGECLICKは画像拒否ね。
これで検索結果にインデックスはされるが他は拒否できる。ただし俺の経験だと、
NOSNIPPETを入れると検索は補足検索結果に追いやられてしまうようだ。
962 忍法帖【Lv=12,xxxPT】 :2012/02/11(土) 17:05:58.09 ID:LpnLTdE9
>>960
亀レスや遅レスとはいうが
チンレスってなんだ?

っていうか亀にも限度があるだろw


魚拓
キャッシュ
アーカイブ

ってどう違うの?
963Name_Not_Found:2012/07/15(日) 00:38:11.87 ID:???
964Name_Not_Found:2012/09/14(金) 23:34:52.44 ID:???
965Name_Not_Found:2012/09/15(土) 19:46:25.80 ID:???
創価死ね
創価死ね
創価死ね
創価死ね
創価死ね
創価死ね
創価死ね
創価死ね
創価死ね
創価死ね 
創価死ね 
創価死ね
創価死ね
創価死ね
創価死ね 
創価死ね 
創価死ね
創価死ね
創価死ね
966Name_Not_Found:2012/09/15(土) 19:48:32.75 ID:???
創価死ね
創価死ね
創価死ね
創価死ね
創価死ね
創価死ね
創価死ね
創価死ね
創価死ね
創価死ね
創価死ね
創価死ね
創価死ね
創価死ね
創価死ね
創価死ね
創価死ね
創価死ね
創価死ね
創価死ね
創価死ね 
創価死ね 
967Name_Not_Found:2013/05/23(木) 09:29:19.13 ID:???
a
968Name_Not_Found:2013/06/18(火) 05:22:47.70 ID:FRQJpthd
969Name_Not_Found:2013/08/14(水) NY:AN:NY.AN ID:X3xCgtmp
970Name_Not_Found:2014/08/21(木) 22:56:07.88 ID:???
1408597637176.jpg
971Name_Not_Found:2014/10/15(水) 03:32:11.35 ID:DkcIMeun
972Name_Not_Found:2014/12/10(水) 12:39:58.81 ID:???
973Name_Not_Found:2014/12/14(日) 01:08:11.04 ID:???
974Name_Not_Found