【Robots】Googleアーカイブが嫌い【NoArchive】
1 :
:
02/07/08 16:54 ID:??? Googleにアーカイブされるのが嫌で <meta name="Robots" content="NoArchive"> を書いている人いる?
<meta name="Robots" content="NONE">
<meta name="
>>1 " content="itteyoshi">
robots.txt 置いてみたら? User-agent: * Disallow: /
6 :
Name_Not_Found :02/07/08 17:23 ID:4U/Bvj7x
>2&4 そうすると検索にひっかからくなるような
グーグルのキャッシュって、著者に無断で複製を作っているわけだよねぇ。 著作権法的には問題ないのか?
>>5 現行のスレッド?どれだよ(w
何か最近、意気揚々と手当たり次第に削除依頼を出す
初心者厨房が多いね。藁
9 :
Name_Not_Found :02/07/08 17:35 ID:4U/Bvj7x
GoogleやWeb Archiveを著作権侵害で訴える人はいないのかな? 訴訟大国アメリカあたりで係争されていてもよさそうだが
10 :
:02/07/08 17:37 ID:???
Googleとか卑怯だよな。 ほとんど無断リンクばっかの検索エンジンみたいな。
11 :
>10 :02/07/08 17:38 ID:???
いや、無断リンクはいいんだけど・・・
content属性の値をnoarchiveにすると、htmlチェッカから怒られるんだけどー ??
無断リンクが駄目な世の中になったら ネットは終わりだ。
14 :
Name_Not_Found :02/07/08 17:49 ID:4U/Bvj7x
無断リンクは何の問題もないだろうが キャッシュ(アーカイブ)はどうだろう? 無断で複製を作る点において違法性が高そうだが
さぁ、どこまで許せる? 1. パーソナルコンピュータに残り、個個人が再度閲覧するかもしれないキャッシュ。 2. プロキシサーバに残り、それを介した人に閲覧されるかもしれないキャッシュ。 3. Google に残り、検索結果に興味を持った人が閲覧するかもしれないキャッシュ。 どれも利用者に便宜をはかるためのもの。そもそも閲覧=ファイルのコピー。 元のデータのありかを明示しているなら構わないと思う。 もちろん、自分の著作物は自分でコントロールしたいという気持ちもわかるのですが. というわけで、Googleのキャッシュを嫌う方はなぜそう思うのかお伺いたいしたい。 自分は逆にありがたいと思っているので(笑)。
個人用のコンピュータに残ったキャッシュは 個人的な用途で使う分にはOK。
大嫌い
20 :
:02/07/08 18:35 ID:???
この中にGoogleキャッシュの世話になったことの無い奴なんて居ない
お世話になってます( ´д`)ハァハァ...
嫌われてても利用されまくるGoogleタン・・(・∀・)モエェ!!
自分のサイトはグーグルキャッシュさせない
27 :
Name_Not_Found :02/07/08 21:36 ID:2QoPXZ6W
Web Archiveつぶさない? マジムカツクンダケド…
28 :
Name_Not_Found :02/07/08 21:37 ID:of3WOEHf
29 :
:02/07/08 21:39 ID:2QoPXZ6W
サァ?
Web Archiveは古い時期に削除されたページとかも残ってて便利。
あぼーん
;゚д゚) <
>>1 は「ウェブサイト=私のお家・聖域」だと思ってるらしいよ…
Σ(゚Д゚;エーッ!
>>7 Googleにしてもarchive.orgにしても、
正当な権利者からの要請による削除には応じてるし、
robots.txtにも対応しているから、訴訟沙汰にはなりようがない。
それから、アメリカの著作権法だと、
原著作者の許諾を得ていない著作物について、
第三者が自由に利用してよいことになっているから、
原作者の許可を得ずにネット上で公開されているパロディ物について、
キャッシュで公開されても、
そのサイトの製作者は原著作者の許諾をえない限り法的に対抗できない。
>>35 アメリカの著作権法が適用されるのってどの場合?
まあ出典が記述されていれば引用となるわけではないのか
<meta name="Robots" content="NoArchive">のサイトはちょっと不便だよな。 Googleの検索結果の画面で、どいう文脈でその単語が出てるか判らないのが痛い。 まぁそういうところにGoogleからは逝く機会は、、、無。
>>36 Googleやarchive.orgが訴えられた場合。
40 :
Name_Not_Found :02/07/08 22:21 ID:of3WOEHf
>>34 みたいな煽りは放っておいて(んな事思ってる馬鹿いるわけないじゃん!)
「嫌い」と言う理由がマジで知りたいのだけれども。
今まで
>>1 から
>>37 までその理由書いた人いないでそ?
煽らないしw、価値観が違うんだろうから論破しようとも試みない。
ただ、どうしてそう思うのか教えて欲しい。
最新の情報が反映されないのがイヤだから?
Googleは検索サイトなんだから、
閲覧する人はGoogleがキャッシュした時のその情報を求めているわけで、
これを契機にあなたのサイトに興味を持ってもらえるかもしれない。
だいたい、キャッシュを見て最新の情報と勘違いする人はいないよ。
能動的に「キャッシュ」をクリックして表示された結果なんだから。
>正当な権利者からの要請による削除には応じてる MXの場合は?警察来てから削除すればいいのか?
43 :
:02/07/09 00:41 ID:???
> だいたい、キャッシュを見て最新の情報と勘違いする人はいないよ。 キャッシュの概念が一般の人にも普及してるとは思えないが。 漏れは「嫌い」派じゃないけど、世間の論理って基本的にアフォが基準だし。
45 :
Name_Not_Found :02/07/09 09:51 ID:M+hY6x1z
>>40 誤った情報をのっけた後、訂正してもずーっと
自分の誤りがのってるのが嫌だから。
のっけられても削除を要請することもできるけど、
即座に削除されるわけじゃないし。
さらに、GoogleやWBのように、自分が知っている
公開倉庫なら削除依頼で事後的な処置もできるけど、
ウェブ上に他に公開倉庫がないとはいいきれないから、
全ての倉庫に削除依頼できるわけではない。
よって、robots.txtやmeta要素で未然に倉庫化を防ぐのが吉。
>>45 いくら誤った情報を訂正したとしても
利用者がその訂正を見なければ、与えてしまった情報は更新されない。
情報を流すって、そういうことだ。
47 :
Name_Not_Found :02/07/09 11:03 ID:M+hY6x1z
>>46 そんなことどーでもいいんだよ。
自分のチョンボがずーっと(少なくとも削除依頼が通るまで)
晒されるのが嫌なだけ。w
WBやGoogleにアーカイブされてない限り、訂正しちゃえば
チョンボの決定的な証拠はなくなるじゃん。
一方、アーカイブされてたら訂正しても、チョンボは残るわけで。
だったら公開するな オンライン上に何か情報を流すのだったら多少のリスクは覚悟しろ
49 :
:02/07/09 12:13 ID:???
>>48 馬鹿かお前何様つもりだ?偉そうに。
氏ね。
50 :
:02/07/09 12:17 ID:???
>>48 かっこわりー。
だったら公開するな(フッ ツギノヒトコトデキメテヤルゼ。
オンライン上に何か情報を流すのだったら多少のリスクは覚悟しろ(キッ キマッター!
よほど悔しかったんかな、この人 顔、真っ赤にしすぎ
52 :
Name_Not_Found :02/07/09 12:45 ID:M+hY6x1z
>>48 だから、リスクを軽減するための
robots.txt/meta要素なんだが?w
<meta name="Robots" content="NoArchive">のタグを書くと、グーグルのキャッシュに残らないの? 検索にも引っかからなくならない?
54 :
Name_Not_Found :02/07/09 12:51 ID:M+hY6x1z
>>53 前半は正解。
Googleのキャッシュに残らなくなる。
none等ではないので、検索対象から外されることはない。
55 :
53 :02/07/09 13:01 ID:wkWXkFSn
>54 ありがと >48 行動にリスクが伴うのは当然だけど、回避可能なリスクを甘受するのは愚か 最近問題の個人情報漏洩にも同じ事がいえる この件に関して、その論は的外れだと思う
56 :
:02/07/09 13:05 ID:???
>>51 ごめん。面白いと思ったんだ。
このとおりです。
許してください。
>>48 あほ。
57 :
Name_Not_Found :02/07/09 13:06 ID:M+hY6x1z
>>55 どういたまして。
Googleで検索をして、「キャッシュ」が表示されない
ページの多くは、robot.txtやmeta要素でキャッシュ対策を
しているところみたいだね。
>54 noneだけではInfoSeekにキャッシュされる罠。
noarchiveじゃだめなの?
60 :
Name_Not_Found :02/07/09 13:23 ID:M+hY6x1z
>>59 HTML4.01/XHTMLなら大文字・小文字どちらでもいいはずだ。
googleは大好きですが、 かなり古い削除したページがえんえんgoogleで残ってしまい、 そこをキャッシュとして読んで飛んできた人がちょっとした誤解をした体験があります。 テーマの方向性をがらりとかえた後だったので、客にもこちらにも迷惑なことでした。 それを防ぐにはgoogleの更新を早くしてもらうか、削除依頼をするか・・ どちらもちょっと。
削除が通るまで何日くらいかかるの?
63 :
Name_Not_Found :02/07/09 15:35 ID:iByTtjxM
>>55 だから48はネット上にアップするからには責任持てって言ってんだろ。
55の言いたいことと食い違いがあるとは思えんぞ。
>>63 48の書いた事は普通にみんな理解してると思うよ。
あの書き方と答え方は間違いなくおかしいと思う。
こんな事を書くつもりじゃなかったのにな、、、。
>>45 自分のミスを隠したいからキャッシュ反対ですか。
そもそもキャッシュって変更されたり削除されたりする前のページを取っておくために あるんでは
67 :
45 :02/07/09 15:43 ID:???
>>65 なんかそういうのってあると
情報が変に伝わっちゃう場合とかあるでしょ。
そういう自分が恥ずかしいからとかじゃないと思う。
キャッシュはキャッシュと書いてあるけど・・・
まぁボロボロボロボロと誤りだらけの情報を流した挙句に 自分の情報がものすごい重要なのだと自意識過剰に浸ってる人間は好きにしろって感じかなw
>>67 それは無知や勘違いする人が悪いだけであって、キャッシュという観念を
否定する理由にはならない。
法律違反をして、「そんな法律知らなかった」と言っても言い訳にはならない。
71 :
45 :02/07/09 16:13 ID:???
>>70 たとえが変だしそれに理由になるよ。
だって、誤った情報が流れると困るでしょ?
作者も閲覧者も。
>>61 のような事があっても否定する理由にはならないの?
【衝撃!】消し去ったはずのWebページga保管する
http://pc.2ch.net/test/read.cgi/hp/1004183621/-100 26 :Name_Not_Found :01/10/28 00:47 ID:YH9hBtu1
一度は公にしたものなんだから、男らしく自分の過去を背負ってゆきませう。
31 :Name_Not_Found :01/10/28 01:10 ID:YH9hBtu1
間違った記述に気づいても決して削除せず、<del>の抹消線で済ませるのが男子の心意気ぢゃ。
73 :
45 :02/07/09 16:16 ID:???
ごめんなさい、私は球と棒が付いてないんです
私はどうなるの?
たしかに「間違ってたら消せばいいや」っていう考え方でサイトを作るのはよくない
私もまんこしかありません。
これこれ、性別に拘泥するでない。 女性にも良い意味での「男らしさ」を求めていいのでは? いや、女々しい女性なんて「女らしさ」からも程遠いものなのだ。
81 :
80 :02/07/09 16:29 ID:???
誤爆
go,gobakuda!
83 :
100 :02/07/09 16:34 ID:???
>>982 俺はスクリプトの見本を絶対にKENTにはしていないが?
84 :
83 :02/07/09 16:35 ID:???
誤爆
87 :
241 :02/07/09 16:53 ID:???
私のサイトは1000hit/1dayですが何か?
88 :
241 :02/07/09 16:54 ID:???
誤爆
>>71 否定する理由にならないというか、結果として削除してもらえなかったり
削除まで時間がかかったりしたとしても文句は言えないって感じ。
90 :
Name_Not_Found :02/07/09 17:00 ID:pfNMhBxR
>>45 過去のあやまちに責任を持つ覚悟が必要です。
訂正したからって口ぬぐって済ませようってのはちょっとナ……。
やっぱりまんこは臭いな
92 :
:02/07/09 17:39 ID:???
93 :
45 :02/07/09 21:11 ID:M+hY6x1z
94 :
45 ◆OIG7OQoM :02/07/09 21:11 ID:M+hY6x1z
IDが変わる前にトリップつけとこ
何故そこまでコテハンに執着するかがわからん。 って、言動見てりゃ解るか。
96 :
45 ◆OIG7OQoM :02/07/09 21:22 ID:M+hY6x1z
>>76 それは貴方の価値観として尊重するけど、
俺はそうは思わない。
誤った情報を発信することで恥をかくのが
嫌だから。これって人間として自然なこと
だと思う。
それに
>>61 のような事例もある。
世の中には色んな価値観の人がいるのだから
俺様ルールを押し付けるのはいかがなものか。
価値観の違いがあるからこそ、robots.txt/meta要素による
キャッシュ規制が準備されてるわけだから。
>>63 軽減できるリスクがあるのなら、軽減してもいいんじゃないか?
それに48は「リスク」と書いているのであって、
「責任」を論じているわけではない。
話を摩り替えないように。
うお、各レスを始めた! じ、自治か、自治が始まるのかッ!
なんか誤爆が多いね。わざと?
TBCやらノッツェやらの漏洩データがグーグルキャッシュされてたら 被害者としては嫌かと。 漏れはいいけど。(藁)
100
101 :
40 :02/07/09 21:34 ID:Acp9NPiz
>>45 > 誤った情報をのっけた後、訂正してもずーっと
> 自分の誤りがのってるのが嫌だから。
なるほどね。そういう考え方は俺にはなかったわ。
キャッシュであれ何であれ、正しい/間違っているの取捨選択は、
閲覧した人が行うはずだと思っていたもので。
それが自己責任ワールド、インターネット、と。
でも影響力が大きくなってくるとそこまで気をつかうのかもね。
俺程度だとてきとうに修正して放っぽっとくだけだ(駄目じゃねえか)。
キャッシュをさせないというのは、ユーザの利便と交換条件になるわけだけど、
そうしなけばならないほど、たびたび大きい間違いってするものかな?
逆に文書の信頼性を貶める、なーんてことにならないといいけど…。
>>61 について。
キャッシュされた文書はその独立した文書として完結しているので、
その人には実際に役に立ったんでしょうよ。
役立った物が削除されてしまったのは残念な限りだけれども。
102 :
45 ◆OIG7OQoM :02/07/09 21:42 ID:M+hY6x1z
>>101 そんなに大げさなもんでもないんよ。
自分が恥をかきたくないだけ。w
たとえば、2chで誤字脱字や小矛盾をすると
それ以後、延々に煽られたりするでしょ?
そういうのが嫌だなって。
もちろん、誤った情報が他人を害する場合、
取り除かないとという義務感もないわけでは
ないけど、たいした情報を出してるわけでも
ないしね。
このスレには商業サイトを作る香具師はいないのか? 商業系のサイトのクライアントは、利用者に、過去の商品価格、過去の商品内容を 知られたくない場合が多い。 「このモールは毎年9月に一割引セールをしてるな。買い控えよう。」 「このジムは毎月入会金無料にしてるな。だったら急ぐ必要ないか。」 「セールと銘打ってるけど、ほとんど安くなってないじゃん。」 こんな分析をされたら、営業利益がダウンしてしまう。 商品の購入者からしてみれば便利なのかもしれないけれども、逆に運営者としては 知られたくないのだ。 そのようなサイトを運営する側としては、キャッシュ&アーカイブ対策は 死活問題なのです。
そもそも、WWW自体が金儲けには向いていない。
>104 それはない。ウェブの対費用宣伝効は大きい。
>>105 その結果バナー広告やSPAMメールが氾濫
全然話が違う方向に進んでるんだけど? わざと?
ブヒブヒ
110 :
45 ◆OIG7OQoM :02/07/09 22:13 ID:M+hY6x1z
>>103 商業系の場合、戦略的に必要なわけね。
確かに俺は消費者側に立ったら、過去の比較のために
キャッシュ利用しちゃうかもな。w
グーグル関係者が荒らしてます!!
112 :
45 ◆OIG7OQoM :02/07/09 22:17 ID:M+hY6x1z
>>111 とゆーか、自分と異なる価値観を認められない
痛い中学生かと。w
>>112 >自分と異なる価値観を認められない
>痛い中学生
自己紹介?
釣れた釣れた。w
115 :
Name_Not_Found :02/07/09 22:21 ID:pyKtivie
こんな裏技があったとは 早速使わせて頂きます
116 :
45 ◆OIG7OQoM :02/07/09 22:23 ID:M+hY6x1z
なんか痛い45が居るな… こいつの目標はこの<meta>表記を浸透させる事なのか? なんか意図が解らん。
119 :
Name_Not_Found :02/07/09 22:29 ID:zlTu03Ri
粘着うざ
120 :
45 ◆OIG7OQoM :02/07/09 22:38 ID:M+hY6x1z
>>117-118 俺の意図は40への回答およびGoogleキャッシュ
回避派としての論を展開すること。
どこでmetaの表記法を浸透させようと
しているのかね?
この表記は当然の知識であり、浸透の必要など
ないと思っていたが?
んで、お前の意図は何?
荒らし?粘着?w
121 :
Name_Not_Found :02/07/09 22:42 ID:v6og1tVk
46=48=109=117=118=痛い厨房=グーグル擁護
>>45 は
>>90 に対して返答はしないの?
一度は公にしたものなんだから、
「過去のあやまちに責任を持つ覚悟が必要です」よ。
123 :
45 ◆OIG7OQoM :02/07/09 22:47 ID:M+hY6x1z
>>121 そーゆーレッテル貼りはやめよーよ。
Googleキャッシュに好意的解釈をする人でも
論理を展開できる人はいるんだから。
とゆーか、痛い中学生と指摘されたのが
よっぽど悔しかったらしいね、粘着は。w
反対意見があるなら堂々と書けばいいのに。
>>103 >「セールと銘打ってるけど、ほとんど安くなってないじゃん。」
そういうのを誇大広告という。ウェブとかキャッシュとかいう以前の問題。
ていうかお前ら理論が逆 削除されたり閉鎖されたりしたページが保存してあるからやだ? 削除されたり閉鎖されたりするページがあるからキャッシュが役に立つんだ
127 :
45 ◆OIG7OQoM :02/07/09 22:51 ID:M+hY6x1z
>>122 責任って?抽象的すぎるんだが。
101も書いてるけど、Webの情報は利用者の
危険において解釈すべきもの。
それを訂正したところで、責任回避にはならないだろ?
その程度の誇大広告は合法。 つかどこもやってる。 そんくらいで誇大広告とのたまうガキは 小学生ですか?
誇大広告を合法と主張する連中が、舌の根も乾かぬうちにキャッシュは違法と 言い出すのだから、2chというのは面白いところだ。
130 :
122 :02/07/09 22:54 ID:???
>>127 誤りを訂正したからって責任を取ったことにもなりませんね。
過去に誤った情報を流した責任は、それはそれとして残るのです。
キャッシュ削除で過去に頬かむりするつもりなら感心しないナ。
131 :
45 ◆OIG7OQoM :02/07/09 22:55 ID:M+hY6x1z
>>125 え?荒らしを痛い中学生と客観的に表現する
ことがレッテルを貼ることになるの?
俺が
>>121 に対して書いたのは、
「痛い厨房=グーグル擁護」という部分だよ。
つまり、特定の行為者=特定の思想という
レッテル貼りに苦言しているのであって、
荒らし行為を非難することとはまったく
同列ではないんだけど、何か?
気に障ったんなら、上っ面で謝るよ。w
132 :
125 :02/07/09 22:57 ID:???
>>131 反対意見を「荒らし」と言いきるところが「気に障った」んだよ。
133 :
45 ◆OIG7OQoM :02/07/09 23:00 ID:M+hY6x1z
>>130 >誤りを訂正したからって責任を取ったことにもなりませんね
ここの「責任」を定義した上で
貴方自身が考える責任を論じてくれないと
話にならないと思うんだが。
確かに重大な違法行為への責任なら、
取ったことにはならんよ。
過去において名誉毀損があったので抗議があって
削除したとしても、刑事的・民事的な違法性の
追及には耐えられないだろう。
しかし、「at your own risk」を明言している
サイト上で、些細な誤字があったとして、それを
訂正する行為が、なぜ責任を放棄したことになる?
134 :
45 ◆OIG7OQoM :02/07/09 23:01 ID:M+hY6x1z
135 :
Name_Not_Found :02/07/09 23:01 ID:b2I7HhCU
右クリック禁止厨房 ディープリンク禁止厨房 そして、 NOARCHIVE厨房 やれやれ…
136 :
45 ◆OIG7OQoM :02/07/09 23:03 ID:M+hY6x1z
>>135 右クリック禁止厨房
ディープリンク禁止厨房
そして、
NOARCHIVE反対厨房
やれやれ…
ともいえるわけだね。
まあ、価値観が違うだけだから、
俺はそれが正しいとは言わないけど。w
137 :
Name_Not_Found :02/07/09 23:03 ID:v6og1tVk
135は厨房
138 :
125 :02/07/09 23:04 ID:???
139 :
125 :02/07/09 23:05 ID:???
>>138 それに一々突っかかる貴方も、2chムキではないね
141 :
122 :02/07/09 23:05 ID:???
>訂正する行為が、なぜ責任を放棄したことになる? 責任放棄なんて言ってませんが。 責任を取ったことにはならない、と申しました。 あなたの態度が、自分を現在の自分でだけ評価してくれって甘えた態度に見えたので、 一言した次第。もちろん、誤ったりした過去をも含めて自分ってもんがあるわけです。 どうもWebは「お前は永遠の現在に過ぎない」(テレビ論の古典の題から)ってとこが ありますね。過去の蓄積を生かせるのがコンピューターの強味のはずなんですが。
125=108=109
143 :
45 ◆OIG7OQoM :02/07/09 23:07 ID:M+hY6x1z
>>141 >過去の蓄積を生かせるのがコンピューターの強味のはずなんですが
それはケースバイケースでは?
過去の蓄積を消せるのがコンピュータの強みともいえるね。
144 :
125 :02/07/09 23:07 ID:???
>>142 俺も45も、そういうのを「レッテル貼り」と言っている。
というか、本当の荒らしは「○○=○○」系のレスをしている君ではないのか。
145 :
122 :02/07/09 23:10 ID:???
>>143 過去の蓄積を無にしてしまってナゼ強味になるのか、理解を絶するナ。
過去が失敗ばかりの人なのかな。
ところで「自分を現在の自分でだけ評価してくれって甘えた態度」については
是認するのかい?
146 :
45 ◆OIG7OQoM :02/07/09 23:13 ID:M+hY6x1z
>>145 過去が失敗ばかりでなく、過去の誤りが
あったら消したいだけ。
正しい過去の情報は残しておいていいんだよ。
(あくまでも俺の価値観だがな)
貴方の話はどうも極論な気がするが。
>「自分を現在の自分でだけ評価してくれって甘えた態度」
この定義自体がおかしい。
なぜ現在の自分(最新の情報)で勝負するのが
甘えた態度になるの?
説明してくれ。
誇大広告にも程度があるの。 合法な誇大広告はどこでもやってるの。 ヨドバシでもやってるでしょ。 競合店と1円しか違わないのに「他店より大安値!!」とか。
148 :
Name_Not_Found :02/07/09 23:17 ID:cr3NrnbG
GOOGLEにキャッシュ置いてる奴は厨房
150 :
Name_Not_Found :02/07/09 23:19 ID:v6og1tVk
>149 何をいまさら 和塩の95%は厨房頁だろ
151 :
122 :02/07/09 23:21 ID:???
>>146 悪いけど、わかんない奴に説明してやるほど親切ではないんだ。
最近の人はコマンドZがどこでも通用すると思ってるのかな。
ま、「お前は永遠の現在に過ぎない」――この言葉でも噛みしめてね。
「過去の誤り」は訂正することはできても
誤りをした過去そのものは「消す」ことはできません。
152 :
45 ◆OIG7OQoM :02/07/09 23:25 ID:M+hY6x1z
>>151 説明じゃなくて論理と定義を展開させて
ほしいのだが?
もしかしてそんなものなくして
書いてたんじゃあるまいな。
>「過去の誤り」は訂正することはできても
>誤りをした過去そのものは「消す」ことはできません
んなことはわかっとる。
でも、「過去の誤り」は訂正することができるのなら
それだけはやっておきたいだけ。
別に押し付けてるわけじゃないから。
153 :
Name_Not_Found :02/07/09 23:26 ID:zlTu03Ri
151=粘着親父
なぜ情報を最新版に保つことが「甘え」なのですか? 122の主観の押付けでは?
151は粘着した過去を消すことができません。
>>154 いちいち君達につきあって最新版をフォローしなきゃいけないのか?
それを他人に求めるのは過大な要求(=甘え)だよ。
過去に一度見たきりのコンテンツで評価されても、
それが確かに自分が公開したものであった以上、仕方がない。
キャッシュされると過去を訂正できなくなって困るとか言うくらいなら、 うpする前にもっと慎重になれよ、とは思うな。 それが大切な時間を使ってページを見てくれているかもしれない閲覧者と、 その情報を必要としているかもしれない人に対する責任だ罠。
158 :
Name_Not_Found :02/07/09 23:34 ID:v6og1tVk
IDを隠す椰子が過去を説いても説得力ないな
>>158 ところでWeb板って、いつからsageでIDが隠されることになったの?
160 :
45 ◆OIG7OQoM :02/07/09 23:39 ID:M+hY6x1z
>>157 誰でも誤りがないか慎重に見直して
アップしていると思うが?
それでも、誤字脱字・思い込みは
誰でもあるんだから、それを非難するのは
筋違い。
>>103 みたいな事例もあるのだから、
貴方の価値観で定義される「責任」で
どーこー言っても仕方ないじゃん。
>>160 誤字脱字は誰しもある。
それに気づいたら訂正するがよいさ。(誰もそれを非難しとらん)
だが訂正前の自分を恥とするあまり、
隠して無かったことにしようって根性がね……。
162 :
45 ◆OIG7OQoM :02/07/09 23:45 ID:M+hY6x1z
>>161 貴方がその根性が嫌いなら、
貴方がキャッシュ対策を
しておけばいいだけ。
俺はキャッシュがない方が
都合がいいから、そうしてるだけ。
価値観の相違だよ。
163 :
Name_Not_Found :02/07/09 23:45 ID:v6og1tVk
sageは反論に自信のない証拠 キャッシュ肯定派は一人何役?
ところで、アーカイブ賛成派は、リファラ隠し目的のime.nuをどう思う? あれも根性なしか?
>>164 便利も何も、価値観に拠っているのが
事実だからしょうがないじゃん。
価値観を超えて話そうとすれば
用語の定義を明らかにする必要があるが、
122が逃げるんだもん。
それとさ、下げても意味ないよ。
俺があげるから。w
は?
>>163 漏れ何処でもsage書きだから噛みつかんでよw
そういや昔、どっかのスレで「日記を書き換えたい」っつー書き込みがあったな。
変えるのは本人の勝手だが、Archiveに突っかるとしたらお門違いだな。
169 :
45 ◆OIG7OQoM :02/07/09 23:53 ID:M+hY6x1z
>>165 うちにもたまにinu.meからアクセスがあるが、
かなりいやんな感じ。
でも、いざとなれば、ime.nuからのアクセスのみ
拒否すればいいから、便利ではある。
っつっても、refererでアクセス拒否なんて
子供だましだがな。
いつも最新のボクを見て、ボクのいいとこだけ見て――ってか。 「認めたくないものだな、自分の若さ故のあやまちを。」
171 :
Name_Not_Found :02/07/09 23:55 ID:6ZVdWMq9
170=168=粘着親父
172 :
Name_Not_Found :02/07/09 23:55 ID:OWXkTCe4
173 :
45 ◆OIG7OQoM :02/07/09 23:55 ID:M+hY6x1z
>>160 103あたりは商人と消費者の駆け引きの問題でしょ。
商売人が“キャッシュのせいで……”とかこぼしてる時点で終わってるよ。
>>163 別に隠す気なんかないよ。sageたいだけ。
つか、お前みんながキャッシュ否定派だと思ってるの? あほか。
大半はキャッシュどーでもいい派だよw
ああ、今一番ダサい騙り
>>キャッシュ賛成派 都道府県によってはもう夏休みなんじゃないか。
>大半はキャッシュどーでもいい派だよw まったくもってそれだ。
>>173 「当り前」なのかよ……。もはや言葉も無いな。
>>174 キャッシュへの対策も消費者との駆け引きを有利に進めるための方法。
103は間違ってない。
180 :
45 ◆OIG7OQoM :02/07/10 00:00 ID:JdUEO0/5
>>178 君は過去の誤りを認めたいわけ?
そーゆー優等生的な意見もあっていいと思うよ。
俺にはわからんけど。
あからさまにキャッシュ隠して値段の推移を誤魔化してるところは利用しない事。
>>179 間違っているいないつーか、当たり前ジャン。
183 :
Name_Not_Found :02/07/10 00:02 ID:ZaPEAvZJ
あげ
<META name="robots" content="noindex,nofollow,noarchive"> <META HTTP-EQUIV="Pragma" CONTENT="no-cache"> いいじゃん、個人HPなんだからさ。 やるもやらぬもアナタ次第よん(w
>>179 そうだね。間違ってるとは思ってないよ。
求められて〜♪ 捨てられて〜♪ もーどぉにでもしてぇ〜♪
187 :
Name_Not_Found :02/07/10 00:04 ID:gPC2xrJZ
>184 自分はnoarchiveだけ かといって他の値を追加したい人を否定はしない
188 :
45 ◆OIG7OQoM :02/07/10 00:11 ID:JdUEO0/5
俺もcontent="noarchive"だな。 つーか、content="noindex,nofollow"とだけ書けば アーカイブされることはないんじゃないの? 違ったらゴメンね。
私も、キャッシュを隠す奴が
「間違ってるとは思ってない」(
>>185 )し、
それを「否定はしない」(
>>187 )。
ただ、信用できないだけだ。
190 :
45 ◆OIG7OQoM :02/07/10 00:12 ID:JdUEO0/5
つまり、検索すらされないのだから、 アーカイブされないのでは?と思ってみた。
191 :
>189 :02/07/10 00:15 ID:FUT2u3ZR
どうせ上がるのに下げでIDを隠すお前は もっと信用できないな
>>191 イマドキ複数IPアドレスくれるISPなんて普通にあるだから
ID晒したって何の意味もなくない?
つか、何でそこまでIDにこだわる? 心の病気か??
193 :
Name_Not_Found :02/07/10 00:22 ID:uCTgQHV+
ID隠しは間違いでも否定対象でもないが、複数プレーだと疑うだけだ
むしろ、矢鱈とID晒して自作自演でないことを強調する奴の方があやしい
ID以外のことで主張できるものがない方って可哀想ですわトホホ...
196 :
Name_Not_Found :02/07/10 00:28 ID:jikHjGp8
あげ
あげんな
w
200
>>193 ただ、半分荒れはじめているスレをいちいち上げるのはドウか・・・
俺はキャッシュ許容派
>>66 ,
>>126 が正解。
キャッシュは欲しい情報が書いてあるらしいページが無くなってた場合のためにある
別に君らの間違いを永遠に晒そうとしてるわけではない
201=66=126
そうか、いわゆる被害妄想が強いだけか?
キャッシュはあってもいいが、ページの作成者がコントロールできるべき。 削除を依頼しても放置される現状では、結果的に間違いを半永久的に晒していることには変わりない。 したがって201は不正解。
>>204 削除を依頼すれば削除されるけど・・・?
>>202 面白いと思ってやってるのかもしれないけど、つまらないよ。
>205 そうとは限らないらしい 特にWay Backは
>>204 一度公開した以上、どこで保存されてるかわからない。
だからキャッシュ削除しても「半永久的に晒していることには変わりない」。
その覚悟がないなら公開するなってこった。(ループ)
210 :
206 :02/07/10 00:50 ID:7oy+zWod
だからキャッシュを事前に防止することに意義がある。 それでもキャッシュされたら、それであきらめるだけだ。
>>204 最新のページで正しい情報になってれば別にいいんじゃねーの?
213 :
208 :02/07/10 00:53 ID:???
>>212 同感。だのに、そこまでキャッシュに神経質になるのは
よほど過去に後暗いことがあって隠してるんだなあ――って感じる。
>>216 漏れが何の被害を妄想してるんですか?(´ー`)
218 :
201 :02/07/10 00:57 ID:???
否定派の理由 ・著作権にかんする問題 ・自分のサイトの古い情報が晒される ・間違った情報を訂正できない 容認派の理由 ・見たいサイトが無くなってた時に便利 理由に関しては以上でOK? 両陣営の皆様方
♪
閉鎖してネットと縁を切る。これ最強。
だ、誰かが、ボ、ボクの過去のあやまちを、キャッシュからほじくり出してきやがるんだ〜。
223 :
221 :02/07/10 01:00 ID:???
>>221 漏れは214=215であって216ではないですぽ
本人がが気にするほど周りは気にしてないよ。 自意識過剰も程々に〜。
>>225 うむ。
そんな事が理由でキャッシュが無くなることの方が問題
>>221 それを被害妄想といったら、DIR一覧を閲覧させないためのindex.htmlも妄想の産物?
キャッシュはなくならんだろ。 危機感のない人間がゴロゴロいるんだから。 被害妄想もいい加減になさい!!
アーカイブされても平気なキミらは ネットヲチ板で日常茶飯事となっている「アーカイブさらし」を やられてぁぅぁぅしていればよろしい
>230そんな環境で生きてるちみに合掌
>>230 アーカイブされてイヤになるものなら初めから公開するなって。(ループ)
>>230 ネットヲッチ板で晒されるようなサイトじゃないので・・・
晒しの基準がオチ板っつー時点で(略
>>232 アーカイブされないように対策を施せばいいだけの話
たしかに、キャッシュ否定派がどんなサイトを作っているのか知りたいな
むしろキャッシュ肯定派を
>237いや、その意味わからんw
239 :
232 :02/07/10 01:14 ID:???
>>235 わかってないな。
アーカイブされたくない様なものをもともと公開するのがヘンだってこった。
>>239 アーカイブされないよう希望することをヘンだと決め付けるお前の考えがヘン
☠ฺⒻฺⓤฺⓒฺⓚฺⓎฺⓞฺⓤฺ☠ฺ
公開しつつもアーカイブを回避する方法があるのに、 それを行うと変だと言われても困ってしまうのだが。
cacheがプライバシー侵害とか害を及ぼす場合などの特例ならアーカイブ回避も理解できる。 それ以外はなんでそんなに避けたがるのか、理解できん。 よっぽど疚しい過去でもあるのか? 被害妄想なんでないの。
>241それだけは同意。保護される権利はある。
お前らそんな事どうでもいいだろ。 くだらん事言い争ってる暇が有ったら風呂入れ。臭いぞ。
ほんとだ。臭うw
否定派を見ていると、
公開したい(見せたい)のはあることに関する情報じゃなくて、
情報を発信してる自分じゃないかって勘繰りたくなる。
>>245 だから、キャッシュされるのを回避する方法はあるってのは既出だと思うが・・・。
被害妄想ではなくて隣り合わせの現実。 どうせクラックされないから、index.htmlを置かなくてもいいや パーミションも適当でいいや、そんなの被害妄想だと 笑うのは自由。そんな奴に限ってクラックされて泣く羽目に。
>>249 それ、
>>170 も言ってるね。
>いつも最新のボクを見て、ボクのいいとこだけ見て――ってか。
>>250 アーカイブされるとクラックされる程の被害でも出るのか?
>>170 キャッシュ賛成派って「過去の自分も見て」って感じ?
自己顕示欲が強いね
>>250 キャッシュとパーミションなんかとは別問題だろが。
あ、それを一緒くたにするのが正に被害妄想なのかな。
同意(ワラ
回避策以外に、拒否・削除申請を受け付けない倉庫ってあるのか?
index.htmlを置くのは被害妄想です!!!
>>250 マテ
index.htmlを置くのとパーミッションを適切に設定するのは全然性質が違う操作だぞ。
つか、index.htmlなんてクラック対策のうちに入らない。
ましてやキャッシュなんて……
パーミションを777以外にするのは、被害妄想です!!!
過去の自分を見られることに無頓着なのと、 自分の過去像まで操作したがるのと。 どっちが自意識過剩かね。
過去を操作してると思うのは妄想で自己満足に過ぎないよ。 真実はいつでも一つd(>ー')
他人がRobots.txtを置くことにギャーギャー言うのは 間違いなく自意識過剰の我侭甘えん坊という噂
>>263 だね。妄想で自己満足のためのcache避け、か。ヤレヤレ。
いいえ
>264ワラタ。アンタまさに自意識過剰。 何について話てるか分かってるか?
またグーグルキャッシュ肯定派による抽象的なイメージ作戦が始まった。 そんなことを言ったら、個人でサイトを運営すること自体自意識過剰の自己満足じゃん。
結局は「なんとなく嫌だから」レベルなんだよな。
>>264 のどこが自意識過剰?
何でも自意識過剰とか被害妄想とか書けば
批判になると思ってない?
やめませう、一般論による論理のすり替へは。
>>268
パーミションを777以外にするのは、被害妄想です!!!
>>274 World Wide Webの理念を分かっていますか?
って言うか肯定派一人だろ
>>271 自意識過剰というより、自分のルールに反することが許せない子供みたい。
そういえば、googleキャッシュって検索語がハイライトされるから便利なんだよな いちいち再度ページ内を検索する手間が省ける
実質的な、もしくは個人的に不快と感じる被害に遭うと人は過剰反応するんだよ。 否定派は運が悪かったと思うしかない。 人間、他人事は「そんなこと位で」と思うもんだ。
って言うか否定派一人だろ
あげ
要するに、このスレは2人で進んでいる、と。
あげんなハゲ
だから風呂入れよ
うむ。7,8人はいるなw
>>281 他のページがキャッシュされるのは便利だけど、自分のページはさせない。
だからrobots.txtを愛用してます。許せ
さっきから自作自演だな一人芝居だのと言ってる人がいるけど、それって 議論の本質と関係ないと思うんだけど。 俺は肯定派でも否定派でもないよ。
だからナルシー君は勝手にやってろよ
あげ
>292だから別にそういうのは自由だからいいんじゃん?
ところで。 迫害者が多数でなく一人だけだと信じたがるのも被害妄想なのかね? 普通、被害妄想患者はみんなが自分の迫害者だと信じ込むんでないの?
Web Archiveされてる 過去のアタシも見て!!!
>>293 そもそもこれが議論に見えてるのかお前は
>298わらた
ワラタ
>>300 さあ?
やたらと「w」付けたり自演と連呼している煽り厨以外は議論になってると思うよ。
>>297 被害妄想というより誇大妄想と言った方がいいだろうな
むしろアーカイブされないページが多いのが問題。
>>298 どうしたら登録させられる?(自他いづれも)
あげ
>297その違いについて大いに騙りたいがヤめとく
>>292 だから、君がそう思うのはなぜ?って話をしてるんだろ?
#話をしていればだけどな
その理由を他者ができるだけ納得できるように話してみてくれよ
312 :
297 :02/07/10 01:59 ID:???
>>309 そんな出し惜しみせんと、一つよろしく。
>305 糞ページはアーカイブされません
肯定派の40、否定派の45、両者が言うように各人の価値観の問題でしょ。 お互いに納得のできる結論なんてないよ。 お互いに自意識過剰、被害妄想と罵り合って沈む、どっちもお互い様な駄スレ。
>>314 延々と上がり続けるだけに、単発質問スレより糞スレだな
>>314 だからロボット除けでもなんでもやりたい奴は勝手にやってろ
まともな神経してる人間はそんなんするな、で結論づいてるんだけどね
319 :
Name_Not_Found :02/07/10 02:05 ID:eoN+yXHU
320 :
305 :02/07/10 02:05 ID:???
>>313 糞かどうかはこっちで判断するから、
とにかく一通りアーカイブしておいてほしい。
現状では遺漏が多すぎる。
>>318 まともな神経してる人間はNoArchiveで決まり
>318 自分に都合のいい結論を持ってこないように。
と言う訳で1000まで互いに罵りあうのがこのスレの醍醐味です
ウンコ!と言われてションベン!と言い返す様に似ています
まともな人間はsageたりしないわ!!!
46 :Name_Not_Found :02/07/09 10:43 ID:???
>>45 いくら誤った情報を訂正したとしても
利用者がその訂正を見なければ、与えてしまった情報は更新されない。
情報を流すって、そういうことだ。
47 :Name_Not_Found :02/07/09 11:03 ID:M+hY6x1z
>>46 そんなことどーでもいいんだよ。
自分のチョンボがずーっと(少なくとも削除依頼が通るまで)
晒されるのが嫌なだけ。w
WBやGoogleにアーカイブされてない限り、訂正しちゃえば
チョンボの決定的な証拠はなくなるじゃん。
一方、アーカイブされてたら訂正しても、チョンボは残るわけで。
48 :Name_Not_Found :02/07/09 11:38 ID:???
だったら公開するな
オンライン上に何か情報を流すのだったら多少のリスクは覚悟しろ
とりあえずage厨を抱えるのが最悪な現状
このスレを見ると、明らかにキャッシュ対策をしている香具師の方が マトモっぽい。 以上、煽りでした。
もういい加減終われや、このスレ。 「お前のかーちゃんデベソ!」レベルの罵り合いが続くだけ。 定期的にagaってきてうざいったらありゃしない。
48の見事に外しまくった反論にならない捨て台詞に萌え
過去のアタシを否定しないで!!!!
>333それはもういいw
いやよ!! Web Archiveされてる 過去のアタシも見て!!!
>337漏れは今のお前が好きだったのに・・・さようなら
このスレッドをあげてる馬鹿は釣り師。放置汁
52 :Name_Not_Found :02/07/09 12:45 ID:M+hY6x1z
>>48 だから、リスクを軽減するための
robots.txt/meta要素なんだが?w
55 :53 :02/07/09 13:01 ID:wkWXkFSn
>54
ありがと
>48
行動にリスクが伴うのは当然だけど、回避可能なリスクを甘受するのは愚か
最近問題の個人情報漏洩にも同じ事がいえる
この件に関して、その論は的外れだと思う
> 釣り師 ぷ
♪
何、さっきからやたら騒いでるのは
>>48 の煽りに対しての過剰反応なワケ?
なんじゃそりゃ
いやんいやあん!!! キャッシュを残せって言ったのはあなたじゃないの!!!
古記事引っぱり出すほうが余程あほ。おまえはArchiverか!
すごい粘着っぷりだな どの板出身なんだ?
>>345 過去ログを生かして、既出やループは避けませう。
>344それは単なるキープだ。さっさと新しいキャッシュ拾ってこい!
なんか自己矛盾してきてる奴が居るな
♪
♪
解る奴には解る感じ
で、何だ、全員血圧は下がったのか
♪
オウム返しウザイ
>>348 がいい事言ってるからちょっと見て来い
358=348(・∀・)
でした。
キャッシュを残す奴は厨房未満
Noarchiveこそ正義
↑出たよ、煽り豚。一生そうやってブーブー鳴いてろ。
最初から読んだけど、100あたりで結論出てるだろ。 なんでこんなにレスついてんだ?
>>45 を見てると、若かった頃の自分を見ているようで歯痒い。
371 :
Name_Not_Found :02/07/10 19:48 ID:2PDUIzfE
Googleってディープリンクになってるよね。
373 :
Name_Not_Found :02/07/10 19:49 ID:2PDUIzfE
検索エンジンの検索結果にまでリンクしてるGoogleって、、、。
>>372 ごめん。どこでもだった。
でもそう考えると結構すごい事してるよね。
ハニー、俺が悪かった。戻ってきてくれ。
↑出たよ、煽り豚。一生そうやってブーブー鳴いてろ。
なんだか荒れちゃったナア……。祭りの後、って感じ。
379 :
Name_Not_Found :02/07/10 23:28 ID:3QMqg+kQ
<meta name="robots" content="none">さえ書いとけば 最強なんだろ? <meta name="robots" content="noarchive">なんていらねえんだろ?
>>379 初心者スレで聞くべきなのかなあ。
<meta name="robots" content="none">書いとけば
ググルも含めて弾けますか?
ってかそれだと検索すらされないじゃん。 検索はされたいけどアーカイブはされたくないときは noarchive。WayBack Machine対策にはRobots.textが必要。
>>381 あっ、そか。失礼しますた。ありがとう。
>>383 ローカルでドグマティックワールド構築して独りで引き篭もっていろ。
386 :
46 :02/07/12 11:47 ID:tyqydX1V
うるせー莫迦
あげんなハゲ
388 :
♪ :02/07/12 12:49 ID:???
こ の ス レ あ げ る と 過 剰 反 応 す る や つ い る ん だ よ な ー ワラ
人のサイトをパクって商売する。 それがウェブアーカイブ。
パクるとかいう言葉が出てくる時点でWWWの理念を理解していないよねー
392 :
Name_Not_Found :02/07/19 16:24 ID:s0Dsoz6o
393 :
Name_Not_Found :02/07/20 20:38 ID:DrRHwaz2
漏れのPCにはここ5年に漏れが見て回って採取した Webキャッシュが8GB程保存されているんだけど、 元のサイト作者に無断で公開してよいんだよね?
395 :
Name_Not_Found :02/07/21 05:58 ID:dxiLqtYQ
あのー、他人が作ったWebページをそっくりそのままアップした 会社員が書類送検されたんですけどー、合法と言ってるのは 馬鹿ですか?それともネタですか?
397 :
Name_Not_Found :02/07/21 06:57 ID:dxiLqtYQ
検索には掲載されたくないでつ。
400 :
400 :02/08/25 21:54 ID:???
そうね
age
>>45 の人格がもうちょっとまともならここまで荒れなかったかもしれないスレはここですか?
保守
保守
このスレの内容、かなり有益だと思うんだけど、919がまとめてくれるかな(w
age
FAQサイトにどこを抜粋すると?
岡田克彦ファンクラブからのご案内です。ご高承のとおり、岡田克彦氏の卒業した早稲田大学政治経済学部
と、ひろゆきの卒業した中央大学文学部は比較にならないほど差があります。中央大学文学部のような
ヘボい大学に共通しているのは、文化水準が低いという事です。18歳から22歳をヘボい大学で過ごすという
ことは、感受性において致命傷と言えます。2ちゃんねらーの大半は岡田克彦氏に比べて、著しい低学歴で
頭が悪いだけでなく、感受性も愚鈍で腐っているという、取り返しのつかない状態なのです。
せめて、
http://www.geocities.co.jp/MusicHall-Horn/1091/で 、岡田氏の作品に触れましょう。
age
410 :
山崎渉 :03/01/23 03:00 ID:???
(^^)
411 :
Name_Not_Found :03/02/04 06:22 ID:L0aD6rgT
robots.txt
それより、何度URL登録してもキャッシュが更新されないページがあって 困ってるんだが。どうすればいい?
昨晩、やっとキャッシュが最新の物に更新されたと思ったら、 先刻見たらまた古い時の状態に戻ってしまってた。 (だから加筆した部分の語彙では検索に引っかからない。) 何なの、一体?
METAもhtaccessも入れてるのにいんふぉしーくに検索引っ掛かってる模様。 なんでだろー、と調べていたら。 CGI少年、ぬっ頃す。
皆さんはウェブマスター初心者ですか? アップ前にNA(NoArchive)の登録しないと危険ですよ。 NAの登録せずにアップした場合、 あなたのウェブサイトの過去の情報が他人に見られる恐れがあります。 そして、簡単にあなたの過去の内容等抜かれ、パクリ情報まで公開された人も数多くおり 社会的に抹殺されてしまう。それがインターネットの隠れた素顔でもあります NAを登録しておけばまず抜かれるキャッシュ情報自体が無効になってしまうので どんなにスキルがある人でもぐーぐるでキャッシュを抜くことが不可能になります NAを登録する方法は、メタタグで、 「<META NAME="ROBOTS" CONTENT="NOARCHIVE">」と入れる。 これでNAの登録は完了します。 一度登録すれば、メタタグ記述を変えない限り継続されます。 インターネットはルールさえ守れば危険な場所ではありません。 しかし悪意を持った人間も確かに存在します。気を付けて下さいね。 NAは、正式にはNOARCHIVEコマンド、 又はネーチブと読みます。 元々はアメリカの学生達の間で、検索の時に サーバーダウンを強化する為に開発されたシステムです。 メタタグをHTMLに組み込むのは結構面倒なのですが、 盗用してたらパクリ先に抗議されたとか、 著作権が侵害された等の抗議がうざったくなったロボット型検索エンジンが、 仕方なく導入しました。 悪意のある人間に晒される前にNAを施す事をお勧めします。
自分から世界に公開しておいて"悪意のある人間に晒される"とは、 これまたひどく頭の弱いお方がいらっしゃいますね
422 :
山崎渉 :03/04/17 15:52 ID:???
(^^)
423 :
山崎渉 :03/04/20 04:03 ID:???
∧_∧ ( ^^ )< ぬるぽ(^^)
googleのキャッシュは手動で削除できるよ。 漏れはサイトを引っ越したときなんかは手動で全部削除してる。
425 :
山崎渉 :03/05/28 13:23 ID:???
∧_∧ ピュ.ー ( ^^ ) <これからも僕を応援して下さいね(^^)。 =〔~∪ ̄ ̄〕 = ◎――◎ 山崎渉
どっかの厨は自サイトのリンクページででかでかと、 「閉鎖されたしまったサイトの見方♪」 とアーカイブを自慢げにあげていた… フォントでかすぎ、色は赤! だ、誰か!!
>>27 昔、FBIが関与してるって噂が、一部で・・・
もっと晒してくれ
431 :
Name_Not_Found :03/07/11 12:29 ID:oTATeLep
漏れら極悪非道のageブラザーズ! 今日もネタもないのにageてやるからな!  ̄ ̄∨ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ∧_∧ ∧_∧ age (・∀・∩)(∩・∀・) age (つ 丿 ( ⊂) age ( ヽノ ヽ/ ) age し(_) (_)J
432 :
Name_Not_Found :03/07/12 18:05 ID:7Ded27Gs
433 :
_ :03/07/12 18:09 ID:???
434 :
Name_Not_Found :03/07/13 04:45 ID:AlwzjMAb
435 :
_ :03/07/13 04:58 ID:???
436 :
Name_Not_Found :03/07/13 12:33 ID:i/IUwJ0N
437 :
_ :03/07/13 12:34 ID:???
__∧_∧_ |( ^^ )| <寝るぽ(^^) |\⌒⌒⌒\ \ |⌒⌒⌒~| 山崎渉 ~ ̄ ̄ ̄ ̄
>>27 UA:ia_archiverでアクセス拒否にすればよろし
糞みてーなサイトなんかグーグルだってお断りだよ。
ハッキリ言ってアメリカなどの多民族国家では黒人の方がアジア人よりもずっと立場は上だよ。 貧弱で弱弱しく、アグレッシブさに欠け、醜いアジア人は黒人のストレス解消のいい的。 黒人は有名スポーツ選手、ミュージシャンを多数輩出してるし、アジア人はかなり彼らに見下されている。 (黒人は白人には頭があがらないため日系料理天などの日本人店員相手に威張り散らしてストレス解消する。 また、日本女はすぐヤラせてくれる肉便器としてとおっている。 「○ドルでどうだ?(俺を買え)」と逆売春を持ちかける黒人男性も多い。) 彼らの見ていないところでこそこそ陰口しか叩けない日本人は滑稽。
442 :
ヌー速より :03/07/27 20:22 ID:yEogUpZ9
(^^)
(⌒V⌒) │ ^ ^ │<これからも僕を応援して下さいね(^^)。 ⊂| |つ (_)(_) 山崎パン
445 :
Name_Not_Found :03/08/27 23:00 ID:NHaJP1MH
もう既に、自分ではどうしようもできないのを archive.org から 削除してもらうのってどうしたらいいでつか 垢削除したから、METAタグにどうこうできないし archive.org って何年ぐらい晒され続けるの?
447 :
Name_Not_Found :03/08/30 12:01 ID:bvXO9uyh
googleは対応しているようだけど、archive.orgもmetaタグによるロボット避けに 対応しているの?
448 :
Name_Not_Found :03/08/30 17:41 ID:upscCebV
>>447 対応してる。archive.orgにも書いてあるはず。
449 :
445 :03/08/31 12:48 ID:???
450 :
447 :03/09/02 19:52 ID:jgDnSTf3
>>448 サンクスです。早速、metaタグ入れてみました。
>>450 メタを無視してくれるありがた〜〜いロボット君もいることをアドバイスしておく
初心者板に行くべき内容だったらすみません。 metaタグによるロボット避けというのは、 検索エンジンごとに設定するのですか? 一つで全部のエンジンに対応するのですか? フロントページエクスプレスで作ったので、 タグというもの自体になじみがありません・・・
453 :
452 :03/09/03 03:32 ID:???
グーグルはいいけど、インターネットアーカイブ には収録されたくないということです。
454 :
Name_Not_Found :03/09/10 12:14 ID:0bYPYhSI
Google五周年age
455 :
Name_Not_Found :03/09/14 03:12 ID:hav9YZK4
>>452 そういう場合は、また別のタグの書き方があったような。
「とほほのwww入門」あたりに載ってなかったっけ。
>>451 そのようだね。robots.txt置けない環境は辛いよ。
archive.org対策ってことで、metaタグの他には、自分はフレームを多用している。
気休めだけど。
フレームを使ってたり、JSのボタンで次のページに行かせるような構成にしてあると
璧には収蔵されにくかったりするじゃない。
なんかもっと良い方法ないかなぁ。
璧には→完璧には
457 :
Name_Not_Found :03/09/14 03:28 ID:s5HrIGwF
ほんとミスしてアップして、 間違い探し好きなアホ二チャンねらーに見つかると 大変だよね。いやまじで。
ミスしたら、直せばいいだけ。 保存されるのがイヤなら初めからアップロードしなければよいヨ。
459 :
Name_Not_Found :03/09/14 07:41 ID:s5HrIGwF
保存ならぜんぜんいいけど、祭りになると手がつけられんのよ。 企業のミスだってそうでしょ。周りが静かに、運営元に連絡して やりゃいいのに、かってにでかくして、被害者増やして、 ログを保存して骨の髄まで貪り祭る。 もう、ハイエナ系ちゃんねらーはうぜー。 まぁ、企業の場合の方が楽かもね。ある意味。 個人サイトがこれにあうとほんとつらいぜよ。 著作権関係はもうあきらめた。 警告しても次から次とでてくるから、もう放置だよ。
安心汁、喪前のサイトごとき誰も騒がんよ
461 :
Name_Not_Found :03/09/14 08:01 ID:s5HrIGwF
ある程度ヒットするサイトつくってみ。 否が応でもここが(2ch)ネックになってくるから。 誰もが感じてる事だろう思うけど。
評判されるのが怖ければサイトなんて作りなさんなってことだ。
>>461 そりゃ厨が集まるようなサイトだからだろ
>>461 被害妄想ではなくて?
そもそもInternet Archiveを使ってまでミスを指摘して騷ぐ奴なんて見かけるか?
騷ぎ立てる馬鹿者どもは、Wayback Machineとか見たこともない無知な連中ではないのかな。
465 :
(*∠_*) ダカラドーシタ :03/09/27 17:13 ID:hW5Ywwz+
466 :
Name_Not_Found :03/10/07 01:04 ID:y1JMCMQG
昔やっていたサイトがとあるサイトの劣化コピー品で、著作権所有者に怒られて閉鎖しました。(謝罪は行い、許しも頂けました) そのサイトがWebArchiveにまだ残っていて、非常に困っています・・・ 存在する事はWebArchiveが出てきたばかりのころに気付いていたのですが、 愚かな自分の愚行を見たくなく、精神的に逃げてしまい、削除依頼も出していませんでした。 何とか消してもらいたいのですが、 どの様なメールを出せば削除又は非公開にしてもらえるのでしょうか? 英語はほとんど解りません… いくら罵倒されてもかまいません。どなたかご教授下さいお願いします。
死ねばいいんじゃん? なんちゃって
468 :
Name_Not_Found :03/10/07 19:41 ID:8Jadebqv
メリケンが削除なんかするわけ無いだろ
469 :
Name_Not_Found :03/12/25 11:28 ID:2q2FDX/X
参考になったので保守
471 :
Name_Not_Found :04/01/21 23:01 ID:FZXzAsgq
経ったのはず
473 :
471 :04/01/21 23:18 ID:???
自己レスですが解決しました
475 :
Name_Not_Found :04/01/29 10:06 ID:nKGkPLGP
robots.txtを置いてGoogleキャッシュ削除の手続きをしたのですが、 robots.txtの場所を入力して削除ボタンを押すと以下のようなメッセージが あらわれました。 robots.txt ファイルの管轄外にある URL には、次の規則が適用されます。 DISALLOW / これって正常に削除されているんですか?削除ステータスには何もあがってこない のですが…。手順が間違っていたら教えてください。
476 :
Name_Not_Found :04/03/24 13:13 ID:NeSHP/bm
477 名前:Name_Not_Found[sage] 投稿日:04/03/25 21:03 ID:???
>>476 >>446 で紹介されてる
[email protected] に送ったら、対処して貰えたよ。
478 名前:476[sage] 投稿日:04/03/26 12:43 ID:???
>477
メール送ったら、すぐに返事がきて「削除したよ」とのことです。
確認したらきちんと削除してありました。
ありがとうございました。
保守
消したがるのって腐女子が多い気がするから確かに男ではないのだろう
Web制作板とか言って厨多すぎですね
そうですね
<meta name="Robots" content="NoArchive"> これをファイルごとにかいてアップロードすればキャッシュが残らないんですか? それともrobots.txtってファイル作って ↓をかいてうpしておけばいいの? User-agent: * Disallow: /
俺の恥を残したくない。 最初作ったHPをローカルに置いてあるが3年前それを見て驚愕して 最初のページだけ見てエクスプローラーの×を押し目を伏せたことがある。 あれから3年・・・恐ろしくて開けないってのにそんなもんを未だに 全世界に向けて保存しとくなバカ
>>484 だったら最初から公開しなければよかったのに。
インターネットはもともと公の場だよ。
>>485 最初からすげー洗練されたページ作れりゃ誰も苦労はしない。
そんな事も感覚的にわからんのか?
洗練されてから公開すればいいんです。
>>484 わかるわかる。
何かものを作るってのは、そういうもんだ。
>>487 それだと一生何も物を作れない罠。
>>486 そんなことはわかっている。そんな問題じゃなくて
インターネットが本来どういう場所でどうあるべきなのか考えたほうがいい。
何もすげー洗練されたものを最初から作る必要はないが
公の場だということを踏まえて作るべきではあると思うよ
>>489 リアル消防に官が企画的に作り方教えるのが必修な今の世で
んな自分だけを正当化してる馬鹿丸出しな発言されてもなあ。
何も金もらって作ってるわけじゃねえし最初から洗練されたもの作れりゃ誰も
苦労しないってことがわかってないから
>>485 みたいなピンボケ発言できるんだよ。
まぁ煽り抜きで全部痛烈なるマジレスな。
後から恥ずかしいと文句言うなら公開するなってことでしょ。
>>492 ってマジレスするのも呆れるほどマヌケなレスだな。
こういう曲げ厨の相手すんのってめんどくさい事この上ない。。。
検索・登録対象から除外しているディレクトリの特定のファイルを 検索・登録対象にする場合のrobots.txtの記述は下のような感じでOKですか? User-Agent: * Disallow: /example/ Allow: /example/test.html (空行1行)
496 :
Name_Not_Found :04/09/17 23:06:32 ID:pmLRZwgG
質問なのでageさして下さいね
理論上はそれでいいはずだけど ロボットがAllow:に対応してるとは思わないほうがいいよ
>>497 レスdクス
一晩待ってレスが無かったので、別スレで問合せた所、
AllowはGoogleに対しては、効果がない、との回答もらいました
499 :
495 :04/09/23 12:57:10 ID:???
Googleから回答が来ましたので、報告 --------------------------------------------------------------------------------------- Googleへご連絡いただきありがとうございました。 ロボットがクロールできるようにrobots.txtを作成するには、 以下のように「Allow:」で始まる記述を「Disallow:」で始まる記述の前に記載していただく必要があります。 --------------------------------------------------------------------------------------- User-Agent: * Allow: /example/test.html Disallow: /example/ (空行1行) 上のような記述であれば、OKみたいです
archiveに削除依頼したら 担当した人によって対応の仕方がちがうのか 本当に貴方のサイトなのか?という返事が返ってきた・・・ サーバーのメルアドで丁寧な英語メールを出したのに・・・ 少しムッとしたがドメインとサーバー使用の領収書を添付して きつーい言葉で削除しろともう一度メールしたら朝一で消されていた 強気の方が対応が早いのか?
501 :
Name_Not_Found :04/10/19 00:24:11 ID:VDGHMVfN
499>>(空白1行)には何の意味があるのですか・・・?
>>501 何も書かない行を1行入れておくって意味でしょ。
Recallアクセスできなくなってる
Recallはよく落ちてるよ
505 :
Name_Not_Found :04/11/08 08:23:28 ID:Q2nUkUnd
>>483 要するに、METAに
meta name="Robots" content="NoArchive"
とさえ書いておけばgoogleだろうがweb archiveだろうが絶対にHPを保存されないわけだ。
アーカイブアーカイブって言っても、それほど怖くないじゃん。
なんで怖がるのか、何故そんなに過去を湮滅したがるのか、不可解。
508 :
Name_Not_Found :04/11/27 02:09:21 ID:AXv4F7JJ
509 :
Name_Not_Found :04/11/29 02:35:05 ID:LObmcSR6
知識無かったらまずいね。 これ、意外と知られてない事実じゃない? 中学生の頃遊びで作ったHPがネイバーなどに知らないうちに一字一句年代順に完璧にコピーされ 半永久的に出回り続ける・・・ 更新しようが何しようが、とにかくたったの一瞬でもネット上に情報が出回ったら取り消す事は出来ない。 著作権法を盾に禁止しようにも、ネットは世界中と繋がっているから、たとえ日本国内で制限しても 法律なんか知ったこっちゃ無いような国がゴロゴロいるので不可能。 その著作権法ですら現行のままではグレーゾーン。 最初からそんなものを出すなと言われそうだが、誰しもただの日記にまで一字一句気を付けて書く事等できないわけで。 現実ではそんなことを知らされずにHPを作ってしまった人はこのスレッドにもたくさんいるが どうしようもない… web製作者にこのことをちゃんと知らせる決まりを作った方がいいのでは。 それがされてないのなら、「気軽に」HPを作ってみよう!なんて番組や雑誌、プロバイダは詐欺と一緒だよ。 HPを作ることは、未来に対して相当のリスクを背負っている事を実感する。 もしこのスレにそうした運動(HP製作など)が出来る人がいれば協力してほしい。 少なくともrobots.textの作り方などは詳しく書いておくべき。
最初からそんなものを出すな。何でそんなに過去を消したがるのかね。
512 :
Name_Not_Found :04/11/30 16:18:37 ID:2AxQnSSg
間違っていようが入るまいが知りません自己責任で
で、どのタグが正しいの? Googlebot? Robots?
515 :
Name_Not_Found :04/12/06 12:37:41 ID:br9lpgB/
>>509 Archive.orgの問題に関しては、一昔前に割とあちこちで議論になってたけど、
ウェブサイト作成初心者の目に触れていたかどうかは疑問だな。
ネットリテラシーをちゃんと教えずに、便利さばかりを強調する商業出版物は
淘汰されていかなくちゃな。
ただ現在の時点で、漠然と「なんとなくインターネットには怖い側面もあるらしい」ってことは
印象としてネットに疎い人にも伝わっていると思うから、むしろそういうことをちゃんと記事に
入れ込めるほうが、信頼度は上がると思うよな。
516 :
Name_Not_Found :04/12/14 17:05:06 ID:AqBMwuq6
517 :
Name_Not_Found :04/12/16 14:18:38 ID:FT/redux
<meta name="robots" content="noindex,nofollow,noarchive"> <meta name="googlebot" content="noindex,nofollow,noarchive">
metaタグ入れたけど キャッシュは残らないものの検索にはひっかかる
何も知らない頃に作ったぼくのほおむぺえじを卑怯にもコソーリ保存しとくと言う 卑屈且つ姑息な手段が許せん。今ならいくらでもかかってこい状態だがなw
卑屈とか姑息とか意味解って使ってるかチミー?
521 :
Name_Not_Found :04/12/20 00:23:59 ID:TG6/tWaN
姑息ってのは大半が間違って使っていた&覚えていたってのが 最近のニュースであったな
522 :
Name_Not_Found :04/12/20 07:07:31 ID:qKm8hCZP
融通などきかせるな
524 :
Name_Not_Found :04/12/20 11:51:31 ID:vv8rHpnV
>>509 洩れ自身は、Net上から「日記コーナー」とかbぉgとか、役に立たんものは消えて無くなれとか思ってるけど、
現状社会は逆に動いてるでしょ。
そも、Archiveの役割がよく解らん。
Net上の物を記録してどうしようってのよ?
後で恥かしい文章やFileを見せて人を脅迫しようってのか?
多人数が必要だと思う情報なんて、
収集業者が無理しなくても、誰かが保存して役立てようとするか商売に使うもんだろ。
著作者が収集回避出来ない仕組みなんて論外だな。
>>525 23世紀くらいに「20世紀のインターネット」なんていう
展示会をやるときにでも使うんでしょ。アーカイブっていうくらいだから。
もう著作者は死んでるだろうから、問題ナシです。
博物館に江戸時代の絵巻が展示されていて、
みせものにされたり、研究材料に使われたりするのと同じ感覚かと。
527 :
Name_Not_Found :04/12/21 22:28:27 ID:Oe5KwH9M
>>526 それが「未来に対しての無限大のリスク」の
ほんの一部だね。
>>484 タソは、同じファイル名で別の内容もう一回うpすればいいんじゃ?
530 :
517 :04/12/22 00:28:09 ID:XV1IYZrR
531 :
Name_Not_Found :04/12/22 00:54:36 ID:2V9rDwhI
グーグルはじいたら、訪れるやついなくなるぜ。
身内だけにしか知られたくない場合それでいいんじゃない? グーグル弾き+パスワード制で。
>>530 nameは大文字が正しいんじゃないの?小文字でもOKなのは拡大解釈してもらえるだけで。
contentは NONE ALL NOINDEX INDEX NOFOLLOW FOLLOW を , で区切って記述。
NONEはNOINDEX,NOFOLLOWと、ALLはINDEX,FOLLOWと等価。
contentのNOARCHIVEはアーカイブするロボットの勝手な拡張。
あとどっかのNから始まるロボットはDoSアタックしてくるから
パケットフィルタレベルで拒否w
しかしrobotstxt.org的にはcase-insensitiveなんだよな
>>533 要するに何なんだ?
そんなに小難しく説明するより、あんたが
模範的な記述をここに書いた方が速いぞ
<META NAME="robots" CONTENT="noindex,nofollow,noarchive">
<META NAME="googlebot" CONTENT="noindex,nofollow,noarchive">
↑これが模範例じゃないかな?
>>533 の日本語を正確に再現すると
<META NAME="robots" CONTENT="NONE,ALL,NOINDEX,INDEX,NOFOLLOW,FOLLOW">
ってことだが。矛盾しちゃう。
多分、↓こうしろということをいいたのだろうけど。
<META NAME="robots" CONTENT="NONE,NOARCHIVE">
content内を大文字が正解 <meta name="robots" content="NOINDEX,NOFOLLOW">
NOINDEX,NOFOLLOWは大文字のほうがいいんだっけか
実際には小文字でも通用するけどね
大文字小文字を間違えるとまずいのはDTD宣言。 それ以外はハッキリ言ってどちらもでいい。 作成ソフトやエディタでも小文字で吐くやつもあれば大文字で吐くやつもあるし。
>>541 XHTMLではタグは小文字と決まってるんだが。
543 :
Name_Not_Found :04/12/22 22:07:18 ID:r13JxYwv
546 :
Name_Not_Found :05/01/22 16:29:09 ID:t9lcvif7
保守
547 :
中島 :05/01/25 19:16:00 ID:???
どちらの書き方が正しいのでしょうか? @---------------------------- User-agent: searchpreview User-Agent: ia_archiver Disallow: / A---------------------------- User-Agent: ia_archiver Disallow: / User-agent: searchpreview Disallow: / googleで検索すると、Aは効果がないらしいとの事ですが ある複数のロボットを指定したい場合どちらが効果があるのでしょうか よろしくお願いします
質問なら上げてみてはどうか
549 :
Name_Not_Found :05/03/01 09:52:29 ID:GxsRpJVb
>>547 Aの方法の場合、間に一行開けると良いと聞いた。こういう風に
User-Agent: ia_archiver
Disallow: /
User-agent: searchpreview
Disallow: /
で、やってみたが効果はなかった。
@はやったことはない。
grub-clientも俺は弾きたい。
三つ弾きたい。どうやったものか。
発想を変えてみる。 Googleとslurpだけ許可したいとき。 User-Agent: * Disallow: / User-Agent: Googlebot Disallow: /hoge/ User-Agent: slurp Disallow: /hoge/ /hoge/ は存在しないディレクトリを指定する。
551 :
Name_Not_Found :2005/03/25(金) 01:55:01 ID:wVs+2Lpf
Googleから削除されない・・
552 :
Name_Not_Found :2005/03/26(土) 13:33:19 ID:x5rjTlqC
Google 削除要請出して、削除完了 となっているのに未だにインデックスされてる。 迷惑この上なし。 不人気サイトは掲載されないし、人気サイトは削除してくれっつっても掲載 される。削除依頼にも応じない。なんか、上場してからおかしくなってきたね。
>>552 うーん。
robots.txtちゃんと設定してる?
554 :
Name_Not_Found :2005/03/26(土) 22:32:26 ID:x5rjTlqC
削除完了 となっている
555 :
Name_Not_Found :2005/03/26(土) 22:33:33 ID:x5rjTlqC
>>553 metaタグに noindex noarchive 入れてる。そして完了となった。
>>555 とりあえず、もう2ヶ月ほどまってみなよ。
それで駄目なら、自動 URL 削除システムとやらを使って消しちゃおう。
>>556 その自動URL削除システムを使って削除したんですよ。
そして、削除完了 とステータスがなっているにも関わらず未だに掲載中。
さらに、未だに掲載されているのでもう一回削除システムに削除依頼だしたら
受け付けてくれなかった。
それなりに人気があるサイトなんだけど、人気サイトは削除しませんってこと
なんだろうか。
逆に掲載してほしいのにいつまでたっても掲載してくれないサイトもあるし・・・
>>557 あれは確か、受け付けてから実際に消えるまで、多少時間がかかるよ。
559 :
Name_Not_Found :2005/03/31(木) 19:44:38 ID:bA0sz/rm
質問なのであげさせて下さい。 Internet Archiveに削除依頼を出したのですが 返信に そのHPにあなたの使ってるメアドを載せてくれ というような内容がありました。 つまり本人確認をしたいという感じの内容でした。 ですがそのHPはもうアカウントも削除していて 現在は存在してないのでできません。他の方法を ぐぐっても削除に成功した方の例は皆現在も そのままHPを運営している方々達の話ばかりでした。 本人確認ができないと却下されそうな感じの内容 だったので返信に困っています。 今は存在しない過去のサイトの削除依頼に成功した方 いらっしゃいましたらアドバイスお願いします。
なんでそんなに過去を消したがるのかねえ。
>>557 ,558
即、消すなら、robots.txtが必要じゃないかな。
ほら、
注意: 緊急を要し、Google が次回サイトをクロールするまで待てない場合は、
自動 URL 削除システムをご使用ください。 この自動プロセスが機能するためには、
Web マスターがまず robots.txt を作成して問題のサイトに配置する必要があります。
って書いてある。
ただ、これ使うと使った記録がいつまでも残りやがる。
>>559 前に同じ状況で依頼した事あるけど、すぐ消してくれたよ。
メアドも何も聞かれなかった。
鯖移転したのでrobots.txt置けない(サイト弄れない)とか書いてメールした気がする。
>564 そうなんですか、そういう事例聞けると励みになります(TДT) (何で自分の時は身元証明求められるんだ…orz) 本人証明できる手段はないけど消してくれというような文を とりあえず再度送ってはいるのですが 承諾されるのかどうか返事待ちの状態です。 (1回目の依頼の時すぐ返信来たのに2回目は中々来ない) あと無断使用禁止の注意文を載せていたページも キャッシュされていたのでそのページと文を主張して 前から意思表示している事も伝えました。 これでなんとかなればいいのですが。
566 :
Name_Not_Found :livedoor06/04/01(金) 16:21:31 ID:KkiLYdYH
Googleはカスラックに通報されてください
今グーグルって死んでる? アクセスできないのだけれども。
URL自動削除システムで削除完了となっているにも関わらずしつこく掲載。。 つまり人気サイトにボイコットされるのを怖がっている検索エンジン各社。 不人気サイトは掲載すらしない、人気サイトは削除してくれない。お行儀悪い! 不人気サイトでも質が高ければそのうち人気サイトになるんだから、掲載してやれよ。 人気サイトでも、これ以上人を増やしたくないサイトもあるんだから、削除してやれよ。
>>562 robot.txtがなくても、metaタグに記載すれば削除する と書いてある。
実際に普通のサイトだとすぐにそれでも削除される。
今回分かったのは人気サイトは削除依頼をして、ステータスが{削除完了}
となっても人気サイトは削除されないということ。
570 :
しつこいな :livedoor06/04/01(金) 22:36:14 ID:???
>robots.txtが必要 metaタグに記入してURL削除システムで申請。それでいいんだって。 >あれは確か、受け付けてから実際に消えるまで、多少時間がかかるよ。 だからぁ、いつまで経っても消えない。以前はすぐに消えたのに。。
559=565です。 一応報告。無事今日消されました。 英語は苦手だったから神経使って凄い疲れたorz
あったお(゚ρ゚) >Internet Archiveに削除依頼を出したのですが >返信に そのHPにあなたの使ってるメアドを載せてくれ >というような内容がありました。 >つまり本人確認をしたいという感じの内容でした。 アーカイブしえっ
誤爆すみません
どこの誤爆かわかった
俺もGoogleから削除されなくて困ってる。 全くもって誰も訪れないファイルなんだけど。 もう最初の申請してから半年経つのに。
577 :
Name_Not_Found :2005/05/01(日) 19:01:27 ID:OL89ggIB
orgなうちのサイトは対象外か
.npは?w
582 :
Name_Not_Found :2005/05/23(月) 14:48:48 ID:diri+SYx
Googleって何で糞なんだ? Googleで違法ファイルはバンバンDLできるし。どおりで Google使ってる奴って厨だらけなんだな
>>583 フェアユース規定がある米国とない日本の越えられない壁だな
>>583 フェアユース規定がある米国とない日本の越えられない壁だな
俺のバカサイトは収集対象なんだな
587 :
Name_Not_Found :2005/07/07(木) 01:05:38 ID:mAGgz0/E
過去にも同じ内容のカキコがありますが、質問させてください。 Internet Archiveの削除依頼の件で困っています。 依頼をメールで出したのですが、一向に反応がありません。 通常はどのくらいで削除してもらえるのでしょう…。
589 :
Name_Not_Found :2005/07/24(日) 15:45:20 ID:hhRGE6oz
無料鯖だと、ろくに.htaccessもrobots.txtも置けないから、はじくの難しいんだよね。 特にweb.archive.orgが一番困る。 漏れは今のところ、metaタグはデフォとして ・ハイパーリンクに、flashやjsを使う ・サイト内にフレームなどを多用して、なるべく1枚のhtmlにすべての情報をおかないようにする(収集確率が少し減る?) とかやって、少しでも収集確率減らそうとあがいてるけど、他に何か良い手はある?
591 :
ラブ天使 :2005/07/24(日) 18:38:46 ID:+a13nFAd
ァ ∧_∧ ァ,、
,、'` ( ´∀`) ,、'`
'` ( ⊃ ⊂) '`
∧_∧ ミ ギャーッハッハッハッ!
>>590 め、何言ってんだかー!!
o/⌒(. ;´∀`)つ
と_)__つノ ☆ バンバン
>>587 すぐやってもらえたのは3年前位までだよ。
その時もlennyタンは協力してくれなくて悲しいよって反応だったし、
頼めば消してもらえると思われてることを知っちゃったみたいだね。
ちゃんと探せば無料鯖で.htaccess使えるところあるし
最近はサブドメイン仕様でrobots.txt置ける無料鯖も多いし
596 :
Name_Not_Found :2005/07/31(日) 03:17:29 ID:y3ZdRS3x
Googleにrobots.txtを使ったURL削除申請をした後で、そのURLを復活させるのはどうすればいいのだろーか。。。 いったん削除申請して完了されてしまうと、金輪際それを含むURLはヒットしないのかなぁ。。。orz...
>>596 robots.txtを戻してURL申請してみなされ
598 :
596 :2005/08/01(月) 21:25:01 ID:???
>>597 状況かわんねっす。。。
180日間の喪があけるのを待つしかないのかなぁ。。。
599 :
596 :2005/08/27(土) 10:36:01 ID:n7Cn7bQi
URLの削除の申請から180日経過してもまったく状況が変わりません。 URLの削除のところにログオンしてもステータスは「完了」のまま。 2003年のキャッシュの削除の申請については「期限切れ」になっているんだけど。 Googleの問い合わせられるフォームやらメールやらは英文も含めて全部問い合わせたけど、音沙汰無し。 まあ、Yahoo!やらMSNやらでは普通に検索ヒットするから別にいいんだけど、 今の状態だとGoogle AdSenseが使えないというのがなかなか痛い。。。
600 :
596 :2005/09/03(土) 00:28:19 ID:2ZE2QuAW
この件ですが、何日か遅れて期限切れ扱いとなり、無事表示されるようになりました。 ただ、Googleから「こっちでサーチしたら引っ掛かるよん」という返信メールがあって確認したらそうなっていたので、 ひょっとしたらGoogle側で何かダマテンで作業をしてくれて、そのお蔭で復活したのかも知れません。
作成時にrobots.txtをおいて metaタグまで記入したのにグーグルから検索できたんだけどどういうこと?
スペルミスとか。
web.archive.orgやalexaでhomepage2.nifty.comなど一部のドメインがブロックされてる模様。
blocked site error
605 :
Name_Not_Found :2005/11/12(土) 15:41:29 ID:7prfaJLI
,. -─‐- 、 , '´ ヽ / /ヽ\ ヽ / / `、 \ ヽ ゙, .i i ヽ、`ヽ、 \ ', i !. ==、 `ヽ、`ヽ、! | l丁 ̄ ̄`i-f´ ̄`ヽ、ヽ ! | !.ヽ --‐' `ー‐一1ヽi | i i 丶 ! ,' ! ! `ー '" ,' i ホームページのダウンロードや印刷は禁止します i /ヽ ー一' /ヽ、! アーカイブも禁止します V \ ,、 .// ヽ 、_ .r'"´ ̄ |. /,へっ‐'" / i ``'‐- 、 / / | / く★へ ,. へ、. l ヽ ./ ⌒ / /`) ヽ/ i
606 :
Name_Not_Found :2006/01/12(木) 16:40:19 ID:5QN9UFCO
dobai
607 :
Name_Not_Found :2006/01/14(土) 11:27:45 ID:aiwZtVb5
あどふぃ 武運
このスレ初めて読んだ。 まあWebArchiveだとかGoogleCacheだとか嫌がる人はいるだろうなとは想像できるけど、 ネットに公開している以上そんなの気にしていられない、というのが個人的感想。 はっきり言って、世の中の大半の人にとっては 俺たちが過去にどんなサイトを作っていたのかなんて全く興味ないわけで。 なんだかとっても自意識過剰っていう感じ。
>>608 同意。問題は著作権なんだよな。
転載みたいなものだし…
610 :
608 :2006/01/17(火) 01:28:35 ID:???
>>609 URLで出所が明示されているわけだし転載じゃなくて引用でしょ。
引用は著作権的にOKだから問題ないと思うけど。
自分のサイト内の該当ページを既に削除していたとしても、 検索エンジンに該当ページがキャッシュとして残っていた場合、 そのキャッシュが原因で企業からヤバイ警告とか来ますか?
Googleのキャッシュはまだしも、Webarchiveみたいに自分が削除しても半永久的に残るのは嫌。
>>610 日本の法律での引用の条件を満たさないので、引用とはみなされない。
出典の明示だけじゃなくていろいろ条件があるから調べてみれ。
普通に考えれば、まるごと転載して「引用です」なんて通るわけがないわな。
614 :
609 :2006/01/20(金) 17:56:51 ID:???
>>610 あれは、引用ではなくて「まるごと転載」…。
転載も出典を表示してれば問題ない…ということはない。
613も言ってるように、引用と転載はまるっきり違う。
615 :
Name_Not_Found :2006/01/21(土) 19:59:15 ID:u1WfF9rt
キャッシュ(アーカイブ=書庫)って何のためにあるの? リソースが削除されても見れるように?
617 :
Name_Not_Found :2006/01/21(土) 20:14:27 ID:u1WfF9rt
そうそう…… でも一応「次回のクロール時にnot foundなら削除」とは書いてあるのね で、いつ次回のクロールが来るかはyahooが決めるわけ これっておかしくない? その文書の著作権者がcacheも管理すべき
ファイル自体を消すより内容を空白に書き換えたほうが 実質的に速くキャッシュから消せるということ?
全然違う
620 :
Name_Not_Found :2006/01/24(火) 14:49:29 ID:+15fj1G5
昔作っていたHPがググルのキャッシュに残っている事を知り、 今日の朝、緊急で削除申請したらキャッシュは無事削除された・・・ でもまだ検索結果にページタイトルと以前ページに書いてた文章が表示されるんだよね この表示結果も削除したいんだけどどうすればいいの?
もっと待て。 それから、過去を隠すな、女々しいゾ。
女々しいとかそういう問題じゃないだろ? なんでそういう根性論精神論に持ってく馬鹿ばっかなんだろう やってらんないね
既出ってか自分の書き込みだろw
差別語を連呼
キ○ガイさんはスルー。 議論もできない腰抜けか どっちが女々しいんだか
でらえもん調査局の話しようぜ
,. -─‐- 、 , '´ ヽ / /ヽ\ ヽ / / `、 \ ヽ ゙, .i i ヽ、`ヽ、 \ ', i !. ==、 `ヽ、`ヽ、! | l丁 ̄ ̄`i-f´ ̄`ヽ、ヽ ! | !.ヽ --‐' `ー‐一1ヽi | i i 丶 ! ,' ! ! `ー '" ,' i ホームページのダウンロードや印刷は禁止します i /ヽ ー一' /ヽ、! アーカイブも禁止します V \ ,、 .// ヽ 、_ 法律は糞くらえだ俺が嫌だと言っている .r'"´ ̄ |. /,へっ‐'" / i ``'‐- 、 / / | / く★へ ,. へ、. l ヽ ./ ⌒ / /`) ヽ/ i
631 :
Name_Not_Found :2006/03/20(月) 13:10:38 ID:fAWO+d9M
アーカイブ使えばフラッシュ取り放題だぜー
ぅーん…。 ずっとこのままなのかな? 嫌って思う人の方が多いんだったら、 アドレス入れて削除ボタン押したら削除できるように… とか、しなきゃいけなくなると思うんだけどなぁ〜… Archive.orgとかの存在を知ってる人が増えるほど… 読まれたくない・読まれて嫌な思いをした…って人も増えるし… 「消したくなったら消せるから」って気持ちだって、大事にしてあげよう?
>嫌って思う人の方が多いんだったら、 >アドレス入れて削除ボタン押したら削除できるように… はっきり言って気にしてる奴は圧倒的に少ないと思われ。 ネットに公開する時点でそんなの気にしてられん。 まあ、 >「消したくなったら消せるから」って気持ちだって、大事にしてあげよう? この意見には賛成だけどね。 保存されない自由というのもあって然るべきだとは思う。 ただしそうなると本人の確認手段が必要になるね。 サイトを持ってる段階ではその主張もできるけど(GoogleSitemapのようなチェックで) サイトを消した後での本人確認は非常に難しいわけで。 それらを考えていくと結局、 archiveとしてとっておくメリット>archiveを消すメリット になってしまうんだと思うよ。企業側からすれば。
634 :
Name_Not_Found :2006/05/24(水) 18:38:25 ID:RLRAkZWR
ドバイ
載せたなら消すな 消すなら載せるな
636 :
Name_Not_Found :2006/05/31(水) 18:34:46 ID:XWp1MCwY
Wayback Machine 止まってる?
637 :
Name_Not_Found :2006/06/01(木) 10:37:04 ID:XDJ6fNww
たぶん 使えないと不便
Page not found We’re sorry, the page you have requested is not available.
やはりそうか 早く復旧しないかな
>>640 見られるページと見られないページに分かれてないか?
見られるページも文字化けばかりだし見られないページは開いても真っ白だし
文字化けは、エンコードを日本語にしてやれば読めた。 しかし、たしかに前はそんな手間は要らなかったな。
Robots.txt置いてもう2週間経つけどWayback Machineからまだ消えない・・・ 8週間以内に本当に消えますか?
載せたなら消すな 消すなら載せるな
今、Wayback Machine 止まっている? しれとも他の人はアクセスできてる?
英語できる人強制的にUTF-8にすんなってフォーラムに書いてきて
648 :
Name_Not_Found :2006/07/06(木) 06:41:01 ID:C+JEbk+S
Googleのキャッシュ死んでね?
651 :
Name_Not_Found :2006/08/21(月) 16:19:07 ID:gH4KSLoP
webarchive見られないぞ!?止まってんの???
652 :
Name_Not_Found :2006/08/21(月) 16:37:20 ID:c635FeOr
最近調子悪いな
そうなんだ。そのまま消滅してくれても構わんっていうか、消えて しまえと思うことが時々あるけどなw
誰かgoogleに有用な検索ワード入れてコピって このページはグーグルのキャッシュのキャッシュです。 っていうのやらないか? 最近のgoogleは広告多いし、検索精度落ちてる気がする。
>>654 「googleは広告多いし、検索精度落ちてる」以上、そのキャッシュもいずれ
精度が落ちるね。
なので、グーグルのキャッシュのキャッシュのキャッシュが必要になる罠。
656 :
Name_Not_Found :2006/09/30(土) 10:23:26 ID:d4gTnwcg
Google検索っておかしくないか。。。w 「php」で検索してすぐに”国境なき医師団日本”だの”FM802”ってw
なんかGoogleからメールが来た。 robots.txtがあるからクロールできないので、クロールできるように書き換えてくれって。 いや、クロールされたくないからrobots.txt置いてるんだけど。
まじで?Googleからそんなメールが本当に来るんか・・・?詳しくきぼん
件名: Google インデックス登録お願い
こんにちは、お客様のサーバーでは robots.txt ファイルを使って検索エンジン
からのアクセスを制御しているため、現在、Google では、お客様のサイトをク
ロールすることができません。 そのため、携帯電話をお使いのユーザーが、
Google を使ってお客様のサイトを見つけることができません。 インターネット
ユーザーの大多数は Google を使用して検索を行っており、検索エンジンからの
参照のうち 50 % 以上は Google からの参照です。 Google の使命は、Google
独自の検索エンジンにより、世界中の情報へのアクセスを可能にし、ウェブ上の
検索経験をより実りのあるものにすることです。 Google では、ユーザーや顧客
がお客様のサイトを簡単に検索できるようお客様のサイト
xxx.xxx.co.jp を Google のインデックスに登録したいと考えて
おります。 Google からのクロールを許可していただける場合は、robots.txt
ファイルに次の行を追加していただくようお願いいたします。 User-agent:
GooglebotDisallow: クロールを許可していていただいてから 4 〜 6 週間後に、
Google のインデックスにお客様のサイトが登録されます。 Google のインデッ
クスにお客様のサイトを登録する方法の詳細については、下記の URL をご覧く
ださい。
http://www.google.co.jp/webmasters/. Google がお客様のサイトをよ
り効率良くクロールするようにするには、サイトマップを作成することをお勧め
します。 詳細については、下記の URL をご覧ください。
http://www.google.com/webmasters/sitemaps/docs/ja/about.html今後とも Google をよろしくお願いいたします。今後、Google インデックスへの登録に関
するメールが不要な場合は、メールにてご連絡ください。お客様のメール アド
レスを Google のメーリング リストより削除いたします。ChrisGoogle クロー
ラーチーム
このメールアドレスは、以前サイトの削除依頼(インデックスからの)を
したときに使ったもので、その時リストに登録されたのかも。
ただ、依頼したサイトと今回のサイトは違うところなんだが。
サイトもメールアドレスもinfoseekのものなので、そっち絡みかもしれん。
ひぇ〜 検索される価値のあるサイトってことか…
ネタだよ、ネタ。 今は、英語による回答のみだよ。
Googleは高度な機械化がモットーなのに、そんなメールを送信してるとでも?
ノリ悪いなw
自分もそのメール来たよ。移転跡地とはいえクロールしてほしくないから
放置してたら、返事の催促メールみたいなのも来た。
今回メールの対象になってるアドレスがinfoseekなんだが、やっぱり
>>659 の言うようにinfoseek関連なんだろうかね?
>>587 Internet Archiveに何としても削除させたい奴は行動を取れ。
うちは口調の厳しい英文で数回抗議して削除させた。
90年代の、METAタグでアーカイブ除けをしてなかった頃のページをな。
相手は横柄な外人だ。
生易しい「お願い」では無視される。
多少厳しい口調で抗議しても一回目は
「ようジャップお前本当にそのサイトの管理人か?」とからかわんばかりの返事が来た。
うちは昔から無断転載禁止と明記していたので
「何勝手に載せてんだこれが読めねぇのかゴルァさっさと消せ」という意味の抗議文を送ってやっと削除された。
>>666 よっぽど残されてほしくないコンテンツ持ってたんだな。
>>1-665 みんなで集団突撃してウェブ魚拓潰そう!
>>630 ネタレスなんだけどスレ住人の総意はマジそれだよな
魚拓ってBasic認証下のページって取れるの?
age
671 :
Name_Not_Found :2006/11/22(水) 23:39:58 ID:zcCiYH1d
検索はして欲しいんだけどキャッシュは表示しないで欲しいんだ robots.txtでNOARCHIVEと同等の設定ってできないのかな
672 :
Name_Not_Found :2006/11/23(木) 00:11:55 ID:eZeUCLRG
,. -─‐- 、 , '´ ヽ / /ヽ\ ヽ / / `、 \ ヽ ゙, .i i ヽ、`ヽ、 \ ', i !. ==、 `ヽ、`ヽ、! | l丁 ̄ ̄`i-f´ ̄`ヽ、ヽ ! | !.ヽ --‐' `ー‐一1ヽi | i i 丶 ! ,' ! ! `ー '" ,' i ホームページのダウンロードや印刷は禁止します i /ヽ ー一' /ヽ、! アーカイブも禁止します V \ ,、 .// ヽ 、_ 法律は糞くらえだ俺が嫌だと言っている .r'"´ ̄ |. /,へっ‐'" / i ``'‐- 、 / / | / く★へ ,. へ、. l ヽ ./ ⌒ / /`) ヽ/ i
>>669 htaccessが効いていたので、多分取れないとオモ。
674 :
Name_Not_Found :2006/11/25(土) 04:23:09 ID:nj0PJAEF
<meta name=”robots” content=”noindex,nofollow”>
<meta name="Robots" content="NoArchive">
ここでは下段のメタタグが上げられていますが、
上段のタグとの違いは何でしょうか。
http://www.archive.org/web/web.php また、上記でアーカイブされちゃっているページを削除願う方法を
どなたか伝授下さい。
675 :
Name_Not_Found :2006/11/27(月) 01:22:45 ID:2xMnqAKU
InternetArchiveにしつこくメールしてやっと消してもらえた。
>>666 を参考に毅然と。
OK Robots.txt置いてありますねーわかりましたそのうち消しますね
的な返事が来て、でもいつまで経っても消されないからまたメール送る
→そのうち消しますねーという返事→メール送る→返事→・・・
を4,5回繰り返した。
[email protected] じゃなくて
[email protected] にメールしたら
やっと消してもらえるっぽい対応の返事が来た
(でも送るアドレス変えたことが本当に対応してもらえるきっかけだったかどうかはわからない)
>>666 みたいなの、そのサイトの管理人だと証明しろっていう内容
証明方法は自鯖にそのサイトの管理人でありArchiveから早く削除しろってtxtをうp
今は解約しちゃってもううpできない古いサイトも一緒に消してもらいたかったんで
「解約しちゃったから証明文うpできないけど、古いサイトに書いてある管理人名も
今のサイトの管理人名も一緒でしょ」って説明したらわかってもらえたらしく削除成功
なんでそんなに過去を消したがるのか、理解に苦しむ。
>>677 英語で。メール内容はこんなかんじのを送りつけた
翻訳エンジンで英語にしたものそのまま貼り付けただけだけど
私のサイトデータを消しなさい
二度とクロールするな
Robots.txtを置いたから早く見ろ
出来る限り早く削除しろ
680 :
Name_Not_Found :2007/01/12(金) 22:39:28 ID:T/oe9OZb
so-netってRobots置けないんだけど、これがインデックスされない原因かな?
>>680 インデックスされないのと、 robots.txt は関係ない。
私のサイトデータを消しなさい 二度とクロールするな Robots.txtを置いたから早く見ろ 出来る限り早く削除しろ
683 :
Name_Not_Found :2007/02/07(水) 00:48:24 ID:hRhfg3VX
>>678 本人に無断で、しかも商用で使われてるのが気にいらないだけ。しかも公にも公表してない。
過去を消す云々はどうでもいい。
一言「あなたのサイトを保存して半永久的に商用に利用していいですか?」
というメールがこれば少しは納得するかもな。
でも答えは「No」だがな。
684 :
Name_Not_Found :2007/03/14(水) 20:58:48 ID:DbBA7I/r
削除依頼送ったがどの程度で返信が来るのやら。
686 :
Name_Not_Found :2007/04/01(日) 23:28:42 ID:aRFJeamt
激しくすれ違いだけど他にアーカイブスレがないので、ここで聞かせてください。 ウェブアーカイブで検索結果のうらるに「sr_nr_」を反映させるには、 フォームタグ内にどんなvalue= name= を既述したらいいのかなあ(´・ω・`)
日本語でおk
marsflag.comとかいうリファラが残っててクロールされてることを知ったが こいつを拒否する方法がさっぱり分からん。 サイトにも拒否方法はまったく書いてないし、偽装してるのかアクセスログからもそれらしき物が見つからない。 とりあえずリファラを弾いておいたが、何か知っている人いたら情報求む。
IPで弾け
693 :
Name_Not_Found :2007/06/18(月) 17:49:46 ID:TbINCN0g
>>一言「あなたのサイトを保存して半永久的に商用に利用していいですか?」 >>というメールがこれば少しは納得するかもな。 >>でも答えは「No」だがな ↑ ギャグです。 笑ってあげてください。
にはは
>>693 >>一言「あなたのサイトを保存して半永久的に商用に利用していいですか?」
コンテンツを金で売る企業があるのか。
2chのdatなら買ってやってもいいがw
勝手にいい加減なタグを書き加えてデタラメなHTMLにされるのが嫌だからnoarchiveしてる。 そんなくだらない理由で?って思われるだろうけどね。
697 :
Name_Not_Found :2007/07/18(水) 22:33:31 ID:iOvf6p4K
うん、思う。 神経質っていうか病的って言うか、キモい。
世間じゃGoogle八分にされたとか喚いてる人もいるが・・・ robots.txtで拒否し、NOINDEXと書いてても、Googlebot君は熱心に 巡回に来ては、検索結果に載る俺のサイト。。。
>>698 うちもそう。いくらrobots.txtで拒否、NOINDEXと書いてもスルー。
あらゆる検索エンジンに登録されまくり。index削除をお願いしても無視。
もう、.htaccessしかないね。
でも近いうちにGoogleにだけは弾くのを止めるつもり。検索エンジンの中では
もっともタグ指定に素直だし更新頻度も早く、アクセスして欲しいキーワードで
きっちりと上位に来るから。
ぐぐれは最強やね。
うちも。 いちおう、noarchiveが効いているのか、キャッシュはされないし titleの表示やbodyのダイジェストは表示されないものの、 きっちり検索結果に載る・indexはされている んだよなぁ。謎。
701 :
Name_Not_Found :2007/08/12(日) 00:37:02 ID:qMvVwwmB
ウェブ魚拓うぜえな
前弾き方を紹介してるサイトを見つけたんだけどなくなってるみたいだから転載 やり方メモっておいただけなんでほんとうにこれで弾けるかどうかは知らない 利用しているサイトのディレクトリトップに、 こういった名前のファイルをまず作る。 .htaccess これが何かはとりあえず無視しておいてくれ。 ファイルの内容に以下の文を記述する。 Deny From 216.237.124. 59.106.19.92 少し幅を取っているが、 これで魚拓されなくなる。 少し解説しておこう。 .htaccessとはApacheというWebサーバのディレクトリ単位の設定ファイル。 さくらインターネットの様なレンタルサーバを使っている場合、 大体これが搭載されている。
Deny Fromというのは 「ここからのアクセスは禁止しますリスト」のことで、 IPアドレスやドメイン名を指定することが出来る。 SPAMを排除したりする場合に利用される。 まぁ、ようするに「ウェブ魚拓」をSPAMリストに入れるって事だ。 ウェブ魚拓のIPアドレスは 216.237.124.114 その他のサービスは 59.106.19.92 で行っているようだ。 59.106.19.92はさくらインターネットのアドレスのようなので、 苦情はさくらインターネットにした方が良いかもしれない。 「〜がやっているサービスで迷惑してます」的な内容をさくらインターネットに送ってあげると良い。
igWebCapもウゼェ。baiduやnaverより酷い。
そして「ニコニコブックマークうぜえ」とは誰も言わないのが2ch的だなw
そもそも存在感がない
707 :
Name_Not_Found :2007/08/16(木) 02:58:53 ID:S/Pi5JeB
marsflag 怖ぇよ。文面1,2行しか出てこない。 画面のキャプからは、元の文面なんか当然読み取れない。 利用者勘違いするって。 で、登録の削除を依頼しようとすると、名前だのメールアカウントだの要求してくんのな。
robots.txtもmeta(noindex,nofollow,noarchive)も無視しておいて 利用者向けにはごちゃごちゃと規制を掲げてやがるし、まじウザイよな。
709 :
Name_Not_Found :2007/08/16(木) 10:14:23 ID:NLv7PFsp
俺の心境はまさしく
>>672 だわ。
ブラウザでの閲覧以外認めたくないし、手元に残されたくもない。
つかみんなで魚拓潰さない?
どうでもいい大容量のページの魚拓とらせまくってディスク浪費させるのはどうよ。
marsflagの足跡を確認している人、IPを報告してもらえたら助かる。 そうすれば禁止できるIP範囲を把握できると思うから。 ウチはまだ形跡が無いんで協力できないが…。
711 :
Name_Not_Found :2007/08/17(金) 17:08:51 ID:4OFyLBfX
とりあえず「Google 宛に送られた法的要請に応じ(ry」の文面は出ないっぽいな
うちが使ってるWeb魚拓弾きおいとくわ #Web魚拓 deny from 216.237.112.0/12
>>710 marsflagにアーカイブされているのを見つけたんでアクセスログを漁ったが
特定が出来なかった。どうもほかのbotみたく特徴的なHost名やUA吐いては
居ない気がする。画像じゃなく普通にページのキャッシュを閲覧できるのなら
ページに埋め込んでいるunix timeで特定できたんだがな・・・・
715 :
Name_Not_Found :2007/08/26(日) 19:26:22 ID:f5wQWLb9
質問です。 /index.php?page=1, 同page=2, 同page=3 ...というURLのファイルをrobots.txtで拒否するとき、 「pageではじまる全てを拒否する」ように指定するには、どう書いたらよいでしょうか? 全てのjpgファイルならば、 User-agent: * Disallow: /*.jpg$ でよいようですが、それとも一つ一つ書くしかないのでしょうか?
METAタグ書けば?
717 :
Name_Not_Found :2007/08/26(日) 20:05:24 ID:f5wQWLb9
レスどうもです。やはり正規表現ではできませんか。 meta要素でも一つ一つ書いていくしかないような?
鯖設定で弾いた方が早そうだ。
>>715 Googleのロボットは、
User-agent: Googlebot
Disallow: /*.jpg$
は理解できるはずだよ。
だけど、ロボット全部に対応するなら、htaccessの方がいいと思う。
720 :
Name_Not_Found :2007/08/26(日) 21:22:52 ID:f5wQWLb9
>>718 あ、たしかに。
思えばphpで吐いてるんだから、meta要素を挿入するのもそんな手間でもないんでした…
googleに限って言えば、 sitemap生成してるんなら、あとは全部ブロックしてもよくね?
全部ブロックしたらクローリング出来ないじゃん
ああ、sitemapも獲れんかw
バカスw
User-agent: ia_archiver Disallow: /
730 :
Name_Not_Found :2007/10/15(月) 22:36:54 ID:dzVJS6LE
731 :
Name_Not_Found :2007/10/25(木) 00:52:55 ID:oli8Gpf6
俺はグーグルADを踏まないように、 ↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓ C:\WINDOWS\system32\drivers\etc\hosts hosts をメモ帳で開く 127.0.0.1 localhost 0.0.0.0 pagead2.googlesyndication.com 保存 ↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑ ってしてんだけど、みんなは? もちろん、TV新聞雑誌に広告を出してる会社は 何か悪いことをしてるから口封じにアドを使って 糞カスゴミ・広告代理店に献金してるんだと思うよ。
robots.txtで消える
キャッシュ取られたサイトはもうないんです・・・
諦めるがよい
このサイトって管理人にメール送れないんですかね・・・
サイト作るときは必ず<meta name="Robots" content="NoArchive">入れてる
,. -─‐- 、 , '´ ヽ / /ヽ\ ヽ / / `、 \ ヽ ゙, .i i ヽ、`ヽ、 \ ', i !. ==、 `ヽ、`ヽ、! | l丁 ̄ ̄`i-f´ ̄`ヽ、ヽ ! | !.ヽ --‐' `ー‐一1ヽi | i i 丶 ! ,' ! ! `ー '" ,' i ホームページのダウンロードや印刷は禁止します i /ヽ ー一' /ヽ、! アーカイブも禁止します V \ ,、 .// ヽ 、_ 法律は糞くらえだ俺が嫌だと言っている .r'"´ ̄ |. /,へっ‐'" / i ``'‐- 、 / / | / く★へ ,. へ、. l ヽ ./ ⌒ / /`) ヽ/ i 元ネタよくわからんがいい言葉だよね。
739 :
Name_Not_Found :2007/11/13(火) 10:26:12 ID:uNh/ZiIw
何がバグだwwwwwwwwwwwwwwwwwwww
741 :
Name_Not_Found :2007/11/14(水) 21:41:38 ID:W9+BbGvR
教えてください。 インターネットの、過去に消されたページを見ることができるらしいいのですが、 その方法を教えてください。 アドレスをどうすれば、そのアドレスの過去を見ることができるのでしょうか?
スレチ
アンチアーカイブスレで何紹介してんだw
ここInternet Archiveの話題もおK? 削除済みの古いコンテンツ拾われてたの気付いて 慌ててロボテキ入れたら、無料鯖だけどすぐブロックされてほっとした それはよかったけど、半年くらい置いてサイトごと削除したら またキャッシュ復活しちゃうんだろうか?
747 :
Name_Not_Found :2008/01/21(月) 14:38:46 ID:Uj+n6EGk
ウェブアーカイブというサイトで、 昔消えたサイトを復元できますが、それをされないようにサイトを作ることはできますか? HPの製作者が消した後なら、 ウェブアーカイブに残らない、なんてことを聞いたこともありますが、 そんなことありえないですよね? あるいは、文字化けして、どっちみち見れないようなものとして表示される、 とも聞きましたが、それも間違いですよね?
>747 なんですぐ一つ上のレスも読めないのかと。 さすがGK。
749 :
Name_Not_Found :2008/01/23(水) 13:24:48 ID:sYWQkDAr
任豚きめえ
>>738 ちょwオサレ先生www
元ネタは、ジャンプ連載漫画「ブリーチ」の作者が、
Webサイトで絵を公開してたときの日記。
>法律もウェッブルールもクソ喰らえだ。 俺が嫌だと言ってる。
少し改変されてるな。
>>750 ウェブ魚拓臭漂うサービスだね
リモートホスト:www.existingproof.jp
IP:210.250.55.120
UA:Java/1.5.0_11
キャッシュする時にこれらを吐いてくるからdenyするとよろし
リファラは吐かなかった
ウェブ魚拓も
>>750 のところも自分の所は保存できなくしてるな
検索避けwikiが死んどる
webarchiveさー、robots.txt置いて、何度もクローラー読み込ませてるのに 普通に過去のデータが出るんですけど… たまにRobots.txt Query Exclusion.が出るだけで… なんなんだこのサイト運営してる連中は…? 本人確認できないと削除しないとか… サーバ契約延長期限ギリギリに気づいてよかった…
756 :
Name_Not_Found :2008/03/31(月) 19:30:43 ID:dPBuO0MW
魚拓のFAQに、 (1) 以下のMETAタグをHEADタグ内に書く <meta name="robots" content="noindex,nofollow"> (2) ルートディレクトリにrobots.txtを設置して、"Megalodon"が取得不可能なパスを指定する なお、robots.txtはキャッシュしておりますので、変更が反映されるまで長くて3日かかります。 って書いてあるんだが、 --------------------------- User-agent: Megalodon Disallow: / --------------------------- これで弾けると思う? てか、魚拓のUAって一定だったっけ? 魚拓はじきの情報が載ってるのって、検索避け支援WIKIだけだったからな……
757 :
Name_Not_Found :2008/03/31(月) 19:33:29 ID:dPBuO0MW
しかしむかつくのは、レンタルブログなどの場合、ロボテキもHTACCESSも設置出来ないから、 メタタグを仕込むことになるけれど、(1)のタグだと他のまともな検索エンジンまで巻き添えで 弾くことになっちゃうじゃないか。どんだけ悪質なんだよ魚拓。
>>756 ちょとと違う話だが、
ルートディレクトリをさわる権限が無くrobots.txtはおけず、Google等には
indexされて欲しいけど、魚拓は拒否りたい…って場合でも
<meta name="robots" content="noindex,nofollow,noarchive">
しか受け付けてくれないんだよなぁ。
<meta name="Megalodon" content="noindex,nofollow,noarchive">
に対応して欲しいが、問い合わせも無視され中。
>>758 deny from 216.98.130.25
deny from 216.98.130.26
deny from 71.6.145.82
deny from 71.6.145.92
今はこれで弾けるみたい
ごめん、
>>756 に対してだった
ちなみにウチにくる魚拓はFirefoxを偽装してくるんだがこんなもんなのか?
>>759 .htaccess使えればいいんだけどねぇ
>763 削除依頼メール出して手動で削除してもらえって意味だろ。 日本語でおkって返すほどのレスじゃない。
サーバ契約中なら削除できるぞ
OrgName: Google Inc.
OrgID: GOGL
Address: 1600 Amphitheatre Parkway
City: Mountain View
StateProv: CA
PostalCode: 94043
Country: US
NetRange: 66.249.64.0 - 66.249.95.255
CIDR: 66.249.64.0/19
NetName: GOOGLE
NetHandle: NET-66-249-64-0-1
Parent: NET-66-0-0-0-0
NetType: Direct Allocation
NameServer: NS1.GOOGLE.COM
NameServer: NS2.GOOGLE.COM
NameServer: NS3.GOOGLE.COM
NameServer: NS4.GOOGLE.COM
Comment:
RegDate: 2004-03-05
Updated: 2007-04-10
OrgTechHandle: ZG39-ARIN
OrgTechName: Google Inc.
OrgTechPhone: +1-650-318-0200
OrgTechEmail:
[email protected] # ARIN WHOIS database, last updated 2008-04-30 19:10
# Enter ? for additional hints on searching ARIN's WHOIS database.
770 :
Name_Not_Found :2008/05/08(木) 15:32:46 ID:0YC6zoKl
魚拓みたいなのをとられるのが嫌でこんかい初めてrobots.txtなるものを 自サイトにも上げて、とりあえずウェブ魚拓からのアクセスは禁止にしたん だけど、他に似たようなサイトはどんなのがありますか? そういうの嫌いなんで片っ端から拒否したいんですけど、よければ みなさんのrobots.txtの設定を教えてくださいませんか。
>>770 もううざいから拒否型じゃなく許可型にしてる
どうせgoogle.yahoo,msぐらいだからな
ものすごく本末転倒感が
773 :
Name_Not_Found :2008/05/11(日) 20:18:23 ID:IfKUE9t9
ブログで魚拓を拒否するにはどんなタグを入力したら良いんでしょうか? 普通のサイトみたいにrobots.txtをアップロードするというやりかたができないので よくわからなくてちょっと困ってます。
noindex
「丸ごと」はGoogleやYahooなどの検索エンジンのキャッシュと同レベルの強さしかありません。 それらのキャッシュと同様に、「インターネットに公開されているコンテンツは、より広く知られることを望まれているはずだ」という 暗黙の前提のもとに無断利用しているだけなので、本人から削除依頼が来たら原則的に削除しなくてはなりません。 「引用」はそうではありません。 「引用する」で取得する場合の「範囲を絞る」「特定のリンク元からのアクセスでしか表示しない」は、日本の著作権法を 考慮して本人から削除依頼が来ても合法的に削除を断れるように考えられています。 どうすれば魚拓を削除せずに済むのかを考えて作った機能なので、ぜひ利用していただきたいです。 あまりにも素敵過ぎるQ&Aに( ゚д゚)ポカーン
>>777 その手の物言いしてると、民事じゃなくていきなり刑事でやられるかもね。
魚拓の中の人って、きっと過去に おっと、誰か来たようだ。
ページの丸ごと転載やら音声のアップロードやら、鬱陶しいことばかりしてるな ところで魚拓の中の人のブログが昔はあった気がするんだが誰か知らない?
要領の悪い、いじめられっこだった。てとこか?
,. -─‐- 、 , '´ ヽ / /ヽ\ ヽ / / `、 \ ヽ ゙, .i i ヽ、`ヽ、 \ ', i !. ==、 `ヽ、`ヽ、! | l丁 ̄ ̄`i-f´ ̄`ヽ、ヽ ! | !.ヽ --‐' `ー‐一1ヽi | i i 丶 ! ,' ! ! `ー '" ,' i ホームページのダウンロードや印刷は禁止します i /ヽ ー一' /ヽ、! アーカイブも禁止します V \ ,、 .// ヽ 、_ 法律は糞くらえだ俺が嫌だと言っている .r'"´ ̄ |. /,へっ‐'" / i ``'‐- 、 / / | / く★へ ,. へ、. l ヽ ./ ⌒ / /`) ヽ/ i 師匠に100%同意!!!
783 :
Name_Not_Found :2008/06/13(金) 10:53:28 ID:yvKvBp/F
引用には要件があるからそれを満たしてないと引用にすらならんのに。 一部だけを抽出したものは引用とはいわんだろ。 質的にも量的にも、引用先が「主」、引用部分が「従」の関係にあること。 引用を独立してそれだけの作品として使用することはできない。
利用規約とかに作者のお人柄がにじみ出ているようですねw これ使うとホム変というところに過去の作品としてURLが晒されるんだな netart.jp 202.172.28.53 s52.coreserver.jp 202.172.28.53 これだけdenyすれば弾けると思うけど確信は無い 弾けるか試してみようにも、自分のサイトのURLが晒されるからなんか嫌だな・・・
魚拓がやってる丸ごとと引用は実質一緒だけどな。 引用っていったって引用部分だけ外部に提供してるからただの部分転載。 引用ってのなら引用してる部分も含めて保存しないと引用にならん。
おまいらtumblrはどうでもいいのか
>>787 確認ありがとうございます。引き続きアク禁リストに加えておく事にします。
このサービスは放置していてもあまり害は無さそうだが、作者の言葉が癇に障るから好きになれんよ。
.htaccess使用不可&robots.txt置けないブログやってる リファラにWebarchiveがあって見に行ったらうちのサイトはまだアーカイブされてなかった <meta name="Robots" content="NoArchive"> メタタグこう入れてるんだけど大丈夫ですよね?
>>790 <META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW,NOARCHIVE">
にしたほうが良い。
三つの効果があり、それに普通は大文字だ。
792 :
Name_Not_Found :2008/07/09(水) 17:36:27 ID:hnNIe0ml
インターネット・アーカイブに保存された、自分の昔のHPを削除できる方法があるなら、 教えてください。 また、保存されたのが今も続いているHPなら、HTMLにロボット禁止のタグを入れると、 削除できると聞きましたが、それは可能ですか?
過去ログ嫁
794 :
Name_Not_Found :2008/07/09(水) 20:57:11 ID:hnNIe0ml
>>794 あるじゃねーかよハゲ。読まないで無いとか言ってんじゃねーよ。
dat落ちの前スレとかっていうならまだしも(その場合でも読める仕組みはあるし) 現スレ内で何度か出てるわけで、現スレくらいはちゃんと読んでくださいね。
797 :
Name_Not_Found :2008/07/10(木) 00:22:06 ID:oBfVO//6
>>795 >>796 いや、それを訊いて、結局答えになっていないレスはありますが、
実際に解決したレスは無いでしょう。
メタタグを入れると削除されるのでは? そうレスにあるはずですが。 解決していないのは、一度キャッシュされたウェブをロボット拒否で消しても、 そのサイトを消すと、また以前にキャッシュされた内容が保存されてしまう、 という問題でしたね。
>>797 あるっつーの。グタグタ言ってないで頭から読み返せクソ野郎
<META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW,NOARCHIVE"> を入れるとキャッシュなどを拒否できるらしいですが、 これを入れておくと、以前にアーカイブなどに保存されたものも消えるのでしょうか? そのような話を聞いたのですが、どうなのでしょうか?
801 :
Name_Not_Found :2008/07/10(木) 01:04:44 ID:oBfVO//6
617 :Name_Not_Found:2006/01/21(土) 20:14:27 ID:u1WfF9rt そうそう…… でも一応「次回のクロール時にnot foundなら削除」とは書いてあるのね ↑もう削除してから7年以上経っても消えていないサイトがありますよ。
802 :
Name_Not_Found :2008/07/10(木) 01:12:20 ID:oBfVO//6
<META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW,NOARCHIVE"> を入れるとキャッシュなどを拒否できるらしいですが、 これを入れておくと、以前にアーカイブなどに保存されたものも消えるのでしょうか? そのような話を聞いたのですが、どうなのでしょうか? 保存されたのを消す方法があれば教えてください
>>801 インターネット・アーカイブの話を振ってたくせに、
なんでヤフーに関するレスを引っ張ってきてんだよ、おまえ。
真性の間抜けだったのか。付き合いきれんわ。
>>802 過 去 ロ グ 嫁
終了。ウザイから二度と書き込むんじゃねークソが。氏ね
805 :
Name_Not_Found :2008/07/10(木) 01:26:32 ID:oBfVO//6
>>804 読みました。
メールで削除要請するしかない、ということですか?
タグ挿入でどうにかならないのでしょうか?
グーグルは削除されたページを何年でも出し続けますよ インデックス数の水増しのためでしょうけど 更新されたページでもキャッシュはほとんど変えません もし自分のブログに変なこと書いてしまったら グーグルが永久に出し続けます その後訂正してもグーグルは訂正してくれません あなたが取り消したい記事であればあるほど グーグルは残そうとします グーグルはサイトオーナーの評価が最も低くなるような形で検索結果を操作しています 実際ググればわかりますが他人をほめるような記事は絶対に上に出てきません ネガティブなキーワードを優先的に拾うなどしているのでしょう
妄想乙w
>>806 やっぱりそうか!
俺も漠然とそう思ってた
このスレの水面下にあった結論を
>>806 が見事表現してくれた
ありがd
グーグル工作員の態度の悪さもムカツク
810 :
Name_Not_Found :2008/07/10(木) 03:50:59 ID:V66zTRw3
ここはアーカイブが嫌いな人が集まるスレなんだから、 802のような質問には真剣に答えるのが当然だろう。
質問する前に過去ログを確認したり、ググるのが当然なのでは? 安易に訊いて、簡単に教えて貰おうとする姿勢が透けて見えるから 答えてもらえないんだと思うけれど・・・。
んだ
何言ってんのクソ工作員 べつに安易に聞いたっていいじゃん 知ってる人がいたらそのほうが早い だいいちググれと言われてググるほどみんなバカじゃない 環境変数グーグル社に持ってかれるから ここに書き込む奴はそのくらいわかってるよ
>>815 仮に知ってたとして、何でお前に教えてやらなきゃいけねーの?
お前の検索ワードをググルに持っていかれようが、
こっちの知ったことじゃないんだが。
顔真っ赤にしてやがる。おもすれーww
>>815 ゆでダコだなw
16歳以上だとしたら哀れみを感じずにいられない
だから答える気もないなら書き込むなよクソ工作員
火病?
工作員だ何だと決め付けて煽るだけの奴も逝けよ。 インターネットアーカイブはキャッシュされる前に対策するのが当たり前。 ちなみにmetaに書いただけですぐに消える保証なんて当然ない。 メールで連絡を試みても依然とは比べ物にならんほど対応も遅い。
工作員だなんだ言ってるやつが、答えをもらえない質問者でしょ
いいから答える気もないなら書き込むなクズ
なんで急に荒れたかというと
>>802 が本質を突いてしまったからだ
グーグルは絶対にアーカイブは消さない
一時的に非表示にすることはあっても決して消さない
だから態度の悪いグーグル工作員と思しき奴も
>>802 に答えられないし
必死に話をそらそうとしている
>>806 が正しい
もし消えないなら東京地裁に著作権侵害を訴えて掲載削除の仮処分申請をするといい
(グーグル日本法人の本社は東京都渋谷区)
マジかよ 鬼畜犯罪企業Googleイラネ
http://pc11.2ch.net/test/read.cgi/hp/1212507582/ 378 :Name_Not_Found:2008/07/08(火) 16:10:17 ID:???
社長逮捕に工作員が反応したのかw
でも実際に著作権者がyoutubeの件で刑事告訴したらグーグルは終わりだろ
Winnyの作者は営利でやってなかったけどグーグルは営利企業だからさらに悪質
今のところは事後的に金払って揉み消してるけどあくまで事後的になw
ホント薄汚い企業だよ
そのうち金額で折り合いが付かなくなって大事になるぞw
389 :Name_Not_Found:2008/07/08(火) 23:01:27 ID:bS5+vImF
違法サイトと違法動画がないと潰れてしまうグーグルって哀れだ・・・
Internet Archiveの話なのかGoogleキャッシュについての相談なのか
そもそも
>>802 はどっちなん?
829 :
802 :2008/07/10(木) 23:32:12 ID:???
>>828 どっちもです。
とにかく、過去に保存されたのを消したいんです。
>>829 だから法的手続を執るしかないんだって
グーグルはそういう会社
他のアーカイブは気にしなくていいよ
グーグルが出しさえしなければ事実上何の問題もない
とにかくグーグルが諸悪の根源だからよく覚えておくように
とりあえずGoogleの方はキャッシュされたのと同じファイル名で 特に意味のない内容のファイルを生成しなおしてうpしてはどうか。 キャッシュが新しい無意味な内容のに切り替われば目的は達成できるんじゃね。
832 :
Name_Not_Found :2008/07/11(金) 03:09:32 ID:w8KgCjVv
ねーよw いくら無意味な内容に切り換えても無視されるだけ グーグルはあくまで誰かにとって都合の悪い記事を残そうとする そういうふうにアルゴリズムができている しかもネガティブなキーワードを拾うだけでなく 社員が絶えず見て回ってネガティブな記事を残そうと努力している だからこそ他社と比べて上位が圧倒的な中傷記事で占められる 上に書いてあるように法的措置をとるしかない
だからいまだに『ケンタッキー』でゴキブリがあんなに出るのか。。。 今ググって来たが相変わらず酷いもんだ
例えば、レンタル掲示板にスレを立てられて誹謗中傷されたり 個人情報を晒された場合、掲示板の鯖管の判断でスレが削除 されても、そのスレは検索にヒットし続けて、キャッシュで中身も 見れると言う事?
802はグーグル叩きじゃなくてなんとかする方法やアイディアを希望してるんだと思うのだが
836 :
802 :2008/07/11(金) 11:41:01 ID:mt6qWS6t
831さんのを試すと良さそうですね。 でも、ロボットを禁止にしておけば、 次に回ってきたときにキャッシュが消えるのではないのでしょうか?
837 :
802 :2008/07/11(金) 11:42:04 ID:mt6qWS6t
>>835 そうです。ただ自分のキャッシュを消したいだけです。
削除リクエストじゃだめなの?
禁止しただけじゃ消えないことも。 その辺は試してみればわかる。
>>834 まさにその通り
被害者が大量にいるからこれだけグーグルが叩かれる
>>837-838 5年以上前に消えたページもGoogleでは平気でヒットするぜ
まず消せないと思え
842 :
802 :2008/07/11(金) 15:03:57 ID:mt6qWS6t
831さんの方法だとどうでしょうか?
Googleの場合は、既に自分の管理下に無いサイト(アドレス)なら別だが、 管理下にあるサイトならWebmaster tools使えば、自力で削除等可能だね。
844 :
Name_Not_Found :2008/07/11(金) 15:41:08 ID:VH/OWixD
ダメなんだなそれがw
グーグルは個人情報も消さないしな
843で消せるよな。 844は釣り
849 :
Name_Not_Found :2008/07/12(土) 20:03:51 ID:pD8MPyEZ
http://mamono.2ch.net/test/read.cgi/newsplus/1215743862/l50 【毎日・変態報道】「robots.txt」で、毎日新聞英語版が「Web引きこもり」設定中
1 名前: 窓際店長見習φ ★ 投稿日: 2008/07/11(金) 11:37:42 ID:???0
熱が収まるどころか、ネットではますます盛り上がってしまっている、毎日新聞の低俗英語
サイト問題。「Mainichi Daily News」で削除済みの「WaiWai」のWebページには、メタタグに
「hentai」とあったものだから、「毎日変態新聞」との表現もネットで頻繁に見かける。問題の
記事については、毎日新聞は訂正することなく、Webサイトから完全に削除してしまったため
に、ネットユーザーには証拠隠滅と映り、反感をますます買ってしまった。念の入ったことに、
検索エンジンがWebページを収集する「ロボット」の動きをコントロールする「robots.txt」にも、
「User-agent: *」「Disallow: /」と、すべてを拒否する設定が書き込まれている。タイムスタンプを
見ると、6月27日の深夜に書き換えたことになっている。この記述がどういう意味なのか、Google
の説明が詳しい。つまり、MainichiDaily Newsはどこで検索しても結果に表れない、引きこもり
状態なのだ。ただし、2行の間に不要な空行が入っているため、設定が有効かどうかは怪しい。
robots.txtはブックマークするようなファイルではないのだけれど、はてなブックマークでは、
人気の「IT戦士」を取り上げた日刊サイゾーの記事を超えるブックマーク数になっている。
http://internet.watch.impress.co.jp/static/yajiuma/2008/07/10/
このスレにある魚拓対策をhtaccessに書いて、全文取得をブロックすることはできたんだが、 引用とかいうふざけた機能はブロックできない。 一部とかいって、ページ単位ならほぼ全部保存することができるし。 これをブロックできている人いるかな?
robots.txtじゃなくて.htaccessで魚拓のIPとかドメインを拒否しててダメなの?
853 :
Name_Not_Found :2008/07/14(月) 12:39:42 ID:kdnYWebS
グーグルはキャッシュの更新はほとんど行わないから どんなツール使っても無駄ですよ
キャッシュの削除指定もWebmaster toolsで。 すでに存在しない(管理下を離れた)サイトだったら_
サイト閉鎖したって著作権あるんだぜ 犯罪企業グーグルさんよぉ 勝手に使うんじゃねーよ あ?
ネット弁慶さん、ようこそ^^
857 :
Name_Not_Found :2008/07/15(火) 04:58:00 ID:Y8KbqON6
つまりグーグルは過去に存在したページだと嘘を言えば どんなデマ情報もキャッシュの名目でばらまくことが出来るわけだな しかしこんだけネットで嫌われてよくやってられるなw
サイト管理者が表示したくないからページを削除したのに グーグルが勝手にキャッシュに出し続けるってのは 犯罪なんじゃないの? どうよこの犯罪体質のグーグル社 米国でも裁判起こされまくってるし
>>858 ここはキャッシュ対策を話し合うスレであって
グーグルに対する恨み辛みをぶちまけるスレではない。
よそでやれ。
ネット弁慶さん、ようこそ^^
862 :
Name_Not_Found :2008/07/15(火) 09:22:25 ID:aQVV+EP4
グーグルではトップページに表示されても クズサイトに囲まれてるからぜんぜん来てくれないんだよな むしろサイトオーナーに迷惑かけてるんだから ページ使用料と損害賠償金を払ってほしいよな 特にキャッシュを残すというのであれば 不特定多数への配布が可能になるわけだから 書籍に換算して最低十万部くらいの値段をサイトオーナーに払うべきだね 他の検索エンジンは無料で構わないよ むしろ宣伝になるから有り難い
こんなところで喚いて満足なら安いものだね。Googleは痛くも痒くもなかろう。
少額訴訟なら個人でも簡単に起こせるんだから、ぜひやってよ。 画期的な前例となるよ。 世界からも注目されると思う。
867 :
Name_Not_Found :2008/07/15(火) 14:54:58 ID:/KYu37tl
つーかグーグル掲載拒否しているサイト大杉だろw だからこそゴミサイトばかり出てくるわけで
グーグルって典型的なネット弁慶だと思ってたけどどうやら違うみたいだな
>>865-866 見ると相当追い詰められて弱気になっていることがわかるw
>>868 ネット弁慶の意味が分からないなら使うなよw
ワラ
俺持ってるサイト全部NOARCHIVEだが
簡単なBasic認証での制限もしないで、そういう紳士協定に依存して、違反したらファビョって…なんなんだよそれ。
>>872 そんな制限したらせっかく来てくれる客に迷惑だろjk
robots.txtで拒否し、META NOINDEXも書いてても、被リンクがたっぷりある サイトだと、検索結果の堂々1位を飾ってくれちゃってたよ・・・ ただし、<title>の中の半角アルファベットはすべて小文字になってたり、 NOINDEX,NOSNIPPET同様にダイジェストは載らなかったり、いろいろ半端な 対応だったな・・・
875 :
Name_Not_Found :2008/07/16(水) 13:27:37 ID:Sx+P1pDg
グーグルワロス いくら人気ページが出ないとまずいからって 手動登録はないだろw
サイト消した後もずっと残るってのがあれだよな 痛いプロフとか書いてた場合、永遠にそれが全世界に晒され続ける まあそういうの書いてた奴の自業自得なんだが
自業自得じゃねえだろ 人の弱みを永久に晒し続けるグーグルこそが異常だと知れ まあその結果グーグル自身も世界に晒されてるわけだが こっちはまさに自業自得だなw
878 :
Name_Not_Found :2008/07/17(木) 01:28:32 ID:/eeRgg+n
夏だなぁ
,. -─‐- 、 , '´ ヽ / /ヽ\ ヽ / / `、 \ ヽ ゙, .i i ヽ、`ヽ、 \ ', i !. ==、 `ヽ、`ヽ、! | l丁 ̄ ̄`i-f´ ̄`ヽ、ヽ ! | !.ヽ --‐' `ー‐一1ヽi | i i 丶 ! ,' ! ! `ー '" ,' i ホームページのダウンロードや印刷は禁止します i /ヽ ー一' /ヽ、! アーカイブも禁止します V \ ,、 .// ヽ 、_ 法律は糞くらえだ俺が嫌だと言っている .r'"´ ̄ |. /,へっ‐'" / i ``'‐- 、 / / | / く★へ ,. へ、. l ヽ ./ ⌒ / /`) ヽ/ i
いやだから自サイトの使用制限は合法だから ×法律は糞くらえ ○グーグルは糞くらえ
だよね リンク禁止だってこっちの管理者の勝手だよね
教えてください グーグルにキャッシュされた場合、 キャッシュされても良い内容にHPを書き換えてから、 次にロボットが回ってくると、キャッシュは書き換えたないように変わりますか? あるいは、次ロボットが回ってくるときにロボット禁止にしていると、 以前にキャッシュされた内容は消えますか?
>>882 書き換えた内容にキャッシュが更新された事は普通にある。
それ以外については自動では中々消えないかも試練。
自分で色々工夫して結果報告よろ。
いじりようがない過去のサイトとかじゃないのなら、Webmaster toolsを使うと楽っつーか話が早い。
885 :
882 :2008/07/17(木) 22:56:56 ID:???
一応、まとめて質問します。 以前にグーグルにキャッシュされた内容を変えたいのですが、 その場合、ロボットが次に回ってくるまでに内容を書き換えておけば良いのですか? その場合、ロボットを禁止にしていると、以前にキャッシュされた内容が消えるのか、 あるいはロボットが回ってこずに、以前の内容だけが残ったままなのか、 どちらでしょうか?
886 :
882 :2008/07/17(木) 22:57:41 ID:???
887 :
882 :2008/07/17(木) 23:30:39 ID:???
もし885の方法を取る時、 ロボット禁止にして、内容を書き換えた場合、 キャッシュに残るのは以前の内容のままってことになりますか? 一度ロボットに新しいキャッシュを取らせる必要があるのでしょうか?
888 :
Name_Not_Found :2008/07/17(木) 23:32:13 ID:q45JfFv5
クロールはしても更新はしないよ グーグルはそんな技術力も良心もやる気もない
890 :
882 :2008/07/18(金) 11:42:22 ID:???
>>888 無責任ですよね。金儲けの都合でしょうが...
>>889 すいません。検索してますが、その画像のようなページは見つかりません。
ソフトをダウンロードする場所も見つかりませんし、いったいどこでどうするのでしょうか?
初心者ですいません。
炎上した発言を揉消すためにアーカイブ反対なわけですね。わかります。
893 :
882 :2008/07/18(金) 21:32:14 ID:???
>>891 それのどこに画像のページがあるのでしょうか?
もしかして、登録しなければ駄目ですか?
しかも英語サイトですが・・・
894 :
Name_Not_Found :2008/07/18(金) 21:45:19 ID:dfAmfq1l
グーグルに自分のサイトをキャッシュされてないかどうかを調べるにはどうすればいいですか? 検索欄にアドレスを入れてもページが見つかりません、と出ます。
897 :
882 :2008/07/19(土) 01:10:19 ID:???
>>895 以前にアップされたウェブマスターツールの操作画像のページに行けません。
そこに行くまでにはどうすれば良いのでしょうか?
891のサイトでどうすれば?
教えてください・・・
882が何を言っているのか 教えてください・・・
ヽ _,,.,、、,.ィ-- ti- 、、、....,,,,_ ', ,,..、、ri':'゙/~ レ ' ゙ヘ:l : : : :~,> _,...r:::''"::/ l/ .l:/-=ニ二,'_ー- 、、 !l!;: r '" '''<:::::::::::::;、r' `'' ‐-`.、 / -、 l::::::::::::l <"゙'i;ソ' ', ~.ヽ l:::::::::::l ~' '、 / .) .l::::::::::! '、 ヽ .l:!l:::::l ヽ '、 \ ' l! l::!l! ヽ ,' ゙ ヾ ‐'" ,. r ゙ ー-‐i ,.r,,iilll鬚髯ヲ そんなに何も見えてないんじゃ . l `''' ‐‐ ---t‐'  ̄ ̄ ̄ ̄ ̄ ̄~"''、' ‐ 、 ー‐ノ 生きてても面白くないでしょう ', ヽ l l l l l l ノ
900 :
Name_Not_Found :2008/07/19(土) 17:32:30 ID:GXerprWQ
要するにグーグルはサイトオーナーから情報だけ勝手に盗み取って サイトオーナーの利益を侵害するような使い方をしている犯罪企業ってこと
Q. GoogleのキャッシュとYahooのキャッシュの違いを述べよ(文字数は自由)
答えると何かくれるのか?
903 :
Name_Not_Found :2008/07/19(土) 19:21:03 ID:dbTyQDC4
答えるとグーグル社長の刑期が縮むのか?
縮みこんでるのは削除されねーと吠えてる奴の玉袋くらいなもんJARO
ωωω
906 :
Name_Not_Found :2008/07/28(月) 10:46:51 ID:Ha+Fu9pi
他人の著作物を永久に勝手に利用するまでの権利はグーグルにはないぜ まあ泥棒にはわからねえか
今日もネット弁慶ご苦労さん
,. -─‐- 、 , '´ ヽ / /ヽ\ ヽ / / `、 \ ヽ ゙, .i i ヽ、`ヽ、 \ ', i !. ==、 `ヽ、`ヽ、! | l丁 ̄ ̄`i-f´ ̄`ヽ、ヽ ! | !.ヽ --‐' `ー‐一1ヽi | i i 丶 ! ,' ! ! `ー '" ,' i 他人の著作物を永久に勝手に利用するまでの権利はグーグルにはないぜ i /ヽ ー一' /ヽ、! まあ泥棒にはわからねえか V \ ,、 .// ヽ 、_ .r'"´ ̄ |. /,へっ‐'" / i ``'‐- 、 / / | / く★へ ,. へ、. l ヽ ./ ⌒ / /`) ヽ/ i
(・∀・)ニヤニヤ
910 :
Name_Not_Found :2008/08/04(月) 12:34:07 ID:tNzNVLiz
ヤフーのロボットがFirefoxにUA偽装してくることがある 非常にウザイ
911 :
Name_Not_Found :2008/08/21(木) 13:53:47 ID:F7Evthvn
912 :
Name_Not_Found :2008/09/14(日) 16:10:02 ID:tpuACtry
うちのサイトなんだけどさ、.htaccessでGoogleとYahooを拒否したんだ。 そしたらどうなったと思う。Googleは素直にクロールするのをやめて消えたんだ。 Yahooはといえば、サイトのURLでアクセスに拒否されたページを取得してる。 おいおいどこまで粘着なんだよ。Yahoo! Japan! ww
素直にrobots.txtで教えてやれよ
>>14 おまえのような奴は市役所に勤めて
まな板みたいなオッパイの女とせっせと子作りしていればいいのさ。
誤爆?
だって
>>14 みたいな事言ってたら、他人のメールの内容をスキャンして興味ありそうな広告を表示しようなんてアイデアは実現しないもん。
917 :
Name_Not_Found :2008/09/23(火) 19:10:21 ID:yavOXsmv
そうだな。
918 :
Name_Not_Found :2008/09/23(火) 19:56:18 ID:Sqi/+f5w
有力サイトのオーナーはグーグルにコンテンツ使用料を請求したほうがいいぞ
100$/ページが最低限だな
ほ
921 :
Name_Not_Found :2008/11/04(火) 23:54:39 ID:gBF9JGWz
紳士協定だから、Googleは何ヵ月か後に有効になったけど、 百度(Baidu)は平気で無視して情報集めてるみたい。 全部、中国からの百度(Baidu)を.htaccessで拒否していたら、 いつの間にか日本にあるサーバでも集め始めた。びっくり! 拒否、拒否・・・
百度w
確かに勝手に複製され、許可なく公開しているのはおかしい 世の中の利便性を考えれば、このままでいてほしいけどやっぱりおかしい
利便性があるのにできないほうがおかしいんだ。
ほ
928 :
性懲りもなく :2009/01/15(木) 00:43:46 ID:sH92gu3g
魚拓とはてなブックマークアク金にしたら マジで魚拓もスクリーンショットもブックマークも取れなくなってて笑ったw 魚拓ざまあww アク金きもちいいわ
>>929 という香具師に限ってページはパスワードもかけてないんだよな
魚拓は取られていいことないから徹底的にアクセス禁止するべき オンラインブックマークとか気持ち悪すぎる はてなとか犯罪者が出るくらいブックマーク中傷の宝庫だし
よう腐女子
933 :
Name_Not_Found :2009/02/26(木) 02:57:10 ID:OVH/kr0n
>>935 0.0.0.0/0 で弾くのがいいな
見られたくない奴には絶対に見られないぞ
診断くん Ver 0.80a Home/Feedback/N/Vote 一般的な情報 REMOTE_HOST 66.71.253.25 REMOTE_ADDR 66.71.253.25 HTTP_REFERER (none) HTTP_ACCEPT . */* HTTP_HOST . taruo.net その他の情報 HTTP_CONNECTION . (none) 判定 66.71.253.25 (66.71.253.25) 判定:プロクシです proxy判定箇所が 1箇所、疑惑点が 0箇所ありました。 漏れ判定:漏れてはいないようです 総合評価:A+ 極めて物静かなproxyです。proxy経由であることを示す情報がほとんどありません。
>>935 deny from 66.71.253.25
でとりあえず防げたみたい。どうもありがとう!
>>939 まあ、漏れが手でぶっこぬいてうpろだに上げれば防げないがな
ttp://pc11.2ch.net/test/read.cgi/esite/1189771222/171- 171 名前:98[sage] 投稿日:2009/04/22(水) 21:00:27
>>170 元々キャッシュされてないとか、
robots.txt で撥ねられてたら無理だな。
172 名前:名無しさん@お腹いっぱい。[sage] 投稿日:2009/04/22(水) 22:47:15
robots.txtは地味にうざい
174 名前:名無しさん@お腹いっぱい。[sage] 投稿日:2009/04/23(木) 13:04:52
特に、ページは読めてもファイルが置いてあるところはrobots.txtでブロックされていると目茶苦茶にがっかりする
943 :
Name_Not_Found :2009/06/29(月) 21:39:06 ID:G3F3dC2/
ほ
944 :
Name_Not_Found :2009/10/06(火) 08:06:39 ID:duqXacb0
し
保守
947 :
Name_Not_Found :2009/12/30(水) 02:37:05 ID:XOW+yb0L
保守
948 :
Name_Not_Found :2010/02/06(土) 03:30:57 ID:So1LXrA4
そもそも、いまのネット空間はアメ公の創作空間。 そのアメ公の空間でアメ公の大きな会社を批判することは無駄。 アメ公空間の創設になんの貢献もできない>>1は身の程を知るべし。 アメ公空間のルールはアメ公が作るのが常識だww
ほ
し
に
ね
953 :
Name_Not_Found :2010/09/07(火) 03:03:11 ID:NUgZhqHU
が
い
を
ヽ _,,.,、、,.ィ-- ti- 、、、....,,,,_ ', ,,..、、ri':'゙/~ レ ' ゙ヘ:l : : : :~,> _,...r:::''"::/ l/ .l:/-=ニ二,'_ー- 、、 !l!;: r '" '''<:::::::::::::;、r' `'' ‐-`.、 / -、 l::::::::::::l <"゙'i;ソ' ', ~.ヽ l:::::::::::l ~' '、 / .) .l::::::::::! '、 ヽ .l:!l:::::l ヽ '、 \ ' l! l::!l! ヽ ,' ゙ ヾ ‐'" ,. r ゙ そんなに何も見えてないんじゃ ー-‐i ,.r,,iilll鬚髯ヲ . l `''' ‐‐ ---t‐' 生きてても面白くないでしょう  ̄ ̄ ̄ ̄ ̄ ̄~"''、' ‐ 、 ー‐ノ ', ヽ l l l l l l ノ
2011
ほ
し
>>800 チンレスだけどググルウェブマスターツールでキャッシュ削除。あとは
meta name="robots" content="NOARCHIVE,NOIMAGEINDEX,NOIMAGECLICK,NOSNIPPET"
で今後のキャッシュ拒否、説明文とインスタントプレビュも拒否
がいしゅつならスマソ。
自己レス:NOIMAGEINDEX,NOIMAGECLICKは画像拒否ね。 これで検索結果にインデックスはされるが他は拒否できる。ただし俺の経験だと、 NOSNIPPETを入れると検索は補足検索結果に追いやられてしまうようだ。
962 :
忍法帖【Lv=12,xxxPT】 :2012/02/11(土) 17:05:58.09 ID:LpnLTdE9
>>960 亀レスや遅レスとはいうが
チンレスってなんだ?
っていうか亀にも限度があるだろw
魚拓
キャッシュ
アーカイブ
ってどう違うの?
ほ
し
創価死ね 創価死ね 創価死ね 創価死ね 創価死ね 創価死ね 創価死ね 創価死ね 創価死ね 創価死ね 創価死ね 創価死ね 創価死ね 創価死ね 創価死ね 創価死ね 創価死ね 創価死ね 創価死ね
創価死ね 創価死ね 創価死ね 創価死ね 創価死ね 創価死ね 創価死ね 創価死ね 創価死ね 創価死ね 創価死ね 創価死ね 創価死ね 創価死ね 創価死ね 創価死ね 創価死ね 創価死ね 創価死ね 創価死ね 創価死ね 創価死ね
a
968 :
Name_Not_Found :2013/06/18(火) 05:22:47.70 ID:FRQJpthd
ほ
969 :
Name_Not_Found :2013/08/14(水) NY:AN:NY.AN ID:X3xCgtmp
ん
1408597637176.jpg
971 :
Name_Not_Found :2014/10/15(水) 03:32:11.35 ID:DkcIMeun
ほ
ふ
は
へ