なんと100億以上のWebページを保管

このエントリーをはてなブックマークに追加
590名無しさん@お腹いっぱい。:01/11/15 07:13 ID:EWYFRXeI
>>589
大多数の人はプロバイダに間借り状態なので
robots.txtの設置は不可能です。

一応、FAQにはMETAタグ(NOARCHIVE)で
拒否できるとは書いてあったけどね。
やはりなんとなく不安だ。
NOINDEXがあっても収録されてたからね…。
591 :01/11/15 10:37 ID:iRnRLJ/H
>>586
今までに50以上のHPを開設して現時点で4つのHPを維持・運営
していますが何か?
592名無しさん@お腹いっぱい。:01/11/15 10:43 ID:uK+E9ZQ0
>>590
となると.htaccessで1つ1つはじかないとダメって事か?
593名無しさん@お腹いっぱい。:01/11/15 13:23 ID:xhqme35C
>>591
html1つを1ページ、画像1つでも1ページという風に
カウントしてるんでしょ?
594 :01/11/15 15:52 ID:OLwQpzHC
>>593
ハァ?お前日本ご理解できるか?
HP開設って書いてあるだろうがヴォケ!

それともお前にとってHPを開設する事は
とてつもなく手間が掛かる作業と言うことか?
HPなんざ1時間も有れば作れるんだよ!!

と煽っておく。
595あらら:01/11/15 15:57 ID:YkErMhqi
1時間も有れば作れるようなnをこれ以上つくるなよ
ま・じ・で
596名無しさん@お腹いっぱい。:01/11/15 15:59 ID:OLwQpzHC
ワレズサイトですから(和良
597名無しさん@お腹いっぱい。:01/11/15 17:17 ID:geS+f1ms
こんなサイトが存在するということは恐ろしいといえば恐ろしい。
598 :01/11/15 17:24 ID:OLwQpzHC
2年前に閉鎖して俺の恥ずかしいサイトがキャッシュされていたよ(;´д`)
599名無しさん@お腹いっぱい。:01/11/15 17:35 ID:K/sa9QK9
>598
削除依頼出しなさい(笑)
600 :01/11/15 18:01 ID:AbEXiNYs
601 :01/11/15 18:10 ID:AbEXiNYs
これをたどってモナー誕生の瞬間や作者特定等できないだろうか。
一大事業になるが。
602名無しさん@お腹いっぱい。:01/11/15 18:32 ID:A4DzB2eU
>The URLs in your email have been added to our exclude list. The exclusion
>will take effect in approximately 2 business days.
>
>Regards,
>
>Alexis Rossi
>Internet Archive Support

削除依頼の英文、かなり不安だったけど通じてよかったよ。
ちゃんとBlocked Site Errorが出てくれてる・・・。
603名無しさん@お腹いっぱい。:01/11/15 19:33 ID:t+RRvHMu
しかしクロール頻度高くない?
Googleの比じゃないっぽ
604名無しさん@お腹いっぱい。:01/11/15 21:55 ID:+zBecx8M
旧2ちゃんまだ生きてるよ
http://www.artists-in-residence.com/~bbs2ch/
605名無しさん@お腹いっぱい。:01/11/16 02:57 ID:MvhdDDja
これをたどって
ニダー誕生の瞬間を目撃したいよ
606名無しさん@お腹いっぱい。:01/11/16 12:38 ID:Vfc4QEn7
>>594
ごめん、>>591じゃなくて>>586の間違い。
607 :01/11/16 14:52 ID:Icy0fGB4
イイトコロでリンクが切れてたりして萎え
608 :01/11/17 08:20 ID:rj+Jb7Ga
今使えない。
609ん?:01/11/17 08:36 ID:N7nQxfl9
モナー誕生スレなら保管されてるだろ。
作者はわかるわけない、名無しさんなんだから。
610名無しさん@お腹いっぱい。:01/11/19 16:57 ID:306mTRxd
ハクられてませんか?
611名無しさん@お腹いっぱい。:01/11/19 21:25 ID:dDs65nsL
こんなだめページも永久表土に保存されるのか?
http://homepage2.nifty.com/stj/
612 :01/11/20 23:48 ID:FIcPYGM8
613名無しさん@お腹いっぱい。:01/11/21 00:09 ID:vb+lZymg
>>611
うわ...どのページにも「一重まぶたを二重まぶたに」が
あるよー。こわいよー。
614名無しさん@お腹いっぱい。:01/11/22 17:13 ID:QGnIM+7l
       / ̄ ̄ ̄ ̄ ̄\
       |  おまえらも |
  ∩_∩  |          |
 (´ー`) <  暇な奴ら   |
 (   )  |          |
  | | |   |  だなぁ    |
 (___)__)  \_____/


  ∧_∧ 
  ( ´∀`)∩  ふぅー、自作自演も憑かれるモナ。
  ( ̄ ⊃´ー`)
  | | ̄| ̄
  (__)_)
615名無しさん@お腹いっぱい。:01/11/23 08:13 ID:onfAEptY
検索結果がクリックできんよ!
616名無しさん@お腹いっぱい。:01/11/23 12:37 ID:ydtKu2jo
>>615
うちもBugBrowserだとできない。
IEならできる。
617 :01/11/23 13:29 ID:DFGMvAa2
>>615
[Tab]キーを活用すれъ( ゚ー^)
618名無しさん@お腹いっぱい。:01/11/24 00:47 ID:glRTPhFr
>>615-616
JAVA切ってない?
619名無しさん@お腹いっぱい。:01/11/24 00:59 ID:Mkz2w/BS
div#waitPage {display: none ! important;}
をユーザースタイルシートに追加。
620 :01/11/24 11:53 ID:rAL6qO1b
>>284まで読んだ

はるか85423
621 :01/11/24 13:44 ID:+Ew7M8+u
権兵衛ってもしかして馬鹿?
622名無しさん@お腹いっぱい。:01/11/24 14:36 ID:DUdNvozk
WEB板のエシュスレ読めば一目瞭然>権兵衛バカ

英語力の酷さもあれだが、日本語も理解できてないらしい。
623名無しさん@お腹いっぱい。:01/11/29 11:47 ID:aFHPaFQq
Web Archiveの収集ロボに対してのみ
同サイトで複製公開された時にブラクラに
変貌する偽コンテンツを返す様にしました。
どうなるか見もの。

もちろん、ブラクラ公開するのはWeb Archiveなので、
被害に対する責任も同サイト管理側にあります。
624 :01/11/29 13:52 ID:H3nT2//y
大学の鯖にエロサイトを開設していた兵。

http://web.archive.org/web/*/http://http://www.ced.cas.uec.ac.jp/~h11154/seifuku.html
625 :01/11/30 19:29 ID:GemOHemc
1ヶ月切った!
いよいよ2000年問題がぁ〜〜
http://web.archive.org/web/19990508181230/http://www.microsoft.com/japan/ms.htm
626age:01/12/03 16:24 ID:qedrAkPC
age
627 :01/12/03 16:44 ID:Roi5E01I
しくみがわからん。
どこにどうやって保存されてたんだ?
628名無しさん@お腹いっぱい。:01/12/03 18:23 ID:ZdAVOuCJ
>>627
検索エンジンと同じ仕組みで収集されました。
ロボットと呼ばれるプログラムがWebのリンクをたどり、手当たりしだいに保存した。
629名無しさん@お腹いっぱい。:01/12/03 18:56 ID:Gzi2lM0R
旧ミリオネアのサイトもあった…
http://web.archive.org/web/*/http://www.phone-a-friend.com/
630名無しさん@お腹いっぱい。:01/12/05 04:52 ID:5QkTlxHE
てゆーかさ、ここでも
pc.2ch.net/test/read.cgi/hp/1004183621 でも
大本営発表
以前
から Internet Archive をマークしてた人っていないのね。
その辺が非常に愉快。
研究目的なら以前から集めてた膨大なデータが利用できたんだけどね。
(無制限に一般公開するとは思っていなかったが…)
631名無しさん@お腹いっぱい。:01/12/08 18:06 ID:I6m3DMkP
あげ
632  :01/12/08 18:10 ID:wIgs52Nx
へー、
児ポ法前の日本のエロサイトがあったら訴えてつぶしてやろう(藁
633 :01/12/08 19:13 ID:GVoFHs1c
同僚がハッキングして予備校HPに載せた
講師のはめどり写真も見れるんだろうか。
634名無しさん:01/12/08 20:52 ID:iSuJKGX4
英国で韓国人が作ってた日本人は赤ん坊を食べるって宣伝してたHPも残っているなら見たい。
635画像は表示されない所が多いね:01/12/08 21:46 ID:FCjHMm0t
↓ここに現存するNHKの最古のページ。
http://web.archive.org/web/19961112103052/http://www.nhk.or.jp/

「サイバー番組ステーション」だって!
サイバーって言葉に時代を感じさせますね。僅か5年前やのに。
636 :01/12/09 18:51 ID:ckBqe04f
「Nikkeiサイバー」とか巡回してたなぁ(w
637名無しさん@お腹いっぱい。:01/12/14 15:39 ID:nuxeZ/vh
ega
638名無しさん@お腹いっぱい。:01/12/14 15:52 ID:dmAjQlCo
ここで、特筆すべきは、過去の www.ntt.com だろう。
100万ドルでNTTが買ったということだったが本当だろう。
639名無しさん@お腹いっぱい。
ega