Internet Archive総合 (web.archive.org) #1

このエントリーをはてなブックマークに追加
1名無しさん@お腹いっぱい。
なんだかんだでお世話になってるInternet Archiveについて語りましょう
Internet Archive
ttp://www.archive.org/index.php

インターネット・アーカイブ - Wikipedia
ttp://ja.wikipedia.org/wiki/InternetArchive


〜よく使われるWeb Archiveキャッシュ検索はこちら〜
Internet Archive: Wayback Machine
ttp://www.archive.org/web/web.php
Advanced Search
ttp://web.archive.org/collections/web/advanced.html

Recall(現在は停止404)
ttp://recall.archive.org/
Internet Archiveの110億ページを検索できるサーチエンジン「Recall」
ttp://internet.watch.impress.co.jp/cda/news/2003/09/08/377.html


Q.Internet Explorerで日本語などの2byte言語のページのWeb Archiveキャッシュを見ようとしても
真っ白なページ&文字化けが起きる&極端に重いなどの症状が出てしまう
A.[表示]もしくは右クリック→[エンコード]→[日本語(自動選択)]やその言語の文字コードに則したものをクリック

Q.Web Archiveでダウンロードしたzipなどが開けない&CRCが違うと表示される
A.よくWeb Archiveは1byte欠けを起こすのでバイナリエディタなどで該当ファイルを開き、
16進数の最後の末尾に「00」を付加すると正常なファイルになることがあります
2名無しさん@お腹いっぱい。:2007/09/14(金) 21:01:41
無かったんで立ててみますた(゚∀゚)
何も無くスレを立てるのもアレなんでテソプレみたいなもんも作りました
Web Archiveだけではすぐに話題は尽きてしまいますが
Internet Archiveなどのさまざまな記録も話題に加えれば話題は尽きないと思います 多分
3名無しさん@お腹いっぱい。:2007/09/15(土) 02:25:05
5年前に作った俺の恥ずかしい若気の至りサイトを消してくれ
4名無しさん@お腹いっぱい。:2007/09/15(土) 05:35:25
>>3
詳しく
5名無しさん@お腹いっぱい。:2007/09/15(土) 18:37:31
Recallは日本語使えなかったけど革新的なサービスだった…
再開してくれないもんかねぇ(出来れば日本語対応で)
6名無しさん@お腹いっぱい。:2007/09/24(月) 18:03:02
ダウンしてるぞInternet Archive
7名無しさん@お腹いっぱい。:2007/09/25(火) 01:38:58
復旧したっぽいね
8名無しさん@お腹いっぱい。:2007/10/07(日) 07:12:29
あげ
9名無しさん@お腹いっぱい。:2007/10/07(日) 11:58:03
あげてねーだろ
しかし語ることねーな
10名無しさん@お腹いっぱい。:2007/10/07(日) 13:28:08
age
11名無しさん@お腹いっぱい。:2007/10/13(土) 06:31:46
tgzのキャッシュってダウンロード出来ない?
12名無しさん@お腹いっぱい。:2007/10/21(日) 23:15:34
キャッシュは流石に難しい
13名無しさん@お腹いっぱい。:2007/11/02(金) 15:00:58
今のところ日本語のページを開くとUnicode固定になっちゃうんだよなぁ…
わざわざエンコードするの面倒だからどうにかしてS-jisに固定できないものだろうか…
14名無しさん@お腹いっぱい。:2007/11/12(月) 04:10:40
オミトロンは?
15名無しさん@お腹いっぱい。:2007/11/12(月) 10:42:56
おみとろん久しく使ってなかったけど。
Internet Archive開くときだけ使ってみるか。
16名無しさん@お腹いっぱい。:2007/11/12(月) 11:30:00
オミトロンのルール誰かplz
17名無しさん@お腹いっぱい。:2007/11/12(月) 12:40:01
最近Internetarchiveからソフト類をダウンロードするの
難しくなってないか?
Zipだとか過去手に入った物が手に入らない。
18名無しさん@お腹いっぱい。:2007/11/12(月) 12:52:13
>>16
Proxomitron専用Uploaderの「pr0043.txt」
ttp://proxo.hp.infoseek.co.jp/cgi-bin/sn_uploader/2.html?1193422532
フィルタ、リスト公開/8 - Proxomitron等に関するWiki
ttp://abc.s65.xrea.com/prox/wiki/%A5%D5%A5%A3%A5%EB%A5%BF%A1%A2%A5%EA%A5%B9%A5%C8%B8%F8%B3%AB/8/
19名無しさん@お腹いっぱい。:2007/11/13(火) 20:19:55
>>17
ネットの発展は「宇宙の膨張と同じ」とまで例えられるくらいだかね
淘汰されちゃうんだろうな
俺的にはlzhアーカイブの加速度的な消失が痛いよ

>>18
作者さん?乙です
20名無しさん@お腹いっぱい。:2007/11/13(火) 21:39:36
ひさびさにおみとろん導入してみたよ。
とりあえずInternet Archive の文字化けを直すヘッダフィルタのみ有効にした。
手間が省けていいもんだね。
21名無しさん@お腹いっぱい。:2007/11/20(火) 12:27:55
Internet Archiveに繋がらないんだが、
どうなってる?
22名無しさん@お腹いっぱい。:2007/11/20(火) 13:35:57
生きてるっぽいけど?
2321:2007/11/20(火) 19:05:40
おお、繋がりましたわ。失礼
24名無しさん@お腹いっぱい。:2007/11/21(水) 01:49:46
>20

どれどれ俺もやってみよう
25名無しさん@お腹いっぱい。:2007/11/28(水) 01:34:39
収得できないのってもう絶対見られない?
時間おけば見られることあるの?
26名無しさん@お腹いっぱい。:2007/11/28(水) 07:30:50
1年ぐらいたったら公開されるってどっかに書いてあったよ
27名無しさん@お腹いっぱい。:2007/11/28(水) 20:43:12
1年か('A`)
28名無しさん@お腹いっぱい。:2007/12/07(金) 20:04:26
落ちてる?
29名無しさん@お腹いっぱい。:2007/12/08(土) 22:16:01
うんにゃ
30名無しさん@お腹いっぱい。:2007/12/24(月) 02:43:23
テンプレ追加きぼん。

Q. 毎日のようにキャッシュが残っていたサイトなのに
最近のものが何故か無くなっている。
A. Wayback Machine で表示できるのは 6 ヶ月前より古いキャッシュで、
それ以降の分は 6 ヶ月経つまで表示されません。

最近 ttp://www.archive.org/index.php
ttp://www.archive.org/web/web.php が落ちてることが多いな。
それでも ttp://web.archive.org/web/*/ごにょごにょ
とかやるときちんと動いてる。
31名無しさん@お腹いっぱい。:2007/12/24(月) 11:18:19
>>30
おや、1年てのは勘違いか、ルールが変わったのか…
32名無しさん@お腹いっぱい。:2007/12/26(水) 20:59:59
同じサイトでも見られるリンクと見られないリンクの違いは何なんだ
33名無しさん@お腹いっぱい。:2007/12/27(木) 10:59:11
またダウンしてる?
34名無しさん@お腹いっぱい。:2007/12/28(金) 11:16:05
>>32
503エラーもどきじゃない?
何回かクリックすると見れることあるよ
3513:2008/01/09(水) 17:52:08 BE:7025524-2BP(129)
色々あり今までこちらに来れませんでしたが
オミトロンを教えてくださった方 どうもありがとうございました
36名無しさん@お腹いっぱい。:2008/01/11(金) 19:56:41
律儀だな〜
37名無しさん@お腹いっぱい。:2008/01/14(月) 12:29:41
俺オミトロン設定してるのになぜか文字化けが止まらないな・・・
38名無しさん@お腹いっぱい。:2008/01/14(月) 18:33:04
>>37
In してくるヘッダーの text/html; charset=UTF-8 の
charset=UTF-8 を削るだけのフィルタだよ。
一度確認してみたら?
39名無しさん@お腹いっぱい。:2008/01/21(月) 14:38:23
ウェブアーカイブというサイトで、
昔消えたサイトを復元できますが、それをされないようにサイトを作ることはできますか?

HPの製作者が消した後なら、
ウェブアーカイブに残らない、なんてことを聞いたこともありますが、
そんなことありえないですよね?
あるいは、文字化けして、どっちみち見れないようなものとして表示される、
とも聞きましたが、それも間違いですよね?
40名無しさん@お腹いっぱい。:2008/01/21(月) 20:41:49
>>39
ここに書いてあるとおりにすればいい。
ttp://www.archive.org/about/exclude.php
英語がわからなければ適当にぐぐって。すぐ情報でるから。

文字化けはキャッシュしたページの文字コードを無視して
UTF-8で表示してるだけで正しい文字コードに変えれば見れる。
41名無しさん@お腹いっぱい。:2008/01/28(月) 01:39:03
1996年から8500億ものウェブサイトを保存している「Wayback Machine」 - GIGAZINE
http://gigazine.net/index.php?/news/comments/20080127_1996_internet/
42名無しさん@お腹いっぱい。:2008/02/01(金) 23:31:08
Robots.txt Query Exclusion.
という文字が出て、ようやく探し当てたページなのですが見る事が出来ません
少し調べたのですが、見れないのです。これは打つ手無しでしょうか。
43名無しさん@お腹いっぱい。:2008/02/03(日) 00:23:15
>>42
それはデータをクロールする検索ボットをお断りしますっていうヤツだから無理
というかまともな検索サイトじゃ検索結果にも出ないハズ
もしキャッシュが欲しいならマイナーな検索エンジンやちょっとUGちっくな検索サイトを使った方が出やすいかも

もし晒しても問題無さげサイトなら晒してみ
手伝いくらいならできるかもよ
44名無しさん@お腹いっぱい。:2008/02/03(日) 20:19:46
livedooの昔のブログで月別アーカイブの次のページ(2ページ以降)を見たいのですが、
普通にクリックでは表示されないのですが、何とか見る方法はありますか?
4544:2008/02/03(日) 21:05:09
続きです。livedoorのブログですが、アドレスの最後がこの様になっていて、
検索しても見られないのです。archives/2006-11.html?p=2

それと、1年以上公開されていたブログで月別アーカイブが約半分程度しか残っていないのですが、
他の月分は今後見る事は不可能でしょうか?
46名無しさん@お腹いっぱい。:2008/02/04(月) 01:27:47
まずWeb Archiveは>>30の半年縛りがある
それと何とか見る方法ってのをみんなで探す前提条件がurlを晒すことなんだがOK?
あと有名なとこなら魚拓系サイトって手もあるかも
4744:2008/02/04(月) 20:06:16
>>46
魚拓系サイトも見たのですが、トップページのみのリンクでだめでした。
livedoorのブログは、アカウント以降は全て同じで次のページへのリンクが
/archives/2006-11.html?p=2で見られる様になっているのですが、
ページが存在しませんと出てしまいます。
残念ながらurlは晒せないので、もう少し頑張ってみます。アドバイス有り難うございました。
48名無しさん@お腹いっぱい。:2008/02/07(木) 14:23:08
ttp://kakuri.sakura.ne.jp/oekaki/

上のお絵かき掲示板のNo.6220-6247の絵を見たいんだけどなんかいい方法ないですかね。
推測するには2007年の6月から5月だと思うんだが。
web archiveじゃあ無理臭い。
49名無しさん@お腹いっぱい。:2008/02/07(木) 14:24:05
現行URL?は
ttp://kakuri.sakura.ne.jp/oekakix/
でした
50名無しさん@お腹いっぱい。:2008/02/07(木) 16:26:24
web archiveは特定のサイズ以上の画像はクロールしないようにしてるっぽいから無理じゃない?
しかもどう見ても児ポでFBIから睨まれそうなトコだし…



で話は変わるが俺その画像(というかHTMLログ全て)持ってるかも知んない
これ以上はスレ違いだから

・比較的流れの速そうな板の適当な糞スレへ誘導
・50メガ程度うpできるロダ

この2つ用意したら揚げてやんよ
51名無しさん@お腹いっぱい。:2008/02/07(木) 17:57:35
52名無しさん@お腹いっぱい。:2008/02/07(木) 21:16:41
ぽっぽ(弟)に通報します
53名無しさん@お腹いっぱい。:2008/03/12(水) 01:56:00
重いー
54名無しさん@お腹いっぱい。:2008/03/12(水) 06:17:54
最近どしたってくらい重いんだけど
英語読めないからアナウンス出てるかもわからんし
55名無しさん@お腹いっぱい。:2008/03/12(水) 08:09:04
robot.txt置けない環境なんだがメタタグでnoarchive指定しても無意味?
56名無しさん@お腹いっぱい。:2008/03/12(水) 09:23:43
最近はGoogleさんですらnoarchiveを無視することがあるしな・・・
57名無しさん@お腹いっぱい。:2008/03/17(月) 02:57:00
Internet archiveで拾えないファイルってもう絶望的…?
58名無しさん@お腹いっぱい。:2008/03/17(月) 15:07:42
>>55
56に同意でmetaは無意味じゃないが読んでくれないことがある

>>57
ファイル系?HTML系?
もしURL晒せれば微力ながら協力するが
59名無しさん@お腹いっぱい。:2008/03/17(月) 20:38:14
>>58
すいません、助かります
ttp://degwin.cool.ne.jp/nanika/download/nekomimi.nar
って言うファイルで、2004年の1月初期まで公開してたっぽいんです
60名無しさん@お腹いっぱい。:2008/03/18(火) 17:36:33
>>59
うーん見つかんないねぇ…
も少し情報無い?
あとこれ伺かだと思うんだけどマルチにならないようにここでの質問を正式に打ち切って
伺か系のスレや掲示板・ロダで探した方が良い鴨
61名無しさん@お腹いっぱい。:2008/04/02(水) 12:50:45
robots.txt置いて、削除フォームから申請したのに一向に削除されない
恥ずかしいから早く過去を消し去りたいのに・・・
62名無しさん@お腹いっぱい。:2008/04/05(土) 00:13:56
     _, ,_
   ( ^ё^) ヤダァ、見ないで!恥ずかしい…
     (つ/ )
      |`(..イ 彡サッ
     しし'
63名無しさん@お腹いっぱい。:2008/04/11(金) 15:11:10
魚拓とweb archiveはウェブ社会の癌。
64名無しさん@お腹いっぱい。:2008/04/12(土) 22:58:28
>>63
ハゲ黙れ
65名無しさん@お腹いっぱい。:2008/04/13(日) 15:59:01
http://rollin.jp.land.to/
上のアップローダーのファイルを保存して新しいところに上げてみたいのですが
Not in Archive.って出てしまうんですが。どうしようもないんですかね?
66名無しさん@お腹いっぱい。:2008/04/14(月) 01:48:10
ここって昔のゲームとかもDLできるんですか?
くにおくんシリーズとか。
どなたかやり方を教えてください!
67名無しさん@お腹いっぱい。:2008/04/14(月) 08:10:14
日本語でおk
6865:2008/04/14(月) 15:54:17
やっぱり無理ですか
69名無しさん@お腹いっぱい。:2008/04/15(火) 03:58:57
>>65
ttp://web.archive.org/web/*nr_130/http://rollin.jp.land.to/*
無効のシステムのエラーならまだしも、
Not in archive だけは無理だろ。
70名無しさん@お腹いっぱい。:2008/04/17(木) 23:08:24
2ヶ月ぶりぐらいにアーカイブを使ったが、
「ページを表示できません」ばっかりだorz
71名無しさん@お腹いっぱい。:2008/04/17(木) 23:15:57
>>70
同じく。一体何がおきてるorz
72名無しさん@お腹いっぱい。:2008/04/18(金) 00:43:42
ttp://web.archive.org/web/*/ごにょごにょ

これで出たと思ってもそっから先に進めなくなってるな。
Failed Connectionとか言われる。
73名無しさん@お腹いっぱい。:2008/04/18(金) 01:59:46
Not in Archiveって出ても日を改めたら見れたりしたと思うけど
勘違いかな?
74名無しさん@お腹いっぱい。:2008/04/29(火) 20:53:14
Path Index Error.が多いな。さっき見たファイルが、もう見れなくなってる。
75名無しさん@お腹いっぱい。:2008/04/29(火) 22:43:09
>>74
確かにここの所それが出る頻度が妙に多くなってるな。
76名無しさん@お腹いっぱい。:2008/05/02(金) 23:17:10
やはりNot in Archiveはもう見れないのかな?
日をあらためれば見れるという人もいるし希望持ってるんだが保存されてないんだったら無理だよなー
アゲます
77名無しさん@お腹いっぱい。:2008/05/03(土) 00:06:52
Not in Archiveって言ってるのだし
その言葉の意味からしても諦めたほうがいいと思う
Failed Connectionならうまくいけば繋がる→繋がれば残ってるかもしれないけど
78名無しさん@お腹いっぱい。:2008/05/08(木) 19:23:31
web.archive.org、404きた…
79名無しさん@お腹いっぱい。:2008/05/08(木) 19:48:33
滅びてくれると嬉しいのだが、クローラは毎日のように来てるんだぜ?
80名無しさん@お腹いっぱい。:2008/05/08(木) 20:28:29
REMOTE_HOST: xcrawl109.alexa.com
HTTP_USER_AGENT: ia_archiver
81名無しさん@お腹いっぱい。:2008/05/08(木) 21:08:02
昨日は表示できてたはずなんだが、今日なんかサーバーにつながらなくね?
82名無しさん@お腹いっぱい。:2008/05/10(土) 00:50:23
         ,. -─‐- 、
         , '´        ヽ
       /  /ヽ\     ヽ
     /  /   `、 \ ヽ   ゙,
      .i   i     ヽ、`ヽ、 \ ',
     i   !.  ==、  `ヽ、`ヽ、!
     |  l丁 ̄ ̄`i-f´ ̄`ヽ、ヽ !
     |  !.ヽ --‐'  `ー‐一1ヽi
     |  i     i  丶   ! ,'
      !  !    `ー '"   ,' i      ホームページのダウンロードや印刷は禁止します
     i  /ヽ    ー一'  /ヽ、!       アーカイブも禁止します
       V   \ ,、     .// ヽ 、_       法律は糞くらえだ俺が嫌だと言っている
  .r'"´ ̄ |.   /,へっ‐'" /  i  ``'‐- 、
 /  / | / く★へ ,. へ、. l         ヽ
./   ⌒ /     /`)   ヽ/        i
83名無しさん@お腹いっぱい。:2008/05/10(土) 01:20:48
うむ
84名無しさん@お腹いっぱい。:2008/05/11(日) 23:56:38
ここに保存されてないと過去のホームページを見るのは絶望的なの?
Internet Archiveの様なサイト他にないのかな
85名無しさん@お腹いっぱい。:2008/05/12(月) 01:31:45
魚拓は?
86名無しさん@お腹いっぱい。:2008/05/12(月) 01:40:36
>>85
無かった、やはり無理だよね
87名無しさん@お腹いっぱい。:2008/05/12(月) 06:02:39
URL晒せないの?
88名無しさん@お腹いっぱい。:2008/05/20(火) 16:15:22
http://homepage3.nifty.com/〜がURLだからそっから保存されてるを全て根気よく調べようと思ったら20000までしか表示されない
並べ方的にこの後なのに
http://web.archive.org/web/*sr_19981nr_30/http://homepage3.nifty.com/*
こういう仕様なのかな?だいたいのURLはわかります
89名無しさん@お腹いっぱい。:2008/05/21(水) 11:32:10
>>88
ttp://web.archive.org/web/*sr_19995nr_1/http://homepage3.nifty.com/*
確かにそういう仕様なのかもな。
URL のページ番号を示す部分が 19999 の次は -1 になってしまう。

あとは、 検索範囲を狭めて根気良くやっていくしかないと思う。
ttp://web.archive.org/web/*/http://homepage3.nifty.com/1*
ttp://web.archive.org/web/*/http://homepage3.nifty.com/2*
90名無しさん@お腹いっぱい。:2008/06/01(日) 16:15:15
「Failed Connection」は「接続できませんでした」の意味でしたっけ
91名無しさん@お腹いっぱい。:2008/06/02(月) 13:24:53
何と何が接続できなかったかを議論する前に
そんな障壁があったとは知らなかった。
92名無しさん@お腹いっぱい。:2008/06/02(月) 19:46:39
この数日Failed Connection頻発して使い物になんね

あとドメイン失効したサイト跡地にrobots.txt置く業者ウゼェ、マジで氏ね
93名無しさん@お腹いっぱい。:2008/06/02(月) 21:19:47
Failed Connection 頻発がマンネリ気味の恐れがあるなら、
94名無しさん@お腹いっぱい。:2008/06/03(火) 17:24:31
どのアドレスを入力してもFailed Connectionと出る、何があったのか!?
95名無しさん@お腹いっぱい。:2008/06/04(水) 05:23:26
過負荷がかかってるだけ
しばらく日をおいたらサーバー増強で直ってるんじゃね?
96名無しさん@お腹いっぱい。:2008/06/09(月) 17:10:39
なんか知らんが直ってるっぽいよ。
数メガバイトのzipファイルも1Mb/s辺りで落ちてくる。
1バイト欠けるのは相変わらずだけど。
97名無しさん@お腹いっぱい。:2008/06/18(水) 23:07:45
半年ルールでそろそろ今年頭のデータが見れるようになってもいいはずだけど…
昨年8月以降止まってる気がする。
98名無しさん@お腹いっぱい。:2008/06/20(金) 00:20:03
99名無しさん@お腹いっぱい。:2008/06/26(木) 14:37:06
Proxomitronの設定ってこれで合ってる?

ttp://imepita.jp/20080626/525180
100名無しさん@お腹いっぱい。:2008/06/28(土) 10:04:32
>>99
違う。
というか、某所のフィルタを利用するつもりなんだろうけど
フィルタのインポート、エクスポートの方法を調べた方がいいよ。
ついでに、text/html だけじゃなくて、text/plain も考慮してみては。
101名無しさん@お腹いっぱい。:2008/06/28(土) 23:17:37
>>100
ども。俺にはややこしそうだから諦めるわ('A`)
102名無しさん@お腹いっぱい。:2008/07/01(火) 01:16:19
過去のHPがウェブアーカイブに残ってますが、
これは二度と消すことができないのでしょうか?
また、今のHPも残っていますが、これは今からでも何か処理することで
残る事を防げますか?
103名無しさん@お腹いっぱい。:2008/07/01(火) 12:58:22
見れなくされると気分が悪いから教えない。
104名無しさん@お腹いっぱい。:2008/07/01(火) 15:08:17
>>103
自分のHPを消したいだけですので、教えてください。
105名無しさん@お腹いっぱい。:2008/07/01(火) 23:21:26
英語を勉強してください
以上

それすらできないくせに消したいと思うなど100年早い
106名無しさん@お腹いっぱい。:2008/07/06(日) 13:18:45
Data Retrieval Failure.

これって何なの?日本語訳が解らないわけでなく、ある程度のサイズのファイルを落とそうとするとかなりの頻度で見かけて困る。
107名無しさん@お腹いっぱい。:2008/07/06(日) 15:48:58
訳せるなら意味もわかるだろ、そのまんまだし
嘘つくなよ
108名無しさん@お腹いっぱい。:2008/07/06(日) 16:07:09
そりゃinfoseekやらのポータルサイトに翻訳もある訳でそんなの無学な子供でも解るわい。
データ検索失敗というエラーがある程度容量(5MB以上?)であろうファイルで頻発するのがどうにもエラーメッセージと結びつかないから書いたのだよ
109名無しさん@お腹いっぱい。:2008/07/07(月) 11:17:30
半年ルールはどこにいったんだ?
110名無しさん@お腹いっぱい。:2008/07/07(月) 12:33:51
このままじゃもうすぐ一年ルールになるなww
111名無しさん@お腹いっぱい。:2008/07/08(火) 09:20:08
ほんとだ、2007/8/30以降分が公開されてない…
112名無しさん@お腹いっぱい。:2008/07/09(水) 15:09:42
まだHPがある場合、
HTMLにロボット禁止タグを入れると保存されたデータが消えるというのは本当ですか?
113名無しさん@お腹いっぱい。:2008/07/12(土) 16:08:08
公開されてないだけでちゃんと8月以降もクロールはしてるんだよな?
不安だ
114名無しさん@お腹いっぱい。:2008/07/13(日) 08:06:35
>>112
ぼくがもっとおおきくなって、 えいごがよめるようになってからかんがえましょう。

http://web.archive.org の 「よくあるしつもん」 のぺーじにかいてあります。
それいがいのほうほうはありません。
どめいんのどきゅめんとるーとのあくせすけんがないばあいは、
すなおにあきらめましょうね。

>>113
> 公開されてないだけでちゃんと8月以降もクロールはしてるんだよな?

"ia_archiver" でぐぐると、 足跡を残したアクセス統計が出てくる。 今月のものもある。
クロールしただけで保存されていない、 なんて可能性も否定はできないけど。

あと考えられるのは日数計算のバグくらいか。
115名無しさん@お腹いっぱい。:2008/07/13(日) 08:23:24
>>108
試しに "Data Retrieval Failure." を Infoseek の翻訳に掛けてみたら
本当に "データ検索失敗" が出てきた。 これは痛い。

データ処理を表現するときの "retrieve" は、
"get のやや形式ばった表現" 程度に考えるのが普通。
少なくとも "search" ではない。
116名無しさん@お腹いっぱい。:2008/07/27(日) 09:18:55
                _,.. ---- .._
              ,. '"       `丶、
              /            ` 、
            ,..-‐/    ...:  ,ィ  ,.i .∧ ,   ヽ.
.         ,:'  .l .::;',. :::;/..://:: /,':/  ', l、 .i  ヽ
.          ,'  ..::| .::;',' :;:','フ'7フ''7/   ',.ト',_|, , ',.',
       ,'   .::::::!'''l/!:;'/ /'゙  /     '! ゙;:|:、.|、| 'l
.         ,'.  .:::::::{ l'.l/  、_  _,.      'l/',|.';|
       l  :::::::::::';、ヾ      ̄     `‐-‐'/! ';. '
.         ! :::::::::::/ `‐、        ゝ   |'゙ |
       | ::::::::/   \    、_, _.,.,_ ノ::: !  
       |::::/.     _rl`': 、_     ///;ト,゙;:::::./
..      `´      /\\  `i;┬:////゙l゙l ヾ/   
                ,.:く::::::::`:、\ 〉l゙:l  / !.|
.            /:.:.:.:\:.:.:.:.`:、ソ/:.:|    | |
           /.:.:.:.:.:.:.:.:.:\:.:.:.:У:.:;l   /./
.          /:.:.:.:.:.:.:.r'´`‐,`、:/.,.:‐{   | !`:、
           ,'.:.:.:.:.:.:.:.:.';_,゚.,ノ.:./,:':.:.:.:',  | |`、:|
           !:.:.:.:.:.:.:.:.:.:.゙、:.::/:.:.:.:.:.:.ヽ, / ,!:.:`、
web_archiveさんが古いパーツや周辺機器のドライバと、
OSやアプリの修正パッチを永久保全しておいてくれますように♪
11798:2008/08/03(日) 18:07:00
>>97>>109-111>>113
今日 >>98 のリンク先を確認したら、
本家は今年 1 月のデータまで出てくるようになってた。
ミラーは相変わらず昨年 8 月まで。
118名無しさん@お腹いっぱい。:2008/08/06(水) 07:25:07
>>117
d
119名無しさん@お腹いっぱい。:2008/08/13(水) 14:22:08
やっと動き出したか
ビビルわぁ
120名無しさん@お腹いっぱい。:2008/08/21(木) 16:49:27
これって×になってる画像見る方法ないんか?
12198:2008/08/22(金) 10:09:39
>>120
要因による。
122名無しさん@お腹いっぱい。:2008/08/22(金) 20:39:52
>>120
見れないと思うぞ
123名無しさん@お腹いっぱい。:2008/08/23(土) 15:43:53
こんなん見つけた

Archive-It.org
ttp://www.archive-it.org/public/advanced
124名無しさん@お腹いっぱい。:2008/09/10(水) 10:37:12
なんかttp://homepage2.nifty.com/のデータが「サーバーが見つかりませんでした」の連続で
まるっきり表示されないのだが、どうなっとるのかね?
125名無しさん@お腹いっぱい。:2008/09/10(水) 20:17:23
>124
そのURLのサイトは軒並みブロックされてたからその所為かも

他のブロックされてたサイトのURLをサーチしたら真っ白画面になる
前はブロックしてますメッセージが出てたのに
たまに見られたりする時があったりしたのにもうそれも無くなるのかな
12698:2008/11/15(土) 04:30:13
Internet Archive がキャッシュを出力するときは
<BASE HREF="http://元の URL のドメイン部分/"> というタグを
<head> タグの直後に挿入していたけど、 これが
<BASE HREF="http://元の URL のドメイン部分.way_back_stub/">
というタグに替わってしまった。

何が問題かと言うと、
例えば http://www.example.com/hoge.html のキャッシュを開いたとき、
そこで使用されていた画像は今まで www.example.com サーバへ取りに行っていたのが
www.example.com.way_back_stub サーバへ取りに行こうとしてしまう。
(その後、 JavaScript で web.archive.org 内の画像に差し替えられるけど。)
www.example.com.way_back_stub なんてサーバは当然存在しないわけで、
ブラウザは DNS からエラーが返るまで待ってしまう。

最近、 キャッシュの表示が遅くなったと感じている人はそれが原因かも。
何らかの方法でそういう URL へのアクセスをブロックすることを薦める。
例えば Opera なら、 「http://*.way_back_stub/* 」 を
「コンテンツのブロック」 のリストに加えれば良い。
IE の対処方法は無いような気がする。
127名無しさん@お腹いっぱい。:2008/11/15(土) 04:59:02
>>126
ほうほう貴重な情報ありがとん!
ここ応用すればIEでもイケルかな?

特設:時報撃滅大作戦 - ニコニコ動画まとめwiki
ttp://nicowiki.com/%E7%89%B9%E8%A8%AD%EF%BC%9A%E6%99%82%E5%A0%B1%E6%92%83%E6%BB%85%E5%A4%A7%E4%BD%9C%E6%88%A6.html#p54ec720
12898:2008/11/15(土) 05:24:16
>>127
おぅおぅ、 こんな過疎スレをチェックしてるとは……。

うちは未だに Proxomitron 使ってるんで、 殆どのブラウザをブロックできるんだけど
開発が止まった古いソフトだし、 Prox ユーザなら方法はすぐ思いつくだろうから
敢えて書かなかった。
ありがと。
129名無しさん@お腹いっぱい。:2008/11/18(火) 03:40:49
サイトの削除依頼の仕方がわからない…
User-agent: ia_archiver
Disallow: /
ってなrobot.txtをアップして
ttp://www.alexa.com/site/help/webmasters
ここでCrawl My Siteボタン押してから2ヶ月近く経ったけど未だに削除されない…
削除依頼の仕方間違ってるのかな?
130名無しさん@お腹いっぱい。:2008/11/18(火) 12:01:36
× robot.txt
○ robots.txt
131名無しさん@お腹いっぱい。:2008/11/18(火) 19:51:46
>>130
レスする際に書き間違えていました。robots.txtとしてアップロードしてます。
それで何故か今日の4時ごろにメールがきていました
Hello,
Your site has now been excluded from the Wayback Machine. Please wait an hour for the changes to take effect. If you have any other questions or concerns, please let me know.
削除されたのを確認しましたが、なんでこんなタイミングよく今頃になってメールきたのかサッパリです。
132名無しさん@お腹いっぱい。:2008/11/18(火) 20:46:15
そりゃ中の人がこのスレを見tうわなにすくぁwせdrftgyふじこlp;@:「」
133名無しさん@お腹いっぱい。:2008/12/07(日) 03:17:49
どうしても見られないところはどうすればいいのかなー
他にいい所ありますでしょうか?
134名無しさん@お腹いっぱい。:2008/12/16(火) 11:19:52
残念ながら…
135名無しさん@お腹いっぱい。:2008/12/25(木) 00:25:04
そうですかorz
136名無しさん@お腹いっぱい。:2008/12/25(木) 00:41:23
魚拓系のサイトと違って、
クローラを使って手当たり次第に保存していくサイトは
ここ以外に無いでしょ?
137名無しさん@お腹いっぱい。:2008/12/31(水) 02:43:19
audio archiveのFAQを見ても書いてないっぽいんで念のため聞きたいんだけど、
あそこの音源って直リンクかましてもOKなん?
138名無しさん@お腹いっぱい。:2008/12/31(水) 13:26:59
ネチケット的にはどうかと思うけど、(今の所)問題は無い
ただ余りにも人が来るサイトや負荷をかけるツールを使うような厨が来るサイトなら
メールで許可取っといた方が無難
139名無しさん@お腹いっぱい。:2009/01/02(金) 03:29:45
>>138
ありがとう。
じゃあ例えばCCLPで曲を公開してるアマチュアミュージシャンが
倉庫代わりにAudio Archiveに自作曲を置いて、自サイトに直リンク
させて公開って手法も有りって事になっちゃうんだね。

メールでの許可取るのが非英語圏の人間には大変そうだけど。
140138:2009/01/02(金) 17:23:17
>>139
>>139の「例えば〜」ってのにつっこむと、
可能な限りメインリンクとしてでは無くミラーリングリンクとしてAudioArchiveを使ったほうが良いと思うね。
例にInternet Archiveに許可を取ってゲームのTAS(Tool-assisted speedrun)動画を鏡公開してるサイト貼っとく。
Speed Demos Archive
ttp://speeddemosarchive.com/

あと英文メールでの許可なんて、数〜数百メガのファイルが倉庫代わりに置ける鯖やサービス探すより遥かにラクでしょ?
辞書片手の昔ならいざ知らず、今はExciteとかWeb翻訳等のエンジンもかなり向上してるしさ。
ちゃんとメアド・自サイトURLなどの身元や、CCLPで公開してると明記しとけば審査も通るハズ。

実際の所>>137が何をしたいのかわからんけど、俺のレスが何かの参考になればいいな…と思ってる
141139:2009/01/03(土) 01:30:29
>>140
丁寧にありがとう。
> 実際の所>>137が何をしたいのかわからんけど
昔やっていた2ちゃんのまとめサイトのデータの中の音源部分をAudio Archiveにアップ
しようかと思っているんですよ。2chで公開されていたものなんでPD同然ですけど、
空気として非営利が当たり前って感じでしたから、まぁCCLPで非営利-継承くらいが
適当なのかな、と。
で、公開するのに直リンクは止めてねと明示しておいた方がいいのかどうか、
特に記載も無いからOKって事なのか、分かりかねていたところでありました。

仰るようにIAの運営目的を考えたら倉庫的に使うのではなく、あくまで実際の図書館がそうであるように
「納める」先の一つとするのが筋ですわね。
142138:2009/01/03(土) 10:20:56
多分(というか普通)直リンは禁止にしておいたほうがいいと思うわ(なるべくHTMLにリンクさせるとか)
もし2chなどに貼られたら転送量がハンパじゃなくなるし、やっぱ「納める」先の一つと考えた方がベター

あと俺、音楽詳しくないし法律詳しくないしスレ違いだけど
"2chで公開されていたもの"って139が作った音源じゃないの?
だとしたらPDじゃなく権利はまだ製作者にあると思う→ドワンゴ問題
削除依頼スレ等でよく間違いを見るんだけど、2chでのレス(文章)は2chに帰属するけど、2chにリンクとして貼られたブツは管轄外
とくに音楽関係は様々な団体の利権が絡みやすいので気を付けて
なるべくだったら製作者に「これこれでこう公開する」と許可取った上で公開した方が良いと思うよ
大きなおせっかい老婆心スマソ
143139:2009/01/04(日) 05:07:09
>>142
親切にアドバイスありがとう。
確かに権利関係はちょっとは気にしてます。名無しor捨てハンの人の作品ばっかりなんで、
許可の取りようが無いってのが実情ですが。
作り手の心意気を汲んだ形で後世に残るようにしたいとは思ってます。

転送量についても気にするところですが、サーチエンジン弾いてこっそり奉納って
多分できないですよね。noindexのオプションはIA内でのサーチからは隠れてもGoogleのロボット検索は弾いてくれない
みたいなんで。
144名無しさん@お腹いっぱい。:2009/01/04(日) 11:18:40
許可の取りようが無いから勝手に公開していいってことにはならないよ
>>139が著作権法なんて無視だ!2chでそんなこときにしてられるか!法律は俺が法だ!
っていうなら止めようもないけど
145名無しさん@お腹いっぱい。:2009/01/04(日) 13:55:20
うん、まぁ2chだしいいんじゃないの
146名無しさん@お腹いっぱい。:2009/01/05(月) 14:24:32
レンタルサーバーでドメイン取得していて
そのサイトを閉鎖する時にどうやってアーカイブブロックするのかな?
解約したらテキスト置けないし、メールで要請した時はどうやって本人確認取ってるの?

それと数年後にまたサイトやりたくなって同じドメインを取得してブロック解除要請とか出来る?

最後に、
契約終了後のレンタルサーバー側で勝手にブロックしてるところもあるみたいなんだけど
その場合同じドメイン取得するれば自動的に解除になるのかな???
質問ばかりですんません。詳しい人いるかなー。
14798:2009/01/05(月) 17:50:25
>>146
閉鎖だからブロックだの、 後で解除だの、 はた迷惑な話。
Internet Archive 等の長期キャッシュのみ排除するよう、
robots.txt の中身を考え直すほうが先。

> 契約終了後のレンタルサーバー側で勝手にブロックしてるところもあるみたいなんだけど
ドメインが失効してしまえば、 DNS から抹消される。
レンタルサーバ側でどんな対応をしたところで、 いずれは無関係になる。

DNS から引けない状態を、 IA は HTTP 404 エラーと同様に
「robots.txt 未設置 = すべて許可」 として処理しているように思える。
開設後かなり時間が経ってから robots.txt を置き、 その後廃止されたサイトで
robots.txt 設置後のキャッシュは確かに IA に残っていないのだが
設置前にクロールした分はドメイン失効後に公開されてしまった、
そんなのを見たことがある。
14898:2009/01/05(月) 18:04:19
書き忘れ。

>>147 は普通にレジストラからドメインを取得した場合の話。
レンタルサーバ業者のサブドメインの場合、
契約終了後に DNS で引けなくなるタイプなら >>147 と同様になるが、
終了サイト用のコンテンツが用意されていれば、 その robots.txt の内容次第。
149名無しさん@お腹いっぱい。:2009/01/05(月) 22:42:34
>>148
専門用語が多くてよくわからんかったけど
調べながら見てみます ありがとう!
150名無しさん@お腹いっぱい。:2009/01/06(火) 22:22:43
>>144
その指摘が正しいのは重々承知してます。
だから現実的には著作権侵害が親告罪なのを考慮して、とりあえずアップして
問題があったら削除しますから連絡下さい。作者とわかる証拠と共に。みたいな形に
なるのかな、と。GoogleStreetViewみたいなオプトアウト式を取ってますよ、とういう形。

実際文句を言われる事は無いとは思うんだけど、2ちゃんねる的な空気感の伝わらない
ところに保存するんだから、アピールでもあれそういった形だけ見せる必要はあるかな、
とは考えています。

話題が完全にスレ違いになってしまいましたね。御免なさい。
151名無しさん@お腹いっぱい。:2009/01/10(土) 22:07:37
>>117あたりで一旦直った昨年2月以降公開ずっと止まりっぱなしだぞー
152名無しさん@お腹いっぱい。:2009/01/16(金) 18:29:08
過去のサイトを検索できるWEBアーカイブの実力 | R25
ttp://r25.jp/b/honshi/a/ranking_review_details/id/1112008111304


7年前のネット世界にタイムスリップ。
10月末までの期間限定サイト『2001 Google Search』では2001年時点でのキーワード検索の結果が表示され話題になった。
でも、どうしてグーグルで過去のサイトが検索できたのだろう? もしや膨大な量のサイトを保存しているのか。
サーチエンジンや情報検索を研究する早稲田大学基幹理工学部の山名早人教授に話を聞いた。

「グーグルは過去のサイトの保存を公式に認めていません。
見ることができたのは、アメリカにある非営利団体『インターネット・アーカイブ』が保存しているサイトにリンクされていたからです。
ここはWEB上に存在したサイトを保管する図書館のようなもの。
本と同じようにサイトの情報も未来に残す文化と捉えて様々なサイトを収集、保存しています」

収集頻度はWEBページの更新間隔を予想してロボットが自動的におこなうので、
毎日更新のサイトでも全て収集されているわけではないとか。
ちなみに、"2001 google Search"は終了したからもう見られないとお嘆きのあなた。
『インターネット・アーカイブ』から直接URLを打ち込めば、国内外を問わず過去のサイトを見られる場合もあるので一度お試しあれ。


日本ではというと、実は『WARP(インターネット情報選択的蓄積事業)』と呼ばれるプロジェクトを国立国会図書館が行っている。
とはいえ、担当者によると「今のところは主に国の公的機関のWEBページを収集の対象としている」とのこと。

ユーザーの立場からすると、過去の情報が蓄積されるのは便利である。
しかし、著作権法の保護対象や肖像権、プライバシー権の取り扱いは国によって異なる。
日本ではWARPが収集しようとした公的機関のサイトがタレントを使ったキャンペーンだったので断られたケースもあったという。
気軽にいつでも過去のページを見られるようになるには、まだまだクリアしなくてはいけない問題が山積みのようだ。

(笹林司)
153名無しさん@お腹いっぱい。:2009/01/20(火) 21:44:40
いいんだけどなあ
154名無しさん@お腹いっぱい。:2009/01/25(日) 03:43:40
Internet Archiveを使って過去のサイトを見てるんだが、cgi掲示板だけは開けない。
ページ移動も記事閲覧もcgi依存だからかな
なんとか見る方法知らないか?
155名無しさん@お腹いっぱい。:2009/01/25(日) 05:25:08
そのCGIタイプや鯖などのURL晒してもらわんことには何ともいえん
cgiでは無くdatなどのログへの直アドで見れることもあるし
156名無しさん@お腹いっぱい。:2009/01/25(日) 18:34:35
ttp://web.archive.org/web/20030203082912/rx.sakura.ne.jp/~kobuta/abou/ffss14_/anthology.cgi
ttp://web.archive.org/web/20001019054809/rx.sakura.ne.jp/~kobuta/abou/ffss/anthology.cgi

こんな感じのやつで、過去ログ移動&作者を選択してリスト表示や、NEXTPAGEを押して移動したいんだがどうにもできん
どうにかして過去ログをみたいんだが、手はないのかな?
15798:2009/01/25(日) 23:15:11
158名無しさん@お腹いっぱい。:2009/01/27(火) 15:41:01
>16進数の最後の末尾に「00」を付加すると正常なファイルになることがあります
おお、すごい!直った。

所で、Internet Archiveに保存されたサイトを、リンクを保ったままHDDに保存したいのですが、
ブラウザで保存するとアーカイブされた日付ごとにフォルダができてしまい、
また、そもそも下層リンク等が保存できません。
なにか、保存する方法ってあるのでしょうか?
15998:2009/01/27(火) 17:42:59
>>158
Internet Archive が出力する HTML は、 オリジナルに対し
次の 2 ヶ所に挿入が行われている。 (\n は改行文字)

◎ <head 〜> の直後
\n<BASE HREF="http://ほげほげ">\n
◎ </html> の直前、 もしくはファイルの末尾
\n<SCRIPT language="Javascript">\n<!--\n\n// FILE ARCHIVED ON 〜
(中略)
〜 \n//-->\n</SCRIPT>\n\n

関係するファイルを一つ一つちまちまとダウンロードし、
オリジナルのフォルダ階層に沿ってファイルを配置し、
それぞれの HTML から前述の 2 点を除去すれば、
リンクを含めたサイトの構造を完全に再現できる。

ここでいう 「ダウンロード」 とは、 HTML や画像、 スタイルシートなど
ファイルを一つ一つ個別に保存することを指す。
非常に手間が掛かるし、 欠けているファイルを探すために
HTML を読んでトレースするなど、 多少の知識は要求される。

ブラウザでの保存方法によっては、 保存先を一回指定するだけで
画像などをごっそり持ってきてくれることがあるが、 あれは
その時開いていたページ 「だけ」 を HDD 上で再現させるもの。
リンク先などは外の (ネット上の) URL に張る必要があるし、
そもそも 「解らない人向けのお手軽機能」 だから仕方が無い。
160156:2009/01/28(水) 01:25:29
>>157
ありがとう。難作業だがやってみる!
161名無しさん@お腹いっぱい。:2009/01/30(金) 18:11:55
現在停止中みたい
16298:2009/01/31(土) 00:37:26
昨年 2 月より後のキャッシュが出てこない件、
サイトによっては 4 月 1 日まで OK っぽい。
ttp://web.archive.org/web/*/http://www.google.com/
ttp://web.archive.org/web/*/http://www.yahoo.com/
それでも、 まだおかしいことには変わりは無いが。
163158:2009/02/08(日) 00:09:29
>>159
ちまちま法しかないんですか、ありがとうございました。
16498:2009/04/08(水) 12:19:25
とうとう、 新しいキャッシュが出てこないまま 1 年が経過。

>>126 の件だが、 BASE タグで挿入されるドメインが
http://元の URL のドメイン部分.way_back_stub/」 から
http://元の URL のドメイン部分.wstub.archive.org/」 に変わってるなー。
少なくとも、 DNS でのエラー待ちは無くなった。
ただ、 用意されているサーバは どうも 404 を返すだけのようだから
素直にフィルタリングしたほうが良いのかな。
Internet Archive が持っているキャッシュにリダイレクト等してくれると
ありがたいんだけど。
165名無しさん@お腹いっぱい。:2009/04/09(木) 15:46:09
二ヶ月もスレが止まっていた件について
16698:2009/04/09(木) 15:56:46
>>165
ネタあらへんさかいしゃーないやんか
167名無しさん@お腹いっぱい。:2009/04/09(木) 16:23:54
それもそうだな
Recallの復活はいつになるのかねぇ
168名無しさん@お腹いっぱい。:2009/04/16(木) 01:01:40
wayback machineが使えない。
169名無しさん@お腹いっぱい。:2009/04/16(木) 02:07:06
使えるようになった
170名無しさん@お腹いっぱい。:2009/04/22(水) 20:11:47
どうしても見たい記事が見れねぇ
技術の発達で今後見られるようにならないかな
17198:2009/04/22(水) 21:00:27
>>170
元々キャッシュされてないとか、
robots.txt で撥ねられてたら無理だな。
172名無しさん@お腹いっぱい。:2009/04/22(水) 22:47:15
robots.txtは地味にうざい
17398:2009/04/23(木) 01:20:57
まあ、 こういう例もあるからなあ。
ttp://web.archive.org/web/*/http://%73%68%77%61%73%68%77%61%2e%63%6f%6d/*

このサイトにロボット全拒否の robots.txt が設置された後、
初めて Wayback Machine が読みに行ったのが 2007 年 12 月。
よって、 それ以降はクロールしていないだろうし、
Wayback Machine から古いキャッシュを取り出そうとしても
"Robots.txt query exclusion." と返されていたはず。
ところがサイトが死んでしまったものだから、
robots.txt 設置前にクロールされた分が公開されてしまった、 というオチ。
174名無しさん@お腹いっぱい。:2009/04/23(木) 13:04:52
特に、ページは読めてもファイルが置いてあるところはrobots.txtでブロックされていると目茶苦茶にがっかりする
175名無しさん@お腹いっぱい。:2009/04/26(日) 16:47:22
ちまちま法しかないのでしょうか?
17698:2009/04/26(日) 18:27:05
>>175
>>159 の "ちまちま" のこと?
あれを自動で行う、 専用の HTTP クライアントソフトを作れば良い。
既に誰かが作った、 という話は聞いた事が無い。

TCP が扱えるスクリプト言語か何かを使って HTTP を喋らせれば済む話だから、
作るのはそんなに難しいことではないと思う。
一度に数百個もキャッシュを拾ってくる必要性が出てきたら
俺も真剣に考えるかな。

ttp://web.archive.org/web/*nr_大きい数字/example.com/*
みたいな URL を与えて、 サイト内のファイルをごっそり持ってくるような方法なら、
HTML 解析も Wayback Machine のキャッシュ一覧を処理するだけになる。
177名無しさん@お腹いっぱい。:2009/04/27(月) 05:07:07
175です。
すいません。1999年から2002年ごろに作ったすでに閉鎖したWebサイトを復元したおきたいと思ったのです。
何日かすべてがInternet archiveに残っていますので、一括ダウンロードができないかって思ったのです。
いくつかの一括ダウンロードソフトで試みたのですが最初のページだけしかダウンロードしてくれません。
設定のコツみたいなものがあるのでしょうか?

ぐぐったらwarrickってparlプログラムを使う方法もありそうですがちょっと簡単ではないみたいで、これを試みてみましたが
どうもうまくいかない状況です。

ちまちま落としていくにはちょっとページが多すぎるのです。
まずは、一括ダウンロードだけでもしたいと思っています。

17898:2009/04/27(月) 20:13:23
>>177
へえーへえーへえー warrick って面白そう。
ただ生憎動かせる環境が無いなあ。

一括ダウンローダで最初のページしか持ち帰らないのは
ダウンローダの選定/設定ミス (リンク先を自動追跡していない) でなければ、
「最初のページ」 の URL が不適切。

>>156 のような再現されたページからスタートしても、
そこで使っている画像ですら 404 で、 他には何も持ち帰れない。

>>176>>173>>157 のようにワイルドカード (*) を与えて、
Wayback Machine が持っているファイルの一覧からスタートする必要がある。
179名無しさん@お腹いっぱい。:2009/04/29(水) 08:18:17
ダウンローダを iria とか irvineとかWeBOXとか使ったがうまくできなかったので
結局、warrickで行くことにした。
なんとか、WindowsXP環境にアクティブパールやSOAP-Lite等をセットできて
動作した。すごく動かすまでに時間はかかってしまいましたが。
まあ、どのディレクトリーになにを置くのかがポイント。メッセージを
見たらわかるだろって突っ込まれそうですが。
うまく動作してくれて目的は達成できました。いろいろありがとうございました。
180名無しさん@お腹いっぱい。:2009/04/29(水) 11:21:32
スクリプトOFF民族としては今の仕様は糞。
181名無しさん@お腹いっぱい。:2009/05/01(金) 16:12:52
K-12 Web Archiving Program!ってなんだろ
182名無しさん@お腹いっぱい。:2009/05/01(金) 16:22:35
warrickがGUIになればいいのに
183名無しさん@お腹いっぱい。:2009/05/01(金) 16:23:42
>>181は中卒
あんな英語も読めん
184名無しさん@お腹いっぱい。:2009/05/01(金) 20:37:43
中卒でもあれくらい読めるだろw小卒でも読めるはずだw


つまり>>181は幼卒か教育を受けていない
18598:2009/05/01(金) 23:10:06
>>179
おめ

>>184
K-12 未満には K-12 の話題は解らん、 て事か。
186名無しさん@お腹いっぱい。:2009/05/24(日) 09:30:18
>>162
データ収集はしているが、掲載を停止しているということ?
それとも収集自体やめてしまった?
187名無しさん@お腹いっぱい。:2009/05/24(日) 09:39:04
>>186
自己レス。Wayback Machine Forumを見てたら、

Wayback Stopped Archiving?という質問に対して次の回答

Poster: gojomo Date: May 22, 2009 03:00:08pm
Forum: web Subject: Re: Wayback Stopped Archiving?
It always takes at least 6 months, and sometimes about a year, for collected web material
to become part of the public Wayback Machine collection.

After some recent changes to the Wayback Machine architecture, and the migration of all data
to a new datacenter, we'll be catching up through all 2008 in the next month or so.

- Gordon @ IA

全データを新しいデータセンターに移していて、6月か7月ぐらいには2008年分までは作業が終わるということか。
188名無しさん@お腹いっぱい。:2009/05/24(日) 11:02:04
>>187
へー参考になった
189名無しさん@お腹いっぱい。:2009/06/16(火) 22:48:14
We're sorry, access to http://jns.ixla.jp/users/utyuunosora1641/isyu2.jpg has been blocked by the site owner via robots.txt.
くっそう!なぜだ!
190名無しさん@お腹いっぱい。:2009/06/20(土) 07:33:33
久しぶりに昔のお気に入りサイトに行ったら閉鎖してて
なんとかしてみたいと思ってInternet Archiveを使ったのですが…
『このホームページはJavaScriptを使っています。
ブラウザの設定でJavaScriptを有効に設定してから
アクセスしてください。』
とか出ちゃいました
JavaScriptは有効にしてるのにみれないから、これはなんかもう駄目ってことなんでしょうか?
このHPなんですけど
ttp://cocoaroom.kir.jp/

191名無しさん@お腹いっぱい。:2009/06/20(土) 17:56:53
ら抜きやめろあきらめろ
192名無しさん@お腹いっぱい。:2009/06/20(土) 21:30:01
やっぱり駄目なんですかー
ありがとうございました
193名無しさん@お腹いっぱい。:2009/07/06(月) 20:19:29
194名無しさん@お腹いっぱい。:2009/09/24(木) 00:53:17
メンテナンスを再開したみたいだな
195名無しさん@お腹いっぱい。:2009/10/03(土) 18:41:23
そうだな
196名無しさん@お腹いっぱい。:2009/10/07(水) 07:46:12
またメンテ
197名無しさん@お腹いっぱい。:2009/10/08(木) 03:45:04
Internet Archive
198名無しさん@お腹いっぱい。:2009/10/08(木) 20:01:16
メンテ再開
199名無しさん@お腹いっぱい。:2009/10/24(土) 00:12:59
  ー-= 、  ,,...、 /:;:::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::ヽ
   ,::-'' ̄`:Y,,,、Y::::::::::::::::::∧:::::::i;:::::::::::::::i;::::::::::::::::::::::::::\
 /  ...:::::::::i"  Y:::/::::::::::::/  ヽ;::::iヽ;;:::::::::::!;::::::::::i::::::::..i,  ';
.i ..:;::::::::;;;/ `'='":/:::::::;i::::/   ヽ:::!,ヽ;;:::::::::::i;:::::::::|;::::::::|:::::::!,
.|::::;i:::::;//  |::::::!:::::::;/::/     ヽ;::i \;;::::::!ヽ;:::::|;;:::::::|::::::::|
. i;:;|::;/ !   |::::::|::::::;/!::i      ヽ:!,  \;:::::|ヽ:::::|!;;::::::|:::::::|
 \/ '   !:::::;|::::;/ |:|       ヽ!    ヽ;::| ヽ::| 'i;:::::|:::::::|
       |::i::;;!;;:::i `|!' -ー ,,_    '!,   _,,>::!-'!:|´ |::::|::::::|
      ノ1;;!;!;;;;!  ! ,-'',´o::,`    ` `=''o:',ヽ、!  i:::i:::;::|
       |/`!r-!, ./ i::::::::::::i      i:::::::::::i. `,  !::i;;;;i;:|
       '  | `)i '  ヽニノ      ヽニノ  ! /|!`i/V
         ヽ `,} .::::::::..            .::::::.. !) /
   ,,、        `Ti ::::::::      '     :::::::::: i,,=i7
   ヽ ヽ        Vヽ                  イ/ '
    `, `,       `_へ.、    rニュ    _,. t7 "     ageます。
     i  ヽ     ,-i':ヽ`''"ニi-ー .,,,,,,,. -t'´''''フ⌒iヽ
    ,./-´`'r-ー、r-' ヽ: ヾ´ '        ' `=/: :/ `、
    ! - '''ヽ=- }     ヽ:.ヽ        /: :/    'ヽ
    }  -'''`Y  |ヽ     `:、`-ー、  ,.-': :/    _,,イ
    >、-t-´` .イ: :'! \    `''+; ;'i ./: :/   _,.-'''´ /: :i
   .|:.iゝ、  /i|: : :'!,  `' ----┴-!--'ー-- ´  i  /: : : |
    |: Y   |ノ:i: : : :!         /⌒'- .,,/''ヽ| /: : : : :.!
200名無しさん@お腹いっぱい。:2009/10/28(水) 18:03:41
Internet Archiveってrobot.txtが効いてても公開されないだけで保存されるんでしょ?
robot.txt実行してもそのサイト自体404になったら公開されるんだろうか…?
201名無しさん@お腹いっぱい。:2009/10/29(木) 12:03:13
>>200
スレを頭から読み直せ
202名無しさん@お腹いっぱい。:2009/11/29(日) 03:05:44
2008年6月以降のログって無いの?
203名無しさん@お腹いっぱい。:2009/11/29(日) 20:28:21
>>202
アーカイブはしているが参照できるようには整理していないということでは。
204名無しさん@お腹いっぱい。:2010/01/18(月) 04:07:48
Internet archiveを携帯で見れるブラウザサービスって「ぐるっぽ」以外にあるでしょうか。
ファイルシークなどだとページは見れますが、リンクを飛ぶたびいちいちnot found や404になってしまいます
また、imodeなどのフルブラウザ機能で上のような不具合なく閲覧可能なものはあるでしょうか
nternet archive、のスレ検索で出てきたのがここだけなので聞いてみますが、スレチでしたら申し訳ない
205名無しさん@お腹いっぱい。:2010/01/18(月) 04:31:27
iPhoneの一台や二台買えよ
206名無しさん@お腹いっぱい。:2010/01/18(月) 06:34:05
別に二台は要らんだろ
207204:2010/01/18(月) 23:42:50
>>205
iphone(というよりipod touch)買おうかなと思ってたので参考になりました。
あと自分で調べたんですが携帯用のYahooのブラウザだと表示可のようです。
読み込みにものすごい時間かかったりエラー表示がたまにでたりしますが。
touchの購入も視野に入れて見やすいブラウザ探していこうと思います。
208名無しさん@お腹いっぱい。:2010/02/19(金) 20:31:29
年明けてからなんかやけに重くなったな。
やたらとエラー頻発するし・・・
今日なんかどのページを参照しても「Failed Connection」しか出てこない。一体どうなってんだ。
209名無しさん@お腹いっぱい。:2010/02/21(日) 18:41:55
たしかに重い。なんとかしてくれ。
210名無しさん@お腹いっぱい。:2010/02/22(月) 15:00:44
とにかく2008年分はメンテしてくれ
211名無しさん@お腹いっぱい。:2010/02/28(日) 01:38:44
重いどころか、落ちてるじゃねーかorz
212名無しさん@お腹いっぱい。:2010/03/03(水) 06:36:06
一応保守
213名無しさん@お腹いっぱい。:2010/03/07(日) 23:21:47
削除依頼ってwayback2@archive.orgかinfo@archive.org宛てであってる?
一ヶ月前両方に送ったのに音沙汰なし。もう一回送った方がいいのかな。
214名無しさん@お腹いっぱい。:2010/03/19(金) 03:40:58
参考までに

「クルクート幻想風花」無断再配布事件 経緯とそのまとめ → webアーカイブからコンテンツを削除するためのいくつかの方法
http://red.ribbon.to/~poughkeepsie/curucute/webarchive.htm
215名無しさん@お腹いっぱい。:2010/04/06(火) 11:54:54
めちゃくちゃ重いのですが
216名無しさん@お腹いっぱい。:2010/04/09(金) 21:11:47
info@〜宛で送ったけど音沙汰なくて
[email protected]の方に送ったらすぐに消してもらえた

去年の話だけど参考までに
217名無しさん@お腹いっぱい。:2010/04/13(火) 17:20:00
robots.txtでアーカイブ表示させないようにしてても
たまに普通に見られることがある(ブラウザにキャッシュが残ってるわけじゃない)
リロードするとまた表示できなくなるけどこれじゃ意味ないな
218名無しさん@お腹いっぱい。:2010/05/06(木) 21:57:07
メンテ促進祈願
219名無しさん@お腹いっぱい。:2010/06/12(土) 12:57:01
>>Poster: gojomo Date: June 10, 2010 04:06:21pm
>>Forum: web Subject: Re: why not visible ??

>>Material archived in 2009 and 2010 (and even a little from the very end of 2008) has been saved
>> but not yet indexed for display in the Wayback Machine. That indexing is being held up by software
>>and systems changes still in progress, but material from these dates will become available sometime
>>in the next few months.
220名無しさん@お腹いっぱい。:2010/06/13(日) 06:45:47
ポスター: gojomo日付: 2010年6月10日、04:、午後6時21分フォーラム: ウェブSubject: Re: 目に見えないなぜ?
2009年と2010年(そして、2008年の最後の最後からの少しさえ)に格納された材料は、救われますが、Wayback Machineでの表示のためにまだ索引をつけられていません。
そのインデックスはまだ進行中のソフトウェアとシステム変化によって上げられていますが、これらの日付からの材料はいつかこの数カ月で利用可能になるでしょう。
221名無しさん@お腹いっぱい。:2010/06/26(土) 20:44:56
Internet archive で削除なんて不必要だと考えるんだが、どうでしょうね。
一旦、発行した書籍、雑誌は世の中に永遠に残ってしまうのに、
インターネット情報は残らないから、こういう場所を作ったのに、
それを消せる機能を持っているというのはなんか違う気がする。
222名無しさん@お腹いっぱい。:2010/07/01(木) 05:03:03
2000年から細々と身内しか見てないようなサイトやってて
数年後にロボット避け置くようにしたんだけど、それ以前のページも一切保存されてない。
やっぱりカウントの少ない無人島みたいなサイトは取得されないこともある?
10年前のページが今後公開されるなんてことはないよね。
223名無しさん@お腹いっぱい。:2010/07/03(土) 12:41:36
糞重い cgiroom.nuのアーカイブ見れない
224名無しさん@そうだ選挙に行こう:2010/07/11(日) 14:48:12
Index Metadata Errorって出るページは絶対見れないの?
225名無しさん@お腹いっぱい。:2010/07/13(火) 15:09:31
>>224
どこで出る?
226名無しさん@お腹いっぱい。:2010/07/13(火) 17:53:14
>>225
ttp://web.archive.org/web/20001010171406/www4.justnet.ne.jp/~yumichan/ffpmidi.htm
このページのmidiを聞こうとすると出てくる
227226:2010/07/13(火) 18:13:02
FAQ見る限りでは今後見れるようになる可能性もあるっぽいな
228名無しさん@お腹いっぱい。:2010/07/15(木) 07:38:24
niftyのプロバ鯖ってデフォルトでアーカイブ避けしてあるんだな
何も知らずに使ってた
229名無しさん@お腹いっぱい。:2010/08/10(火) 01:55:24
jcomもなー
230名無しさん@お腹いっぱい。:2010/08/18(水) 15:52:51
Data Retrieval Failure.
って出る……みなさんもそうかな?
ちなみに、見たいページはこれです。
http://www.h4.dion.ne.jp/~chibicon/page044.html
231名無しさん@お腹いっぱい。:2010/08/18(水) 15:54:59
232名無しさん@お腹いっぱい。:2010/08/19(木) 10:58:18
233名無しさん@お腹いっぱい。:2010/09/03(金) 04:10:03
234名無しさん@お腹いっぱい。:2010/09/03(金) 12:19:02
基準がわからんな
235名無しさん@お腹いっぱい。:2010/09/03(金) 14:35:51
[ご挨拶]

平素は、Infoseek をご利用いただきまして誠にありがとうございます。

インフォシークでは、2001年より、無料ホームページサービス「インフォシーク iswebライト」、および有料の「インフォシーク iswebライト 広告非表示オプション」を提供してまいりました。
しかしながら、昨今のインターネット環境の変化を受け、弊社内にて慎重に検討を重ねた結果、誠に勝手ではございますが、サービスを終了させていただくこととなりました。

「インフォシーク iswebライト」、および「インフォシーク iswebライト 広告非表示オプション」を長年ご愛顧いただいた皆さまに、ご迷惑をおかけすることを深くお詫びします。


[サービス終了概要]

■ サービス終了予定日
2010年10月31日(日) (11月1日に終了作業を行います)


■ 終了対象サービス

インフォシーク iswebライト (無料サービス)
インフォシーク iswebライト 広告非表示オプション (有料サービス)
※インフォシーク iswebベーシック (有料サービス)は今後もサービスを継続します
236名無しさん@お腹いっぱい。:2010/09/03(金) 14:37:17
■ ホームページデータの移行について
「インフォシーク iswebベーシック」(有料)にて、ホームページを継続される場合は、専用の移行ツールの提供を予定しております。
※お詫び:移行ツールは8月下旬の提供を予定しておりましたが、9月上旬に延期させていただきました。
提供延期となりましたことを深くお詫びします。

※ データ移行に関する方法やサービス利用料につきましてはこちらをご確認ください
※ ツール提供前に、広告非表示オプションの契約期限を向かえる方はこちらからお問い合わせください。


■ なぜホームページサービスを終了するのか

「インフォシーク iswebライト」のサービス開始当初におきましては、ホームページスペース提供サービスがインターネットにおける情報発信ツールとして大きな役割を担ってまいりました。

しかしながら、インターネットの発展に伴い情報発信ツールも多様な進化を遂げており、無料のホームページスペース提供サービスとして運営してきた「インフォシーク iswebライト」は当初の役割を終えたものと判断いたしました。
長年に渡ります皆さまのご愛顧に深く感謝しております。

皆さまにはホームページ移行等で、お手数をおかけいたしますが、前述状況を踏まえたサービス終了でありますことを、何とぞご理解いただき、ご了承くださいますようお願い申し上げます。

ご利用いただき誠にありがとうございました。

※サービス終了、データ移行についてのお問い合わせはこちらより受け付けております。
お問い合わせの際には、ご自身のiswebID(又はURL)のご記入を必ず、お願い申し上げます。



最終更新日 2010.09.01 17:08:53




インフォシーク iswebライト 終了のお知らせ - インフォシーク ユーザサポートからのお知らせ - 楽天ブログ(Blog)
http://plaza.rakuten.co.jp/usersupport/diary/201008250000/
237名無しさん@お腹いっぱい。:2010/09/08(水) 02:22:49
ファイルがあるように見せかけて
Server Error-wbcgiやFailed Connection.とか舐めてんのか
238 ◆xs.m./NkkNFp :2010/09/09(木) 10:01:22
ブラウザ変えろカス
239名無しさん@お腹いっぱい。:2010/09/09(木) 10:42:36
>>238
ブラウザ(UA含む)はあんま関係無い

>>237
日時に間を置いてアクセスしろカス
240 ◆xs.m./NkkNFp :2010/09/09(木) 15:21:30
なんだブラウザは影響なかったのか 火狐だと若干エラーが多い気がしててな
スマソ
241名無しさん@お腹いっぱい。:2010/09/09(木) 17:23:32
Firefoxは最近昔のHTTPの接続数を無視した数の接続をするようになったから
関係ないとは言い切れない。
242名無しさん@お腹いっぱい。:2010/09/26(日) 22:58:09
>>233
>>Poster: gojomo Date: July 06, 2010 02:53:07pm
>>Forum: web Subject: Re: Wayback Machine - Showing results for popular pages for 2010 but not 2009?

>>There was a very small index update last week. A result of this update is that some very-recent (as late as June
>> 2010) content is now available, even as most content from the last 24 months awaits a bulk update.

>>The relevant FAQ items (and small note atop each date-results page) have been updated to reflect
>>that this may sometimes happen.

>>- Gordon @ IA

243名無しさん@お腹いっぱい。:2010/11/01(月) 09:34:42
infoseek乙したのに全然残ってねぇな
244名無しさん@お腹いっぱい。:2010/11/12(金) 14:58:02
うおおおん・・・
何年も更新がないけど頻繁に見に行ってた小説サイトが急に消えて約4ヶ月、
移転前のURLを辿ったらいくつかの話が拾えて嬉しい・・・
一番好きだった話がNot in Archiveだったのは少し悲しいけど、それでも超嬉しい。
音沙汰がないけど気に入ってるサイトは、面倒くさがらずにこっそり保存しておこうと改めて思った。
245名無しさん@お腹いっぱい。:2010/11/26(金) 02:29:45
何度やってもServer Error-wbcgiがでるなぁ(´・ω・`)
>>244
その気持ち分るw
魚拓でもいんだけどね
246マグナ ◆i.K3ZM.pZo :2010/11/26(金) 15:36:17
インターネットアーカイヴはURLが分かる場合には有用だが分からない場合、つまり消えたサイトにあった文章等で覚えている場合はどうすればいいのだ?w
247名無しさん@お腹いっぱい。:2010/11/27(土) 00:44:42
それが一番困るよねw
ググっても出てこないし自分の場合、見たいサイトのリンク貼ってあるサイトを探してそこから一つずつ辿ったりしてるけど
ところで最近サイト重いよね
248名無しさん@お腹いっぱい。:2010/11/29(月) 15:48:28
これ簡単にアドレス入力してくれるFirefoxのアドオンってありますかね?
249名無しさん@お腹いっぱい。:2010/12/07(火) 03:12:48
>>248
「このリンクを蘇生」ってのでできるよ
ttps://addons.mozilla.org/ja/firefox/addon/2570/
250名無しさん@お腹いっぱい。:2010/12/13(月) 01:18:25
>>249
おーこんな便利なのがw
thxでした
251名無しさん@お腹いっぱい。:2011/01/06(木) 12:39:35
この記事って見れないですかね?
ttp://203.139.202.230/07yakyu/070708kouya01.htm
252名無しさん@お腹いっぱい。:2011/01/06(木) 14:52:58
>>251
とりあえずこのスレの範疇にある質問では無い事はわかった
せめて正確なタイトルわかんない?もしわかれば俺はもう少し探してみる
253名無しさん@お腹いっぱい。:2011/01/06(木) 15:02:12
>>251
あとこっちから質問したいんだけど、以前他のスレで同じ質問した事無い?
なんか昔に同じような記事の探し手伝いした覚えがある
マルチポストとかでツッコむ気は毛頭無いし(むしろ時効だろうしw)、ただ自分の記憶が正しいか知りたいだけなんだ
ぜひ頼む
254名無しさん@お腹いっぱい。:2011/01/07(金) 15:24:19
255名無しさん@お腹いっぱい。:2011/01/08(土) 01:57:35
>>252
高知新聞の高校野球の記事なんですけど
タイトルは「・初戦から好ゲーム 高校野球県大会組み合わせ」です
メインのは見れるんですけどね
ttp://web.archive.org/web/*/http://203.139.202.230/07yakyu/07kousienfr.htm
>>253
初めてですw
>>254
やっぱり・・・困ったなぁ
256名無しさん@お腹いっぱい。:2011/01/23(日) 17:48:28
ここに保存してあるHPの全階層を楽に保存する方法ありますか。
HP保存のフリーソフトで保存できるのでしょうか。
257名無しさん@お腹いっぱい。:2011/01/26(水) 18:13:30
>>256そりゃあ出来るが時間かかる
頑張りましょう
25898:2011/01/28(金) 02:47:02
Wayback Machine Beta
ttp://waybackmachine.org

あまり GUI に凝ったのは好きじゃないなぁ。
259名無しさん@お腹いっぱい。:2011/01/28(金) 03:38:19
>>258
d
26098:2011/02/03(木) 00:33:54
Wayback Bachine Beta、 何気に良いかも。

キャッシュ取得時、 あるいは日付別キャッシュ一覧の表示の際、
本家ではデータや接続系のエラーが返されても、
Beta で試すとかなりの確率で取り出せてる。

ttp://web.archive.org/web/*sa_/%68ttp://www.color.org/
ttp://waybackmachine.org/*/%68ttp://www.color.org/
本家では 2008 年 8 月までだが、
Beta では 2009 年分も出てくる、 なんてこともある。
26198:2011/02/03(木) 00:46:47
それから、 HTTP のレスポンスヘッダの内容が
Beta ではかなり異なっている。

本家
例: ttp://web.archive.org/web/19991111085830/%68ttp://2ch.net/

Last-Modified: オリジナルのタイムスタンプ
Content-Length: スクリプト埋め込み後の長さ

Beta
例: ttp://replay.waybackmachine.org/19991111085830/%68ttp://2ch.net/

Last-Modified: (無し)
Content-Length: スクリプト埋め込みおよび文字セット変換後の長さ
X-Archive-Orig-Last-Modified: オリジナルのタイムスタンプ
X-Archive-Orig-Content-Length: オリジナルの長さ
その他、 オリジナルのサーバが返したと思われるレスポンスヘッダが、
頭に X-Archive-Orig- を付けて羅列されている。

そのほか、 HTML の場合の Content-Type は全て
text/html;charset=utf-8 になっている。
以前と違って、 今度は中身もコード変換されている。
変換元として使われた文字セットは
X-Archive-Guessed-Charset: ヘッダに記載されている。
26298:2011/02/06(日) 01:12:05
Beta 版のキャッシュを開いたとき、 キャッシュし損ねていた画像などは
元 URL の頭に ttp://liveweb.waybackmachine.org/ を付けた URL へリダイレクトされている。

ttp://liveweb.waybackmachine.org/%68ttp://hibari.2ch.net/test/read.cgi/esite/1189771222/

どうもこれはキャッシュプロキシとして動作しているようで、
前回のキャッシュから数分程度しか経っていなければそのキャッシュを返すが、
そうでない場合はオリジナルのサーバへ読みに行って、 取得した内容を返してくる。
HTML に挿入されるメッセージ (Here's a capture taken....) から察するに、
キャッシュされたデータは後日 Wayback Machine で公開されると思われる。

半年経たないと公開されない、 という制約はあるものの、
ウェブ魚拓と似たような使い方ができるかも。
263名無しさん@お腹いっぱい。:2011/02/07(月) 10:46:44
>>98
運営してるのって同じ団体?
264名無しさん@お腹いっぱい。:2011/02/15(火) 13:17:20
javascript:location.href='http://waybackmachine.org/*/'+location.href;
265名無しさん@お腹いっぱい。:2011/02/25(金) 00:27:19.47
この頃重すぎない?
266名無しさん@お腹いっぱい。:2011/02/26(土) 01:52:25.94
確かに重い
URL叩いてから具が出てくるまでえらい待たされる
267名無しさん@お腹いっぱい。:2011/03/02(水) 20:02:23.66
何かインターフェースが変わったw
まだβみたいだけど見づらくない?w
268名無しさん@お腹いっぱい。:2011/03/03(木) 15:15:10.55
糞見づらくなったな
269名無しさん@お腹いっぱい。:2011/03/04(金) 03:58:59.01
βのテストとかしてるのか分からんがエラーばっか出る・・・
270名無しさん@お腹いっぱい。:2011/03/04(金) 07:21:01.97
質問です。
現在使用中ブログ(FC2ブログ)のアーカイブ削除依頼したいのですが、
FC2ブログなのでrobots.txtをルートディレクトリに置けないようなので
直接[email protected]に削除依頼しようと思うのですが
やはり本人確認の要求があるのでしょうか?
本人確認の条件はどの程度の要求なのかも気になります
(住所や名前まで提示しなければならないのかなど)
それとも本人確認なしで削除依頼がすんなり通るのでしょうか?
271名無しさん@お腹いっぱい。:2011/03/04(金) 20:05:12.57
やったことないから分らんw
でも普通そんな情報まで提示しなくてもいいと思うけどな
272名無しさん@お腹いっぱい。:2011/03/04(金) 20:14:39.35
この前よりかなり見やすくなった感じ
普通のだと不具合なのかエラーで見れなくてもβだと見れるみたい
273名無しさん@お腹いっぱい。:2011/03/05(土) 01:23:15.11
水色の丸印で日にちは分りやすくなったけど更新された日の*印の代わりがまだないね
274名無しさん@お腹いっぱい。:2011/03/07(月) 00:16:25.22
>>256
Firefoxのスクラップブックってアドオンで掘り下げ階層選んで保存できるぞ
275名無しさん@お腹いっぱい。:2011/03/14(月) 16:27:19.13
http://www.archive.org/

なんかこっちのほうダウンしてるな
276名無しさん@お腹いっぱい。:2011/03/15(火) 01:27:32.06
502 Bad Gatewayとでるね
277名無しさん@お腹いっぱい。:2011/03/15(火) 13:38:45.70
ここ数か月の間に閉鎖したブログをいくつか読もうと>>1のアーカイブ(Wayback Machine Advanced Search)から検索してもほとんど出てきません。

ヒットしても09年のものまでしかみれないのですが、10年以降のキャッシュは見れないのでしょうか。
278名無しさん@お腹いっぱい。:2011/03/16(水) 10:04:33.35
10年以降は出てこないよね
というか09年もあんまり・・・
あとβテスト番の方が今は検出しやすくなってる感じはする
279名無しさん@お腹いっぱい。:2011/03/23(水) 17:58:05.04
ベータになってから重いわこればっかり出るわで散々だ
This URL has been excluded from the Wayback Machine.

前は見られてたのに・・・
280名無しさん@お腹いっぱい。:2011/03/25(金) 10:39:13.16
>>279
クラッシック使えよw

なんかアイコンがごみ箱になった
281名無しさん@お腹いっぱい。:2011/03/25(金) 10:43:51.69
よくみたら神殿だった・・・
282名無しさん@お腹いっぱい。:2011/04/03(日) 20:14:07.72
28398:2011/04/03(日) 20:49:02.94
284名無しさん@お腹いっぱい。:2011/04/20(水) 23:44:15.10
本家も糞使いにくいベータのUIになっちまった
285名無しさん@お腹いっぱい。:2011/04/24(日) 06:32:43.61
同じページにあるリンクでも見られるのと”Hrm.”になって見られないのがあるのはどうしてでしょうか?
286名無しさん@お腹いっぱい。:2011/04/25(月) 07:04:40.09
同じページからリンクされていても一部しかクロールされないのは良くある話
287名無しさん@お腹いっぱい。:2011/04/25(月) 08:37:13.32
さっきから全然繋がらないんだがどうよ
288名無しさん@お腹いっぱい。:2011/04/26(火) 18:21:54.37
俺もたまに同じことある
まだβだから色々とあるみたいだね
289名無しさん@お腹いっぱい。:2011/04/28(木) 05:22:34.15
Advanced Search(高度な検索)が利用できなくなって、駄目になったよな。
http://web.archive.org/collections/web/advanced.html
290名無しさん@お腹いっぱい。:2011/04/28(木) 05:24:12.25
検索結果のカレンダー表示も却って見づらい。元に戻すか、せめてClassicも並存してくれ。
291名無しさん@お腹いっぱい。:2011/05/05(木) 02:14:35.97
今まで見れた奴が見れなくなってる

うがあああああああああああああああああ
292名無しさん@お腹いっぱい。:2011/05/11(水) 18:59:02.47
www.red-jp.com/ten/chada0.htm
を見ようとしたら
Data Retrieval Failureって出てきたんだけど
これって日を改めれば見れるかも知れないの?
29398:2011/05/11(水) 21:22:15.54
>>292
ベータはどう?
ttp://web.archive.org/*/www.red-jp.com/ten/*

> これって日を改めれば見れるかも知れないの?
後日取り出せた経験はある。
294名無しさん@お腹いっぱい。:2011/05/12(木) 14:37:43.10
ベータが何のことか分からないけど
目的のページは見れたよ
ありがとう
295名無しさん@お腹いっぱい。:2011/05/21(土) 08:10:45.56
うーん、Niftyのサイト見れんなぁ
2005年付近の音楽サイトなんだけど、当時からブロックしてたんだっけ?
296名無しさん@お腹いっぱい。:2011/05/22(日) 16:39:10.77
297名無しさん@お腹いっぱい。:2011/05/23(月) 11:43:35.01
新バージョンになってから接続が早くなった希ガス
298名無しさん@お腹いっぱい。:2011/05/30(月) 14:50:36.45
全く見れない。
どうなってるの〜
299名無しさん@お腹いっぱい。:2011/05/30(月) 15:38:23.45
んなこたぁない
300名無しさん@お腹いっぱい。:2011/05/30(月) 15:46:34.82
あらほんと
さっきは全く見れなかったのに、今は見れる
失礼しました
301名無しさん@お腹いっぱい。:2011/06/03(金) 16:25:02.37
Hrm.
Wayback Machine doesn't have that page archived.
It doesn't seem to be available on the live web, either.

このメッセージが出たらもう一生そのページは見れないの?
半年か一年経てば見れそうなページって別のメッセージが出ますか?
302名無しさん@お腹いっぱい。:2011/06/04(土) 04:23:53.49
一生か分らんが見れないみたいだね
あと09年以降が表示されるのはいつなんだろ
303名無しさん@お腹いっぱい。:2011/06/19(日) 18:29:33.52
それは2日
304名無しさん@お腹いっぱい。:2011/06/20(月) 11:54:49.85
使ったことないんだが、他国の人はwebciteを活用してるみたいだけど、
これ利用したことある人いますか?
フォームにurlを送れば確実に保存してくれるのかなあ?

http://www.webcitation.org/archive
305名無しさん@お腹いっぱい。:2011/06/20(月) 13:55:59.78
>>304
使ってみた。
ttp://www.webcitation.org/5zZewWlmT

メールアドレスの入力を求められるが、
「メールに記載された URL に再度アクセス」 というような操作も必要なく、
単にキャッシュ成功とアクセス用 URL の通知に利用されているだけの模様。

左上の時刻表示のタイムゾーンは UTC-4。
306名無しさん@お腹いっぱい。:2011/06/20(月) 18:28:26.39
>>305
右上
307名無しさん@お腹いっぱい。:2011/06/21(火) 11:12:00.70
キャッシュされたサイトのトップから入ると普通に読めるのに、途中から
直に入ると弾かれるページは、手動でURLを削る必要があるようだな
(途中のttp://を削ればOK
面倒臭い…
308名無しさん@お腹いっぱい。:2011/06/21(火) 11:12:43.94
あ、>>307はInternet Archiveのことね
309名無しさん@お腹いっぱい。:2011/07/08(金) 09:49:46.19
オリジナルのファイルの日付が
取得出来なくなったような気がしますが(Downstair、iriaで確認)
みなさんどうやって取得されてますか
310名無しさん@お腹いっぱい。:2011/07/08(金) 15:54:46.31
>>309
1) ミラー (ttp://web.archive.bibalex.org) を使う
2) X-Archive-Orig-Last-Modified: ヘッダからタイムスタンプを読み出す (>>261)
この二択かと。
311名無しさん@お腹いっぱい。:2011/07/08(金) 22:45:48.32
>>310
どうもありがとうございます。ミラーが有ったんですね。
312名無しさん@お腹いっぱい。:2011/07/19(火) 10:25:36.86
リニューアル後は2006年分がバッサリ抜け落ちてるようだが、
キャッシュサーバに何かあったのか?
313名無しさん@お腹いっぱい。:2011/07/20(水) 00:00:16.79
>>312
> リニューアル後は2006年分がバッサリ抜け落ちてるようだが、
ほんと?
314名無しさん@お腹いっぱい。:2011/07/20(水) 00:31:58.44
サイトによるね
全てのキャッシュサーバから抜け落ちたわけじゃなさそう
315名無しさん@お腹いっぱい。:2011/07/21(木) 16:02:08.63 BE:271778922-2BP(285)
http://liveweb.archive.org/
の次にキャッシュを取得させたいURL貼れば取得させられるみたいだね。
316名無しさん@お腹いっぱい。:2011/07/22(金) 19:04:24.11
改悪
317名無しさん@お腹いっぱい。:2011/07/27(水) 10:05:17.79
サーバーが応答しません、ファイルがありません、ロボット避け
これらをどうにかする方法はないものか…
318名無しさん@お腹いっぱい。:2011/07/28(木) 16:17:04.05
真っ当なサイトとしてやっていく限りは
ロボット避けは仕方ないな。
319名無しさん@お腹いっぱい。:2011/07/28(木) 21:57:41.06
真っ当なサイト(笑)
320名無しさん@お腹いっぱい。:2011/07/28(木) 22:03:00.66
笑ったところでロボットは残るよ
321名無しさん@お腹いっぱい。:2011/07/31(日) 19:47:21.01
先週くらいまで見れてたサイトのキャッシュ、今日見ようと思ったら
We were unable to get the robots.txt document to display this page.
The gateway to the live web is not available. Please try again later.
ってなって見れない
もう復活しないのかな…
322名無しさん@お腹いっぱい。:2011/07/31(日) 19:55:43.96
Please try again later.
323名無しさん@お腹いっぱい。:2011/08/25(木) 22:26:32.31
どのサイト見ても2009年から一切ログが無い。そんなものなのか
324名無しさん@お腹いっぱい。:2011/08/26(金) 09:54:59.40
fuq
325名無しさん@お腹いっぱい。:2011/09/03(土) 08:57:21.40
昔の方がいいなぁ
こういう所はGoogleと一緒だ
326名無しさん@お腹いっぱい。:2011/09/05(月) 13:44:55.34
Whoops!
We can't read the archived file for this date. The captured content may be garbled,
or we might not have the ability to display it.

これは時間が経てば復活するのかな...
327名無しさん@お腹いっぱい。:2011/09/12(月) 13:49:09.49
最近になってようやく2010年以降のログが出てきて安堵した
328名無しさん@お腹いっぱい。:2011/09/13(火) 07:06:44.93
2009年頃のまったく出てこないページは諦めるしかないのですかねえ
329名無しさん@お腹いっぱい。:2011/09/22(木) 20:10:08.43
アーカイブでJAVA使ったゲームを遊ぶのは無理?
330名無しさん@お腹いっぱい。:2011/09/25(日) 20:19:57.82
wayback2、info、lennyの三つに削除依頼のメール送ったけど対応してくれる気配が無い・・・。
おまけにrobots置いたURLを送るフォームも404エラーだし。

削除依頼出した人、どれくらいで対応してもらえた?
331330:2011/10/07(金) 12:31:44.24
infoの方からメール来て削除してもらえた!
三週間くらい掛かったかな
削除してもらえてよかった
332名無しさん@お腹いっぱい。:2011/10/08(土) 18:28:24.30
今まで見れてたサイトのキャッシュ、今日見ようとすると・・・
Bummer.

The machine that serves this file is down. We're working on it.
The Wayback Machine is undergoing scheduled maintenance Friday through Sunday, October 7-9. Most services will be offline during that time. See our blog for more information.
Would you like to try the previous or next date?

なんじゃこりゃあ!
333名無しさん@お腹いっぱい。:2011/10/08(土) 18:33:46.40
馬鹿ですか?
7-9日にメンテナンスってはっきり書いてるだろ
334名無しさん@お腹いっぱい。:2011/10/08(土) 21:01:20.95
こいつ恥ずかしすぎるwww
335名無しさん@お腹いっぱい。:2011/10/09(日) 08:37:25.42
見たいサイトのトップページは開けたけど
そこからページ内の各コンテンツへ飛ぶのは無理だった
これってやっぱどうやっても見れないもの?初歩的ですまん
336名無しさん@お腹いっぱい。:2011/10/09(日) 14:27:47.64
Internet Archiveってウェブ魚拓みたいにキャッシュ取得はできない?
337名無しさん@お腹いっぱい。:2011/10/10(月) 11:20:10.82
まだ見れないけど日本時間だから?
338名無しさん@お腹いっぱい。:2011/10/10(月) 15:38:41.50
まだ見れないね
339名無しさん@お腹いっぱい。:2011/10/10(月) 23:53:15.35
まだだね、遅いな
340名無しさん@お腹いっぱい。:2011/10/11(火) 23:01:58.24
見れるな
見たいページは見れなかったがorz
341名無しさん@お腹いっぱい。:2011/10/11(火) 23:34:59.34




ヤフチャ出会い世代ユザル人気No.1部屋

【30↑気まぐれな女達(BGM)】

   部屋主:oxxx_hikaru_xxxo

   部屋主代理:llla_little_eijilll









342名無しさん@お腹いっぱい。:2011/10/12(水) 17:43:53.82
Got an HTTP 302 response at crawl time
343名無しさん@お腹いっぱい。:2011/10/12(水) 19:36:24.02
レスポンス速くなって( ・∀・)イイ!!
344名無しさん@お腹いっぱい。:2011/10/14(金) 10:32:30.37
>>342
勝手にリダイレクトされてた以前の仕様よりは評価できる。
345名無しさん@お腹いっぱい。:2011/10/15(土) 00:50:12.90
うーん見れないのがあるわ
346名無しさん@お腹いっぱい。:2011/10/19(水) 09:33:40.28
         /:::,. -―-、::ー-、::>一ァ
         /:::/,. -=ニ:: ̄::\::\―i:、
        /:/::://::\::::::::\::::::,ヽ::::ヽ|、\
.       /:::|, イ:'、::ヽ::::\::::::::Xヽ:|ヘ:::::ヘ\,ゝ
      l/|:::::|::::::!、::\ー`ー-,ィf示ハ:::::ヘ、,ハ
     く,.イl:::::斗┼‐` ー    弋炒 ',:::::ハ:::l::|
       |/,!ヘ::::::ヘ:| ,ィf心         !:::::::l::|::!
      //:| |ヘ::::::ヘ代t炒   ` ノ   |:::::|:|_|リ    ageます・・・!
    く/l:::L|、::`:ー-ゝ    ‐'´     /イ/|:| ヽ
     |:!:,-、:::\f^ヽ:≧z. __ .. イハ: : リ| |
     l:|:{  ヽ:::;ム  マミ、: : \    ム: : :∨
     リ/\  ヽ,ム  ∨ヘ : : \ /: /ヘ: : :ヘ
     ,.- 、   \ ヽ〉  ヽ  \: : :\://ヘ: : :|
     ヽ、 \ | 〉       \ lヽ./^)、 : : |: : !
      丶、`¨     /  ァ'´ /: : ヽr:| : ハ
        `)      l     ,.イ、ヾニ二7イ |.ィ
      ⊂二´.. _      __/ /  ` ー-、_|/、__jニフ
           ヾー--='彡- '    /´:j:_}::::/一`
             `ーr'´      ,f-':j´:||`′
               /ヾ二トr‐_Tj-トイ : l:!┐
               /: : : : : : 丁´ : : /:/: ://: `\-、
           /: : : : : : : / : : : /:/: ://: : : : : :ヽ:\
        ,. -‐': : : : : : : :/ : _/::f: ://: : : : : : /ヽ7
        ヽ: : : : : : : : : :|: : : :/:::::|: :!:|: : : : :/   \

347名無しさん@お腹いっぱい。:2011/10/20(木) 01:17:52.75
このスレの住人なら一度は見てると思うが
ttp://www.archive.org/web/hardware.php
普通のPCで組んだ方が安上がりなのかねぇ。
348名無しさん@お腹いっぱい。:2011/10/22(土) 23:20:54.88
どのサイト見ても
We were unable to get the robots.txt document to display this page.
The gateway to the live web is not available. Please try again later.

って出る…先週は普通に見れたのに
349名無しさん@お腹いっぱい。:2011/10/22(土) 23:27:39.40
>>332といい何で馬鹿ばっかり湧くんだ?

Please try again later.

この程度の短文も理解できないってどんな教育受けたんだ????
350名無しさん@お腹いっぱい。:2011/10/22(土) 23:32:12.76
だって半日待ってるけど出てこないし
351名無しさん@お腹いっぱい。:2011/10/23(日) 11:05:50.51
1週間待っても出てこないなんてザラよね
352名無しさん@お腹いっぱい。:2011/10/25(火) 18:57:02.21
353名無しさん@お腹いっぱい。:2011/10/25(火) 20:29:31.49
メンテナンスは終わったはずなのにまだBUMMERが出てるんだが・・・
待てばいつかは直るのか?
354名無しさん@お腹いっぱい。:2011/10/26(水) 14:27:56.39
直るものは直るよ
この間画像が出なかったがしばらくしたら復活してたってこともあったから。

>>352
そんなのより、Welcome to Waybackのロード画面を省略して、
すぐにアーカイブにアクセス出来るアドオンのほうが欲しい。wikipediaみたいに。
355名無しさん@お腹いっぱい。:2011/10/27(木) 09:38:01.43
                     ,.ィ ´  ̄ `` ヽ、
                      /          `ヽ、_ _,. -- 、
                   / //            三- 、ー `ヽ
                     / / /  / /         ヽ\ \  ヽ
                 / / /  / ///         ヘ ヽヽヽ
                   / / / /⌒レ /- 、/ // /i l i ハ ! i ヽ',
                / / /  { ⌒〃ヽr=r <`メ、 // / l l l l l li
                  / / /   ヘ V //  ヽ{:::;;pハ //メ ! l ! l | l |  !
               / / /   / /ヽ、    ``′   ,.ィr//〃 l/l / /
             / / /  / / /          _(;ン' /〃 〃 l/
            /// // /  ヽ      _   /ソ// /
          / ,. -‐- 、 _,.ノ \   >、   _,.  '´^` }
         / /     ヽ \   7ヽ、`ー ´/   ,.イ!   はぁ・・・誰かageないかな。。
       ///        ヽ ヽ  i   l lヽ    く i | |
      //,.イ         ヽ ヽ- l  l l ∧  /〉ヽ,!
    /// i|           ヽ ヽ=!  l lヒー ' / ノ ト
   ////  il l       \   ヽ ヾ!  Vヽ  ̄ /   い
  / /  // /! !         `ヽ、  L..ム、  i   ̄     ハ
. / /  // / !  ハ           ` ー < > \iヽ        ヽ
/ /  //// l  i ハ             l 〉〈`ヽ、ヘ         \

356名無しさん@お腹いっぱい。:2011/10/28(金) 09:39:54.78
何が?
357名無しさん@お腹いっぱい。:2011/11/01(火) 05:25:22.42
ttp://beebee2see.appspot.com/i/azuYjdqFBQw.jpg

502エラーで調べたけども良くわかなくてこちらにきました
これは時間を置けば見られるんでしょうか?
それともページ自体がそもそも保存されてないのでしょうか?
358名無しさん@お腹いっぱい。:2011/11/01(火) 13:06:00.58
すれち
359名無しさん@お腹いっぱい。:2011/11/04(金) 06:04:40.62
スレチ…?
360名無しさん@お腹いっぱい。:2011/11/08(火) 22:37:12.44
>>357
ゆとりの人か
361名無しさん@お腹いっぱい。:2011/11/27(日) 18:15:41.05
web archiveまだ落ちたまま?
362名無しさん@お腹いっぱい。:2011/11/27(日) 18:19:51.14
4時頃までは見れたんだが落ちてるね
363名無しさん@お腹いっぱい。:2011/12/31(土) 18:12:17.45
ここ、日本語でトラブル報告しても対応してくれるかな?
以前見られていたはずのサイトがまた見られなくなっているんだけど、
500エラーとか既知のバグとかが出て、何とかしてほしい。
クラシックの方はもう繋がらなくなっているみたいだし。
というかいまだにベータって表示があるのがなんか疑問。
364名無しさん@お腹いっぱい。:2011/12/31(土) 23:02:45.08
http://en.wikipedia.org/wiki/List_of_Web_archiving_initiatives
ウェイバック以外のインターネットアーカイブのリスト。
こんなにあったとは意外。
365名無しさん@お腹いっぱい。:2012/01/01(日) 01:10:30.37
HTTP Status 500 -
--------------------------------------------------------------------------------
type Exception report
message
description The server encountered an internal error () that prevented it from fulfilling this request.
exception
java.lang.NullPointerException
note The full stack trace of the root cause is available in the Apache Tomcat/6.0.24 logs.

と出る。
多分、以前見れたはずのページ。
これはウェイバック側のバグってことでいいのかな?
IEとFFの両方で同じ結果になるし。
気長に改善されるのを待つしかないか・・・
366名無しさん@お腹いっぱい。:2012/01/12(木) 00:08:24.19
>>365
まだ出る?
367名無しさん@お腹いっぱい。:2012/01/12(木) 03:16:48.93
>>365
ぬるぽww
368名無しさん@お腹いっぱい。:2012/01/12(木) 04:04:56.67
>>364
この手の奴で、ウェイバックで見つからない物が見つかるケースってあるのだろうか
369名無しさん@お腹いっぱい。:2012/01/15(日) 02:18:42.68
Wayback Machineを使って好きだったサイトの画像をたくさん入手できた
ありがとうWayback Machine
ただまだ見れない画像もあるよorz
これは諦めるしか無いのか…………
370名無しさん@お腹いっぱい。:2012/01/17(火) 03:37:14.98
画像どころかSS置いてある場所すら見られん
371名無しさん@お腹いっぱい。:2012/01/25(水) 08:47:04.14
月ごとの採取件数の棒グラフのリンクのURLの「/」が「\/」になってない?
372名無しさん@お腹いっぱい。:2012/01/25(水) 14:55:51.37
>>371
おそらくバグだと思うが、JavaScript を切っているとそうなる。
373名無しさん@お腹いっぱい。:2012/01/26(木) 09:57:24.67
年の境界がずれている場合があった
ttp://wayback.archive.org/web/20050101000000*/http://
これで2004年が表示されて2005年が抜けてしまうので、
0101の部分をいじって0105とか0106とかにすると2005年になったり。
374名無しさん@お腹いっぱい。:2012/01/26(木) 21:07:24.19
昨日まで見れたのに
We were unable to get the robots.txt document to display this page.

Our request Timed Out.
と出て見れない・・・これってもう見れない?
375名無しさん@お腹いっぱい。:2012/01/26(木) 21:10:37.20
すまんageてしまった
376名無しさん@お腹いっぱい。:2012/01/27(金) 11:32:28.38
今、見れました。なんだったんだろう
377名無しさん@お腹いっぱい。:2012/01/27(金) 16:05:51.57
>>321>>348>>374-376
そのメッセージが出るのは、
元サイトのドメイン (DNS の A レコード) がまだ存在しているのに
Wayback Machine から元サイトへ接続できない状態であると思われる。

回線が切れたり鯖が落ちる等の一時的エラーもありうるし、
DNS を消さないままサイトを畳んでしまうことも考えられる。

鯖と回線が復活するか、あるいは元サイトがドメインごと消失してくれれば
robots.txt で明示的に拒否されない限り
Wayback Machine で表示されるようになるはず。
378名無しさん@お腹いっぱい。:2012/02/29(水) 22:05:06.76
We were unable to get the robots.txt document to display this page.
と表示されてかなりのサイトが閲覧できなくなってる、特に古いサイト。
数日前、10日前には確実に見れてたページも見れなくなってる。

同じような人いますか?

379名無しさん@お腹いっぱい。:2012/02/29(水) 22:27:42.98
馬鹿なの?なんでしばらく様子みようとしないの?
380名無しさん@お腹いっぱい。:2012/02/29(水) 23:24:24.06
はじめて昨日このサイトを使って見てたんだけど
ちょうどまた今日見ようと思ったら見れなくなってた・・・
自分だけかと思って色々試してたけどそういうわけじゃないんだな
今までこういう事なかったってこと?
ついてねーなぁ
381名無しさん@お腹いっぱい。:2012/03/01(木) 02:12:16.52
復活してるっぽいです、自分が使い始めてから数年、古いサイトだけ
見れなくなる事態って無かったからかなり焦った。

でも念のため今のうちに保存保存
382名無しさん@お腹いっぱい。:2012/03/01(木) 03:09:05.22
We were unable to get the robots.txt
document to display this page.
さっきまで見れてたページすら見れない・・・
明日になったら見れますように
383名無しさん@お腹いっぱい。:2012/03/15(木) 05:04:39.47
今まで見られていたサイトのサーバが落ちてしまう。

急に見られなくなったのに気付き、Wayback Machineに残ってないかと見に行く。

Wayback Machineもキャッシュを表示する前に
元サイトのrobots.txtのチェックを行おうとする.

ところが元サイトのサーバが落ちているため、当然の如く接続エラーとなる。

そこで、Wayback Machineは「We were unable to get the robots.txt」を表示。

このスレにやってくる。

この繰り返しなのねん。
384名無しさん@お腹いっぱい。:2012/03/15(木) 17:13:46.59
接続エラー記念カキコ
385名無しさん@お腹いっぱい。:2012/03/15(木) 17:17:14.37
ここ1時間くらい落ちてるな
386名無しさん@お腹いっぱい。:2012/03/15(木) 19:50:54.23
長いなぁ
387名無しさん@お腹いっぱい。:2012/03/26(月) 18:48:34.87
warrickが復活してるみたいですが、使えてる人いますか?
388名無しさん@お腹いっぱい。:2012/03/27(火) 14:16:21.09
「Google API Key」の取得で詰んだ
389名無しさん@お腹いっぱい。:2012/03/27(火) 14:35:53.89
有効なwin32アプリケーションではありません
390名無しさん@お腹いっぱい。:2012/03/27(火) 23:05:04.66
あー、どのサイトのキャッシュも見れないな。数日待ってみるか。
391名無しさん@お腹いっぱい。:2012/03/28(水) 03:18:38.79
ついさっきまで見れてたのにもうbummerとか、まじ勘弁。
どれ位で復旧するかな…。
392名無しさん@お腹いっぱい。:2012/03/29(木) 03:39:32.39
蓋のまとめ見ようと思ったけど見れたり見れなかったりorz
393名無しさん@お腹いっぱい。:2012/03/29(木) 15:03:12.39
みんな見えないんだな。安心した。
394名無しさん@お腹いっぱい。:2012/03/31(土) 14:30:45.58
お、見れるぞ
395名無しさん@お腹いっぱい。:2012/04/20(金) 00:17:56.21
list.cgi のものを見るのは無理なんでしょうか?
396名無しさん@お腹いっぱい。:2012/04/20(金) 01:35:23.25
ゆとり?
397名無しさん@お腹いっぱい。:2012/05/10(木) 00:19:32.54
Internet ArchiveからBIGLOBEの個人ホームページのアーカイブがごっそり消滅
ttp://anond.hatelabo.jp/20120506223825

むぅ…
398名無しさん@お腹いっぱい。:2012/05/10(木) 16:08:28.71
だーめだwarrick2を使いこなせる気がしない
399名無しさん@お腹いっぱい。:2012/06/01(金) 15:20:04.52
こんなサイトがあるともっと早く知ってたらブクマ整理なんかしなかったのに・・・
URLわからなくて使えねええええ
400名無しさん@お腹いっぱい。:2012/06/04(月) 13:29:00.77
>>399
ご愁傷様
401名無しさん@お腹いっぱい。:2012/06/17(日) 19:19:33.28
http://wred.blog88.fc2.com/
このブログを完全に復元されられる人いますか?
webアーカイブじゃ一部しか見れない…
402名無しさん@お腹いっぱい。:2012/07/29(日) 21:19:44.00
閉鎖されたサイトで
http://sinonome-yuuto.hp.infoseek.co.jp/index.html
なのですが
webアーカイブで見ようとすると文字化けをおこしたので、
エンコードを日本語(EUC)と日本語(シフトJIS)に変更しても
文字化けをして見れません。
ちゃんと見れる方法はあるでしょうか?
403名無しさん@お腹いっぱい。:2012/07/30(月) 02:16:41.30
>>402
現在の Wayback Machine は保有しているキャッシュのエンコードを自動的に判定して、
全て UTF-8 に変換して出力しようとする。
だから判定を間違えると記号の羅列になってしまう。

アレキサンドリアのミラーサイトの方は
まだそういう機能が実装されていないから大丈夫なはず。
今試してみたら "Failed Connection" って返されたけど……
404名無しさん@お腹いっぱい。:2012/07/30(月) 18:56:18.35
>>403さん
つまり、UTF-8への変換を失敗して出力をしているからコチラのブラウザのエンコードを
いくら変更しても見れないということでいいのでしょう?
あとアレキサンドリアとはなんでしょうか?
405名無しさん@お腹いっぱい。:2012/07/31(火) 11:01:08.99
>>404
お尋ねのサイトの本文は EUC-JP ですが、
インフォシーク側が冒頭に Shift_JIS の広告を挿入しています。
そのためか Wayback Machine 側ではソースを UTF-8 と判定しています。
(X-Archive-Guessed-Charset: UTF-8 という応答を返しています)
UTF-8 から UTF-8 へ変換して出力されるわけですが、
同じコード同士だから何もしないという訳ではなく、
UTF-8 として正しくないコードは全て U+FFFD という番号の文字に置き換えられます。
つまり、 完全に壊されます。

Wayback Machine は本家の他に、
エジプトの新アレキサンドリア図書館で運営されているミラーサイトがあります。
本家
ttp://wayback.archive.org/web/*/sinonome-yuuto.hp.infoseek.co.jp/*
ミラー: Failed Connection の問題は解消した模様。
ttp://web.archive.bibalex.org/web/*/sinonome-yuuto.hp.infoseek.co.jp/*
406名無しさん@お腹いっぱい。:2012/07/31(火) 13:13:44.18
これって終了してホームページサービスの場合、見れるものとそうでないものがあるのかな
407402:2012/08/01(水) 21:27:42.22
>>405さんありがとうございます。
見れないページもいくつかありましたが、何とか見れました。
本家のサイトだとやっぱり壊されちゃうんですねぇ・・・
本家のサイトで見れる方法はないですか?
そちらだと見れないところもみれるのですが。
408名無しさん@お腹いっぱい。:2012/08/29(水) 09:21:55.51
10年ぶりにネット本格復帰、でもHP全滅で友人と連絡がとれない・・
とりあえず分かっている人のアドレスをweb.archiveにかけ、
ありとあらゆるリンクを辿り、数日かけてやっとアドレス判明したのに、

Hrm.
Wayback Machine doesn't have that page archived.

完全にオワタ。
409名無しさん@お腹いっぱい。:2012/08/29(水) 09:51:39.04
そういう場合HPやメールアドレスどころかプロパイダ自体解約してる可能性アリの罠
410名無しさん@お腹いっぱい。:2012/08/29(水) 11:17:32.99
友人のほとんどが当時20歳前後。
現実が忙しくなり、充実し、自然とネットやパソコンから距離を置くようになる。
それが普通。

戻ってきてしまった俺は普通にすらなれなかった・・・自業自得だよね。
ネットにも現実にも居場所が残ってなかった。もう生きてるのが恥ずかしいし辛い。
411名無しさん@お腹いっぱい。:2012/08/30(木) 09:39:01.83
そういうスレじゃねえからw
412名無しさん@お腹いっぱい。:2012/08/30(木) 15:44:19.67
馬鹿だなあ。ネットや現実に居場所なんてのはもともとないよw
10年前に縛られてるだけだろw
413名無しさん@お腹いっぱい。:2012/09/01(土) 18:01:16.46
懐古に浸ったらそこで終わりだ 先を見ろ


チラシ
カイコに浸ったらそこで終わりだ って真っ先に変換されたw
414名無しさん@お腹いっぱい。:2012/09/02(日) 11:39:13.87
10年もネット断ちってどこの仙人様だよ
今更山から下りてくるなよw
415名無しさん@お腹いっぱい。:2012/09/10(月) 16:00:22.09
Googleの画像検索でも表示されるようにはできないのかな?
ページ削除されると見られなくなるんだよねorz
416名無しさん@お腹いっぱい。:2012/10/03(水) 05:32:34.77
使えない。鯖落ち?
417名無しさん@お腹いっぱい。:2012/10/03(水) 06:39:22.70
>>416
正常に使えてるけどなぁ?

こっちは?
International School of Information Science (ISIS)
http://www.bibalex.org/isis/frontend/archive/archive_web.aspx
418名無しさん@お腹いっぱい。:2012/10/03(水) 06:41:52.56
419名無しさん@お腹いっぱい。:2012/10/19(金) 16:32:30.98
一週間ぐらい前に見れてたページが見れなくなってたり
同じサイト内でも見れるページと見れないページがあるんだけど
見れないページは時間経ったらまた見れるように可能性ある?
420同じ質問を何度見たことか:2012/10/20(土) 05:05:28.05
>>419
お引き取りください。
421名無しさん@お腹いっぱい。:2012/10/20(土) 08:53:47.49
>>419
可能性は”ある”よ

     ____________
    ヾミ || || || || || || || ,l,,l,,l 川〃彡|
     V~~''-山┴''''""~   ヾニニ彡|       ある・・・・・・!
     / 二ー―''二      ヾニニ┤       あるが・・・
    <'-.,   ̄ ̄     _,,,..-‐、 〉ニニ|       今回 まだ その時と絶対的URLの
   /"''-ニ,‐l   l`__ニ-‐'''""` /ニ二|       指定まではしていない
   | ===、!  `=====、  l =lべ=|
.   | `ー゚‐'/   `ー‐゚―'   l.=lへ|~|       そのことを
    |`ー‐/    `ー――  H<,〉|=|       どうか諸君らも
    |  /    、          l|__ノー|       思い出していただきたい
.   | /`ー ~ ′   \   .|ヾ.ニ|ヽ
    |l 下王l王l王l王lヲ|   | ヾ_,| \     つまり・・・・
.     |    ≡         |   `l   \__   Internet Archiveがその気になれば
    !、           _,,..-'′ /l     | ~'''  キャッシュアーカイブの再公開は
‐''" ̄| `iー-..,,,_,,,,,....-‐'''"    /  |      |    10年後 20年後ということも
 -―|  |\          /    |      |   可能だろう・・・・・・・・・・ということ・・・・!
    |   |  \      /      |      |
422名無しさん@お腹いっぱい。:2012/10/21(日) 10:44:32.01

Bummer.

The machine that serves this file is down. We're working on it.
The machine that serves this file is down. We're working on it.
Would you like to try the previous date?

とでていままで見れていたページが見れなくなってしまったのですが、これはサバ落ちかなにかでしょうか?

またこのひとつ前のArchiveは普通に見れるのですがこれもいずれ見えなくなってしまうのでしょうか?
423名無しさん@お腹いっぱい。:2012/10/22(月) 17:02:03.08
>>422
経験から言うと、その "the machine that serves this file" は忘れた頃に復帰します。
424名無しさん@お腹いっぱい。:2012/10/22(月) 20:58:56.37
うちもよく見るデータがbummerで困ったが、しばらくはエジプトのミラーで食いつなぐしか無いべ。
こっちも落ちなきゃいいけど
425名無しさん@お腹いっぱい。:2012/10/22(月) 22:19:09.68
昔見れたアーカイブって
今見ると見れないことが多いな。

そして皆同じBummer問題で困っていたようで
ほっとした。

魚拓とは役割違うから
頑張ってほしい。

なんか日経新聞で記事になってましたね。
貧乏だから全部読めないけど。

現代に蘇る「知の宝庫」 「インターネット・アーカイブ」の素顔  :日本経済新聞
http://www.nikkei.com/article/DGXBZO47171370S2A011C1000000/
426名無しさん@お腹いっぱい。:2012/10/29(月) 15:03:47.72
Internet Archiveのアーカイブ量が10ペタバイトに到達 - GIGAZINE
http://gigazine.net/news/20121029-internet-archive-10peta-bytes-archived/
427名無しさん@お腹いっぱい。:2012/10/29(月) 19:44:05.06
> Facebookは写真とムービーだけで100ペタバイト
こっち驚いた。
428名無しさん@お腹いっぱい。:2012/11/03(土) 07:58:20.05
2011年と2012年のが見れない
2010年以降は保存してないのかな?
429名無しさん@お腹いっぱい。:2012/11/03(土) 11:30:40.36
>>428
保存してるよ。
巡回が遅いか、公開スパンが長いだけじゃないか?
430名無しさん@お腹いっぱい。:2012/11/03(土) 12:25:09.16
>>429
そうなんだ
なんかググると保存量が10ペタバイト超えたとかあって
運営行き詰って2010年以降は保存諦めたんじゃ、とか思ってしまった
431名無しさん@お腹いっぱい。:2012/11/04(日) 12:48:16.74
今のHDD最大容量でも4テラ
そう考えると10ペタって10000テラだから恐ろしいな…
432名無しさん@お腹いっぱい。:2012/11/23(金) 08:35:39.98
繋がり易い時間帯はあるのかね 日本時間で
ネット社会は、日の沈まない国みたいなものだから
いつでも地球上の誰かがアクセスしている訳だけど
433名無しさん@お腹いっぱい。:2012/11/30(金) 14:31:20.73
現在のインターフェイスがベータ版としてリリースされてから 2 年弱、
またベータ版なるものが出てきています。

トップページの "Take Me Back" ボタンを押した場合。
ttp://wayback.archive.org/web/*/www.google.com/

"Try Beta Version" を押した場合。
ttp://wayback-beta.archive.org/web/*/www.google.com/
通常版が去年 7 月で止まっているのに対し、
こちらでは今月 15 日取得分まで見ることができます。
434名無しさん@お腹いっぱい。:2012/12/08(土) 16:34:21.00
今までWebアーカイブのサイトで2年ぐらい前の分まで見れたのに、急に
 Page cannot be crawled or displayed due to robots.txt.
って出て全く見れなくなったんだけど、既にロボットが集めたページを遡って消すことができるの?
それとも、時間をおいてアクセスすれば見れるようになるのかな。
435名無しさん@お腹いっぱい。:2012/12/08(土) 19:21:54.39
俺も同じケースに遭遇したよ
確か閲覧する時点で目的のサイトにrobots.txt置いてたらそれに従うルールだったような
一番ひどかったのはドメインパーキングがrobots.txt置きやがったケースww
436名無しさん@お腹いっぱい。:2012/12/08(土) 23:41:57.96
ロボットテキストを置けば、自分のサイトでも見られないようにできるってことか。

>一番ひどかったのはドメインパーキングがrobots.txt置きやがったケース
これってどういうこと? 解説プリーズ。
437435:2012/12/08(土) 23:56:07.34
>>436
ごめん、ちょっとわかりにくかったか
あるサイトのドメインが期限切れになって業者に取られちゃって
アクセスすると業者のサイトが表示されるようになったんだけど
サイトが生きていた頃にはなかったrobots.txtが業者のサイトで置かれていたために
archive.orgから消されちゃったって経緯
438名無しさん@お腹いっぱい。:2012/12/18(火) 01:56:07.87
ttp://archive.org/web/web.php
Server error 502 -- probably because our servers are overloaded right now.
Please retry either now or later (by hitting refresh/reload).

あーん!
439名無しさん@お腹いっぱい。:2012/12/18(火) 11:47:20.45
鯖様が死んだ!
440438:2012/12/19(水) 14:00:34.37
コンテンツの置いてある鯖が落ちてるのはしょっちゅうだけど
入り口が落ちてるのは久々に見た
441名無しさん@お腹いっぱい。:2013/01/02(水) 23:42:33.31
今年もお世話になります
がんばれ
442名無しさん@お腹いっぱい。:2013/01/11(金) 14:09:06.14
webarchiveのログが一部消えてるサイトがあるんだけど…
何が原因?
443名無しさん@お腹いっぱい。:2013/01/11(金) 22:20:05.10
エスパーさんいますかー?
444名無しさん@お腹いっぱい。:2013/01/16(水) 03:35:33.40
どうも URL にクエリ用の引数 ("?" と "&" で区切られる文字列) が含まれている場合、
引数のトークンの順序を入れ替えても同一視されるようになったっぽい。

例えば次の 2 つは同じ結果が返る。
ttp://web.archive.org/web/*/www.microsoft.com/downloads/details.aspx?displaylang=ja&FamilyID=5b33b5a8-5e76-401f-be08-1e1555d4f3d4
ttp://web.archive.org/web/*/www.microsoft.com/downloads/details.aspx?FamilyID=5b33b5a8-5e76-401f-be08-1e1555d4f3d4&displaylang=ja
displaylang= が前のものと FamilyID= が前のものとが一緒くたに並んでいる。

弊害として、
"?" 以降の部分にワイルドカード "*" を使って検索を掛けると
無条件に "見つからない" とか言い出すようになった。
445名無しさん@お腹いっぱい。:2013/01/21(月) 19:53:39.78
急に404になったページがあるのですが、隠しページのアーカイブから辿っていくとしっかり見れます。
また普通に見れるようになるのでしょうか?
446名無しさん@お腹いっぱい。:2013/01/21(月) 20:43:04.19
Additionally, a 404 Not Found error was encountered while trying to use an ErrorDocument to handle the request.
こんなのがでて404でした
447名無しさん@お腹いっぱい。:2013/01/21(月) 21:35:32.22
448名無しさん@お腹いっぱい。:2013/01/21(月) 23:38:26.49
どうも新しいの記録が404になって古いものなら見れるようです
最新バージョンでも見れるのかもしれませんが古いガラケーからなのでPCサイトビューワーで見る際に古いバージョンのlatestでみるとすぐ見れました。
新しいものはshowALLのような画面になるのでPCからなら見れる気がするのですが・・・
449名無しさん@お腹いっぱい。:2013/01/27(日) 18:47:38.56
閉鎖されたサイトをみたいんだけど一部だけ見れて他の所がみれないんだ
そこにアップロードされていたファイルは見ることはできないの?
小説サイトなんだけどさ、肝心の小説がみれない
450名無しさん@お腹いっぱい。:2013/03/14(木) 00:28:56.65
451名無しさん@お腹いっぱい。:2013/04/07(日) 08:21:33.25
OperaでInternet Archiveのページに行ったらこんなのが出たんだけど…

フィッシング警告

このサイトは不正なサイトとして報告されています。
このサイトで重要な情報や個人の秘密情報を送受信すると、
個人情報の盗難や金融詐欺のリスクにさらされる危険性があります。
Opera Software は、このページにアクセスしないことを強くお勧めします。
452名無しさん@お腹いっぱい。:2013/04/07(日) 10:58:20.59
そりゃ異なるドメインへの転送サービスだしフィッシング警告出るのは当然でしょ
自分でweb.archiveだけ解除すりゃいいんじゃね?
453名無しさん@お腹いっぱい。:2013/04/09(火) 03:45:50.39
う〜ん最近よくBummerが出るなあ
サーバーがメンテ?落ちてる?んだっけ?
454名無しさん@お腹いっぱい。:2013/04/09(火) 14:54:34.70
>>453
ほんと多いねぇ
455名無しさん@お腹いっぱい。:2013/04/10(水) 02:16:03.47
>>454
昨日はBummerどころか一定時間繋がらなくなった
Bummerが出たときは>>447のさらに古いバージョンでしのいでるけど
古いやつだと表示されない画像があったりするんだよなあ
456名無しさん@お腹いっぱい。:2013/04/15(月) 01:42:05.25
これってピクシブや萌えjpみたいなサイトにはやっぱり使えんのかね
457名無しさん@お腹いっぱい。:2013/04/15(月) 02:22:00.90
>>456
クッキー食べる必要がある場所は駄目よ
458419:2013/04/26(金) 06:51:05.99
ふと思い出したんで久々にブックマークしといた見れなかったページ群行ってみたら
3分の1ぐらいが見れるようになってたわ
嬉しい
459名無しさん@お腹いっぱい。:2013/04/26(金) 22:17:02.89
鯖落ち増えたなあ
460名無しさん@お腹いっぱい。:2013/05/03(金) 17:30:00.99
黒歴史を消したい人用に報告。

10年前に閉鎖した自分のサイトが閲覧できるのに気付いて、
メールで削除依頼する際に自分が当時のサイト管理者だった証明として
「InternetArchiveにキャッシュされていない画像を自分は持っているYO」
ということで

1,InternetArchiveで非表示になっている画像があるページ(「×」表示)
2,そのページのソース(非表示画像の「○○.jpg」を強調)
3,PCに保存しておいたサイトフォルダのスクリーンショット(非表示画像を強調)

1,2,3の画像をまとめたファイルを添付して説明入れたら一発で対応してもらえたわヽ(´ー`)ノ
461名無しさん@お腹いっぱい。:2013/05/03(金) 19:10:46.10
>>460
ナイスなtipsありがとう
他人のサイトもこれで消せばキャッシュ持ってる自分だけが独り占めだね
462名無しさん@お腹いっぱい。:2013/05/15(水) 19:56:51.26
閉鎖→アーカイブで閲覧可→アーカイブで見られなくなる
1)robot.textの後置き
2)削除メール
3)アーカイブの容量圧縮のためデータ削除
の理由が考えられると思っておk?

1)ならドメイン削除後に復活の可能性が微レ存だけど、3)は根本から望みが絶たれるよねorz
classicも使えなくなってるしオワタ
463名無しさん@お腹いっぱい。:2013/05/16(木) 04:37:40.16
>>462
Bummer
464名無しさん@お腹いっぱい。:2013/05/16(木) 17:55:50.04
容量圧縮のためにせっかく保存しといたページを削除って
このサービスの理念と矛盾してて意味なくないか?
465名無しさん@お腹いっぱい。:2013/05/17(金) 05:53:52.25
だよな
>>462にとってarchive.orgってその程度の存在なんだろう
466名無しさん@お腹いっぱい。:2013/05/17(金) 21:36:22.34
このスレでも圧縮でlzh消えてる例はガイシュツですが?
467名無しさん@お腹いっぱい。:2013/05/18(土) 02:55:05.87
既出。
>>462の2番目。
468名無しさん@お腹いっぱい。:2013/05/20(月) 23:36:39.36
日本でもこういうアーカイブサービス作ってほしい
ウェブ魚拓とかで似たようなことできんかな?
469名無しさん@お腹いっぱい。:2013/05/21(火) 01:26:07.46
ttp://en.wikipedia.org/wiki/Wayback_Machine#Legal_status
本家ですら色々と争いが起きているのに、
同じことをやろうとする漢が日本にいるとは思えない。
470名無しさん@お腹いっぱい。:2013/05/21(火) 02:04:01.86
>>468-489
>>152
実は国会図書館でも…
まぁ一般公開してくれないだろうけど
471名無しさん@お腹いっぱい。:2013/05/27(月) 09:37:49.94
Hrm.ってどういう意味?
なんか日本の Orzに似てるなw
472名無しさん@お腹いっぱい。:2013/05/28(火) 16:50:12.99
Orz ほど深い意味は無いよ
ttp://en.wiktionary.org/wiki/hrm
473名無しさん@お腹いっぱい。:2013/07/21(日) NY:AN:NY.AN
画像のアーカイブってできないんですかね?
サイトが変わってアドレスが分からんw
474名無しさん@お腹いっぱい。:2013/07/21(日) NY:AN:NY.AN
画像も一部は通常通り保存されてるけど特化して画像を保存ってのは無いな
肖像権の問題も大きいんだと思う
475名無しさん@お腹いっぱい。:2013/08/24(土) NY:AN:NY.AN
ここって新劇エヴァ丸々とか動画のとこ探すとみつかるんだけど著作権的にどうなの
476名無しさん@お腹いっぱい。:2013/08/26(月) NY:AN:NY.AN
477名無しさん@お腹いっぱい。:2013/09/10(火) 13:12:34.43
なんかインターネットアーカイブの旧ver.でしか見つからないページもあるそうだけど、
旧ver.は今凍結されてるから確認できないじゃん…
478名無しさん@お腹いっぱい。:2013/09/13(金) 20:11:56.19
ダウンロードソフト使ってまとめて保存するのって今はできなくなってる?
去年の今頃は普通に落とせてたと思うんだが・・・設定しだいではいけるのかな?
因みに、IriaとかDCさくらとかをよく使ってたと思う
誰かまとめて保存する良い方法教えてください
479名無しさん@お腹いっぱい。:2013/09/14(土) 04:16:30.95
手作業とかスクリプト使うとかして URL リスト生成してから wget に食わせてる
480名無しさん@お腹いっぱい。:2013/09/16(月) 22:30:04.31
ブログって見れないのかな
消えてたブログ見ようとしてURL入れたら
The Wayback Machine does not have this URL.
Here is the page from the Live Web.
としか表示されない…
そもそも向こうの方にページのデータがないのかな
481名無しさん@お腹いっぱい。:2013/09/17(火) 08:05:23.32
中卒以下の方はお引き取りください
482名無しさん@お腹いっぱい。:2013/09/17(火) 20:04:04.78
中卒ならその程度の英文読めるんだから中卒に失礼だ
483名無しさん@お腹いっぱい。:2013/09/22(日) 16:49:28.63
Chrome用の拡張機能見つけた。まあまあ便利。

Internet Archiveで検索【消えたサイト・更新前の情報を復活!】
https://chrome.google.com/webstore/detail/kgikjidebfpobpdblajldckjkofkjncn/details?hl=ja
484名無しさん@お腹いっぱい。:2013/09/25(水) 14:44:55.26
Q&A
LOVE PHANTOM
ZERO
イチブ
太陽のKOMACHI
ねがい
ULTRASOUL
485名無しさん@お腹いっぱい。:2013/10/07(月) 02:03:29.55
Firefoxだとなんかサイトによって表示されない
486名無しさん@お腹いっぱい。:2013/10/07(月) 12:37:44.93
あら、ie8でも表示されず真っ白にorz
ここなんだけど他の方は表示されますでしょうか?
ttp://svr.sanyo.oni.co.jp/hb/index.html
487名無しさん@お腹いっぱい。:2013/10/07(月) 21:45:19.97
高校野球がどうたらってかいてるよ
488名無しさん@お腹いっぱい。:2013/10/07(月) 23:17:20.32
>>486
operaで何ら問題無く表示されてますよ。
489名無しさん@お腹いっぱい。:2013/10/10(木) 15:59:16.94
>>487-488
今は表示されました。
どもでした。
490名無しさん@お腹いっぱい。:2013/10/10(木) 16:49:04.74
あほくさ
491名無しさん@お腹いっぱい。:2013/10/15(火) 22:50:11.70
ttp://iyakuhy.sakura.ne.jp/

ある程度は出てきますが、
欲しい情報が最後の2011年10月14日更新のもので、
それがどうしても拾えないです…。
何か方法があればアドバイスお願いします。
492名無しさん@お腹いっぱい。:2013/10/23(水) 23:38:23.65
ここと似たようなサイトだと魚拓しかない?
493名無しさん@お腹いっぱい。:2013/10/27(日) 01:13:02.18
クロール指示が出来るようになったのか
494名無しさん@お腹いっぱい。:2013/10/31(木) 21:07:22.06
>>493
何を今更
495名無しさん@お腹いっぱい。:2013/11/01(金) 00:23:30.49
今更だったのか…
496名無しさん@お腹いっぱい。:2013/11/03(日) 01:01:32.83
魚拓化して大手サイトのログは凄いことなってるけど
早晩この路線は破綻すると思う
497名無しさん@お腹いっぱい。:2013/11/03(日) 17:11:27.23
財政上の懸念は別として、ここの場合は
集めることそのものが目的だからなぁ・・・
498名無しさん@お腹いっぱい。:2013/11/04(月) 11:41:09.84
前回クロール時から変化のなかった重複ファイルもそのまま馬鹿正直に全部保存してるの?
500名無しさん@お腹いっぱい。:2013/11/05(火) 10:03:04.60
すごいなあ
501名無しさん@お腹いっぱい。:2013/11/06(水) 22:46:33.44
502名無しさん@お腹いっぱい。:2013/11/06(水) 22:48:58.10
メンテいつまで?
503名無しさん@お腹いっぱい。:2013/11/07(木) 06:18:43.44
ツイには何も出てないけどどうやら復活した様子
504名無しさん@お腹いっぱい。:2013/11/18(月) 14:22:32.19
とあるトラブル解決のため、消されたHPのデータを可能な限り拾って紙媒体に保存する作業をしています。

キャプチャが一度しかされていない状態で404やHrm.を吐いてしまった場合、そのページは閲覧不可でしょうか?
本当に困っています。助けてください。
505名無しさん@お腹いっぱい。:2013/11/19(火) 10:10:51.81
本当に困ってるんだったら
こんなところで訊いていないで
元の作者に連絡を取るなどするべきかと
506名無しさん@お腹いっぱい。:2013/11/20(水) 04:17:53.44
Mozilla/5.0 (Windows NT 5.1; rv:25.0) Gecko/20100101 Firefox/25.0 AlexaToolbar/alxf-2.19
Mozilla/5.0 (Windows NT 6.1; rv:25.0) Gecko/20100101 Firefox/25.0 AlexaToolbar/alxf-2.19
Mozilla/5.0 (Windows NT 6.1; WOW64; rv:25.0) Gecko/20100101 Firefox/25.0 AlexaToolbar/alxf-2.19
User Agent
The Wayback Machine
507名無しさん@お腹いっぱい。:2013/11/20(水) 07:28:10.96
何それ?
508名無しさん@お腹いっぱい。:2013/11/20(水) 18:06:37.00
Alexa Toolbar を Wayback Machine と誤検出してるだけかと。
ttp://web.archive.org/web/*/taruo.net/e/
510名無しさん@お腹いっぱい。:2013/11/23(土) 01:17:27.64
>>509
> .co.kr
何か変な奴が来たと思ったらそういうことか。
511囗WEBア〜カイブ ◆uo3RAN8HyY :2013/11/23(土) 02:22:51.91
>>507site:megalodon.jp google.co.kr
在日認定したぃ?。。ぁぁソレ牽強付会
http://google.fr/images?&hl=zh&q=kr
中国語表示だと。。必ずハイライト=赤
http://google.kr/images?&hl=ko&q=kr
google.co.krでハングル表示のみ?独特
http://google.uk/images?&hl=ko&q=kr
デフォルトでは魚拓できないURLも取得
>>492site:megalodon.jp google.co.uk
特定のアクセス元のみ閲覧制限?回避策
http://liveweb.archive.org/liveweb/
サ〜バごとに表示設定?その他使ぃ分け
512名無しさん@お腹いっぱい。:2013/11/23(土) 09:46:49.78
リアルに日本語でおk
513名無しさん@お腹いっぱい。:2013/11/23(土) 16:32:53.82
画像版アーカイブもあるといいんだけどな
514名無しさん@お腹いっぱい。:2013/11/23(土) 17:39:43.21
>>513
どういう意味?
スクショを残しておいて欲しい、ということなら
archive.is か zoom.it あたりを使えば良い。
515名無しさん@お腹いっぱい。:2013/11/29(金) 18:29:09.50
>>509 >>511
&#51453;&#46020;(竹島)&#45716; &#51068;&#48376;&#51077;&#45768;&#45796;. &#45817;&#49888;&#46308;&#51008; &#45208;&#44032;&#46972;
516515:2013/11/29(金) 18:50:59.72
http://awabi.2ch.net/test/read.cgi/korea/1313533828/139
>>509 >>511
竹島は日本の領土です。貴方達は出て行け
517名無しさん@お腹いっぱい。:2013/12/01(日) 00:22:26.97
さて。
518名無しさん@お腹いっぱい。:2013/12/12(木) 07:11:30.86
pixivや手ブロなんかもイラストごと保存できてたら神サイトなんだけどなあ
519名無しさん@お腹いっぱい。:2013/12/19(木) 01:13:37.04
■規制されても書き込める板■
臨時地震板
[test]書き込みテスト 専用スレッド@臨時地震
http://hayabusa.2ch.net/test/read.cgi/eq/1371879931/

シベリア超速報板 (強制IPアドレス表示) sage推奨
てすとスレ Part.2
http://toro.2ch.net/test/read.cgi/siberia/1376062707/

戦時板 (戦時下ニアル為、片仮名ト漢字デ発言サレタシ)
【戦時中デモ】忍法帖【テストガシタイ】ソノ弐
http://uni.2ch.net/test/read.cgi/senji/1377558958/
520名無しさん@お腹いっぱい。:2013/12/26(木) 22:08:46.49
メンテ上げ
521名無しさん@お腹いっぱい。:2013/12/27(金) 01:24:52.29
なんか最近Bomberだかなんだかのエラーが良く出てくる
522名無しさん@お腹いっぱい。:2014/01/01(水) 02:05:45.70
あけおめ
523名無しさん@お腹いっぱい。:2014/01/09(木) 21:39:58.23
重いなあ
524名無しさん@お腹いっぱい。:2014/01/10(金) 04:55:46.17
/* userContent.css */
@-moz-document domain(archive.org) {
  div.web_carousel {
    display: none;
  }
}
525名無しさん@お腹いっぱい。:2014/01/12(日) 23:04:20.24

何が変わるの?

.web_carousel
ってどこに出てくるやつ?
526名無しさん@お腹いっぱい。:2014/01/19(日) 04:28:53.43
Internet Archive、自分が見たいサイトはHrm.ばっかで全然使い物にならないんだけれども
他に同じようなサイトはございませんでしょうか?
527名無しさん@お腹いっぱい。:2014/01/19(日) 18:41:35.09
>>525
入口のぐるぐる回ってるやつが消えるだけ
528名無しさん@お腹いっぱい。:2014/01/20(月) 00:21:10.60
なるほど
529名無しさん@お腹いっぱい。:2014/01/23(木) 00:35:53.31
「インターネットアーカイブ 詐欺」とぐぐるとヤクバのスレがトップにくる。
ttp://toro.open2ch.net/test/read.cgi/magazin/1362208710/201-i?guid=on
530名無しさん@お腹いっぱい。:2014/01/23(木) 09:19:22.36
531名無しさん@お腹いっぱい。:2014/01/27(月) 06:14:14.11
すいません
Intenet Archive の書籍をPCでダウンロードするには、如何したらいいのでしょうか?
何処かにボタンでも有るのでしょうか?

iPad の Book Down というアプリでダウンロードすると
iBooks で見た時、数式が正常に表示できていない様に見えます
明らかに上付き下付きが動いていない様に見えます
 しかし、調べて見るとiBooks は、ePub の機能はフルに働く筈です
私は何か根本的に間違っているのでしょうか?
すいません。何も分からない初心者です
532名無しさん@お腹いっぱい。:2014/02/01(土) 14:33:10.79
533名無しさん@お腹いっぱい。:2014/02/02(日) 15:14:45.61
> Intenet Archive の書籍
どんなものか見てみたい
534名無しさん@お腹いっぱい。:2014/02/03(月) 22:58:59.44
>>183
>>481

クソみたいな奴しかいないんだな。いつまでも。アホらしい。
535名無しさん@お腹いっぱい。:2014/02/04(火) 12:49:14.68
いちいち去年のレスを引っ張り出すなよ
536名無しさん@お腹いっぱい。:2014/02/10(月) 20:37:53.44
ダウンしてね?
537名無しさん@お腹いっぱい。:2014/02/11(火) 13:12:26.88
https://web.archive.org/web/20060115015305/http://www.geocities.jp/id4622/kyara.htm
このURLのキャラをDL(右クリックで対象をファイルに保存)を選んだのはいいんだけれど
解凍できなくてどうにもならない。

zipの正常化はバイナリエディタなどで該当ファイルを開き、
16進数の最後の末尾に「00」を付加と書いているがもっと詳しく教えてほしい。

上記URLのzipファイルを正常ファイルに出来た方や昔に上記URLと同じファイルを持っていた人はご報告を
538名無しさん@お腹いっぱい。:2014/02/11(火) 15:17:54.45
今まで見れてたアーカイブが、新しいサイト主になってrobots.txt置かれただけで過去のが全部見れなくなるって何なんですか!
タヒねタヒねタヒね
539名無しさん@お腹いっぱい。:2014/02/11(火) 16:48:13.37
そのパターンあるなあ。
「当時はInternet Archiveのことを把握してなかったよ!」
みたいなクレーム対策で全部適応できるようにしてるんだろうけど、
もうちょっとなんとかできないのかね。

(過去に遡ってのアーカイブ停止は自動ではなく、申請があった場合に限るとか)
540538:2014/02/11(火) 17:19:17.99
>>538 続き
具体例ですが

看護師愚痴広場
http://16pixels.net/

という数年前に消滅してdomain for sale になってたサイトがあったのですが、新しいドメイン管理者が、robots.txtを置いただけで全てのアーカイブが見れなくなったようです。

まだ全部保存出来てなかったのに(泣)

URL直接指定でも見れないようです。
http://web.archive.org/web/20111010134707/http://www.16pixels.net/list/

robot.txt後置きで全部見れなくなる仕様はやめてほしい。
541名無しさん@お腹いっぱい。:2014/02/11(火) 17:52:05.80
>>540
http://16pixels.net/ の現在のドメイン主って、これ?
DYM testって出てる

株式会社DYMってどうよ?【10ページ目】
http://uni.2ch.net/test/read.cgi/venture/1371593009/
542名無しさん@お腹いっぱい。:2014/02/11(火) 18:27:35.49
>>538-539
ドメインパーキングサービスがそれやりやがったときは殺意が芽生えたよw
543名無しさん@お腹いっぱい。:2014/02/11(火) 19:44:36.41
>>542
もしそのドメインが完全に消滅して、robots.txtも何も無くなったら、また見れるようになるんでしょうか?
544名無しさん@お腹いっぱい。:2014/02/12(水) 19:30:40.26
>>537
その右クリ保存したというのは、どれも中身はエラーメッセージの HTML かと。
ttp://web.archive.org/web/*/www.geocities.jp/id4622/*
同サイトの場合 *.zip は一個も保存されていません。

>>541
ttp://bgp.he.net/ip/202.214.193.121#_dns
16pixels.net を含め、ここにリストされているのは全部 DYM。

>>543
そういうのはいくつも見たことがあります。
545名無しさん@お腹いっぱい。:2014/02/12(水) 20:03:03.33
昔のアーカイブは消さずに閉架化してるだけってことか。まあ当たり前だな。
546名無しさん@お腹いっぱい。:2014/02/13(木) 19:01:18.23
>>544 情報ありがと。助かる

>>541のDM、風評被害対策会社みたいなんだけど、ここはドメイン保管みたいな事もやってるんだろうか?
547名無しさん@お腹いっぱい。:2014/02/21(金) 11:20:17.54
wayback machineは、セーブしたアーカイブを勝手に消されることが多くなった。
もう使えない。
548名無しさん@お腹いっぱい。:2014/02/21(金) 12:11:56.86
有名になりすぎた
ただそれだけ
549名無しさん@お腹いっぱい。:2014/02/21(金) 15:30:50.36
半角英字に全角空白を混ぜるような奴が文句を垂れるときは
その本人の方に問題があるケースが多い
550名無しさん@お腹いっぱい。:2014/02/21(金) 18:06:40.81
>>547
実例kwsk
551名無しさん@お腹いっぱい。:2014/02/22(土) 12:32:00.75
相互リンク貼ります。仲良くしましょう。

ウェブ魚拓 Part2
http://toro.2ch.net/test/read.cgi/esite/1340450717/
552名無しさん@お腹いっぱい。:2014/02/22(土) 14:07:12.99
>>483

なにげにお役立ち情報
553名無しさん@お腹いっぱい。:2014/02/22(土) 17:34:55.14
サーバーダウンしているみたいだが
554名無しさん@お腹いっぱい。:2014/02/22(土) 18:24:57.21
メンテw
555名無しさん@お腹いっぱい。:2014/02/23(日) 00:38:35.01
なおったか
556名無しさん@お腹いっぱい。:2014/02/24(月) 16:40:47.72
サーバーダウンしているみたいだが
557名無しさん@お腹いっぱい。:2014/02/24(月) 17:04:08.92
入口が落ちてるっぽい
558名無しさん@お腹いっぱい。:2014/02/24(月) 17:16:52.45
入口どころか全体が落ちてないか?
本当使えないサービスになっちまったな
559名無しさん@お腹いっぱい。:2014/02/24(月) 17:33:03.38
まったくだな
もう俺らはarchive.orgを一切使わないことにするわ
560名無しさん@お腹いっぱい。:2014/02/24(月) 18:33:38.73
俺らって誰だよ
561名無しさん@お腹いっぱい。:2014/02/27(木) 16:22:56.46
スレ違いかもしれんが、peeep.usで記事のアーカイブが取れないよう、NHK側が何か仕掛けてるな
562名無しさん@お腹いっぱい。:2014/02/27(木) 17:03:09.70
>>561
取り敢えずニュースページを見てみたけど、
コンテンツを他のサイトで使用させないようにするための在り来りの方法が使われてる。
アーカイブの呼出し後に次のブックマークレットを走らせてみそ。
javascript:void(document.body.style.display='block');
563名無しさん@お腹いっぱい。:2014/02/27(木) 17:40:04.43
webプロキシを経由して閲覧した時のURlを使えば魚拓返しを破れる。

例えば
http://www.gmodules.com/ig/proxy?url=対象URl挿入
このURlを魚拓

またはGoogle、Yahoo、BINGのキャッシュをpeeep.usやarchive.isで保存すればいいよ。
564名無しさん@お腹いっぱい。:2014/02/28(金) 09:25:31.56
>>563

> またはGoogle、Yahoo、BINGのキャッシュをpeeep.usやarchive.isで保存すればいいよ。


あー、そういう手があるのか(感心)
565名無しさん@お腹いっぱい。:2014/02/28(金) 17:02:57.56
でもプロクシ介すとプロクシ自身が生成したという疑惑が残るから
それが気になる用途には無理w
566名無しさん@お腹いっぱい。:2014/02/28(金) 17:25:31.46
つまり魚拓サイト側がでっち上げをやらかすとか
そういうことは絶対に起こらないってことか。
平和なことは良いことだ。
567名無しさん@お腹いっぱい。:2014/03/17(月) 04:18:55.21
さて
568名無しさん@お腹いっぱい。:2014/03/21(金) 17:24:27.87
誰か「幼なじみエンサイクロペディア」憶えてるやついない?
案外残ってないもんなんだな…
569名無しさん@お腹いっぱい。:2014/03/22(土) 10:13:32.17
インターネットアーカイブ
http://web.archive.org/web/20131111024456/http://coffee0101.blog.jp/archives/3541257.html

上の魚拓
http://archive.is/x77Of
http://www.peeep.us/fb35a52e
インターネットアーカイブ、archive.isを弾くようになった?Page cannot be crawled or displayed due to robots.txt.って表示されてるが、何とか魚拓取れた。
アーカイブは信用ならないから、他の魚拓を取るのを推奨。
570名無しさん@お腹いっぱい。:2014/03/22(土) 14:17:26.52
ピント合ってない発言にもほどがある気が…
571名無しさん@お腹いっぱい。:2014/03/22(土) 15:26:26.21
>>569
インターネットアーカイブのファイルをarchive.isで魚拓しようとしたら、正常に魚拓が取れなかったのです。
572名無しさん@お腹いっぱい。:2014/03/22(土) 16:46:42.82
User-agent: * Disallow: /

そりゃそうだろう。
573名無しさん@お腹いっぱい。:2014/03/22(土) 23:20:43.06
>>569>>571
archive.is は robots.txt を読まない。
おまけに "Page cannot be crawled or displayed due to robots.txt." ってのは
Internet Archive のセリフ。
つまり、

archive.is の URL 入力欄に IA のアーカイブの URL を突っ込む。

archive.is が IA にアクセスを仕掛ける。

IA が元サイトの robots.txt を読みに行く。

元サイトには全拒否の robots.txt が置いてあった。

IA は archive.is に "Page cannot be crawled...."
というメッセージを返す.

そのメッセージが archive.is に魚拓として残る。

そういうオチじゃないのか?
574名無しさん@お腹いっぱい。:2014/04/01(火) 00:25:23.70
まさしくそういうオチだったのか…?
575名無しさん@お腹いっぱい。:2014/04/07(月) 16:40:31.39
スレチかもしれんが、NHKニュースがzoom.itをブロックしたようだな。アーカイブが取れなくなっている。
576名無しさん@お腹いっぱい。:2014/04/07(月) 17:12:04.25
試してみたが、確かにプログレスバーが6割程度まで進んでそれっきり。
577名無しさん@お腹いっぱい。:2014/04/07(月) 18:45:23.24
めんどいなあ
578名無しさん@お腹いっぱい。:2014/04/10(木) 06:48:54.44
>>575

>NHKニュースがzoom.itをブロックしたようだな。

ブロックした理由がわからん。
579名無しさん@お腹いっぱい。:2014/04/11(金) 12:23:39.39
アレキサンドリアのミラーに繋がらん…
580名無しさん@お腹いっぱい。:2014/04/15(火) 16:54:17.33
フジテレビニュースが記事全文の魚拓を取らせないような
仕様に変えたようだが、なにか対抗策あるだろうか?

http://www.fnn-news.com/fujitv/
581名無しさん@お腹いっぱい。:2014/04/15(火) 18:42:34.59
582名無しさん@お腹いっぱい。:2014/04/15(火) 18:46:29.90
>>581

「続きを読む」以降の記事後半をキャッシュできていないぞ。
583581:2014/04/15(火) 19:03:00.42
ttp://web.archive.org/web/20140415094659/www.fnn-news.com/news/headlines/articles/CONN00266721.html
robots.txt の後置きだけ無ければ行けそうな気がするんだけどなぁ。

>>582
うちの環境ではクリックすると続きが出てくるんだわ。
ソースも読んでみたけど、スタイルシートの overflow 属性の値を書き替えてるだけだから
隠れていてもテキスト自体はキャッシュされてる。
584名無しさん@お腹いっぱい。:2014/04/15(火) 19:09:36.75
>>583

> うちの環境ではクリックすると続きが出てくるんだわ。


あー、すまん。読めた。

本当にすまん。
585581:2014/04/15(火) 19:18:50.68
ははは良かった良かった
586名無しさん@お腹いっぱい。:2014/04/16(水) 01:01:27.10
はてさて
587名無しさん@お腹いっぱい。:2014/04/16(水) 05:18:35.71
archive.is が archive.today へ移転。
旧ドメインにアクセスを掛けてもリダイレクトされます。
588名無しさん@お腹いっぱい。:2014/04/16(水) 12:47:39.25
todayなんてできたのか
589名無しさん@お腹いっぱい。:2014/04/23(水) 20:17:23.88
>>587
アドレスが代わっててびびった
英語力がないのだが、ハッキングに合ってドメイン失ったよってことかいな?

http://blog.archive.today/post/82775187091/curious-why-the-move-in-domain-names-from-archive-is
590587:2014/04/24(木) 17:31:08.83
>>589
.is ドメインの管理機関がソーシャルハッキングの攻撃を受けているため
archive.is を失いかねない状態にある、ってこと。

移転しないまま乗っ取られてしまうと、たとえ別の場所でドメイン立てても
ダメージは並じゃないからねぇ。
591名無しさん@お腹いっぱい。:2014/04/24(木) 17:47:05.10
ほえー。
592183:2014/04/25(金) 16:47:03.11
相変わらずこのスレは中卒が居付いてるのか
5年前と何も変わっちゃいない
593名無しさん@お腹いっぱい。:2014/05/01(木) 02:48:58.27
他人が言うのもなんだが名乗るほどの者じゃないな
594名無しさん@お腹いっぱい。:2014/05/05(月) 00:38:27.37
良かった。中学生は書き込んでもいいんだね
595名無しさん@お腹いっぱい。:2014/05/05(月) 10:16:27.55
Bummer.

The machine that serves this file is down. We're working on it.

さっさと直せド糞シロンボ
596名無しさん@お腹いっぱい。:2014/05/05(月) 12:52:18.16
白とは限らんぞ
597名無しさん@お腹いっぱい。:2014/05/07(水) 20:09:45.13
>>590

そんなことがあるのか。初耳だ。
598名無しさん@お腹いっぱい。:2014/05/27(火) 00:41:50.24
また数日前の魚拓が消えてるなぁ
同日に取ったものでも消えてないのがあったり意味不明だわ
599名無しさん@お腹いっぱい。:2014/05/27(火) 06:55:17.86
>>598
ユーザ側の操作で取った魚拓は、永久保存となる前に
一度「整理」されているような気がしていたが・・・やっぱりそうか
600名無しさん@お腹いっぱい。:2014/05/28(水) 17:27:42.86
魚拓?
601名無しさん@お腹いっぱい。:2014/05/30(金) 22:42:26.95
取っても取っても消されるんで嫌になるな・・・
なんで毎日のように同じページ保存しなきゃならんのだ
602名無しさん@お腹いっぱい。:2014/05/30(金) 22:52:51.51
強迫性精神疾患の自慢しなくていいから
603名無しさん@お腹いっぱい。:2014/05/31(土) 03:17:55.98
もう6月か
604名無しさん@お腹いっぱい。:2014/06/01(日) 18:58:33.76
>>601
そんな単純作業は自動化しろボケ
605名無しさん@お腹いっぱい。:2014/06/02(月) 14:19:36.31
Page cannot be crawled or displayed due to robots.txt.が表示されるということは
ドメイン管理者がrobots.txtを置く以外に原因はありえますか?

犯罪行為の立証のためにwayback machineを使っていたのですが、急に閲覧できなくなりました
ドメイン管理者が情報秘匿の意思を持ってrobots.txtを置いたという認識でよいでしょうか
606605:2014/06/02(月) 14:45:47.79
連投失礼します

robots.txtを置かれた場合でもアーカイブを閲覧する手段はありませんか?
607名無しさん@お腹いっぱい。:2014/06/02(月) 15:28:28.05
>>605
robots.txtで見れないよーと言われている原因はrobots.txtが置かれたこと意外にありません

閲覧できなくなったのは残念なことですが
robots.txtを置いたこと=情報秘匿の意思がある、かどうかは確実ではありません
そもそもInternet Archiveが
サイトの持ち主の意思を無視してサイトのクローンを作るようなものですので
そのbot訪問を阻止したいと思うこと自体は普通にありえるからです
普通の閲覧者なら来てもらってもかまわないけど
botはファイルのコピーを取っていくbotが多いから一律botは来ないでほしいという場合も
robots.txtを使います
なのでrobots.txtが置かれたから秘匿意思があったと決め付けることはできません

robots.txtを置かれた場合Arhiveを閲覧する手段はありません
ただ、robots.txtを一度置かれてもその後管理者がrobots.txtを撤去したり
ドメイン失効などによってrobots.txtを読み込めない状態になると
また閲覧できるようになるかもしれません
608605:2014/06/02(月) 16:57:53.01
>>607
詳しいご説明をありがとうございます

ついでに私的な内容なのですが…
ドメイン情報を検索したところ管理者の個人情報(電話番号やメールアドレス)を知り得たのですが、
robots.txtを撤去するよう依頼するのは無謀だと思いますか…?
609名無しさん@お腹いっぱい。:2014/06/02(月) 17:11:58.73
いつの間に robots.txt を置いただけで情報秘匿とか言われる世の中になってしまったんだ・・・
610名無しさん@お腹いっぱい。:2014/06/02(月) 17:39:20.55
>>608
ネット上の問題の扱いに慣れてる弁護士に相談したら?
ドメイン管理者の連絡先が見つかったところで
「robots.txt撤去を要求」とか短絡しているようでは
どう考えても無理ぽ
611605:2014/06/02(月) 19:54:45.91
>>610
単に報酬目的でそのドメインを取得しているなら、トラブル解決に協力してもらいたい旨を説明しようかと思ったのですが、
もし情報秘匿を目的としているなら、こちらの動きを悟られてしまうなと

現段階では動きようがなさそうですね…ありがとうございます
612名無しさん@お腹いっぱい。:2014/06/02(月) 20:05:41.07
>>605-611さん、>>538-544をごらんなさい。
風評被害対策業者は、インターネットアーカイブを潰す事までやっているのかもしれません。

現在、看護師愚痴広場 http://16pixels.net/ にアクセスすると"DYM test"と表示されます。
DYMが何を表すのかは知りませんが、同名の誹謗中傷対策を行う企業も存在するようです。
http://ai.2ch.net/test/read.cgi/venture/1371593009/

そして http://16pixels.net/ のアーカイブはrobot.txtの後置きで見れなくなっています。
http://web.archive.org/web/20111010134707/http://www.16pixels.net/

看護師愚痴広場は病院の誹謗中傷サイトのようでした。これはもしや…
http://archive.today/i5m2n
http://archive.today/HF2q2
613605:2014/06/02(月) 20:42:26.14
>>612
拝見しました、なるほど…
私の検証していたサイトのドメインは2013年9月まで失効していたのですが、調べてみると2014年4月にアップデートされた記録があります
アーカイブ対策としてrobots.txtを置きにきた可能性もあるということですね

過去の記録として記者や弁護士に提示する矢先だったので、先手を講じなかったのが悔やまれます…
ありがとうございました
614名無しさん@お腹いっぱい。:2014/06/03(火) 15:44:06.73
>>613
繰り返しになりますが、
あなたの言う犯人さんがアーカイブ対策としてrobots.txtを置いたという可能性も否定できませんが、
必ずしもそうではないかもしれないということを覚えておきましょう。

ドメイン管理者の電話番号やメールアドレスに連絡して
robots.txtを撤去するよう依頼するという件ですが、

(1)ドメイン販売業者に取得されている場合
無視される or 「売ってあげるよ!相場より高い値段で」とふっかけられる可能性がある

(2)あなたの言う犯人さんである場合
無視される or 無視された上で絶対にドメインを手放さないようになる

のどれかに転ぶと思います
どれに転ぶかわからない以上得策とは言えないのではないでしょうか?

あなたがそのドメイン管理者に下手に内情を話さないで
ただドメインを購入することができれば
一番簡単なんじゃないかと思うんですがいかがでしょうか?

あと、仮にドメイン購入に成功しrobots.txtの撤去に成功したとしても、
InternetArchiveに保存されているデータはオリジナルデータとは異なる無断転載ですので
犯罪行為の立証として使えるものか疑わしいような気がしますが
615名無しさん@お腹いっぱい。:2014/06/03(火) 19:12:29.19
はてさて
616名無しさん@お腹いっぱい。:2014/06/04(水) 15:08:52.90
平和だなあ
617名無しさん@お腹いっぱい。:2014/07/01(火) 05:47:26.33
618名無しさん@お腹いっぱい。:2014/07/01(火) 09:33:22.46
InternetArchiveに保存されているデータはオリジナルデータとは異なる無断転載ですので
犯罪行為の立証として使えるものか疑わしいような気がしますが
619名無しさん@お腹いっぱい。:2014/07/04(金) 23:59:13.78
blogspotの成人向けコンテンツってインターネットアーカイブからは見れないの?
「理解し続行を希望します」を押してもただループするだけ。

昔気に入ってて今は消えてるサイトがあるんだけど、もう見れないと諦めるしかないのかな…。
620名無しさん@お腹いっぱい。:2014/07/05(土) 04:56:03.59
あれは縦横 100% のインラインフレームでコンテンツを隠してるだけだから、
ブックマークレット書いて走らせれば見られるんじゃないかな。
621620:2014/07/05(土) 05:20:47.82
こんなのでどうだろう。多分 Internet Explorer では使えないです。

javascript:(function(){var%20a,b,c;if(a=document.getElementById('injected-iframe'))
a.style.visibility='hidden';a=document.styleSheets;for(b=a.length-1;b>=0;b--)
{if(!a[b].href){for(c=a[b].cssRules.length-1;c>=0;c--)
{if(/body%20+\*/i.test(a[b].cssRules[c].selectorText)
&&a[b].cssRules[c].style.visibility=='hidden')a[b].deleteRule(c);}}}})();
622名無しさん@お腹いっぱい。:2014/07/08(火) 03:31:19.59
623620:2014/07/08(火) 05:27:02.07
>>622
悪いが俺はエスパーじゃない
624名無しさん@お腹いっぱい。:2014/07/11(金) 07:48:56.68
Facebookのアーカイブ取るのってどうしてる?
625名無しさん@お腹いっぱい。:2014/07/17(木) 18:08:38.47
ここだけの話
7月14日前後に仕様変更が行われたので文字コードがx-sjisのサイトは全て文字化けになります。
626名無しさん@お腹いっぱい。:2014/07/18(金) 07:29:16.86
>>625
HTTP のレスポンスヘッダ (X-Archive-Guessed-Charset) を見る限りでは
x-sjis を Windows-1252 と判断してしまっているようですなぁ。
627名無しさん@お腹いっぱい。:2014/07/18(金) 10:27:52.28
えええ
628名無しさん@お腹いっぱい。:2014/07/25(金) 22:08:48.74
間違えてscのほうに書き込んでしまった
文字化け困ってる
リロードすると正常表示されることもあるが…
629名無しさん@お腹いっぱい。:2014/07/26(土) 15:41:35.89
手動でアーカイブ取れなくなってる
630名無しさん@お腹いっぱい。:2014/07/26(土) 18:48:17.32
>>629
いつから?
631名無しさん@お腹いっぱい。:2014/07/31(木) 15:39:12.70
imgurがIA対策を入れてきたっぽい?
632名無しさん@お腹いっぱい。:2014/08/01(金) 00:26:17.61
っていうと?
633名無しさん@お腹いっぱい。:2014/08/01(金) 09:33:19.20
お前らが笑った画像スレに同じ画像を何度も持ってくる奴がいるから
日付のメモ代わりにこれで画像をロードしていたところ、
imgurはこれ経由の画像へのアクセスを画像を内包した
HTMLのページへ飛ばすような改変をしてきて
そこが無限ループになって画像が出ない。
634名無しさん@お腹いっぱい。:2014/08/01(金) 11:04:10.39
今は画像へ普通にアクセスできるらしい。
635名無しさん@お腹いっぱい。:2014/08/01(金) 14:28:38.48
一時的なものだったってことかな
636名無しさん@お腹いっぱい。:2014/08/03(日) 15:03:14.14
2年前には普通にアーカイブで文字化けを
エンコード変換すれば見れていたページが
今ではどの日本語のエンコードをしても文字化けがなおらなくなりました。
(そのページはもともとシフトJIS指定でした)

この2年ほどでアーカイブの仕様が変わったのでしょうか?
また、どうすれば日本語で見れるようになるでしょうか。

昔保存していたHDDが壊れてしまったので、
アーカイブだけが頼りになってしまいました。
ご存じの方、どうぞよろしくお願いいたしますm(__)m
637名無しさん@お腹いっぱい。:2014/08/03(日) 15:22:25.40
すいません、すぐ上の>>625さんの懸案事項だったみたいですね。
ホンの半月ほどのタッチの差だったのですか…。

今のところ、シフトJISのものを読む手だてはないのでしょうか?
638名無しさん@お腹いっぱい。:2014/08/03(日) 19:08:09.27
タッチ?
639名無しさん@お腹いっぱい。:2014/08/03(日) 22:37:53.12
archive.todayがLoading...のままで一向に繋がらない・・・
この時間にメンテか何かやってるのかな?15時は普通に繋がったんだけどなあ
640名無しさん@お腹いっぱい。:2014/08/06(水) 05:24:24.41
zoom.itがサービス終了らしい。

Zoom.it is being discontinued, but the technology behind the site is
continuing forward.

Seadragon technology will continue forward as the Deep Zoom feature
in Silverlight, a shining example of Silverlight's ability to "light
up the web".

In addition, there are two Open Source projects that continue to
improve this technology. The first is OpenSeadragon which was
created by members of the original Seadragon team, as well as
Seadragon Ajax which was the original project from Microsoft's Live
Labs group.

The timeline for the end of service is as follows:
August 15th, All uploads will be suspended and on September 15th,
all image hosting will cease and the service terminated.

We apologize for any issues that this might cause.

http://zoom.it/
641名無しさん@お腹いっぱい。:2014/08/06(水) 05:26:51.84
zoom.itの代替ってどこがいいかねえ
642名無しさん@お腹いっぱい。:2014/08/09(土) 10:25:08.17
>>637
ページを保存してエンコード指定できるエディタ(EmEditorとか)でunicodeで開いてからwindows-1252で保存してsjisで開きなおすと
一部に文字化けは残るけれどなんとなく読めるようになる
643名無しさん@お腹いっぱい。:2014/08/09(土) 10:45:31.63
こまったもんだね
644名無しさん@お腹いっぱい。:2014/08/10(日) 19:25:42.54
>>625
なんてことだ
645名無しさん@お腹いっぱい。:2014/08/11(月) 12:23:54.45
7月中はリロード繰り返したら何とか見れたんだが、8月に入ってからは何度リロードしても文字化けしたままだ。
646名無しさん@お腹いっぱい。:2014/08/11(月) 19:34:09.44
>>645
>>625によるとx-sjisの文字コードは全て文字化けするみたい。
もしサイトの文字コードが上記なら何回リロードしても無理かも。
>>642のやり方で試してみて。
647名無しさん@お腹いっぱい。:2014/08/12(火) 09:14:22.90
最新のURLは https://archive.org/ だなw
648名無しさん@お腹いっぱい。:2014/08/16(土) 01:51:18.23
上の方にあったミラーからだと文字化けせずに見れた

トップページ
http://www.bibalex.org/isis/frontend/archive/archive_web.aspx

↑遅い場合はここから
http://web.archive.bibalex.org/archive_request_ng
649名無しさん@お腹いっぱい。:2014/08/16(土) 19:41:10.54
ミラーなんてあったのか。
650名無しさん@お腹いっぱい。:2014/08/20(水) 22:48:58.46
archive.orgまた503になってる・・・
651名無しさん@お腹いっぱい。:2014/08/20(水) 23:54:10.56
Scheduledってあるけど
652名無しさん@お腹いっぱい。:2014/08/26(火) 21:36:35.36
Internet Archiveは2バイトコードの処理にバグが多い?
653名無しさん@お腹いっぱい。:2014/08/27(水) 14:57:22.28
非標準の文字セット名を使い続けていたという
日本語Webの過去の事情をたまたま知らないだけなのに、
これをバグとか言い出す有様。
654名無しさん@お腹いっぱい。:2014/08/28(木) 07:19:09.25
最近はコンピュータで日本語を使うためのプログラムを保守する日本人がいなくなってしまったのか、
いろんなコンピュータで日本語がうまく扱えなくなってきてる気がする。
655名無しさん@お腹いっぱい。:2014/08/28(木) 13:35:47.40
たぶん他言語でも似たようなことが起きてるんだろうな。
Unicode対応したらとりあえず全言語対応できる!時代の弊害だな。
656名無しさん@お腹いっぱい。:2014/08/28(木) 15:53:02.33
非標準の文字セット名を使い続けていたという
日本語Webの過去の事情をたまたま知らないだけなのに、
x-sjisの完全なスーパーセットであって
文字セット名さえ認識できれば正しく変換できるUnicodeを名指しして
時代の弊害とか言い出す有様。

・・・しかし、x-sjis以外に似たような問題は聞いたことが無いな。
米国・西欧用の文字セット名(US-ASCII, ISO-8859-1等)を指定したまま
実際は別の文字セットを使っているという例は15年くらい前に東欧で散々見てきたが、
これは言わば「嘘を吐いている」訳だから話が違う。
657名無しさん@お腹いっぱい。:2014/08/28(木) 16:45:51.37
バグとは何かは一律普遍的に決められるものではなく、
そのサービスが何を目的にしているかによって変わるんじゃないかな。
Wayback Machineはその趣旨からいって既存文書に対する後方互換性がキモなわけだから、
x-sjisに(今になって)対応できなくなったことをバグ扱いすることに違和感は感じないな。
658名無しさん@お腹いっぱい。:2014/08/28(木) 16:47:47.93
×違和感は感じない
○違和感は抱かない

失礼。
659名無しさん@お腹いっぱい。:2014/08/28(木) 16:54:31.64
誰かInternet Archive宛てに要望出してくれないかな。
x-sjisをShift_JISのエイリアスと看做させるだけだから
変な自動判定ルーチン組み込むよりは簡単だと思うのだが。
660名無しさん@お腹いっぱい。:2014/08/28(木) 17:03:41.20
こういうローカルなデファクトって根拠の提示が難しいよね。
661名無しさん@お腹いっぱい。:2014/08/28(木) 17:16:04.21
ごめん、以前どうだったのかよく知らんのだけど、前は問題なかったのならx-sjisの事情自体は知ってるのかな。
もしそうなら根拠の提示とか抜きで「x-sjisバグってますよ」で十分な気がする。
英語できる人頼んだ↓
662名無しさん@お腹いっぱい。:2014/09/01(月) 12:56:50.59
なんかエドウィン
663名無しさん@お腹いっぱい。:2014/09/17(水) 09:09:50.25
削除要請したら翌日受領の返事が来て驚いた
664名無しさん@お腹いっぱい。:2014/09/18(木) 00:45:23.72
文字化けの修正はまーだ時間かかりそうですかね?
665名無しさん@お腹いっぱい。:2014/09/18(木) 01:56:32.20
修正どころか、この問題は運営側に認知されてないかもよ。
666663:2014/09/18(木) 09:19:10.68
そしてもう削除されてた
以前のカキコやサイトみると何週間もかかってる人がいたのに
667名無しさん@お腹いっぱい。:2014/09/18(木) 20:33:50.64
文字化けの件について一応メールは送ってみた。
ただ今まで海外の企業に10以上問合せ送ったことがあるが
2回くらいしか返信が来なかったのであまり期待しないでほしい。

あと送ってから気づいたんだが、どうやらx-sjisだけの問題じゃないらしい。
Shift_JISでも文字化けしているサイトがいくつかあった。
結局のところ手動でエンコードを選択できないのが問題だと思う。
そもそも申告された文字コードが正しいとは限らず、
より賢い自動判定によって表面化せずに放置されてる可能性もあるわけで。

(メールには>659の言う内容に加えて、もしくは余計な変換を止めろとも書いておいた)
668名無しさん@お腹いっぱい。:2014/09/19(金) 00:23:57.45
うーんカレンダーの所には表示があるのに
クリックすると新しいキャプチャに飛ばされる
これは削除されているのかな

上のレスとは関係ないよな・・・
669名無しさん@お腹いっぱい。:2014/09/22(月) 13:55:18.45
>>667

改善されると嬉しいな
前まで観られていたサイトが文字化けで読めないのは悲しい
670名無しさん@お腹いっぱい。:2014/09/23(火) 01:21:21.12
>>668
取得したページ数が増えなくて変だなぁと思ったら
ところ天方式で古いページから消えてく現象が起きてる・・・なんだこれ
不定期にページが消し飛ぶ現象とは違うよな
671名無しさん@お腹いっぱい。:2014/09/23(火) 09:41:09.24
まずところてん方式ってのが何ぞ
672名無しさん@お腹いっぱい。:2014/09/24(水) 08:17:04.78
更新されていなければ最新版1つ持っていれば十分じゃねということ?
673名無しさん@お腹いっぱい。:2014/09/25(木) 15:40:04.63
そんな事はどうでもいいが
Internet Archiveは仕様変更でもしたのかね
674名無しさん@お腹いっぱい。:2014/09/25(木) 15:49:35.72
いや何の話だよ
675名無しさん@お腹いっぱい。:2014/09/25(木) 23:20:49.30
浦島さんこんにちは。
676名無しさん@お腹いっぱい。:2014/09/26(金) 01:30:18.01
677名無しさん@お腹いっぱい。:2014/09/26(金) 02:54:40.41
数レス上の話を忘れるとは・・・
678名無しさん@お腹いっぱい。:2014/09/26(金) 13:26:03.28
>>673がリアルに何の話かわからん。

直前の流れを「そんな事はどうでもいいが」と切り捨ててるあたりからすると直前の話題の記録ポイント消失問題を話したいわけではなさそうだし、
その前の話題の文字化け問題は発端の>>625から仕様変更として扱ってるんだから今更「仕様変更でもしたのかね」も妙だし…。
679名無しさん@お腹いっぱい。:2014/09/26(金) 23:10:44.31
ところてんに引っ掛かってるのを「どうでもいい」と切り捨てて
直前の記録ポイント消失問題の話をしているんだよ
680名無しさん@お腹いっぱい。:2014/09/26(金) 23:13:52.88
ところてんに引っかかってたのは>>671までだよ
681668:2014/10/01(水) 10:44:10.97
二日くらいあけてからクリックしたらいけた
何かトラブルか混んでいただけかも
682名無しさん@お腹いっぱい。:2014/10/01(水) 12:56:20.48
ときどきそういうことあるよね
683名無しさん@お腹いっぱい。:2014/10/05(日) 23:10:00.78
まだ文字化け直ってないねえ
684名無しさん@お腹いっぱい。:2014/10/06(月) 02:31:21.48
しっかし送出側がちょっと間違っただけで、こっちでできる対処ってほとんどなくなっちゃうんだな。
685名無しさん@お腹いっぱい。:2014/10/07(火) 19:20:48.85
ちょっとおかしい?
686名無しさん@お腹いっぱい。:2014/10/08(水) 01:40:09.66
sjisの全文字を羅列したhtmlをx-sjisとしてarchiveに食わせて
出てきたhtmlをざっと見た感じ、全ての文字が1:1で対応しており、
欠損や複数の文字が1つの文字に化けているということは無いみたい。
なので最悪テーブルを作って元に戻すことは出来そう。
687名無しさん@お腹いっぱい。:2014/10/08(水) 03:04:41.30
ああそうか、今からクロールさせても再現できるのか。
688名無しさん@お腹いっぱい。:2014/10/08(水) 04:53:05.69
>>686
> 出てきたhtmlをざっと見た感じ、全ての文字が1:1で対応しており、
本当?

Shift_JIS で 0x81, 0x8D, 0x8F, 0x90, 0x9D の値がどれも
0xEF 0xBF 0xBD というバイト列 (Unicode で U+FFFD の文字)
に変換されるから、絶対に重複が生じるはずなのだが。

例えば
8D40 后 喉 坑 垢 好 孔 孝 宏 工 巧 巷 幸 広 庚 康 弘
8D50 恒 慌 抗 拘 控 攻 昂 晃 更 杭 校 梗 構 江 洪 浩
8D60 港 溝 甲 皇 硬 稿 糠 紅 紘 絞 綱 耕 考 肯 肱 腔
8D70 膏 航 荒 行 衡 講 貢 購 郊 酵 鉱 砿 鋼 閤 降

8F40 宗 就 州 修 愁 拾 洲 秀 秋 終 繍 習 臭 舟 蒐 衆
8F50 襲 讐 蹴 輯 週 酋 酬 集 醜 什 住 充 十 従 戎 柔
8F60 汁 渋 獣 縦 重 銃 叔 夙 宿 淑 祝 縮 粛 塾 熟 出
8F70 術 述 俊 峻 春 瞬 竣 舜 駿 准 循 旬 楯 殉 淳
が同じになったりしてない?

そんなことより
URL パラメータを使って変換前の HTML を取り出した方が早いわ
689名無しさん@お腹いっぱい。:2014/10/09(木) 01:39:25.15
文字化けはもう治らないんですね...
690名無しさん@お腹いっぱい。:2014/10/09(木) 02:48:56.13
ほんと余計なことするよなあ運営
日本語なんて知ったこちゃあねーよって感じなんだろうな
691名無しさん@お腹いっぱい。:2014/10/09(木) 08:48:37.07
画像が壊れたまま保存されてしまわない?
692名無しさん@お腹いっぱい。:2014/10/09(木) 09:42:13.14
またデータサーバが飛んだのか
キャッシュ一覧は表示されるのにリンク先へ進むと真っ白…
693名無しさん@お腹いっぱい。:2014/10/09(木) 13:38:50.29
あるある
694名無しさん@お腹いっぱい。:2014/10/11(土) 01:08:56.71
データサーバが飛んだというより、何かのバグじゃないかな・・・
アーカイブを取り出そうとすると時々長さ 0 の応答を返してくることがあって、
それが HTML の場合は画面真っ白、画像やその他のファイルは中身が空のまま保存されてしまう。

HTTP/1.1 200 OK
Server: Tengine/2.0.3
Date: Thu, 09 Oct 2014 15:22:12 GMT
Content-Type: application/octet-stream
Content-Length: 0
Connection: keep-alive
set-cookie: wayback_server=74; Domain=archive.org; Path=/; Expires=Sat, 08-Nov-14 15:22:12 GMT;
X-Archive-Wayback-Runtime-Error: java.lang.ArrayIndexOutOfBoundsException
X-Archive-Playback: 0
X-Page-Cache: HIT
695名無しさん@お腹いっぱい。:2014/10/11(土) 07:17:27.29
おかしくなるタイミングがあるとかおかしいサーバに割り当てられるとかかな?
696名無しさん@お腹いっぱい。:2014/10/17(金) 06:24:18.73
archive.today
すげー重い
まともに利用できない状態だな
697名無しさん@お腹いっぱい。:2014/10/18(土) 10:13:20.60
archive.tomorrow
698名無しさん@お腹いっぱい。:2014/10/22(水) 00:00:29.29
えらいこったな
699名無しさん@お腹いっぱい。:2014/10/28(火) 19:11:53.14
タイムアウト?
700名無しさん@お腹いっぱい。:2014/11/01(土) 19:39:41.29
文字化け何時になったら直るんだろう
見たいページがあるのに・・・
701名無しさん@お腹いっぱい。:2014/11/01(土) 23:17:53.96
(´;ω;`)ブワッ
702名無しさん@お腹いっぱい。:2014/11/05(水) 02:50:37.83
【ゲーム】InternetArchivesが懐かしのアーケードゲーム900本を無料公開、パックマンからスト2まで全部ブラウザで遊べるぞ! [11/4]c2ch.net
http://anago.2ch.net/test/read.cgi/moeplus/1415119297/
703名無しさん@お腹いっぱい。:2014/11/06(木) 14:43:14.78
ロイタージャパンの記事をWayback machineではアーカイブが取れなくなったな。
704名無しさん@お腹いっぱい。:2014/11/06(木) 18:51:31.07
(´・ω・`)
705名無しさん@お腹いっぱい。:2014/11/08(土) 06:30:08.66
>>688
変換前のhtmlを取り出すパラメータってあるの?
面倒だけど出来るなら文字化けが直せるのでありがたい。
706名無しさん@お腹いっぱい。:2014/11/08(土) 13:19:31.49
>>705
通常 (変換あり)
ttp://web.archive.org/web/20000229210655/www.iodata.co.jp/
時系列表示無し (変換あり)
ttp://web.archive.org/web/20000229210655fw_/www.iodata.co.jp/
元データ (変換無し)
ttp://web.archive.org/web/20000229210655im_/www.iodata.co.jp/

im_ オプション使用時は HTML コード内の URL の置換も行わないので、
画像や外部スタイルシートなどがより高確率で正しく描画されない点に注意。
707名無しさん@お腹いっぱい。:2014/11/08(土) 13:33:44.22
乙!そんな方法があったとは知らなかったよ。
708名無しさん@お腹いっぱい。:2014/11/08(土) 13:52:21.04
これは役に立つ
709名無しさん@お腹いっぱい。:2014/11/08(土) 23:18:23.56
文字化けになっていてもう終わりかと思っていたけどコレでちゃんと閲覧出来るようになった。
ありがとう本当にありがとう。
710名無しさん@お腹いっぱい。:2014/11/10(月) 01:49:46.68
>>706
GJ
711名無しさん@お腹いっぱい。:2014/11/10(月) 02:13:20.71
>>706
これよく分からないんだけど
見たいURLにim_かfw_をつければ文字化けしなくなるの?
712名無しさん@お腹いっぱい。:2014/11/10(月) 03:17:36.59
文字化けしないというより、少なくともim_は画像と同じ(内部に手を加えたら壊れる)扱いをするということだな。
fw_はどこで使われているか知らないw
713名無しさん@お腹いっぱい。:2014/11/10(月) 13:30:17.22
>>712
im_ に関してはそういうことになるかと。
実際に中身が画像等であれば特に im_ を付けなくても変換は行われないのですが、
呼び出し元が画像として参照しようとしているときは予防的に付けているのかもしれません。

fw_ はフレームコンテンツの参照 (<frame src=...) で使われています。
UTF-8 への変換は行われますので、元が x-sjis であれば現状では文字化けします。
714名無しさん@お腹いっぱい。:2014/11/11(火) 08:13:44.22
715名無しさん@お腹いっぱい。:2014/11/13(木) 11:21:20.74
>>706
なんという神だ!
いったいどこでこんな知識を得るんだ?
716名無しさん@お腹いっぱい。:2014/11/20(木) 15:35:50.96
あれいつの間にか文字化けしないようになってるのか
対策してくれたのかな
717名無しさん@お腹いっぱい。:2014/11/20(木) 17:00:45.12
>>716
>>706 の一番目の URL に対する web.archive.org のレスポンスヘッダ。

HTTP/1.1 200 OK
Server: Tengine/2.0.3
Date: Thu, 20 Nov 2014 07:46:00 GMT
Content-Type: text/html;charset=utf-8
Content-Length: 19119
Connection: keep-alive
set-cookie: wayback_server=74; Domain=archive.org; ... (後略)
Memento-Datetime: Tue, 29 Feb 2000 21:06:55 GMT
Link: <http... (後略)
X-Archive-Guessed-Charset: x-sjis
X-Archive-Orig-server: Apache/1.2.6 Ben-SSL/1.17
X-Archive-Orig-etag: "3c72-2672-38b0a8da"
(以下略)

「X-Archive-Guessed-Charset: x-sjis」となっていますから、
きちんと x-sjis を認識するようになったみたいですね。
以前は欧文用の文字セットとして認識していました (>>626)。
718名無しさん@お腹いっぱい。:2014/11/20(木) 22:47:59.90
うお、本当だ
やったね!
719名無しさん@お腹いっぱい。:2014/12/01(月) 00:18:24.74
おやおや、しばらく見ないうちに解決?
よかった。
720名無しさん@お腹いっぱい。:2014/12/05(金) 12:14:25.65
寄付してくれってメッセージが出だしたな
721名無しさん@お腹いっぱい。:2014/12/07(日) 20:54:48.38
【サービス終了のお知らせ】
inter7をご利用の皆様
 2014年12月20日(土)正午、
 全サービス完全停止し、サイトを閉鎖致します。
 12年間もの長きに渡り、サービス提供させて頂けたのは
 皆様方のご愛顧の賜物 と 奇跡だった感謝しております。
722名無しさん@お腹いっぱい。:2014/12/07(日) 22:17:05.65
文字化け直っててよかったー!
723721:2014/12/07(日) 22:46:59.05
スレタイinterで見間違ったごめん
724名無しさん@お腹いっぱい。:2014/12/08(月) 07:10:50.69
 _, ._
( ゚ A ゚;)?
725名無しさん@お腹いっぱい。:2014/12/08(月) 22:09:30.86
726名無しさん@お腹いっぱい。:2014/12/12(金) 08:22:38.83
         ,, _
       /     ` 、
      /  (_ノL_)  ヽ
      /   ´・  ・`  l    インターネットアーカイブは死んだんだ
     (l     し    l)    いくら呼んでも帰っては来ないんだ
.     l    __   l    もうあの時間は終わって、君も人生と向き合う時なんだ
      > 、 _      ィ
     /      ̄   ヽ
     / |         iヽ
    |\|         |/|
    | ||/\/\/\/| |
           O 。
                 , ─ヽ
________    /,/\ヾ\   / ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
|__|__|__|_   __((´∀`\ )< というお話だったのサ
|_|__|__|__ /ノへゝ/'''  )ヽ  \_________
||__|        | | \´-`) / 丿/
|_|_| 从.从从  | \__ ̄ ̄⊂|丿/
|__|| 从人人从. | /\__/::::::|||
|_|_|///ヽヾ\  /   ::::::::::::ゝ/||
────────(~〜ヽ::::::::::::|/        = 完 =
728名無しさん@お腹いっぱい。:2014/12/12(金) 09:09:09.56
Twitterをチェックしろと書いてあるのに、
実際にTwitterにメンテ終了告知が載せられた記憶がない
729名無しさん@お腹いっぱい。:2014/12/12(金) 14:28:40.48
何の為のtwitterなんだろな
730名無しさん@お腹いっぱい。:2014/12/15(月) 14:49:56.39
archive.today まともに使えない
復旧はよ
731名無しさん@お腹いっぱい。:2014/12/15(月) 15:55:01.04
GET / HTTP/1.1
Host: archive.today
Connection: close

HTTP/1.1 200 Service Unavailable
Refresh: 5
Content-Length: 626
Accept-Ranges: bytes
Date: Mon, 15 Dec 2014 06:53:01 GMT
Connection: close
Server: nginx/1.6.0

Service Unavailable という説明をしておきながら
応答コードが 200 なのは笑える。
732名無しさん@お腹いっぱい。:2014/12/16(火) 12:15:31.40
unusable.today
733名無しさん@お腹いっぱい。:2014/12/17(水) 22:39:27.74
使い方簡単に教えて
734名無しさん@お腹いっぱい。:2014/12/18(木) 00:35:26.15
まず服を脱ぎます
735名無しさん@お腹いっぱい。:2014/12/18(木) 03:28:55.99
次に水着を着ます
736名無しさん@お腹いっぱい。:2014/12/18(木) 15:36:10.85
archive.today 画像が多いページはエラー出て取れなかったけど、今やったら取れた
不具合直ったのかな
737名無しさん@お腹いっぱい。:2014/12/18(木) 17:11:17.46
いえ、水着のパッドのせいです
738名無しさん@お腹いっぱい。:2014/12/18(木) 17:30:23.30
糞つまらんレスイラネ
739名無しさん@お腹いっぱい。:2014/12/22(月) 19:12:42.09
接続元の国の情報から言語を自動で切り替えていると思われるページのアーカイブを取ったら
キムチ語とか中国語とかが並んだけど、Internet Archiveってキムチ鯖も使ってるのかな?
740名無しさん@お腹いっぱい。:2014/12/23(火) 03:55:40.73
>>739
クライアントからのリクエストに Accept-Language ヘッダが含まれていると、
Wayback Machine はそれをそのまま取得先にも送ってしまいます。
アーカイブを取ろうとしたそのサイト、接続元の国の情報ではなく
このヘッダ (= ブラウザの言語設定) を見ているということは無いですか?

ブラウザをロシア語用に設定してから ttp://taruo.net/e/ を保存させると
HTTP_ACCEPT_LANGUAGE の項が ru になる。
ttp://web.archive.org/web/20141222183727/taruo.net/e/
about:config を直接弄って、言語略号の代わりに URL を突っ込むと
それもそのまま吐いてくれる。
ttp://web.archive.org/web/20141222184129/taruo.net/e/
741名無しさん@お腹いっぱい。:2014/12/23(火) 08:49:22.38
>>740
それが原因であれば、ja,en;q=0.7,en-us;q=0.3なので絶対に違うw
ちなみにサイトはツイッターだしw
742名無しさん@お腹いっぱい。:2014/12/23(火) 15:02:03.48
同じ経験したことある>Twitter

自分が見かけたのは韓国語とアラビア語。
743名無しさん@お腹いっぱい。:2015/01/01(木) 01:30:33.21
さて、今年の初アーカイブは
744名無しさん@お腹いっぱい。:2015/01/01(木) 09:52:47.33
リダイレクトループにならね?
745名無しさん@お腹いっぱい。:2015/01/01(木) 12:45:28.04
何が?
746名無しさん@お腹いっぱい。:2015/01/01(木) 17:04:40.46
いろいろおかしくね?
ttps://web.archive.org/web/*/http://www.example.com/ で2015年のグラフがもう生えてるしw
747名無しさん@お腹いっぱい。:2015/01/02(金) 04:05:08.86
半年ルールはとっくの昔に消失。
昨年夏ごろはアーカイブ保存からグラフに現れるまで一日か二日待たされていたのが、
最近は数時間で出てきます。
748名無しさん@お腹いっぱい。:2015/01/02(金) 09:49:13.24
ブラウザのリクエストヘッダによって返すものを変えているせいか、
特定のURLはブラウザのキャッシュをクリアしてもリダイレクトループになるし、
同じURLを別のクライアントソフトを使ってアクセスすると
きちんと内容が取れるorz
749名無しさん@お腹いっぱい。:2015/01/03(土) 11:43:07.56
今さっきまで読めていたページに繋がらねえよ。
検索フォームに打ち込んでも検索結果すら出なくなった。
750名無しさん@お腹いっぱい。:2015/01/07(水) 04:23:40.41
またベータ版が来てますなぁ。"Try Our New BETA Version" だとさ。
ttp://archive.org/web/web.php?&ui3=1
751名無しさん@お腹いっぱい。:2015/01/07(水) 18:14:27.86
見つけられない
752750:2015/01/08(木) 04:38:29.09
>>751
>>750 のリンクを踏むと、クッキーの幾つかの値が書き替えられて
以後 archive.org の表示がベータ版に変わる。
クッキーを消すか ttp://archive.org/services/exit.php を踏むと元に戻る。
…という仕組みのよう。

exit.php を踏むとクッキーの ui3 と v2time を消しに来るから
これでベータ版判定をしているのかな。
753名無しさん@お腹いっぱい。:2015/01/08(木) 21:34:30.84
何踏ませてんだよw
754名無しさん@お腹いっぱい。:2015/01/11(日) 02:07:42.34
archive.today重いな
755名無しさん@お腹いっぱい。:2015/01/12(月) 13:33:46.97
数時間前までどのURL入れても繋がらなかったがもう直ったみたいだ
756名無しさん@お腹いっぱい。:2015/01/15(木) 21:38:07.44
はじめましてインターネットアーカイブでページは見つかりましたが画像がなくて助けて下さい
757名無しさん@お腹いっぱい。:2015/01/16(金) 01:00:14.50
いえいえ大丈夫ですそれではごきげんよう
758名無しさん@お腹いっぱい。:2015/01/16(金) 23:10:41.17
urlはわかりますが
759名無しさん@お腹いっぱい。:2015/02/01(日) 21:59:58.62
さて
760名無しさん@お腹いっぱい。:2015/02/06(金) 18:02:37.65
メンテに入ったな
761名無しさん@お腹いっぱい。:2015/02/07(土) 11:40:21.37
たまに入るな。
762名無しさん@お腹いっぱい。:2015/02/08(日) 07:57:44.42
てんめー
763名無しさん@お腹いっぱい。:2015/02/17(火) 17:39:47.63
最近peeep.usで保存できないんだけど自分だけ?👀
764名無しさん@お腹いっぱい。:2015/02/17(火) 17:42:20.34
変な文字が…
765名無しさん@お腹いっぱい。:2015/02/17(火) 22:34:09.59
ワラタ
766763:2015/02/18(水) 01:20:34.38
なんで変な文字が入力されるのか調べてみた どうも特定ワードとかがあるとなるらしい
>>763は「peeep.us」が含まれていたせいみたい

(参考)
初心者が安心して質問できるスレッド 391&#169;2ch.net
http://hello.2ch.net/test/read.cgi/qa/1418210008/523-524

【携帯ブラウザ】べっかんこ49 [転載禁止]&#169;2ch.net
http://carpenter.2ch.net/test/read.cgi/operatex/1423936509/250-257👀
767名無しさん@お腹いっぱい。:2015/02/18(水) 02:06:19.20
そのレスにも目玉付いててワラタ
768名無しさん@お腹いっぱい。:2015/02/21(土) 00:54:28.04
http://free2.milkypal.net/f-bbs/BA-1/freedom.cgi?mm=asako3

ここの文字化けどうすれば直る?
769名無しさん@お腹いっぱい。:2015/02/21(土) 03:15:32.13
>>768
それ、CGI 側がバグってて壊れたコード吐いちゃってたんじゃないの?
同じ free2.milkypal.net/f-bbs/BA-1/freedom.cgi で、2007 年 6 月 30 日に
クロールされた分は軒並み壊れてる。

例えば次の 2 つ、元のテキストは全く同じだと思われる。
ttp://web.archive.org/web/20070110202224/free2.milkypal.net/f-bbs/BA-1/freedom.cgi?mm=lake&mode=howto
ttp://web.archive.org/web/20070630150422/free2.milkypal.net/f-bbs/BA-1/freedom.cgi?mm=lake&mode=howto
770名無しさん@お腹いっぱい。:2015/02/21(土) 21:17:07.40
>>769

復元できませんでしょうか?
771769:2015/02/22(日) 01:48:50.91
>>770
化けてるんじゃなくて、特定の条件のデータがごっそり抜け落ちるという
壊れ方だから無理。

具体的に示すと、>>769 で挙げた例の場合、
1 つ目の「掲示板の使い方と注意事項」という部分のバイト列は次の通り。
8C 66 8E A6 94 C2 82 CC 8E 67 82 A2 95 FB-82 C6 92 8D 88 D3 8E 96 8D 80
ここから 7 ビットに収まらない値を取り除くと
66 67
この 2 つだけが残り、これを文字に戻すと「fg」となる。これが 2 つ目の状態。
772名無しさん@お腹いっぱい。
( ・´ω・`)