Internet Archive総合 (web.archive.org) #1
171 :
98 :
2009/04/22(水) 21:00:27 >>170 元々キャッシュされてないとか、
robots.txt で撥ねられてたら無理だな。
robots.txtは地味にうざい
173 :
98 :2009/04/23(木) 01:20:57
特に、ページは読めてもファイルが置いてあるところはrobots.txtでブロックされていると目茶苦茶にがっかりする
ちまちま法しかないのでしょうか?
176 :
98 :2009/04/26(日) 18:27:05
>>175 >>159 の "ちまちま" のこと?
あれを自動で行う、 専用の HTTP クライアントソフトを作れば良い。
既に誰かが作った、 という話は聞いた事が無い。
TCP が扱えるスクリプト言語か何かを使って HTTP を喋らせれば済む話だから、
作るのはそんなに難しいことではないと思う。
一度に数百個もキャッシュを拾ってくる必要性が出てきたら
俺も真剣に考えるかな。
ttp://web.archive.org/web/*nr_大きい数字/example.com/* みたいな URL を与えて、 サイト内のファイルをごっそり持ってくるような方法なら、
HTML 解析も Wayback Machine のキャッシュ一覧を処理するだけになる。
175です。 すいません。1999年から2002年ごろに作ったすでに閉鎖したWebサイトを復元したおきたいと思ったのです。 何日かすべてがInternet archiveに残っていますので、一括ダウンロードができないかって思ったのです。 いくつかの一括ダウンロードソフトで試みたのですが最初のページだけしかダウンロードしてくれません。 設定のコツみたいなものがあるのでしょうか? ぐぐったらwarrickってparlプログラムを使う方法もありそうですがちょっと簡単ではないみたいで、これを試みてみましたが どうもうまくいかない状況です。 ちまちま落としていくにはちょっとページが多すぎるのです。 まずは、一括ダウンロードだけでもしたいと思っています。
178 :
98 :2009/04/27(月) 20:13:23
>>177 へえーへえーへえー warrick って面白そう。
ただ生憎動かせる環境が無いなあ。
一括ダウンローダで最初のページしか持ち帰らないのは
ダウンローダの選定/設定ミス (リンク先を自動追跡していない) でなければ、
「最初のページ」 の URL が不適切。
>>156 のような再現されたページからスタートしても、
そこで使っている画像ですら 404 で、 他には何も持ち帰れない。
>>176 >>173 >>157 のようにワイルドカード (*) を与えて、
Wayback Machine が持っているファイルの一覧からスタートする必要がある。
ダウンローダを iria とか irvineとかWeBOXとか使ったがうまくできなかったので 結局、warrickで行くことにした。 なんとか、WindowsXP環境にアクティブパールやSOAP-Lite等をセットできて 動作した。すごく動かすまでに時間はかかってしまいましたが。 まあ、どのディレクトリーになにを置くのかがポイント。メッセージを 見たらわかるだろって突っ込まれそうですが。 うまく動作してくれて目的は達成できました。いろいろありがとうございました。
スクリプトOFF民族としては今の仕様は糞。
K-12 Web Archiving Program!ってなんだろ
warrickがGUIになればいいのに
中卒でもあれくらい読めるだろw小卒でも読めるはずだw
つまり
>>181 は幼卒か教育を受けていない
185 :
98 :2009/05/01(金) 23:10:06
186 :
名無しさん@お腹いっぱい。 :2009/05/24(日) 09:30:18
>>162 データ収集はしているが、掲載を停止しているということ?
それとも収集自体やめてしまった?
>>186 自己レス。Wayback Machine Forumを見てたら、
Wayback Stopped Archiving?という質問に対して次の回答
Poster: gojomo Date: May 22, 2009 03:00:08pm
Forum: web Subject: Re: Wayback Stopped Archiving?
It always takes at least 6 months, and sometimes about a year, for collected web material
to become part of the public Wayback Machine collection.
After some recent changes to the Wayback Machine architecture, and the migration of all data
to a new datacenter, we'll be catching up through all 2008 in the next month or so.
- Gordon @ IA
全データを新しいデータセンターに移していて、6月か7月ぐらいには2008年分までは作業が終わるということか。
久しぶりに昔のお気に入りサイトに行ったら閉鎖してて
なんとかしてみたいと思ってInternet Archiveを使ったのですが…
『このホームページはJavaScriptを使っています。
ブラウザの設定でJavaScriptを有効に設定してから
アクセスしてください。』
とか出ちゃいました
JavaScriptは有効にしてるのにみれないから、これはなんかもう駄目ってことなんでしょうか?
このHPなんですけど
ttp://cocoaroom.kir.jp/
ら抜きやめろあきらめろ
やっぱり駄目なんですかー ありがとうございました
?
194 :
名無しさん@お腹いっぱい。 :2009/09/24(木) 00:53:17
メンテナンスを再開したみたいだな
そうだな
またメンテ
Internet Archive
メンテ再開
199 :
名無しさん@お腹いっぱい。 :2009/10/24(土) 00:12:59
ー-= 、 ,,...、 /:;:::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::ヽ ,::-'' ̄`:Y,,,、Y::::::::::::::::::∧:::::::i;:::::::::::::::i;::::::::::::::::::::::::::\ / ...:::::::::i" Y:::/::::::::::::/ ヽ;::::iヽ;;:::::::::::!;::::::::::i::::::::..i, '; .i ..:;::::::::;;;/ `'='":/:::::::;i::::/ ヽ:::!,ヽ;;:::::::::::i;:::::::::|;::::::::|:::::::!, .|::::;i:::::;// |::::::!:::::::;/::/ ヽ;::i \;;::::::!ヽ;:::::|;;:::::::|::::::::| . i;:;|::;/ ! |::::::|::::::;/!::i ヽ:!, \;:::::|ヽ:::::|!;;::::::|:::::::| \/ ' !:::::;|::::;/ |:| ヽ! ヽ;::| ヽ::| 'i;:::::|:::::::| |::i::;;!;;:::i `|!' -ー ,,_ '!, _,,>::!-'!:|´ |::::|::::::| ノ1;;!;!;;;;! ! ,-'',´o::,` ` `=''o:',ヽ、! i:::i:::;::| |/`!r-!, ./ i::::::::::::i i:::::::::::i. `, !::i;;;;i;:| ' | `)i ' ヽニノ ヽニノ ! /|!`i/V ヽ `,} .::::::::.. .::::::.. !) / ,,、 `Ti :::::::: ' :::::::::: i,,=i7 ヽ ヽ Vヽ イ/ ' `, `, `_へ.、 rニュ _,. t7 " ageます。 i ヽ ,-i':ヽ`''"ニi-ー .,,,,,,,. -t'´''''フ⌒iヽ ,./-´`'r-ー、r-' ヽ: ヾ´ ' ' `=/: :/ `、 ! - '''ヽ=- } ヽ:.ヽ /: :/ 'ヽ } -'''`Y |ヽ `:、`-ー、 ,.-': :/ _,,イ >、-t-´` .イ: :'! \ `''+; ;'i ./: :/ _,.-'''´ /: :i .|:.iゝ、 /i|: : :'!, `' ----┴-!--'ー-- ´ i /: : : | |: Y |ノ:i: : : :! /⌒'- .,,/''ヽ| /: : : : :.!
200 :
名無しさん@お腹いっぱい。 :2009/10/28(水) 18:03:41
Internet Archiveってrobot.txtが効いてても公開されないだけで保存されるんでしょ? robot.txt実行してもそのサイト自体404になったら公開されるんだろうか…?
2008年6月以降のログって無いの?
203 :
名無しさん@お腹いっぱい。 :2009/11/29(日) 20:28:21
>>202 アーカイブはしているが参照できるようには整理していないということでは。
Internet archiveを携帯で見れるブラウザサービスって「ぐるっぽ」以外にあるでしょうか。 ファイルシークなどだとページは見れますが、リンクを飛ぶたびいちいちnot found や404になってしまいます また、imodeなどのフルブラウザ機能で上のような不具合なく閲覧可能なものはあるでしょうか nternet archive、のスレ検索で出てきたのがここだけなので聞いてみますが、スレチでしたら申し訳ない
iPhoneの一台や二台買えよ
別に二台は要らんだろ
207 :
204 :2010/01/18(月) 23:42:50
>>205 iphone(というよりipod touch)買おうかなと思ってたので参考になりました。
あと自分で調べたんですが携帯用のYahooのブラウザだと表示可のようです。
読み込みにものすごい時間かかったりエラー表示がたまにでたりしますが。
touchの購入も視野に入れて見やすいブラウザ探していこうと思います。
年明けてからなんかやけに重くなったな。 やたらとエラー頻発するし・・・ 今日なんかどのページを参照しても「Failed Connection」しか出てこない。一体どうなってんだ。
たしかに重い。なんとかしてくれ。
210 :
名無しさん@お腹いっぱい。 :2010/02/22(月) 15:00:44
とにかく2008年分はメンテしてくれ
211 :
名無しさん@お腹いっぱい。 :2010/02/28(日) 01:38:44
重いどころか、落ちてるじゃねーかorz
一応保守
削除依頼ってwayback2@archive.orgかinfo@archive.org宛てであってる? 一ヶ月前両方に送ったのに音沙汰なし。もう一回送った方がいいのかな。
めちゃくちゃ重いのですが
robots.txtでアーカイブ表示させないようにしてても たまに普通に見られることがある(ブラウザにキャッシュが残ってるわけじゃない) リロードするとまた表示できなくなるけどこれじゃ意味ないな
218 :
名無しさん@お腹いっぱい。 :2010/05/06(木) 21:57:07
メンテ促進祈願
219 :
名無しさん@お腹いっぱい。 :2010/06/12(土) 12:57:01
>>Poster: gojomo Date: June 10, 2010 04:06:21pm >>Forum: web Subject: Re: why not visible ?? >>Material archived in 2009 and 2010 (and even a little from the very end of 2008) has been saved >> but not yet indexed for display in the Wayback Machine. That indexing is being held up by software >>and systems changes still in progress, but material from these dates will become available sometime >>in the next few months.
ポスター: gojomo日付: 2010年6月10日、04:、午後6時21分フォーラム: ウェブSubject: Re: 目に見えないなぜ? 2009年と2010年(そして、2008年の最後の最後からの少しさえ)に格納された材料は、救われますが、Wayback Machineでの表示のためにまだ索引をつけられていません。 そのインデックスはまだ進行中のソフトウェアとシステム変化によって上げられていますが、これらの日付からの材料はいつかこの数カ月で利用可能になるでしょう。
Internet archive で削除なんて不必要だと考えるんだが、どうでしょうね。 一旦、発行した書籍、雑誌は世の中に永遠に残ってしまうのに、 インターネット情報は残らないから、こういう場所を作ったのに、 それを消せる機能を持っているというのはなんか違う気がする。
2000年から細々と身内しか見てないようなサイトやってて 数年後にロボット避け置くようにしたんだけど、それ以前のページも一切保存されてない。 やっぱりカウントの少ない無人島みたいなサイトは取得されないこともある? 10年前のページが今後公開されるなんてことはないよね。
223 :
名無しさん@お腹いっぱい。 :2010/07/03(土) 12:41:36
糞重い cgiroom.nuのアーカイブ見れない
Index Metadata Errorって出るページは絶対見れないの?
226 :
名無しさん@お腹いっぱい。 :2010/07/13(火) 17:53:14
227 :
226 :2010/07/13(火) 18:13:02
FAQ見る限りでは今後見れるようになる可能性もあるっぽいな
niftyのプロバ鯖ってデフォルトでアーカイブ避けしてあるんだな 何も知らずに使ってた
jcomもなー
基準がわからんな
[ご挨拶] 平素は、Infoseek をご利用いただきまして誠にありがとうございます。 インフォシークでは、2001年より、無料ホームページサービス「インフォシーク iswebライト」、および有料の「インフォシーク iswebライト 広告非表示オプション」を提供してまいりました。 しかしながら、昨今のインターネット環境の変化を受け、弊社内にて慎重に検討を重ねた結果、誠に勝手ではございますが、サービスを終了させていただくこととなりました。 「インフォシーク iswebライト」、および「インフォシーク iswebライト 広告非表示オプション」を長年ご愛顧いただいた皆さまに、ご迷惑をおかけすることを深くお詫びします。 [サービス終了概要] ■ サービス終了予定日 2010年10月31日(日) (11月1日に終了作業を行います) ■ 終了対象サービス インフォシーク iswebライト (無料サービス) インフォシーク iswebライト 広告非表示オプション (有料サービス) ※インフォシーク iswebベーシック (有料サービス)は今後もサービスを継続します
■ ホームページデータの移行について
「インフォシーク iswebベーシック」(有料)にて、ホームページを継続される場合は、専用の移行ツールの提供を予定しております。
※お詫び:移行ツールは8月下旬の提供を予定しておりましたが、9月上旬に延期させていただきました。
提供延期となりましたことを深くお詫びします。
※ データ移行に関する方法やサービス利用料につきましてはこちらをご確認ください
※ ツール提供前に、広告非表示オプションの契約期限を向かえる方はこちらからお問い合わせください。
■ なぜホームページサービスを終了するのか
「インフォシーク iswebライト」のサービス開始当初におきましては、ホームページスペース提供サービスがインターネットにおける情報発信ツールとして大きな役割を担ってまいりました。
しかしながら、インターネットの発展に伴い情報発信ツールも多様な進化を遂げており、無料のホームページスペース提供サービスとして運営してきた「インフォシーク iswebライト」は当初の役割を終えたものと判断いたしました。
長年に渡ります皆さまのご愛顧に深く感謝しております。
皆さまにはホームページ移行等で、お手数をおかけいたしますが、前述状況を踏まえたサービス終了でありますことを、何とぞご理解いただき、ご了承くださいますようお願い申し上げます。
ご利用いただき誠にありがとうございました。
※サービス終了、データ移行についてのお問い合わせはこちらより受け付けております。
お問い合わせの際には、ご自身のiswebID(又はURL)のご記入を必ず、お願い申し上げます。
最終更新日 2010.09.01 17:08:53
インフォシーク iswebライト 終了のお知らせ - インフォシーク ユーザサポートからのお知らせ - 楽天ブログ(Blog)
http://plaza.rakuten.co.jp/usersupport/diary/201008250000/
237 :
名無しさん@お腹いっぱい。 :2010/09/08(水) 02:22:49
ファイルがあるように見せかけて Server Error-wbcgiやFailed Connection.とか舐めてんのか
238 :
◆xs.m./NkkNFp :2010/09/09(木) 10:01:22
ブラウザ変えろカス
なんだブラウザは影響なかったのか 火狐だと若干エラーが多い気がしててな スマソ
Firefoxは最近昔のHTTPの接続数を無視した数の接続をするようになったから 関係ないとは言い切れない。
>>233 >>Poster: gojomo Date: July 06, 2010 02:53:07pm
>>Forum: web Subject: Re: Wayback Machine - Showing results for popular pages for 2010 but not 2009?
>>There was a very small index update last week. A result of this update is that some very-recent (as late as June
>> 2010) content is now available, even as most content from the last 24 months awaits a bulk update.
>>The relevant FAQ items (and small note atop each date-results page) have been updated to reflect
>>that this may sometimes happen.
>>- Gordon @ IA
infoseek乙したのに全然残ってねぇな
うおおおん・・・ 何年も更新がないけど頻繁に見に行ってた小説サイトが急に消えて約4ヶ月、 移転前のURLを辿ったらいくつかの話が拾えて嬉しい・・・ 一番好きだった話がNot in Archiveだったのは少し悲しいけど、それでも超嬉しい。 音沙汰がないけど気に入ってるサイトは、面倒くさがらずにこっそり保存しておこうと改めて思った。
何度やってもServer Error-wbcgiがでるなぁ(´・ω・`)
>>244 その気持ち分るw
魚拓でもいんだけどね
246 :
マグナ ◆i.K3ZM.pZo :2010/11/26(金) 15:36:17
インターネットアーカイヴはURLが分かる場合には有用だが分からない場合、つまり消えたサイトにあった文章等で覚えている場合はどうすればいいのだ?w
それが一番困るよねw ググっても出てこないし自分の場合、見たいサイトのリンク貼ってあるサイトを探してそこから一つずつ辿ったりしてるけど ところで最近サイト重いよね
これ簡単にアドレス入力してくれるFirefoxのアドオンってありますかね?
>>251 とりあえずこのスレの範疇にある質問では無い事はわかった
せめて正確なタイトルわかんない?もしわかれば俺はもう少し探してみる
>>251 あとこっちから質問したいんだけど、以前他のスレで同じ質問した事無い?
なんか昔に同じような記事の探し手伝いした覚えがある
マルチポストとかでツッコむ気は毛頭無いし(むしろ時効だろうしw)、ただ自分の記憶が正しいか知りたいだけなんだ
ぜひ頼む
ここに保存してあるHPの全階層を楽に保存する方法ありますか。 HP保存のフリーソフトで保存できるのでしょうか。
257 :
名無しさん@お腹いっぱい。 :2011/01/26(水) 18:13:30
>>256 そりゃあ出来るが時間かかる
頑張りましょう
258 :
98 :2011/01/28(金) 02:47:02
260 :
98 :2011/02/03(木) 00:33:54
261 :
98 :2011/02/03(木) 00:46:47
262 :
98 :2011/02/06(日) 01:12:05
この頃重すぎない?
確かに重い URL叩いてから具が出てくるまでえらい待たされる
何かインターフェースが変わったw まだβみたいだけど見づらくない?w
糞見づらくなったな
βのテストとかしてるのか分からんがエラーばっか出る・・・
質問です。
現在使用中ブログ(FC2ブログ)のアーカイブ削除依頼したいのですが、
FC2ブログなのでrobots.txtをルートディレクトリに置けないようなので
直接
[email protected] に削除依頼しようと思うのですが
やはり本人確認の要求があるのでしょうか?
本人確認の条件はどの程度の要求なのかも気になります
(住所や名前まで提示しなければならないのかなど)
それとも本人確認なしで削除依頼がすんなり通るのでしょうか?
やったことないから分らんw でも普通そんな情報まで提示しなくてもいいと思うけどな
この前よりかなり見やすくなった感じ 普通のだと不具合なのかエラーで見れなくてもβだと見れるみたい
水色の丸印で日にちは分りやすくなったけど更新された日の*印の代わりがまだないね
>>256 Firefoxのスクラップブックってアドオンで掘り下げ階層選んで保存できるぞ
502 Bad Gatewayとでるね
277 :
名無しさん@お腹いっぱい。 :2011/03/15(火) 13:38:45.70
ここ数か月の間に閉鎖したブログをいくつか読もうと
>>1 のアーカイブ(Wayback Machine Advanced Search)から検索してもほとんど出てきません。
ヒットしても09年のものまでしかみれないのですが、10年以降のキャッシュは見れないのでしょうか。
10年以降は出てこないよね というか09年もあんまり・・・ あとβテスト番の方が今は検出しやすくなってる感じはする
ベータになってから重いわこればっかり出るわで散々だ This URL has been excluded from the Wayback Machine. 前は見られてたのに・・・
>>279 クラッシック使えよw
なんかアイコンがごみ箱になった
よくみたら神殿だった・・・
283 :
98 :2011/04/03(日) 20:49:02.94
本家も糞使いにくいベータのUIになっちまった
同じページにあるリンクでも見られるのと”Hrm.”になって見られないのがあるのはどうしてでしょうか?
同じページからリンクされていても一部しかクロールされないのは良くある話
287 :
名無しさん@お腹いっぱい。 :2011/04/25(月) 08:37:13.32
さっきから全然繋がらないんだがどうよ
俺もたまに同じことある まだβだから色々とあるみたいだね
検索結果のカレンダー表示も却って見づらい。元に戻すか、せめてClassicも並存してくれ。
今まで見れた奴が見れなくなってる うがあああああああああああああああああ
www.red-jp.com/ten/chada0.htm を見ようとしたら Data Retrieval Failureって出てきたんだけど これって日を改めれば見れるかも知れないの?
293 :
98 :2011/05/11(水) 21:22:15.54
ベータが何のことか分からないけど 目的のページは見れたよ ありがとう
うーん、Niftyのサイト見れんなぁ 2005年付近の音楽サイトなんだけど、当時からブロックしてたんだっけ?
新バージョンになってから接続が早くなった希ガス
298 :
名無しさん@お腹いっぱい。 :2011/05/30(月) 14:50:36.45
全く見れない。 どうなってるの〜
んなこたぁない
300 :
名無しさん@お腹いっぱい。 :2011/05/30(月) 15:46:34.82
あらほんと さっきは全く見れなかったのに、今は見れる 失礼しました
Hrm. Wayback Machine doesn't have that page archived. It doesn't seem to be available on the live web, either. このメッセージが出たらもう一生そのページは見れないの? 半年か一年経てば見れそうなページって別のメッセージが出ますか?
一生か分らんが見れないみたいだね あと09年以降が表示されるのはいつなんだろ
303 :
名無しさん@お腹いっぱい。 :2011/06/19(日) 18:29:33.52
それは2日
キャッシュされたサイトのトップから入ると普通に読めるのに、途中から
直に入ると弾かれるページは、手動でURLを削る必要があるようだな
(途中の
ttp://を削ればOK )
面倒臭い…
あ、
>>307 はInternet Archiveのことね
オリジナルのファイルの日付が 取得出来なくなったような気がしますが(Downstair、iriaで確認) みなさんどうやって取得されてますか
>>310 どうもありがとうございます。ミラーが有ったんですね。
リニューアル後は2006年分がバッサリ抜け落ちてるようだが、 キャッシュサーバに何かあったのか?
>>312 > リニューアル後は2006年分がバッサリ抜け落ちてるようだが、
ほんと?
サイトによるね 全てのキャッシュサーバから抜け落ちたわけじゃなさそう
改悪
サーバーが応答しません、ファイルがありません、ロボット避け これらをどうにかする方法はないものか…
真っ当なサイトとしてやっていく限りは ロボット避けは仕方ないな。
真っ当なサイト(笑)
笑ったところでロボットは残るよ
先週くらいまで見れてたサイトのキャッシュ、今日見ようと思ったら We were unable to get the robots.txt document to display this page. The gateway to the live web is not available. Please try again later. ってなって見れない もう復活しないのかな…
Please try again later.
どのサイト見ても2009年から一切ログが無い。そんなものなのか
fuq
昔の方がいいなぁ こういう所はGoogleと一緒だ
Whoops! We can't read the archived file for this date. The captured content may be garbled, or we might not have the ability to display it. これは時間が経てば復活するのかな...
最近になってようやく2010年以降のログが出てきて安堵した
2009年頃のまったく出てこないページは諦めるしかないのですかねえ
アーカイブでJAVA使ったゲームを遊ぶのは無理?
wayback2、info、lennyの三つに削除依頼のメール送ったけど対応してくれる気配が無い・・・。 おまけにrobots置いたURLを送るフォームも404エラーだし。 削除依頼出した人、どれくらいで対応してもらえた?
331 :
330 :2011/10/07(金) 12:31:44.24
infoの方からメール来て削除してもらえた! 三週間くらい掛かったかな 削除してもらえてよかった
332 :
名無しさん@お腹いっぱい。 :2011/10/08(土) 18:28:24.30
今まで見れてたサイトのキャッシュ、今日見ようとすると・・・ Bummer. The machine that serves this file is down. We're working on it. The Wayback Machine is undergoing scheduled maintenance Friday through Sunday, October 7-9. Most services will be offline during that time. See our blog for more information. Would you like to try the previous or next date? なんじゃこりゃあ!
馬鹿ですか? 7-9日にメンテナンスってはっきり書いてるだろ
こいつ恥ずかしすぎるwww
見たいサイトのトップページは開けたけど そこからページ内の各コンテンツへ飛ぶのは無理だった これってやっぱどうやっても見れないもの?初歩的ですまん
336 :
名無しさん@お腹いっぱい。 :2011/10/09(日) 14:27:47.64
Internet Archiveってウェブ魚拓みたいにキャッシュ取得はできない?
まだ見れないけど日本時間だから?
338 :
名無しさん@お腹いっぱい。 :2011/10/10(月) 15:38:41.50
まだ見れないね
まだだね、遅いな
見れるな 見たいページは見れなかったがorz
341 :
名無しさん@お腹いっぱい。 :2011/10/11(火) 23:34:59.34
ヤフチャ出会い世代ユザル人気No.1部屋 【30↑気まぐれな女達(BGM)】 部屋主:oxxx_hikaru_xxxo 部屋主代理:llla_little_eijilll
342 :
名無しさん@お腹いっぱい。 :2011/10/12(水) 17:43:53.82
Got an HTTP 302 response at crawl time
レスポンス速くなって( ・∀・)イイ!!
>>342 勝手にリダイレクトされてた以前の仕様よりは評価できる。
うーん見れないのがあるわ
346 :
名無しさん@お腹いっぱい。 :2011/10/19(水) 09:33:40.28
/:::,. -―-、::ー-、::>一ァ /:::/,. -=ニ:: ̄::\::\―i:、 /:/::://::\::::::::\::::::,ヽ::::ヽ|、\ . /:::|, イ:'、::ヽ::::\::::::::Xヽ:|ヘ:::::ヘ\,ゝ l/|:::::|::::::!、::\ー`ー-,ィf示ハ:::::ヘ、,ハ く,.イl:::::斗┼‐` ー 弋炒 ',:::::ハ:::l::| |/,!ヘ::::::ヘ:| ,ィf心 !:::::::l::|::! //:| |ヘ::::::ヘ代t炒 ` ノ |:::::|:|_|リ ageます・・・! く/l:::L|、::`:ー-ゝ ‐'´ /イ/|:| ヽ |:!:,-、:::\f^ヽ:≧z. __ .. イハ: : リ| | l:|:{ ヽ:::;ム マミ、: : \ ム: : :∨ リ/\ ヽ,ム ∨ヘ : : \ /: /ヘ: : :ヘ ,.- 、 \ ヽ〉 ヽ \: : :\://ヘ: : :| ヽ、 \ | 〉 \ lヽ./^)、 : : |: : ! 丶、`¨ / ァ'´ /: : ヽr:| : ハ `) l ,.イ、ヾニ二7イ |.ィ ⊂二´.. _ __/ / ` ー-、_|/、__jニフ ヾー--='彡- ' /´:j:_}::::/一` `ーr'´ ,f-':j´:||`′ /ヾ二トr‐_Tj-トイ : l:!┐ /: : : : : : 丁´ : : /:/: ://: `\-、 /: : : : : : : / : : : /:/: ://: : : : : :ヽ:\ ,. -‐': : : : : : : :/ : _/::f: ://: : : : : : /ヽ7 ヽ: : : : : : : : : :|: : : :/:::::|: :!:|: : : : :/ \
348 :
名無しさん@お腹いっぱい。 :2011/10/22(土) 23:20:54.88
どのサイト見ても We were unable to get the robots.txt document to display this page. The gateway to the live web is not available. Please try again later. って出る…先週は普通に見れたのに
>>332 といい何で馬鹿ばっかり湧くんだ?
Please try again later.
この程度の短文も理解できないってどんな教育受けたんだ????
350 :
名無しさん@お腹いっぱい。 :2011/10/22(土) 23:32:12.76
だって半日待ってるけど出てこないし
1週間待っても出てこないなんてザラよね
メンテナンスは終わったはずなのにまだBUMMERが出てるんだが・・・ 待てばいつかは直るのか?
直るものは直るよ
この間画像が出なかったがしばらくしたら復活してたってこともあったから。
>>352 そんなのより、Welcome to Waybackのロード画面を省略して、
すぐにアーカイブにアクセス出来るアドオンのほうが欲しい。wikipediaみたいに。
355 :
名無しさん@お腹いっぱい。 :2011/10/27(木) 09:38:01.43
,.ィ ´  ̄ `` ヽ、 / `ヽ、_ _,. -- 、 / // 三- 、ー `ヽ / / / / / ヽ\ \ ヽ / / / / /// ヘ ヽヽヽ / / / /⌒レ /- 、/ // /i l i ハ ! i ヽ', / / / { ⌒〃ヽr=r <`メ、 // / l l l l l li / / / ヘ V // ヽ{:::;;pハ //メ ! l ! l | l | ! / / / / /ヽ、 ``′ ,.ィr//〃 l/l / / / / / / / / _(;ン' /〃 〃 l/ /// // / ヽ _ /ソ// / / ,. -‐- 、 _,.ノ \ >、 _,. '´^` } / / ヽ \ 7ヽ、`ー ´/ ,.イ! はぁ・・・誰かageないかな。。 /// ヽ ヽ i l lヽ く i | | //,.イ ヽ ヽ- l l l ∧ /〉ヽ,! /// i| ヽ ヽ=! l lヒー ' / ノ ト //// il l \ ヽ ヾ! Vヽ  ̄ / い / / // /! ! `ヽ、 L..ム、 i  ̄ ハ . / / // / ! ハ ` ー < > \iヽ ヽ / / //// l i ハ l 〉〈`ヽ、ヘ \
356 :
名無しさん@お腹いっぱい。 :2011/10/28(金) 09:39:54.78
何が?
すれち
スレチ…?
361 :
名無しさん@お腹いっぱい。 :2011/11/27(日) 18:15:41.05
web archiveまだ落ちたまま?
4時頃までは見れたんだが落ちてるね
363 :
名無しさん@お腹いっぱい。 :2011/12/31(土) 18:12:17.45
ここ、日本語でトラブル報告しても対応してくれるかな? 以前見られていたはずのサイトがまた見られなくなっているんだけど、 500エラーとか既知のバグとかが出て、何とかしてほしい。 クラシックの方はもう繋がらなくなっているみたいだし。 というかいまだにベータって表示があるのがなんか疑問。
364 :
名無しさん@お腹いっぱい。 :2011/12/31(土) 23:02:45.08
365 :
名無しさん@お腹いっぱい。 :2012/01/01(日) 01:10:30.37
HTTP Status 500 - -------------------------------------------------------------------------------- type Exception report message description The server encountered an internal error () that prevented it from fulfilling this request. exception java.lang.NullPointerException note The full stack trace of the root cause is available in the Apache Tomcat/6.0.24 logs. と出る。 多分、以前見れたはずのページ。 これはウェイバック側のバグってことでいいのかな? IEとFFの両方で同じ結果になるし。 気長に改善されるのを待つしかないか・・・
>>364 この手の奴で、ウェイバックで見つからない物が見つかるケースってあるのだろうか
Wayback Machineを使って好きだったサイトの画像をたくさん入手できた ありがとうWayback Machine ただまだ見れない画像もあるよorz これは諦めるしか無いのか…………
画像どころかSS置いてある場所すら見られん
月ごとの採取件数の棒グラフのリンクのURLの「/」が「\/」になってない?
>>371 おそらくバグだと思うが、JavaScript を切っているとそうなる。
374 :
名無しさん@お腹いっぱい。 :2012/01/26(木) 21:07:24.19
昨日まで見れたのに We were unable to get the robots.txt document to display this page. Our request Timed Out. と出て見れない・・・これってもう見れない?
すまんageてしまった
今、見れました。なんだったんだろう
>>321 >>348 >>374-376 そのメッセージが出るのは、
元サイトのドメイン (DNS の A レコード) がまだ存在しているのに
Wayback Machine から元サイトへ接続できない状態であると思われる。
回線が切れたり鯖が落ちる等の一時的エラーもありうるし、
DNS を消さないままサイトを畳んでしまうことも考えられる。
鯖と回線が復活するか、あるいは元サイトがドメインごと消失してくれれば
robots.txt で明示的に拒否されない限り
Wayback Machine で表示されるようになるはず。
378 :
名無しさん@お腹いっぱい。 :2012/02/29(水) 22:05:06.76
We were unable to get the robots.txt document to display this page. と表示されてかなりのサイトが閲覧できなくなってる、特に古いサイト。 数日前、10日前には確実に見れてたページも見れなくなってる。 同じような人いますか?
馬鹿なの?なんでしばらく様子みようとしないの?
はじめて昨日このサイトを使って見てたんだけど ちょうどまた今日見ようと思ったら見れなくなってた・・・ 自分だけかと思って色々試してたけどそういうわけじゃないんだな 今までこういう事なかったってこと? ついてねーなぁ
381 :
名無しさん@お腹いっぱい。 :2012/03/01(木) 02:12:16.52
復活してるっぽいです、自分が使い始めてから数年、古いサイトだけ 見れなくなる事態って無かったからかなり焦った。 でも念のため今のうちに保存保存
We were unable to get the robots.txt document to display this page. さっきまで見れてたページすら見れない・・・ 明日になったら見れますように
今まで見られていたサイトのサーバが落ちてしまう。 ↓ 急に見られなくなったのに気付き、Wayback Machineに残ってないかと見に行く。 ↓ Wayback Machineもキャッシュを表示する前に 元サイトのrobots.txtのチェックを行おうとする. ↓ ところが元サイトのサーバが落ちているため、当然の如く接続エラーとなる。 ↓ そこで、Wayback Machineは「We were unable to get the robots.txt」を表示。 ↓ このスレにやってくる。 この繰り返しなのねん。
接続エラー記念カキコ
385 :
名無しさん@お腹いっぱい。 :2012/03/15(木) 17:17:14.37
ここ1時間くらい落ちてるな
長いなぁ
387 :
名無しさん@お腹いっぱい。 :2012/03/26(月) 18:48:34.87
warrickが復活してるみたいですが、使えてる人いますか?
「Google API Key」の取得で詰んだ
有効なwin32アプリケーションではありません
390 :
名無しさん@お腹いっぱい。 :2012/03/27(火) 23:05:04.66
あー、どのサイトのキャッシュも見れないな。数日待ってみるか。
ついさっきまで見れてたのにもうbummerとか、まじ勘弁。 どれ位で復旧するかな…。
392 :
名無しさん@お腹いっぱい。 :2012/03/29(木) 03:39:32.39
蓋のまとめ見ようと思ったけど見れたり見れなかったりorz
みんな見えないんだな。安心した。
394 :
名無しさん@お腹いっぱい。 :2012/03/31(土) 14:30:45.58
お、見れるぞ
395 :
名無しさん@お腹いっぱい。 :2012/04/20(金) 00:17:56.21
list.cgi のものを見るのは無理なんでしょうか?
ゆとり?
だーめだwarrick2を使いこなせる気がしない
399 :
名無しさん@お腹いっぱい。 :2012/06/01(金) 15:20:04.52
こんなサイトがあるともっと早く知ってたらブクマ整理なんかしなかったのに・・・ URLわからなくて使えねええええ
401 :
名無しさん@お腹いっぱい。 :2012/06/17(日) 19:19:33.28
402 :
名無しさん@お腹いっぱい。 :2012/07/29(日) 21:19:44.00
>>402 現在の Wayback Machine は保有しているキャッシュのエンコードを自動的に判定して、
全て UTF-8 に変換して出力しようとする。
だから判定を間違えると記号の羅列になってしまう。
アレキサンドリアのミラーサイトの方は
まだそういう機能が実装されていないから大丈夫なはず。
今試してみたら "Failed Connection" って返されたけど……
404 :
名無しさん@お腹いっぱい。 :2012/07/30(月) 18:56:18.35
>>403 さん
つまり、UTF-8への変換を失敗して出力をしているからコチラのブラウザのエンコードを
いくら変更しても見れないということでいいのでしょう?
あとアレキサンドリアとはなんでしょうか?
これって終了してホームページサービスの場合、見れるものとそうでないものがあるのかな
407 :
402 :2012/08/01(水) 21:27:42.22
>>405 さんありがとうございます。
見れないページもいくつかありましたが、何とか見れました。
本家のサイトだとやっぱり壊されちゃうんですねぇ・・・
本家のサイトで見れる方法はないですか?
そちらだと見れないところもみれるのですが。
10年ぶりにネット本格復帰、でもHP全滅で友人と連絡がとれない・・ とりあえず分かっている人のアドレスをweb.archiveにかけ、 ありとあらゆるリンクを辿り、数日かけてやっとアドレス判明したのに、 Hrm. Wayback Machine doesn't have that page archived. 完全にオワタ。
そういう場合HPやメールアドレスどころかプロパイダ自体解約してる可能性アリの罠
友人のほとんどが当時20歳前後。 現実が忙しくなり、充実し、自然とネットやパソコンから距離を置くようになる。 それが普通。 戻ってきてしまった俺は普通にすらなれなかった・・・自業自得だよね。 ネットにも現実にも居場所が残ってなかった。もう生きてるのが恥ずかしいし辛い。
411 :
名無しさん@お腹いっぱい。 :2012/08/30(木) 09:39:01.83
そういうスレじゃねえからw
馬鹿だなあ。ネットや現実に居場所なんてのはもともとないよw 10年前に縛られてるだけだろw
懐古に浸ったらそこで終わりだ 先を見ろ チラシ カイコに浸ったらそこで終わりだ って真っ先に変換されたw
10年もネット断ちってどこの仙人様だよ 今更山から下りてくるなよw
Googleの画像検索でも表示されるようにはできないのかな? ページ削除されると見られなくなるんだよねorz
使えない。鯖落ち?
一週間ぐらい前に見れてたページが見れなくなってたり 同じサイト内でも見れるページと見れないページがあるんだけど 見れないページは時間経ったらまた見れるように可能性ある?
>>419 可能性は”ある”よ
____________
ヾミ || || || || || || || ,l,,l,,l 川〃彡|
V~~''-山┴''''""~ ヾニニ彡| ある・・・・・・!
/ 二ー―''二 ヾニニ┤ あるが・・・
<'-.,  ̄ ̄ _,,,..-‐、 〉ニニ| 今回 まだ その時と絶対的URLの
/"''-ニ,‐l l`__ニ-‐'''""` /ニ二| 指定まではしていない
| ===、! `=====、 l =lべ=|
. | `ー゚‐'/ `ー‐゚―' l.=lへ|~| そのことを
|`ー‐/ `ー―― H<,〉|=| どうか諸君らも
| / 、 l|__ノー| 思い出していただきたい
. | /`ー ~ ′ \ .|ヾ.ニ|ヽ
|l 下王l王l王l王lヲ| | ヾ_,| \ つまり・・・・
. | ≡ | `l \__ Internet Archiveがその気になれば
!、 _,,..-'′ /l | ~''' キャッシュアーカイブの再公開は
‐''" ̄| `iー-..,,,_,,,,,....-‐'''" / | | 10年後 20年後ということも
-―| |\ / | | 可能だろう・・・・・・・・・・ということ・・・・!
| | \ / | |
422 :
名無しさん@お腹いっぱい。 :2012/10/21(日) 10:44:32.01
Bummer. The machine that serves this file is down. We're working on it. The machine that serves this file is down. We're working on it. Would you like to try the previous date? とでていままで見れていたページが見れなくなってしまったのですが、これはサバ落ちかなにかでしょうか? またこのひとつ前のArchiveは普通に見れるのですがこれもいずれ見えなくなってしまうのでしょうか?
>>422 経験から言うと、その "the machine that serves this file" は忘れた頃に復帰します。
うちもよく見るデータがbummerで困ったが、しばらくはエジプトのミラーで食いつなぐしか無いべ。 こっちも落ちなきゃいいけど
426 :
名無しさん@お腹いっぱい。 :2012/10/29(月) 15:03:47.72
> Facebookは写真とムービーだけで100ペタバイト こっち驚いた。
2011年と2012年のが見れない 2010年以降は保存してないのかな?
>>428 保存してるよ。
巡回が遅いか、公開スパンが長いだけじゃないか?
>>429 そうなんだ
なんかググると保存量が10ペタバイト超えたとかあって
運営行き詰って2010年以降は保存諦めたんじゃ、とか思ってしまった
今のHDD最大容量でも4テラ そう考えると10ペタって10000テラだから恐ろしいな…
繋がり易い時間帯はあるのかね 日本時間で ネット社会は、日の沈まない国みたいなものだから いつでも地球上の誰かがアクセスしている訳だけど
今までWebアーカイブのサイトで2年ぐらい前の分まで見れたのに、急に Page cannot be crawled or displayed due to robots.txt. って出て全く見れなくなったんだけど、既にロボットが集めたページを遡って消すことができるの? それとも、時間をおいてアクセスすれば見れるようになるのかな。
俺も同じケースに遭遇したよ 確か閲覧する時点で目的のサイトにrobots.txt置いてたらそれに従うルールだったような 一番ひどかったのはドメインパーキングがrobots.txt置きやがったケースww
ロボットテキストを置けば、自分のサイトでも見られないようにできるってことか。 >一番ひどかったのはドメインパーキングがrobots.txt置きやがったケース これってどういうこと? 解説プリーズ。
437 :
435 :2012/12/08(土) 23:56:07.34
>>436 ごめん、ちょっとわかりにくかったか
あるサイトのドメインが期限切れになって業者に取られちゃって
アクセスすると業者のサイトが表示されるようになったんだけど
サイトが生きていた頃にはなかったrobots.txtが業者のサイトで置かれていたために
archive.orgから消されちゃったって経緯
ttp://archive.org/web/web.php Server error 502 -- probably because our servers are overloaded right now.
Please retry either now or later (by hitting refresh/reload).
あーん!
鯖様が死んだ!
440 :
438 :2012/12/19(水) 14:00:34.37
コンテンツの置いてある鯖が落ちてるのはしょっちゅうだけど 入り口が落ちてるのは久々に見た
今年もお世話になります がんばれ
442 :
名無しさん@お腹いっぱい。 :2013/01/11(金) 14:09:06.14
webarchiveのログが一部消えてるサイトがあるんだけど… 何が原因?
エスパーさんいますかー?
急に404になったページがあるのですが、隠しページのアーカイブから辿っていくとしっかり見れます。 また普通に見れるようになるのでしょうか?
Additionally, a 404 Not Found error was encountered while trying to use an ErrorDocument to handle the request. こんなのがでて404でした
どうも新しいの記録が404になって古いものなら見れるようです 最新バージョンでも見れるのかもしれませんが古いガラケーからなのでPCサイトビューワーで見る際に古いバージョンのlatestでみるとすぐ見れました。 新しいものはshowALLのような画面になるのでPCからなら見れる気がするのですが・・・
449 :
名無しさん@お腹いっぱい。 :2013/01/27(日) 18:47:38.56
閉鎖されたサイトをみたいんだけど一部だけ見れて他の所がみれないんだ そこにアップロードされていたファイルは見ることはできないの? 小説サイトなんだけどさ、肝心の小説がみれない
OperaでInternet Archiveのページに行ったらこんなのが出たんだけど… フィッシング警告 このサイトは不正なサイトとして報告されています。 このサイトで重要な情報や個人の秘密情報を送受信すると、 個人情報の盗難や金融詐欺のリスクにさらされる危険性があります。 Opera Software は、このページにアクセスしないことを強くお勧めします。
そりゃ異なるドメインへの転送サービスだしフィッシング警告出るのは当然でしょ 自分でweb.archiveだけ解除すりゃいいんじゃね?
う〜ん最近よくBummerが出るなあ サーバーがメンテ?落ちてる?んだっけ?
>>454 昨日はBummerどころか一定時間繋がらなくなった
Bummerが出たときは
>>447 のさらに古いバージョンでしのいでるけど
古いやつだと表示されない画像があったりするんだよなあ
これってピクシブや萌えjpみたいなサイトにはやっぱり使えんのかね
458 :
419 :2013/04/26(金) 06:51:05.99
ふと思い出したんで久々にブックマークしといた見れなかったページ群行ってみたら 3分の1ぐらいが見れるようになってたわ 嬉しい
459 :
名無しさん@お腹いっぱい。 :2013/04/26(金) 22:17:02.89
鯖落ち増えたなあ
黒歴史を消したい人用に報告。 10年前に閉鎖した自分のサイトが閲覧できるのに気付いて、 メールで削除依頼する際に自分が当時のサイト管理者だった証明として 「InternetArchiveにキャッシュされていない画像を自分は持っているYO」 ということで 1,InternetArchiveで非表示になっている画像があるページ(「×」表示) 2,そのページのソース(非表示画像の「○○.jpg」を強調) 3,PCに保存しておいたサイトフォルダのスクリーンショット(非表示画像を強調) 1,2,3の画像をまとめたファイルを添付して説明入れたら一発で対応してもらえたわヽ(´ー`)ノ
>>460 ナイスなtipsありがとう
他人のサイトもこれで消せばキャッシュ持ってる自分だけが独り占めだね
閉鎖→アーカイブで閲覧可→アーカイブで見られなくなる 1)robot.textの後置き 2)削除メール 3)アーカイブの容量圧縮のためデータ削除 の理由が考えられると思っておk? 1)ならドメイン削除後に復活の可能性が微レ存だけど、3)は根本から望みが絶たれるよねorz classicも使えなくなってるしオワタ
容量圧縮のためにせっかく保存しといたページを削除って このサービスの理念と矛盾してて意味なくないか?
だよな
>>462 にとってarchive.orgってその程度の存在なんだろう
このスレでも圧縮でlzh消えてる例はガイシュツですが?
日本でもこういうアーカイブサービス作ってほしい ウェブ魚拓とかで似たようなことできんかな?
Hrm.ってどういう意味? なんか日本の Orzに似てるなw
画像のアーカイブってできないんですかね? サイトが変わってアドレスが分からんw
画像も一部は通常通り保存されてるけど特化して画像を保存ってのは無いな 肖像権の問題も大きいんだと思う
ここって新劇エヴァ丸々とか動画のとこ探すとみつかるんだけど著作権的にどうなの
477 :
名無しさん@お腹いっぱい。 :2013/09/10(火) 13:12:34.43
なんかインターネットアーカイブの旧ver.でしか見つからないページもあるそうだけど、 旧ver.は今凍結されてるから確認できないじゃん…
ダウンロードソフト使ってまとめて保存するのって今はできなくなってる? 去年の今頃は普通に落とせてたと思うんだが・・・設定しだいではいけるのかな? 因みに、IriaとかDCさくらとかをよく使ってたと思う 誰かまとめて保存する良い方法教えてください
手作業とかスクリプト使うとかして URL リスト生成してから wget に食わせてる
ブログって見れないのかな 消えてたブログ見ようとしてURL入れたら The Wayback Machine does not have this URL. Here is the page from the Live Web. としか表示されない… そもそも向こうの方にページのデータがないのかな
中卒以下の方はお引き取りください
中卒ならその程度の英文読めるんだから中卒に失礼だ
484 :
名無しさん@お腹いっぱい。 :2013/09/25(水) 14:44:55.26
Q&A LOVE PHANTOM ZERO イチブ 太陽のKOMACHI ねがい ULTRASOUL
Firefoxだとなんかサイトによって表示されない
高校野球がどうたらってかいてるよ
>>486 operaで何ら問題無く表示されてますよ。
あほくさ
ここと似たようなサイトだと魚拓しかない?
クロール指示が出来るようになったのか
今更だったのか…
魚拓化して大手サイトのログは凄いことなってるけど 早晩この路線は破綻すると思う
財政上の懸念は別として、ここの場合は 集めることそのものが目的だからなぁ・・・
前回クロール時から変化のなかった重複ファイルもそのまま馬鹿正直に全部保存してるの?
すごいなあ
502 :
名無しさん@お腹いっぱい。 :2013/11/06(水) 22:48:58.10
メンテいつまで?
ツイには何も出てないけどどうやら復活した様子
504 :
名無しさん@お腹いっぱい。 :2013/11/18(月) 14:22:32.19
とあるトラブル解決のため、消されたHPのデータを可能な限り拾って紙媒体に保存する作業をしています。 キャプチャが一度しかされていない状態で404やHrm.を吐いてしまった場合、そのページは閲覧不可でしょうか? 本当に困っています。助けてください。
本当に困ってるんだったら こんなところで訊いていないで 元の作者に連絡を取るなどするべきかと
506 :
名無しさん@お腹いっぱい。 :2013/11/20(水) 04:17:53.44
Mozilla/5.0 (Windows NT 5.1; rv:25.0) Gecko/20100101 Firefox/25.0 AlexaToolbar/alxf-2.19 Mozilla/5.0 (Windows NT 6.1; rv:25.0) Gecko/20100101 Firefox/25.0 AlexaToolbar/alxf-2.19 Mozilla/5.0 (Windows NT 6.1; WOW64; rv:25.0) Gecko/20100101 Firefox/25.0 AlexaToolbar/alxf-2.19 User Agent The Wayback Machine
何それ?
>>509 > .co.kr
何か変な奴が来たと思ったらそういうことか。
リアルに日本語でおk
画像版アーカイブもあるといいんだけどな
>>513 どういう意味?
スクショを残しておいて欲しい、ということなら
archive.is か zoom.it あたりを使えば良い。
515 :
名無しさん@お腹いっぱい。 :2013/11/29(金) 18:29:09.50
>>509 >>511 죽도(竹島)는 일본입니다. 당신들은 나가라
516 :
515 :2013/11/29(金) 18:50:59.72
さて。
pixivや手ブロなんかもイラストごと保存できてたら神サイトなんだけどなあ
519 :
名無しさん@お腹いっぱい。 :2013/12/19(木) 01:13:37.04
520 :
名無しさん@お腹いっぱい。 :2013/12/26(木) 22:08:46.49
メンテ上げ
なんか最近Bomberだかなんだかのエラーが良く出てくる
あけおめ
重いなあ
/* userContent.css */ @-moz-document domain(archive.org) { div.web_carousel { display: none; } }
↑ 何が変わるの? .web_carousel ってどこに出てくるやつ?
526 :
名無しさん@お腹いっぱい。 :2014/01/19(日) 04:28:53.43
Internet Archive、自分が見たいサイトはHrm.ばっかで全然使い物にならないんだけれども 他に同じようなサイトはございませんでしょうか?
>>525 入口のぐるぐる回ってるやつが消えるだけ
なるほど
?
すいません Intenet Archive の書籍をPCでダウンロードするには、如何したらいいのでしょうか? 何処かにボタンでも有るのでしょうか? iPad の Book Down というアプリでダウンロードすると iBooks で見た時、数式が正常に表示できていない様に見えます 明らかに上付き下付きが動いていない様に見えます しかし、調べて見るとiBooks は、ePub の機能はフルに働く筈です 私は何か根本的に間違っているのでしょうか? すいません。何も分からない初心者です
?
> Intenet Archive の書籍 どんなものか見てみたい
534 :
名無しさん@お腹いっぱい。 :2014/02/03(月) 22:58:59.44
いちいち去年のレスを引っ張り出すなよ
ダウンしてね?
537 :
名無しさん@お腹いっぱい。 :2014/02/11(火) 13:12:26.88
538 :
名無しさん@お腹いっぱい。 :2014/02/11(火) 15:17:54.45
今まで見れてたアーカイブが、新しいサイト主になってrobots.txt置かれただけで過去のが全部見れなくなるって何なんですか! タヒねタヒねタヒね
そのパターンあるなあ。 「当時はInternet Archiveのことを把握してなかったよ!」 みたいなクレーム対策で全部適応できるようにしてるんだろうけど、 もうちょっとなんとかできないのかね。 (過去に遡ってのアーカイブ停止は自動ではなく、申請があった場合に限るとか)
540 :
538 :2014/02/11(火) 17:19:17.99
541 :
名無しさん@お腹いっぱい。 :2014/02/11(火) 17:52:05.80
543 :
名無しさん@お腹いっぱい。 :2014/02/11(火) 19:44:36.41
>>542 もしそのドメインが完全に消滅して、robots.txtも何も無くなったら、また見れるようになるんでしょうか?
昔のアーカイブは消さずに閉架化してるだけってことか。まあ当たり前だな。
546 :
名無しさん@お腹いっぱい。 :2014/02/13(木) 19:01:18.23
>>544 情報ありがと。助かる
>>541 のDM、風評被害対策会社みたいなんだけど、ここはドメイン保管みたいな事もやってるんだろうか?
547 :
名無しさん@お腹いっぱい。 :2014/02/21(金) 11:20:17.54
wayback machineは、セーブしたアーカイブを勝手に消されることが多くなった。 もう使えない。
有名になりすぎた ただそれだけ
549 :
名無しさん@お腹いっぱい。 :2014/02/21(金) 15:30:50.36
半角英字に全角空白を混ぜるような奴が文句を垂れるときは その本人の方に問題があるケースが多い
551 :
名無しさん@お腹いっぱい。 :2014/02/22(土) 12:32:00.75
553 :
名無しさん@お腹いっぱい。 :2014/02/22(土) 17:34:55.14
サーバーダウンしているみたいだが
メンテw
なおったか
556 :
名無しさん@お腹いっぱい。 :2014/02/24(月) 16:40:47.72
サーバーダウンしているみたいだが
入口が落ちてるっぽい
入口どころか全体が落ちてないか? 本当使えないサービスになっちまったな
まったくだな もう俺らはarchive.orgを一切使わないことにするわ
俺らって誰だよ
561 :
名無しさん@お腹いっぱい。 :2014/02/27(木) 16:22:56.46
スレ違いかもしれんが、peeep.usで記事のアーカイブが取れないよう、NHK側が何か仕掛けてるな
>>561 取り敢えずニュースページを見てみたけど、
コンテンツを他のサイトで使用させないようにするための在り来りの方法が使われてる。
アーカイブの呼出し後に次のブックマークレットを走らせてみそ。
javascript:void(document.body.style.display='block');
563 :
名無しさん@お腹いっぱい。 :2014/02/27(木) 17:40:04.43
>>563 > またはGoogle、Yahoo、BINGのキャッシュをpeeep.usやarchive.isで保存すればいいよ。
あー、そういう手があるのか(感心)
でもプロクシ介すとプロクシ自身が生成したという疑惑が残るから それが気になる用途には無理w
つまり魚拓サイト側がでっち上げをやらかすとか そういうことは絶対に起こらないってことか。 平和なことは良いことだ。
さて
誰か「幼なじみエンサイクロペディア」憶えてるやついない? 案外残ってないもんなんだな…
569 :
名無しさん@お腹いっぱい。 :2014/03/22(土) 10:13:32.17
ピント合ってない発言にもほどがある気が…
571 :
名無しさん@お腹いっぱい。 :2014/03/22(土) 15:26:26.21
>>569 インターネットアーカイブのファイルをarchive.isで魚拓しようとしたら、正常に魚拓が取れなかったのです。
User-agent: * Disallow: / そりゃそうだろう。
>>569 >>571 archive.is は robots.txt を読まない。
おまけに "Page cannot be crawled or displayed due to robots.txt." ってのは
Internet Archive のセリフ。
つまり、
archive.is の URL 入力欄に IA のアーカイブの URL を突っ込む。
↓
archive.is が IA にアクセスを仕掛ける。
↓
IA が元サイトの robots.txt を読みに行く。
↓
元サイトには全拒否の robots.txt が置いてあった。
↓
IA は archive.is に "Page cannot be crawled...."
というメッセージを返す.
↓
そのメッセージが archive.is に魚拓として残る。
そういうオチじゃないのか?
まさしくそういうオチだったのか…?
575 :
名無しさん@お腹いっぱい。 :2014/04/07(月) 16:40:31.39
スレチかもしれんが、NHKニュースがzoom.itをブロックしたようだな。アーカイブが取れなくなっている。
試してみたが、確かにプログレスバーが6割程度まで進んでそれっきり。
めんどいなあ
578 :
名無しさん@お腹いっぱい。 :2014/04/10(木) 06:48:54.44
>>575 >NHKニュースがzoom.itをブロックしたようだな。
ブロックした理由がわからん。
アレキサンドリアのミラーに繋がらん…
580 :
名無しさん@お腹いっぱい。 :2014/04/15(火) 16:54:17.33
582 :
名無しさん@お腹いっぱい。 :2014/04/15(火) 18:46:29.90
>>581 「続きを読む」以降の記事後半をキャッシュできていないぞ。
583 :
581 :2014/04/15(火) 19:03:00.42
584 :
名無しさん@お腹いっぱい。 :2014/04/15(火) 19:09:36.75
>>583 > うちの環境ではクリックすると続きが出てくるんだわ。
あー、すまん。読めた。
本当にすまん。
585 :
581 :2014/04/15(火) 19:18:50.68
ははは良かった良かった
はてさて
archive.is が archive.today へ移転。 旧ドメインにアクセスを掛けてもリダイレクトされます。
todayなんてできたのか
590 :
587 :2014/04/24(木) 17:31:08.83
>>589 .is ドメインの管理機関がソーシャルハッキングの攻撃を受けているため
archive.is を失いかねない状態にある、ってこと。
移転しないまま乗っ取られてしまうと、たとえ別の場所でドメイン立てても
ダメージは並じゃないからねぇ。
ほえー。
592 :
183 :2014/04/25(金) 16:47:03.11
相変わらずこのスレは中卒が居付いてるのか 5年前と何も変わっちゃいない
他人が言うのもなんだが名乗るほどの者じゃないな
良かった。中学生は書き込んでもいいんだね
Bummer. The machine that serves this file is down. We're working on it. さっさと直せド糞シロンボ
白とは限らんぞ
また数日前の魚拓が消えてるなぁ 同日に取ったものでも消えてないのがあったり意味不明だわ
>>598 ユーザ側の操作で取った魚拓は、永久保存となる前に
一度「整理」されているような気がしていたが・・・やっぱりそうか
魚拓?
取っても取っても消されるんで嫌になるな・・・ なんで毎日のように同じページ保存しなきゃならんのだ
強迫性精神疾患の自慢しなくていいから
もう6月か
605 :
名無しさん@お腹いっぱい。 :2014/06/02(月) 14:19:36.31
Page cannot be crawled or displayed due to robots.txt.が表示されるということは ドメイン管理者がrobots.txtを置く以外に原因はありえますか? 犯罪行為の立証のためにwayback machineを使っていたのですが、急に閲覧できなくなりました ドメイン管理者が情報秘匿の意思を持ってrobots.txtを置いたという認識でよいでしょうか
606 :
605 :2014/06/02(月) 14:45:47.79
連投失礼します robots.txtを置かれた場合でもアーカイブを閲覧する手段はありませんか?
>>605 robots.txtで見れないよーと言われている原因はrobots.txtが置かれたこと意外にありません
閲覧できなくなったのは残念なことですが
robots.txtを置いたこと=情報秘匿の意思がある、かどうかは確実ではありません
そもそもInternet Archiveが
サイトの持ち主の意思を無視してサイトのクローンを作るようなものですので
そのbot訪問を阻止したいと思うこと自体は普通にありえるからです
普通の閲覧者なら来てもらってもかまわないけど
botはファイルのコピーを取っていくbotが多いから一律botは来ないでほしいという場合も
robots.txtを使います
なのでrobots.txtが置かれたから秘匿意思があったと決め付けることはできません
robots.txtを置かれた場合Arhiveを閲覧する手段はありません
ただ、robots.txtを一度置かれてもその後管理者がrobots.txtを撤去したり
ドメイン失効などによってrobots.txtを読み込めない状態になると
また閲覧できるようになるかもしれません
608 :
605 :2014/06/02(月) 16:57:53.01
>>607 詳しいご説明をありがとうございます
ついでに私的な内容なのですが…
ドメイン情報を検索したところ管理者の個人情報(電話番号やメールアドレス)を知り得たのですが、
robots.txtを撤去するよう依頼するのは無謀だと思いますか…?
いつの間に robots.txt を置いただけで情報秘匿とか言われる世の中になってしまったんだ・・・
>>608 ネット上の問題の扱いに慣れてる弁護士に相談したら?
ドメイン管理者の連絡先が見つかったところで
「robots.txt撤去を要求」とか短絡しているようでは
どう考えても無理ぽ
611 :
605 :2014/06/02(月) 19:54:45.91
>>610 単に報酬目的でそのドメインを取得しているなら、トラブル解決に協力してもらいたい旨を説明しようかと思ったのですが、
もし情報秘匿を目的としているなら、こちらの動きを悟られてしまうなと
現段階では動きようがなさそうですね…ありがとうございます
612 :
名無しさん@お腹いっぱい。 :2014/06/02(月) 20:05:41.07
613 :
605 :2014/06/02(月) 20:42:26.14
>>612 拝見しました、なるほど…
私の検証していたサイトのドメインは2013年9月まで失効していたのですが、調べてみると2014年4月にアップデートされた記録があります
アーカイブ対策としてrobots.txtを置きにきた可能性もあるということですね
過去の記録として記者や弁護士に提示する矢先だったので、先手を講じなかったのが悔やまれます…
ありがとうございました
>>613 繰り返しになりますが、
あなたの言う犯人さんがアーカイブ対策としてrobots.txtを置いたという可能性も否定できませんが、
必ずしもそうではないかもしれないということを覚えておきましょう。
ドメイン管理者の電話番号やメールアドレスに連絡して
robots.txtを撤去するよう依頼するという件ですが、
(1)ドメイン販売業者に取得されている場合
無視される or 「売ってあげるよ!相場より高い値段で」とふっかけられる可能性がある
(2)あなたの言う犯人さんである場合
無視される or 無視された上で絶対にドメインを手放さないようになる
のどれかに転ぶと思います
どれに転ぶかわからない以上得策とは言えないのではないでしょうか?
あなたがそのドメイン管理者に下手に内情を話さないで
ただドメインを購入することができれば
一番簡単なんじゃないかと思うんですがいかがでしょうか?
あと、仮にドメイン購入に成功しrobots.txtの撤去に成功したとしても、
InternetArchiveに保存されているデータはオリジナルデータとは異なる無断転載ですので
犯罪行為の立証として使えるものか疑わしいような気がしますが
はてさて
平和だなあ
?
InternetArchiveに保存されているデータはオリジナルデータとは異なる無断転載ですので 犯罪行為の立証として使えるものか疑わしいような気がしますが
blogspotの成人向けコンテンツってインターネットアーカイブからは見れないの? 「理解し続行を希望します」を押してもただループするだけ。 昔気に入ってて今は消えてるサイトがあるんだけど、もう見れないと諦めるしかないのかな…。
あれは縦横 100% のインラインフレームでコンテンツを隠してるだけだから、 ブックマークレット書いて走らせれば見られるんじゃないかな。
621 :
620 :2014/07/05(土) 05:20:47.82
こんなのでどうだろう。多分 Internet Explorer では使えないです。 javascript:(function(){var%20a,b,c;if(a=document.getElementById('injected-iframe')) a.style.visibility='hidden';a=document.styleSheets;for(b=a.length-1;b>=0;b--) {if(!a[b].href){for(c=a[b].cssRules.length-1;c>=0;c--) {if(/body%20+\*/i.test(a[b].cssRules[c].selectorText) &&a[b].cssRules[c].style.visibility=='hidden')a[b].deleteRule(c);}}}})();
622 :
名無しさん@お腹いっぱい。 :2014/07/08(火) 03:31:19.59
623 :
620 :2014/07/08(火) 05:27:02.07
624 :
名無しさん@お腹いっぱい。 :2014/07/11(金) 07:48:56.68
Facebookのアーカイブ取るのってどうしてる?
ここだけの話 7月14日前後に仕様変更が行われたので文字コードがx-sjisのサイトは全て文字化けになります。
>>625 HTTP のレスポンスヘッダ (X-Archive-Guessed-Charset) を見る限りでは
x-sjis を Windows-1252 と判断してしまっているようですなぁ。
えええ
間違えてscのほうに書き込んでしまった 文字化け困ってる リロードすると正常表示されることもあるが…
629 :
名無しさん@お腹いっぱい。 :2014/07/26(土) 15:41:35.89
手動でアーカイブ取れなくなってる
imgurがIA対策を入れてきたっぽい?
っていうと?
お前らが笑った画像スレに同じ画像を何度も持ってくる奴がいるから 日付のメモ代わりにこれで画像をロードしていたところ、 imgurはこれ経由の画像へのアクセスを画像を内包した HTMLのページへ飛ばすような改変をしてきて そこが無限ループになって画像が出ない。
今は画像へ普通にアクセスできるらしい。
一時的なものだったってことかな
636 :
名無しさん@お腹いっぱい。 :2014/08/03(日) 15:03:14.14
2年前には普通にアーカイブで文字化けを エンコード変換すれば見れていたページが 今ではどの日本語のエンコードをしても文字化けがなおらなくなりました。 (そのページはもともとシフトJIS指定でした) この2年ほどでアーカイブの仕様が変わったのでしょうか? また、どうすれば日本語で見れるようになるでしょうか。 昔保存していたHDDが壊れてしまったので、 アーカイブだけが頼りになってしまいました。 ご存じの方、どうぞよろしくお願いいたしますm(__)m
637 :
名無しさん@お腹いっぱい。 :2014/08/03(日) 15:22:25.40
すいません、すぐ上の
>>625 さんの懸案事項だったみたいですね。
ホンの半月ほどのタッチの差だったのですか…。
今のところ、シフトJISのものを読む手だてはないのでしょうか?
タッチ?
archive.todayがLoading...のままで一向に繋がらない・・・ この時間にメンテか何かやってるのかな?15時は普通に繋がったんだけどなあ
640 :
名無しさん@お腹いっぱい。 :2014/08/06(水) 05:24:24.41
zoom.itがサービス終了らしい。
Zoom.it is being discontinued, but the technology behind the site is
continuing forward.
Seadragon technology will continue forward as the Deep Zoom feature
in Silverlight, a shining example of Silverlight's ability to "light
up the web".
In addition, there are two Open Source projects that continue to
improve this technology. The first is OpenSeadragon which was
created by members of the original Seadragon team, as well as
Seadragon Ajax which was the original project from Microsoft's Live
Labs group.
The timeline for the end of service is as follows:
August 15th, All uploads will be suspended and on September 15th,
all image hosting will cease and the service terminated.
We apologize for any issues that this might cause.
http://zoom.it/
641 :
名無しさん@お腹いっぱい。 :2014/08/06(水) 05:26:51.84
zoom.itの代替ってどこがいいかねえ
642 :
名無しさん@お腹いっぱい。 :2014/08/09(土) 10:25:08.17
>>637 ページを保存してエンコード指定できるエディタ(EmEditorとか)でunicodeで開いてからwindows-1252で保存してsjisで開きなおすと
一部に文字化けは残るけれどなんとなく読めるようになる
こまったもんだね
7月中はリロード繰り返したら何とか見れたんだが、8月に入ってからは何度リロードしても文字化けしたままだ。
>>645 >>625 によるとx-sjisの文字コードは全て文字化けするみたい。
もしサイトの文字コードが上記なら何回リロードしても無理かも。
>>642 のやり方で試してみて。
ミラーなんてあったのか。
archive.orgまた503になってる・・・
Scheduledってあるけど
Internet Archiveは2バイトコードの処理にバグが多い?
非標準の文字セット名を使い続けていたという 日本語Webの過去の事情をたまたま知らないだけなのに、 これをバグとか言い出す有様。
最近はコンピュータで日本語を使うためのプログラムを保守する日本人がいなくなってしまったのか、 いろんなコンピュータで日本語がうまく扱えなくなってきてる気がする。
たぶん他言語でも似たようなことが起きてるんだろうな。 Unicode対応したらとりあえず全言語対応できる!時代の弊害だな。
非標準の文字セット名を使い続けていたという 日本語Webの過去の事情をたまたま知らないだけなのに、 x-sjisの完全なスーパーセットであって 文字セット名さえ認識できれば正しく変換できるUnicodeを名指しして 時代の弊害とか言い出す有様。 ・・・しかし、x-sjis以外に似たような問題は聞いたことが無いな。 米国・西欧用の文字セット名(US-ASCII, ISO-8859-1等)を指定したまま 実際は別の文字セットを使っているという例は15年くらい前に東欧で散々見てきたが、 これは言わば「嘘を吐いている」訳だから話が違う。
バグとは何かは一律普遍的に決められるものではなく、 そのサービスが何を目的にしているかによって変わるんじゃないかな。 Wayback Machineはその趣旨からいって既存文書に対する後方互換性がキモなわけだから、 x-sjisに(今になって)対応できなくなったことをバグ扱いすることに違和感は感じないな。
×違和感は感じない ○違和感は抱かない 失礼。
誰かInternet Archive宛てに要望出してくれないかな。 x-sjisをShift_JISのエイリアスと看做させるだけだから 変な自動判定ルーチン組み込むよりは簡単だと思うのだが。
こういうローカルなデファクトって根拠の提示が難しいよね。
ごめん、以前どうだったのかよく知らんのだけど、前は問題なかったのならx-sjisの事情自体は知ってるのかな。 もしそうなら根拠の提示とか抜きで「x-sjisバグってますよ」で十分な気がする。 英語できる人頼んだ↓
なんかエドウィン
削除要請したら翌日受領の返事が来て驚いた
文字化けの修正はまーだ時間かかりそうですかね?
修正どころか、この問題は運営側に認知されてないかもよ。
666 :
663 :2014/09/18(木) 09:19:10.68
そしてもう削除されてた 以前のカキコやサイトみると何週間もかかってる人がいたのに
文字化けの件について一応メールは送ってみた。 ただ今まで海外の企業に10以上問合せ送ったことがあるが 2回くらいしか返信が来なかったのであまり期待しないでほしい。 あと送ってから気づいたんだが、どうやらx-sjisだけの問題じゃないらしい。 Shift_JISでも文字化けしているサイトがいくつかあった。 結局のところ手動でエンコードを選択できないのが問題だと思う。 そもそも申告された文字コードが正しいとは限らず、 より賢い自動判定によって表面化せずに放置されてる可能性もあるわけで。 (メールには>659の言う内容に加えて、もしくは余計な変換を止めろとも書いておいた)
うーんカレンダーの所には表示があるのに クリックすると新しいキャプチャに飛ばされる これは削除されているのかな 上のレスとは関係ないよな・・・
>>667 乙
改善されると嬉しいな
前まで観られていたサイトが文字化けで読めないのは悲しい
>>668 取得したページ数が増えなくて変だなぁと思ったら
ところ天方式で古いページから消えてく現象が起きてる・・・なんだこれ
不定期にページが消し飛ぶ現象とは違うよな
まずところてん方式ってのが何ぞ
更新されていなければ最新版1つ持っていれば十分じゃねということ?
そんな事はどうでもいいが Internet Archiveは仕様変更でもしたのかね
いや何の話だよ
浦島さんこんにちは。
?
数レス上の話を忘れるとは・・・
>>673 がリアルに何の話かわからん。
直前の流れを「そんな事はどうでもいいが」と切り捨ててるあたりからすると直前の話題の記録ポイント消失問題を話したいわけではなさそうだし、
その前の話題の文字化け問題は発端の
>>625 から仕様変更として扱ってるんだから今更「仕様変更でもしたのかね」も妙だし…。
ところてんに引っ掛かってるのを「どうでもいい」と切り捨てて 直前の記録ポイント消失問題の話をしているんだよ
681 :
668 :2014/10/01(水) 10:44:10.97
二日くらいあけてからクリックしたらいけた 何かトラブルか混んでいただけかも
ときどきそういうことあるよね
まだ文字化け直ってないねえ
しっかし送出側がちょっと間違っただけで、こっちでできる対処ってほとんどなくなっちゃうんだな。
ちょっとおかしい?
sjisの全文字を羅列したhtmlをx-sjisとしてarchiveに食わせて 出てきたhtmlをざっと見た感じ、全ての文字が1:1で対応しており、 欠損や複数の文字が1つの文字に化けているということは無いみたい。 なので最悪テーブルを作って元に戻すことは出来そう。
ああそうか、今からクロールさせても再現できるのか。
>>686 > 出てきたhtmlをざっと見た感じ、全ての文字が1:1で対応しており、
本当?
Shift_JIS で 0x81, 0x8D, 0x8F, 0x90, 0x9D の値がどれも
0xEF 0xBF 0xBD というバイト列 (Unicode で U+FFFD の文字)
に変換されるから、絶対に重複が生じるはずなのだが。
例えば
8D40 后 喉 坑 垢 好 孔 孝 宏 工 巧 巷 幸 広 庚 康 弘
8D50 恒 慌 抗 拘 控 攻 昂 晃 更 杭 校 梗 構 江 洪 浩
8D60 港 溝 甲 皇 硬 稿 糠 紅 紘 絞 綱 耕 考 肯 肱 腔
8D70 膏 航 荒 行 衡 講 貢 購 郊 酵 鉱 砿 鋼 閤 降
と
8F40 宗 就 州 修 愁 拾 洲 秀 秋 終 繍 習 臭 舟 蒐 衆
8F50 襲 讐 蹴 輯 週 酋 酬 集 醜 什 住 充 十 従 戎 柔
8F60 汁 渋 獣 縦 重 銃 叔 夙 宿 淑 祝 縮 粛 塾 熟 出
8F70 術 述 俊 峻 春 瞬 竣 舜 駿 准 循 旬 楯 殉 淳
が同じになったりしてない?
そんなことより
URL パラメータを使って変換前の HTML を取り出した方が早いわ
文字化けはもう治らないんですね...
ほんと余計なことするよなあ運営 日本語なんて知ったこちゃあねーよって感じなんだろうな
画像が壊れたまま保存されてしまわない?
またデータサーバが飛んだのか キャッシュ一覧は表示されるのにリンク先へ進むと真っ白…
あるある
データサーバが飛んだというより、何かのバグじゃないかな・・・ アーカイブを取り出そうとすると時々長さ 0 の応答を返してくることがあって、 それが HTML の場合は画面真っ白、画像やその他のファイルは中身が空のまま保存されてしまう。 HTTP/1.1 200 OK Server: Tengine/2.0.3 Date: Thu, 09 Oct 2014 15:22:12 GMT Content-Type: application/octet-stream Content-Length: 0 Connection: keep-alive set-cookie: wayback_server=74; Domain=archive.org; Path=/; Expires=Sat, 08-Nov-14 15:22:12 GMT; X-Archive-Wayback-Runtime-Error: java.lang.ArrayIndexOutOfBoundsException X-Archive-Playback: 0 X-Page-Cache: HIT
おかしくなるタイミングがあるとかおかしいサーバに割り当てられるとかかな?
archive.today すげー重い まともに利用できない状態だな
archive.tomorrow
えらいこったな
タイムアウト?
文字化け何時になったら直るんだろう 見たいページがあるのに・・・
(´;ω;`)ブワッ
703 :
名無しさん@お腹いっぱい。 :2014/11/06(木) 14:43:14.78
ロイタージャパンの記事をWayback machineではアーカイブが取れなくなったな。
(´・ω・`)
705 :
名無しさん@お腹いっぱい。 :2014/11/08(土) 06:30:08.66
>>688 変換前のhtmlを取り出すパラメータってあるの?
面倒だけど出来るなら文字化けが直せるのでありがたい。
乙!そんな方法があったとは知らなかったよ。
これは役に立つ
文字化けになっていてもう終わりかと思っていたけどコレでちゃんと閲覧出来るようになった。 ありがとう本当にありがとう。
>>706 これよく分からないんだけど
見たいURLにim_かfw_をつければ文字化けしなくなるの?
文字化けしないというより、少なくともim_は画像と同じ(内部に手を加えたら壊れる)扱いをするということだな。 fw_はどこで使われているか知らないw
>>712 im_ に関してはそういうことになるかと。
実際に中身が画像等であれば特に im_ を付けなくても変換は行われないのですが、
呼び出し元が画像として参照しようとしているときは予防的に付けているのかもしれません。
fw_ はフレームコンテンツの参照 (<frame src=...) で使われています。
UTF-8 への変換は行われますので、元が x-sjis であれば現状では文字化けします。
>>706 なんという神だ!
いったいどこでこんな知識を得るんだ?
あれいつの間にか文字化けしないようになってるのか 対策してくれたのかな
>>716 >>706 の一番目の URL に対する web.archive.org のレスポンスヘッダ。
HTTP/1.1 200 OK
Server: Tengine/2.0.3
Date: Thu, 20 Nov 2014 07:46:00 GMT
Content-Type: text/html;charset=utf-8
Content-Length: 19119
Connection: keep-alive
set-cookie: wayback_server=74; Domain=archive.org; ... (後略)
Memento-Datetime: Tue, 29 Feb 2000 21:06:55 GMT
Link: <http... (後略)
X-Archive-Guessed-Charset: x-sjis
X-Archive-Orig-server: Apache/1.2.6 Ben-SSL/1.17
X-Archive-Orig-etag: "3c72-2672-38b0a8da"
(以下略)
「X-Archive-Guessed-Charset: x-sjis」となっていますから、
きちんと x-sjis を認識するようになったみたいですね。
以前は欧文用の文字セットとして認識していました (
>>626 )。
うお、本当だ やったね!
おやおや、しばらく見ないうちに解決? よかった。
寄付してくれってメッセージが出だしたな
721 :
名無しさん@お腹いっぱい。 :2014/12/07(日) 20:54:48.38
【サービス終了のお知らせ】 inter7をご利用の皆様 2014年12月20日(土)正午、 全サービス完全停止し、サイトを閉鎖致します。 12年間もの長きに渡り、サービス提供させて頂けたのは 皆様方のご愛顧の賜物 と 奇跡だった感謝しております。
文字化け直っててよかったー!
723 :
721 :2014/12/07(日) 22:46:59.05
スレタイinterで見間違ったごめん
_, ._ ( ゚ A ゚;)?
726 :
名無しさん@お腹いっぱい。 :2014/12/12(金) 08:22:38.83
,, _ / ` 、 / (_ノL_) ヽ / ´・ ・` l インターネットアーカイブは死んだんだ (l し l) いくら呼んでも帰っては来ないんだ . l __ l もうあの時間は終わって、君も人生と向き合う時なんだ > 、 _ ィ /  ̄ ヽ / | iヽ |\| |/| | ||/\/\/\/| |
O 。 , ─ヽ ________ /,/\ヾ\ / ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ |__|__|__|_ __((´∀`\ )< というお話だったのサ |_|__|__|__ /ノへゝ/''' )ヽ \_________ ||__| | | \´-`) / 丿/ |_|_| 从.从从 | \__ ̄ ̄⊂|丿/ |__|| 从人人从. | /\__/::::::||| |_|_|///ヽヾ\ / ::::::::::::ゝ/|| ────────(~〜ヽ::::::::::::|/ = 完 =
Twitterをチェックしろと書いてあるのに、 実際にTwitterにメンテ終了告知が載せられた記憶がない
何の為のtwitterなんだろな
archive.today まともに使えない 復旧はよ
GET / HTTP/1.1 Host: archive.today Connection: close HTTP/1.1 200 Service Unavailable Refresh: 5 Content-Length: 626 Accept-Ranges: bytes Date: Mon, 15 Dec 2014 06:53:01 GMT Connection: close Server: nginx/1.6.0 Service Unavailable という説明をしておきながら 応答コードが 200 なのは笑える。
unusable.today
使い方簡単に教えて
まず服を脱ぎます
次に水着を着ます
archive.today 画像が多いページはエラー出て取れなかったけど、今やったら取れた 不具合直ったのかな
いえ、水着のパッドのせいです
糞つまらんレスイラネ
接続元の国の情報から言語を自動で切り替えていると思われるページのアーカイブを取ったら キムチ語とか中国語とかが並んだけど、Internet Archiveってキムチ鯖も使ってるのかな?
>>740 それが原因であれば、ja,en;q=0.7,en-us;q=0.3なので絶対に違うw
ちなみにサイトはツイッターだしw
同じ経験したことある>Twitter 自分が見かけたのは韓国語とアラビア語。
さて、今年の初アーカイブは
リダイレクトループにならね?
何が?
半年ルールはとっくの昔に消失。 昨年夏ごろはアーカイブ保存からグラフに現れるまで一日か二日待たされていたのが、 最近は数時間で出てきます。
ブラウザのリクエストヘッダによって返すものを変えているせいか、 特定のURLはブラウザのキャッシュをクリアしてもリダイレクトループになるし、 同じURLを別のクライアントソフトを使ってアクセスすると きちんと内容が取れるorz
今さっきまで読めていたページに繋がらねえよ。 検索フォームに打ち込んでも検索結果すら出なくなった。
見つけられない
752 :
750 :2015/01/08(木) 04:38:29.09
何踏ませてんだよw
archive.today重いな
数時間前までどのURL入れても繋がらなかったがもう直ったみたいだ
756 :
名無しさん@お腹いっぱい。 :2015/01/15(木) 21:38:07.44
はじめましてインターネットアーカイブでページは見つかりましたが画像がなくて助けて下さい
いえいえ大丈夫ですそれではごきげんよう
758 :
名無しさん@お腹いっぱい。 :2015/01/16(金) 23:10:41.17
urlはわかりますが
さて
メンテに入ったな
たまに入るな。
てんめー
最近peeep.usで保存できないんだけど自分だけ?👀
変な文字が…
ワラタ
766 :
763 :2015/02/18(水) 01:20:34.38
そのレスにも目玉付いててワラタ
768 :
名無しさん@お腹いっぱい。 :2015/02/21(土) 00:54:28.04
770 :
名無しさん@お腹いっぱい。 :2015/02/21(土) 21:17:07.40
771 :
769 :2015/02/22(日) 01:48:50.91
>>770 化けてるんじゃなくて、特定の条件のデータがごっそり抜け落ちるという
壊れ方だから無理。
具体的に示すと、
>>769 で挙げた例の場合、
1 つ目の「掲示板の使い方と注意事項」という部分のバイト列は次の通り。
8C 66 8E A6 94 C2 82 CC 8E 67 82 A2 95 FB-82 C6 92 8D 88 D3 8E 96 8D 80
ここから 7 ビットに収まらない値を取り除くと
66 67
この 2 つだけが残り、これを文字に戻すと「fg」となる。これが 2 つ目の状態。
( ・´ω・`)