【情報】玉石混交のネット情報、国会図書館が収集・保存へ
1 :
◆MX8JAKQ2 @窓際戦隊φ ★:
インターネットに流れては消える膨大な情報を、国民の知的財産として残せないか−−。
そんな研究を国立国会図書館が始めた。ネット時代の「知性」を後世に
伝えるには、これまでの書籍や新聞、雑誌の収集だけでは
足りないからだ。ただ図書館にはなじみの薄い分野だけに、しばらくは
試行錯誤が続きそうだ。
準備を進めているのは「ネットワーク系電子情報に関するプロジェクト」。
京都府精華町に新設される関西館のコンピューターシステムを使い、
早ければ10月に技術面の実験を始める。
(中略)
来年度には、国内のホームページを一切合切、保存する試みも
計画している。ネット上の住所を表すドメインに日本を示す「jp」のつく
ホームページを対象にする。
データ量は膨大だ。総務省郵政研究所の昨年8月の調査では、
「jp」ドメインは約6500万ページあり、総情報量は
約4400ギガバイト(新聞約1万3千年分に相当)に及ぶ。
情報の中身は玉石混交だが、「内容による選別は避け、知的活動の
総体を記録するべきだ」との考えから可能性を探ることにした。
いずれの実験も04年度までに一定の評価をまとめ、集めた
電子情報の分類・整理の仕方や、一般利用者への提供方法も
検討していく。
(後略)
( ´D`)ノ<ソースはasahi.com(朝日新聞社)
全文は下記URL参照
http://www.asahi.com/culture/update/0831/002.html
2 :
名無しさん@3周年:02/09/01 00:08 ID:vZJXx1dS
お!
3 :
名無しさん@3周年:02/09/01 00:08 ID:zPDGS7lI
10000
4 :
名無しさん@3周年:02/09/01 00:08 ID:0R2nZkQj
1000げっとずさー
5 :
名無しさん@3周年:02/09/01 00:08 ID:BKqH+22Y
2ちゃんだけで済むな
でも、著作権があるから、勝手に閲覧させて言いものか?
6 :
名無しさん@3周年:02/09/01 00:08 ID:v0jo0mNs
__,,,,_
/´  ̄/
/ 〃 _,ァ---/
i /´ / /`ヽ,
| 〉. -‐/ /‐一ヘヽ
| | ‐/ / リ}
ヤヽリ ´゚/ / '''ー {!
ヽ_」 / / くー |
ゝ i / / ,r "_,,>、 ゚'}
r/ / ト‐=‐ァ' !
_/ / ` `二´' 丿
/ ̄/ /、` '' ー--‐f´
/| \ /|\_
| /`又´\| |  ̄\
∧ ∧,〜
( (⌒ ̄ `ヽ
\ \ `ー'"´, -'⌒ヽ
/∠_,ノ _/
/( ノ ヽ、_/´ \
、( 'ノ( く `ヽ、
/` \____>\___ノ
/ /__〉 `、__>
/
/
7 :
名無しさん@3周年:02/09/01 00:08 ID:mVVswZFD
G.W.?
8 :
◆URA2CH4U :02/09/01 00:08 ID:W7rC3Vmj
賛成
( ´D`)ノ<つまりなんでもかんでもひっくるめて保存するわけれすか……。
10 :
名無しさん@3周年:02/09/01 00:08 ID:mQe/j93o
すげえ無駄遣いのヨカーン
12 :
(=゚ω゚)ノ ◆DXk2CTWs :02/09/01 00:09 ID:AyyxUVqx
ソースが朝卑か
13 :
名無しさん@3周年:02/09/01 00:09 ID:h1q7pLdi
お上に都合の悪い事も保存するんかね?
14 :
名無しさん@3周年:02/09/01 00:10 ID:d8EpyFmz
国民の知的財産
15 :
名無しさん@3周年:02/09/01 00:10 ID:g+a6ztil
すでにインターネット図書館ってなかったっけ?
日本じゃないけど
16 :
(=゚ω゚)ノ ◆DXk2CTWs :02/09/01 00:10 ID:AyyxUVqx
いいんじゃない?
17 :
6!!:02/09/01 00:10 ID:pxCsD9pe
6!!
みみずんは?ウェブアーカイブは?
19 :
も:02/09/01 00:11 ID:VnKZ00MM
日本版waybackmachineぐらいはあっても
いいかと思う。
20 :
名無しさん@3周年:02/09/01 00:11 ID:EEBtaGi0
ばかじゃね?
21 :
名無しさん@3周年:02/09/01 00:12 ID:QLQwm8PP
ソースが朝日=信用できない
国家に管理されるのか鬱だ
2chはnetで対象外
22 :
名無しさん@3周年:02/09/01 00:12 ID:TDhkL6FI
学校の授業で作らされた恥ずかしいホムペも保存されるのか・・・
欝だ氏脳
23 :
名無しさん@3周年:02/09/01 00:13 ID:wmEhL+X+
4400ギガって少ないなあ。
たかがそんなもんか
24 :
名無しさん@3周年:02/09/01 00:13 ID:QLQwm8PP
25 :
名無しさん@3周年:02/09/01 00:14 ID:wmEhL+X+
これって普通の一般人でも十分にできるね
26 :
名無しさん@3周年:02/09/01 00:14 ID:zwbZ9dyC
2ちゃんも残るの?
だったら「2」とかいうカキコも残るのかな。感慨深いものがある。
27 :
名無しさん@3周年:02/09/01 00:14 ID:F2sFW9/3
asahi.comは対象外ですか。
28 :
名無しさん@3周年:02/09/01 00:14 ID:U1ldDGcn
29 :
名無しさん@3周年:02/09/01 00:15 ID:K3fIr/TS
朝鮮コピペ集の保存きぼんぬ。
30 :
名無しさん@3周年:02/09/01 00:15 ID:viky/Hma
31 :
名無しさん@3周年:02/09/01 00:16 ID:ONcG+M/G
良い試みだと思うよ。
200年後ぐらいには価値が出て来るんじゃないかな・・・
32 :
名無しさん@3周年:02/09/01 00:16 ID:O2laLhm5
>>23 jpドメインだからでしょ。
画像等の容量大きい物はcomドメインが多いから(w
しかし
>>21の言うように国家に管理だったらもっと反応があってもよいのに>アサヒ
ネットは敵のようなもんだからいいのかな。
でも熱烈な愛読者っぽいHPもいっぱいあるのに・・・
( ´D`)ノ<300年後くらいにウガニクのオナニー日記とか見られたら
この時代の日本まるごと誤解を招きそうれす。
34 :
名無しさん@3周年:02/09/01 00:17 ID:WEx77Jvq
jpドメインだけか。
他のドメイン含めると何人だろうが日本語サイトだけ抽出すればいいのか、
他言語だろうが日本人が作ったサイト全てを抽出すればいいのかややこしいのかな。
35 :
名無しさん@3周年:02/09/01 00:19 ID:rNSiNqNa
たまいし
36 :
名無しさん@3周年:02/09/01 00:21 ID:gs0JuJ9x
100年後に便所の掃き溜め2ちゃんねるを真顔で研究する社会学者が
生まれそうで笑える。
37 :
名無しさん@3周年:02/09/01 00:22 ID:QAE3cEio
2chの良スレ保存とか?
国家レベルってことはgoogleとは金のかけ方が違うのか。
39 :
名無しさん@3周年:02/09/01 00:25 ID:syVuQlpT
国会図書館のbotは拒否してもいいのかな。
40 :
名無しさん@3周年:02/09/01 00:26 ID:Wr/bXHlU
更新されるページとかって、どうやって保存していくんだろう?
41 :
:02/09/01 00:28 ID:wh6noysn
グーぐるを買い取ればすむんじゃないの?
42 :
名無しさん@3周年:02/09/01 00:30 ID:Wr/bXHlU
はっ。俺が作って晒してる恥ずかしいページも残るのか?消さなきゃ・・・
43 :
名無しさん@3周年:02/09/01 00:30 ID:syVuQlpT
>38
予算のかけ方は違うだろうが、どうせ受注した日本企業がまともに仕事せんだろうから、
質はgoogle以下。
44 :
名無しさん@3周年:02/09/01 00:31 ID:2eJV25mE
ん?2chの過去ログ保存を國でやってくれるのか?
横断的にやらんと価値ないぞ。こういうのは。
45 :
:02/09/01 00:33 ID:ouqbHQaI
ネオ麦の例のスレは保存ケテーイだな
46 :
名無しさん@3周年:02/09/01 00:34 ID:syVuQlpT
100年後には2chのログを検索しただけで「21世紀初頭の風俗」の卒論でっち上げる
文系君が出そうだな。
47 :
名無しさん@3周年:02/09/01 00:35 ID:viky/Hma
100年もかからんだろ
とりあえず、2chは.netで対象外
49 :
名無しさん@3周年:02/09/01 00:36 ID:wRKdV/yV
50 :
名無しさん@3周年:02/09/01 00:37 ID:viky/Hma
49部落
51 :
名無しさん@3周年:02/09/01 00:37 ID:O9kUYf/u
持ってるだけでタイーホされちゃう、ぺド系ポルノ画像。
国が保管しちゃった場合、誰がタイーホされますか?
52 :
名無しさん@3周年:02/09/01 00:38 ID:7gaZOuSm
53 :
名無しさん@3周年:02/09/01 00:39 ID:PQAtNEjO
短時間で削除されるのもあるから全部はむりだろ。自動更新のページもむりだな。
54 :
名無しさん@3周年:02/09/01 00:42 ID:WuWQZ8Qd
現在でも猥褻系の雑誌も収集保存している。
ただ、閲覧できるのは研究者のみらしい。
何を研究しているのやら。
55 :
名無しさん@3周年:02/09/01 00:43 ID:xrgaIiW0
>>51 つうか普通に保存するだろ。
今だって発禁本保存されてるわけだし。
立法の際に保存目的は違法性はないものとされるでしょ、きっと。
( ´D`)ノ<
>>54 性風俗研究とかなんとかもっともらしいこと言って……。
57 :
名無しさん@3周年:02/09/01 00:50 ID:syVuQlpT
>>54 22世紀のポルノは3D。多分スタートレックのホログラムのようなものとみた。
なら、22世紀人は2Dのリアリティーの薄さでは立たないかと。
58 :
名無しさん@3周年:02/09/01 00:51 ID:LSl1LXeG
59 :
名無しさん@3周年:02/09/01 00:52 ID:ot9pKwD6
>>57 アンドロイドや奴隷クローンと直接やった方がいい。
ムーピーを捕まえろ
61 :
名無しさん@3周年:02/09/01 01:08 ID:viky/Hma
火の鳥か
62 :
名無しさん@3周年:02/09/01 01:10 ID:sGbAvsFc
保存したって誰も見ないし整理もできない。
63 :
名無しさん@3周年:02/09/01 01:14 ID:U1ldDGcn
>>62 そうなんだよな。
こういうのって、整理してインデックスつけてくんないと。
64 :
名無しさん@3周年:02/09/01 01:15 ID:QRPCRWCA
エロサイトの量が膨大すぎてパンクする悪寒。
>>63
百年後に「長瀬愛」で検索する奴とかいるかな。
66 :
名無しさん@3周年:02/09/01 01:19 ID:glka0/IY
っていうか結構データ量少ないんだな。
4Tでしょ?
間違ってないよな。
個人でエロ動画こんぐらい持ってる奴とかいるよな。
ん?
いまいち良く分かんないんですが、
なんで収集するだけで「管理」なの?
検閲されるわけでもあるまいし。
68 :
名無しさん@3周年:02/09/01 01:24 ID:zwbZ9dyC
>>51 力武氏曰く、児ポ法が施行される前にロリ写真集を国会図書館にぜひ収めてくれと
連絡があったらしい。本当なのかな。
(´Å`) 〜 日本版ウェブアーカイブ 良いでつね
ミーのクソサイトも末永く保存されるのかしら
ふふ
70 :
名無しさん@3周年:02/09/01 01:30 ID:7gaZOuSm
71 :
名無しさん@3周年:02/09/01 01:30 ID:RYdL5Vd5
えろげアーカイブスをはげしく作ってほしい。
72 :
マグロ男:02/09/01 01:31 ID:DpGoa1iQ
>>68 案外本当かも、ロリだろうが文化は文化。ぜひ国会図書館の倉庫にうずめて
おきたいと思う国会図書館司書はいると思われ。
なお、web.archive.orgには日本のサイトが少ないなんて
くそったれな発言している奴は、熊に食われてしまえ。
俺のサイトですらはいっている。
75 :
名無しさん@3周年:02/09/01 01:36 ID:7gaZOuSm
>>74 そお?
オレの知り合いのサイトは、ぜんぜん入ってないよ。
76 :
名無しさん@3周年:02/09/01 01:37 ID:42Orat0S
会員制サイトとか有料コンテンツなんかも無理矢理ぶっこ抜くのかねぇ?
それが全部閲覧できるなら、ちとモメそうな気もするが・・・。これも「研究
者のみ閲覧可」かな?
77 :
名無しさん@3周年:02/09/01 01:38 ID:7gaZOuSm
78 :
bm593:02/09/01 01:39 ID:2f07qjcU
2チャンのログを保存するだけで十分ではないか。
79 :
名無しさん@3周年:02/09/01 01:39 ID:WuWQZ8Qd
江戸時代の春画はグロいだけだし、20世紀半ばには全盛だったエロ小説も
21世紀初頭の現在では細々としか生き残ってないし、
Avさえも衰退の一途なくらいだから、
得ろ画像だの得ろ動画なんて今世紀半ばには古典芸能の一分野になっているのでわ。
星新一のセクスタシーみたいのが発明されてたりして。
80 :
:02/09/01 01:40 ID:gr8IOdHC
web archiveの日本版っすか。 またイヤラシイことを。
>>75 有名どころはほとんど入っている。もちろん時期的に収録できなかったもの
もいくらかあるけれども、自分のサイトなんかは1年くらいやっていたから、
40000くらいのアクセスだったけれども、収録されていたよ。
>>81 archive.orgはよく使うんだけど、見たいページが入ってなくて
がっかりということはよくあるよ。
83 :
:02/09/01 01:44 ID:gr8IOdHC
web archiveは、日本人の一般人のサイトも保存されてましたよ。
削除依頼したら消してくれるみたいなので、いつか依頼しなきゃと思ってて、ついそのまんま。
84 :
名無しさん@3周年:02/09/01 01:46 ID:ryrI7D75
これは著作権の問題とかは絡んでこないの?
保存しているだけだったらいいのかな?
85 :
名無しさん@3周年:02/09/01 01:48 ID:6ir3cbcc
jp ドメインのデータって 4400 ギガバイトぽっちなんだな
頑張れば個人で全データ保存できそうな気がする
>84
それいったらgoogleも、gooもときりがない。
クロールするくらいいいじゃない。気に寸名。
87 :
名無しさん@3周年:02/09/01 01:50 ID:/pEC3cte
俺のHPも歴史に残るわけか。
>>82 公開時期が異常に狭いのと、有名サーチエンジン、海外サーチエンジン
に登録しておくと収録されやすい。
とくに海外サーチエンジン。
89 :
名無しさん@3周年:02/09/01 01:50 ID:Sioyxsq8
つーか無茶苦茶民業圧迫してねえ?
90 :
名無しさん@3周年:02/09/01 01:51 ID:YULPnMwk
いま、日本がかっこいい。
92 :
名無しさん@3周年:02/09/01 01:56 ID:syVuQlpT
>84
ログはするけど公開しない。公開時期は
例のネズミ次第で決定だな。
93 :
名無しさん@3周年:02/09/01 01:58 ID:oEAD3RWA
でさ、にちゃんねるの全板情報を集めたらどれくらいのサイズになるんですか?
10ギガはいくでしょうか
94 :
名無しさん@3周年:02/09/01 01:58 ID:EswAQmzT
誹謗中傷サイトも国で永遠に保護か?
国を訴えてもよかですか?
95 :
名無しさん@3周年:02/09/01 01:59 ID:3VnyNWbH
志ねよ木綿ら
97 :
◆GACHApeQ :02/09/01 02:05 ID:f6OPEner
2ちゃんねるの過去スレ国家が保存すんのか!!???
すっげー!!
・・・んなわけないじゃん。
98 :
名無しさん@3周年:02/09/01 02:06 ID:7gaZOuSm
99 :
名無したん(;´Д`)ハァハァ :02/09/01 02:06 ID:O9kUYf/u
角煮住人な俺は、これまで神のウプしたあれやこれをゲトし損なって涙したものですが。
これからは国が補完してくれるのですね。(・∀・)イイ!!
100 :
名無しさん@3周年:02/09/01 02:06 ID:07ra2bnj
にちゃんねるの価値=o
101 :
名無しさん@3周年:02/09/01 02:07 ID:+WdZ6wAn
>>93 夜勤がCD-R100枚以上とか言ってたなあ・・・
103 :
名無しさん@3周年:02/09/01 02:08 ID:pSlCEwYr
住民基本台帳と連携し、誰が何を閲覧したか記録されます。
むかし図書館で我が闘争や社会主義関連の本を借りるとマークされたように。
105 :
名無しさん@3周年:02/09/01 02:11 ID:7gaZOuSm
106 :
名無しさん@3周年:02/09/01 02:13 ID:+WdZ6wAn
トップページからしか入っていけないのが多いと思うんだが
108 :
名無しさん@3周年:02/09/01 02:21 ID:WuWQZ8Qd
>>108 逆言えば、現在入手困難なソフトウェアも手に入る可能性も
あるんだよ。zipやlzh、なんてアーカイブファイルもクロールさ
れている時がある。
正直、web.archive.orgを使いこなせている人間がちょっとすくない。
基本的に、トップレベルドメインか、それより一つ下のサブドメイン
を検索かけて、あとは結果を掘り下げていくこと。
いきなり目的のページにいったってたどり着けるわけがない。
112 :
名無しさん@3周年:02/09/01 02:24 ID:pSlCEwYr
むかし法に触れかねないヤバイサイトつくって、今はもう足を洗ったとしても、
archiveに記録されていると何となくガクガクブルブルな罠。
Uranewsなんて昔はヒットしたが、最近は削除されたのか依頼があったのか
renpouにいたっては収録もされていない。
114 :
名無しさん@3周年:02/09/01 02:26 ID:B6he+1+H
115 :
名無しさん@3周年:02/09/01 02:27 ID:7gaZOuSm
>>112 犯罪じゃなくても、消し去りたい過去が。
エロゲーを作って本名で公開してたときがあるんだけど…
116 :
名無しさん@3周年:02/09/01 02:29 ID:oEAD3RWA
もう知らない地に住めば新しい人生が始められるなんてことすらも
許されない時代になったんだね・・
117 :
名無しさん@3周年:02/09/01 02:30 ID:rl9Lq/mk
たぶん耳あてながら寝ちゃってたんじゃない?月曜から学校なのに....
119 :
名無しさん@3周年:02/09/01 02:33 ID:DvAaAkUp
なあんか総背番号制の一環みたいだな。
120 :
名無しさん@3周年:02/09/01 02:34 ID:7gaZOuSm
121 :
名無しさん@3周年:02/09/01 02:35 ID:Sioyxsq8
>>119 誰がどの資料を閲覧したのかというデータを逐一内務省に転送しそうだよね。
122 :
名無しさん@3周年:02/09/01 02:38 ID:pSlCEwYr
当ネット国会図書館の閲覧には住民基本台帳ネットの番号が必要です。
現在日本国民専用ですので、それを証明するためにのみ使われます。
他の事には一切使用されませんのでどうぞご安心ください。
〜ネット国会図書館館長〜
123 :
名無しさん@3周年:02/09/01 02:39 ID:/S4luzjW
googleによるlog総ざらいが2ch閉鎖危機の一因じゃ
なかったか?夜勤★さんが泣くよ。
125 :
名無しさん@3周年:02/09/01 06:33 ID:nKYEnPdr
ウェブアーカイブは凄いな
クソゲーハンターABCのサイトが拝めるとは思わなかった
侍魂以前のテキストサイトとしては秀逸だと思うけど、あまり知られてないよね
126 :
名無しさん@3周年:02/09/01 06:47 ID:NRoS3jWZ
歴史に残る?
127 :
名無しさん@3周年:02/09/01 06:48 ID:jSH/DPUR
2チャンのログを保存するだけで十分
128 :
ともチャン:02/09/01 06:49 ID:17I+hZri
4400ギガバイトしかないのか。
意外と少ないな。
129 :
名無しさん@3周年:02/09/01 06:51 ID:MwyFUSKF
>約4400ギガバイト(新聞約1万3千年分に相当)
jpドメインだけでも1万3千年分かよ・・・・
いまいちピンと来ないところもあるがインターネットもそこまで来たのか。
130 :
名無しさん@3周年:02/09/01 06:52 ID:aY/HC+Rg
カキコにドキドキ!
131 :
名無しさん@3周年:02/09/01 06:55 ID:1DJvDffi
>>124 違うよ
リクルートによる資料集めのlog総ざらい。
これはツール使ってるので普通に全スレ読むのに比べて10倍以上の負担がかかるらしい。
132 :
名無しさん@3周年:02/09/01 07:21 ID:E4X97p3N
穴だらけのアーカイブになって、未来の研究者に恨まれるヨカンヌ
133 :
名無しさん@3周年:02/09/01 07:25 ID:gvdgLyez
件数カウントすると
> select count(*) from 2ch where content matches '逝ってよし';
312309242345
とか出るのか?
嫌なデータベースだ。
134 :
名無しさん@3周年:02/09/01 09:48 ID:qXwgKcSe
×玉石混交
○玉石混淆
136 :
名無しさん@3周年:02/09/01 12:51 ID:kzdv5AR0
jpドメイソだけ保存しても、あまり意味がない。
これだから役所仕事は・・・杜撰。
137 :
名無しさん@3周年:02/09/01 12:57 ID:kzdv5AR0
>>68 出版社は、日本国内で書籍を刊行した場合、すべての書籍を漏れなく
1冊ずつ国会図書館に献本するように法律(国会図書館法)で義務付け
られていた筈。エロ本であっても例外ではない。逆に、国会図書館側が
受け入れを拒否したら、そっちの方が違法なのでは?
138 :
名無しさん@3周年:02/09/01 12:59 ID:2DGhEvn3
「知性」ねぇ。
文化としてのインターネットを保存した方がイイと思う
139 :
名無しさん@3周年:02/09/01 13:08 ID:SPY2c7vx
割れずの分割ファイルを国会図書館が補完?
140 :
名無しさん@3周年:02/09/01 13:15 ID:0i8HdjSX
>>138文化としてのインターネットってなんですか?
141 :
名無しさん@3周年:02/09/01 13:16 ID:gWAaA/m3
142 :
名無しさん@3周年:02/09/01 13:17 ID:pX0PWZNx
勤務中に2ちゃんチェックする理由に使えそう
143 :
名無しさん@3周年:02/09/01 13:26 ID:p98iuxvE
webarchiveで十分じゃないの?
144 :
名無しさん@3周年:02/09/01 13:31 ID:WO7bKJ1T
国家に都合の悪い情報は改ざんされて保存されます。
本家が消えれば国会図書館のほうが真実に。
こうして歴史は作られていく……。
Я