Google、大図書館の蔵書のほとんどを検索可能にするプロジェクト

このエントリーをはてなブックマークに追加
1エナメルノート様φ ★
米Googleは14日、世界の大規模図書館の蔵書をスキャンし、
インターネットから全文検索できるようにする
プロジェクトを遂行していることを明らかにした。

(中略)

著作権が切れ、パブリックドメインにある蔵書は、
書籍全文がGoogleによって公開される。
この場合はスキャンされた書籍の中から検索に合致した部分が表示され、
書籍全文についても前後することで閲覧できる。
また、著作権者が権利を保有している書籍に関しては、
検索語と関連している文書の一部だけを引用表示。
同時に書籍に関する情報も表示されるため、
そこから出版社に注文して書籍を購入できる。
出版社の売上にもつながるとともに、
同時に表示されるターゲット広告によって
Googleでも収入が得られる仕組みだ。

(中略)


プロジェクトについてGoogleでは、
同社が掲げる「オフラインの情報をオンラインで検索できるようにする」という
目標の1つだとしている。
また、Google創業者の1人であるLarry Page氏は
「Googleの任務は世界の情報を整理することであり、
我々は図書館とともに働き、この任務を現実のものにすることができることに興奮している」
とコメントしている。

ソース
http://internet.watch.impress.co.jp/cda/news/2004/12/15/5796.html

ニュースリリース
http://www.google.com/press/pressrel/print_library.html
2名無しさん@お腹いっぱい。:04/12/15 22:20:57 ID:sEeoKZwm
娘はもらった
3名無しさん@お腹いっぱい。:04/12/15 22:23:23 ID:5HhA5N2g
夢のような話だ

それはそうと>>2は詩ね
4名無しさん@お腹いっぱい。:04/12/15 22:25:39 ID:nh6lnLw5
ますます歴史捏造が難しくなるな>韓国w
5名無しさん@お腹いっぱい。:04/12/15 22:29:40 ID:wIZoqd4x
> 著作権が切れ、パブリックドメインにある蔵書は、
> 書籍全文がGoogleによって公開される。
こいつは面白そうだ。

> また、著作権者が権利を保有している書籍に関しては、
> 検索語と関連している文書の一部だけを引用表示。
これも便利そう。スキャンの進行が楽しみ。
6名無しさん@お腹いっぱい。:04/12/15 22:29:40 ID:p0VIEzKf
死後50年で著作権切れになるんだっけか?
7名無しさん@お腹いっぱい。:04/12/15 22:31:20 ID:G1PWcFHF
Googleってのはほんとに不気味なくらいサプライズだ。何者だこいつらは。
8名無しさん@お腹いっぱい。:04/12/15 22:37:39 ID:qRCNgybk
ぐるぐる
9名無しさん@お腹いっぱい。:04/12/15 22:37:53 ID:a4wtO4wR
映画『タイムマシン』に出てくるような未来の図書館ができるきっかけになるといいな
10名無しさん@お腹いっぱい。:04/12/15 22:38:44 ID:CQXQK9on
>>6
個人の著作物はそう。法人著作は公表後50年。
11名無しさん@お腹いっぱい。:04/12/15 22:39:32 ID:mNLyz0Qe
Googleすげぇ。
12エナメルノート様φ ★:04/12/15 22:43:05 ID:???
>>6,>>10
日本では50年だけど
アメリカ・イギリスでは70年くらいあると思います。
うろ覚えなんで今から調べてきます。
13名無しさん@お腹いっぱい。:04/12/15 22:44:18 ID:ky+2DqTp
すげぇ・・・
日本の図書館ももう終わりだし海外の試み
にたよるしかないんだな。
14名無しさん@お腹いっぱい。:04/12/15 23:09:16 ID:CZb9BpkL

すばらしい企画だな。はやくやって欲しい。
15名無しさん@お腹いっぱい。:04/12/15 23:15:38 ID:hz3Qigq9
これに自動翻訳が加わると、
学者の仕事にも何らかの影響を及ぼすことになるやもしれん。

まぁ、元々が院生の仕事だから
こういう事は本能的に考えちまうんだよな。
16名無しさん@お腹いっぱい。:04/12/15 23:33:04 ID:pZwA7j1b

IT・ネット関連スレ

光ファイバの質問スレッド4 FTTH(Fiber To The Home)
http://pc6.2ch.net/test/read.cgi/isp/1079598584/
無線LAN機器のお勧めは? 〜Part 16〜
http://pc5.2ch.net/test/read.cgi/hard/1096188452/

【新品】低価格・激安ノートパソコンを語ろーPart7
http://pc6.2ch.net/test/read.cgi/pc/1100366552/
低価格・激安・格安PC(新品) PART24
http://pc6.2ch.net/test/read.cgi/pc/1092411071/
17名無しさん@お腹いっぱい。:04/12/15 23:34:24 ID:7JcK+sLo
英語の著作権切れの本を公開しているProject Gutenberg
http://promo.net/pg/

日本語の著作権切れの青空文庫
http://www.aozora.gr.jp/
18名無しさん@お腹いっぱい。:04/12/15 23:34:27 ID:SvZi+8qx
素直にGoogleは凄いと驚く
こういう仕事(蔵書のデジタルデータ化)は図書館の仕事で
この作業は相当の時間がかかると思っていたが
これを企業が行いそこから利益を得る方法を考えたGoogleは凄い
利益を考えているため作業スピードも相当速いだろう

現在のローマ字OCRの識字率は高いが、日本語OCRは低い
そのため日本語版が出るのはいつになるかわからないけど
応援してます。マジがんばってください>Google
19名無しさん@お腹いっぱい。:04/12/15 23:36:35 ID:IINRT9OH
> 同社が掲げる「オフラインの情報をオンラインで検索できるようにする」という

前からゆってた amazon 対抗策のひとつかな。
図書館から来るとは思わなかった。
20名無しさん@お腹いっぱい。:04/12/15 23:39:50 ID:IINRT9OH
age ちゃったおわびに /.org の記事。

Google To Digitize Much of Harvard's Library
http://slashdot.org/article.pl?sid=04/12/14/013251
21名無しさん@お腹いっぱい。:04/12/16 00:06:50 ID:Q3ZvNiRm
GOOGLEPRINTか。覚えておこう。
若い世代にとっちゃ新聞はとうにWEBにとって変わられたが、そろそろ書籍も電子ブックに本格的になるかな。
ハードも需要の増加にあわせてもっとTABLET型が増えるだろうな。
エロビデオとエロ本はさらに昔に電子化されているな。
22名無しさん@お腹いっぱい。:04/12/16 00:09:34 ID:Q3ZvNiRm
ぶっちゃけアマゾン対抗策なんて眠いこと言ってないで、GOOGLEとAMZONが提携すれば話は早いのにな。
どっちも相手にわけまえ渡して取り分が減るのが嫌なんだろうが。
23名無しさん@お腹いっぱい:04/12/16 01:15:33 ID:SFtGmzrf
       ||
     ∧||∧
    ( / ⌒ヽ  前に書きこんだ時のクッキー残ってやんの・・・
     | |   |
     ∪ / ノ
      | ||
      ∪∪
24名無しさん@お腹いっぱい。:04/12/16 02:22:13 ID:VtMsSnZs
久しぶりにgoogleつかったら[このページを訳す BETA ]とかあってびっくり
なんか検索したら独自レンダリングエンジンのブラウザ開発中とかでてきたりしてよくわからんが凄い気合だ
25名無しさん@お腹いっぱい。:04/12/16 02:40:01 ID:G1Fh3Bdw
IPOで無駄に金が余ってる感じだな。
26名無しさん@お腹いっぱい。:04/12/16 03:42:21 ID:nk+XtgOz
どれくらいの人数がScanにかり出されているのだろうか...
27名無しさん@お腹いっぱい。:04/12/16 05:01:57 ID:IIrPtRhP
google GJ!
28名無しさん@お腹いっぱい。:04/12/16 05:03:01 ID:CoLm8zKO
>なんか検索したら独自レンダリングエンジンのブラウザ開発中とかでてきたりして

キッパリと否定してたはずだけど?
29名無しさん@お腹いっぱい。:04/12/16 06:52:24 ID:oxie3AId
規模で先を越されたorz

Sakamura Laboratory Entrance Hall
http://www.sakamura-lab.org/

東京大学総合研究博物館
http://www.um.u-tokyo.ac.jp/
30名無しさん@お腹いっぱい。:04/12/16 06:53:48 ID:oxie3AId
>>28
テレビでABCが報道してたけど、自動機械で超高速スキャンしてた。
31名無しさん@お腹いっぱい。:04/12/16 07:27:25 ID:Z0YDMKJp
OCRのバイトを世界規模で数万人募集とかやるのかな?
32名無しさん@お腹いっぱい。:04/12/16 08:19:25 ID:1EksPyRS
日本語の書籍が見たいんだがな
ゲイシは国立国会図書館でやってくれ
それならWINDOWS使うよ
33fussianasan:04/12/16 08:27:17 ID:BugpcSKk
MS ni taishite kouiu bussiness no
houhouga arunndane. sannkou ninaru.
34名無しさん@お腹いっぱい。:04/12/16 08:29:19 ID:oxie3AId
>>32
ゲイツ?
Windows?

GoogleがTRONでだろ。
35名無しさん@お腹いっぱい。:04/12/16 11:14:54 ID:CJJPawGo
雑誌を50年劣化させずに保存するのは骨だぞ
36名無しさん@お腹いっぱい。:04/12/16 11:19:09 ID:Z0YDMKJp
調子に乗って出版社買収までやると思う。
37名無しさん@お腹いっぱい。:04/12/16 11:59:10 ID:+fLC2OeK
>>36
まるでソフトバンクだな
38名無しさん@お腹いっぱい。:04/12/16 12:14:54 ID:jPGOLNz8
↓読子リードマンが一言
39名無しさん@お腹いっぱい。:04/12/16 13:36:06 ID:UtxF/XuL
やることが、すさまじいね。
脱帽だよ。思い切りがよすぎる。
40名無しさん@お腹いっぱい。:04/12/16 13:38:13 ID:JwGOFN1I
昔のエロ雑誌とかも検索できますかね?
41名無しさん@お腹いっぱい。:04/12/16 13:44:16 ID:rro+7qH5
2ちゃんねるの書き込みもさぁ、残るわけだよ。書いてるときは便所の落書きのつもりでも、
すっかり歳とってからも、死んでからもずーっと残るわけだよ。
デジタルって、沁みるねぇ。
42名無しさん@お腹いっぱい。:04/12/16 14:25:40 ID:qQFcRR4/
読子さんの異名は「ザ・キャッシュ」になってしまうのか
43名無しさん@お腹いっぱい。:04/12/16 16:23:13 ID:WDYYvqJ5
英語圏の人間は、圧倒的に勝つ気でいるんじゃないのか?

積極的に開くことで世界中のニーズを今以上に作り出し、
自分たちが優位に立てる言語プロトコルを磐石に固めて、
これから先も強い立場を維持し続けるつもりなのでは。。。
みな、このサービスに群がるだろうし、いくら翻訳ソフトが発達しても、
第一言語の立場は揺るぎはしないだろうし。

これ、弁護士活動とか国際基準の設定とか、そういうところまで
考えた長期的な戦略をゆるく見据えているような気がするよなぁ。。。
44名無しさん@お腹いっぱい。:04/12/16 20:13:46 ID:aMM3Or66
Googleの社員は勤務時間の20%を自由研究に充てなければならないことになってる。
やたら高学歴者多いし、そこから山のように新しい技術やビジネスモデルが出てくるわけですよ。
45名無しさん@お腹いっぱい。:04/12/16 22:13:05 ID:JlPnmCWE
>>41
良い事言ってるように見せてるが・・・
要らないものは淘汰される。

これデータの世界も同じね。
46名無しさん@お腹いっぱい。:04/12/17 02:40:06 ID:NxmTqyVd
読子さん、出番ですよ
47名無しさん@お腹いっぱい。:04/12/17 02:50:49 ID:06VdJyTY
>>43
物騒な言い方をするなら一種の武力行使、戦争と見てもいいんじゃないかな。
物理的な戦争よりはるかに安全で強力で根深いけど。
48名無しさん@お腹いっぱい。:04/12/17 14:59:43 ID:YLFtHbxH
>>47

そうだね。それが正解でしょうね。
しかしうまいところに目をつけたよなとは思った。

アメリカの戦略と戦術はこういうところは
どこまでもフェアだから、文句のもっていきようがない。
やはり、残るのはアメリカなのかな。あの国は特別だと思う。

49名無しさん@お腹いっぱい。:04/12/17 15:06:20 ID:vtWZmvHT
私が口を挟むまでもないかもしれませんが、この構想はOPACとか言う
日本で行われていた構想のパクリです。各方面お忘れ無きよう。
50名無しさん@お腹いっぱい。:04/12/17 15:45:06 ID:gZAxXfZS
ネットの初期からこういう構想はあったけど、ボランティアだよりだったりして
規模はしょぼしょぼだったのが現実。googleが大規模にやるからニュースになる。
51名無しさん@お腹いっぱい。:04/12/17 15:58:56 ID:YLFtHbxH
>>49
Googleがやってることはすばらしい。
誰もがやりたくて、予算の問題があってできなかったことを
あっさり実現してくれる計画であることは間違いないんですから。

日本はなぜ同じことができないんだろうなぁ。
予算や技術の問題はあるのはわかるんだけど、それ以前に、
図書館利用者から金を取るなんていう人もいる始末だし。
発想の根っこがまったく食い違ってんだろうなぁ。。。

>>50
量が質を変えるよい例だと思う。大学図書館が丸ごと網羅されている、
という「安心感」を実現したのはすごいよ。

東大の蔵書がこんな感じで閲覧できるようには今後ともならないだろうなぁ。
52名無しさん@お腹いっぱい。:04/12/17 18:05:49 ID:eet+6vSF
東大は資料を集めるだけ集めて出し惜しみするからなぁ。
53名無しさん@お腹いっぱい。:04/12/17 19:16:15 ID:YLFtHbxH
>>52

自分たちの所有物だと勘違いしているのではないのかなぁ?

ちなみにこれ、どれいくらくらいの予算を計上してんでしょうね。
そのへんがすごく気になる。どこかのサイトに載ってないでしょうかね?
infoseekを抱える楽天が、東大の全資料をデジタルドキュメント化したら、
日本国内ではinfoseekがGoogleに勝つ可能性もあるのにね。
54名無しさん@お腹いっぱい。:04/12/17 19:22:51 ID:gPzau/Ce
まあ発売前のジャンプの全話スキャン画像が流れている時代だからな
と空気を読まずカキコ
55名無しさん@お腹いっぱい。:04/12/17 20:41:10 ID:foL5gWPH
グーグルがやる必然は無いのかもしれないけど、
ネットの理念としては圧倒的に正しい。
そもそも際限無く情報を共有するために作られたんだろ。
56名無しさん@お腹いっぱい。:04/12/17 20:44:39 ID:p8wTUBly
>>51
まあ、僕が大学院でやってた参考文献も結局その当時の日本のシステムで
他の大学から取り寄せたんですよ。料金は大学間の決済ですから、とくに
問題が或るとは思えません。それに各施設の書庫でそれぞれ得手不得手は
有りますからそれを補う意味で良い仕組みだったと思います。
 
これも、せっかくの日本の仕組みを見直す良い機会ではないですかね。
57名無しさん@お腹いっぱい。:04/12/17 20:49:39 ID:p8wTUBly
>>55
で、とにかく君らにいいたいのは、日本のナニをちゃんと知ってから
偉そうに言えってことだ
58名無しさん@お腹いっぱい。:04/12/17 21:57:22 ID:S43mGAGZ
球団買収で騒いでるのとスケールが違い杉
ヽ( ・∀・)ノウンコー
59名無しさん@お腹いっぱい。:04/12/18 01:25:31 ID:vmSbnPjn
あれは興味ないね
60名無しさん@お腹いっぱい。:04/12/18 01:39:01 ID:TZ7bmJMp
青空文庫は数が少なすぎるな。ホラーの名作「ジキルとハイド」があるのは良いけど。
61名無しさん@お腹いっぱい。:04/12/18 07:21:31 ID:l+6Wxoey
>>51-52
>東大の蔵書
>東大は資料を

今は坂村が東大に風穴を開けようと奮闘している。
62名無しさん@お腹いっぱい。:04/12/18 07:23:51 ID:hWYd5M7x
大学生であれば閲覧可能であれば問題無いかもしれないけど
一般用にはどうかな
63名無しさん@お腹いっぱい。:04/12/18 08:13:35 ID:y46rd4sU
東大の蔵書のデジタル化もグーグルに任せては。
64名無しさん@お腹いっぱい。:04/12/18 08:53:58 ID:BIGBmrRW
Googleって企業なの?
どうやって稼いでるの?
65名無しさん@お腹いっぱい。:04/12/18 10:24:39 ID:u8+mSxQc
>>64
サーチエンジンのリースがメイン。
66名無しさん@お腹いっぱい。:04/12/18 12:11:47 ID:4PdyB0hE
googleはこないだ株式公開して入ってきた金をこれにあてるんだろうな
すげぇなぁ
67名無しさん@お腹いっぱい。:04/12/18 17:06:07 ID:IhIEpy9x
>>60 そう思ったあなたが、入力をすればよいのですよ
68名無しさん@お腹いっぱい。:04/12/18 18:44:10 ID:ezOvQi0i
>>61

そうなんですか。。。
マイクロソフトと組んだことまでは知ってましたが、
大学そのものを変革しようとしているとは。

何をしようとしているか、具体的にわかるサイトとかないでしょうか?
69名無しさん@お腹いっぱい。:04/12/18 20:56:00 ID:iQc7OZiH
>>62
誰でも閲覧出来る環境を実現するという点で素晴らしいよね。
ただそれならば必ずしもITを使う必要はないのかもしれない。

付け加えるべき点は、電子化されることで生産性が向上する点かな。
図書館に借りに行って、なかったならば注文して時間を消費して、
入手できてもパソコンに打ち込んだり、しおりを沢山付けたり、
そんな手間が大きく削減されるんでないかな。

上のプロセスは付加価値を生むものではないから、効率よく論文かけそう。
70名無しさん@お腹いっぱい。:04/12/18 22:04:02 ID:3c7ilPUU
ゴッゴルで欧文文献をただで読みあされて、近所の図書館で漢籍を読みあされる日本人が真の勝ち組。
18世紀までの文献は漢籍の方が圧倒的に多い。
ちなみに言論が統制されてる中国韓国は真の負け組。
71名無しさん@お腹いっぱい。:04/12/18 23:33:15 ID:FQMYP2oh
ふとGoogleで検索したとき、2chから欧米の古典までがシームレスに引っかかるようになるわけだろう。
文学や技術書はもちろんのこと、統計資料なんかも加わるのだろうか・・・
それらをもとに情報が整理・再構築されていったりするのかな。
便利さはもちろん、きわめて高い検索性が約束されることから、何かしら興味深いことが起こりそうで楽しみだ。
72名無しさん@お腹いっぱい。:04/12/18 23:39:20 ID:VldYDwpG
串刺しが好きな欧米人らしい発想です
73名無しさん@お腹いっぱい。:04/12/18 23:45:05 ID:Yn87nWXH
著作権切れだから技術書はあまり関係なさそう

エルゼビアとつながって最近の論文まで検索できたら
さらに凄いけど
74名無しさん@お腹いっぱい。:04/12/19 00:00:51 ID:bLmrzZWM
>>73
書き方が悪かった。
技術書に関してもWebページ感覚で検索できて便利になりそうだなと。
(入手には金がかかる場合が多いだろうけど)
> また、著作権者が権利を保有している書籍に関しては、
> 検索語と関連している文書の一部だけを引用表示。

論文検索まで統合してくれたら本当、言うことないのだが。
75名無しさん@お腹いっぱい。:04/12/19 00:22:57 ID:vVGLPHdZ
おまえら、英語の本なんかどうせ読めないだろ。
イルボンサラムは青空文庫のgoogle全文検索でも使っとけ。
76名無しさん@お腹いっぱい。:04/12/19 00:36:28 ID:dU3xavfE
と、生粋の日本人が申しております。
77名無しさん@お腹いっぱい。:04/12/19 03:49:37 ID:nd1uovtK
>>74

論文検索は、すでにあるじゃん? ほれ。。。

Google Scholar β
http://scholar.google.com/
78名無しさん@お腹いっぱい。:04/12/19 08:20:48 ID:U638lsJl
これで完璧だ 個人情報の収集が楽になった
 まあ今でも図書館の情報は貰ってるけど。。。
79名無しさん@お腹いっぱい。:04/12/19 08:35:48 ID:nd1uovtK
>>78

おいおい。。。公安調査庁の人????
80名無しさん@お腹いっぱい。:04/12/19 09:05:12 ID:WEgS4Fq1
有料でもいいのでオライリーさんの本を全て電子化して欲しいです。
81名無しさん@お腹いっぱい。:04/12/19 09:05:25 ID:RDnvYt4J
>>63
Googleの技術に新規性はないよ。
物量作戦。

東大も既に始めている。
文献に限らずあらゆる文化財をデジタル化する計画を。

東京大学総合研究博物館
http://www.um.u-tokyo.ac.jp/
82名無しさん@お腹いっぱい。:04/12/19 09:07:09 ID:RDnvYt4J
>>70
漢籍もTRONコードで電子化しようよ。
83名無しさん@お腹いっぱい。:04/12/19 09:09:04 ID:RDnvYt4J
>>74
>論文検索まで統合

やってくれー
これなら英語だけで充分だから。
84名無しさん@お腹いっぱい。:04/12/19 09:55:05 ID:ev+HLHxm
google落ちてるね。
最近調子悪すぎ。
85名無しさん@お腹いっぱい。:04/12/19 10:20:10 ID:AmjeMkhH
webから古文書から研究論文から小説から健作されちゃたまったもんじゃないから
なんとか検索しやすいソートを作れば有用だな。
あと単純にTEXT化して健作文字が合致すれば関係ないものまでソートされてしまう
現在の検索エンジンは実は不完全きわまりないんだよな。
86名無しさん@お腹いっぱい。:04/12/19 11:19:12 ID:olbxNSjg
とても画期的な野望なのに
案外スレが伸びないな
やはり英語主導、ということで
一般ピープルには遠い世界の
話なのかな
87名無しさん@お腹いっぱい。:04/12/19 11:25:09 ID:O4gvFxvw
グーグルは、中国市場を得る見返りに中国政府の検閲を受け入れてしまった。
このような姿勢では、検索結果が時の政府や良識や歴史認識にとって、
都合のよい操作対象となる。

こわいこわい
88名無しさん@お腹いっぱい。:04/12/19 12:56:56 ID:UGcW/7G7
>>86
構想と推進力(人的物的リソース)の確保にたいしては、すばらしすぎて万歳としか言えない。

現時点でブツがないことを考えると
(1) a9.comとの比較
(2) このリソース投入の株屋の観点からみての妥当性
(3) (2)に関連してgoogleの米国企業にあるまじきCG様式
くらいが、論点かね。



89名無しさん@お腹いっぱい。:04/12/19 14:14:19 ID:uTLWTAr6
中国の犬か・・・
90名無しさん@お腹いっぱい。:04/12/19 14:28:53 ID:/eIkqJe7
日本でもやれとかすぐ言い出すやつがおるけど日本にも類似のプロジェクトあるっしょ。
金がないだけで。
こういう「文化的」な事業にはカネが回って来ない。民間も国や自治体も含めて。
公立図書館の予算見れば日本がどんな国かよくわかる。
実現希望するやつはうまいこと民間企業巻き込むかカネ出してやってくれ。
91名無しさん@お腹いっぱい。:04/12/19 19:07:35 ID:I1J2lQTA
意義が素晴らしいのはわかるが、著作権切れの本で読みたいのなんて
そうあるかぁ?
文学作品は青空文庫がやっているし、それ以外に何かあるかな。
はっきりいって思い浮かばないんだけど。
92名無しさん@お腹いっぱい。:04/12/19 19:38:16 ID:nd1uovtK
>>91
著作権があるものもないものもすべてまとめて
全文検索できる、というのがミソなんだろうね。

93名無しさん@お腹いっぱい。:04/12/19 20:14:06 ID:RDnvYt4J
>>91
古典漢籍
94名無しさん@お腹いっぱい。:04/12/20 02:48:23 ID:YJWnY7yF
どういうデータで保存するのか興味津々。
本を抽象化するにはどうすればいいんでしょう?
95名無しさん@お腹いっぱい。:04/12/20 03:08:12 ID:BvU6aC6J
>>93
古典漢籍は「意義が素晴らし」部類だな。注釈もなしに読めないよ。
あと漢籍は返り点とかどうするんだろう。
96名無しさん@お腹いっぱい。:04/12/20 03:52:26 ID:O5I2o90+
>>87 >>89
ウエディング事件なんかも見れば、
googleがその手のネタに思いの外弱いのも頷けるが。

ここら辺の足腰の弱さが悪い方に出なければ良いんだが。
97名無しさん@お腹いっぱい。:04/12/20 07:51:45 ID:jMWK6UGe
>>94
最近の一部民生用スキャナ付属ソフトのように、基本的には画像として取り込んでおいて、文字認識できた部分はテキストとしても読めるようにするのかな?
98名無しさん@お腹いっぱい。:04/12/20 11:44:46 ID:J4O5C8W1
>>49
>
>私が口を挟むまでもないかもしれませんが、この構想はOPACとか言う
>日本で行われていた構想のパクリです。各方面お忘れ無きよう。

OPAC?WebCatだろ
こういう構想は、外国にもあるし
しったかはやめよう
99名無しさん@お腹いっぱい。:04/12/20 18:28:15 ID:RQMZT/ji
なんでもかんでも舶来モノを崇めるのはやめよう。
100名無しさん@お腹いっぱい。:04/12/20 18:40:27 ID:pLXObVlX
>>98
意味不明
101名無しさん@お腹いっぱい。:04/12/20 19:40:41 ID:y/k7rHG+
>>100

Webcatってこれだよ。

NACSIS Webcat
http://webcat.nii.ac.jp/

ただ、全文検索はできない。

NACSIS-ELSのほうがコンセプトとしては近いような気がするな。
http://www.nii.ac.jp/els/els-j.html

ただこれも全文検索はできない。
102名無しさん@お腹いっぱい。:04/12/20 21:17:16 ID:55rX6esB
なんかGoogle落ちてない?
103名無しさん@お腹いっぱい。:04/12/20 21:31:45 ID:c1b0IzJf
おか白
104名無しさん@お腹いっぱい。:04/12/20 22:32:05 ID:ect7jglq
どれぐらいの容量になるのかね・・・・ちょっと想像できない。
出来うることなら、2・3ペインのブラウザーがほしいところだな。
現行のブラウザーだと色々閲覧時面倒臭そうだし
 
あと、楔形文字とか象形文字とかどうやって表示させるつもりなんだ?
そういうのは対象外なのか?
105名無しさん@お腹いっぱい。:04/12/20 23:23:11 ID:+BolHDzI
>>104
全世界のウェブページのキャッシュよりは少なそうな気がする。
106名無しさん@お腹いっぱい。:04/12/21 08:35:36 ID:1vFMSX3G
>>104
画像でしょ。

一対一対応ではない新しい文字コード体系に期待。
107名無しさん@お腹いっぱい。:04/12/21 09:47:21 ID:Xo39vycH
>>106
>一対一対応ではない新しい文字コード体系に期待。
意味が分からん。
108名無しさん@お腹いっぱい。:04/12/21 14:14:59 ID:1vFMSX3G
符号化だけでは対応できない文字体系があるから。
109名無しさん@お腹いっぱい。:04/12/22 03:18:26 ID:G9vQ25W/
米blinkx、テレビ番組の全文検索サーチエンジン「blinkxTV」を発表
http://internet.watch.impress.co.jp/cda/news/2004/12/17/5843.htm

これもすごいよね。l
110もう一度。。。:04/12/22 03:19:09 ID:G9vQ25W/
米blinkx、テレビ番組の全文検索サーチエンジン「blinkxTV」を発表
http://internet.watch.impress.co.jp/cda/news/2004/12/17/5843.html
111名無しさん@お腹いっぱい。:04/12/22 06:03:16 ID:Yh1X0FB5
すげえな。
112名無しさん@お腹いっぱい。:04/12/22 07:46:27 ID:bxCJbAba
感動する前に、日本は字幕法とルビ法を制定しろ。
113名無しさん@お腹いっぱい。:04/12/22 10:41:51 ID:HV2OMYsS
技術の導入は簡単だけど、それをとりまく社会環境の導入は
一朝一夕ではできんもんなぁ〜
114名無しさん@お腹いっぱい。:05/01/01 11:51:09 ID:2ZNOpUEr
Googleが新年仕様になってる。
115名無しさん@お腹いっぱい。:05/01/01 11:52:08 ID:xzOUts/M
むかしは朝日新聞(ネット版)でも仕様を変えてたのに、もう
あの新聞にはそういう気もないらしい、だめですね
116名無しさん@お腹いっぱい。:05/01/02 15:22:20 ID:Z6Kt3SqE
知識欲旺盛な人には、良い時代がきますね。
しかし、検閲だけは、大きな問題だよ。
117名無しさん@お腹いっぱい。:05/01/04 08:02:42 ID:GVlL/zZ4
こんな途方もないテキスト量を
どうやってデジタル化するんだ?
118名無しさん@お腹いっぱい。:05/01/10 10:38:21 ID:l+W1rYkw
日本語もTRONで対抗だ
119名無しさん@お腹いっぱい。:05/01/11 20:58:00 ID:JifsbAnE
>>112

これですか。。。。

日本語は国際語になりうるか―対外言語戦略論 講談社学術文庫
鈴木 孝夫 (著)
http://www.amazon.co.jp/exec/obidos/ASIN/4061591886/250-3202881-1361034


積読なんですけど、読んだ方いらっしゃいます?
120名無しさん@お腹いっぱい。:05/01/12 09:34:14 ID:/d5OMrnx
>>119 タイトルだけ読んで反応。
日本語が国際語にならなくても全然困らないよな。
英語が母国語のやつらなんて、
内輪ネタが世界中に筒抜けみたいなもんだろ?
母国語+英語でいいんじゃないかなぁ。
121名無しさん@お腹いっぱい。:05/01/13 02:10:24 ID:FIAYw5/W
Google何でもありだな。おそろしや。
122名無しさん@お腹いっぱい。:05/01/13 02:18:42 ID:MCi5mDIx
>>1
>1のレスとか見てる限り解決しそうな気がしません。
ホントですね。ネット初心者が、上に書いたように検索エンジンのKWにトゥシーエイチが
ひっかかる事が多いので、それとなく読んでQ&Aだと思って質問書き込むと、
いじわるなレスがついて、、それを見て怒ってさらに荒れて。。。って感じですかね。

トゥーシーエイチ(*)で聞けば、回答が得られて便利!というのはすでにすたれつつあって、
やはりblogを見てトラバ回る方がよっぽど解決になると思います。

一時fushianaさんトラップという方法でネット初心者の方がアクセス元が判ってしまい、
騒ぎになってかわいそうでしたね。

(*)トゥーシーエイチとは現在一緒に仕事しているチャイニーズアメリカンの人が
発言してた言葉で、日本語で「2ちゃんねる」とかいうと正統化された(?)イメージがあるので、
僕は英語読みにしてます。
123名無しさん@お腹いっぱい。:05/01/13 12:21:48 ID:yhADMqND
>>122
なんかキモイ
124名無しさん@お腹いっぱい。:05/01/21 12:20:39 ID:BPndWW1w
age
125名無しさん@お腹いっぱい。:05/01/21 14:44:51 ID:wZ12tgOt
図書館の蔵書検索の使いづらいこと使いづらいこと。。

googleみたいな一社がまとめて請け負えばいいわけだ。
地域ごとに条件絞り込めたりしたら便利だな。
126名無しさん@お腹いっぱい。:05/01/29 23:21:57 ID:UiaEgiyX
age
127名無しさん@お腹いっぱい。:05/02/02 17:19:21 ID:sbTPcene
Googleの2004年度決算、売上高は31億8,900万ドルで前年から倍増
http://internet.watch.impress.co.jp/cda/news/2005/02/02/6319.html
128名無しさん@お腹いっぱい。:05/02/02 17:29:28 ID:8CYoJI56
まず聖書か
129名無しさん@お腹いっぱい。:05/02/07 19:06:48 ID:lV8p55Vx
これが完成すると、損をこうむる奴は意外と多い気がする。
130名無しさん@お腹いっぱい。:05/02/14 13:38:10 ID:HlkNKdJ2
The University Museum, The University of Tokyo
http://www.um.u-tokyo.ac.jp/en/
131名無しさん@お腹いっぱい。:05/02/15 05:03:50 ID:03+/WEWQ
132名無しさん@お腹いっぱい。
The University Museum, The University of Tokyo
http://www.um.u-tokyo.ac.jp/en/