米国Googleは9月16日、認証システムである「CAPTCHA」を提供する米国reCAPTCHAを買収し、
何千万冊もの書籍および雑誌をスキャンする大規模な取り組みを加速させる計画を発表した。
CAPTCHA(Completely Automated Public Turing Test to Tell Computers and Humans Apart)は、
ランダムに選択した単語を画像として表示し、それをユーザーに入力させる認証システムだ。
こうした作業は人間にとっては簡単だが、コンピュータが正確に実行するのは難しい。
これにより、スパマーやマルウェア作者による自動アカウント登録を防止している。
CAPTCHAは現在、WebメールやSNS(ソーシャル・ネットワーキング・サービス)など、
Web上のサービスのアカウントを取得したり、オンライン・フォーラムにコメントを書き込んだりする際に利用されている。
かねてからGoogleは、「Google Books」および「Google News Archive」サービスという、
2つの大がかりなプロジェクトを推進している。
ReCAPTCHAは、同社の認証サービスを、書籍および雑誌のデジタル化に応用しており、
今回の買収についてGoogleは、「ReCAPTCHAのこうした点に魅力を感じた」とコメントしている。
ReCAPTCHAは、スキャンした印刷物から単語の画像を抽出している。
ユーザーがCAPTCHAを使うたび、そうした単語が平文化されていき、
インデックス化されたのちに検索エンジンで検索できるようになるという仕組みだ。
ReCAPTCHAの共同設立者のひとりであるルイス・フォン・アン(Luis von Ahn)氏と
Googleの製品マネージャーを務めるウィル・キャスカート(Will Cathcart)氏は、
Googleの公式ブログに、「われわれは、Google製品を詐欺やスパムから保護するためだけでなく、
書籍および新聞記事のスキャン作業にも適用していくつもりだ」と記した。
なおReCAPTCHAのサービスはおよそ10万のWebサイトで採用され、
過去に発行されたNew York Times(新聞)のデジタル化にも貢献している。
http://www.computerworld.jp/topics/google/162709.html 依頼ありました
http://pc11.2ch.net/test/read.cgi/pcnews/1252558163/40