【ネット】「見えなかった情報」を可視化--NII、論文300万件をGoogle検索対象に[07/05/25]

このエントリーをはてなブックマークに追加
1やるっきゃ騎士φ ★
国立情報学研究所(NII)が4月から、国内の学術論文情報300万件のデータベース
「CiNii」(サイニイ)をGoogle検索対象にした。同時に、データベースも検索エンジン
が見つけやすい形に変更。一般ユーザーが論文情報にアクセスしやすくした。

論文検索エンジン「Google Scholar」のコンテンツを整備・充実させたいGoogleの
思惑と、論文情報へのアクセスを増やしたいNIIの思惑が一致して実現した。
「Googleにすべてを持っていかれるのでは」??CiNiiに論文を提供している学会の一部
にはこう心配する声もあったというが、NIIが説得を重ね、構想から約1年後に公開にこぎ
つけた。

「『今すぐ無料で情報が欲しい』というWebを中心にした生活スタイルと、書籍や論文と
いう“知識の体系”とのすき間を埋めてきたい」と、NII助教の大向一輝氏は狙いを語る。

何かを調べる際、Web上だけで情報収集を済ませてしまう人は今や少なくない。そういう
人にとっては、論文にちょうどいい情報があったとしても、Web検索に引っかからない
限りその情報は「なかったこと」になってしまう。

NIIは、論文を検索しようと考えもしなかった人に、まずは論文の存在を知ってもらいたい、
と公開に踏み切った。「普通の人がものを探す中で、いきなりCiNIIに来ることはないだろう
が、Google検索でこのページにたどりつくことはあるだろう」と、NIIコンテンツチーム
係長の阿蘇品(あそしな)治夫さんは語る。

CiNiiに収録されているのは、全国271の学会・協会から提供を受けた論文と、大学の
研究紀要に収録された論文計約300万件。加えて一部雑誌の情報も検索できる。
ある論文が別の論文からどれぐらい引用されたかを参照できる「被引用数」データも
収録している。

今回、GoogleとGoogle Scholarで検索できるようになったのは、従来のCiNiiでも無料で
検索できた著者名や論文名、被引用数データなど、論文の冒頭に付けている概要紹介
(アブストラクト)だ。“Googleフレンドリー”にするため、HTMLやURLをGoogleが
検索しやすいよう書き換えたり、パーマネントリンクのURLをページ上に掲載したりする
などといった地道な作業も行った。

論文本文PDFの閲覧は従来通り、一部を除いて有料だ。「論文データベースを作るのは
手作業で、膨大な手間ひまがかかっている。論文の形式や料金体系も学会によって
さまざま。一括して無料にはできない」と大向氏は事情を説明する。

学会によってWebへの態度も異なる。「Googleにすべてを持っていかれるのでは」と
心配する学会もあり、全学会でOKを取り付けるまでは苦労もあった。ただ最終的には
「一般の人に論文の存在を伝え、学会を知ってもらえるのはメリットになる」という
意識が広まり、全学会から理解を得ることができたという。

公開した効果はすでに現れ始めた。Google経由で閲覧されたCiNiiのページビューは、
5月初めに10万を超え、直接CiNiiを訪れたユーザーの総PVを超えた。
「今後もGoogle経由のアクセスが増えていきくだろう」(阿蘇品さん)

もう少し続きます。
ソースは
http://www.itmedia.co.jp/news/articles/0705/25/news041.html
2やるっきゃ騎士φ ★:2007/05/25(金) 14:54:03 ID:???
-続き-
NIIは、その前身である「学術情報センター」時代から、国内の情報をまとめて発信する
という役割を担ってきた。図書館の蔵書情報検索サービス「Webcat」「Webcat Plus」
や、学術情報データベース「NII DBR」などを展開。書籍や論文の情報へのアクセス経路
を整備してきた。

2005年にスタートしたCiNiiも、そんな取り組みの1つだ。CiNiiのデータは、マシンで
情報を収集・整理するGoogleとは対照的。学者が手で書き、査読し、学会で精読し、
学会誌に掲載した論文に、被引用数を手作業で確認して作っており、何人もの人が
膨大な手間ひまをかけている。

人の手で整理した情報にはロボット検索にはない価値がある。「キーワード検索では、
周辺の分野や、他の情報との関連性が見えづらい。手作業で整理した論文情報のページ
には、著者や掲載誌、引用情報などが書かれているから、ここを起点にして周辺情報に
触れることができる」(大向氏)。各論文情報ページにはパーマネントリンクが付いて
おり、それぞれのページが情報ポータルになる。

大向氏は、私見と断った上でこう語る。「例えば、検索結果にAmazonの本を見つけて
実際に購入したり、検索で評判のいい店を見つけて行ってみたりと、Web検索が徐々に、
Webの中だけで完結しなくなってきている」。Webの中で存在を知り、実際に手に入れる
ために足を動かすという動きは、今後も進んでいくとの見方だ。

 「ロボット検索はすばらしいが、コンテンツを作っているのは個々の人。ものを
作っている人が報われるようにしたい」(大向氏)。NIIは今後も情報公開を進め、
Google以外のネット企業との連携にも積極的に取り組んでいきたいという。
-以上です-

cinii nii 論文情報ナビゲータ
http://ci.nii.ac.jp/cinii/servlet/CiNiiTop
3名刺は切らしておりまして:2007/05/25(金) 14:57:00 ID:Ys+FxvAt
なんかすげぇ前に見たことあるニュースだな
4名刺は切らしておりまして:2007/05/25(金) 15:00:51 ID:OLQqGKoL
漏れの出来そこないの卒論までヒットする悪寒
5名刺は切らしておりまして:2007/05/25(金) 15:07:07 ID:DffOpWhp
これで卒論のネタサガしか
6やるっきゃ騎士φ ★:2007/05/25(金) 15:09:11 ID:???
>>3さん、過去ログ倉庫にありました。
【学術/IT】国内論文(NII)300万件が「Google Scholar」で検索可能に [07/04/09]
http://news21.2ch.net/test/read.cgi/bizplus/1176119023/

さすがにここまでは重複検索はしていませんでした。
7名刺は切らしておりまして:2007/05/25(金) 15:21:59 ID:bqNXP7/o
論文の内容をもう少し見せてくれないかなー
タイトルだけヒットしても金払うとなると選びづらい
8名刺は切らしておりまして:2007/05/25(金) 15:51:49 ID:QUeAXTnZ
ネットの課金はどんなものでもまんどくせ
9名刺は切らしておりまして:2007/05/25(金) 15:57:39 ID:qpl/FsQm
>>8 ハゲド
10名刺は切らしておりまして:2007/05/25(金) 18:25:11 ID:tR+P45Ve
>>4
学会誌に載ったの?
11名刺は切らしておりまして:2007/05/25(金) 18:34:08 ID:qItDgDta
俺が大学院の時に学会で発表したアブストラクトが引っかかったよ。もうしにたいよ。
12名刺は切らしておりまして
(サイニイ)
今読み方知った