【工学】インターネット上の大量な情報を分析・整理し信頼性判断を支援する技術を開発
1 :
依頼21-282@あんたレスφ ★:
インターネット上の大量な情報を分析・整理し信頼性判断を支援する技術を開発
日本電気株式会社(以下、NEC)、東北大学(以下、東北大)、奈良先端科学技術大学院大学(以下、奈良先端大)、
横浜国立大学(以下、横浜国大)は、独立行政法人情報通信研究機構(以下、NICT)情報信頼性プロジェクト(注1)
の協力を得て、インターネット上の大量のテキスト情報を分析・整理し、ある意見について、その判断の裏付けや
参考となるような情報を複数の観点から表示することで、情報信頼性の判断を支援する技術を共同開発しました。
このたび、本技術に関して広く意見を収集するため、本技術を用いて開発した試作システムを、本日より試験的に
インターネット上で公開します(注2)。
なお本成果の一部は、NICTの委託研究「電気通信サービスにおける情報信憑性検証技術に関する研究開発」によるものです。
現在のインターネット情報検索では、検索結果が大量に表示され、利用者がその中から信頼性や価値の高い情報を探し出し、
判断の材料とすることが困難になっています。
開発した技術は、利用者が気になる意見を入力すると、関連するネット上の大量のテキスト情報を分析・整理し、
その信頼性や有用性判断の裏付けとなるよう、賛否やその根拠となる意見、意見の対立点の解説、人々の意見に影響を与えた
出来事を提示します。利用者はこれらを基に、一つの意見に偏らない広い観点から情報を得ることができるため、
ネット上に溢れた情報の信頼性判断に役立てることができます。
本技術を応用することで、例えば、検索結果や商品の説明ページ、体験談などで見つけた気になる意見に対して、
関連する他の意見を容易に調べることが可能となります。また企業においても、商品のアンケートやブログなど個人の意見を
分析・整理できるようになり、マーケティングや新しい情報提供サービスへの応用が期待できます。
本技術の特長は以下の通りです(各出力イメージは別紙参照)。
>>2 に続く
別紙、出力イメージ pdfファイル
http://www.nec.co.jp/press/ja/1101/images/3101-01-01.pdf 注1 情報信頼性プロジェクト:
URL:
http://kc.nict.go.jp/project1/ 注2 実証実験用試作システムの公開について:
試作システムURL:
http://ici.wisdom-nict.jp/ 公開期間:2011年01月31日〜2011年03月31日
(試作システムのサーバ運用上の都合により、上記期間内であっても、短期間システムを停止させていただく場合がございます。ご了承下さい。)
▽ ソース NAISTプレスリリース ※本リリースは、日本電気株式会社、国立大学法人 東北大学、国立大学法人 奈良先端科学技術大学院大学、
国立大学法人 横浜国立大学の共同リリースです。
2011年1月31日
http://www.naist.jp/pressrelease/detail_j/topics/1062/
2 :
あんたレスφ ★:2011/02/03(木) 21:36:35 ID:???
>>1 の続き
1.意見の論理的な裏付けを分析・可視化する「言論マップ化技術」を開発
(東北大、奈良先端大の成果)
利用者が入力した気になる意見に関して、WEB上の他の人々の賛否、根拠を論じた意見など、論理的に関係のある情報を
1億以上のWEBページから分析。それらの関係を「言論マップ」として可視化することで、論理的な観点から気になる意見の裏付け
として利用できるような情報を提示。
2.重要な意見間の対立点の読み解き方を解説する「整理・要約技術」を開発
(横浜国大の成果)
1億以上のWEBページから重要な意見を抽出して、言論マップ化技術と組み合わせ、重要な意見間の対立点をどのように
理解したら良いか整理して、読み解き方を解説した要約レポートを提示。
3.意見の変化の傾向や変化の要因を分析する「時系列分析技術」を開発し、1〜3の要素技術を統合(NECの成果)
気になる意見に対する他の人々の意見の変化を時系列に分析し、意見の変遷と意見が変わった要因を提示。
また1〜3の要素技術を統合して、信頼性判断を支援するシステムを開発。
なお、本技術の実現にあたって、NICTにて独自に収集・インデックス付与している1億以上の日本語WEBページを、
実験開発用データおよび、分析対象文書として活用しています。
昨今、様々なWEBサービスにより得た情報を活用して意志決定する機会が増えています。しかし、偏った意見や誤った情報も多く、
専門知識を持たない利用者が、信頼性や価値の高い情報を正しく判断したいというニーズが高まっています。
このたび開発した技術は上記のニーズに応えるものです。
今後は、試作システムの一般公開等を通じて、利用者のニーズの詳細な分析を行うと共に、本成果のさらなる高速化、
高精度化に向けて、研究開発を進めてまいります。
以上、依頼を受けて立てました。
3 :
名無しのひみつ:2011/02/03(木) 21:40:52 ID:dPV77aac
メタ認知できないものは分類できないだろ、つかえない技術
4 :
名無しのひみつ:2011/02/03(木) 21:41:01 ID:8NByeOi4
WebBot予言
5 :
名無しのひみつ:2011/02/03(木) 21:46:30 ID:tjIHdFIl
釣りも認識出来んのかね?
褒め殺しとかあえてネガティブなレスするとかよくあるけど
6 :
名無しのひみつ:2011/02/03(木) 21:49:20 ID:FntjMjP2
信頼性判断の支援! そういうものもあるのか。
7 :
名無しのひみつ:2011/02/03(木) 21:50:39 ID:6eqxMAGg
そのシステムが信頼できるのかどうか、どうやって判断するんだ?
8 :
名無しのひみつ:2011/02/03(木) 21:51:53 ID:EBSlfwpA
どうせ出典不明の情報も頻出や信頼されてそうな自演で
翻弄される程度なんだろ
9 :
名無しのひみつ:2011/02/03(木) 21:55:36 ID:FntjMjP2
10 :
名無しのひみつ:2011/02/03(木) 21:55:41 ID:dzxtSXmJ
とりあえず
宇宙人がいるかネットで調べてくれ
11 :
名無しのひみつ:2011/02/03(木) 21:59:39 ID:2YuW7Sry
このアルゴリズムを阻害するネット情報掲載&リンクを構築することもできる
∴いまいち
12 :
名無しのひみつ:2011/02/03(木) 22:08:31 ID:oEgKjYfr
自分で絞りこんで
判断するのが楽しいのに
13 :
名無しのひみつ:2011/02/03(木) 22:17:01 ID:FE62md+8
googlezonという巨大企業がでてくる未来予測の動画で、ネット上から情報を集めて、
個人に合わせた記事を書くというアルゴリズムがあったのをおもいだした。
14 :
名無しのひみつ:2011/02/03(木) 22:30:48 ID:azb+XRfb
それより画像データから類推して元ネタの情報を検索できるサービスを開発してくれよ
15 :
名無しのひみつ:2011/02/03(木) 22:33:25 ID:z7p9HdWJ
立て読みとか皮肉も解析できんのかね。
16 :
ぴょん♂:2011/02/03(木) 22:33:44 ID:Zs9FRhYq
自動工作機械か・・・
17 :
ぴょん♂:2011/02/03(木) 22:35:24 ID:Zs9FRhYq
2ちゃんねるでテストして問題なければ准教授に昇進だな
18 :
ぴょん♂:2011/02/03(木) 22:39:47 ID:Zs9FRhYq
19 :
名無しのひみつ:2011/02/03(木) 22:46:07 ID:FHrJEOWH
20 :
名無しのひみつ:2011/02/03(木) 23:04:06 ID:1gTYXjhw
こりゃ微妙だな。
スパム業者や、コンテンツファーマーを舐めてんだろ?
21 :
名無しのひみつ:2011/02/03(木) 23:05:39 ID:TNunQowQ
22 :
名無しのひみつ:2011/02/03(木) 23:39:01 ID:QsR4j3g0
信頼性判断を支援する技術・・・まずその技術そのものが信頼できないんだが
23 :
名無しのひみつ:2011/02/03(木) 23:54:35 ID:FBEqBqRT
そびえ立つクソだな
24 :
名無しのひみつ:2011/02/03(木) 23:59:18 ID:6tfsPVpz
Googleに聞いた方が早い気がするな
25 :
名無しのひみつ:2011/02/04(金) 00:38:57 ID:4CQfioz1
クソの役にも立たない情報しか無いアフィブログを排除してくれるなら良い技術
26 :
名無しのひみつ:2011/02/04(金) 01:10:10 ID:CCNoa0YZ
この情報こそが粗悪だろ
27 :
名無しのひみつ:2011/02/04(金) 11:00:44 ID:66kL4L5F
否定的な意見を書こうと思ったけど、サイトみたら結構面白い。
数多の亜流検索サービスと比べるとずっと面白い。
検索結果にゴミもあるし、量が少ないし、結局一番慣れたグーグル使うけど。
自動検索の問題は、こういうサービスが普及しはじめると、
それを利用したSEOとかいってゴミがたちまち溢れ出てくること何だよね。
28 :
名無しのひみつ:2011/02/04(金) 18:47:18 ID:rGLcQSXL
これの、欠陥は情報精度を多数決に頼ってるとこ。
ごく少数の人間しか知らない事実があるとする。
それを、小耳にはさんだ人間がこの検索システム使っても、多くの人間にとって
事実と認識されてなく、反対情報の方が多かった場合この情報はガセって思ってしまうよね。
事実かどうかを多数決に頼るのは、かえって危険なこともある。
29 :
名無しのひみつ:2011/02/04(金) 19:14:40 ID:FBHIak/b
中国政府が悪用しような技術だな。
30 :
名無しのひみつ:2011/02/04(金) 19:38:17 ID:eq9dS+Q2
最近、グーグルの検索結果の上位がグーグルアフィだし
31 :
名無しのひみつ:2011/02/04(金) 20:54:58 ID:F1L/O+FQ
32 :
名無しのひみつ:2011/02/04(金) 23:47:05 ID:rGLcQSXL
上で、欠陥と言ってしまったけど、二元的な多数決に縛られなければ、集合知として充分機能しそう。
二元論的、解だけじゃなく、摺合せ、問題点を明確にさせるには、優れた機能があるかもしれませんね。
時系列で、情報を追えるのもユニークだし。
大衆搖動に使われないことを、願います。 なんちって・・。
33 :
名無しのひみつ:2011/02/05(土) 12:18:40 ID:TTiHxwAr
これ、賛成、反対って分け方じゃなくて、肯定、否定って分け方で、
企業、外貨の情報分析にしたら、そのまま、株価、FXの分析予測として使えるんじゃない。
時系列で、情報追えるんだもの。そういう使い方の方が向いてる気がする。
ウエヴポットも、最初株価予測のプログラムの為に開発されたらしいけど。
これも、進化したら、そういう予言機能もあり?
34 :
名無しのひみつ:2011/02/05(土) 12:23:28 ID:TTiHxwAr
↑肯定(ネガティブ)・否定(ポジティブ)ってことね。
35 :
名無しのひみつ:2011/02/05(土) 12:39:32 ID:Uap+ZZnv
前にツイッター内のテンションで株価が予想できたって記事見た気がする。
36 :
名無しのひみつ:2011/02/05(土) 12:42:58 ID:1rbGLCm6
HALのレベルでもない
IBMなら、もっとマシな研究やってる
37 :
名無しのひみつ:2011/02/05(土) 12:44:26 ID:20EJ37kc
取り敢えずエジプト情勢を分析してくれ
38 :
名無しのひみつ:2011/02/05(土) 12:51:10 ID:0EDA4i2U
”ソニー 故障”でググればいいんでね
39 :
名無しのひみつ:2011/02/05(土) 12:59:41 ID:jslB0Ebv
2chの投稿から役に立つ情報を抜き出すソフトを作れ。
40 :
名無しのひみつ:2011/02/05(土) 13:07:28 ID:6i5EzRtU
>>33 企業や金融商品に対する評価をムーディーズとか格付けしてるみたいに、
情報に対する格付けをしていけば、サイトに対する格付けが出来るね。
ウェブが少しずつ現実の世界に近づいていくから、そういうビジネスは儲かるだろう
41 :
名無しのひみつ:2011/02/05(土) 13:26:28 ID:N7udcJgR
これで信頼性がある結果が得られるとして、その結果で評判の悪い商品を
評判が良くなるように嘘情報を流すのが広告会社だろ。このシステム結果でさ。
結局、いたちごっこで、広告情報で溢れかえるネットに、益々ゴミ情報が
増えるってことじゃん。ネット広告に規制かけろよ。
42 :
名無しのひみつ:2011/02/05(土) 14:15:19 ID:6ZB+qbe7
いでよ、ハリ・セルダン。
このツールを使って、世界を制御するのだ!
43 :
名無しのひみつ:2011/02/05(土) 14:29:58 ID:N7udcJgR
こんなのが昨年通ってる。結局DPIの効果の検証にでも使うんだろ。
【広告】「ネット全利用履歴もとに広告」総務省容認 課題は履歴情報流出対策(2010/05/30)
>インターネットでどんなサイトを閲覧したかがすべて記録される。
>初めて訪れたサイトなのに「あなたにはこんな商品がおすすめ」と宣伝される――。
>そんなことを可能にする技術の利用に、総務省がゴーサインを出した。
>ネット接続業者(プロバイダー)側で、情報を丸ごと読み取る技術を広告に使う手法だ。
>だが、個人の行動記録が丸裸にされて本人の思わぬ形で流出してしまう危険もある。
>業者は今後、流出を防ぐ指針作りに入る。
>
> この技術は「ディープ・パケット・インスペクション(DPI)」。
>プロバイダーのコンピューター(サーバー)に専用の機械を接続し、
>利用者がサーバーとの間でやりとりする情報を読み取る。
>どんなサイトを閲覧し、何を買ったか、どんな言葉で検索をかけたかといった情報を分析し、
>利用者の趣味や志向に応じた広告を配信する。
>
> DPIは従来技術に比べてより多くのデータを集められるため、
>こうした「行動ターゲティング広告」に利用すると広告効果がさらに上がると期待されている。
44 :
名無しのひみつ:2011/02/05(土) 14:49:15 ID:F6/iFJSD
45 :
名無しのひみつ:2011/02/06(日) 16:23:41 ID:IOI6ARwx
「菅直人の息子はニート」とかでも一応回答が出てくんだなw
46 :
名無しのひみつ:2011/02/06(日) 16:29:28 ID:IOI6ARwx
検索結果があまりにも馬鹿っぽいから楽しめるなw
47 :
名無しのひみつ:2011/02/06(日) 16:47:50 ID:Br3HV4xv
アルファブロガーとやらの影響力も数値化されそうだな
48 :
名無しのひみつ:2011/02/06(日) 16:57:21 ID:mSdPouXM
>>43 串通して阻止するサービスが流行りそうだな。
無差別検索して無力化でもいい。
49 :
名無しのひみつ:2011/02/06(日) 17:07:54 ID:IH6NbaFx
2chはどうしようもないだろ。ウンコの塊だし。
50 :
名無しのひみつ:2011/02/06(日) 17:44:10 ID:cchkTQVK
最新のエロ動画とみてオナルのと妻と普通のSEXするのとどっちがいい
限りなく
最新のエロ動画みてオナル>>>>>>>>>>>>>>
>>>>>>>>>>>>>>>>>>>>>>>>>>
>>>>>>>>>>>>>>>>>>>>>>>>>>
>>>>>>>>>>>>>>>>>>>>>>>>>
妻と普通のSEX
51 :
LポイウY:2011/02/06(日) 18:07:47 ID:XUZLsKhK
朝鮮韓国人は、パクリばかりしている、企業大学等の研究室にちかずけるな
日本に悪影響をあたえている韓国朝鮮人を日本人は、警戒追放すべきだ「
52 :
名無しのひみつ:2011/02/07(月) 00:13:55 ID:RQIFsMup
うさんくせー
53 :
名無しのひみつ:2011/02/07(月) 02:09:35 ID:nmgLoBlZ
まあ、ネットに公開されているのは大半公開知のうすっぺらい知識であって、ほとんどゴミの塊だからな。
こういった技術はあてにならないが、ないよりかはあったほうがいいな。
54 :
名無しのひみつ:2011/02/07(月) 07:50:05 ID:ilNAPDbf
googleの中の人が見たら鼻で笑いそうな気がする
55 :
名無しのひみつ:2011/02/07(月) 09:37:32 ID:QYQjAwr+
こういう感じで2chの意見のマップ化もおもしろいんじゃねぇかな
分析対象文書として1億以上の日本語WEBページを独自に収集してるらしいけど、2chは入ってないみたいね・・・
56 :
ぴょん♂:2011/02/07(月) 09:58:13 ID:hutmrRVT
>>48 これはアメリカなんかだとISP内でやっていることなんだな。
57 :
名無しのひみつ:2011/02/07(月) 10:06:30 ID:AlzTvdsD
10回本当の事言うより
10000回嘘を言う方が正当化されるのか
58 :
名無しのひみつ:2011/02/07(月) 11:35:49 ID:u/o3OrCx
>1
こういうツールは有意義だとは思うんだが、
もしもあるツールが無視できないくらいにメジャーになると
そのツール向けの工作・チートも開発される。
Google上位表示工作は有名だよね
マイナーなOS向けのウィルスが少ないのと同様に
ツールがメジャーにならない方が信頼性の高い状態を維持できる
59 :
名無しのひみつ:2011/02/07(月) 11:57:10 ID:u/o3OrCx
>>40 そして、金融格付けでサブプライムローンに関して起きたみたいな
格付け価値に対する詐欺的錬金術が編み出されるわけだな
60 :
名無しのひみつ:2011/02/12(土) 01:10:03 ID:TzdytO2C
芸能人の実力を数値するシステムができないかな。
61 :
名無しのひみつ:2011/02/12(土) 01:11:14 ID:TzdytO2C
数値→数値化
62 :
名無しのひみつ:2011/02/12(土) 01:29:41 ID:/uvvTfpZ
開発元がGoogleなら興味有るが
NECじゃあねぇ・・・
63 :
名無しのひみつ:2011/02/12(土) 02:23:35 ID:NRlBI7PO
偏るからネットはおもしろいんだよ。
90年代のネットは最強だった まさにアングラの世界
64 :
名無しのひみつ:2011/02/13(日) 01:49:21 ID:cDVGlC2z
無能すぎて笑える
公開する意味あんのかこれ
65 :
名無しのひみつ:2011/02/13(日) 16:02:03 ID:cnvX4NB0
個人的には2次ソース、3次以降のソースを排除あるいは
順序付けすることができる検索エンジンの方が何倍もありがたい。
例えば音楽CDのタイトルで検索したら、通販サイトが大量に上位に
羅列されて、アーティストやレーベルの公式サイトが遥か下位に
なっているのはいつもイライラさせられる
66 :
名無しのひみつ:2011/02/17(木) 13:03:17 ID:LsmxLEbG
石原 おまえの太陽の季節はどうなんだよ
当時 不良の生態だろうが 水着で裕次郎と奥さんのキスシーンもあったな
67 :
名無しのひみつ:2011/02/17(木) 13:05:32 ID:LsmxLEbG
68 :
名無しのひみつ:2011/02/22(火) 00:12:40.46 ID:V53yfdcD
検閲はしてはならない。
69 :
名無しのひみつ:2011/02/22(火) 01:04:56.43 ID:SvR5EBja
検閲より。まず翻訳のほうが先だろ。
70 :
名無しのひみつ:2011/02/22(火) 01:30:17.97 ID:0lju7CxJ
多数決か・・・中国ネットに使われるよ。
71 :
名無しのひみつ:2011/02/22(火) 06:14:47.35 ID:BmzKTi8c
例えばトクアの情報を数値化出来たらキチガイであると言う情報の信頼性が明確になると言うことか。
72 :
名無しのひみつ:2011/02/22(火) 07:55:31.14 ID:eBRW4/Yj
73 :
名無しのひみつ:2011/02/22(火) 08:29:03.09 ID:tURH74fz
はいはい、NECお得意の金の無駄遣い。
74 :
名無しのひみつ:2011/02/22(火) 08:42:45.71 ID:U8m9U+Ua
楽天のうんこ検索エンジンをなんとかして欲しい。
せめてカテゴリ登録くらいきちんとしろ
75 :
名無しのひみつ:2011/02/22(火) 20:48:30.97 ID:UO6EdOYX
俺はVIPメーターだけで充分足りてるがwww
76 :
名無しのひみつ:2011/02/22(火) 20:53:43.89 ID:ClcX+9rx
ただし英語に限る!
77 :
名無しのひみつ:2011/02/25(金) 05:29:14.69 ID:L03nDjAG
高校生(中学生も)がそういったことをやろうと起業したとか、TVでやってたけど?
なんだっけかな、ITネイティブとかそういう言い方をしてたかな。
78 :
名無しのひみつ:2011/02/25(金) 05:54:10.09 ID:wd8JhrUd
自分で裏取らずに何を信頼するのか
79 :
名無しのひみつ:2011/02/25(金) 06:37:42.09 ID:Dz4pyk4i
>>78 > 自分で裏取らずに何を信頼するのか
ソレがネットの基本であり心理だよな〜
自分で裏取るから信頼出来るわけだし
それが出来なきゃ旧世代の情報媒体の新聞・テレビと変わらん
調べる為の支援システム自体は批判しないが、どーせ一部のワードにはフィルターかけてんでしょ?
携帯アクセスだと確認出来ないけど政治、領土、特亜関連とかさ
80 :
名無しのひみつ:2011/02/25(金) 07:08:49.86 ID:0sUTW4l2
インチキアフェリエイトで更に信用低下!
81 :
名無しのひみつ:2011/02/28(月) 04:15:38.29 ID:lsgS/qZL
>>78 ネットで裏を取ろうと情報検索したら、
訴えてる記事の量20%、否定する記事の量80%だった、としたら何を基準にするよ。
どっちが捏造記事?
82 :
名無しのひみつ:2011/02/28(月) 20:00:59.45 ID:6xO2iT4E
まあ、文章解析してそれが賛成意見なのか、反対意見なのか、区別を付けるだけでも結構大変だけどね。
ただ、デモ画面は選択タブがあるだけで、分析テキストを自由に入力できないというのは、多分、大多数の入力データの解析はできないような気がする。
83 :
名無しのひみつ:2011/02/28(月) 20:04:41.19 ID:6xO2iT4E
>>55 既にある。
パターンとしては、価格コムの口コミデータを解析して、商品動向チェックに使うマーケティングツール。
あるいは2chの書き込みデータを解析して、企業に対する悪評などを早期に把握するための風評監視ツール。
どちらも複数の企業が月額料金10万程度で企業向けにサービス提供してる。
84 :
名無しのひみつ:2011/02/28(月) 20:32:27.02 ID:i3x+ddSY
反対意見が無かったり誰もが信じてる=信頼性が高い
とは言い切れないんじゃ?
85 :
名無しのひみつ:2011/02/28(月) 23:21:44.37 ID:4M+MTOz8
86 :
名無しのひみつ:2011/03/09(水) 00:59:12.58 ID:PukNfAEt
反対意見者や意見に賛成しない者を物理的に消滅させれば……進歩が遅れる
87 :
名無しのひみつ:2011/04/01(金) 09:44:44.25 ID:AlzANkVa
原発関連で信頼性のある情報をさっさと抽出しろよゴルァ!
言ってみただけ。
88 :
名無しのひみつ:
>>1 これは信頼性と言っても結局、前例主義に基く信頼性で、
新しい事には対処出来ないシステムだな。