【アメリカ】NYタイムズは、ビッグデータの「ビジュアル化」でいかに洞察を引き出したか…ビッグデータ解析で導き出せる「口コミ効果」

このエントリーをはてなブックマークに追加
1Hi everyone! ★@転載禁止
ソース(ダイヤモンド・ハーバード・ビジネス・レビュー)
http://www.dhbr.net/articles/-/2512
http://www.dhbr.net/mwimgs/6/7/-/img_67a39ac3143858c50a254e59f57d53e0463868.png

 本誌2014年5月号(4月10日発売)の特集は、「アナリティクス競争元年」。組織を「データ巧者」にするさまざまな方法と事例を
紹介する。HBR.ORGからの関連記事の第1回は、ソーシャルメディア上のデータを分析・視覚化して洞察を引き出したニューヨーク
タイムズの例を取り上げる。

 データのビジュアル化は、いまや最も目を引く芸術表現の1つとなっている。作品のいくつかは、ニューヨーク近代美術館をはじめ
世界中のアート展にもお目見えするようになった。その一方で、ビジネスリーダーたちはこんな疑問を持っている――データの
ビジュアル化は、はたしてアクションに結びつくのだろうか?

 答えはイエスであると、私は考える。ニューヨークタイムズ研究開発室の常勤研究員として、私は世界で最も先進的なデジタル
研究開発チームの1つと協力し、ビッグデータから実行可能な洞察を引き出す方法を研究している。

>>2以降に続く)
2Hi everyone! ★@転載禁止:2014/04/10(木) 08:38:34.80 ID:???0
>>1の続き)

 「ビッグ」とはどの程度かというと、実に膨大な量だ。ニューヨークタイムズに言及しているすべてのツイートとリツイート、そして
ツイッターとフェイスブックで本紙記事にリンクされているすべての短縮URLへのクリックを記録する。それらを、ユーザーが本紙の
サイトに来て何をしたのかを示す閲覧履歴と組み合わせる。このプロジェクトは、広く知られる「情報のカスケード」(ある意見の真意
が精査されずに賛成意見の滝が形成されること)のコンセプトを用いたものである。カスケード2.0のようなものだと思ってもらえれば
いい。

 取り組みの目的は、ネット上のカスケードや会話がどんな時に本紙コンテンツの大量消費につながるのか(もしくは、つながらない
のか)を理解・予測するためである。そして、より重要な関心事項として次の点にも着目している。クチコミが読者数や定期購読、
広告収入にどのような影響を与えるのか。そうした会話に本紙がどう参加すれば、ユーザーとのつながり(エンゲージメント)を強化
できるのか。つながりを増やしてくれる、本当に影響力のある読者をどう見分けるか。本紙はそうした影響力のあるユーザーとどう
関われば、彼らのニーズ・関心に応えることができるのか。これらを統計解析した結果は、芸術的で美しいリアルタイムのデータ
ストリームに表すことができる。

 ストリームの取り扱い、セッションのアーカイブ化、情報の格納や操作は、それ自体が非常に困難な作業である。だがもっと難しい
のは、美しいビッグデータを、実行可能で意味のある、意思決定に役立つ知識に変換することだ。そして我々は、その知識を得るうえで
ビジュアル化が最も重要な道しるべの1つとなることを発見した。統計解析においてどこで何を探すべきかを知るために、ビジュアル化
は不可欠だったのだ。

(さらに続きます)
3Hi everyone! ★@転載禁止:2014/04/10(木) 08:38:53.87 ID:???0
>>2の続き)

?たとえば、次の3つのビジュアル化によって我々はある知識を得た。本紙の3つの異なる記事に対するツイートとリツイートのカスケード
を時系列で線と点で表し、これに各記事のクリックスルーのボリュームを同期させ、各カスケードの下に黒いグラフとして表示した。
それぞれの図は、記事とユーザーのつながりについて異なる現象を物語っている。

図1 http://www.dhbr.net/mwimgs/1/6/-/img_166b1405444eafbcaf17bf3f59576dc4132185.png

 1つ目の記事では、ツイッター上でかなりの会話が行なわれ、トラフィックの急上昇が数カ所で見られる。だがクリックスルーの数は、
ツイッターでの会話とは無関係に見える。トラフィックが最も上昇したのは(水色の部分)、ツイッターの活動が非常に少ない時だ。
この場合には、おそらくツイッターでの会話自体よりも、記事に関連したブログのリンク、あるいはこの記事に関する新たなニュース
記事のリンクがトラフィックを増加させたのだろう。

図2 http://www.dhbr.net/mwimgs/5/0/-/img_503ba643c1ccce41f584bac0fb86024a318611.png

 2番目の記事では、ツイッターで激しく会話が行なわれている。記事に関するツイートやリツイートは膨大だが、一方で記事自体への
トラフィックは非常に少ない。つまりツイッターで記事の話をしているが、記事を読むには至っていないということだ。これが起こりうる
のは、記事の内容がそれほど重要ではなくても、その主旨が議論や会話を沸騰させる場合だ。たとえば、事実分析や解説がほとんど
含まれていない速報が流れた時や、会話や議論が記事から離れて独自のコンテンツへと発展した時などだ。

図3 http://www.dhbr.net/mwimgs/6/7/-/img_67a39ac3143858c50a254e59f57d53e0463868.png

?3番目の記事では、ツイッターでの激しい会話と記事への関心が連動している。誰かが記事についてツイートやリツイートをすると、
フォロワーがクリックスルーによって記事にアクセスしている。ネット上の会話とサイトのトラフィックの緊密な連動が最も顕著になった
のは、図中に示された3名の「インフルエンサー」(影響力のあるユーザー)が2つの大きなトラフィックを引き起こした時である。

(さらに続きます)
4名無しさん@13周年@転載禁止:2014/04/10(木) 08:39:03.19 ID:2dpzeUhG0
プライバシーの侵害と紙一重だよなぁ。
5Hi everyone! ★@転載禁止:2014/04/10(木) 08:39:17.59 ID:???0
>>3の続き)

 このように、たった3件のデータのビジュアル化により、いわゆるバイラリティ(クチコミの効果)について重要なニュアンスを理解する
ことができた。ネット上のクチコミと記事へのアクセスの関係は、「バイラル現象」の一言ですべてを説明できるほど単純なものではない。
コンテンツの種類によって、異なるパターンが出現するのだ。

 とはいえ、ビジュアルがすべてを伝えるということではない。いくつかの明確な相関関係はたしかに見られる。しかしクチコミの影響に
ついて信頼性のある真の洞察を生みだすには、複雑な条件付き依存関係や、時間的な自己相関およびネットワーク自己相関をふまえ、
因果関係を説明する精緻な統計モデルを構築する必要がある。

 それでもこれらのビジュアルは、データのどこを見て、どのような問いをすればよいかを知るうえで役に立つ。より複雑なモデルを
構築するには、最適な構築場所を知る必要があるが、ビジュアルはそのためのヒントとなるのだ。

 カスケード2.0は、最新のアナリティクスに基づいて構築されるが、それにはデータのビジュアル化が必要になる。ビッグデータを
効果的かつ効率的に利用するには、重要な問いかけをして、不要な問いを避けることが不可欠だ。ビジュアル化なしでは、有用な解
を得るための問いを見つける効率が格段に落ちる。だからこそ、データのビジュアル化はデータ・サイエンティストにとって最も重要な
ツールの1つでなければならない。それは深くて暗い森の中を照らす明かりなのだ。

(原注:本記事のビジュアル化図表は、ニューヨークタイムズ研究開発室のクリエイティブ・テクノロジストであるニコラ・ハンゼルマン
による。)

HBR.ORG原文:To Go from Big Data to Big Insight, Start with a Visual August 27, 2013
http://blogs.hbr.org/2013/08/visualizing-how-online-word-of/

(終わり)
6名無しさん@13周年@転載禁止:2014/04/10(木) 08:39:51.95 ID:duHScEPX0
NYタイムスとか日本のスポーツ新聞にすら遠く及ばない発行部数なんすけど
7名無しさん@13周年@転載禁止:2014/04/10(木) 08:45:22.19 ID:BtNoKMMN0
記事の中で「クチコミ」という単語が4回使われてる
理由は米の口コミサイト「Yelp」が日本にできたから

世界最大級の口コミサイト「Yelp」が日本上陸 「食べログ」「ぐるなび」終了?   ※実名投稿
http://maguro.2ch.net/test/read.cgi/poverty/1397085818/

>>1はステマ記事です
8名無しさん@13周年@転載禁止:2014/04/10(木) 08:49:01.03 ID:je7FEFsB0
ビッグデータはデータ対象者に使用料払えよ
9名無しさん@13周年@転載禁止:2014/04/10(木) 09:58:09.72 ID:a9TITT0h0
日本でNYタイムズというとオオニシ・反日・朝日と仲良しくらいしか思い浮かばない

ttp://newyork.areaconnect.com/statistics.htm
Chinese 361531 4.51%
Korean 86473 1.08%

ttp://en.wikipedia.org/wiki/File:Race_and_ethnicity_New_York_City.png
BlackをよけWhiteの近くに忍び寄るAsian
10名無しさん@13周年@転載禁止:2014/04/10(木) 10:47:19.11 ID:FT+URsf70
ロコミ?
暴カニ男や原子カムラみたいなの?
11名無しさん@13周年@転載禁止:2014/04/10(木) 17:35:17.57 ID:mr2U1g/70
アメリカ版アカヒ
12名無しさん@13周年@転載禁止:2014/04/10(木) 17:38:42.93 ID:Xzncg+gB0
>> 6
そっか、口コミもそうか.
「ビッグデータ」がそれっぽいと記事を読んでた.

中には役立つ情報も得られるんだろうが、商売として
費用対効果が十分にあるものなのか?あるいは、ただ、
流行研究項目でテーマやお金をひっぱりたいだけなのか?
「ビッグデータ」についてはまだまだ半信半疑.
13名無しさん@13周年@転載禁止:2014/04/10(木) 17:39:27.08 ID:cqnPmXSf0
デビッド・マニング「せやな」
14名無しさん@13周年@転載禁止
個人情報を扱う会社がネット工作することは、個人情報を適当に扱う可能性が高いため、禁止の法律をつくるべき。