【韓国】成長する音声認識技術市場、韓国語は認識率低く[05/13]

このエントリーをはてなブックマークに追加
1ロンメル銭湯兵 ★@転載禁止
「私の声、聞こえてる? ドアを開けて」。「悪いが、デイブ。それはできない。あなたとフランクが私を殺そうとしているのを知っている」。
 世界的な名将スタンリー・キューブリック監督が1968年に制作した空想科学(SF)映画『2001年宇宙の旅』に出てくるセリフだ。
 声の主人公は木星に向かうディスカバリー号の船長デビッド・ボーマンと人工知能コンピュータ「HAL−9000」だ。HALはあたかも
信号の赤信号または一つ目小僧のような姿で、船長のボーマンとチェスを楽しみ、対話をしながら宇宙船を統制する。しかしある時、
エラーのために混乱し、作動を止めようとする人間を攻撃する。

この映画から半世紀近く過ぎた現在、「話すコンピューター」はすでに映画の中の想像や研究室だけの話ではない。スマートフォンなど
モバイル機器に人工知能基盤音声認識機能が入り、本格的な「手の中のアシスタント」時代が開かれていることだ。

米アップル社が2011年にアイフォン向け知能型音声認識サービス「Siri」を試験サービスして以降、世界トップ圏の情報通信(IT)企業は
競って音声認識と人工知能研究に没頭している。中国のような後発走者が猛追撃してくるほど、スマート機器のハードウェア競争が限界に
達したのも刺激になった。特に今年に入ってスマートウォッチなどウェアラブル機器とモノのインターネット(IoT=Internet of Things)市場が
本格化し、「音声認識と人工知能」は核心機能に浮上している。デスクトップやノートブックは入力装置としてキーボードを使えばよいが、
ウェアラブルコンピュータやモノのインターネットは「音声」で指示するのがはるかに便利であるからだ。このためスマートフォンはもちろん、
最近発売されているスマートウォッチ、グーグルグラスなどはほとんどの人工知能に基づいた音声認識機能を付けている。

市場調査会社BCCリサーチによると、世界音声認識技術市場規模は2011年にすでに470億ドル(約48兆2200億ウォン)にのぼり、
今後も年平均16.2%ずつ成長し、2017年には1130億ドルに達する見込みだ。

アップルは昨年9月、新しいモバイル基本ソフトiOS7を出し、Siriに付いていたbeta(テストサービス)文字を切り離した。もう技術を整えて
正式サービスができるという自信の表れだ。今年3月に発売した車両用iPhoneソリューション「CarPlay」は、Siriを活用した音声認識が
代表的な機能だ。運転中に音声で指示すれば、車が運転手の声を認識して電話をかけ、地図も見せる。退屈な時に冗談を言えば適当に
返事もする。例えば「私は酔った」と話せば、「私があなたを家につれていくことを期待しないでほしい」と答える。

グーグルの音声認識機能は2012年グーグルグラスを公開しながら作った動画広告(CF)で大きな関心を集めた。広告で主人公は
音声だけで友人に文字を送り、公演チケットを購入し、地図を検索し、写真を撮り、音楽プレーヤーを消す。スマートフォンの
アプリケーションとして出てきたグーグル翻訳機は80以上の言語を音声に通訳する。アンドロイドフォンで見ることができる
「グーグルナウ」は、位置情報と使用者の個人情報を利用し、使用者が尋ねる前に必要な情報を提供するという点でSiriを上回る。
 例えば、出勤する際、「今日は雨が降って渋滞するので乗用車より地下鉄を利用するのがよい」と助言する。

モバイル分野で一歩遅れていた米マイクロソフト(MS)も今は速かに動いている。先月初めMSはサンフランシスコで開催された開発者会議で、
スマートフォンOS「ウィンドウズ ・フォン8.1」のアップデート計画を発表し、ウィンドウズ音声認識機能「Cortana(コルタナ)」を出すと明らかにした。
>>2以降へ続く)

中央日報/中央日報日本語版 2014年05月13日16時48分
http://japanese.joins.com/article/265/185265.html?servcode=300&sectcode=330
2ロンメル銭湯兵 ★@転載禁止:2014/05/14(水) 00:20:49.30 ID:???
>>1の続き

Siriとグーグルナウ、Cortanaの共通点は、使用者が使うほどさらに賢くなるという点だ。音声認識サービスが
使用者の個人情報と各種利用データを保存し、これに基づいて自ら学習するため可能なことだ。

問題は認識率だ。現在、英語の場合は認識率が高いほうだが、韓国語を含む他の言語はまだ前途が長い。
 音声認識機能を1、2回使って失望した後、使用しなくなる人も少なくない。

このためグーグルは2012年末、世界的な発明家で人工知能分野の大家レイ・カーツワイル氏を迎え、
音声認識機能の進化速度を高めている。カーツワイル氏は「5−8年以内にグーグル検索エンジンが革新的に
変わるはずで、2029年には人のように長くて複雑な質問までも理解し、答えることができるだろう」と話した。

では、サムスン電子・LG電子など韓国企業はどうか。両社ともにグーグルのアンドロイド体制を使用しているため、
音声認識機能を別途に開発する必要がないように見えるが、実際は両社とも独自の音声認識機能の開発に力を
注いでいる。グーグルの音声認識機能が韓国語サービスと自然に互換されるうえで限界があるうえ、テレビや
冷蔵庫など家電機器をインターネットにつなげようという計画のため、グローバル競争で優位を占めるためには
独自の音声認識機能開発が必須だ。ただ、国内企業の音声認識サービスはグーグル・アップルとは違い、
使用者の個人情報を収集せず、また、これに基づいて自ら学習する機能がないため、現在としては“手の中の
アシスタント”となるには限界がある。

LG電子は2012年、国内で初めて音声認識機能「Qボイス」を搭載したスマートフォンOptimus LTE2を出した。
 音声で電話をかけるほか、文字伝送・写真撮影・音楽再生・アラーム設定・日にち確認など計20種類の分野で
作業を遂行できる。例えば、文字伝送の場合「OOに明日3時に会おうと文字メッセージを送ってほしい」と命令すれば、
そのまま遂行する。インターネットを通じて望む情報を検索したり、しりとりなどひまつぶし用としてQボイスと対話することも可能だ。

LG電子MC事業部のクァク・ジェド部長は「現在、音声認識率は80%程度」とし「まだ遊びレベルで音声認識機能を
使う人が多いが、遠からず本当に手の中のアシスタントの役割をする時がくるだろう」と述べた。今後5年以内にスマートフォンで
顧客が望む機能を音声ですべて処理できる水準へと発展させるというのがLGの目標だ。

サムスンも2012年、ギャラクシーS3に初めて搭載した音声認識機能「Sボイス」を進化させている。音声命令だけで
電話・文字はもちろん、カメラ作動などさまざまな作業ができる。昨年4月に発売されたギャラクシーS4では翻訳機能も
新たに追加された。情報技術(IT)業界のある関係者は「ハードウェア競争が限界に達した今は、ソフトウェア生態系の
構築に力を注がなければならないだろう」と述べた。

(おしまい)
3<丶`∀´>(´・ω・`)(`ハ´  )さん@転載禁止:2014/05/14(水) 00:21:06.44 ID:e5NwOKYJ
人間同士が喋って聴いても
同音異義語が多すぎてマトモに通じない言語なんだから
痴過多亡いよね
4逆さ卓袱台 ◆SXM5MEwzhk @転載禁止:2014/05/14(水) 00:21:36.02 ID:80+O8Bfp
>>1
音声認識以前に、何言っているか意味不明な人たちだから。
キムチ照合システムでも作れば?
息吐いて自家製キムチかどうか認識してキー解除とかw
6<丶`∀´>(´・ω・`)(`ハ´  )さん@転載禁止:2014/05/14(水) 00:23:25.16 ID:8FfGY5t9
識字率の低さが原因だろ
世界の人口の約80%は割礼を受けていません。
割礼を受ける大部分の男性はイスラム教やユダヤ教の宗教上の理由から行われます。

ヘロドトス(前484年-前425年)は『歴史』の中で、エジプト人・エチオピア人が昔から割礼を行っている、と書いている。


韓国における割礼
http://upload.wikimedia.org/wikipedia/commons/7/79/Global_Map_of_Male_Circumcision_Prevalence_at_Country_Level.png
結論
大部分の韓国男性は幼年時ではなく、10代から20年代の思春期に割礼をします。
韓国の割礼状況には興味深い特性があり、世界の医学界はそのことを知らないようです。それらは、次の通りです。
1)割礼は、アメリカ人のと接触を通じて最近できた慣習で、50年経てはいないです。
2)この比較的短い期間に韓国男性の大部分は割礼を受け、20代の割礼割合は90%以上です。
3)アメリカなどと違い、幼年期には割礼は行われません。
4)現在の状況は、ほとんど議論されずに行われています。
5)韓国の割礼には宗教的な背景をもちませんが、思春期の時期にまわりの仲間からのプレッシャーにより、行われます。
そのため、割礼を行うことが大人への通過儀礼となり、韓国文化と融合されています。
6)割礼の医学的正当性は、アメリカとの初期接触のときに得た情報からなり、現在のアメリカの考えが論争の的となっています。
7)アメリカでの割礼の減少が、アメリカに倣うように韓国医学界にも解釈されてきています。
統計をとった人々は、ソウルの人ですが、ソウルの人口は大部分がソウル以外の都市で育った人たちが集まっています。
8<丶`∀´>(´・ω・`)(`ハ´  )さん@転載禁止:2014/05/14(水) 00:30:01.77 ID:icqlb+0B
ハングルはゲチョンゲチョンと濁音ばかりで聞いてて耳障り
消えてほしい
9<丶`∀´>(´・ω・`)(`ハ´  )さん@転載禁止:2014/05/14(水) 00:30:29.22 ID:2Uq5iLHP
まず真実を語りなさい、話はそれから
韓国語の翻訳なんてこれで十分だろ

  踏んだら孕んだ!
  孕んだ振る降る般若だ!
  童貞擦る無駄、フン出る春巻きはむ無理!
  チン毛ちぎり、看板塗る飛騨!
  安眠煮る焼酎!
  安打!?半田ゴテ適時打!!
  原チャリ盗んだ!
  よくちょん切れるハサミだ!

        ∧__∧   ________ 
      <丶`Д´>/ ̄/ ̄/ 
      ( 二二二つ / と) 
      |    /  /  /  
       |      ̄|
認識出来なくても「日本の責任です」「謝罪と賠償を請求します」って表示すれば結構当たるんじゃね?
朝鮮語のような欠陥言語は認識できなくて当たり前。本人ですら理解してない。
チョソンがチョソンでチョソンに
>>1 >>2
日本語で書いてやんの。
15<丶`∀´>(´・ω・`)(`ハ´  )さん@転載禁止:2014/05/14(水) 00:39:10.84 ID:2Uq5iLHP
ハングルそのものが暗号だからな
16蟹(極東wktk産) ◆Uy8zHC0F8E @転載禁止:2014/05/14(水) 00:42:19.32 ID:RnDGoLqO
(V)_ _(V)
.ミ( ∀ )ミ <チョ(choまたはchyo)を示すハングルが6種あるが。
そういった部分だろうか。
日本語って英語とかに翻訳可能なんだが、韓国語は困難なのかな。
>>17
日本人って中学生の頃から英語を学んでいるから、
英語の文法が日本語に入り込んでいる面はあるだろう。
しかしそれがヘンだとは思わない。すごいだろ。
自衛と自慰が同じ発音だしな。
>>17
音声は別だけど、筆記のハングル文字は日本語のカナ文字だから
ネクサス7の日本語音声認識はまあまあ。
訂正が面倒だからキーボードのほうがはやいけどw
<丶`∀´>防火システム作動
(◎o◎)放火システム作動シマス
23<丶`∀´>(´・ω・`)(`ハ´  )さん@転載禁止:2014/05/14(水) 00:57:46.85 ID:xkqJtb7w
サムスン様が音声認識システム用の新ハングルを作って公用語にするんじゃね?
オムロンにスパイを送り込むニダ
>>19
同音異義語だらけ、ってことだね
文脈に応じて適切な意味を選択しなければならず、人でも間違えやすい
ましてやコンピュータで自動認識させるとなると....

さらに漢字教育廃止によって、
韓国語の正確な意味を知る人材(言語研究者)が育たないという現状もある
問題は、火病を起こした状態で音声認識出来るか?だと思うよw
27<丶`∀´>(´・ω・`)(`ハ´  )さん@転載禁止:2014/05/14(水) 01:12:51.80 ID:fri6pbXw
だって、ハングルは人類が使う言語じゃないもん。
そりゃ機械だって認識出来るはずが無い。
音声認識技術ってのは、人間の発する言葉を認識するのであって、
ヒトモドキの発する音なんて理解出来ないわwww
音声認識は面倒くさい
はっきり言ってしゃべるのはだるい
>>16
<;l|l;`田´> 韓国語に対応しないのはシャベチュにだ!

http://image.itmedia.co.jp/l/im/makoto/articles/0803/05/l_ay_shingo05.jpg
音声認識に対応した自動販売機。切符や定期券の発行、PASMOのチャージなど多機能だ
そのうち銀行ATMの音声認識技術とか開発したりして
>>31
流石にセキュリティの観点から、音声を使った操作は難しい。技術的には可能だけどね。
33蟹(極東wktk産) ◆Uy8zHC0F8E @転載禁止:2014/05/14(水) 01:58:30.62 ID:RnDGoLqO
>>32
(V)。 。(V)
.ミ( ∀ )ミ <暗証番号ではなく、暗唱番号ではね。
おれオジンだから、音声認識なんてトンデモない。
キーボードから文字や暗証番号を入力するほうが普通。
35<丶`∀´>(´・ω・`)(`ハ´  )さん@転載禁止:2014/05/14(水) 07:37:29.55 ID:uy/qeVRP
The liar Corean !

The liar Corean !

姦国人は息を吐くように嘘を吐く!

姦国人は息を吐くように嘘を吐く!

姦国人は息を吐くように嘘を吐く!
>>27
    ∧,,∧ 
   ミ..Θ。Θミ  
   (ミ;;;;;;;;;;ミつ【バウリンガル】   
  〜ミ;;;;;;;;;;ミ
    ∪"∪   シュゴー
(((∈三三∋ノシ...。,
自販機音声の元ネタの人とか、外歩けんなw
>>26
その時は「謝罪するニダ」と「賠償するニダ」の二つを自動認識させとけば9割当たってるだろ
Siri『韓国人が何を言っているのかよく分かりません』
開発者『気にするな。どうせたいしたことは言ってない』
発音記号のハングルなら発音通りに文字入力すればいいだろうに。

やはり、ハングル文章は同音異義語ばかりで、機械がその意味を理解できないか。