【技術】混じり合った複数の声を「聞き分ける」コンピュータを開発―京都大
一度に多くの人の訴えが聞けたという聖徳太子のように複数の声を聞き分ける
コンピューターを、京都大大学院情報学研究科の奥乃博教授(人工知能)が開発
した。これまではきちんとマイクに向かって話さないと聞き分けが難しかったが、
「聖徳太子コンピューター」は、話し手の位置を割り出し、聞きやすいように自ら
方向を変える。
(中略)
このコンピューターは、特定の基本周波数を持つ音を一連のものとして認識し、
混じり合った音を判別する。2つのマイクに音が届く時間、強さの差や、映像情報
から話し手の位置を割り出す。実験では3人が別の言葉を一度にしゃべった場合、
6割以上の確率で、誰が何をしゃべっているかを正確に聞き分けた。
奥乃教授はこれを使って科学技術振興事業団のプロジェクトとして胸像型の
ロボットを開発した。約45度の範囲で回転して話し手の方を向く。
奥乃教授は「理解したことを動作で示し、人間とコミュニケーションできる気の
きいたロボットを造りたい」と話している。
(以上、2002年10月4日のアサヒ・コムより一部引用―全文は引用元を参照)
引用元:
http://www.asahi.com/national/update/1003/039.html 奥乃研究室:
http://winnie.kuis.kyoto-u.ac.jp/ 奥乃先生か。ちなみに研究テーマは「挑戦的な研究テーマで新たな地平を切り拓く」
相変わらずがんばってる模様。
2 :
名無しさん@3周年:02/10/04 15:58 ID:OkWS9IEt
アフォキタ━(゚∀゚)━( ゚∀)━( ゚)━( )━(` )━(Д` )━(;´Д`)ハァハァ
3 :
名無しさん@3周年:02/10/04 15:59 ID:Kd9jASgK
3
4 :
冥土で逝く:02/10/04 15:59 ID:ZRMEzFZC
正徳太子スレと重複?
聖徳太子がこんぴうたで出来るって事か
質問には答えてくれないのね。
9 :
冥土で逝く:02/10/04 16:00 ID:ZRMEzFZC
10 :
名無しさん@3周年:02/10/04 16:00 ID:dbL5S4HJ
繁華街に置いたらどうなるのか?
12 :
名無しさん@3周年:02/10/04 16:01 ID:JsV0avXZ
建物丸ごとのマイクロウエーブ盗聴に使えるね
↓聖書の一文
15 :
名無しさん@3周年:02/10/04 16:02 ID:OkWS9IEt
マンコ
16 :
名無しさん@3周年:02/10/04 16:03 ID:MEpCjYcp
潜水艦乗務の海自隊員とかならシラフで聞き分け出来そうだがな・・・・無理か
>>16 ではないです。私は奥乃先生と同じ組織にいたことはないですが、十数年前の
先生がNTTの研究所にいらっしゃった頃から名前は存じ上げています。
# 削除依頼作成中。
( ´D`)ノ<
>>11 いえいえ・・・。しかし、大抵この手のミスは油断したときに
限って起きやすいものだと思うので、あたちも他山の石としますれす。
>>18 パーティーとかで喋る人の顔を見てると声が聞こえやすいっていう研究を始めた人?
>>1 > 奥乃先生か。ちなみに研究テーマは「挑戦的な研究テーマで新たな地平を切り拓く」
> 相変わらずがんばってる模様。
ん?もしかして関係者か??
こっちにもカキコ。
・フーリエ変換
・各周波数成分の共時性とパタン認識
ここまでは誰しも思いつく。
「声紋」のデータベースを増やせば個人の判定にも使える。
「2つのマイクに音が届く時間、強さの差や、映像情報から
話し手の位置を割り出す」のも当たり前の方法。
問題は「意味の聞き分け」。
これができなければ役には立たない。そのためにはまず音声を文に変換する必要がある。
母音は簡単だが子音は難しい。
子音の解析はできるようになったのか?
26 :
名無しさん@3周年:02/10/05 01:06 ID:jMAX6WYk
びあボイス
カクテルパーティー効果って言ったっけ?
29 :
名無しさん@3周年:02/10/05 15:44 ID:PtVxvMpD
今から4年前、
IBMのパソコンを買ったら
ViaVoiceがついていて
しゃべったら文字になったのでビビった。
30 :
名無しさん@3周年:02/10/05 15:48 ID:8/ViphFC
前スレ落ちてるので削除されても困るんですが…
31 :
名無しさん@3周年:02/10/05 17:39 ID:PtVxvMpD
これあがらないの?
32 :
名無しさん@3周年:02/10/06 04:02 ID:VqVMMIld
33 :
名無しさん@3周年: