【技術】混じり合った複数の声を「聞き分ける」コンピュータを開発―京都大

このエントリーをはてなブックマークに追加
1 ◆dFMUMUMU4w @むむむφ ★
 一度に多くの人の訴えが聞けたという聖徳太子のように複数の声を聞き分ける
コンピューターを、京都大大学院情報学研究科の奥乃博教授(人工知能)が開発
した。これまではきちんとマイクに向かって話さないと聞き分けが難しかったが、
「聖徳太子コンピューター」は、話し手の位置を割り出し、聞きやすいように自ら
方向を変える。
(中略)
 このコンピューターは、特定の基本周波数を持つ音を一連のものとして認識し、
混じり合った音を判別する。2つのマイクに音が届く時間、強さの差や、映像情報
から話し手の位置を割り出す。実験では3人が別の言葉を一度にしゃべった場合、
6割以上の確率で、誰が何をしゃべっているかを正確に聞き分けた。

 奥乃教授はこれを使って科学技術振興事業団のプロジェクトとして胸像型の
ロボットを開発した。約45度の範囲で回転して話し手の方を向く。

 奥乃教授は「理解したことを動作で示し、人間とコミュニケーションできる気の
きいたロボットを造りたい」と話している。
(以上、2002年10月4日のアサヒ・コムより一部引用―全文は引用元を参照)

引用元: http://www.asahi.com/national/update/1003/039.html
奥乃研究室: http://winnie.kuis.kyoto-u.ac.jp/

奥乃先生か。ちなみに研究テーマは「挑戦的な研究テーマで新たな地平を切り拓く」
相変わらずがんばってる模様。
2名無しさん@3周年:02/10/04 15:58 ID:OkWS9IEt
アフォキタ━(゚∀゚)━( ゚∀)━(  ゚)━(  )━(`  )━(Д` )━(;´Д`)ハァハァ
3名無しさん@3周年:02/10/04 15:59 ID:Kd9jASgK
3
4冥土で逝く:02/10/04 15:59 ID:ZRMEzFZC
正徳太子スレと重複?
5(= ゚仝゚) ◆m/wPUNSUKA :02/10/04 15:59 ID:9XhNmsnX
聖徳太子がこんぴうたで出来るって事か
6 ◆V3V3oHJAKQ @窓際戦隊φ ★:02/10/04 15:59 ID:???
( ´D`)ノ<・・・既出だったりするのれす・・・。
【ロボ】複数の声聞き分ける「聖徳太子ロボット」開発=京都大学[021004]
http://news2.2ch.net/test/read.cgi/newsplus/1033664318/
7(= ゚仝゚) ◆m/wPUNSUKA :02/10/04 15:59 ID:9XhNmsnX
8名無しさん@お腹いっぱい。:02/10/04 16:00 ID:Zs58A56L
質問には答えてくれないのね。
9冥土で逝く:02/10/04 16:00 ID:ZRMEzFZC
一応、貼っとく

【ロボ】複数の声聞き分ける「聖徳太子ロボット」開発=京都大学[021004]
http://news2.2ch.net/test/read.cgi/newsplus/1033664318/l50
10名無しさん@3周年:02/10/04 16:00 ID:dbL5S4HJ
繁華街に置いたらどうなるのか?
11 ◆dFMUMUMU4w @むむむφ ★:02/10/04 16:01 ID:???
>>6
ごめんなさい。忙しくて検索をさぼりました。久しぶりのベタ既出。すまそ。
以下こちらで。削除依頼出してきます。

【ロボ】複数の声聞き分ける「聖徳太子ロボット」開発=京都大学[021004]
http://news2.2ch.net/test/read.cgi/newsplus/1033664318/
12名無しさん@3周年:02/10/04 16:01 ID:JsV0avXZ
>>10
上半身がねじ切れる
13名無しさん@3周年:02/10/04 16:01 ID:4lBw6o/i
建物丸ごとのマイクロウエーブ盗聴に使えるね
14尻の巣 ◆Tk9tcTRv6o :02/10/04 16:01 ID:w9rWQFpQ
↓聖書の一文
15名無しさん@3周年:02/10/04 16:02 ID:OkWS9IEt
マンコ
16名無しさん@3周年:02/10/04 16:03 ID:MEpCjYcp
>>1
むむむさんは京大出身ですか?
17名無しさん@3周年:02/10/04 16:06 ID:gVkMb78j
潜水艦乗務の海自隊員とかならシラフで聞き分け出来そうだがな・・・・無理か
18 ◆dFMUMUMU4w @むむむφ ★:02/10/04 16:06 ID:???
>>16
ではないです。私は奥乃先生と同じ組織にいたことはないですが、十数年前の
先生がNTTの研究所にいらっしゃった頃から名前は存じ上げています。

# 削除依頼作成中。
19名無しさん@3周年:02/10/04 16:07 ID:OkWS9IEt
>>18
じゃ、みかか社員か?
20 ◆V3V3oHJAKQ @窓際戦隊φ ★:02/10/04 16:11 ID:???
( ´D`)ノ<>>11
いえいえ・・・。しかし、大抵この手のミスは油断したときに
限って起きやすいものだと思うので、あたちも他山の石としますれす。
21名無しさん@3周年:02/10/04 16:32 ID:JsV0avXZ
>>18
パーティーとかで喋る人の顔を見てると声が聞こえやすいっていう研究を始めた人?
22名無しさん@3周年:02/10/04 16:59 ID:xmZawHem
>>1
> 奥乃先生か。ちなみに研究テーマは「挑戦的な研究テーマで新たな地平を切り拓く」
> 相変わらずがんばってる模様。

ん?もしかして関係者か??
23名無しさん@3周年:02/10/04 17:00 ID:xmZawHem
>>18
なるほど〜。
24名無しさん@3周年:02/10/04 17:00 ID:xmZawHem
>>18
漏れはさっき構内で・・・
 
こっちにもカキコ。

・フーリエ変換
・各周波数成分の共時性とパタン認識

ここまでは誰しも思いつく。
「声紋」のデータベースを増やせば個人の判定にも使える。
「2つのマイクに音が届く時間、強さの差や、映像情報から
話し手の位置を割り出す」のも当たり前の方法。

問題は「意味の聞き分け」。
これができなければ役には立たない。そのためにはまず音声を文に変換する必要がある。
母音は簡単だが子音は難しい。
子音の解析はできるようになったのか?
26名無しさん@3周年:02/10/05 01:06 ID:jMAX6WYk
びあボイス
27名無しさん@3周年:02/10/05 01:12 ID:BPKEGUzx
カクテルパーティー効果って言ったっけ?
28名無しさん@3周年:02/10/05 02:35 ID:ErZwBhr4
>>25
子音は大して聞き取っていないと思うぞ
29名無しさん@3周年:02/10/05 15:44 ID:PtVxvMpD
今から4年前、
IBMのパソコンを買ったら
ViaVoiceがついていて
しゃべったら文字になったのでビビった。
30名無しさん@3周年:02/10/05 15:48 ID:8/ViphFC
前スレ落ちてるので削除されても困るんですが…
31名無しさん@3周年:02/10/05 17:39 ID:PtVxvMpD
これあがらないの?
32名無しさん@3周年:02/10/06 04:02 ID:VqVMMIld
33名無しさん@3周年
>>27
ワルQスレの方ですか?