【技術】聞きたい音だけ抽出する音源分離技術を開発−奈良先端科学技術大学院大学・神戸製鋼
1 :
落武者φ ★:
生駒市高山町の奈良先端科学技術大学院大学(安田国雄学長)情報科学研究科
の猿渡洋助教授は31日までに、複数の音声が混ざる環境で聞きたい音だけを抽出
できる「音源分離技術」を神戸製鋼所(神戸市中央区脇浜町、犬伏泰夫社長)と共同
で開発した。リアルタイムで、かつ高精度に音声を抽出できる技術は世界初で、サイズ
は世界最小。
ソース 奈良新聞(2005/11/01)
http://www.nara-shimbun.com/n_eco/051101/eco051101a.shtml 当社はこのたび、国立大学法人 奈良先端科学技術大学院大学 音情報処理学講座
猿渡洋(さるわたり ひろし)助教授と共同で、複数の音声や各種環境音が混ざった日常
生活において、目的とする音源信号のみを、世界で初めてリアルタイム・高精度に抽出
出来る技術を確立しました。同時に、世界最小の手のひらサイズの装置とすることに
成功しました。性能を発揮するために最低限必要なプロセッサや基板、電源などだけで
製作すると、更に小型化が可能です。
クリアな音声入力を必要とするカーナビや屋外の喧騒下で使用する携帯電話、あるいは
工場の機械装置などの異常音の聞き分け、更には近未来の人間型ロボット社会における
音声認識用など、目的とする音だけを確実に抽出することが必要とされる多様な用途へ
の活用が期待されます。
複数の音源が混ざった信号の中から、目的とする音源を抽出する技術は音源分離技術
として、これまでにも多くの研究開発が行われてきました。マイクを複数個(最低2個有れば
可。)用いて得られた音源信号を解析すると同時に、マイクごとの情報を絡まった紐を解く
ように独立な音源ごとに信号を分離します。予めスピーカーやヘッドホンなどの出力装置を
接続しておくと、目的とする音源信号だけを聞くことが出来、分離の結果を確認出来ます。
こうした音源分離に関しては、入って来た音源信号の解析や独立な音源成分を抽出する
ためのアルゴリズムが、既にいくつか学会などで公表されています。しかし、いずれも膨大
な演算処理が必要なことから、パソコンレベルのプロセッサを用いても、他の音が混ざり
実環境で十分な分離性能までには至っていません。特に十分なリアルタイム性能が得られ
ませんでした。
当社と奈良先端科学技術大学院大学では、音源信号の解析や独立な音源成分を抽出
する『独自の音源分離アルゴリズム』を開発し、高性能信号処理プロセッサを用いて『演算
処理の高速化』を実現したことで、実環境下での分離性能の格段の向上と分離処理のリアル
タイム化を両立することに成功しました。
また、電池駆動可能な世界最小装置を製作し、手軽に目的とする音源をリアルタイムで
抽出出来るようになりました。市販のマイクや汎用品の高性能信号処理プロセッサを用いる
ことで比較的安価に製作が出来ます。音源分離に最低限必要な部品だけを用いて更なる
小型化も可能です。
当社では,本技術を含めた音声信号処理技術をベースに音声・音響関連ソリューション
の提供を進めて行きます。
神戸製鋼プレスリリース(2005/10/24)
http://www.kobelco.co.jp/topics/2005/10/1174814_2911.html
2 :
名無しのひみつ:2005/11/01(火) 11:55:48 ID:8mitIgaB
5
3 :
名無しのひみつ:2005/11/01(火) 11:56:43 ID:v1me1K09
奈良先端科学技術大学院大学
噛みそう
4 :
名無しのひみつ:2005/11/01(火) 11:59:43 ID:CJk3RXmt
鉄工所は、騒音が凄いのだろう
5 :
名無しさん@恐縮です:2005/11/01(火) 12:04:07 ID:eAt/ihIk
拡声器騒音に効果ありまつか?
6 :
名無しのひみつ:2005/11/01(火) 12:20:26 ID:hDsNuZxR
すげええええええ
これでWAV→MIDIも一発?
7 :
名無しのひみつ:2005/11/01(火) 12:40:15 ID:pX4KlWct
>>6 ちが〜う。
音波から特定の音周波数を引っこ抜く技術だ。
短波無線愛好家には便利なアイテムになりそうな予感。
似たような物に、DSPノイズフィルタってのもあるが、
あれは頑固だ。
8 :
名無しのひみつ:2005/11/01(火) 12:46:49 ID:LH0Ckkbr
wavelet?
9 :
名無しのひみつ:2005/11/01(火) 12:49:41 ID:I7XrAODe
加藤鷹のあえぎ声がうるさいAVから女優のあえぎ声だけを抽出とか
できるのだろうか
10 :
名無しのひみつ:2005/11/01(火) 13:07:54 ID:hDsNuZxR
>>7 なんだ
フィルタに毛が生えたような代物か・・・orz
11 :
名無しのひみつ:2005/11/01(火) 14:05:43 ID:iYtwD6Rd
これが十分小さくて低消費電力になるなら、
マイクに組み込んで「ハウリングしないマイク」も可能になるか?
12 :
名無しのひみつ:2005/11/01(火) 15:19:07 ID:NgeolRov
これでBGMをカットして能登の声だけを聞くことができるな(;´Д`)ハァハァ
13 :
名無しのひみつ:2005/11/01(火) 15:26:40 ID:tULwWC7e
FBIやペンタゴンではとっくの昔に使われてる技術だ。
何をいまさら。w
14 :
名無しのひみつ:2005/11/01(火) 15:57:27 ID:7NLJsYto
>>13 今までホーミング魚雷サイズだったものが、
乾電池駆動可能に縮小化したのが今回の肝。
15 :
名無しのひみつ:2005/11/01(火) 16:30:51 ID:9DK3cMS2
ノイズキャンセリング・ヘッドフォンを高性能化できるのか。
すっげー期待。
16 :
名無しのひみつ :2005/11/01(火) 22:11:42 ID:eRSFVot3
テープレコーダーは高い音域だけならカットできるものがある
17 :
名無しのひみつ:2005/11/01(火) 22:41:33 ID:f+g2aiku
それはLPFと言って2円の受動素子2個で作れるんだがな
18 :
名無しのひみつ:2005/11/01(火) 23:13:53 ID:uC1ubZiT
(∩゚д゚)アーアーきこえなーい
19 :
名無しのひみつ:2005/11/02(水) 10:46:13 ID:c+0nt2zx
20 :
名無しのひみつ:2005/11/02(水) 12:00:53 ID:SwE9K/kh
LPFとHPF使ってBPFにすればある程度使える音源分離装置の出来上がり。
21 :
名無しのひみつ:2005/11/02(水) 12:05:53 ID:YkgWpaKi
相変わらずくだらねー事してるよなぁ。
22 :
名無しのひみつ:2005/11/02(水) 14:25:08 ID:YKY5J1dH
実は軍用絡みで展開が広い研究だったりする。
23 :
名無しのひみつ:2005/11/04(金) 12:44:19 ID:obMAiAd2
二本のマイクを使うところがミソ
24 :
名無しのひみつ:2005/11/04(金) 12:51:03 ID:D662PNOP
人間の耳でも一度録音した音だと認識率が落ちるからな
25 :
名無しのひみつ:2005/11/04(金) 13:11:30 ID:Js1rReYN
ソフトウエア併用の指向性マイク?
26 :
名無しのひみつ:2005/11/04(金) 13:43:17 ID:/z06MAov
何十万円とかのデジタル補聴器のカタログにもそんな技術が使われてると書いてあったぞ。
そんな大層な技術が補聴器には使われてるのか?
それとも補聴器カタログに書いてあるのはデタラメ?
27 :
名無しのひみつ:2005/11/04(金) 16:25:47 ID:dFZhhn0E
PAでハウリングカットするのに、今でもテストワンツーコンシーシーってやってるのかな。
28 :
名無しのひみつ:2005/11/04(金) 19:29:28 ID:A4ChTH20
チェックワンツーワンツー
松方弘樹パイプカッツー
29 :
名無しのひみつ:2005/11/05(土) 15:31:17 ID:sJ0xDkWe
複数のマイクを利用し、各音源からの音の位相差を利用し、音源分離を行うのだ。
それをリアルタイムに、しかも小型化できたというのが凄いのだ。
パチパチパチ。
30 :
名無しのひみつ:2005/11/05(土) 17:33:51 ID:szb+G75Q
聞きたい音とそうでない音の区別ってどうやるんだろ?
抽出した音がいらない方の音声だったってこともあるんじゃないか
31 :
名無しのひみつ:2005/11/05(土) 18:21:28 ID:luSFJQUP
周波数分離じゃないでしょ。ニュースに
ならないよ。簡単だもん。
聖徳太子のように複数の方向からの
音つまり声を別々に取り出せるってこと
音の源ごとに重ね合わせられた音
音場から、逆に個々の要素を求めるってことだよ
当然応用価値は指方性マイクよりすごいよ
32 :
名無しのひみつ:2005/11/05(土) 21:23:18 ID:exNBFtUO
これから盗聴機は2つマイクのステレオになるな
33 :
名無しのひみつ:2005/11/05(土) 21:31:54 ID:B+doIGJE
>世界初で、サイズは世界最小。
世界初なんだから世界最小に決まってる件
34 :
名無しのひみつ:2005/11/06(日) 00:18:51 ID:js8YrJK6
>>33 マヂで気が付かなかった.........orz
35 :
名無しのひみつ:2005/11/06(日) 00:28:48 ID:DpSKmsBc
うまくやれば方向だけでなく距離も指定して音が取れるってことか
36 :
名無しのひみつ:2005/11/06(日) 00:35:53 ID:CXKkKCl/
37 :
名無しのひみつ:2005/11/06(日) 01:31:30 ID:W+xDn7kg
これはつまり、例えば街中でスパイに機密事項を伝えるときに
商店街のスピーカーを通してでも伝えることができるようになると言うことか?
スパイだけがその音源分離マイクをもっているという前提ならば。
かっこいいな
38 :
名無しのひみつ:2005/11/06(日) 04:48:56 ID:sCbziSVu
聞きたい音だけ抽出ってあるけど、
カーナビの場合2台つけるわけないんだから
聞き分けられるだろと思うんだが。。
39 :
名無しのひみつ:2005/11/06(日) 08:13:01 ID:veaPTwyD
カーナビに入力する音声のことだろ
40 :
名無しのひみつ:2005/11/06(日) 08:16:09 ID:6GrTqjtF
これ市販品?
ひとつ欲しいぞ
41 :
名無しのひみつ:2005/11/06(日) 10:40:28 ID:hIg5UM3i
こういうの人間にも装備されてる気がする
42 :
名無しのひみつ:2005/11/07(月) 03:17:01 ID:KxXGM407
所謂,独立成分分析ってやつですな。
43 :
名無しのひみつ:2005/11/07(月) 13:19:14 ID:S0FswQLN
奈良先端科学技術大学院大学
長い名前だな。
しっかし最初はどうかと思ったが、順調に実績を挙げそうな感じで期待大。
44 :
名無しのひみつ:2005/11/07(月) 15:01:06 ID:xbdcHw7g
独立成分分析って、
例えばマイクを左右に配置し、音源を前後に配置した場合でも分離できるのですか?
45 :
44:2005/11/07(月) 15:06:53 ID:xbdcHw7g
ちょっと分かりにくかったかもしれないので、もう一度トライ!
例えば、二つのマイクの位地をそれぞれ、A,B、音源の位地をそれぞれ、C,Dとする。
んで、AC=BC かつ AD=BD の場合でも、きちんと分離できるのですか?
46 :
名無しのひみつ:2005/11/07(月) 15:19:59 ID:y84VotBR
空間的な情報(利得比、位相差)が使えなくなるから、
従来の時間的処理で分離できないような信号だったら
分離不可なんじゃないかと直感的に推測します
47 :
名無しのひみつ:2005/11/07(月) 16:22:51 ID:+z9ZWu9H
マイクABを十分に離して、かつ常に振ってやれば良い。
例えば竿の両端にマイクABを取り付け、竿の真ん中で
支えて半回転行ったり来たりさせる。
48 :
名無しのひみつ:2005/11/07(月) 17:00:09 ID:KWTX2E8o
>>47 ∩
( ・∀・)彡 マイク!マイク!
⊂彡
49 :
名無しのひみつ:2005/11/07(月) 17:03:03 ID:fGmImHSx
今日の「めざましテレビ」で紹介されていた。
男と女が同時にしゃべってスイッチを切り替えたら
男の声だけ、女の声だけを出す事ができた。
僅かに混ざって聞こえたが、実用になるかも。
手のひらに乗るほどの装置だった。
50 :
44:2005/11/07(月) 17:13:06 ID:xbdcHw7g
>>46 なるほど、やっぱりそうですよね。
>>47 ふむふむ、そうすることにより「死角」を無くすわけですね!?
関連質問だけど、人間て、左右についている耳でどうやって前後の位置を識別するのでしょうね?
51 :
名無しのひみつ:2005/11/07(月) 17:23:27 ID:M6rdvxOd
52 :
名無しのひみつ:2005/11/07(月) 21:26:01 ID:5/G509Ds
ギシアンも??
53 :
名無しのひみつ:2005/11/07(月) 21:59:09 ID:pk6mD/Ow
録音したソースから特定の音源だけを抜き取るってことは出来ないってことか。ショボン。
54 :
名無しのひみつ:2005/11/07(月) 23:25:28 ID:YtD8VZK6
産学連携がうまく行っているみたいね。
55 :
44:2005/11/08(火) 13:13:49 ID:8sQ8Il6O
独立成分分析について、もう少し教えてください。
例えば、弦楽四重奏の演奏を二本のマイクで録音したとします。
二本のマイク及び4人の奏者の位置関係は既知とします。
また、4人の奏者の位地はマイクに対して、重なっていない(位相差がバラバラ)とします。
このとき、4人の奏者の演奏を分離することが原理的に可能な気がしますが、
この考えはあっていますでしょうか?
56 :
名無しのひみつ:2005/11/08(火) 20:55:33 ID:+w8650NX
>>55 位相差を利用した場合でも、マイクが2本では
1つの音源しか消去できないので、分離できないと思います。
同じように、「音源の数>マイクの数」の場合、
独立成分分析では分離出来ません。
ちなみに,独立成分分析は統計的な手法なので、
音源の位置関係が未知でも分離可能です。
57 :
名無しのひみつ:2005/11/09(水) 12:26:47 ID:kspCGFTI
電話で一言でも「ビン・ラディン」と発音すれば当局にマークされる予感
58 :
44:2005/11/10(木) 09:32:42 ID:0FUX0bm/
56さん、どうもありがとうございました。
59 :
わろすわろす:2005/11/10(木) 10:48:59 ID:l0UDzulT
>>50 電子技術総合研究所と筑波技術短期大学による実験では、全盲者の被験者が
音の方向について、左右は認識できても、上下と前後は認識できなかったこと
が確認されています。
つまり疑問はごもっとも。
結局は”目で見ること”と”耳たぶからの反射の微妙な音のズレ”の複合で、
その辺は学習しているのではないかと思われ。
60 :
名無しのひみつ:2005/11/10(木) 10:55:12 ID:oqrofJ4q
ドラムとボーカルとギターが鳴ってる音声からボーカルだけ取り出しとかは出来ないの?
61 :
名無しのひみつ:2005/11/10(木) 15:50:52 ID:TB5LiYbC
これはマルチの耳に使えるということでつか?
62 :
44:2005/11/10(木) 16:09:18 ID:0FUX0bm/
>>59 納得です。
更に関連質問です。
「差音」という現象があります。
例えば、1000Hzと1300Hzを同時に鳴らすと、300Hzの音が聞こえるというやつです。
(パソコンで実際に試すと、確かに聞こえます。)
7000Hzと7300Hzではかなり強く聞こえます。
ところが、10000Hzと10300Hzでは聞こえなくなります。
周波数が高い領域では、何故差音が聞き取れなくなるのでしょうか?
もし超音波領域で差音を作り出すことが出来れば(Ex:40000Hzと40300Hz等)
指向性の高いスピーカができるのでは無いか、と思ったしだいです。
どなたかよろしくお願いいたします。
63 :
名無しのひみつ:2005/11/10(木) 16:14:51 ID:8YDIzgI5
>>62 その原理の超指向性スピーカーはもう実用化されてるよ確か
64 :
名無しのひみつ:2005/11/10(木) 16:26:19 ID:8YDIzgI5
パラメトリックスピーカで検索かけてみるべし
65 :
名無しのひみつ:2005/11/10(木) 17:13:07 ID:qSmufYVr
>>62 うなりは音の波形の法絡線なので
物理的には「300Hzの音」などというものはなく
そう聞こえるのは脳が適当に処理した結果。
だからそもそも聞こえない周波数の音に対しては
法絡線を認識しようがないのでうなりも聞こえない。
>>63の場合は空気が非線形のフィルタになって
実際に法絡線に相当する波形が生じているので
聞こえる原理も聞こえる音もうなりとは異なる。
66 :
名無しのひみつ:2005/11/10(木) 17:26:15 ID:cdUxH3Vp
ハードボイルド・ワンダーランドみたい
67 :
44:2005/11/10(木) 18:18:51 ID:0FUX0bm/
63&64さん、ありがとうございます。
三菱エンジニアリングの「ここだけ」ですよね。
上野の科学博物館の地下1階(恐竜展示場)に設置されてました。
65さん、ありがとうございます。
>だからそもそも聞こえない周波数の音に対しては
>法絡線を認識しようがないのでうなりも聞こえない。
やっぱりそうなんですか!?残念です。
68 :
名無しのひみつ:2005/11/10(木) 18:28:23 ID:+vKuNDbo
雑誌で読んだけど北陸何たらって大学院は結構やるらしいな。無名だけどw
69 :
名無しのひみつ:2005/11/10(木) 20:47:43 ID:KSGebQWH
結構やるのは奈良のほうだよ。北陸は国立最底辺。
70 :
名無しのひみつ:2005/11/11(金) 00:43:21 ID:LEeLKAK4
>>69 いや、奈良って大阪&京都の流れ組が行ってるから出来るのは当然やろw
結構どうしようもない連中がそれなりのパフォーマンスを発揮している方がニュースバリューが上というか
そこら辺の感覚が理解できないなら会話が成り立たんがな。
オレが言ってんのは経済誌の(観点での)話だから。
71 :
名無しのひみつ:2005/11/11(金) 13:44:46 ID:f7Lwwdm5
72 :
名無しのひみつ:2005/11/12(土) 10:24:05 ID:CMyI2DOe
hotwiredの記事は、どうも胡散臭い気がする。
73 :
名無しのひみつ:2005/11/12(土) 11:31:00 ID:/KCNhtJk
やっぱニュートン
74 :
名無しのひみつ:2005/11/12(土) 18:53:50 ID:0cpcvxbE
サンプル音声を載せてくれ
75 :
名無しのひみつ&rlo;(どけイイもでうど) Oo .(`・ω・´)&lro;:2005/11/12(土) 18:54:12 ID:qH4n5AsW
これって、カクテルパーティー効果を実現できるシステムと言ってよいくらいの完成度なのか?
76 :
名無しのひみつ:
>>71 昨日のサイエンス0で、パラメトリックスピーカの紹介をしていた。
それによると、指向性は、10mはなれて広がりが3.5mとのこと。まあそんなもんだろう。
よって、
>音源から100メートルほど離れたところではっきりと音を聞くことができたが、
>音の通り道から2歩離れただけで、何も聞こえなくなったという。
は、疑似科学の疑いあり。