【技術】聞きたい音だけ抽出する音源分離技術を開発−奈良先端科学技術大学院大学・神戸製鋼

このエントリーをはてなブックマークに追加
27名無しのひみつ:2005/11/04(金) 16:25:47 ID:dFZhhn0E
PAでハウリングカットするのに、今でもテストワンツーコンシーシーってやってるのかな。
28名無しのひみつ:2005/11/04(金) 19:29:28 ID:A4ChTH20
チェックワンツーワンツー
松方弘樹パイプカッツー
29名無しのひみつ:2005/11/05(土) 15:31:17 ID:sJ0xDkWe
複数のマイクを利用し、各音源からの音の位相差を利用し、音源分離を行うのだ。

それをリアルタイムに、しかも小型化できたというのが凄いのだ。

パチパチパチ。
30名無しのひみつ:2005/11/05(土) 17:33:51 ID:szb+G75Q
聞きたい音とそうでない音の区別ってどうやるんだろ?
抽出した音がいらない方の音声だったってこともあるんじゃないか
31名無しのひみつ:2005/11/05(土) 18:21:28 ID:luSFJQUP
周波数分離じゃないでしょ。ニュースに
ならないよ。簡単だもん。
聖徳太子のように複数の方向からの
音つまり声を別々に取り出せるってこと
音の源ごとに重ね合わせられた音
音場から、逆に個々の要素を求めるってことだよ
当然応用価値は指方性マイクよりすごいよ

32名無しのひみつ:2005/11/05(土) 21:23:18 ID:exNBFtUO
これから盗聴機は2つマイクのステレオになるな
33名無しのひみつ:2005/11/05(土) 21:31:54 ID:B+doIGJE
>世界初で、サイズは世界最小。
世界初なんだから世界最小に決まってる件
34名無しのひみつ:2005/11/06(日) 00:18:51 ID:js8YrJK6
>>33
マヂで気が付かなかった.........orz
35名無しのひみつ:2005/11/06(日) 00:28:48 ID:DpSKmsBc
うまくやれば方向だけでなく距離も指定して音が取れるってことか
36名無しのひみつ:2005/11/06(日) 00:35:53 ID:CXKkKCl/
>>33
世界最大でもあるのだ!
37名無しのひみつ:2005/11/06(日) 01:31:30 ID:W+xDn7kg
これはつまり、例えば街中でスパイに機密事項を伝えるときに
商店街のスピーカーを通してでも伝えることができるようになると言うことか?
スパイだけがその音源分離マイクをもっているという前提ならば。

かっこいいな
38名無しのひみつ:2005/11/06(日) 04:48:56 ID:sCbziSVu
聞きたい音だけ抽出ってあるけど、
カーナビの場合2台つけるわけないんだから
聞き分けられるだろと思うんだが。。
39名無しのひみつ:2005/11/06(日) 08:13:01 ID:veaPTwyD
カーナビに入力する音声のことだろ
40名無しのひみつ:2005/11/06(日) 08:16:09 ID:6GrTqjtF
これ市販品?

ひとつ欲しいぞ
41名無しのひみつ:2005/11/06(日) 10:40:28 ID:hIg5UM3i
こういうの人間にも装備されてる気がする
42名無しのひみつ:2005/11/07(月) 03:17:01 ID:KxXGM407
所謂,独立成分分析ってやつですな。
43名無しのひみつ:2005/11/07(月) 13:19:14 ID:S0FswQLN
奈良先端科学技術大学院大学

長い名前だな。
しっかし最初はどうかと思ったが、順調に実績を挙げそうな感じで期待大。
44名無しのひみつ:2005/11/07(月) 15:01:06 ID:xbdcHw7g
独立成分分析って、

例えばマイクを左右に配置し、音源を前後に配置した場合でも分離できるのですか?
4544:2005/11/07(月) 15:06:53 ID:xbdcHw7g
ちょっと分かりにくかったかもしれないので、もう一度トライ!

例えば、二つのマイクの位地をそれぞれ、A,B、音源の位地をそれぞれ、C,Dとする。
んで、AC=BC かつ AD=BD の場合でも、きちんと分離できるのですか?

46名無しのひみつ:2005/11/07(月) 15:19:59 ID:y84VotBR
空間的な情報(利得比、位相差)が使えなくなるから、
従来の時間的処理で分離できないような信号だったら
分離不可なんじゃないかと直感的に推測します
47名無しのひみつ:2005/11/07(月) 16:22:51 ID:+z9ZWu9H
マイクABを十分に離して、かつ常に振ってやれば良い。
例えば竿の両端にマイクABを取り付け、竿の真ん中で
支えて半回転行ったり来たりさせる。
48名無しのひみつ:2005/11/07(月) 17:00:09 ID:KWTX2E8o
>>47
    ∩
( ・∀・)彡 マイク!マイク!
  ⊂彡
49名無しのひみつ:2005/11/07(月) 17:03:03 ID:fGmImHSx
今日の「めざましテレビ」で紹介されていた。
男と女が同時にしゃべってスイッチを切り替えたら
男の声だけ、女の声だけを出す事ができた。
僅かに混ざって聞こえたが、実用になるかも。
手のひらに乗るほどの装置だった。
5044:2005/11/07(月) 17:13:06 ID:xbdcHw7g
>>46
なるほど、やっぱりそうですよね。

>>47
ふむふむ、そうすることにより「死角」を無くすわけですね!?

関連質問だけど、人間て、左右についている耳でどうやって前後の位置を識別するのでしょうね?
51名無しのひみつ:2005/11/07(月) 17:23:27 ID:M6rdvxOd
>>49
スゲーな、ロボットの耳として使えそう。
52名無しのひみつ:2005/11/07(月) 21:26:01 ID:5/G509Ds
ギシアンも??
53名無しのひみつ:2005/11/07(月) 21:59:09 ID:pk6mD/Ow
録音したソースから特定の音源だけを抜き取るってことは出来ないってことか。ショボン。
54名無しのひみつ:2005/11/07(月) 23:25:28 ID:YtD8VZK6
産学連携がうまく行っているみたいね。
5544:2005/11/08(火) 13:13:49 ID:8sQ8Il6O
独立成分分析について、もう少し教えてください。

例えば、弦楽四重奏の演奏を二本のマイクで録音したとします。
二本のマイク及び4人の奏者の位置関係は既知とします。
また、4人の奏者の位地はマイクに対して、重なっていない(位相差がバラバラ)とします。

このとき、4人の奏者の演奏を分離することが原理的に可能な気がしますが、
この考えはあっていますでしょうか?
56名無しのひみつ:2005/11/08(火) 20:55:33 ID:+w8650NX
>>55
位相差を利用した場合でも、マイクが2本では
1つの音源しか消去できないので、分離できないと思います。
同じように、「音源の数>マイクの数」の場合、
独立成分分析では分離出来ません。

ちなみに,独立成分分析は統計的な手法なので、
音源の位置関係が未知でも分離可能です。
57名無しのひみつ:2005/11/09(水) 12:26:47 ID:kspCGFTI
電話で一言でも「ビン・ラディン」と発音すれば当局にマークされる予感
5844:2005/11/10(木) 09:32:42 ID:0FUX0bm/
56さん、どうもありがとうございました。
59わろすわろす:2005/11/10(木) 10:48:59 ID:l0UDzulT
>>50
電子技術総合研究所と筑波技術短期大学による実験では、全盲者の被験者が
音の方向について、左右は認識できても、上下と前後は認識できなかったこと
が確認されています。
つまり疑問はごもっとも。

結局は”目で見ること”と”耳たぶからの反射の微妙な音のズレ”の複合で、
その辺は学習しているのではないかと思われ。
60名無しのひみつ:2005/11/10(木) 10:55:12 ID:oqrofJ4q
ドラムとボーカルとギターが鳴ってる音声からボーカルだけ取り出しとかは出来ないの?
61名無しのひみつ:2005/11/10(木) 15:50:52 ID:TB5LiYbC
これはマルチの耳に使えるということでつか?
6244:2005/11/10(木) 16:09:18 ID:0FUX0bm/
>>59
納得です。

更に関連質問です。
「差音」という現象があります。
例えば、1000Hzと1300Hzを同時に鳴らすと、300Hzの音が聞こえるというやつです。
(パソコンで実際に試すと、確かに聞こえます。)
7000Hzと7300Hzではかなり強く聞こえます。
ところが、10000Hzと10300Hzでは聞こえなくなります。
周波数が高い領域では、何故差音が聞き取れなくなるのでしょうか?

もし超音波領域で差音を作り出すことが出来れば(Ex:40000Hzと40300Hz等)
指向性の高いスピーカができるのでは無いか、と思ったしだいです。

どなたかよろしくお願いいたします。
63名無しのひみつ:2005/11/10(木) 16:14:51 ID:8YDIzgI5
>>62
その原理の超指向性スピーカーはもう実用化されてるよ確か
64名無しのひみつ:2005/11/10(木) 16:26:19 ID:8YDIzgI5
パラメトリックスピーカで検索かけてみるべし
65名無しのひみつ:2005/11/10(木) 17:13:07 ID:qSmufYVr
>>62
うなりは音の波形の法絡線なので
物理的には「300Hzの音」などというものはなく
そう聞こえるのは脳が適当に処理した結果。
だからそもそも聞こえない周波数の音に対しては
法絡線を認識しようがないのでうなりも聞こえない。

>>63の場合は空気が非線形のフィルタになって
実際に法絡線に相当する波形が生じているので
聞こえる原理も聞こえる音もうなりとは異なる。
66名無しのひみつ:2005/11/10(木) 17:26:15 ID:cdUxH3Vp
ハードボイルド・ワンダーランドみたい
6744:2005/11/10(木) 18:18:51 ID:0FUX0bm/
63&64さん、ありがとうございます。
三菱エンジニアリングの「ここだけ」ですよね。
上野の科学博物館の地下1階(恐竜展示場)に設置されてました。

65さん、ありがとうございます。
>だからそもそも聞こえない周波数の音に対しては
>法絡線を認識しようがないのでうなりも聞こえない。

やっぱりそうなんですか!?残念です。
68名無しのひみつ:2005/11/10(木) 18:28:23 ID:+vKuNDbo
雑誌で読んだけど北陸何たらって大学院は結構やるらしいな。無名だけどw
69名無しのひみつ:2005/11/10(木) 20:47:43 ID:KSGebQWH
結構やるのは奈良のほうだよ。北陸は国立最底辺。
70名無しのひみつ:2005/11/11(金) 00:43:21 ID:LEeLKAK4
>>69
いや、奈良って大阪&京都の流れ組が行ってるから出来るのは当然やろw
結構どうしようもない連中がそれなりのパフォーマンスを発揮している方がニュースバリューが上というか
そこら辺の感覚が理解できないなら会話が成り立たんがな。
オレが言ってんのは経済誌の(観点での)話だから。
71名無しのひみつ:2005/11/11(金) 13:44:46 ID:f7Lwwdm5
これらの記事の信憑性は?

ttp://hotwired.goo.ne.jp/news/technology/story/20050905301.html

>銃声や音楽、指示の言葉などの音を発した一連のテストでは、
>最高約1.6キロメートル離れた地点でも音を聞き、内容を理解することができた。


ttp://hotwired.goo.ne.jp/news/technology/story/20020225301.html

>音源から100メートルほど離れたところではっきりと音を聞くことができたが、
>音の通り道から2歩離れただけで、何も聞こえなくなったという。

専門家の皆様のご意見を聞かせてね。
72名無しのひみつ:2005/11/12(土) 10:24:05 ID:CMyI2DOe
hotwiredの記事は、どうも胡散臭い気がする。
73名無しのひみつ:2005/11/12(土) 11:31:00 ID:/KCNhtJk
やっぱニュートン
74名無しのひみつ:2005/11/12(土) 18:53:50 ID:0cpcvxbE
サンプル音声を載せてくれ
75名無しのひみつ&rlo;(どけイイもでうど) Oo .(`・ω・´)&lro;:2005/11/12(土) 18:54:12 ID:qH4n5AsW
これって、カクテルパーティー効果を実現できるシステムと言ってよいくらいの完成度なのか?
76名無しのひみつ
>>71

昨日のサイエンス0で、パラメトリックスピーカの紹介をしていた。
それによると、指向性は、10mはなれて広がりが3.5mとのこと。まあそんなもんだろう。
よって、

>音源から100メートルほど離れたところではっきりと音を聞くことができたが、
>音の通り道から2歩離れただけで、何も聞こえなくなったという。

は、疑似科学の疑いあり。