音声合成プログラムを作りる

このエントリーをはてなブックマークに追加
1デフォルトの名無しさん
ネトラジとかで声優のしゃべた音声がたくさん出回ってきたから、
それを使って音声合成するプログラムを作りたいと思うんだけど、
そんなスレ

2デフォルトの名無しさん:2007/06/14(木) 09:52:04
じゃあ、一緒に作るれ
3デフォルトの名無しさん:2007/06/14(木) 09:54:14
しゃべた
4デフォルトの名無しさん:2007/06/14(木) 10:08:17
ネトラジリソース多いのんって誰かな
BGMとかあんまなくって、高音質なの
5デフォルトの名無しさん:2007/06/14(木) 10:33:17
よし、みんなで作れろ
6デフォルトの名無しさん:2007/06/14(木) 12:27:51
中原小麦が多いるれ
7デフォルトの名無しさん:2007/06/14(木) 14:18:18
音声合成は難しいぜ
しかもそんだけの素材じゃかなり苦労する

と元国立理系大学院音声関係研究者の俺が言っておく。
8デフォルトの名無しさん:2007/06/14(木) 14:39:22
音声を発するシミュレーションを
まじめにやったらどうなるんだろう。
骨格、肉、声帯、云々。
97:2007/06/14(木) 14:57:22
シミュレーションやるより、模型?を作った方が楽なんだなー
10デフォルトの名無しさん:2007/06/14(木) 14:58:35
でも、模型はメンテナンスが
11デフォルトの名無しさん:2007/06/14(木) 16:22:28
>>7 に期待
127:2007/06/14(木) 20:44:39
いや、俺の元専門は音声認識だから・・・
そんな俺でも「声優の声」を目指す>>1は厳しい、ということくらいはわかる。

ニュースとかで見聞きする合成音声ってみな糞でしょ?
何年も進化していないのよ。

音素切り貼り(新聞の切り抜き文字で文章作る感じ)、なら多少はいける・・・かもしれないけどね。
13デフォルトの名無しさん:2007/06/14(木) 21:11:40
       |
   \  __  /
   _ (m) _ピコーン
      |ミ|
    /  `´  \
     ('A`)     そうだ! 自分で喋ればいいんだ!
     ノヽノヽ
       くく
14デフォルトの名無しさん:2007/06/15(金) 00:03:29
>>1が作るって言うんだから、余計な口出しはせず、
まずはお手並みを拝見する所だろう。
151:2007/06/15(金) 01:58:54
まずは音声データベース作んないと
なんで、ネトラジ落としてWAVにして文章ごとに分割してみた
こんどは、音素ごとに区切る作業はじめる
専用のツールつくんないとだめかな
167:2007/06/15(金) 02:42:52
ツールならHTKにいいのがあるんじゃね?

音声認識機に通して音素ごとに切り分ける、ってのが大量データ作成には楽かな?
しかし懐かしすぎ・・・
171:2007/06/15(金) 02:48:21
>>16
HTKおk、しらべる
thx
18デフォルトの名無しさん:2007/06/15(金) 16:35:47
19デフォルトの名無しさん:2007/06/16(土) 16:15:14
1さんに期待

しかし, カクカクとした音声が限界じゃないかね
声優のような音にするにはパラ情報なんかの
感情を表現する部分をどの程度対応できるかに
よると思われ

とか, ネットワーク屋さんのもれが曰ってみる
201:2007/06/17(日) 14:53:48
HTK登録したのにパスワード送てこねー
説明書くらい登録なしで読ませてもいいのにさ
待てる間に音声db作成支援ツールでも作りる

ところで音声認識の分割精度てどれくらい出んの?
0から書き起こしさせるのは全然使えねーレベルなんは分かるけど、
書き起こしテキストあれば音素位置そろえるくらいは精度いいんかな
21デフォルトの名無しさん:2007/06/19(火) 02:06:23
http://plusd.itmedia.co.jp/lifestyle/articles/0405/28/ts_virtual_morita.mpg
86時間コーパス。これくらいでよろ!
221:2007/06/20(水) 03:00:36
86時間て正味?ネトラジから集めよう思たら数年分必要だなー
ところでこれNHKの森田アナだよね
ところどころイントネーション変な繋がりあるから
数文節単位くらいで切り貼りしてるん?
23デフォルトの名無しさん:2007/07/08(日) 20:38:20
24デフォルトの名無しさん:2007/07/10(火) 17:10:43
理系大学院って工学部と理学部でだいぶ違うよな
251:2007/07/10(火) 23:29:09
>>23
さんくすです
SoftalkはAeuqst社のAquesTalkを音声合成エンジンとして使っている、
web2speechは大学が作ったGalateaTalkをエンジンとして使っている、
EasySpeechはSAPI使ってエンジンを読んでるだけみたいでしね
自分で音声合成エンジン作ってる人はまだないのかな
26デフォルトの名無しさん:2007/07/13(金) 14:22:49
age
27デフォルトの名無しさん:2007/07/13(金) 14:27:35
age
28デフォルトの名無しさん:2007/07/13(金) 14:29:44
age
29デフォルトの名無しさん:2007/07/13(金) 14:40:43
30デフォルトの名無しさん:2007/07/13(金) 18:29:39
同じ金額で声優雇った方が早くね?
311:2007/07/14(土) 00:03:56
>>30
別にセリフ読んでもらいたいわけじゃないし
合成音声で2ちゃんログとかメールとか
読んでもらったら面白くなくね?
32デフォルトの名無しさん:2007/07/19(木) 21:26:09
音(声)の切り張りと云うと、コナミがときメモ3でやってなかったっけ?
未プレイ(体験版触っただけ)だから、詳しくは解らんけど。
33名無しさん@そうだ選挙に行こう:2007/07/29(日) 04:01:34
イントネーションを網羅した辞書みたいなファイルを作って
文章をAquesTalk用の音声記号列に自動変換するようにすれば、
どんな文章もきれいに読み上げることができそう。
341:2007/07/30(月) 00:14:46
>>32
ときめも2と3でプレーヤの名前を呼んでくれる
EVSという音声合成システムがのてたみたい
やったことないからクオリティーは分からないよ
ttp://ja.wikipedia.org/wiki/%E3%81%A8%E3%81%8D%E3%82%81%E3%81%8D%E3%83%A1%E3%83%A2%E3%83%AA%E3%82%A2%E3%83%AB2
ttp://www.konami.jp/gs/game/toki3/point/game/evs2.html
351:2007/07/30(月) 00:22:44
"音声合成 ゲーム"で検索すると
PS2 モジブリボンにNTT
PS2 ダビつく3に東芝
DS お料理ナビは?
DS 日本史・世界史に日立
なんてのが見つかったよ
どうなん?
361:2007/07/30(月) 00:26:22
>>33
イントネーションって網羅できるもんなの?
AquesTalkってあんまりきれいな声とは思えない
37デフォルトの名無しさん:2007/07/31(火) 01:27:57
以前でてた音声コーパスっていうのがそういうものじゃないのか?
38デフォルトの名無しさん:2007/07/31(火) 04:55:00
同じ単語でもどう使われるかでイントネーションって変わるからな。
39デフォルトの名無しさん:2007/08/01(水) 00:48:55
>>38
例えば?
40デフォルトの名無しさん:2007/08/06(月) 10:44:13
彼氏↑、彼氏↓
41デフォルトの名無しさん:2007/08/06(月) 16:39:36
箸 端 橋 嘴 波子 梯
頑張って聞き分けてください。
42デフォルトの名無しさん:2007/08/06(月) 17:10:09
無理ッス絶対無理ッス自分無理ッス
43デフォルトの名無しさん:2007/08/06(月) 20:17:36
>>41
それは「同じ単語」でイントネーションが「変わる」例になってないだろ。
44デフォルトの名無しさん:2007/08/06(月) 20:32:17
どうして>>1は舌っ足らずなんだろう。
ていうか>>6のせいで、
このスレの全てのレスが桃井声で脳内再生されるんだがw
45デフォルトの名無しさん:2007/08/06(月) 20:33:20
>>35
くまうたも忘れないでくれ
46デフォルトの名無しさん:2007/08/08(水) 01:18:40
早く作りろ
47デフォルトの名無しさん:2007/08/08(水) 01:58:32
「あ」の波形と「い」の波形を足して2で割ったら、「あ」と「い」の中間の声ができるってわけか!
48デフォルトの名無しさん:2007/08/08(水) 01:59:27
ようするに、声帯をプログラムでシミュレートすればいいんだろ
簡単ジャン
49デフォルトの名無しさん:2007/08/08(水) 02:11:22
じゃ期限は明日の0時だ。よろしく。
50デフォルトの名無しさん:2007/08/08(水) 04:15:54
オーケーベイビー
首洗って待ってな。
51デフォルトの名無しさん:2007/08/09(木) 01:17:32
まだぁー?
もう全身洗って待ってるんだけど。
52デフォルトの名無しさん:2007/08/09(木) 06:52:26
声帯って振動するだけ?声によって(高さじゃなく「あ」とか「い」)振動の仕方が異なることはないよね?
音が高くなると振動数が増えるだけだよね?
声帯が発した振動を口の形と舌でコントロールすると「あ」とか「い」になるという解釈でいいの?
舌のシミュレーションが大変そう(><;)
53デフォルトの名無しさん:2007/08/09(木) 10:39:18
音声学の勉強からやらなきゃダメだね。
昔勉強したけど、もう忘れたからお役に立てないよ、ごめん。
54デフォルトの名無しさん:2007/08/10(金) 14:06:39
必要な音素が全て含まれた文章を作って読んで、それから音素を抽出するようにすれば、そのうち望んだような声質の人が音を提供してくれることもあるんじゃないかと思るれ
551:2007/08/10(金) 16:14:15
>>54
誰の声でもいいんだったら、それでもいんだけど、
やっぱ声優の誰々の声でってのが大事だから、
今はネトラジの音声からちまちま集めてるよ
56デフォルトの名無しさん:2007/08/11(土) 18:40:21
どっちかっつーと話者変換のほうに興味があるんだが
57デフォルトの名無しさん:2007/08/16(木) 22:59:34
その声優の音声ファイルはSNいいのか?
581:2007/08/16(木) 23:48:39
>>56
話者変換って何に使うん?
自分のしゃべった声を誰かの声に似せるとかな?
591:2007/08/17(金) 00:13:19
>>57
SNは分かんねが、音は良さげ(64kbpsの44kHz)
一人しゃべりでBGMなしなんじょ
60デフォルトの名無しさん:2007/08/17(金) 01:07:05
BGMなしか。それはいいな。
とりあえずHTKでその声優の音響モデルつくるところからだべ。
61デフォルトの名無しさん:2007/08/17(金) 20:59:04
俺は女性のツテなしで自分ひとりでもマルチヒロイン声つき同人エロゲーを作れる環境が欲しい
62デフォルトの名無しさん:2007/08/24(金) 21:36:59
エロゲの音声使えば?
抜き出し出来れば、台詞も大量にあるし、テキストもあるので分割解析もしやすいしょ
63デフォルトの名無しさん:2007/08/28(火) 07:41:37
北都さんの声でお願いします
64デフォルトの名無しさん:2007/09/06(木) 14:16:39
結構凄いけど、まだ今一歩というところか。結構おしいところまでは行ってるな。
http://www.nicovideo.jp/tag/%E5%88%9D%E9%9F%B3%E3%83%9F%E3%82%AF
65デフォルトの名無しさん:2007/09/06(木) 20:14:37
>>64
藤田咲はまなストのモモ役が良かったなぁ
66デフォルトの名無しさん:2007/09/21(金) 10:48:08
ときめも2以降で採用された音声のプログラムってどんなアルゴリズムなのか分かる人教えて
67デフォルトの名無しさん:2007/12/17(月) 22:51:47
>>66
overlap add
68デフォルトの名無しさん:2007/12/19(水) 12:23:36
――
学校

 ̄ ̄ ̄\
専門学校
69デフォルトの名無しさん:2007/12/20(木) 23:14:24
>>67
ありがと。調べてみる。
ついでに初学者の入門書みたいなのがあったら教えてくれると嬉しい
70デフォルトの名無しさん:2007/12/21(金) 01:38:07
Alice Project
71デフォルトの名無しさん:2007/12/24(月) 09:25:18
2007/12/19(Wed.) ◆ Julius-4.0 リリース
72デフォルトの名無しさん:2007/12/29(土) 18:28:29
初音ミクが話題にならないあたり、ここはプログラム板じゃないのかと思ってしまう。

そんな、俺に、お勧めはこれ。

「エロ版初音ミク」の衝撃 - 「阿久女イク」を使ってみた - 偏読日記@はてな
http://d.hatena.ne.jp/a-park/20071227/p1
73デフォルトの名無しさん:2007/12/30(日) 12:03:36
音声合成というより、台詞合成だな
74デフォルトの名無しさん:2007/12/30(日) 13:55:26
>>72
ワロタ
75デフォルトの名無しさん:2008/01/06(日) 13:05:04
れこーどうえーぶ
http://recwav.dip.jp/

音声でメッセージを伝えよう
http://recwav.dip.jp/M_RECWAV_Media.asp?Speech=1221925210420080106131222
76デフォルトの名無しさん:2008/01/10(木) 21:52:09
この板の住人じゃないんだけどAquesTalkでwav保存できるソフト
あるのかな?
DTM板住人なんだけど、需要ありそうだったから。
俺自身もあったら使いたい。
オーディオアウトとインをつなげばできるけど、
そんなの嫌だしw
77デフォルトの名無しさん:2008/01/11(金) 06:44:14
全二十じゃないの?
78デフォルトの名無しさん:2008/01/11(金) 13:26:54
全二十が全二重と気づくまでに数時間を要してしまった・・・orz
要するにサウンドキャプチャソフト使えば?ということかな?
まぁ実際に配線するより数倍マシだから、それで納得するしかないか。
79デフォルトの名無しさん:2008/01/13(日) 09:32:40
普通に、ライン出力を録画するんではダメなのか?
80デフォルトの名無しさん:2008/01/18(金) 02:45:43
>>78
スマンスマンw
二十って書いたの俺かもw
81デフォルトの名無しさん:2008/01/19(土) 00:36:30
>>76
API見たら、普通にAquesTalk_Synthe()を呼べば保存できそうだけど、
そういうことじゃないのか?
ほとんどの人がライセンスがないから試せないと思われ。
82デフォルトの名無しさん:2008/01/26(土) 02:02:50
>>76
俺はここ数か月DTM板に出入りするようになった者だけど
オーディオインとアウトをつなぐって言っても
ハード的に結線するんじゃなくて
DAWのRECボタン押下→AquesTalk再生みたいな感じで
とりあえず録音はうまくいくけど
音質まではわからない
83デフォルトの名無しさん:2008/01/26(土) 02:53:10
全二重に温室関係案のカナ?
84デフォルトの名無しさん:2008/02/07(木) 12:56:18
いまどこまで進んでいるんだ?
85デフォルトの名無しさん:2008/03/24(月) 13:24:15
age
86デフォルトの名無しさん:2008/04/06(日) 12:19:17
>>1
おーい!いまどこまで進んでいるんだ?
87デフォルトの名無しさん:2008/04/07(月) 01:29:34
age
88デフォルトの名無しさん:2008/04/07(月) 04:01:19
「あ」の波形と「う」の波形を足して2で割ったら「い」の波形ができるのを発見して特許取った
89デフォルトの名無しさん:2008/04/07(月) 08:54:58
特許番号は?
90デフォルトの名無しさん:2008/04/07(月) 21:51:13
どのくらい 「い」 と区別が付かないんだ?
不自然感0?
91デフォルトの名無しさん:2008/04/07(月) 21:54:23
じゃあ俺は「い」の波形を倍にして「あ」の波形を引いたら
「う」の波形が出来るという特許を取ろうかしらん
92デフォルトの名無しさん:2008/04/23(水) 18:22:12
>>88-91
もうちょっとでアヘ声が実現するな
93デフォルトの名無しさん:2008/04/29(火) 23:32:40
>>88 特許番号は?
94デフォルトの名無しさん:2008/05/01(木) 14:02:57
juliusで音素列を指定して、
強制アライメント取れますか?
95デフォルトの名無しさん:2008/05/02(金) 23:24:08
>>94
つ 単語・音素セグメンテーションキット&Julian
9694:2008/05/07(水) 03:45:12
>>95
ありがと
juliusでディクテーションさせて、julianで強制アライメントできるようになりました。
ところで、ピッチを求めるいいアルゴリズムはありませんか?
97デフォルトの名無しさん:2008/05/14(水) 13:20:18
C++MIDIプログラミングっていう廃刊を店に売ろうか悩んでるんだけどいくらになるんだろう
98デフォルトの名無しさん:2008/05/17(土) 07:29:42
ヤフオクの方が売れるんじゃね?
9994:2008/05/19(月) 00:47:59
とりあえず、声優のラジオ番組の音声分割して、接続合成できるプログラム作ってみました
juliusの認識精度ではダメですね、手修正必須ですが
100デフォルトの名無しさん:2008/05/19(月) 08:53:12
そうか
音声素材なんてわざわざ録音しないでも
ネットラジオにいくらでも転がってるんだな
面白い発想するな
101デフォルトの名無しさん:2008/05/19(月) 22:39:48
これは意外な盲点。
個人(?)で使う分には十分だね。
102デフォルトの名無しさん:2008/05/20(火) 12:01:59
>>99
サンプルを聞いてみたいです
103デフォルトの名無しさん:2008/05/20(火) 19:25:05
周波数と最初に名づけたやつは死んでいいと思うな
10494:2008/05/24(土) 11:02:31
>>102
音ってどこにアップできます?
それと何話させましょ?
声優はSMです
105102:2008/05/24(土) 13:14:10
>>104
アップローダは↓でお願いします。
ttp://www.axfc.net/uploader/

セリフは↓のサンプル音声の「シナリオ」あたりでどうでしょう。
ttp://voice.pentax.jp/blog/64.html
106デフォルトの名無しさん:2008/05/24(土) 15:20:08
10794:2008/05/25(日) 10:00:48
108102:2008/05/25(日) 11:08:17
>>107
サンプル拝聴しました。
音素や単音単位ではなく、単語単位の連結なんですね。
語のつながりがぶつ切りで、聞き取るにはちょっと辛いかなと思います。
音素単位なら、聞き取りやすくなるかもしれませんが、
抑揚やアクセントを指定できるようにしないといけないので、難しいですが。
10994:2008/05/25(日) 22:57:56
>>108
アドバイスありがとうございます。
使えるだけ使うので、単語より長い部分も1音素だけの部分もあります。
今はピッチ情報がないので抑揚をそろえられないです。だから最長一致。
これからはピッチをそろえられるようにしてみます。
110デフォルトの名無しさん:2008/07/12(土) 13:27:35
>>109
これってオープンソースにしないの?
111デフォルトの名無しさん:2008/07/13(日) 13:49:42
>>109
94さん

>>110の追加なんですがオープンソース化のメリットは・・・

開発が止まっても後を継げる。

・例えば作者が飽きたとか、あるいは交通事故にあったとかで開発が止まったとする。
 そんな場合、誰かが開発を引き継いでくれる可能性がある。

誰かが他のOSに移植してくれる。

・誰かがMacOS版を作りたいと思ったときに、ソースコードを見ずに移植した場合、どうして
 も互換性に問題が出る。
 しかし、ソースが公開されていれば、少ない手間でほぼ完全な移植ができる。
 環境に依存した部分は書き直したり、移植が難しい部分については機能を削ったりする
 必要があるけど、それでも一から書くよりはずっと楽。
 ちなみに、現在Windows以外の環境でサポート外の動いている場合、
 それは誰かが更新履歴の仕様を見て、オリジナルのコードを使わずに
 クラックして移植したものだ。ありがたいことだけど、
 もしソースが公開されていたらこの作業は不要だったはずで、その人はもっと別の作業ができた。

バグを修正できる
・誰かがバグを見つけ、それを報告したとする。
 それをみた第三者かが、ソースコードの中から原因を見つけて、
 作者に「ここを直せばいいぞ」と教えてくれる可能性がある。
 ひょっとしたら修正したソースコードをupしてくれるかもしれない。
112111:2008/07/13(日) 13:52:00
>>111 続き
自分で改良して、それを作者に提案できる。
・第三者ソフトウェアを見て「ここを改良したらもっと良くなるんじゃないのか?」
 もしくは「こんな機能を追加したらもっとよくなるんじゃないの?と誰かが思ったとする。
 その場合、公開されているコードを改良・追加し、作者に改良案や機能追加案を提案する
 ことができる。
 作者がその人の方がより開発に向いていると判断した人は、作者の許可を得て改良版を
 公開することができる。
 第三者が改良案や機能追加案を提案して作者がそれを見て、影響を受けて、第三者の
 改良版を使用しながら作者は更なる改良を加えることができる。
 ソースが公開されていなかったら、作者に具体的に改良案や機能追加案を
 提案することが難しい。

HDDが飛んでも即死しない
・「作者のHDDが飛んだので開発中止」っていうソフトたまにあるよね……あれはむなしい。
  ソースがサーバ上にアップしていれば、作者のHDDが飛んでも、開発を続行することが
  できる。

とこんな感じなメリットがあります。
長文になってすいません。 ぜひご検討のほうよろしくお願いします。
113デフォルトの名無しさん:2008/07/13(日) 22:37:30
でたーオプソ厨
114デフォルトの名無しさん:2008/07/14(月) 12:10:04
>>110
>>111
>>112

それはいいアイディアですね。 ぜひやってもらいたいです。
115デフォルトの名無しさん:2008/07/14(月) 12:14:13
反論するのも馬鹿馬鹿しいが。
>・「作者のHDDが飛んだので開発中止」っていうソフトたまにあるよね……あれはむなしい。
これを字義通りに受け取る(或いはそのように敢えて振舞う)人がいることに驚いた。
116デフォルトの名無しさん:2008/07/14(月) 22:51:41
俺が学生時代にちまちま作ってたしょぼいソフトは
まさしくその運命をたどったよ
117デフォルトの名無しさん:2008/07/15(火) 01:33:45
そういや昔のプログラムはフロッピーに入れてたのでもう見れなくなったなw
118デフォルトの名無しさん:2008/07/15(火) 03:56:00
実はハードごとまだ生きてる
子供の頃しこしこ打ち込んでた雑誌掲載のBASICゲームは起動メニューを作っておいたので
ファイル名すら覚えてなくても今でも遊べる
子供時代の自分の聡明さにしばし感動
今はもう駄目かもわからんね
119デフォルトの名無しさん:2008/07/15(火) 21:05:07
そこで FILES
120デフォルトの名無しさん:2008/07/19(土) 12:36:03
>>109
おーい。94氏 オープンソース化しないのかい?
返事をくれ。
121デフォルトの名無しさん:2008/07/19(土) 13:34:24
自分の要求のために他者に負担をかけることを当然のように考えてるからオプソ「厨」って付くんだな。
122デフォルトの名無しさん:2008/07/19(土) 13:55:25
某コナンの蝶ネクタイ型変声機みたいな物は作れないかなぁ
他人の声からパラメータだけ抽出して、云々
123デフォルトの名無しさん:2008/07/19(土) 14:16:39
既にあるんですね...
124デフォルトの名無しさん:2008/07/19(土) 17:00:43
オプソ厨って、自作自演だよw
シェア作家のなw
125デフォルトの名無しさん:2008/07/20(日) 10:50:58
>>124
そんなわけないだろうw
12694:2008/07/20(日) 12:22:06
久々に見に来たらレス増えてた。。。
オープンソースにするのはいいんですけど、プログラムだけだと何もできませんよ?
素材の音声データが無いと。それもかなりの量で。。
127デフォルトの名無しさん:2008/07/20(日) 14:54:58
プログラムの権利より音声データの権利のほうが問題になりがち
128デフォルトの名無しさん:2008/07/20(日) 15:05:16
>>122
1.マイクの声から声帯の影響を取り除く
2.フォルマントを他人の位置に移動する
でできるかも
129デフォルトの名無しさん:2008/07/20(日) 23:56:23
>>126
>オープンソースにするのはいいんですけど、プログラムだけだと何もできませんよ?

それでもいいと思う。

自分の声のデータを入れて合成することもできるし。

オープンソースなら合成エンジンをもっと高性能化することもできるし。

使う側が改造できるだけでなく、作った側にも自分の技術を高める、新しい着想を得る

といった双方にメリットがあるかもしれませんし。
130デフォルトの名無しさん:2008/07/21(月) 01:03:03
>>129
オープンソースって勝手に改変してくれる分にはいいけどパッチとか
送ってこられるとうざくない?
正直ソースが穢れるけど、拒否するとアンチ化しそうだし。
131デフォルトの名無しさん:2008/07/21(月) 02:24:44
そりゃ、コミュニケーション力がないだけだな。
適当にあしらえばいいし、ソースは参考になるなら自分で書き直して入れましたでいい。

オープンソースと、みんなで開発はまた別だよ。
132デフォルトの名無しさん:2008/07/21(月) 02:29:45
すべての会話音声を録音して流せば解決
133デフォルトの名無しさん:2008/07/21(月) 11:45:45
>>109
>>94
このプログラムは「Alice Project」と同じようなことができるのかい?

又某コナンの蝶ネクタイ型変声機みたいな機能を追加する予定とかはあるのかい?
134デフォルトの名無しさん:2008/07/21(月) 20:30:25
>>131
参考になるものは送ってこないから。
これだけは断言できる。
勘弁してーってお願いしたくなるようなうんこ送りつけて奇妙な主張を
しつこくしてくるのが関の山。
いやほんとしつこくされるよ。
住所なんか当たり前のように調べてくるしね。
それなりの覚悟がないとオープンソースは無理だよ。
135デフォルトの名無しさん:2008/07/21(月) 21:18:17
どうでもいいがペンタックスの合成ライブラリはかなり巧い
136デフォルトの名無しさん:2008/07/21(月) 22:28:41
>>134
そんなわけねえだろうよw
確かに参考になるものは送られてこないのは確かだけど、しつこくは
されないだろう。

しかもメールアドレスを公開しないでオープンソース化すればいいだけの話。
137デフォルトの名無しさん:2008/07/21(月) 22:32:25
オープンソース化ってもごく一部のソフト以外はパッチが送られてくるどころか読まれることすらほとんどなさそーな悪寒。
138デフォルトの名無しさん:2008/07/21(月) 23:19:57
てか、ソース見せ合うだけなら
どっかに無料のうpロダ用意してそこに勝手にソースをうpしたり、落としたりすれば良いんでは?
139デフォルトの名無しさん:2008/07/22(火) 00:15:42
反オプソ厨は、言い訳が稚拙なのがなw

普通に、手柄を独り占めしたい、ソースを見せたくない、でいいんだよw
140デフォルトの名無しさん:2008/07/22(火) 00:48:55
>>136
じゃぁそうしてみろよ。
どっかのロダに匿名で上げて見れ。
おれの創作物を勝手にオープンソースにしやがったってやつが3人は
出てくるから。
そうすればオープンソース厨の怖さが少しは理解できるだろ。
奴らは(無料も含めた)金のためなら何でもするからな。
141デフォルトの名無しさん:2008/07/22(火) 01:16:48
>>139
バカなオプソ厨を装った釣りとかネタか?
作った人間が手柄を独り占めできるのは当然の権利で言い訳とかいらんだろ?
むしろオプソ厨のほうが「あなたの手柄をタダ取りしたいんでソース見せてください」ってのを
いかにオブラートにくるんでうまく言えるか工夫しなきゃいけない立場なのに。
142デフォルトの名無しさん:2008/07/22(火) 01:24:19
>>141
だったら言い訳しなくていいよw 言い訳するってのは、何らかの心の働きだから。
いちいち、オプソ厨がウザイとか、ソースが汚いから見せるのが嫌だとか、しょうもない言い訳はいらんから。

まぁ、他の人のソースパクってて本当に見せられない奴も中にはいるだろうけどw
143デフォルトの名無しさん:2008/07/22(火) 01:37:40
>>142
え?マジなの?本当はオプソ厨のふりしたネガキャンだよな?
144デフォルトの名無しさん:2008/07/22(火) 23:53:47
>>140
だったらGPLもしくはGNU等のライセンスで公開すれば?
ちなみに、俺もオープンソースで公開したんたが、そんなことはなかったと思うな。
145デフォルトの名無しさん:2008/07/23(水) 00:00:43
誰か再うpしてくれないか
間違えて削除してしまった
146デフォルトの名無しさん:2008/07/23(水) 00:23:13
>>144
匿名でGPL等でうぷした場合の話だろ。
おまえは都合の悪い話は一切読めないのか?

クレクレ言ってる時点でオプソ厨のニオイがプンプンしてるんだよ。

匿名じゃない場合は過去ログ参照。
147デフォルトの名無しさん:2008/07/23(水) 01:01:07
こういう流れを作ってグダグダにするのがオプソ厨の狙いなんだから相手するなよw
148デフォルトの名無しさん:2008/07/23(水) 03:23:34
嫌なら嫌だって言えば良いだけだしな。
つーか、厨はクローズドの方がよってくると思うがw
あれしてくれ、これしてくれってw

オープンソース・フリーソフトなら、自分でやれ!で終わるw
149デフォルトの名無しさん:2008/07/23(水) 08:28:05
もし公開するならある程度完成度をあげてからの方がいいよ。オリジナルは俺だと主張できるくらいにね。
中途半端なソースを公開する必要なんて無い。
150デフォルトの名無しさん:2008/07/23(水) 13:10:13
実際の声からサンプリングするんじゃなくて、人間の声帯を物理モデリングして作れよ。
151デフォルトの名無しさん:2008/07/23(水) 16:14:23
式うpしてくれ
152デフォルトの名無しさん:2008/07/24(木) 02:26:56
まずは模型を作るところから始めるんだ
153デフォルトの名無しさん:2008/07/25(金) 16:16:30
>>146

>勘弁してーってお願いしたくなるようなうんこ送りつけて奇妙な主張を
>しつこくしてくるのが関の山。
>いやほんとしつこくされるよ。
>住所なんか当たり前のように調べてくるしね。

匿名なのにどうやって送りつけるんだい?
話が矛盾してるぞ。
154おい:2008/07/25(金) 17:56:19
Shut the fuck up and write some code.
155デフォルトの名無しさん:2008/07/25(金) 21:14:17
>>153
ほんとに頭の悪い子だな。
頭の悪さは公表しなくていいからそっと隠しておけよ。
100回読みなおせばお前でも理解できるかも知れんから読みなおせ。
156デフォルトの名無しさん:2008/07/25(金) 22:09:22
とりあえず Win + U×2 しとけ
157デフォルトの名無しさん:2008/07/25(金) 23:05:35
自分の声から音声を合成し、入力したテキストを読み上げられるソフトを、OKIが発売した。病気などで声を失った人に、自分の声の代わりに使ってもらいたいという。
http://www.itmedia.co.jp/news/articles/0807/25/news011.html
158デフォルトの名無しさん:2008/07/26(土) 00:49:05
声を失った人が、自分の声から音声を合成することは出来ないと思うのだが
159158:2008/07/26(土) 00:50:41
って書いてから記事を読んで理解した。すまそ。
160デフォルトの名無しさん:2008/07/27(日) 00:18:05
>>146
そんなの匿名でやればいい話
161デフォルトの名無しさん:2008/07/27(日) 00:26:50
まだ作ってないのかおまえら
162デフォルトの名無しさん:2008/07/27(日) 09:42:30
>>160
だからお前がやればいいだろ。
オプソ厨の最大の欠点は、人が作ったものはクレクレ言って、オプソにしなければ
ならないと一生懸命言うけど、自分では何も作らないことだな。
社会正義のためとか言うけど、そんなものに興味があるなら自分でやれ。
おれは全然興味ない。
163デフォルトの名無しさん:2008/07/27(日) 11:30:58
ところでバーローの蝶ネクタイ型変声機みたいな物はできるのかね?
164デフォルトの名無しさん:2008/07/27(日) 11:56:39
ぼかりすは似たようなもんだと思う。
165デフォルトの名無しさん:2008/07/27(日) 14:23:25
韻律も含めて他人の声に変換してもらいたいなー
166デフォルトの名無しさん:2008/07/27(日) 16:18:32
しかし、オープンソースにするとパッチとかがウザイとか言うけど、
どう考えてもクローズドの方が、オープンにしろって要望も含めて、あれやってくれこれやってくれって五月蝿いと思うがw

まぁ、かまってちゃんならそっちの方がいいんだろうけどw
167デフォルトの名無しさん:2008/07/27(日) 19:03:07
某コナンの蝶ネクタイ型変声機みたいな物はどうやって作るんだい?
そのアルゴリズム等を提案してみてください。
168デフォルトの名無しさん:2008/07/27(日) 20:30:52
変声機はどっちかというと、元の音声をいかに消すかが肝だと思うw
169デフォルトの名無しさん:2008/07/27(日) 20:37:01
音声認識して音声合成しなおせばいいんじゃね?
170デフォルトの名無しさん:2008/07/29(火) 12:29:37
ところで音声合成ってどうやって作るんだい?
アルゴリズムを提案してくれ。
171デフォルトの名無しさん:2008/07/29(火) 17:44:36
基本は、サンプリングのツギハギ。
声帯を物理シミュレーションしてるのは、あるのかな?
172デフォルトの名無しさん:2008/07/30(水) 01:18:20
173デフォルトの名無しさん:2008/08/01(金) 00:14:21

94氏
この掲示板みてたら、現状を報告してくれ。
174デフォルトの名無しさん:2008/08/03(日) 19:07:12
変声機つくっても犯罪用途しか思いつかないなぁw
175デフォルトの名無しさん:2008/08/03(日) 20:42:59
マイナー分野である音声合成技術が、オレオレ詐欺に使われることで一躍世間の注目を浴びる、と。
176デフォルトの名無しさん:2008/08/03(日) 21:08:32
それ既にあるぞ
177デフォルトの名無しさん:2008/08/04(月) 19:12:59
こんなんみつけた
ttp://d.hatena.ne.jp/shoozhoo/20080712

やっぱ英語用の音声合成は日本語じゃ役立たずなのか?
178デフォルトの名無しさん:2008/08/06(水) 22:21:13
ところで誰か音声合成プログラムを作っている人いるかね?
179デフォルトの名無しさん:2008/08/12(火) 00:25:48
ボイーン
180デフォルトの名無しさん:2008/09/04(木) 03:02:37
>>171
面白い特許を見つけました。シンセサイザーの方では表現力が高いとして
90年代に研究され尽くされた物理モデリングアルゴリズムDWGを
音声シンセサイザーに応用するものです。
http://www.patentgenius.com/patent/5528726.html
181デフォルトの名無しさん:2008/09/08(月) 11:38:26
よく見つけたな。ちょっと読んでみるか
182デフォルトの名無しさん:2008/09/15(月) 06:39:06
http://prius.hitachi.co.jp/prius/pc/2005may/yomiwaza/index.html
>※本ソフトウェアが出力する読み上げ音声の著作権は株式会社 日立製作所が保有します。

これってどうなの?
ここまで著作権を主張できるもんなの?
183デフォルトの名無しさん:2008/09/15(月) 10:37:50
フォントの著作権の問題に似てるな
184デフォルトの名無しさん:2008/10/14(火) 11:10:46
そろそろ何か作りれたか?
185デフォルトの名無しさん:2008/10/14(火) 21:24:36
日本語でおk
186デフォルトの名無しさん:2008/10/18(土) 15:12:50
>>94氏へ
この掲示板みてたら、なんでもいいから報告をしてくれ。
187デフォルトの名無しさん:2008/12/24(水) 02:45:19
188デフォルトの名無しさん:2009/01/03(土) 11:49:06
age
189デフォルトの名無しさん:2009/02/05(木) 07:16:16
保守
190デフォルトの名無しさん:2009/02/05(木) 11:09:11
>>182
しかし読み上げた結果の音声を自由に使えなきゃ意味ないよな。
191デフォルトの名無しさん:2009/02/05(木) 11:11:41
そういえば、ちょっと前にアニメのキャラクターで音声合成するのがあったけど、あのベースになっているアルゴリズムはなんなんだろ。
藤崎モデルだっけ、あれとはちょっと違うでしょ?
192デフォルトの名無しさん:2009/02/08(日) 10:49:41
波形接続だろ
193デフォルトの名無しさん:2009/02/08(日) 11:15:27
でも、通常の波形接続リソースとは変えないとキャラっぽいしゃべりは無理だろ?
194デフォルトの名無しさん:2009/02/09(月) 00:16:52
キャラ声でキャラせりふを録音しておくんだからOKだろ?
195デフォルトの名無しさん:2009/02/09(月) 09:26:51
それじゃうまくいかないんじゃないか?
とはいえ、音声リソースに手作業で情報追加すれば何とかなるのかや。
196デフォルトの名無しさん:2009/02/09(月) 10:49:52
量を確保できればなんとかなる。それが波形接続のメリット。
韻律モデルが重要になるが、機械学習のアルゴリズムも確立してきてるし、
そこそこのクオリティはすぐ出せるはず。
197デフォルトの名無しさん:2009/02/10(火) 23:16:28
>>196
統計だから最適なデータを用意すればそこそこできるのはわかるけど、
ウェブサービスだったのは意外とすぐに出てきた感じがしたんだ。

大量に用意したら、波形を分割するて作業とか増えるじゃん。
韻律モデルは声優の真似ができるほどのものはまだないと思ってたけど。
198デフォルトの名無しさん:2009/02/14(土) 04:41:05
overlap add
199デフォルトの名無しさん:2009/02/17(火) 14:31:50
>>198
わからんな、単語並べられてもさ。
200デフォルトの名無しさん:2009/02/17(火) 20:41:36
>>191 のアルゴリズムがoverlap additionだと言いたいんだろうな
201デフォルトの名無しさん:2009/02/23(月) 11:31:09
簡単な波形接続プログラム作ってみた
Ne_46114
makaron
202デフォルトの名無しさん:2009/02/23(月) 18:17:57
ttp://www1.axfc.net/uploader/Ne/so/46114
みんながみんなお前や俺のようなワレザーじゃないんだからURLを併記するべき
それはそうと入力した語句がwavに反映されない。

buliding database
done
input text


こんにちわ。

1 sp /*/ 614 400 242
203デフォルトの名無しさん:2009/02/24(火) 08:14:40
申し訳ない。上でそこ使ってたから、デフォかと思ったよ。

で、音が出ないってのだけど、dataフォルダの中にポッドキャストの
wavファイルは作ってあるんだよね?んー、なんでだろう。
204デフォルトの名無しさん:2009/02/24(火) 21:59:55
もちろん
全てREADMEの通りに行った
原因が思いつかないなら結構場所食うし消すわ
205デフォルトの名無しさん:2009/03/09(月) 12:22:15
>>202
すいません。それをもう一度うpしてくれませんか?

後このソフトはオープンソースですか?
206デフォルトの名無しさん:2009/03/09(月) 20:05:03
おっと盗賊が現れた。
207デフォルトの名無しさん:2009/03/11(水) 12:26:04
>>201
>>202のURLからダウンロードできないんだが・・・
もう一度うpしてくれるか?
208デフォルトの名無しさん:2009/03/11(水) 12:44:47
もうなくなっているようだな。
209デフォルトの名無しさん:2009/03/11(水) 15:14:17
だれでもいいからうpしてくれ
210デフォルトの名無しさん:2009/03/26(木) 11:58:27
そういえば、声を好きな人の声に変換するものがあったけど、あのアルゴリズムはどうなっているんだろう?
211デフォルトの名無しさん:2009/03/31(火) 09:09:02
好きな人の声ってなんだよ?
212デフォルトの名無しさん:2009/03/31(火) 11:13:33
俺で言えば佐伯香織ちゃんの声だよ
213デフォルトの名無しさん:2009/03/31(火) 17:26:09
音声認識して音声再生してるだけじゃないの?
214デフォルトの名無しさん:2009/04/03(金) 15:48:54
>>210
それって声質変換のことじゃないの?
声質変換って声の周波数で他人の声に変えることかな?
215デフォルトの名無しさん:2009/04/04(土) 00:09:17
ふぉるまんと0の成分を上げ下げすればいいんじゃね?
216デフォルトの名無しさん:2009/04/04(土) 20:24:59
>>215
それで本当に他人の声に変えることができるの?
だれか詳しい人教えて
217デフォルトの名無しさん:2009/04/05(日) 02:42:50
>>216
おとこ、おんな、こども、
っぽく変換はできる。

でも、20年前の技術だぞ?
218デフォルトの名無しさん:2009/04/11(土) 16:55:30
声質変換技術で他人の声の変換するにはどのようにすればいいのかな?
219デフォルトの名無しさん:2009/04/11(土) 20:22:18
んなの英語の論文調べなよ。
220デフォルトの名無しさん:2009/05/25(月) 22:41:33
声優いわく、BIGLOBEのコエラボは5日間の収録だそうだぞ
221デフォルトの名無しさん:2009/05/26(火) 22:16:46
222デフォルトの名無しさん:2009/05/27(水) 00:07:24
>>221
ちょーやばくねー。
223デフォルトの名無しさん:2009/05/31(日) 03:43:40
>>221
なんかムカつく。でもそれがいい
224デフォルトの名無しさん:2009/06/30(火) 15:03:16
age
225デフォルトの名無しさん:2009/07/02(木) 08:08:16
なぜ、VOICE TEXTがでてこない・・・
市販の音声合成ではあれの出来がかなりよい
226デフォルトの名無しさん:2009/07/02(木) 21:18:35
Harukaってコメント程度ならいいけど、
聞き続けるとムカつきそうw
227デフォルトの名無しさん:2009/07/03(金) 08:01:09
>>226
確かにw
最初は可愛いと思うがだんだんゆとりの女子高生に思えてきたw
228デフォルトの名無しさん:2009/08/13(木) 20:00:14
声質を変換できる方法ってあるのかな?
229デフォルトの名無しさん:2009/08/13(木) 20:17:19
うん
230222.248.109.70:2009/08/17(月) 17:45:20
Q. 自動保守#K9K?_D[L とは一体何なのか?
A. 外部サイトへの突撃大好きな真性厨房

韓国突撃でお馴染みの自動保守
最近は自動焼人 ★として2ちゃんねるのボランティアにも精を出す日々
だがそんな彼にも、人間らしい部分はあったのだ…

名言集
『アパッチ砲はワシが作った』
『お前が規制系キャップ取れるか審査してやるよ』
『いつもサボってばかりのキャップがウゼえ』
『俺、100人規模の集団サイバーテロの主犯だったこともあるんだぜ』
『俺の経歴カックイイだろ?』

最近のニュース
 8月15日の韓国突撃の際に歴史的大敗を喫する。ラジオでの敗戦宣言のときに声が震えていた
 本人は体調不良と言っているが…


----------------------------------------------
この自動焼人 ★メールマガジンの配信停止をご希望される方は
http://qb5.2ch.net/test/read.cgi/sec2chd/1250169591/
にて自動焼人 ★までご連絡ください
231デフォルトの名無しさん:2009/08/31(月) 22:39:57
声質を変換できる方法ってあるの?
232デフォルトの名無しさん:2009/08/31(月) 22:42:46
うん
233デフォルトの名無しさん:2009/10/03(土) 16:56:55
ほしゅ
234デフォルトの名無しさん:2009/10/04(日) 11:19:20
VOCALOID2 シーケンス (VSQ) ファイルのフォーマット (推定)
ttp://www5d.biglobe.ne.jp/~noocyte/Programming/FileFormat/VSQ.html
235デフォルトの名無しさん:2010/02/11(木) 11:05:27
つOpenJtalk
236デフォルトの名無しさん:2010/02/14(日) 19:22:47
肖像画から頭蓋骨のCGを作成して声を再現する奴があったと思うんだがあれはどうやるんだろう?
誰か教えて
237デフォルトの名無しさん:2010/02/15(月) 07:51:28
あったね
238デフォルトの名無しさん:2010/02/16(火) 14:06:08
>>237
どうやるの?
239デフォルトの名無しさん:2010/02/16(火) 21:04:17
やっぱり音響モデルじゃないのかな
240デフォルトの名無しさん:2010/02/16(火) 23:34:34
>>239
音響モデル?
詳しく教えて
241デフォルトの名無しさん:2010/02/27(土) 20:30:27
肖像画から頭蓋骨のCGを作成して声を再現する奴があったと思うんだがあれはどうやるんだろう?
誰か教えて
242デフォルトの名無しさん:2010/02/27(土) 23:15:36
あったね
243デフォルトの名無しさん:2010/02/27(土) 23:24:51
>>242
どうやるの?
244デフォルトの名無しさん:2010/02/28(日) 13:02:52
やっぱり音響モデルじゃないのかな
245デフォルトの名無しさん:2010/02/28(日) 16:19:26
>>244
日本音響研究所に肖像画から頭蓋骨のCGを作成して声を再現するものがあったと思うがあれはどうやるの?
246デフォルトの名無しさん:2010/02/28(日) 17:41:40
肖像画からCGを作成するのは六角大王の手法でできるんじゃね
247デフォルトの名無しさん:2010/02/28(日) 18:38:51
涼宮ハルヒのエンドレス夏休みを見ている気分ですねわかります
248デフォルトの名無しさん:2010/03/02(火) 23:08:24
>>246
どうやってやる?
249デフォルトの名無しさん:2010/03/21(日) 23:17:01
マジレスすると、頭蓋のサイズから声道長を推定して、
フォルマント位置を決めるって感じか。
ま、肖像画とかから復元した声ってほとんど当てにならないけどな。
250デフォルトの名無しさん:2010/04/12(月) 00:29:58
>>249
肖像画からどうやって頭蓋のサイズを出してるの?
251デフォルトの名無しさん:2010/04/12(月) 19:11:06
俺の写真から声を復元したとして、
俺の声にどこまで近くなるんだろうか?
252デフォルトの名無しさん:2010/04/12(月) 23:10:15
>>251
そもそも顔写真から頭蓋のサイズを割り出すにはどうやって割り出せばいいの?
253デフォルトの名無しさん:2010/04/15(木) 12:59:30
その写真に写りこんでいる、寸法の判っているものを基準にすればいいんじゃね
254デフォルトの名無しさん:2010/04/15(木) 17:26:26
ネッシーの捏造写真だってサイズ割り出されてたもんな
255デフォルトの名無しさん:2010/04/15(木) 17:34:19
波紋の伝播周期からサイズが決定できるってことかな。
256デフォルトの名無しさん:2010/04/15(木) 19:19:57
257デフォルトの名無しさん:2010/04/15(木) 22:31:48
w
258デフォルトの名無しさん:2010/04/17(土) 18:26:20
>>253
でも肖像画に寸法の判っているものがなかったらどうするの?
259デフォルトの名無しさん:2010/04/17(土) 20:29:56
何でお前らそんなに世話焼きなの?
260デフォルトの名無しさん:2010/04/19(月) 11:43:36
>>258
そんときは、目玉の大きさとか目の感覚とか、統計的手法に頼ればいいんじゃね

>>259
暇なんじゃね?
261デフォルトの名無しさん:2010/04/19(月) 13:10:40
>>258
声のキャラクタってのは体格以外の要素も絡むわけで、
例えば故人の歌声を再現、とかやりたい場合は大抵残念な結果になるよ。
そもそもここで聞くより元の論文探して見当つけたほうが早くね?

>>260
こういうのも頭部画像だけで測れちゃったり?
ttp://m.onet.pl/_m/94cfc8bff0ea6227e4a8547781d30f45,35,1.jpg
ttp://image.blog.livedoor.jp/laba_q/imgs/1/9/19f92fc1.jpg
262デフォルトの名無しさん:2010/04/19(月) 19:22:54
サイズはパラメータにしておいて、
平均値を使った場合と
その前後の値を使った場合と全部試してみて
この中のどれかですって言えばいいんじゃない
263デフォルトの名無しさん:2010/04/20(火) 17:55:12
>>261
ググッても見つからないんだが・・・
264デフォルトの名無しさん:2010/04/21(水) 19:02:15
>>261
探しても見つからないよ
265デフォルトの名無しさん:2010/04/22(木) 22:39:13
一卵性双生児の場合、声(歌声も)は全く同じではないだろ
だから頭部の数値だけでは不十分な気がする
266デフォルトの名無しさん:2010/04/22(木) 22:56:07
>>265
でも↓を見ると
http://www.onkyo-lab.com/mv.html

>そこで肖像画、写真、銅像等があれば、性別、身長、年齢、顔形を特定してその人の発声器官をコンピュータ上で電子回路に置き換え、
>シミュレーションして声を合成することが出来るのです。

って書かれているんだが・・・・

てかそもそも肖像画からどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出しているんだろう?
267デフォルトの名無しさん:2010/04/22(木) 22:58:41
声を合成できる事と
その声が実際の声と一致している事とは別だよ
268デフォルトの名無しさん:2010/04/23(金) 13:27:11
>>267
うん。だけど肖像画からどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出しているの?
269デフォルトの名無しさん:2010/04/23(金) 23:17:59
日本音響研究所に不可能はない
270デフォルトの名無しさん:2010/04/24(土) 00:03:36
>>269
だからどうやってやったの?
271デフォルトの名無しさん:2010/04/24(土) 00:15:07
日本音響研究所のおっさんに直接聞けよ
272デフォルトの名無しさん:2010/04/24(土) 23:13:48
>>271
直接聞いても企業秘密で答えてくれない
おまえらの力で考えるしかない
273デフォルトの名無しさん:2010/04/25(日) 09:48:56
>>266
肖像画が残るような人物なら性別は記録からすぐ分かるだろ
低脳

顔の各部分の寸法に関しては、
肖像画とその人物の民族平均を比較するんだよ。
低脳
274デフォルトの名無しさん:2010/04/27(火) 23:30:32
【歴史】169センチ、62キロだった龍馬 大男伝説に一石 山梨
http://tsushima.2ch.net/test/read.cgi/newsplus/1272325001/
甲州の研究家襟幅から算出
甲州市塩山上井尻の郷土史研究家、矢崎勝巳さんが写真から体格を測定する方法を
考案し、幕末の志士・坂本龍馬(1835〜67年)の身長を169センチ、体重を62・1キロと
算出した。平均身長が150センチ台だった幕末当時、龍馬の身長は5尺7寸(173センチ)
とも6尺(182センチ)とも伝えられ、長い間大男だったとされてきたが、一石を投じそうだ。

矢崎さんは、当時の着物の襟幅が6センチか6・5センチの2種類しかないことに着目した。
6センチとすると背が低くなりすぎるため、6・5センチとして龍馬の立位の肖像写真で算出した。
2007年10月の日本人類学会で、龍馬の身長は170センチに満たなかったとの試算を
紹介したのに続き、昨年10月の同学会では体格指数BMIで体重を試算する方法も発表した。

このほど、龍馬のBMI指数を標準体形の「18・5以上25未満」と仮定し、標準値の
(以下省略)

ソース:読売新聞
http://www.yomiuri.co.jp/e-japan/yamanashi/news/20100426-OYT8T01349.htm
画像:坂本龍馬の肖像写真
http://www.yomiuri.co.jp/photo/20100426-932069-1-L.jpg
275デフォルトの名無しさん:2010/04/27(火) 23:58:20
ところで証明写真などの顔写真からどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出しているんだろう?
276デフォルトの名無しさん:2010/04/28(水) 18:02:44
おーい証明写真などの顔写真からどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出しているんだろう?
277デフォルトの名無しさん:2010/04/28(水) 18:36:50
ねえねえ証明写真などの顔写真からどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出しているの?
278デフォルトの名無しさん:2010/04/28(水) 20:13:21
そして誰もいなくなった
279デフォルトの名無しさん:2010/04/29(木) 23:02:27
ところで証明写真などの顔写真からどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出しているんだろう?
280デフォルトの名無しさん:2010/04/30(金) 01:37:52
男の声をピッチ上げるだけだと、女っぽくならないのは何故だろう
281デフォルトの名無しさん:2010/04/30(金) 01:50:08
ボカロで言うGENとかUTAUでいうgフラグを調整する必要がある
282デフォルトの名無しさん:2010/05/01(土) 14:24:27
ところで証明写真などの顔写真からどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出しているんだろう?
283デフォルトの名無しさん:2010/05/01(土) 19:24:01
ねえねえ証明写真などの顔写真からどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出しているんだろう?
284デフォルトの名無しさん:2010/05/04(火) 18:39:42
おーい証明写真などの顔写真からどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出しているんだろう?
285デフォルトの名無しさん:2010/05/04(火) 23:25:22
発声時における声帯から口までの空気の流れを粒子法でモデル化して
音声合成を作ってみたいと急に思い立ったんだが、右も左も分からない。

とりあえず、これは圧縮性流れと見なしてシミュレートすればいいのか
286デフォルトの名無しさん:2010/05/06(木) 23:04:54
ところで証明写真などの顔写真からどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出すの?
287デフォルトの名無しさん:2010/05/07(金) 00:23:20
>>286
一般的には統計を利用する。
288デフォルトの名無しさん:2010/05/07(金) 16:24:45
>>287
どうやってやるの?
具体的に教えてくれる?
289デフォルトの名無しさん:2010/05/07(金) 16:57:59
てかそもそも証明写真などの顔写真からどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出すの?
290デフォルトの名無しさん:2010/05/20(木) 15:00:33
証明写真などの顔写真から統計を使ってどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出すの?
291デフォルトの名無しさん:2010/06/08(火) 23:57:00
ところで証明写真などの顔写真から統計を使ってどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出すの?
292デフォルトの名無しさん:2010/06/11(金) 13:49:50
>>291
とりあえず証明写真見て性別を5割以上の確率で当てられないバカはお前くらいじゃねーの
293デフォルトの名無しさん:2010/06/12(土) 22:08:09
ところで証明写真などの顔写真から統計を使ってどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出すの?
294デフォルトの名無しさん:2010/06/12(土) 23:22:47
きっと後ろの壁に横線が並んでるんだよ。
295デフォルトの名無しさん:2010/06/13(日) 15:05:51
うん。だけど証明写真などの顔写真から統計を使ってどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出すの?
296デフォルトの名無しさん:2010/07/06(火) 18:15:36
>>1を見て
鏡の国のレジェンドでのりぴーの声を1音ずつ喋らすことができるんだけど
それを録音してX68にADPCMで取り込んでおいて順次再生して「おまんこ」とか
「ちんちんいれて」とか喋らせて大喜びしてたのを思い出した
297デフォルトの名無しさん:2010/12/07(火) 04:06:55
音について質問です

例で
Windows Wave 無圧縮 PCM 16 bit 44kHz サンプリング ステレオ

wav format
http://www.kk.iij4u.or.jp/~kondo/wave/#wav
http://hooktail.org/computer/index.php?Wave%A5%D5%A5%A1%A5%A4%A5%EB%A4%F2%C6%FE%BD%D0%CE%CF%A4%B7%A4%C6%A4%DF%A4%EB

波形データはステレオの場合LRLR・・ と並ぶなどの説明までは沢山の日本語サイトであるんですけど
その多くがWAV ファイルヘッダ情報ばかり詳しく述べて肝心のデータ部分の説明がおざなりで解りません。

波形データ符号付き整数 (-32768 - 32767) 16ビットの場合 FFFF8000 〜 0 〜 7FFF

リトルエンディアン にすると 00 80 FF FF 〜 00 00 00 00 〜 FF 7F 00 00 ですよね。

data (波形データのバイト数) 波形データL 波形データR 波形データL 波形データR ですよね。

解らないのは、リニア PCM の場合
整数16bit / リトルエンディアン
L0L1L2L3  / L3 L2 L1 L0
R0R1R2R3  / R3 R2 R1 R0

格納順番は
これ?> data (波形データのバイト数) L3 R3 L2 R2 L1 R1 L0 R0 L3 R3 L2 R2 L1 R1 L0 R0 L3 R3 L2 R2 L1 R1 L0 R0
コレ?> data (波形データのバイト数) L3 L2 L1 L0 R3 R2 R1 R0 L3 L2 L1 L0 R3 R2 R1 R0 L3 L2 L1 L0 R3 R2 R1 R0

日本語サイトでここが詳しいとリンクしている英語サイト
https://ccrma.stanford.edu/courses/422/projects/WaveFormat/
では矢印のつけ方がどちらとも受け取れるので
音が変
298デフォルトの名無しさん:2010/12/07(火) 07:51:53
>リトルエンディアン にすると 00 80 FF FF 〜 00 00 00 00 〜 FF 7F 00 00 ですよね。

それ32bitじゃね?
299デフォルトの名無しさん:2010/12/07(火) 14:18:42
>>297
16ビットは2バイトだと気がつけば格納順番も分かると思います。

波形データ符号付き整数 (-32768 - 32767) 16ビットの場合 8000 〜 0 〜 7FFF
リトルエンディアン にすると 00 80 〜 00 00 〜 FF 7F
data (波形データのバイト数) 波形データL 波形データR 波形データL 波形データR

整数16bit/リトルエンディアン
L0L1  / L1 L0
R0R1  / R1 R0

格納順番はこうなります。
data (波形データのバイト数) L1 L0 R1 R0 L1 L0 R1 R0 L1 L0 R1 R0
300デフォルトの名無しさん:2010/12/07(火) 23:06:21
SAPIの話かと思ったらすれ違いみたい
301297:2010/12/08(水) 08:25:46
ありがと やっと謎がとけたよ
音声組替えで音の基本配置がわかんなかったから音声合成のこのスレにきたんですが スレ違いごめんなさい
変調なんかもドコのスレだろ?
302デフォルトの名無しさん:2010/12/09(木) 02:03:55
グーグル検索

念のためうぷ(´・ω・`)まわいが重要


グーグル検索

やらなくてもやられるし 日本語以外話せないし


テレビやネットで説明
303デフォルトの名無しさん:2011/01/05(水) 18:49:53
>>1
何という手間のかかる事を...。
波型とかエンベロープとか、学ばなきゃいけない事が、
山ほどあるのに。
304デフォルトの名無しさん:2011/01/15(土) 16:12:14
これの話者適応とか使えそうなんだけど、具体的なやり方がわからん
http://www.sp.nitech.ac.jp/index.php?%A5%DB%A1%BC%A5%E0%2F%B8%A6%B5%E6%C6%E2%CD%C6%2F%B2%BB%C0%BC%B9%E7%C0%AE
305デフォルトの名無しさん:2011/01/15(土) 17:34:46
>>304
話者適応は英語で Speaker Adaptation です。
HMM音声合成ツールキット HTS 2.0以降に
その機能があるのでソースを読めばわかると思います。

HMM-based Speech Synthesis System (HTS) - History
http://hts.sp.nitech.ac.jp/?History#z5d7dda6
>December 29, 2006
> HTS version 2.0 was finally released :-)
> The new features are
> * Speaker adaptation, adaptive training, and semi-tied covariance transforms are supported for multi-stream HMMs/MSD-HMMs.
>  * MLLRMEAN, MLLRCOV, and CMLLR-based adaptation.
>  * CMLLR-based adaptive training.
>  * Decision trees for context clustering can be used to define regression classes for adaptation.
>  * HMGenS can read MLLRMEAN, MLLRCOV, CMLLR, and SEMIT transforms for adaptation.
306デフォルトの名無しさん:2011/01/15(土) 22:00:38
>>305
サンクス。ドキュメント見ながら色々試してみようと思う
とりあえずHTSの話者適応デモ動かしてるけど、終わらないし、2〜3日かかるらしい
最終的にはwavファイルとその文章を与えたらその声で音声合成できるようにしたい
307デフォルトの名無しさん:2011/01/24(月) 21:38:46
統計学と信号処理と音声言語処理と機械学習を
勉強すれば何とかなるかな。
308デフォルトの名無しさん:2011/02/06(日) 11:25:55
>>306
できた?興味あるんだけど
309デフォルトの名無しさん:2011/02/17(木) 17:24:58
>>308
できてない
とりあえず、デモのデータを使って音響モデルを作成するところまでできた
音響モデルができたらテキストからその声で音声の再生もできる
今は、自作のデータからモデル作る途中でエラーが出てるからそれの対処中
310天使 ◆uL5esZLBSE :2011/07/03(日) 09:38:03.37
Rubyバカにしてる子ってさ
変数に$ついてる言語触ってるって事だよね

いちいちSHIFT+4キーおして $ 打ちまくってる感触はどう?
でもお前はゴミなのにねw
311天使 ◆uL5esZLBSE :2011/07/06(水) 01:45:59.76
これ ; デリミタっていうんだけどさ、これをつけなきゃエラーになるような
そんな言語使ってる奴ってどうみてもゴミだと思うんだけど

もしかして「;」これ打ち忘れてコンパイルエラー出すのが楽しいの?
そうか、二度と話かけんなよ

死ねよゴミ
312デフォルトの名無しさん:2011/08/02(火) 06:50:05.52
ゆっくり声のライブラリって規則合成ってのらしいんだけど、これは素片接続法やHMM合成とは全く違う方法なの?素片接続の一種?
313デフォルトの名無しさん:2011/08/03(水) 19:03:56.08
規則合成は、規則に基づいて音声合成することなので、合成方式が波形接続かHMM合成かとは別。というか、上の分類。
ゆっくりは、たぶん、LPCとかのパラメータからのボコーダ方式。ボコーダという点ではHMM合成と同じ。
314デフォルトの名無しさん:2011/08/05(金) 06:51:28.40
>>313
ありがとう。勉強になります。
315デフォルトの名無しさん:2012/04/24(火) 14:08:11.51
NHK Eテレ Rの法則という番組にて歌声合成が取り上げられるようです.
また,その企画に伴い,4/25から番組HPでUTAU音源がDL出来るようになります.
男声と女声の2音源です.その音源作りを担当させていただきました!
316デフォルトの名無しさん:2012/06/01(金) 11:31:32.53
UTAUよりまともな音声合成ソフトないの?
317デフォルトの名無しさん:2012/07/09(月) 20:44:26.02
日本音響研究所が開発したモンタージュボイスっていうやつどうやればできるの?
詳しく教えてくれ
318デフォルトの名無しさん:2012/07/16(月) 20:36:29.06
日本音響研究所が開発したモンタージュボイスっていうやつどうやればできるの?
詳しく教えてくれ
319デフォルトの名無しさん:2012/08/12(日) 22:40:26.39
誰かHMM音声合成を語れ
320デフォルトの名無しさん:2012/10/28(日) 13:39:03.63
フジテレビの杏梨ルネってどこの技術?
321デフォルトの名無しさん:2013/05/01(水) 02:28:38.09
>>320
なんかの記事でドコモのiコンシェルと同じを使ってるって言ってたな
それが確かならHOYAのVoiceTextってことになる
322デフォルトの名無しさん:2013/05/01(水) 02:32:16.90
なるほど
323デフォルトの名無しさん:2013/05/04(土) 21:11:27.84
おれの98は、ピポッと起動するから現在形
324デフォルトの名無しさん:2013/05/07(火) 15:12:54.26 ID:qEqQNQf6O
難しいな
325デフォルトの名無しさん:2013/06/27(木) 16:17:04.80
              
326デフォルトの名無しさん:2013/10/18(金) 09:34:37.17
327デフォルトの名無しさん:2013/11/03(日) 20:36:45.88
初音ミクとか目標にしてるんだろうけど意外に奥が深いんだよ。
328デフォルトの名無しさん:2014/01/27(月) 14:18:06.62
判ります
329デフォルトの名無しさん:2014/01/27(月) 15:00:50.44
初音ミクどころか歌唱よりさらに難しいといわれる読み上げに見える
330デフォルトの名無しさん:2014/01/27(月) 15:05:33.72
へっ?
どうみても歌唱やんこれ
331デフォルトの名無しさん:2014/03/08(土) 16:28:12.83
332デフォルトの名無しさん:2014/04/04(金) 14:07:45.36 ID:Bqre4+dt
初音ミク、って専属の声優さんがいるんじゃなかったかな?
その声優さんを機械のような質感にしているだけだと思うけどな。
333デフォルトの名無しさん:2014/04/04(金) 14:11:49.55 ID:UPfoP0f4
334デフォルトの名無しさん:2014/04/07(月) 10:02:18.51 ID:Eg/nEWhY
>>333
紹介ありがとう。
やっぱり専属の声優さんいたんやな。
335デフォルトの名無しさん:2014/04/07(月) 10:05:42.81 ID:Eg/nEWhY
声優さんの合成音声をセリフから抽出するより。
お気に入りの声優さんに「あ〜ん」までを発声してもらって。
それをタイピングと連動させるツールを作ればいいんでね?


音域を解析して、ネットラジオ等で音声素材を収集して。
埋められない言葉は、これまで収集したデータから予測するのは・・・。
考えただけでかなりのコスト^^;
336デフォルトの名無しさん:2014/04/07(月) 10:36:56.71 ID:SBlJ2Fr+
337デフォルトの名無しさん:2014/04/07(月) 11:05:45.64 ID:SBlJ2Fr+
ひとつURLにlついてなかったので
http://internet.watch.impress.co.jp/docs/news/20140404_642876.html
338デフォルトの名無しさん:2014/04/07(月) 11:50:09.04 ID:ktMnCtsu
また、この専用アプリでは、初期状態で「あ」、「い」、「う」、「え」、「お」と割り当てられている5つのボタンに別の文字を割り当てることができたり、この ボタン以外の文字をリアルタイムに選択して、本体のカーボンキーボードで歌わせることも可能とのことです。

発音するノートの直前に文字情報をMIDIシステム・エクスクルーシブで入力する

さらに、すべてをシーケンサ、DAWでコントロールして歌わせたという場合には、MIDIシステムエクスクルーシブを利用して歌詞を設定することも可能 です。具体的には、発音させたいノートデータの直前に

F0 43 79 09 11 0A 00 ** F7

というエクスクルーシブデータを送るのですが、この**に文字番号を設定します。その文字番号についてはポケット・ミクのマニュアルに記載されてい ますが、「み」なら「65」、「く」なら「07」(いずれも16進数表記)のように1バイトの数字が割り振られています。


子音もいけるじゃん
339デフォルトの名無しさん:2014/04/07(月) 12:14:36.44 ID:ktMnCtsu
なるほど
ようするにmidi音源として見ると安いな
http://m.youtube.com/watch?v=2-v5CB5krws
340デフォルトの名無しさん:2014/04/07(月) 13:32:02.94 ID:ktMnCtsu
いくつかアイディア思いついたので
ム板らしく早速実装に取り掛かろう
http://m.youtube.com/watch?v=2-v5CB5krws
341デフォルトの名無しさん:2014/04/07(月) 13:33:06.19 ID:ktMnCtsu
342デフォルトの名無しさん:2014/04/12(土) 13:52:39.87 ID:UapBJj1i
USBでmidiノート投げれば子音も普通にしゃべれるのか
343デフォルトの名無しさん:2014/04/13(日) 13:49:25.53 ID:xQQladLb
専用スレ立ったのでプログラマ以外の人はこちらでどうぞ

【格安音源】ポケット・ミク【NSX-39】
http://anago.2ch.net/test/read.cgi/dtm/1397341323/
344デフォルトの名無しさん:2014/04/21(月) 12:55:07.07 ID:7LfDKqGZ
メモ

VST Plugins Development 3.0
http://anago.2ch.net/test/read.cgi/dtm/1184564987/
345デフォルトの名無しさん:2014/11/04(火) 04:11:37.58 ID:9XcfLbNC
画像の処理はよく話題になるが音声の処理はあまり話題にならないな
346デフォルトの名無しさん:2014/11/04(火) 04:52:55.25 ID:UYsaPI6O
臭いの処理も話題にならないよな
347デフォルトの名無しさん:2014/11/06(木) 04:17:54.25 ID:iaZsweTc
臭いはまだデバイスがほとんど一般向けに出てないからだろ。
たまにどこぞの大学や企業が試作品作ってるって話が聞こえるくらいだ。

市販されたとしてもプリンタのインクと同じで何かを放出する系だから
維持費がかかって一般人はなかなか買わないだろうね。
348デフォルトの名無しさん:2014/11/06(木) 10:29:03.27 ID:keBB2IB1
脳に電極を刺してエミュレートする機械の方が先に出るんじゃね
349デフォルトの名無しさん:2014/11/06(木) 10:41:01.68 ID:Jg48RgBo
味の処理も欲しい・・・です
350デフォルトの名無しさん:2014/11/06(木) 12:43:09.93 ID:Uazf0Jll
味は、舌に流す電流の波形でどうとか言う話を電通大(本家か大阪か忘れた)の誰かがしてた記憶が
351デフォルトの名無しさん:2014/11/06(木) 15:03:14.07 ID:qOkBrttj
舌の部位によって担当細胞が分かれてるのが本当だとしたら
電極を当てる場所も点じゃだめで面にしないとな
352デフォルトの名無しさん:2014/12/31(水) 08:11:08.67 ID:ve7ao+6B
このスレタイほんと好きだわ
このタイトルだけでここまでもったスレと言えよう
353デフォルトの名無しさん:2015/02/05(木) 01:04:37.93 ID:K5NTGqg/
MMDAgentの2等身のデータどっかにないですか
354デフォルトの名無しさん
いつのまにこんな本出てたし
認識じゃなくて合成の方だけど役に立ちそう

イラストで学ぶ 音声認識 2015-01-24
http://www.amazon.co.jp/dp/4061538241