【IT】ニコ動やYouTubeの音声をテキスト化する「PodCastle」、産総研が公開
1 :
帰社倶楽部φ ★:
独立行政法人産業技術総合研究所(産総研)は12日、インターネット上の動画中の音声を認識し、
全文検索や書き起こしが行えるサービス「PodCastle(ポッドキャッスル)」を一般公開し、
実証実験を開始した。
産総研では、日本語のポッドキャストを音声認識によりテキスト化し、全文検索が行えるサービス
として、2008年6月にPodCastleを公開。PodCastleは、閲覧した不特定多数のユーザーがテキストに
訂正を加えられ、訂正結果を学習・反映させることで、音声検索と音声認識の性能を向上させる点
が特徴となっている。
今回公開したサービスでは、新たに動画共有サービスの音声に対応。ニコニコ動画、YouTube、Ustreamの
動画に対応し、動画中の音声を自動認識してテキスト化し、全文検索を行える。また、テキスト化した
データの誤認識を訂正できる機能に加えて、話者や改行を付け加えて書き起こし形式の文章として編集
できる機能も追加。さらに日本語に加えて、英語の音声データも認識と検索ができる機能を追加した。
PodCastleの利用は無料で、動画データやポッドキャストの登録にはOpenID(Twitter、Google、mixi、
Yahoo! Japan、Yahoo.com、Livedoor)によるログインが必要となる。
産総研では、10月13日〜14日に産総研つくばセンターで開催する「産総研オープンラボ」で、
この研究成果に関するデモンストレーション展示を行う。
2011/10/12 18:51
http://internet.watch.impress.co.jp/docs/news/20111012_483203.html
2 :
帰社倶楽部φ ★:2011/10/13(木) 11:54:15.38 ID:???0
3 :
名無しさん@12周年:2011/10/13(木) 11:55:05.46 ID:nBsresE80
国会の野次も容易にテキスト化w
4 :
名無しさん@12周年:2011/10/13(木) 11:55:08.07 ID:bwzPzo870
あ ぁん・・・ もぅ ダメだってばぁ・・・
エッチな動画で試してみよう(´・ω・`)
6 :
名無しさん@12周年:2011/10/13(木) 12:09:38.75 ID:9YdyI6TW0
ま た 出 た か(笑) 惨 瘡 研 の ヨ タ 話
7 :
名無しさん@12周年:2011/10/13(木) 12:10:18.86 ID:KivWEuFaO
ゆっくりで音声化したテキストをまたテキストに戻すんですね…
8 :
名無しさん@12周年:2011/10/13(木) 12:12:29.80 ID:pUBT1FV60
英語版は役に立つな。
自動翻訳機もすぐできるな。
なるほど…これに外国語の動画を食わせれば簡単に空耳字幕がつくと…
10 :
名無しさん@12周年:2011/10/13(木) 12:16:04.93 ID:jrBeE7uj0
Oh,yes!!スーハースーハー
11 :
名無しさん@12周年:2011/10/13(木) 12:30:56.41 ID:0AhkDvQn0
docomoに、音声をパケットに変換。
音声通話を廃止し、大幅値引き
より良い、細かなサービスが出来る。
こういうものが開発される度に99%の人が貧乏になっていくんだけどな
これ前からあったよね。あれはPodcastか。なんだか
全然使えなくて、結局ほとんど人間に頼っていた記憶だけがある。
カイゼンされたのだろうか?
>>12 ラッダイト運動だね。
14 :
名無しさん@12周年:2011/10/13(木) 12:38:17.91 ID:Qx0nMoUQ0
何を歌ってるかよくわからないボーカロイドで試してみたい
逆じゃないのか
16 :
名無しさん@12周年:2011/10/13(木) 12:40:06.50 ID:zt1vENVQ0
コメントを音声にすんのかと思ったわ
すげぇウザそう
17 :
名無しさん@12周年:2011/10/13(木) 12:41:48.52 ID:V3IZbBEK0
ガチムチ動画の音声をこれでテキスト化してみたい。
GoogleVoiceの音声テキスト化やらiPhoneのSiriやら最近音声認識流行ってんな
19 :
名無しさん@12周年:2011/10/13(木) 12:54:04.80 ID:pUBT1FV60
てか、読み上げソフトのフリーでいいのない?
20 :
名無しさん@12周年:2011/10/13(木) 13:19:37.68 ID:HL53NBXV0
産総研のオタ路線はいいとおもう。
21 :
名無しさん@12周年:2011/10/13(木) 13:35:21.16 ID:zhzqQIjx0
すごいけど何に使うんだ?
23 :
名無しさん@12周年:2011/10/13(木) 13:44:58.22 ID:M43uHflU0
これはいいな、Googleに売れ
あいつらが自社で実装したら無意味になるからな
24 :
名無しさん@12周年:2011/10/13(木) 13:46:43.53 ID:Tw8GsdgK0
んなことより読み上げソフトまともなの作れ
>>22 テキストになったら検索できるだろ。
そしたら要約もできるし、タグも付けられる。
「その話は何分頃から」も出来るな。
問題は精度なんだけど、
>>1の先生の偉いところ(ズルいところ)は
それを人間に、ユーザに任せたところだな。
これすごすぎだろ
日本始まったわ
27 :
名無しさん@12周年:2011/10/13(木) 13:54:57.98 ID:2iDY8/KA0
稲川淳二の怪談のしゃべりをテキスト化する動画見てワロタ
とりあえずミンサガの熱情の律動のテキスト化を
29 :
名無しさん@12周年:2011/10/13(木) 14:16:04.20 ID:dIFnED060
そんな貴方も インタビューおこしで、ラクラク月収20万w
※専用の機材が必要となります
アニソンをテキスト化してゆっくりに歌わせるか
31 :
名無しさん@12周年:2011/10/13(木) 16:14:53.21 ID:omeYiIyx0
> 閲覧した不特定多数のユーザーがテキストに訂正を加えられ、
> 訂正結果を学習・反映させることで、音声検索と音声認識の
> 性能を向上させる点が特徴となっている。
でたらめな訂正を入れまくられそうなんだが。
こんなのNHKのアナウンサーみたいな喋り方じゃないとまともに機能せんだろ
チデジになって字幕入れられるけど、あれは人間がやってんのか?
>>33 人間。
生放送とかはリアルタイムで打ってる。
イモトとキリマンジャロ登った子も、このバイトやってたな。
なんでPodcastっぽい名前してるの紛らわしい
36 :
名無しさん@12周年:2011/10/13(木) 21:23:28.46 ID:TaBA4EW00
>>1 これでaRthみたいな剽窃キチガイを発見しやすくなるなw
全然つかえねえ
sage
39 :
名無しさん@12周年:2011/10/15(土) 18:12:18.04 ID:TX0QD8Ls0
a
>閲覧した不特定多数のユーザーがテキストに
>訂正を加えられ、訂正結果を学習・反映させることで、音声検索と音声認識の性能を向上させる点
>が特徴となっている。
アニメOPが空耳歌詞に書き換えられるぞ
ガンダムWのOPで試したい
42 :
名無しさん@12周年:2011/10/17(月) 03:01:28.14 ID:pJ/S+SC20
落ちた?
43 :
名無しさん@12周年:2011/10/17(月) 03:11:21.03 ID:e7FFnwJS0
テニミュで試したら空耳どおりになったりしてww
44 :
名無しさん@12周年:2011/10/17(月) 03:19:45.24 ID:PdB9Qrh3O
ゲーム実況主の音声テキストかとか面白そう
特に絶叫系
効果音のテキスト化もよろしく。
ちゃーちゃちゃらららちっちゃちちゃーっちゃーちゃちゃちゃー
日常1クール目のOPでどう聞いても「マンコ」って聞こえる部分がどうなるか試したい。
全然使えない…結局のところ
「おまえらボランティアで文字おこししろよ」
というサイトではないのか?