【IT】ニコ動やYouTubeの音声をテキスト化する「PodCastle」、産総研が公開

このエントリーをはてなブックマークに追加
1帰社倶楽部φ ★
独立行政法人産業技術総合研究所(産総研)は12日、インターネット上の動画中の音声を認識し、
全文検索や書き起こしが行えるサービス「PodCastle(ポッドキャッスル)」を一般公開し、
実証実験を開始した。

産総研では、日本語のポッドキャストを音声認識によりテキスト化し、全文検索が行えるサービス
として、2008年6月にPodCastleを公開。PodCastleは、閲覧した不特定多数のユーザーがテキストに
訂正を加えられ、訂正結果を学習・反映させることで、音声検索と音声認識の性能を向上させる点
が特徴となっている。

今回公開したサービスでは、新たに動画共有サービスの音声に対応。ニコニコ動画、YouTube、Ustreamの
動画に対応し、動画中の音声を自動認識してテキスト化し、全文検索を行える。また、テキスト化した
データの誤認識を訂正できる機能に加えて、話者や改行を付け加えて書き起こし形式の文章として編集
できる機能も追加。さらに日本語に加えて、英語の音声データも認識と検索ができる機能を追加した。

PodCastleの利用は無料で、動画データやポッドキャストの登録にはOpenID(Twitter、Google、mixi、
Yahoo! Japan、Yahoo.com、Livedoor)によるログインが必要となる。

産総研では、10月13日〜14日に産総研つくばセンターで開催する「産総研オープンラボ」で、
この研究成果に関するデモンストレーション展示を行う。

2011/10/12 18:51
http://internet.watch.impress.co.jp/docs/news/20111012_483203.html
2帰社倶楽部φ ★:2011/10/13(木) 11:54:15.38 ID:???0
3名無しさん@12周年:2011/10/13(木) 11:55:05.46 ID:nBsresE80
国会の野次も容易にテキスト化w
4名無しさん@12周年:2011/10/13(木) 11:55:08.07 ID:bwzPzo870
あ ぁん・・・ もぅ ダメだってばぁ・・・
5名無しさん@12周年:2011/10/13(木) 11:55:42.03 ID:b56FNTlC0
エッチな動画で試してみよう(´・ω・`)
6名無しさん@12周年:2011/10/13(木) 12:09:38.75 ID:9YdyI6TW0

ま た 出 た か(笑) 惨 瘡 研 の ヨ タ 話
7名無しさん@12周年:2011/10/13(木) 12:10:18.86 ID:KivWEuFaO
ゆっくりで音声化したテキストをまたテキストに戻すんですね…
8名無しさん@12周年:2011/10/13(木) 12:12:29.80 ID:pUBT1FV60
英語版は役に立つな。
自動翻訳機もすぐできるな。
9名無しさん@12周年:2011/10/13(木) 12:15:22.73 ID:+eCrOLCsP
なるほど…これに外国語の動画を食わせれば簡単に空耳字幕がつくと…
10名無しさん@12周年:2011/10/13(木) 12:16:04.93 ID:jrBeE7uj0
Oh,yes!!スーハースーハー
11名無しさん@12周年:2011/10/13(木) 12:30:56.41 ID:0AhkDvQn0
docomoに、音声をパケットに変換。
音声通話を廃止し、大幅値引き

より良い、細かなサービスが出来る。
12名無しさん@12周年:2011/10/13(木) 12:31:08.07 ID:2oz1zxDeP
こういうものが開発される度に99%の人が貧乏になっていくんだけどな
13名無しさん@12周年:2011/10/13(木) 12:36:24.44 ID:0ytfyxbV0
これ前からあったよね。あれはPodcastか。なんだか
全然使えなくて、結局ほとんど人間に頼っていた記憶だけがある。
カイゼンされたのだろうか?

>>12
ラッダイト運動だね。
14名無しさん@12周年:2011/10/13(木) 12:38:17.91 ID:Qx0nMoUQ0
何を歌ってるかよくわからないボーカロイドで試してみたい
15名無しさん@12周年:2011/10/13(木) 12:39:07.05 ID:rcKiriAR0
逆じゃないのか
16名無しさん@12周年:2011/10/13(木) 12:40:06.50 ID:zt1vENVQ0
コメントを音声にすんのかと思ったわ
すげぇウザそう
17名無しさん@12周年:2011/10/13(木) 12:41:48.52 ID:V3IZbBEK0
ガチムチ動画の音声をこれでテキスト化してみたい。
18名無しさん@12周年:2011/10/13(木) 12:48:15.35 ID:C63r/m/f0
GoogleVoiceの音声テキスト化やらiPhoneのSiriやら最近音声認識流行ってんな
19名無しさん@12周年:2011/10/13(木) 12:54:04.80 ID:pUBT1FV60
てか、読み上げソフトのフリーでいいのない?
20名無しさん@12周年:2011/10/13(木) 13:19:37.68 ID:HL53NBXV0
産総研のオタ路線はいいとおもう。
21名無しさん@12周年:2011/10/13(木) 13:35:21.16 ID:zhzqQIjx0
>>3
大臣のオフレコもテキスト化だろ
22名無しさん@12周年:2011/10/13(木) 13:40:17.50 ID:ivq7dG470
すごいけど何に使うんだ?
23名無しさん@12周年:2011/10/13(木) 13:44:58.22 ID:M43uHflU0
これはいいな、Googleに売れ
あいつらが自社で実装したら無意味になるからな
24名無しさん@12周年:2011/10/13(木) 13:46:43.53 ID:Tw8GsdgK0
んなことより読み上げソフトまともなの作れ
25名無しさん@12周年:2011/10/13(木) 13:48:23.89 ID:0ytfyxbV0
>>22
テキストになったら検索できるだろ。
そしたら要約もできるし、タグも付けられる。
「その話は何分頃から」も出来るな。

問題は精度なんだけど、>>1の先生の偉いところ(ズルいところ)は
それを人間に、ユーザに任せたところだな。
26名無しさん@12周年:2011/10/13(木) 13:54:35.31 ID:UxDB5BkWP
これすごすぎだろ
日本始まったわ
27名無しさん@12周年:2011/10/13(木) 13:54:57.98 ID:2iDY8/KA0
稲川淳二の怪談のしゃべりをテキスト化する動画見てワロタ
28名無しさん@12周年:2011/10/13(木) 13:57:00.90 ID:ioycB8sA0
とりあえずミンサガの熱情の律動のテキスト化を
29名無しさん@12周年:2011/10/13(木) 14:16:04.20 ID:dIFnED060
そんな貴方も インタビューおこしで、ラクラク月収20万w
※専用の機材が必要となります
30名無しさん@12周年:2011/10/13(木) 15:12:35.51 ID:G6J2njVJ0
アニソンをテキスト化してゆっくりに歌わせるか
31名無しさん@12周年:2011/10/13(木) 16:14:53.21 ID:omeYiIyx0
> 閲覧した不特定多数のユーザーがテキストに訂正を加えられ、
> 訂正結果を学習・反映させることで、音声検索と音声認識の
> 性能を向上させる点が特徴となっている。

でたらめな訂正を入れまくられそうなんだが。
32名無しさん@12周年:2011/10/13(木) 17:28:56.86 ID:1a9S3ly30
こんなのNHKのアナウンサーみたいな喋り方じゃないとまともに機能せんだろ

33名無しさん@12周年:2011/10/13(木) 17:31:44.68 ID:W/cTBXBuP
チデジになって字幕入れられるけど、あれは人間がやってんのか?
34名無しさん@12周年:2011/10/13(木) 17:45:10.24 ID:G6J2njVJ0
>>33
人間。
生放送とかはリアルタイムで打ってる。
イモトとキリマンジャロ登った子も、このバイトやってたな。
35名無しさん@12周年:2011/10/13(木) 17:48:29.74 ID:X7T4pmsT0
なんでPodcastっぽい名前してるの紛らわしい
36名無しさん@12周年:2011/10/13(木) 21:23:28.46 ID:TaBA4EW00
>>1
これでaRthみたいな剽窃キチガイを発見しやすくなるなw
37名無しさん@12周年:2011/10/13(木) 21:31:00.92 ID:tyNnla7W0
全然つかえねえ
38 忍法帖【Lv=6,xxxP】 :2011/10/15(土) 02:50:04.74 ID:PGM2FGMx0
sage
39名無しさん@12周年:2011/10/15(土) 18:12:18.04 ID:TX0QD8Ls0
a
40名無しさん@12周年:2011/10/15(土) 18:15:12.29 ID:+FR7j+bU0
>閲覧した不特定多数のユーザーがテキストに
>訂正を加えられ、訂正結果を学習・反映させることで、音声検索と音声認識の性能を向上させる点
>が特徴となっている。

アニメOPが空耳歌詞に書き換えられるぞ
41名無しさん@12周年:2011/10/15(土) 18:19:21.11 ID:CQQcdhnn0
ガンダムWのOPで試したい
42名無しさん@12周年:2011/10/17(月) 03:01:28.14 ID:pJ/S+SC20
落ちた?
43名無しさん@12周年:2011/10/17(月) 03:11:21.03 ID:e7FFnwJS0
テニミュで試したら空耳どおりになったりしてww
44名無しさん@12周年:2011/10/17(月) 03:19:45.24 ID:PdB9Qrh3O
ゲーム実況主の音声テキストかとか面白そう
特に絶叫系
45名無しさん@12周年:2011/10/17(月) 03:44:32.75 ID:MvJHxbDY0
効果音のテキスト化もよろしく。
ちゃーちゃちゃらららちっちゃちちゃーっちゃーちゃちゃちゃー
46名無しさん@12周年:2011/10/17(月) 08:07:00.08 ID:gJfD5BVI0
日常1クール目のOPでどう聞いても「マンコ」って聞こえる部分がどうなるか試したい。
47名無しさん@12周年
全然使えない…結局のところ
「おまえらボランティアで文字おこししろよ」
というサイトではないのか?