21世紀のアニメ

このエントリーをはてなブックマークに追加
1風の谷の名無しさん
東芝は十一日、コンピューターで人工的に人間の声を作る音声合成の分野で、
キーボードなどで入力した文章を、瞬時に音声に再現する実用技術を開発した
ことを明らかにした。有名人の声を忠実に模倣するなど、声質を自在に変化さ
せることもでき、二○○二年までには抑揚や感情の起伏も俳優張りに表現でき
るようにする計画だ。放送業界では、今後、プロのナレーターらが不足すると
予想されており、地上波デジタル放送が始まる二〇〇三年ごろには、「人工ア
ナウンサー」や「人工声優」の声が幅をきかせそうだ。
音声合成技術では、あらかじめ録音された単語や文節をつなぎ合わせて再生す
る方式などが実用化され、駅のアナウンスなどに使われている。だが語彙が限
られ、定型文にしか対応できないほか、ロボットのような無機質な音声になり
がちで、事前に音質を修正する必要がある。
東芝の新技術は、母音や子音の音声データをコンピューターのソフトに蓄積し
た上で、ある程度の分量の人間の肉声を参考音源として入力してやると、数時
間で言葉遣いを学習し、その人間に極めて近い声を再生できるようになる。そ
の後は、ニュース台本などの文章をキーボードなどで入力すれば、その声で間
髪をおかずに文章を読み上げることができる。
現段階では、まだ棒読み口調で、微妙な感情を表現するのは困難だが、今後
は、ソフトの文章解析能力を向上させ、例えば小説や台本の一節を入力する
と、文章表現や会話分から喜怒哀楽の感情を認識し、悲しいセリフは悲しそう
な声色で、自動再生できるようにしたい考えだ。
東芝は「将来はロケや俳優が要らない、総コンピューターグラフィック
ス(CG)、総人工音声の映画を作ることも夢ではない」としている。