« Independenceの不具合 | トップページ | Alice: Madness Returns »

音声合成情勢

  Vocaloid 3が今年9月に販売されることが発表されました。「もう3が出るの?」と思ったものの、2が出てから4年も経ってました。早い早い。

  コンピューターが声に出して読む人間の言葉は、本物をマネしきれていない不完全さがあって、それがかわいく思えたり、親近感を持つ原因になったりします。でも最近はバスの社内案内など、聴きこまないと本物かどうかわからないものもあります。

  「ToSpeak」は東芝が開発する音声合成エンジンです。業務用ですが、登録すると、現在公開中のサイトで自由に合成を試したり、Wave形式で保存したりできます(期間限定らしい)。知らない語句でイントネーションが崩れますが、調整できますし、初見でも大方うまく読んでくれます。このクラスのものをふつうの人が手軽に使えるようになってきてるんですね。

  試しに古い自分の日記を読んでもらいました。ココログの制限で1MB以下にする必要があったので、話す速さを3段階上げてます。

  うちの母が、香港マーク6宝くじで13.2億円の配当を当選しました。
  嘘ではありません。だって、当選通知に「これは冗談ではなく、100%真実です!」とうれしそうに書かれてるからです。
  あと、職場の人でまったく同じ手紙を受け取った人がたくさんいるからです。もうひとつ、当選金額をもらうためになぜかこっちが2000円支払わないといけないからです。

Waveファイル

  なんだか声のいい人に日記を読み上げられたみたいで恥ずかしい気分になります。そういうのが好きな人にもいいんじゃないか。

  ToSpeakのこのサービス、なんと二次創作への利用が許可されています(「よくあるご質問」に明記されてます)。ただし、例外もあるので、サイトの利用規約をご確認ください。


・7月発売のMac OS X Lionには、日本語の読み上げ音声が入るようです。Snow Leopardにも読み上げ機能はあるんですが、標準では英語音声しか付属していません

・OS Xには、読み上げ機能を呼び出すコマンドがあります(sayコマンド)。””でくくった語句が解釈されて発音されます

say -o daijoubu.wav --voice Vicki --file-format=WAVE --data-format=LEI16@44100 "die joe boo?"

→ Vickiに「ダイジョーブ?」と話させ、daijoubu.wavという名前で16bit/44kHzのWave形式で保存

--voiceは次のいずれか。Agnes, Albert, Alex, Bad News, Bahh, Bells, Boing, Bruce, Bubbles, Cellos, Deranged, Fred, Good News, Hysterical, Junior, Kathy, Pipe Organ, Princess, Ralph, Trinoids, Vicki, Victoria, Whisper, Zarvox

|

« Independenceの不具合 | トップページ | Alice: Madness Returns »

コメント

むお!?
Vocaloid 3ですか!?(@o@);;

じゃ、Aisshaさんが新作Upするのをお待ちしておきます(^-^)/))w

投稿: まふぁ | 2011.06.12 00:39

ありがとうございますw 歌わせやすくなってるみたいなので、買っちゃうかもしれません。まだ先だと思いますが、デモ曲の発表が楽しみです。

投稿: Aissha | 2011.06.12 23:07

コメントを書く



(ウェブ上には掲載しません)


コメントは記事投稿者が公開するまで表示されません。



トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/42723/51918905

この記事へのトラックバック一覧です: 音声合成情勢:

« Independenceの不具合 | トップページ | Alice: Madness Returns »