Slide 7
Slide 7 text
超簡易版 音声合成の歴史
● ルールベース(職人芸):フォルマント合成(1990年以前)
○ 手動ルールによる各音素(/a/や/k/など)の素片を構築
○ e.g., AquesTalk(いわゆる「ゆっくりボイス」)
● コーパスベース:波形接続型音声合成(1990年〜)
○ 音声データベースから音声素片を接続し合成
○ e.g., ボーカロイド
● コーパスベース:統計的パラメトリック音声合成(1995年〜)
○ 音声データベースから統計的に音声を予測し合成
○ 隠れマルコフモデル/深層学習による音声合成
○ e.g. CeVIO
参考 https://www.sp.nitech.ac.jp/~tokuda/tokuda_ongaku2013.pdf