Upgrade to Pro — share decks privately, control downloads, hide ads and more …

音声合成の発音正確性と自然性

 音声合成の発音正確性と自然性

音声合成は元々、入力と出力の対応が一対多になりやすい問題設定だが、そこには入出力の好ましい対応とそうでないものがある。従来は、技術的な問題で好ましくない対応が混入することにより、指定した文字と異なる発音をする場合がごくまれにあった。例えば「が」が「か」になったり、「と」が「た」になったりしていた。こういったことがあると特定の日付だけうまく言えない等の事故が起きうるので、特に予約タスクなどの自動対話では問題となる。音響モデルの性質の違いとアラインメントの観点で、こうした発音違いを抑制する手法について紹介する。

https://cadc.cyberagent.co.jp/2023/sessions/research-audio/?utm_medium=ca_ex&utm_source=speaker_deck&utm_campaign=official

CyberAgent

June 29, 2023
Tweet

More Decks by CyberAgent

Other Decks in Technology

Transcript