Slide 17
Slide 17 text
入力パラメー
タ
説明 利用方法
text 合成したい文章を日本語で入力 台本のセリフを入力
speaker_y Koeiromap空間上の値。有効範囲は
`[-3.0, 3.0]`
Y軸のプラス側が女性、マイナス側が男性声
登場人物の男女イメージを数値化
style 音声の感情スタイル。スタイルは全部で
6通り`"talk",
"happy", "sad", "angry", "fear", "surprised"`
セリフの感情を入力
出力パラメー
タ
説明 利用方法
audio base64エンコードされたwav形式の音声データ 役者の代わりにセリフを上演
phonemes 入力テキストの音素列 次のセリフに移る際の間の参考に利用
Koeiromapのパラメータ