Upgrade to Pro — share decks privately, control downloads, hide ads and more …

F0-Consistent Many-to-many Non-parallel Voice Conversion via Conditional Autoencoder

peisuke
June 19, 2020

F0-Consistent Many-to-many Non-parallel Voice Conversion via Conditional Autoencoder

ICASSP2020読み会発表資料
F0 Consistent Many-to-many Non-parallel Voice Conversion via Conditional Autoencoder

peisuke

June 19, 2020
Tweet

More Decks by peisuke

Other Decks in Technology

Transcript

  1. F0-consistent many-to-many non-parallel voice conversion via conditional autoencoder Author: K,

    Qian, Z. Jin, M. H-Johnson, G, J. Mysore presenter: @peisuke ICASSP2020⾳響⾳声読み会
  2. 概要 • タイトル • F0-consistent many-to-many non-parallel voice conversion via

    conditional autoencoder • どんな論⽂? • Auto Encoderによってメルスペクトログラムを他⼈のものに変換 • その際にF0(ピッチ)が反転してしまう場合があった問題を解決 • ⼯夫点は? • 過去に実施したAutoVC(AEベースでの⾳声変換)に、ソース⾳声のF0を条件 として与えた
  3. AutoVCとは • AutoEncoderの特徴量の次元を絞ることで、⾳声の変換を実現 1. エンコード・デコード時に話者を変えずに 復元した場合( ! , )の復元ロス 2.

    上記処理の中間復元結果 $ の復元ロス 3. 復元したメルスペクトログラムを再エン コードした特徴の⼀致度合い
  4. 実験 • 実験内容 • F0の情報が適切に復元されるかを、定性的・定量的に調査 • 実験条件 • VCTKコーパスで学習/テストを⾏う •

    過去の実験との条件を合わせるため、男⼥それぞれ10を対象に実験 • 90%のデータを学習、10%をテストに利⽤