Upgrade to Pro — share decks privately, control downloads, hide ads and more …

リアルタイムボイスチェンジャーMMVCとVITSの紹介

 リアルタイムボイスチェンジャーMMVCとVITSの紹介

MMVCというオープンソースのリアルタイムボイスチェンジャーと、そのエンジン部分であるVITSというディープラーニングを利用したTTS音声生成手法について、紹介と解説をしました。

NSEG + JAWS-UG 長野支部 合同勉強会 - connpass https://nseg.connpass.com/event/251366/

の勉強会で話した内容です。

SATOH Kiyoshi

June 25, 2022
Tweet

More Decks by SATOH Kiyoshi

Other Decks in Programming

Transcript

  1. VITSとは 2021/6に発表された高速高品質の End to End Text to Speach (TTS) 手法

    Conditional Variational Autoencoder with Adversarial Learning for End-to-End Text- to-Speech https://arxiv.org/abs/2106.06103 VITSの公式実装 https://github.com/jaywalnut310/vits 12
  2. 図の引用元 Conditional Variational Autoencoder with Adversarial Learning for End-to-End Text-

    to-Speech https://arxiv.org/abs/2106.06103 Flow-based Deep Generative Models | Lil'Log https://lilianweng.github.io/posts/2018-10-13-flow-models/ 【機械学習】VITSでアニメ声へ変換できるボイスチェンジャー&読み上げ器を作っ た話 - Qiita https://qiita.com/zassou65535/items/00d7d5562711b89689a8#stochastic- duration-predictor 30