$30 off During Our Annual Pro Sale. View Details »
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
高音質リアルタイム声質変換 Chainer Meetup LT #1
Search
Hiroshiba
April 18, 2019
0
400
高音質リアルタイム声質変換 Chainer Meetup LT #1
Chainer Meetup LT #1の資料です。
https://chainer.connpass.com/event/81556/
Hiroshiba
April 18, 2019
Tweet
Share
Featured
See All Featured
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
2
250
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
PRO
10
770
Fireside Chat
paigeccino
34
3.1k
Side Projects
sachag
452
42k
A designer walks into a library…
pauljervisheath
204
24k
Site-Speed That Sticks
csswizardry
1
140
How to train your dragon (web standard)
notwaldorf
88
5.7k
A Modern Web Designer's Workflow
chriscoyier
693
190k
GitHub's CSS Performance
jonrohan
1030
460k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
94
17k
What’s in a name? Adding method to the madness
productmarketing
PRO
22
3.2k
Dealing with People You Can't Stand - Big Design 2015
cassininazir
365
24k
Transcript
高音質リアルタイム声質変換 廣芝 和之 2018/03/22
自己紹介 ドワンゴ Dwango Media Village、研究開発チーム 好きなゲーム Splatoon 一番好きなバーチャルYoutuber 輝夜月 今期イチオシアニメ
デスマーチからはじまる異世界協奏曲 5XJUUFS*%!IJIP@LBSVUB
なりたい姿になる技術は進んでいる 例: バーチャルYoutuber なりたい声になる技術が遅れている 理想のシステム リアルタイムで 高音質で 誰の声でも変換できて 誰の声にも変換できるやつ 見た目の仮想化は進んでいる
5XJUUFS*%!IJIP@LBSVUB ࠓճϦΞϧλΠϜˍߴԻ࣭ͷ࣮ݱʹνϟϨϯδ
音声合成ソフトウェアの一種 VOICELOID VOCALOID 中の人は石黒千尋さん 音声合成にすごく適した声の持ち主 通称「波形美人」 結月ゆかりを目指す ʮ͋ΒΏΔݱ࣮Λɺશͯɺࣗͷํ೧͡ۂ͛ͨͷͩɻʯ
σΟʔϓϥʔχϯάͷྗͰ ݄݁Ώ͔ΓͷʹͳͬͯΈ·ͨ͠
リアルタイム声質変換デモ GPU付きPCが必要 持ってこなかったので動画 遅延は3〜4秒 バッファの幅1秒 音響特徴量抽出1〜2秒 GPU処理が1秒
ゲーム実況プレイデモ ディープラーニングの力で結月ゆかりの声になってみた http://www.nicovideo.jp/watch/sm32724409 録音した音声と変換結果を重ねた 笑い声も変換できている
モデルの工夫1 2段階構成にした 高音質な変換を学習させるには、大量のペアデータが必要になる 低音質変換と高音質化に分けた Ի࣭
݄݁Ώ͔Γ ߴԻ࣭ ݄݁Ώ͔Γ ม ߴԻ࣭Խ ɾػցֶश࣌ʹগͷϖΞσʔλ͕ඞཁ ɾػցֶश࣌ʹϖΞσʔλෆཁ ɹʢେྔͷԻσʔλ͕͋Ε͍͍ʣ
モデルの工夫2 画像分野の手法(pix2pix)を転用した 音声を時間×周波数の「絵」として捉える 時間方向にも周波数方向にも繰り返し構造があるので、CNNと相性が良いはず ߴԻ࣭Խલ ߴԻ࣭Խޙ
その他 技術寄りの解説記事やデモ動画を公開してます 「ディープラーニング 結月ゆかり」で検索! コードもGitHubで公開しています chainer製 「become-yukarin」で検索! 課題 変換結果の滑舌が悪い → 学習データのチューニングでマシになった 僕の声にしか対応してない → 誰の声でも変換できるように頑張ってます
ʮਫ্͕͕͖ͬͯͨΒɺ ͋ͱΏͬ͘Γͱɺ ্Լͤ͞Εྑ͍ʯ
ご静聴ありがとうございました
自己紹介 ドワンゴ Dwango Media Village、研究開発チーム 好きなゲーム Splatoon 一番好きなバーチャルYoutuber 輝夜月 今期イチオシアニメ
デスマーチからはじまる異世界協奏曲 5XJUUFS*%!IJIP@LBSVUB