音声合成してみよう

音声合成してみようたいちょー

みなさん#!/bin/bash(こんにちはの意) たいちょーです twitter: @xztaityozx_001 GitHub: xztaityozx 好きな言語: C#, Go 職業:
お嬢様系難読化シェル芸人

今回の話自分の音声で単純な音声合成をしてみる話

筋トレしてますか私はやってますめちゃくちゃ追い込む感じではなく、ゆるく自宅トレーニングしてますちょっっっとだけ育ってきてちょっとうれしいこれからも頑張りますでも…

回数数えるのが面倒

回数数えるのが面倒どの動きをN回、という感じ。回数を数えておく必要があるでも運動の方に集中したいので、回数が分からなくなりがち回数を電子音で知らせるアプリもあるけど、今何回目かがわかりにくくてむずいトレーナーがいれば楽ですが…家にはいない…！

トレーナー作ればいいじゃん

音声合成を使ってトレーナーを作ろう音声合成テキストから音声を人工的に生成するやつそんな感じのソフトウェアが割とある Open JTalk N2 TTS A.I VOICE
まだまだたくさん回数を数える文章を書いて音声を合成すればトレーナーが作れる！

音声合成してみる今回はA.I VOICE 紲星あかりを使ってみます理由 API用のDLLが配られてて、プログラムから音声を合成しやすいかわいい

cute... いい感じですね APIを使って簡単にメニューを音声合成できるようにしたいですね！なんなら、WebサーバーにしてLAN内に公開したいですね！スマホから操作できてうれしいからですね！ちなみに、APIを使ったサーバーをインターネットに公開するのは規約で禁止されてますでも名前付きパイプを使う都合、.NET6ではできないですねとはいえ.NET
FrameworkではWebサーバーを書くのがめんどくさいですね

なんかこう…もっと手軽に合成したい… したいですね

自分の声合成すればいいじゃんそうかな…そうかも…

自分の音声合成ソフトを作ってみよう手法 i. 50音を録音 ii. 文字列を1文字ずつ分割 iii. 対応する音声ファイルを ffmpeg で連結
iv. 完成すごく簡単ですね！

録音以下のコマンドで生成した文字を一つずつ録音していきます echo {ァ..ン} | fmt -1 | grep -v
'[ァ|ィ|ゥ|ェ|ォ|ヮ|ャ|ュ|ョ|ヰ|ヱ|ッ]'

分割 Audacityの機能を使って録音ファイルをから一文字ずつ分割していきます。分割後のファイルはシェル芸で名前を付けておきます $ echo {あ..ん} | fmt -1 |
grep -v '[ぁぃぅぇぉゃっゅょゎゑゐ]' | paste - <(ls) | rargs mv {2} {1}.mp3 あ.mp3 , い.mp3 という感じのデータができます。

合成 ffmpeg で音声を合成します。「こんにちは」だとすると、以下のコマンドで生成できます $ ffmpeg -i "concat:こ.mp3|ん.mp3|に.mp3|ち.mp3|は.mp3" out.mp3

聞いてみよう！

こわい！そして全然かわいくない

なぜ怖いのかいろいろあると思いますが、一番は抑揚がないからですね

UniDicでアクセントを知らべてみる UniDic UniDicとは、国立国語研究所の規定した斉一（せいいつ）な言語単位（短単位）と、階層的見出し構造に基づく電子化辞書の ① 設計方針および、その実装としてのリレーショナルデータベース ② UniDicデータベース
と、そのデータベースからエクスポートされた短単位をエントリ（見出し語）とする、形態素解析器MeCab用の解析用辞書 ③ 解析用UniDic の総称です。

UniDicでアクセントを調べてみる 25番目のフィールド(= aType )がアクセント位置です 26,27番目のフィールドも使ってアクセントを修飾しますが、今回は単純化のために位置だけを見ますこんにちはの場合は5文字目 $ echo
こんにちは | mecab -d /var/lib/mecab/dic/unidic こんにちは感動詞,...省略...,コンニチハ,5,,,37963946107478528,138112 EOS

アクセント位置用の音声を用意するピッチを調整した音声を用意します ffmpeg を使います 1.01倍にします $ ls *.mp3 | rargs
-p '(.+)\.mp3' ffmpeg -y -i {} -af 'asetrate=44100*101/100,atempo=100/101' {1}_accent.mp3

アクセントを考慮した音声を合成してみるアクセントの効果をわかりやすくするために、ここでは「よろしくお願いいたします」を使います $ ffmpeg -i concat:$(echo よろしくお願いいたします|\ mecab -d
/var/lib/mecab/dic/unidic | \ awk 'NF>1{print $2}' | \ sel -d, 21 25 | \ awk '{for(i=1;i<=length($1);i++) if(i==$2) { print substr($1, i, 1)"_accent.mp3" } else print substr($1, i, 1)".mp3"}' | \ paste -sd\|) \ ./output.mp3

聞いてみよう！

こわい！！かなしいね

APIサーバーを建ててみました… いい感じにできたらWebサービスとして公開してみるかと思ってましたいい感じになってないですが公開しました。ただしAPIだけ… https://[サ終しました].ap-northeast-1.awsapprunner.com/api/Generate {"Text": "こんにちは"} といった感じのJSONをPOSTしてやると、音声ファイルへのURLが返ってきます AWS App
Runnerの素振りがしたかったのがほとんどのモチベです今日中にサーバーは落とすので試すなら今！！ # httpie の例 $ http --json POST https://[サ終しました].ap-northeast-1.awsapprunner.com/api/Generate Text=こんにちは

まとめ 1. 筋トレのトレーナーのかわりに音声合成を使おうと思った 2. なんかもっとサッとやりたかったので、自分の音声を使った音声合成をやってみた 3. こわかった 4. アクセントをつけてみた
5. こわかった App Runnerめちゃ簡単で良かったのでおススメです

$ owari kan -g -a xztaityozx |￣￣￣￣￣￣￣￣￣| | 終 |
| 制作・著作 | | ￣￣￣￣￣￣￣ | | xztaityozx | |＿＿＿＿＿＿＿＿＿| ∧∧ || ( ﾟдﾟ)|| / づΦ

音声合成してみよう

音声合成してみよう

xztaityozx

More Decks by xztaityozx

Other Decks in Programming

Featured

Transcript