Upgrade to PRO for Only $50/Year—Limited-Time Offer! 🔥
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
text-to-speech-hands-on
Search
Yutong Song
September 14, 2021
Technology
0
260
text-to-speech-hands-on
本資料はIBM Tech Dojoのコンテンツになります。
Yutong Song
September 14, 2021
Tweet
Share
More Decks by Yutong Song
See All by Yutong Song
cats-classification-cp4d
yutongsong
0
270
Other Decks in Technology
See All in Technology
OCI Oracle Database Services新機能アップデート(2025/09-2025/11)
oracle4engineer
PRO
1
100
re:Invent 2025 ~何をする者であり、どこへいくのか~
tetutetu214
0
210
ML PM Talk #1 - ML PMの分類に関する考察
lycorptech_jp
PRO
1
800
LT登壇を続けたらポッドキャストに呼ばれた話
yamatai1212
0
130
AWSセキュリティアップデートとAWSを育てる話
cmusudakeisuke
0
220
Challenging Hardware Contests with Zephyr and Lessons Learned
iotengineer22
0
180
Kiro Autonomous AgentとKiro Powers の紹介 / kiro-autonomous-agent-and-powers
tomoki10
0
390
[デモです] NotebookLM で作ったスライドの例
kongmingstrap
0
130
生成AI時代におけるグローバル戦略思考
taka_aki
0
120
20251209_WAKECareer_生成AIを活用した設計・開発プロセス
syobochim
6
1.5k
Karate+Database RiderによるAPI自動テスト導入工数をCline+GitLab MCPを使って2割削減を目指す! / 20251206 Kazuki Takahashi
shift_evolve
PRO
1
680
ブロックテーマとこれからの WordPress サイト制作 / Toyama WordPress Meetup Vol.81
torounit
0
550
Featured
See All Featured
Six Lessons from altMBA
skipperchong
29
4.1k
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
32
1.8k
GraphQLの誤解/rethinking-graphql
sonatard
73
11k
Code Reviewing Like a Champion
maltzj
527
40k
[SF Ruby Conf 2025] Rails X
palkan
0
510
A better future with KSS
kneath
240
18k
Learning to Love Humans: Emotional Interface Design
aarron
274
41k
Put a Button on it: Removing Barriers to Going Fast.
kastner
60
4.1k
Building Flexible Design Systems
yeseniaperezcruz
330
39k
Being A Developer After 40
akosma
91
590k
Speed Design
sergeychernyshev
33
1.4k
Typedesign – Prime Four
hannesfritz
42
2.9k
Transcript
Watsonが代わりに発⾔する! Text to Speechハンズオン 2021年9⽉14⽇
本ハンズオンについて • 目的 Watons Text to Speechを利用する イメージを掴むこと • ハンズオンのゴール
テキストから音声ファイルを合 成すること
事前準備が お済みでない⽅ IBM Cloud への登録はご⾃宅かスマートフォンのキャリア回線を使⽤して ⾏ってください ※同⼀のWiFi経由で複数⼈が同時に登録するとエラーとなる事があります https://ibm.biz/Bdf8fD IBM Cloudアカウント(無料)の取得
操作解説動画: https://ibm.biz/action1
⾃⼰紹介 宋 ⾬桐(Song Yutong)
[email protected]
カスタマ・サクセス・マネージャー テクノロジー事業本部 ⽇本アイ・ビー・エム株式会社
ハンズオンの 進め⽅ Watson Text to Speechのご紹介 Demoを触ってみよう︕ 本⽇使うcodeの説明 IBM Cloud
ライトアカウントLogin Text to Speech API keyの取得 テキストから⾳声ファイルを合成してみる Tips & 補⾜
Watson Text to Speech テキストを多様な⾔語と声で⾃然な⾳声に変換します。 IBM Watson Text to Speechは、テキストをさまざまな
⾔語に変換することができます。 • お客様のブランドに「声」をもたらし、ユーザーの⺟ 国語での対話を可能にすることで、顧客体験とエン ゲージメントを向上させます。 • あらゆるユーザーのアクセシビリティーを⾼めること ができます。 • 不注意運転を防ぐために⾳声オプションを提供する⽬ 的で利⽤することも可能です。 • このサービスを活⽤してカスタマー・サービスでの対 話を⾃動化すると、待ち時間を排除できます。
Watson Text to Speech • ⾔語と⾳声 https://cloud.ibm.com/docs/text-to-speech?topic=text-to- speech-voices • ⾳声フォーマット
https://cloud.ibm.com/docs/text-to-speech?topic=text-to- speech-audioFormats
Demoを 触ってみよう︕ https://www.ibm.com/demos/live/tts- demo/self-service/home
本⽇使うcodeの説明
IBM Cloud ライトアカウントLogin https://cloud.ibm.com/
• カタログからText to Speechを選択する Text to Speech API keyの取得
• 「無料」プランのサービスを作成する Text to Speech API keyの取得
• 「apikey」と「url」を確認する Text to Speech API keyの取得
では、 テキストから⾳声ファイルを合成してみましょう︕ コードはこちらからダウンロード: https://github.com/IBMDeveloperTokyo/tex t-to-speech
ゴールまであと少しだけ…… • auth.json apikeyとurlを追加して保存する。 • tts.py 合成したい⽂章に書き換える。 他の⾔語を使いたい場合、「voice」を修正する。 こちらをご参照ください︓https://cloud.ibm.com/docs/text-to-speech?topic=text-to-speech-voices
Tips • 長文より、短い文章に分けて変換する方が修正しやすい。 • 自然な発音を得るために、句読点やスペースをテキストに入れる。 • 他の言語はこちらをご参照ください: https://cloud.ibm.com/apidocs/text-to-speech?code=node#listcustomprompts
https://app.sli.do/event/fgjjege8 Customer Success Manager 募集中︕ アンケートお願いします︕
本ハンズオンで利⽤する Python のバージョンは 3.x が前提となっています。Python 3.x をダウンロードして 下さい。少なくとも 3.9で動作実績があります。 最新版
Python はこちらからダウンロードできます。 https://www.python.org/downloads/ わかりにくいという場合は、こちらが親切です。 https://pythonlinks.python.jp/ja/index.html macOS で Python を使われている⽅は、ご⾃⾝が普段使われているパッケージ管理⽅式に合わせて、Python 公 式サイトが提供する macOS ⽤のインストーラーか HomeBrew を使ったインストールのどちらかの⽅式を選択 して下さい。 https://www.python.jp/install/macos/index.html Python の導⼊が完了したら、Windows の場合はコマンドプロンプト (cmd.exe) から、macOS の場合はター ミナルから python コマンドが実⾏できることを確認して下さい。 補⾜ーーPython 実⾏環境の導⼊ python --version Python 3.9.6
Windows で python の実⾏パスが⾒つからない場合は、以下の⼿順を実⾏したかどうか確認して下さい。 ・Python for Windows のインストーラ実⾏時に「Add Python 3.x
to PATH」のチェックボックスを選択し、 インストールを継続。インストール終了後 OS を再起動。 ・それでも python の実⾏パスが⾒つからない場合は、コマンドプロンプトで python を実⾏する際にフルパス を指定。 C:¥Users¥Windowsユーザ名¥AppData¥Local¥Programs¥Python¥Python3X¥python.exe (XはPythonのバージョンに依存) https://docs.python.org/ja/3/using/windows.html 補⾜ーーPython 実⾏環境の導⼊
https://pip.pypa.io/en/stable/installation/ macOS Windows 補⾜ーーPipの導⼊ $ python get-pip.py C:> py get-pip.py