Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
text-to-speech-hands-on
Search
Yutong Song
September 14, 2021
Technology
0
260
text-to-speech-hands-on
本資料はIBM Tech Dojoのコンテンツになります。
Yutong Song
September 14, 2021
Tweet
Share
More Decks by Yutong Song
See All by Yutong Song
cats-classification-cp4d
yutongsong
0
260
Other Decks in Technology
See All in Technology
Access-what? why and how, A11Y for All - Nordic.js 2025
gdomiciano
1
120
定期的な価値提供だけじゃない、スクラムが導くチームの共創化 / 20251004 Naoki Takahashi
shift_evolve
PRO
4
360
Vibe Coding Year in Review. From Karpathy to Real-World Agents by Niels Rolland, CEO Paatch
vcoisne
0
110
『バイトル』CTOが語る! AIネイティブ世代と切り拓くモノづくり組織
dip_tech
PRO
1
110
Trust as Infrastructure
bcantrill
1
370
ユーザーの声とAI検証で進める、プロダクトディスカバリー
sansantech
PRO
1
110
能登半島地震で見えた災害対応の課題と組織変革の重要性
ditccsugii
0
240
綺麗なデータマートをつくろう_データ整備を前向きに考える会 / Let's create clean data mart
brainpadpr
3
370
関係性が駆動するアジャイル──GPTに人格を与えたら、対話を通してふりかえりを習慣化できた話
mhlyc
0
140
AIAgentの限界を超え、 現場を動かすWorkflowAgentの設計と実践
miyatakoji
1
160
「れきちず」のこれまでとこれから - 誰にでもわかりやすい歴史地図を目指して / FOSS4G 2025 Japan
hjmkth
1
160
成長自己責任時代のあるきかた/How to navigate the era of personal responsibility for growth
kwappa
4
300
Featured
See All Featured
Stop Working from a Prison Cell
hatefulcrawdad
271
21k
Rails Girls Zürich Keynote
gr2m
95
14k
Connecting the Dots Between Site Speed, User Experience & Your Business [WebExpo 2025]
tammyeverts
9
590
Agile that works and the tools we love
rasmusluckow
331
21k
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
507
140k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
229
22k
A better future with KSS
kneath
239
18k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
35
3.2k
The Straight Up "How To Draw Better" Workshop
denniskardys
237
140k
How GitHub (no longer) Works
holman
315
140k
Building Applications with DynamoDB
mza
96
6.7k
4 Signs Your Business is Dying
shpigford
185
22k
Transcript
Watsonが代わりに発⾔する! Text to Speechハンズオン 2021年9⽉14⽇
本ハンズオンについて • 目的 Watons Text to Speechを利用する イメージを掴むこと • ハンズオンのゴール
テキストから音声ファイルを合 成すること
事前準備が お済みでない⽅ IBM Cloud への登録はご⾃宅かスマートフォンのキャリア回線を使⽤して ⾏ってください ※同⼀のWiFi経由で複数⼈が同時に登録するとエラーとなる事があります https://ibm.biz/Bdf8fD IBM Cloudアカウント(無料)の取得
操作解説動画: https://ibm.biz/action1
⾃⼰紹介 宋 ⾬桐(Song Yutong)
[email protected]
カスタマ・サクセス・マネージャー テクノロジー事業本部 ⽇本アイ・ビー・エム株式会社
ハンズオンの 進め⽅ Watson Text to Speechのご紹介 Demoを触ってみよう︕ 本⽇使うcodeの説明 IBM Cloud
ライトアカウントLogin Text to Speech API keyの取得 テキストから⾳声ファイルを合成してみる Tips & 補⾜
Watson Text to Speech テキストを多様な⾔語と声で⾃然な⾳声に変換します。 IBM Watson Text to Speechは、テキストをさまざまな
⾔語に変換することができます。 • お客様のブランドに「声」をもたらし、ユーザーの⺟ 国語での対話を可能にすることで、顧客体験とエン ゲージメントを向上させます。 • あらゆるユーザーのアクセシビリティーを⾼めること ができます。 • 不注意運転を防ぐために⾳声オプションを提供する⽬ 的で利⽤することも可能です。 • このサービスを活⽤してカスタマー・サービスでの対 話を⾃動化すると、待ち時間を排除できます。
Watson Text to Speech • ⾔語と⾳声 https://cloud.ibm.com/docs/text-to-speech?topic=text-to- speech-voices • ⾳声フォーマット
https://cloud.ibm.com/docs/text-to-speech?topic=text-to- speech-audioFormats
Demoを 触ってみよう︕ https://www.ibm.com/demos/live/tts- demo/self-service/home
本⽇使うcodeの説明
IBM Cloud ライトアカウントLogin https://cloud.ibm.com/
• カタログからText to Speechを選択する Text to Speech API keyの取得
• 「無料」プランのサービスを作成する Text to Speech API keyの取得
• 「apikey」と「url」を確認する Text to Speech API keyの取得
では、 テキストから⾳声ファイルを合成してみましょう︕ コードはこちらからダウンロード: https://github.com/IBMDeveloperTokyo/tex t-to-speech
ゴールまであと少しだけ…… • auth.json apikeyとurlを追加して保存する。 • tts.py 合成したい⽂章に書き換える。 他の⾔語を使いたい場合、「voice」を修正する。 こちらをご参照ください︓https://cloud.ibm.com/docs/text-to-speech?topic=text-to-speech-voices
Tips • 長文より、短い文章に分けて変換する方が修正しやすい。 • 自然な発音を得るために、句読点やスペースをテキストに入れる。 • 他の言語はこちらをご参照ください: https://cloud.ibm.com/apidocs/text-to-speech?code=node#listcustomprompts
https://app.sli.do/event/fgjjege8 Customer Success Manager 募集中︕ アンケートお願いします︕
本ハンズオンで利⽤する Python のバージョンは 3.x が前提となっています。Python 3.x をダウンロードして 下さい。少なくとも 3.9で動作実績があります。 最新版
Python はこちらからダウンロードできます。 https://www.python.org/downloads/ わかりにくいという場合は、こちらが親切です。 https://pythonlinks.python.jp/ja/index.html macOS で Python を使われている⽅は、ご⾃⾝が普段使われているパッケージ管理⽅式に合わせて、Python 公 式サイトが提供する macOS ⽤のインストーラーか HomeBrew を使ったインストールのどちらかの⽅式を選択 して下さい。 https://www.python.jp/install/macos/index.html Python の導⼊が完了したら、Windows の場合はコマンドプロンプト (cmd.exe) から、macOS の場合はター ミナルから python コマンドが実⾏できることを確認して下さい。 補⾜ーーPython 実⾏環境の導⼊ python --version Python 3.9.6
Windows で python の実⾏パスが⾒つからない場合は、以下の⼿順を実⾏したかどうか確認して下さい。 ・Python for Windows のインストーラ実⾏時に「Add Python 3.x
to PATH」のチェックボックスを選択し、 インストールを継続。インストール終了後 OS を再起動。 ・それでも python の実⾏パスが⾒つからない場合は、コマンドプロンプトで python を実⾏する際にフルパス を指定。 C:¥Users¥Windowsユーザ名¥AppData¥Local¥Programs¥Python¥Python3X¥python.exe (XはPythonのバージョンに依存) https://docs.python.org/ja/3/using/windows.html 補⾜ーーPython 実⾏環境の導⼊
https://pip.pypa.io/en/stable/installation/ macOS Windows 補⾜ーーPipの導⼊ $ python get-pip.py C:> py get-pip.py