Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
text-to-speech-hands-on
Search
Yutong Song
September 14, 2021
Technology
0
260
text-to-speech-hands-on
本資料はIBM Tech Dojoのコンテンツになります。
Yutong Song
September 14, 2021
Tweet
Share
More Decks by Yutong Song
See All by Yutong Song
cats-classification-cp4d
yutongsong
0
290
Other Decks in Technology
See All in Technology
Claude_CodeでSEOを最適化する_AI_Ops_Community_Vol.2__マーケティングx_AIはここまで進化した.pdf
riku_423
2
600
usermode linux without MMU - fosdem2026 kernel devroom
thehajime
0
240
マーケットプレイス版Oracle WebCenter Content For OCI
oracle4engineer
PRO
5
1.6k
フルカイテン株式会社 エンジニア向け採用資料
fullkaiten
0
10k
モダンUIでフルサーバーレスなAIエージェントをAmplifyとCDKでサクッとデプロイしよう
minorun365
4
220
【Oracle Cloud ウェビナー】[Oracle AI Database + AWS] Oracle Database@AWSで広がるクラウドの新たな選択肢とAI時代のデータ戦略
oracle4engineer
PRO
2
180
CDKで始めるTypeScript開発のススメ
tsukuboshi
1
500
Introduction to Sansan for Engineers / エンジニア向け会社紹介
sansan33
PRO
6
68k
Context Engineeringが企業で不可欠になる理由
hirosatogamo
PRO
3
630
M&A 後の統合をどう進めるか ─ ナレッジワーク × Poetics が実践した組織とシステムの融合
kworkdev
PRO
1
480
Contract One Engineering Unit 紹介資料
sansan33
PRO
0
13k
Amazon S3 Vectorsを使って資格勉強用AIエージェントを構築してみた
usanchuu
3
450
Featured
See All Featured
GitHub's CSS Performance
jonrohan
1032
470k
More Than Pixels: Becoming A User Experience Designer
marktimemedia
3
320
Leveraging Curiosity to Care for An Aging Population
cassininazir
1
160
RailsConf 2023
tenderlove
30
1.3k
Git: the NoSQL Database
bkeepers
PRO
432
66k
Connecting the Dots Between Site Speed, User Experience & Your Business [WebExpo 2025]
tammyeverts
11
830
Building an army of robots
kneath
306
46k
VelocityConf: Rendering Performance Case Studies
addyosmani
333
24k
Fashionably flexible responsive web design (full day workshop)
malarkey
408
66k
How to Talk to Developers About Accessibility
jct
2
130
We Have a Design System, Now What?
morganepeng
54
8k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
122
21k
Transcript
Watsonが代わりに発⾔する! Text to Speechハンズオン 2021年9⽉14⽇
本ハンズオンについて • 目的 Watons Text to Speechを利用する イメージを掴むこと • ハンズオンのゴール
テキストから音声ファイルを合 成すること
事前準備が お済みでない⽅ IBM Cloud への登録はご⾃宅かスマートフォンのキャリア回線を使⽤して ⾏ってください ※同⼀のWiFi経由で複数⼈が同時に登録するとエラーとなる事があります https://ibm.biz/Bdf8fD IBM Cloudアカウント(無料)の取得
操作解説動画: https://ibm.biz/action1
⾃⼰紹介 宋 ⾬桐(Song Yutong)
[email protected]
カスタマ・サクセス・マネージャー テクノロジー事業本部 ⽇本アイ・ビー・エム株式会社
ハンズオンの 進め⽅ Watson Text to Speechのご紹介 Demoを触ってみよう︕ 本⽇使うcodeの説明 IBM Cloud
ライトアカウントLogin Text to Speech API keyの取得 テキストから⾳声ファイルを合成してみる Tips & 補⾜
Watson Text to Speech テキストを多様な⾔語と声で⾃然な⾳声に変換します。 IBM Watson Text to Speechは、テキストをさまざまな
⾔語に変換することができます。 • お客様のブランドに「声」をもたらし、ユーザーの⺟ 国語での対話を可能にすることで、顧客体験とエン ゲージメントを向上させます。 • あらゆるユーザーのアクセシビリティーを⾼めること ができます。 • 不注意運転を防ぐために⾳声オプションを提供する⽬ 的で利⽤することも可能です。 • このサービスを活⽤してカスタマー・サービスでの対 話を⾃動化すると、待ち時間を排除できます。
Watson Text to Speech • ⾔語と⾳声 https://cloud.ibm.com/docs/text-to-speech?topic=text-to- speech-voices • ⾳声フォーマット
https://cloud.ibm.com/docs/text-to-speech?topic=text-to- speech-audioFormats
Demoを 触ってみよう︕ https://www.ibm.com/demos/live/tts- demo/self-service/home
本⽇使うcodeの説明
IBM Cloud ライトアカウントLogin https://cloud.ibm.com/
• カタログからText to Speechを選択する Text to Speech API keyの取得
• 「無料」プランのサービスを作成する Text to Speech API keyの取得
• 「apikey」と「url」を確認する Text to Speech API keyの取得
では、 テキストから⾳声ファイルを合成してみましょう︕ コードはこちらからダウンロード: https://github.com/IBMDeveloperTokyo/tex t-to-speech
ゴールまであと少しだけ…… • auth.json apikeyとurlを追加して保存する。 • tts.py 合成したい⽂章に書き換える。 他の⾔語を使いたい場合、「voice」を修正する。 こちらをご参照ください︓https://cloud.ibm.com/docs/text-to-speech?topic=text-to-speech-voices
Tips • 長文より、短い文章に分けて変換する方が修正しやすい。 • 自然な発音を得るために、句読点やスペースをテキストに入れる。 • 他の言語はこちらをご参照ください: https://cloud.ibm.com/apidocs/text-to-speech?code=node#listcustomprompts
https://app.sli.do/event/fgjjege8 Customer Success Manager 募集中︕ アンケートお願いします︕
本ハンズオンで利⽤する Python のバージョンは 3.x が前提となっています。Python 3.x をダウンロードして 下さい。少なくとも 3.9で動作実績があります。 最新版
Python はこちらからダウンロードできます。 https://www.python.org/downloads/ わかりにくいという場合は、こちらが親切です。 https://pythonlinks.python.jp/ja/index.html macOS で Python を使われている⽅は、ご⾃⾝が普段使われているパッケージ管理⽅式に合わせて、Python 公 式サイトが提供する macOS ⽤のインストーラーか HomeBrew を使ったインストールのどちらかの⽅式を選択 して下さい。 https://www.python.jp/install/macos/index.html Python の導⼊が完了したら、Windows の場合はコマンドプロンプト (cmd.exe) から、macOS の場合はター ミナルから python コマンドが実⾏できることを確認して下さい。 補⾜ーーPython 実⾏環境の導⼊ python --version Python 3.9.6
Windows で python の実⾏パスが⾒つからない場合は、以下の⼿順を実⾏したかどうか確認して下さい。 ・Python for Windows のインストーラ実⾏時に「Add Python 3.x
to PATH」のチェックボックスを選択し、 インストールを継続。インストール終了後 OS を再起動。 ・それでも python の実⾏パスが⾒つからない場合は、コマンドプロンプトで python を実⾏する際にフルパス を指定。 C:¥Users¥Windowsユーザ名¥AppData¥Local¥Programs¥Python¥Python3X¥python.exe (XはPythonのバージョンに依存) https://docs.python.org/ja/3/using/windows.html 補⾜ーーPython 実⾏環境の導⼊
https://pip.pypa.io/en/stable/installation/ macOS Windows 補⾜ーーPipの導⼊ $ python get-pip.py C:> py get-pip.py