Upgrade to Pro — share decks privately, control downloads, hide ads and more …

text-to-speech-hands-on

Yutong Song
September 14, 2021

 text-to-speech-hands-on

本資料はIBM Tech Dojoのコンテンツになります。

Yutong Song

September 14, 2021
Tweet

More Decks by Yutong Song

Other Decks in Technology

Transcript

  1. Watsonが代わりに発⾔する!
    Text to Speechハンズオン
    2021年9⽉14⽇

    View Slide

  2. 本ハンズオンについて
    • 目的
    Watons Text to Speechを利用する
    イメージを掴むこと
    • ハンズオンのゴール
    テキストから音声ファイルを合
    成すること

    View Slide

  3. 事前準備が
    お済みでない⽅
    IBM Cloud への登録はご⾃宅かスマートフォンのキャリア回線を使⽤して
    ⾏ってください
    ※同⼀のWiFi経由で複数⼈が同時に登録するとエラーとなる事があります
    https://ibm.biz/Bdf8fD
    IBM Cloudアカウント(無料)の取得
    操作解説動画: https://ibm.biz/action1

    View Slide

  4. ⾃⼰紹介
    宋 ⾬桐(Song Yutong)
    [email protected]
    カスタマ・サクセス・マネージャー
    テクノロジー事業本部
    ⽇本アイ・ビー・エム株式会社

    View Slide

  5. ハンズオンの
    進め⽅
    Watson Text to Speechのご紹介
    Demoを触ってみよう︕
    本⽇使うcodeの説明
    IBM Cloud ライトアカウントLogin
    Text to Speech API keyの取得
    テキストから⾳声ファイルを合成してみる
    Tips & 補⾜

    View Slide

  6. Watson Text to Speech
    テキストを多様な⾔語と声で⾃然な⾳声に変換します。
    IBM Watson Text to Speechは、テキストをさまざまな
    ⾔語に変換することができます。
    • お客様のブランドに「声」をもたらし、ユーザーの⺟
    国語での対話を可能にすることで、顧客体験とエン
    ゲージメントを向上させます。
    • あらゆるユーザーのアクセシビリティーを⾼めること
    ができます。
    • 不注意運転を防ぐために⾳声オプションを提供する⽬
    的で利⽤することも可能です。
    • このサービスを活⽤してカスタマー・サービスでの対
    話を⾃動化すると、待ち時間を排除できます。

    View Slide

  7. Watson Text to Speech
    • ⾔語と⾳声
    https://cloud.ibm.com/docs/text-to-speech?topic=text-to-
    speech-voices
    • ⾳声フォーマット
    https://cloud.ibm.com/docs/text-to-speech?topic=text-to-
    speech-audioFormats

    View Slide

  8. Demoを
    触ってみよう︕
    https://www.ibm.com/demos/live/tts-
    demo/self-service/home

    View Slide

  9. 本⽇使うcodeの説明

    View Slide

  10. IBM Cloud ライトアカウントLogin
    https://cloud.ibm.com/

    View Slide

  11. • カタログからText to Speechを選択する
    Text to Speech API keyの取得

    View Slide

  12. • 「無料」プランのサービスを作成する
    Text to Speech API keyの取得

    View Slide

  13. • 「apikey」と「url」を確認する
    Text to Speech API keyの取得

    View Slide

  14. では、
    テキストから⾳声ファイルを合成してみましょう︕
    コードはこちらからダウンロード:
    https://github.com/IBMDeveloperTokyo/tex
    t-to-speech

    View Slide

  15. ゴールまであと少しだけ……
    • auth.json
    apikeyとurlを追加して保存する。
    • tts.py
    合成したい⽂章に書き換える。
    他の⾔語を使いたい場合、「voice」を修正する。
    こちらをご参照ください︓https://cloud.ibm.com/docs/text-to-speech?topic=text-to-speech-voices

    View Slide

  16. Tips
    • 長文より、短い文章に分けて変換する方が修正しやすい。
    • 自然な発音を得るために、句読点やスペースをテキストに入れる。
    • 他の言語はこちらをご参照ください:
    https://cloud.ibm.com/apidocs/text-to-speech?code=node#listcustomprompts

    View Slide

  17. https://app.sli.do/event/fgjjege8
    Customer Success Manager 募集中︕
    アンケートお願いします︕

    View Slide

  18. 本ハンズオンで利⽤する Python のバージョンは 3.x が前提となっています。Python 3.x をダウンロードして
    下さい。少なくとも 3.9で動作実績があります。
    最新版 Python はこちらからダウンロードできます。
    https://www.python.org/downloads/
    わかりにくいという場合は、こちらが親切です。
    https://pythonlinks.python.jp/ja/index.html
    macOS で Python を使われている⽅は、ご⾃⾝が普段使われているパッケージ管理⽅式に合わせて、Python 公
    式サイトが提供する macOS ⽤のインストーラーか HomeBrew を使ったインストールのどちらかの⽅式を選択
    して下さい。
    https://www.python.jp/install/macos/index.html
    Python の導⼊が完了したら、Windows の場合はコマンドプロンプト (cmd.exe) から、macOS の場合はター
    ミナルから python コマンドが実⾏できることを確認して下さい。
    補⾜ーーPython 実⾏環境の導⼊
    python --version
    Python 3.9.6

    View Slide

  19. Windows で python の実⾏パスが⾒つからない場合は、以下の⼿順を実⾏したかどうか確認して下さい。
    ・Python for Windows のインストーラ実⾏時に「Add Python 3.x to PATH」のチェックボックスを選択し、
    インストールを継続。インストール終了後 OS を再起動。
    ・それでも python の実⾏パスが⾒つからない場合は、コマンドプロンプトで python を実⾏する際にフルパス
    を指定。
    C:¥Users¥Windowsユーザ名¥AppData¥Local¥Programs¥Python¥Python3X¥python.exe
    (XはPythonのバージョンに依存)
    https://docs.python.org/ja/3/using/windows.html
    補⾜ーーPython 実⾏環境の導⼊

    View Slide

  20. https://pip.pypa.io/en/stable/installation/
    macOS
    Windows
    補⾜ーーPipの導⼊
    $ python get-pip.py
    C:> py get-pip.py

    View Slide