Slide 1

Slide 1 text

Tech-on MeetUp#19 知ったかAWSサービスをChatGPT先生に聞いて みよう! 2023/02/27 watany 1

Slide 2

Slide 2 text

About me Watanabe Yohei (Twitter: _@watany) Role: AWS Architect, Instructor, CCoE AWS, CDK AWS Community Builder(Cloud Operations) Contributer (AWS CDK) 2

Slide 3

Slide 3 text

私が生成 AI で解決したいこと ⇒ あの AWS サービスを知りたい!!!! 3

Slide 4

Slide 4 text

"あのサービス" = Amazon Polly 某所研修では対向アプリとして扱っているが、サービス自体はそこまで詳しくない 実は 5 年ほど雰囲気で使ってる 生成 AI に教えてもらって、知ったかを卒業したい 4

Slide 5

Slide 5 text

今回もちいる生成 AI は? ChatGPT OpenAI 社提供のチャットボットサー ビス お詫び:Bing AI Chat は未検証 ChatGPT Plus 2023/2/10 頃から日本でも Plus($20/ 月)が利用可能に サーバー落ちがほぼない 回答速度が 3 倍に(体感) 5

Slide 6

Slide 6 text

ChatGPT 先生に訊いてみた 6

Slide 7

Slide 7 text

要約してもらった 7

Slide 8

Slide 8 text

聞いて分かったこと ここまでの知識は、既に知っている 私が Amazon Polly で本当に知りたいことは 変換した音声を自然な発音にしたい 自然にさせないと実務で使えないのでは そもそも SSML ってなんだ 8

Slide 9

Slide 9 text

変換した音声を自然な発 音にしたい TL;DR Amazon Polly で自然な音声を作成す るには、SSML タグを使用する必要が ある。 ex) や、、 タグで、音声の発音や流 れを調整可能に。 9

Slide 10

Slide 10 text

自然にさせないと実務で 使えないのでは TL;DR 自然な発音でない場合、発音が不自 然で聞き取りづらくなったり、口語 体に適した音声が生成されない可能 性。 また、意図しない結果が生じること もあるため、適切な SSML タグで自 然な発音を行うことが重要。 10

Slide 11

Slide 11 text

SSML(Speech Synthesis Markup Language)とは TL;DR SSML は音声合成エンジンに対し、音 声の発音や流れ、イントネーション などを指示するためのマークアップ 言語 SSML タグを使用することで、発音の 調整、発話速度の変更、休止時間の 挿入が可能に。 多くの音声合成エンジンは SSML タ グをサポートしている 11

Slide 12

Slide 12 text

Polly に対する課題が明瞭になったとこ ろで改めて・・・ 12

Slide 13

Slide 13 text

タグ付けをいい感じに任せられないか なあ! 13

Slide 14

Slide 14 text

ChatGPT にタグつけてもらえばいいじゃん 例文(Chat GPT に生成してもらった要約) Amazon Polly は、Amazon Web Services が提供するテキストから音声合成(TTS)サービスであ り、自然な音声を生成することができます。 Polly で変換した音声 0:00 0:00 / 0:11 / 0:11 14

Slide 15

Slide 15 text

依頼してみよう # 命令書: あなたは日本語の自然言語処理のスペシャリストです。以下の制約のもと最高のアウトプットを 出力してください。 # 制約: 日本語話者が自然な発声と判断できるよう、例文に SSML タグをつけてください。 発声は以下の特徴があるように設定してください。 聴衆が聞き取れる速度、かつ明瞭な発声。 要点を強調し、最後に余韻を残す。 Amazon Polly が対応する SSML タグのみを用いる # 例文 省略(前述) 15

Slide 16

Slide 16 text

結果 16

Slide 17

Slide 17 text

SSML タグをつけた音声 例文 Amazon Polly は、Amazon Web Services が提供するテキストから音声合成(TTS)サービスであ り、自然な音声を生成することができます。 SSML タグをつけた音声 備考:さきほどの音声 0:00 0:00 / 0:12 / 0:12 0:00 0:00 / 0:11 / 0:11 17

Slide 18

Slide 18 text

いかがでしたか? 挙手で聞いてみたい 良さそう 多分いい なんか違う 18

Slide 19

Slide 19 text

振り返り 先ほどの指示がなぜダメか?(想定) ”聴衆が聞き取れる速度、かつ明瞭な発声。” 具体的な定義がなかったので、現行を変える契機がなかった? ”要点を強調し、最後に余韻を残す。” 要点とは何か?が指示できていない 強調の方法を指定できていない 単語の直前1秒以下の沈黙を入れる、なども考えられる 19

Slide 20

Slide 20 text

まとめ ChatGPT で得られる価値 = 対話による思考・問いの整理にはかなり良い ラバーダッキング 2.0 欲しいプログラムを自動で出力する、という使い方はおすすめできない プロンプトをどこまで作りこむか?問題 プロンプトを過度に作りこむよりは対話的に精度を上げる方が使いやすい 使って良さがわかる典型なので、ある程度の熟練は必要。 事例・発表を聞いて知ったかしないで使っていきましょう 20

Slide 21

Slide 21 text

Appendix. ChatGPT に向いていそう オープンクエスチョン 広義のテキスト加工 変換、要約、詳細説明、 Markdown, Marmaid 形式などもいいぞ 自然言語やプログラミング言語の翻訳 Python → Golang とか ChatGPT に実は向かない? 事実を調査し、回答させる(補助まで!!) 要件からそのまま使えるアウトプットを生成する(補助まで!!) 21

Slide 22

Slide 22 text

Appendix. モノづくりの進捗でいうと 10%→60%を支援するのに強い 0%→10%:アイデアこそ出るが、かなり無難なものしか出てこない テストデータには良さそう 60%以降:品質を一定以上にするには人のチェックが必要。 例:K8s の運用スクリプトを書いてもらうも、3 時間くらい対話して治したが全然動 かない。 22