Link
Embed
Share
Beginning
This slide
Copy link URL
Copy link URL
Copy iframe embed code
Copy iframe embed code
Copy javascript embed code
Copy javascript embed code
Share
Tweet
Share
Tweet
Slide 1
Slide 1 text
Tech-on MeetUp#19 知ったかAWSサービスをChatGPT先生に聞いて みよう! 2023/02/27 watany 1
Slide 2
Slide 2 text
About me Watanabe Yohei (Twitter: _@watany) Role: AWS Architect, Instructor, CCoE AWS, CDK AWS Community Builder(Cloud Operations) Contributer (AWS CDK) 2
Slide 3
Slide 3 text
私が生成 AI で解決したいこと ⇒ あの AWS サービスを知りたい!!!! 3
Slide 4
Slide 4 text
"あのサービス" = Amazon Polly 某所研修では対向アプリとして扱っているが、サービス自体はそこまで詳しくない 実は 5 年ほど雰囲気で使ってる 生成 AI に教えてもらって、知ったかを卒業したい 4
Slide 5
Slide 5 text
今回もちいる生成 AI は? ChatGPT OpenAI 社提供のチャットボットサー ビス お詫び:Bing AI Chat は未検証 ChatGPT Plus 2023/2/10 頃から日本でも Plus($20/ 月)が利用可能に サーバー落ちがほぼない 回答速度が 3 倍に(体感) 5
Slide 6
Slide 6 text
ChatGPT 先生に訊いてみた 6
Slide 7
Slide 7 text
要約してもらった 7
Slide 8
Slide 8 text
聞いて分かったこと ここまでの知識は、既に知っている 私が Amazon Polly で本当に知りたいことは 変換した音声を自然な発音にしたい 自然にさせないと実務で使えないのでは そもそも SSML ってなんだ 8
Slide 9
Slide 9 text
変換した音声を自然な発 音にしたい TL;DR Amazon Polly で自然な音声を作成す るには、SSML タグを使用する必要が ある。 ex) や、、 タグで、音声の発音や流 れを調整可能に。 9
Slide 10
Slide 10 text
自然にさせないと実務で 使えないのでは TL;DR 自然な発音でない場合、発音が不自 然で聞き取りづらくなったり、口語 体に適した音声が生成されない可能 性。 また、意図しない結果が生じること もあるため、適切な SSML タグで自 然な発音を行うことが重要。 10
Slide 11
Slide 11 text
SSML(Speech Synthesis Markup Language)とは TL;DR SSML は音声合成エンジンに対し、音 声の発音や流れ、イントネーション などを指示するためのマークアップ 言語 SSML タグを使用することで、発音の 調整、発話速度の変更、休止時間の 挿入が可能に。 多くの音声合成エンジンは SSML タ グをサポートしている 11
Slide 12
Slide 12 text
Polly に対する課題が明瞭になったとこ ろで改めて・・・ 12
Slide 13
Slide 13 text
タグ付けをいい感じに任せられないか なあ! 13
Slide 14
Slide 14 text
ChatGPT にタグつけてもらえばいいじゃん 例文(Chat GPT に生成してもらった要約) Amazon Polly は、Amazon Web Services が提供するテキストから音声合成(TTS)サービスであ り、自然な音声を生成することができます。 Polly で変換した音声 0:00 0:00 / 0:11 / 0:11 14
Slide 15
Slide 15 text
依頼してみよう # 命令書: あなたは日本語の自然言語処理のスペシャリストです。以下の制約のもと最高のアウトプットを 出力してください。 # 制約: 日本語話者が自然な発声と判断できるよう、例文に SSML タグをつけてください。 発声は以下の特徴があるように設定してください。 聴衆が聞き取れる速度、かつ明瞭な発声。 要点を強調し、最後に余韻を残す。 Amazon Polly が対応する SSML タグのみを用いる # 例文 省略(前述) 15
Slide 16
Slide 16 text
結果 16
Slide 17
Slide 17 text
SSML タグをつけた音声 例文 Amazon Polly は、Amazon Web Services が提供するテキストから音声合成(TTS)サービスであ り、自然な音声を生成することができます。 SSML タグをつけた音声 備考:さきほどの音声 0:00 0:00 / 0:12 / 0:12 0:00 0:00 / 0:11 / 0:11 17
Slide 18
Slide 18 text
いかがでしたか? 挙手で聞いてみたい 良さそう 多分いい なんか違う 18
Slide 19
Slide 19 text
振り返り 先ほどの指示がなぜダメか?(想定) ”聴衆が聞き取れる速度、かつ明瞭な発声。” 具体的な定義がなかったので、現行を変える契機がなかった? ”要点を強調し、最後に余韻を残す。” 要点とは何か?が指示できていない 強調の方法を指定できていない 単語の直前1秒以下の沈黙を入れる、なども考えられる 19
Slide 20
Slide 20 text
まとめ ChatGPT で得られる価値 = 対話による思考・問いの整理にはかなり良い ラバーダッキング 2.0 欲しいプログラムを自動で出力する、という使い方はおすすめできない プロンプトをどこまで作りこむか?問題 プロンプトを過度に作りこむよりは対話的に精度を上げる方が使いやすい 使って良さがわかる典型なので、ある程度の熟練は必要。 事例・発表を聞いて知ったかしないで使っていきましょう 20
Slide 21
Slide 21 text
Appendix. ChatGPT に向いていそう オープンクエスチョン 広義のテキスト加工 変換、要約、詳細説明、 Markdown, Marmaid 形式などもいいぞ 自然言語やプログラミング言語の翻訳 Python → Golang とか ChatGPT に実は向かない? 事実を調査し、回答させる(補助まで!!) 要件からそのまま使えるアウトプットを生成する(補助まで!!) 21
Slide 22
Slide 22 text
Appendix. モノづくりの進捗でいうと 10%→60%を支援するのに強い 0%→10%:アイデアこそ出るが、かなり無難なものしか出てこない テストデータには良さそう 60%以降:品質を一定以上にするには人のチェックが必要。 例:K8s の運用スクリプトを書いてもらうも、3 時間くらい対話して治したが全然動 かない。 22