Azure OpenAI Serviceのプロンプトエンジニアリング入門

by tomokusaba

Slide 1

Slide 1 text

Azure OpenAI Serviceのプロンプトエンジニアリング入門株式会社SAKURUG プロダクトDiv 草場友光 Global Azure 2024

Slide 2

Slide 2 text

自己紹介 • 普段は主にシステムをAzureにモダナイズする仕事をしています。 • コミュニティ活動を通じて知識をアップデートしています。 • 2022/08-2024 Microsoft MVP (Developer Technologies) • tomo_kusaba

Slide 3

Slide 3 text

宣伝【VISION】ひとの可能性を開花させる企業であり続ける VISIONに共感できる仲間募集中。

Slide 4

Slide 4 text

注意 • 個人の見解・解釈が多分に入っています。 • 見解の相違・事実誤認などありましたらご指摘ください。

Slide 5

Slide 5 text

今日の目的 • 生成AIを使う上で出力を改善する第一歩はプロンプトを改善することです。 • 本日はプロンプトを改善してよりよい出力を得るための技法を学んでいきたいと思います。 • Azure OpenAI Serviceのプレイグラウンドが使用可能な方は一緒にやってみるとより理解が深まると思います。 • (参考) https://github.com/microsoft/generative-ai- for-beginners/tree/main/translations/ja-jp

Slide 6

Slide 6 text

プロンプトエンジニアリングとは？ • 目的に合わせた初期プロンプトを「設計する」 • 回答品質を上げるために、反復・試行錯誤して「改善する」 • プロンプトエンジニアリングは机上で練り上げるのではなく実際にLLMに質問を投げかけて何回も試行錯誤して最良のものを得ていくことが重要

Slide 7

Slide 7 text

プロンプトエンジニアリングの必要性 • モデルの回答は確率的な性質を持っています。たとえ、同じプロンプトだとしても実行するたびに異なる結果を得る場合があります。プロンプトエンジニアリングの手法でこのばらつきを軽減するのに役立ちます。 • モデルは回答をねつ造することがあります。モデルは有限のデータで事前トレーニングされています。その結果、架空あるいは事実と異なる回答を出力することがあります。 • モデルの能力は異なります。新しいモデルや新世代のモデルはより高度な機能を持つことが知られています。例えば、 GPT-35-TurboよりGPT-4の方がより精度の高い回答を得られる可能性があります。

Slide 8

Slide 8 text

ねつ造について • Microsoftでは責任あるAIガイドラインの枠組みにおいて一般的に「幻覚」とか「ハルシネーション」と表現される用語について「ねつ造」という用語を強く推奨しています。 • 機械が生み出した回答に対して人間の特性を誤って当てはめる擬人化を避けるためで、これによって不快におもう方への配慮です。

Slide 9

Slide 9 text

生成AIの出力結果を改善する方法プロンプトエンジニアリング Retrieval Augmented Generation(RAG) 知識拡張ファインチューニングモデルトレーニング簡単かつ安い難しいかつ高いプロンプトエンジニアリング Retrieval Augmented Generation(RAG) 知識拡張ファインチューニングモデルトレーニング高品質

Slide 10

Slide 10 text

演習のためのリポジトリ • https://github.com/tomokusaba/GlobalAzure2024

Slide 11

Slide 11 text

生成AIの活用方法① ー指示 • 文章の要約 • 文章の翻訳 • 非構造化データからの整形 • JSONで出力など

Slide 12

Slide 12 text

生成AIの活用方法② ー質問 • 会話形式でAIの持っている知識を尋ねる

Slide 13

Slide 13 text

生成AIの活用方法③ ープログラムコード • プログラムに関する説明やコード生成、コードの説明を求めるなど

Slide 14

Slide 14 text

LLMに向かない質問①－1 例）今年のセリーグの優勝チームを教えてください学習データにないので通常のGPT- 35-Turboだとねつ造された回答がされる。実際には2021年の優勝チームはヤクルトスワローズです。(残念) Bingによって最新のデータをRAG で取り込まれた Copilotなら正確な回答がされる。

Slide 15

Slide 15 text

LLMに向かない質問①－2 • システムメッセージにアウトメッセージを設定する質問文にだしたメッセージに対してうまく答えられない場合にたいして逃げ道を与える指示を出してあげる。

Slide 16

Slide 16 text

LLMに向かない質問② 例）98765の平方根を求めてください。数値計算ならコードで書いた方がよい。

Slide 17

Slide 17 text

LLMに向かない質問③ • LLMはアクションを実行することができません。アクションを実行したい場合、Semantic KernelのPluginなどを利用してください。

Slide 18

Slide 18 text

明確な構文を追加する • プロンプトに明確な構文を（句読点、見出し、セクションマーカー）をしようするとよい • 異なる情報ソースの区切りに「---」を使うことができる。 • 使用する構文が分からない場合マークダウンまたはXMLを使うとAzure OpenAI Serviceはいい感じに解釈してくれる可能性が高い。 • 学習に大量のWebコンテンツが使用されているため

Slide 19

Slide 19 text

基本的なプロンプトー情報抽出次の文章から名前と所属と受賞歴を抽出してください。 --- では簡単に自己紹介をしたいと思います。私は草場友光と言います。主にシステムのモダナイの業務をしておりこうした登壇活動によって知識のアップデートをしています。所属は株式会社SAKURUGというところで渋谷に本社があり、最近では和歌山の白浜や仙台、福岡という場所にもオフィスがあります。 2022年8月にMicrosoft MVPを Developer Technologiesの分野で受賞しました。今後もよろしくお願いします。

Slide 20

Slide 20 text

キューを含むプロンプト • キューとは期待する回答フォーマットの一部をプロンプトに含めてモデルを正しい方向に誘導します。 • モデルはそのキューを受け取ってその文章の流れに沿って続けます。

Slide 21

Slide 21 text

フューショットプロンプト EC2:AWS Cloud Run:Google Cloud Autonomous Database:OCI App Service: フューショットプロンプトを用いない場合余計な出力がされる

Slide 22

Slide 22 text

サポートコンテンツ • プロンプトの内容は以下のように分類できると考えられます。 • 指示：なにをするのか？ • 主要コンテンツ：指示をする内容 • セカンダリコンテンツ：何らかの形で出力に影響を与える追加情報 • 分類の例 • 指示：次の文章から名前と所属と受賞歴を抽出してください。 • 主要コンテンツ：文章の内容（長いので割愛） • セカンダリ：JSON形式にしてください。

Slide 23

Slide 23 text

Chain of thought • LLMはタスクを小さなステップに分割し世界に関する知識と推論能力を使用します。

Slide 24

Slide 24 text

Chain of thought

Slide 25

Slide 25 text

Temperature • 0から1までの範囲があり0が最も決定的で、1が最も多様性があります。 • Temperature＝0

Slide 26

Slide 26 text

Temperature • Temperature＝1

Slide 27

Slide 27 text

ベストプラクティス • プロンプトを具体的に書く！ • プロンプトに例示を含める！ • 生成AIと繰り返し対話する！ • プロンプトの順序も重要！ • モデルにOUT指定をする！

Slide 28

Slide 28 text

参考文献 • generative ai for beginners https://github.com/microsoft/generative-ai-for- beginners/tree/main/translations/ja-jp • Azure OpenAI ServiceではじめるChatGPT/LLMシステム構築入門(ドーナツ本) (ISBN:978-4-297-13929-2)

Slide 29

Slide 29 text

おしまいおしまい