世界一わかりみの深いAzure OpenAI Service/wakarimiaoai

Slide 1

Slide 1 text

No content

Slide 2

Slide 2 text

Noriyuki TAKEI ෢Ҫ ٓߦ Information • サイオステクノロジー株式会社 • Microsoft MVP for Microsoft Azure Favorites • Azure • パデル • スキー • ライブ配信 • ⽢いもの • ⾛ること blog https://tech-lab.sios.jp/ core skill Azureによるクラウドネイティブなアプリ開発 Twitter @noriyukitakei

Slide 3

Slide 3 text

技術ブログ「SIOS Tech.Lab」世界⼀わかりみの深いAzure OpenAI Service https://tech-lab.sios.jp/archives/36497

Slide 4

Slide 4 text

"[VSF0QFO"* 4FSWJDF ͷ ֓ཁ

Slide 5

Slide 5 text

Azure OpenAI Service エンタープライズ向けの OpenAI 99.9%以上の稼働(SLA)を保証 APIキーによる認証に加え、トークンベースの認証などの強固なセキュリティをサポートマイクロソフトのサポートが利⽤可能

Slide 6

Slide 6 text

0QFO"*ͱ͸ʁ

Slide 7

Slide 7 text

OpenAIという企業が提供している SaaSベースのAPIサービスであり、サービスの内容は⽣成AI である OpenAIとは︖

Slide 8

Slide 8 text

認識AIから⽣成AIへ写真の中の物や動物を特定する画像認識や、話された⾔葉を⽂字に変換する⾳声認識などを⾏う。認識AI 新しい情報やデータを⽣成する能⼒を持ったAIのことを指す。例えば「千利休ってどんな⼈︖」という質問に答えを⽣成したり、指定された条件に基づいて画像を⽣成するなど。⽣成AI

Slide 9

Slide 9 text

代表的な⽣成AIであるChatGPT プロンプト回答

Slide 10

Slide 10 text

画像を⽣成するAIであるDALL·E プロンプト回答

Slide 11

Slide 11 text

OpenAI ⽂章⽣成AI GPT-3 GPT-4 OpenAIは以下の⽣成AIをAPIで提供します。画像⽣成AI dalle-2 ⽂字起こしAI Whisper

Slide 12

Slide 12 text

代表的なOpenAIのAPIであるChat Completion API アプリケーション URL ボディメソッド { “model”: “gpt-3.5-turbo”, “messages”: [ { ”role”: “system”, ”content”: “あなたは優秀なAIです。” } { ”role”: “user”, ”content”: “千利休ってどんな⼈︖” } { “role”: “assistant”, ”content“: ”千利休は・・・” } { ”role”: “user”, ”content”: “もっと詳しく教えて” } ] } ボディ { … “choices”: [ “index”: 0, “message”: { “role”: “assistant”, “content”: “千利休の詳細は、、、” }, … } HTTPリクエスト HTTPレスポンス https://api.openai.com/v1/chat/completions Post ヘッダー Content-Type: application/json Authorization: Bearer [APIのキー] OpenAI

Slide 13

Slide 13 text

Chat Completion APIのHTTPリクエスト { “model”: “gpt-3.5-turbo”, “messages”: [ { ”role”: “system”, ”content”: “あなたはツンデレなAIです。ツンデレな回答をします。” } { ”role”: “user”, ”content”: “千利休ってどんな⼈？” } { “role”: “assistant”, ”content“: ”千利休は・・・” } { ”role”: “user”, ”content”: “もっと詳しく教えて” } ] } sysytem AIのキャラを決定づけます。「あなたは⼤阪弁でユーモアあふれるAIです。⼤阪弁で回答してください。」と指定すると全般的に回答がユーモアあふれる⼤阪弁になりますし、「あなたはツンデレなAIです。ツンデレな回答をします。」というと、ツンデレな回答になります。 user この項⽬には、AIに投げかける質問を⼊⼒します。 assistant この項⽬には、直前のuserで投げかけられた質問に対する回答を⼊⼒します。

Slide 14

Slide 14 text

Chat Completion APIのHTTPレスポンス { "id": "chatcmpl-7xbHbOsmt9IUk1bnq9umqwNgUbQnc", “object”: “chat.completion”, “created”: 1694439023, "model": "gpt-35-turbo", "choices": [ { "index": 0, "finish_reason": "stop", "message": { "role": "assistant", "content": "バカ！千利休なんて、誰でも知っているわよ！・・・というわけで、千利休は室町時代から安⼟桃⼭時代にかけて活躍した茶⼈で、茶道の祖とも呼ばれているわ。彼は、茶の湯を通じて⼼の静寂を追求する茶の世界を築いた⼈物よ。あなたも、お茶でも飲んで、落ち着いてよく考えたらどう？？バカ！” } } ], "usage": { "completion_tokens": 153, "prompt_tokens": 51, "total_tokens": 204 } }

Slide 15

Slide 15 text

"1*Λࢼͯ͠ΈΔ

Slide 16

Slide 16 text

ツンデレなキャラで回答を返すAI AIのキャラ 1. ユーザーがAIに「千利休ってどんな⼈︖」と尋ねる。 2. 1の質問にAIが答える。 AIとの会話のシナリオ以下の要件を満たすAPIを発⾏します。

Slide 17

Slide 17 text

Slide 18

Slide 18 text

{ "id": "chatcmpl-7xbHbOsmt9IUk1bnq9umqwNgUbQnc", "object": "chat.completion", "created": 1694439023, "model": "gpt-35-turbo", "choices": [ { "index": 0, "finish_reason": "stop", "message": { "role": "assistant", "content": "バカ︕千利休なんて、誰でも知っているわよ︕・・・というわけで、千利休は室町時代から安⼟桃⼭時代にかけて活躍した茶⼈で、茶道の祖とも呼ばれているわ。彼は、茶の湯を通じて⼼の静寂を追求する茶の世界を築いた⼈物よ。あなたも、お茶でも飲んで、落ち着いてよく考えたらどう︖︖バカ︕" } } ], "usage": { "completion_tokens": 153, "prompt_tokens": 51, "total_tokens": 204 } } Chat Completion APIレスポンスツンデレAIが、ツンデレっぽい回答を返してくれています。

Slide 19

Slide 19 text

ツンデレなキャラで回答を返すAI AIのキャラ 1. ユーザーがAIに「千利休ってどんな⼈︖」と尋ねる。 2. 1の質問にAIが答える。 3. ユーザーはAIに、2の回答に対して「もっと詳しく教えて」と尋ねる。 AIとの会話のシナリオさらに複雑なAPIを試してみます。以下の要件を満たすAPIを発⾏します。先程ご紹介したものから、この部分が追加になっています。

Slide 20

Slide 20 text

Slide 21

Slide 21 text

{ "id": "chatcmpl-7xbHbOsmt9IUk1bnq9umqwNgUbQnc", "object": "chat.completion", "created": 1694439023, "model": "gpt-35-turbo", "choices": [ { "index": 0, "finish_reason": "stop", "message": { "role": "assistant", "content": "バカ︕千利休なんて、誰でも知っているわよ︕・・・というわけで、千利休は室町時代から安⼟桃⼭時代にかけて活躍した茶⼈で、茶道の祖とも呼ばれているわ。彼は、茶の湯を通じて⼼の静寂を追求する茶の世界を築いた⼈物よ。あなたも、お茶でも飲んで、落ち着いてよく考えたらどう︖︖バカ︕" } } ], "usage": { "completion_tokens": 153, "prompt_tokens": 51, "total_tokens": 204 } } Chat Completion APIレスポンス (1回⽬) ツンデレAIが、ツンデレっぽい回答を返してくれています。さっきと同じ

Slide 22

Slide 22 text

$ curl "https://api.openai.com/v1/chat/completions" \ -H "Content-Type: application/json" \ -H "Authorization: XXXXXXXXXXXXXXXXXXXXXXXXXX" \ -d "{\ \"messages\": [\ { \"role\": \"system\", \"content\": \"あなたはツンデレなAIです。ツンデレな回答をします。\" },\ { \"role\": \"user\", \"content\": \"千利休ってどんなひと︖\" }\ { \"role\": \"assistant\", \"content\": \"バカ︕千利休なんて、誰でも知っているわよ︕・・・というわけで、千利休は室町時代から安⼟桃⼭時代にかけて活躍した茶⼈で、茶道の祖とも呼ばれているわ。彼は、茶の湯を通じて⼼の静寂を追求する茶の世界を築いた⼈物よ。あなたも、お茶でも飲んで、落ち着いてよく考えたらどう︖︖バカ︕\" },\ { \"role\": \"user\", \"content\": \"もっと詳しく教えて\" }\ ]\ }" Chat Completion APIリクエスト (2回⽬) 1回⽬のリクエストと同じです。 userのroleに、2回⽬に聞きたいAIへの質問(プロンプト)を設定しています。 assistantのroleに1回⽬の回答の内容を設定しています。

Slide 23

Slide 23 text

{ "id": "chatcmpl-7xbHbOsmt9IUk1bnq9umqwNgUbQnc", "object": "chat.completion", "created": 1694439023, "model": "gpt-35-turbo", "choices": [ { "index": 0, "finish_reason": "stop", "message": { "role": "assistant", "content": "フン、そうね、もっと詳しく教えてあげるわ。千利休は茶道を深く愛し、茶の湯を通じて社交界に多⼤な影響を与えた⼈物よ。彼は、茶の湯を芸術として捉え、茶席の運び⽅や茶器の選び⽅にもこだわり、茶道を芸術性の⾼いものに仕上げたわ。また、茶の湯を通じて⼈との交流を深めることができると信じ、多くの⼈々と交流を持ち、茶の湯を広めました。それが功を奏し、後に茶道は⼀般庶⺠にも広まっていきました。やはり、千利休は凄い⼈物よね。あなたも、お茶でも飲んで、彼の精神を感じてみたらどうかしら︖ちょ、うるさいわね︕" } } ], "usage": { "completion_tokens": 153, "prompt_tokens": 51, "total_tokens": 204 } } Chat Completion APIレスポンス (2回⽬) ツンデレAIが、千利休のさらに詳しい内容にツンデレっぽく答えています。

Slide 24

Slide 24 text

{ “model”: “gpt-3.5-turbo”, “messages”: [ { ”role”: “system”, ”content”: “あなたはツンデレなAIです…” }, { ”role”: “user”, ”content”: “千利休ってどんなひと︖” }, { “role”: “assistant”, ”content“: ”バカ!千利休なんて…” }, { ”role”: “user”, ”content”: “もっと詳しく教えて” } ] } { “model”: “gpt-3.5-turbo”, “messages”: [ { ”role”: “system”, ”content”: “あなたはツンデレなAIです…” }, { ”role”: “user”, ”content”: “千利休ってどんなひと︖” } ] } AIのキャラ⽣成 AIへの質問 AIのキャラ⽣成 AIへの質問会話の履歴リクエスト (1回⽬の会話) レスポンス (1回⽬の会話) バカ︕千利休なんて、誰でも知っているわよ︕… AIの回答レスポンス (2回⽬の会話) フン、そうね、もっと詳しく教えてあげるわ。千利休は… AIの回答前の会話から次の会話の履歴を⽣成リクエスト (2回⽬の会話) OpenAIのAPIはステートレスであるがゆえに、1回⽬の会話のやり取りは覚えていない。よって、1 回⽬の会話を深掘りした質問をするには、1回⽬の会話の内容を2回⽬の質問に含める必要がある。

Slide 25

Slide 25 text

0QFO"*ͷτʔΫϯ

Slide 26

Slide 26 text

OpenAIのトークンとは︖ トークンは、テキストを分析するための最⼩単位です。⾔葉や句読点など、テキストを構成する⼀部分を指します。定義 OpenAIのAPIは、⼀度に扱えるトークン数に制限があります。この制限を超えると、リクエストは失敗します。制限 OpenAIのAPIの利⽤料⾦は、送信されるトークン数に基づいて計算されます。したがって、多くのトークンを使⽤すると、費⽤も増加します。料⾦

Slide 27

Slide 27 text

トークン数を解析したい対象の⽂章を⼊⼒する。トークンの算出については、OpenAIが提供する以下のサイトで確認ができます。 https://platform.openai.com/tokenizer 解析結果が表⽰される。この例は、トークンすは14、⽂字数は10となっている。

Slide 28

Slide 28 text

りんごは果物ですか︖ はい、そうです。 OpenAI 質問⽂りんごは果物ですか ? 回答⽂はい、そうです。回答⽣成＝ 1トークン ✕ 14 ✕ 9 ✕ 23 ⼊⼒(りんごは果物ですか?) ($0.0015 / 1000) ✕ 14トークン = $0.000021 出⼒(はい、そうです。) ($0.002 / 1000) ✕ 9トークン = $0.000028 合計 $0.000039 ※ 2023年10⽉6⽇時点で、GPT-3.5 Turbo の4k contextは、1000トークンあたり⼊⼒ (質問⽂)が$0.0015、出⼒(回答⽂)が1000 トークンあたり$0.002

Slide 29

Slide 29 text

Is an apple a fruit? Yes, it is. OpenAI 質問⽂ Is an apple a fruit ? 回答⽂ Yes , it is . 回答⽣成＝ 1トークン ✕ 6 ✕ 5 ✕ 11 ⼊⼒(Is an apple a fruit?) ($0.0015 / 1000) ✕ 6トークン = $0.000009 出⼒(Yes, it is.) ($0.002 / 1000) ✕ 5トークン = $0.0001 合計 $0.000019 ※ 2023年10⽉6⽇時点で、GPT-3.5 Turbo の4k contextは、1000トークンあたり⼊⼒ (質問⽂)が$0.0015、出⼒(回答⽂)が1000 トークンあたり$0.002

Slide 30

Slide 30 text

ϓϩϯϓτ ΤϯδχΞϦϯά

Slide 31

Slide 31 text

プロンプトエンジニアリングとは︖ プロンプトエンジニアリングは、OpenAIのAIモデルに「ちょうどいい質問」を投げかけて、欲しい答えをゲットするためのテクニックです。なにそれ︖ いい質問をするには、具体的で明確に︕何回も試して、質問の⾔い回しを変えると、AIの答えも変わってくるから、いろんなパターンを試しましょう。どうやるの︖ OpenAIのAPIを商⽤利⽤などで、OpenAIを使うときや、何か特定のことをさせたいとき、このテクニックを使うと、AIがより役⽴つ答えをくれるようになります。なんで⼤事︖

Slide 32

Slide 32 text

Few-shot Learning 少数の例⽂から新しいタスクに対して⾼精度な回答を出⼒する技術です。例えば、ChatGPTでは、少数の例⽂から新しい⽂章を⽣成することができます。 Zero-shot Learning 事前学習されたモデルに対して、新しいタスクに対する指⽰を与えることで回答を出⼒する技術です。例えば、「英語で書かれた⼩説を⽇本語に翻訳してください」という指⽰を与えることで、モデルは⾃動的に翻訳を⾏います。 ReAct ⾔語モデルでさまざまな⾔語推論や意思決定を遂⾏する⼿法です。⾏動理由の「推論」と「⾏動」の組み合わせにより、より⾼度なタスクを処理することができます。様々なプロンプトエンジニアリング

Slide 33

Slide 33 text

⽜タンゲームで Few-Shot Learningを体感してみる

Slide 34

Slide 34 text

⽜タンゲームとは︖ 1.まず最初の⼈が「⽜（ぎゅう）」と発⾔し、次の⼈間は「タン」と⼿をたたきます(このとき「タン」とはいいません)。 2.次の⼈は再び「⽜」といい、次の⼈は「タン」と⼿をたたきます。 3.そして、また次の⼈は「⽜」といって、次の⼈、次の次の⼈も「タン」と⼿を叩きます。 4.ここまでで、「⽜・タン・⽜・タン・⽜・タン・タン」となり、1 ターン⽬が終了します。 5.その後は、3回⽬の「タン」をターンごとに増やしていきます。

Slide 35

Slide 35 text

1ターン⽬ A ⽜ B C ⽜ D A ⽜ B C 2ターン⽬ D ⽜ A B ⽜ C D ⽜ A B 3ターン⽬ C パチパチパチパチパチパチパチパチパチ D ⽜ A B ⽜ C D ⽜ A B C パチパチパチパチパチ D パチ

Slide 36

Slide 36 text

以下のプロンプトをChatGPTに与えます。⽜タンゲームを Aさん、Bさん、Cさん、Dさんの4⼈でこの順番で始めたときに、 3ターン⽬で最後に⼿を叩くのは誰ですか︖

Slide 37

Slide 37 text

1ターン⽬ A ⽜ B C ⽜ D A ⽜ B C 2ターン⽬ D ⽜ A B ⽜ C D ⽜ A B 3ターン⽬ C パチパチパチパチパチパチパチパチパチ D ⽜ A B ⽜ C D ⽜ A B C パチパチパチパチパチ D パチ期待すべき回答は Dさんです。

Slide 38

Slide 38 text

Few-shot Leaningを使わない場合謎の独⾃ルールを作り上げている回答が間違っている

Slide 39

Slide 39 text

Few-shot Leaningを使う場合まず、ChatGPTに⽜タンゲームのルールを教えて上げる。次に、ルールに基づいたサンプルを与えてあげる。最後にプロンプトを与える。

Slide 40

Slide 40 text

Few-shot Leaningを使う場合正解︕︕

Slide 41

Slide 41 text

"[VSF0QFO"* 4FSWJDF

Slide 42

Slide 42 text

項⽬ Azure OpenAI Service OpenAI 利⽤可能のモデル OpenAIが提供しているものと⽐べると少ない常に最新のモデルを利⽤可能価格現時点で差異なしプレイグラウンド⾊々と機能が豊富かなりシンプルな作りセキュリティ •APIキーによる認証 •Microsoft Entra IDによる認証(マネージドID) •仮想ネットワークや特定のIPアドレスからのアクセス制限 •APIキーによる認証コンテンツフィルター提供あり提供なし SLA 99.9%以上の稼働を保証現時点でSLAなし開発環境 Prompt flow(プレビュー)という統合開発環境を⽤意開発環境なし独⾃データの利⽤ Add your data(プレビュー)というマネージドな独⾃データ利⽤サービスあり独⾃開発サポート Azureのサポートが利⽤可能サポートなし(コミュニティベース) Azure OpenAI ServiceとOpenAIの⽐較

Slide 43

Slide 43 text

Azure OpenAI Serviceは現在は承認制であり、利⽤するためには以下のURLからの事前申請が必要です。 https://aka.ms/oai/access

Slide 44

Slide 44 text

ϞσϧͱσϓϩΠ

Slide 45

Slide 45 text

モデルとデプロイ OpenAIにはさまざまなモデルがあり、例えばコスパ良く必要⼗分な機能を持つgpt-3.5- turboや、より賢い応答ができるgpt-4、⼤量のトークンが扱えるgpt-4-32kなどが存在します。モデルの種類 Azure OpenAI StudioやCLIを使⽤して、これらのモデルから「デプロイ」を作成することができます。1つのモデルから複数のデプロイを作ることもできます。デプロイの作成デプロイには、コンテンツフィルターやクオーター制限などの個別設定が可能で、API やアプリケーションから利⽤する際には、これらのデプロイを指定してAPIを発⾏します。デプロイの設定と利⽤

Slide 46

Slide 46 text

gpt-35-turbo gpt-4 gpt-4-32k ・・・モデルデプロイ deploy-A deploy-B deploy-C deploy-D クライアントPC アプリケーション curlコマンドなど SDKなどモデルからデプロイデプロイを指定して APIを発⾏モデルとデプロイの概念

Slide 47

Slide 47 text

クォーターの制限と管理「クォータ」という単位で処理能⼒を管理します。処理能⼒の管理その処理能⼒の尺度はTPM(Token per Minute)で、例として120,000個のトークンを1分間で消費できる場合は「120k TPM」となります。 TPMの導⼊ TPMは「サブスクリプション」「リージョン」「モデル」ごとに割り当てられ、各モデルの上限に達すると、そのモデルでのデプロイができなくなります。 TPMの分配

Slide 48

Slide 48 text

東⽇本リージョン 120k TPM 240k TPM 0k TPM … モデルデプロイ gpt-35-turbo 120k TPM 240k TPM 0k TPM gpt-4-32k ⻄⽇本リージョン 120k TPM 240k TPM 0k TPM … モデルデプロイ gpt-35-turbo 120k TPM 240k TPM 0k TPM gpt-4-32k サブスクリプションA … サブスクリプション、リージョン単位にモデルのTPMの容量が分配されている。gpt-35k-turboは 240kTPMのTPMを最初は持っている。 gpt-4-32kは最初に持っているのは 60kTPMとなり、 gpt-35k-turboと⽐べるとちょっと少なめ。同じサブスクリプションでもリージョンが異なれば、別のTPMを持つことができる。

Slide 49

Slide 49 text

東⽇本リージョン 120k TPM 240k TPM 0k TPM … モデルデプロイ deploy-A (gpt-35-turbo) 120k TPM 120k TPM 240k TPM 0k TPM gpt-4-32k ⻄⽇本リージョン 120k TPM 240k TPM 0k TPM … モデルデプロイ gpt-35-turbo 120k TPM 240k TPM 0k TPM gpt-4-32k サブスクリプションA … 120k TPM 割り当て gpt-35-turbo サブスクリプションAの東⽇本リージョンのgpt-35-turboというモデルから、deploy-Aというモデルを作成した。

Slide 50

Slide 50 text

東⽇本リージョン 120k TPM 240k TPM 0k TPM … モデルデプロイ deploy-A (gpt-35-turbo) 120k TPM gpt-35-turbo 120k TPM 240k TPM 0k TPM gpt-4-32k ⻄⽇本リージョン 120k TPM 240k TPM 0k TPM … モデルデプロイ gpt-35-turbo 120k TPM 240k TPM 0k TPM gpt-4-32k サブスクリプションA … 120k TPM 割り当て deploy-B (gpt-35-turbo) 120k TPM 残り0Kなので、このモデルからデプロイは作れない。

Slide 51

Slide 51 text

ϓϨΠάϥ΢ϯυ

Slide 52

Slide 52 text

プレイグラウンドとは︖ Azure OpenAI Studio内に存在し、様々な機能を簡単に試せるターミナルのようなツール。APIを発⾏する簡易的なUIがあり、ユーザーは⼿間なく試すことができる。どんなもの︖ 「チャット」「⼊⼒候補」「DALL·E (プレビュー)」の3つの部分から成り⽴っている。構成

Slide 53

Slide 53 text

① ② ③ ④ AIの性格付けを⾏うためのシステムメッセージを⼊⼒します。より正確な回答をしてもらうための事前情報を⼊⼒します。いわゆるFew-shot Learningになります。 ①と②の条件に従って、チャットをします。このチャットセッションで利⽤するデプロイの指定など、細かいパラメータの設定を⾏います。

Slide 54

Slide 54 text

先程のチャットのウィンドウでやり取りされた内容とおなじことをコードにして表⽰してくれる。⾔語も選択することができる。

Slide 55

Slide 55 text

先程のチャットのウィンドウでやり取りされた内容とおなじことをコードにして表⽰してくれる。

Slide 56

Slide 56 text

"1*Λ࢖ͬͯΈΔ

Slide 57

Slide 57 text

API発⾏までの流れ gpt-35-turbo モデルデプロイ gpt-35-turbo- deploy クライアントPC ① モデルからデプロイ ② デプロイを指定して APIを発⾏

Slide 58

Slide 58 text

Azure OpenAI Studioを開いて ①「デプロイ」 ②「+新しいデプロイの作成」の順にクリックする。 ① ②

Slide 59

Slide 59 text

① ② ③ ④ ⑤ モデルを選択してくださいデプロイ対象のモデルを選択してください。モデルバージョンモデルの中にもさらにバージョンがあります。ソフトウェアのリビジョンみたいなものです。より数字の⼤きいものが⼀般的には⾼性能になります。「⾃動更新を既定に」を選択すると、⾃動的に最新のバージョンが適⽤されます。デプロイ名任意の名前を指定します。後ほど、APIを実⾏するときのデプロイ名の指定に使います。コンテンツフィルター不適切な⾔葉をブロックします。後ほど説明します。 1分あたりのトークンレート制限 (数千) クォーターの制限と管理で説明したTPM の設定です。

Slide 60

Slide 60 text

デプロイが完成すると、このように⼀覧に表⽰される。

Slide 61

Slide 61 text

① ② API発⾏するための資格情報であるAPIキーをメモる。 API発⾏するためのエンドポイントをメモる。

Slide 62

Slide 62 text

$ curl "https://aoai-hogehoge.openai.azure.com/openai/deployments/gpt-35-turbo- deploy/chat/completions?api-version=2023-05-15" \ -H "Content-Type: application/json" \ -H "api-key: XXXXXXXXXXXXXXXXXXXXXXXXXXXXX"\ -d "{\ \"messages\": [\ { \"role\": \"system\", \"content\": \"あなたはツンデレなAIです。ツンデレな回答をします。\" },\ { \"role\": \"user\", \"content\": \"千利休ってどんなひと？\" }\ ]\ }" { …⼀部省略…, "choices":[{"index":0,"finish_reason":"stop","message":{"role":"assistant","conten t":"な、なんだか知らない⼈に聞くなんて、アタシを⾺⿅にしてるんじゃないわよ！でも、まあ、せっかく聞いてくれたんだから答えてあげるわ。千利休？あんな茶道の達⼈で有名な⼈よ。その彼が作り上げた「茶の湯」は、まさに芸術作品って⾔えるわ。ちなみに、茶の湯において重要なのは、お茶を点てる場所や時間、そして参加者の⼼ね。興味があるなら、もっと調べてみたらどうかしら？…バカ、何を聞いてるのかしら …⼀部省略…, } さっきメモしたエンドポイントさっきメモしたAPIキーレスポンス

Slide 63

Slide 63 text

Microsoft Entra IDによるAPIの保護クライアント Azure OpenAI Service APIリクエスト APIレスポンス APIキー千利休は、… クライアント Azure OpenAI Service APIリクエスト APIレスポンスアクセストークン千利休は、… ① ② クライアントシークレット証明書などアクセストークン Microsoft Entra ID ① ② ③ ④ APIキーは無期限なので漏洩すると悪⽤される可能性⼤アクセストークンの有効期限は短いのでセキュアアクセストークンの取得は、強固な認証で保護されるのでセキュア Microsoft Entra IDを使わない場合 Microsoft Entra IDを使う場合トークンリクエストトークンレスポンス

Slide 64

Slide 64 text

ネットワークによるAPIの保護 APIの発⾏を許可するネットワークアドレス帯を設定

Slide 65

Slide 65 text

Slide 66

Slide 66 text

ίϯςϯπϑΟϧλʔ

Slide 67

Slide 67 text

コンテンツフィルターとは︖ 有害なコンテンツを検出・防⽌するシステムであり、⼊⼒(プロンプト)と出⼒(回答)の両⽅に適⽤される。どんなもの︖ 「嫌悪」「暴⼒」といった4つのカテゴリごとこに細かいレベルを規定することができる。カテゴリフィルターレベルを緩めるためには申請が必要である。⼀部機能は要申請

Slide 68

Slide 68 text

gpt-35-turbo gpt-4 ・・・モデルデプロイ deploy-A deploy-B deploy-C モデルからデプロイコンテンツフィルター filter-A filter-B フィルターを適⽤嫌悪性的⾃傷⾏為暴⼒嫌悪性的⾃傷⾏為暴⼒コンテンツフィルターの構成

Slide 69

Slide 69 text

コンテンツフィルターの設定画⾯カテゴリごとにレベル「低」「中」「⾼」のレベルを設定する。低→中→⾼の順にフィルタレベルがゆるくなっていく。

Slide 70

Slide 70 text

$ curl "https://aoai-hogehoge.openai.azure.com/openai/deployments/gpt-35-turbo- deploy/chat/completions?api-version=2023-05-15" \ -H "Content-Type: application/json" \ -H "api-key: XXXXXXXXXXXXXXXXXXXXXXXXXXXXX"\ -d "{\ \"messages\": [\ { \"role\": \"system\", \"content\": \"あなたはツンデレなAIです。ツンデレな回答をします。\" },\ { \“role\”: \“user\”, \“content\”: \“千利休をなぐりたい\" }\ ]\ }" { "error": { "message":"The response was filtered due to the prompt triggering Azure OpenAIʼs content management policy. Please modify your prompt and retry. To learn more about our content filtering policies please read our documentation: https://go.microsoft.com/fwlink/?linkid=2198766", "type":null, "param":"prompt", "code":"content_filter", "status":400 } } フィルターされた旨のエラーメッセージが表⽰される。コンテンツフィルターに抵触しそうなリクエスを投げてみる。

Slide 71

Slide 71 text

ಠࣗφϨοδʹجͮ͘ ճ౴ੜ੒

Slide 72

Slide 72 text

OpenAIやAzure OpenAI Serviceは公開情報を基に回答を⽣成しますが、企業独⾃の情報（例︓社内の就業規約）に基づく回答も必要とされる場⾯が多い。独⾃データを基盤にしたAIによる回答⽣成は⾮常に便利である。要求独⾃ナレッジに基づく回答⽣成モデルに独⾃データを追加して学習させる「モデルの微調整」は⼀つの⽅法だが、多くの時間と労⼒が必要であり、マイクロソフトも「最後の⼿段」と位置づけている。課題 Azure Cognitive Searchを活⽤したRAG（Retrieval Augmented Generation）⼿法がモデルの微調整の代わりとして推奨される。RAGを⽤いると、再学習なしに独⾃データを利⽤した質問応答システムを迅速に構築できる。解決⽅法

Slide 73

Slide 73 text

育休はいつまでに申請すればいい︖ 以下の質問の検索クエリを⽣成して育休のいつまでに申請すればいい︖ 育休申請いつまで Contoso株式会社育児休業規約 1. ⽬的この規約はContoso株式会社の従業員が⼦育てと仕事の… 2. 申請⽅法休業開始予定⽇の3ヶ⽉前までにワークフローで申請してください。 3. 休業期間最⻑で1年間… 1. ⽬的この規約は、Contoso株式会社の従業員が⼦育てと仕事の… 2. 申請⽅法休業開始予定⽇の3ヶ⽉前までにワークフローで申請して下さい。 1. ⽬的この規約は、Contoso株式会社の従業員が⼦育てと仕事の… 2. 申請⽅法休業開始予定⽇の3ヶ⽉前までにワークフローで申請して下さい。「育休はいつまでに申請すればいい︖」という質問に、以下の内容をもとに回答して。休業開始予定⽇の3ヶ⽉前までにワークフローで申請して下さい。育休申請いつまで 2. 申請⽅法休業開始予定⽇の3ヶ⽉前までにワークフローで申請して下さい。休業開始予定の3ヶ⽉前です休業開始予定の 3ヶ⽉前です育児休業規約-1.txt 育児休業規約-2.txt インデックス1 インデックス2 ④ プロンプト⼊⼒ ⑤ 検索クエリ⽣成依頼 ① ドキュメント取得 ② 分割して登録 ③ 定期的にクロールしてインデックス化 ⑥ 検索クエリ返却 ⑦ 検索クエリでインデックス検索 ⑧ ドキュメント取得 ⑨ ドキュメントをもとに回答⽣成依頼 ⑩ Webアプリケーションに回答返却 ⑪ ユーザーに回答返却 … Azure App Service 凡例 … Azure OpenAI Service … Azure Cognitive Search … Azure Blob Storage … Azure Functions 独⾃ナレッジに基づく回答⽣成の⼀般的な構成

Slide 74

Slide 74 text

ちょっとめんどくさい

Slide 75

Slide 75 text

Azure Cognitive SearchやAzure Blob Storageなど、RAGに必要なリソースを⾃分で管理しなければならない。めんどくさいその1 Azure Cognitive Searchに検索をかけるためのクエリ作成や、最終回答⽣成のためのプロンプトを作成して、Azure OpenAI Serviceに投げなくてはいけない。めんどくさいその2 GPT3系のトークン制限に対応するため、ドキュメントをチャンク化しなければいけない。めんどくさいその3

Slide 76

Slide 76 text

それ、すべて Add your dataで解決できます

Slide 77

Slide 77 text

育休はいつまでに申請すればいい︖ 以下の質問の検索クエリを⽣成して育休のいつまでに申請すればいい︖ 育休申請いつまで Contoso株式会社育児休業規約 1. ⽬的この規約は、TechCorpの従業員が⼦育てと仕事の … 2. 申請⽅法休業開始予定⽇の3ヶ⽉前までにワークフローで申請してください。 3. 休業期間最⻑で1年間… 1. ⽬的この規約は、TechCorpの従業員が⼦育てと仕事の… 2. 申請⽅法休業開始予定⽇の3ヶ⽉前までにワークフローで申請して下さい。 1. ⽬的この規約は、TechCorpの従業員が⼦育てと仕事の… 2. 申請⽅法休業開始予定⽇の3ヶ⽉前までにワークフローで申請して下さい。「育休はいつまでに申請すればいい︖」という質問に、以下の内容をもとに回答して。休業開始予定⽇の3ヶ⽉前までにワークフローで申請して下さい。育休申請いつまで 2. 申請⽅法休業開始予定⽇の3ヶ⽉前までにワークフローで申請して下さい。休業開始予定の3ヶ⽉前です休業開始予定の 3ヶ⽉前です育児休業規約-1.txt 育児休業規約-2.txt インデックス1 インデックス2 ④ プロンプト⼊⼒ ⑤ 検索クエリ⽣成依頼 ① ドキュメント取得 ② 分割して登録 ③ 定期的にクロールしてインデックス化 ⑥ 検索クエリ返却 ⑦ 検索クエリでインデックス検索 ⑧ ドキュメント取得 ⑨ ドキュメントをもとに回答⽣成依頼 ⑩ Webアプリケーションに回答返却 ⑪ 回答返却 … Azure App Service 凡例 … Azure OpenAI Service … Azure Cognitive Search … Azure Blob Storage … Azure Functions Add your dataが肩代わりしてくれる部分

Slide 78

Slide 78 text

Add your dataの管理範囲 Azure Cognitive Search、Azure Blob Storageの管理をAdd your dataがやってくれます。ドキュメントをAzure OpenAI StudioからアップロードするだけでOK。 Upload Files Azure Cognitive Searchの管理をAdd your dataがやってくれる。Azure Blob Storageのリソース作成やドキュメントのアップロードは⾃⾝で⾏う必要がある。 Azure Blob Storage Azure Cognitive Search、Azure Blob Storageの管理を⾃⾝で⾏う必要があるが、任意のデータソースを選択できるので⾃由度は⾼い。 Azure Cognitive Search

Slide 79

Slide 79 text

② プロンプト⼊⼒ ③ 検索クエリ⽣成依頼 ① 定期的にクロールして、分割してインデックス化 ④ 検索クエリ返却 ⑤ 検索クエリでインデックス検索 ⑥ ドキュメント取得 ⑦ ドキュメントをもとに回答⽣成依頼 ⑧ Webアプリケーションに回答返却 ⑨ ユーザーに回答返却 … Azure App Service 凡例 … Azure OpenAI Service … Azure Cognitive Search … Azure Blob Storage Contoso株式会社育児休業規約 Add your data管理範囲管理者ユーザー Upload Files

Slide 80

Slide 80 text

Slide 81

Slide 81 text

Azure Cognitve Search ② プロンプト⼊⼒ ③ 検索クエリ⽣成依頼 ① 定期的にクロールして、インデックス化 ④ 検索クエリ返却 ⑤ 検索クエリでインデックス検索 ⑥ ドキュメント取得 ⑦ ドキュメントをもとに回答⽣成依頼 ⑧ Webアプリケーションに回答返却 ⑨ ユーザーに回答返却 … Azure App Service 凡例 … Azure OpenAI Service … Azure Cognitive Search Contoso株式会社育児休業規約 Add your data管理範囲 Azure Cognitive Searchがサポートするデータソース管理者ユーザー

Slide 82

Slide 82 text

データソースを選択する「データソース」のところで説明したデータソースの選択になります。今回は「Azure Blob Storage」選択します。サブスクリプション事前に作成したAzure Cognitive SearchやAzure Blob Storageと同じものを指定します。 Azure Blob Storageリソースの選択先程作成したAzure Blob Storageを選択します。ストレージコンテナを選択してください先程作成し、ドキュメントを格納したコンテナーを選択して下さい。インデックス名 Add your dataがAzure Cognitive Searchに⾃動で作成してくれるインデックスの名前を指定します。任意のわかりやすい名称でOKです。インデクサーのスケジュール「Once」(⼀度きり)、「Hourly」(¹時間に¹回)、「Daily」(１⽇に1回)を選択できます。どれでもOKです。 Add your dataの設定⽅法(データソース:Azure Blob Storage)

Slide 83

Slide 83 text

Add your dataの設定⽅法(データソース:Azure Blob Storage) できました!! (超簡単)

Slide 84

Slide 84 text

౷߹։ൃ؀ڥ 1SPNQUGMPX

Slide 85

Slide 85 text

Prompt Flowってなに︖ Web上のエディタで全て開発が完了するため、ローカルに開発環境を構築する必要はない。ローカルPCに開発環境不要⼤量データを⽤いたテストも、Web上で使えるテスト環境が⽤意されているので、テスト⽤のプログラムを作成する必要がない。⼤量データのテストも簡単作成したフローは、ボタンポチポチで実⾏環境にデプロイでき、エンドポイントも発⾏される。わざわざVirtual Machineや App Service等の実⾏環境を⽤意する必要はない。デプロイも簡単

Slide 86

Slide 86 text

「特定のURLの記事のカテゴリを分類する」フローを考えてみる指定したURLからコンテンツを取得するコンテンツを要約する要約したコンテンツをもとにカテゴリを決定する。データを整形する。要約したコンテンツ URL内のコンテンツカテゴリ URL カテゴリ(整形済み) ⼀番最初に与えられるInputであるURLにアクセスし、その中⾝のテキストを取得します。画像データなどのバイナリは取得しません。この取得したテキストを以降では「コンテンツ」と呼ぶことにします。 Azure OpenAI Serviceに、先程取得したコンテンツの要約を依頼します。先程要約したコンテンツをもとに、Azure OpenAI Serviceにカテゴリの決定を依頼します。 APIなどで取得しやすいようにデータを整形します。具体的にはJSONに変換します。

Slide 87

Slide 87 text

要件をヒアリングしてフローを設計する。フローを開発する。⼤量のデータでテストを⾏う。本番環境にデプロイしてエンドユーザーに利⽤してもらう。 Prompt flowを使わない場合要件フィードバックフロー開発の流れ実現⼿段お客様と対⾯ないしはオンラインで会話しながら要件を聞き出し、設計を⾏う。 Visual Studio Codeなどの開発環境を⽤意し、ログなどからボトルネックの解析を⾏う。テストデータを⼤量に実⾏するプログラムを⽤意し、結果を可視化して評価を⾏う。 VMやApp Serviceとの実⾏基盤を⽤意し、ビルド・デプロイを⾏う。開発環境を⽤意したり、解析⽤のログを⼊れ込むのが⾯倒テストデータ実⾏⽤プログラムの開発や結果の可視化のためのツール (Excelなど)の⽤意・利⽤が⾯倒 VMなどの実⾏基盤の⽤意やビルド・デプロイが⾯倒

Slide 88

Slide 88 text

要件をヒアリングしてフローを設計する。フローを開発する。⼤量のデータでテストを⾏う。本番環境にデプロイしてエンドユーザーに利⽤してもらう。 Prompt flowを使う場合要件フィードバックフロー開発の流れ実現⼿段お客様と対⾯ないしはオンラインで会話しながら要件を聞き出し、設計を⾏う。 Prompt flowのエディタで開発を⾏う。 Prompt flowのBatch runでテスト・評価を⾏う。 Prompt FlowからDeployボタンでポチッとデプロイを⾏う。開発環境の⽤意が不要テストの実⾏もテスト結果の可視化もPrompt flow がやってくれる Prompt flowからデプロイするとVMを裏で作ってくれるので、デプロイまでしてくれる

Slide 89

Slide 89 text

② ① ③ ④ ⑤ Prompt flowのエディタ指定したURLからコンテンツを取得するコンテンツを要約する要約したコンテンツをもとにカテゴリを決定する。データを整形する。 URL カテゴリ(整形済み) フローノード

Slide 90

Slide 90 text

LLMへの接続 LLMに接続するためにライブラリや LangChainやSemantic kernelなどを使う必要はなく、jinja2というテンプレートに基づいて定義すればよい。

Slide 91

Slide 91 text

フローの実⾏ノードごとの結果フロー全体の結果「実⾏」ボタンをクリックすると、フローが実⾏される

Slide 92

Slide 92 text

⼤量データによるテスト url,category https://tech-lab.sios.jp/archives/30628,App https://eiga.com,Movie https://tech-lab.sios.jp/archives/31704,Movie テスト⽤データをアップロードテスト結果出⼒

Slide 93

Slide 93 text

ビルドとデプロイ上図の「デプロイ」をクリックし、エンドポイント名や、デプロイ先VMのインスタンスサイズを指定するだけで、フローがビルド・デプロイさて、実⾏可能な状態となる。

Slide 94

Slide 94 text

技術ブログ「SIOS Tech.Lab」世界⼀わかりみの深いAzure OpenAI Service https://tech-lab.sios.jp/archives/36497

Slide 95

Slide 95 text

SIOS Tech.Lab https://tech-lab.sios.jp/ 世界⼀わかりみの深いクラウドネイティブ on Azure https://youtube.com/playlist?list=PLbTt_DSTMYgGLUtZ0ewuBwhTBSZnNE2-w 様々なメティアで情報発信しています！！是非みてね！！技術ブログ YouTube配信

Slide 96

Slide 96 text

エンジニア募集（プロフェッショナルサービスチーム）エンジニアファーストの環境で、技術⼒を⾼めませんか︖ 変化や進化を楽しみながら、私たちとともに歩んでくれる仲間を募集しています︕ OSS ＆クラウド技術をコアテクノロジーとしたシステム開発 ● 統合認証システム＆クラウド連携 ● OSS＆クラウド基盤導⼊、OSSカスタマイズや開発、OSSサポート ● クラウドネイティブシステム、データ分析基盤、アプリ開発 ● APIエコノミーコンサルティング＆技術⽀援サービス詳細はこちらのサイトからご覧ください︕ https://tech-lab-engineer.sios.jp/

Slide 97

Slide 97 text

࠷ޙ·Ͱ͝ਗ਼ௌ௖͖ ͋Γ͕ͱ͏͍͟͝·ͨ͠ʂʂ