世界一わかりみの深いAzure OpenAI Service/wakarimiaoai

Noriyuki TAKEI ෢Ҫ ٓߦ Information • サイオステクノロジー株式会社 • Microsoft MVP
for Microsoft Azure Favorites • Azure • パデル • スキー • ライブ配信 • ⽢いもの • ⾛ること blog https://tech-lab.sios.jp/ core skill Azureによるクラウドネイティブなアプリ開発 Twitter @noriyukitakei

技術ブログ「SIOS Tech.Lab」世界⼀わかりみの深いAzure OpenAI Service https://tech-lab.sios.jp/archives/36497

"[VSF0QFO"* 4FSWJDF ͷ ֓ཁ

Azure OpenAI Service エンタープライズ向けの OpenAI 99.9%以上の稼働(SLA)を保証 APIキーによる認証に加え、トークンベースの認証などの強固なセキュリティをサポートマイクロソフトのサポートが利⽤可能

0QFO"*ͱ͸ʁ

OpenAIという企業が提供している SaaSベースのAPIサービスであり、サービスの内容は⽣成AI である OpenAIとは︖

認識AIから⽣成AIへ写真の中の物や動物を特定する画像認識や、話された⾔葉を⽂字に変換する⾳声認識などを⾏う。認識AI 新しい情報やデータを⽣成する能⼒を持ったAIのことを指す。例えば「千利休ってどんな⼈︖」という質問に答えを⽣成したり、指定された条件に基づいて画像を⽣成するなど。⽣成AI

代表的な⽣成AIであるChatGPT プロンプト回答

画像を⽣成するAIであるDALL·E プロンプト回答

OpenAI ⽂章⽣成AI GPT-3 GPT-4 OpenAIは以下の⽣成AIをAPIで提供します。画像⽣成AI dalle-2 ⽂字起こしAI Whisper

代表的なOpenAIのAPIであるChat Completion API アプリケーション URL ボディメソッド { “model”: “gpt-3.5-turbo”,
“messages”: [ { ”role”: “system”, ”content”: “あなたは優秀なAIです。” } { ”role”: “user”, ”content”: “千利休ってどんな⼈︖” } { “role”: “assistant”, ”content“: ”千利休は・・・” } { ”role”: “user”, ”content”: “もっと詳しく教えて” } ] } ボディ { … “choices”: [ “index”: 0, “message”: { “role”: “assistant”, “content”: “千利休の詳細は、、、” }, … } HTTPリクエスト HTTPレスポンス https://api.openai.com/v1/chat/completions Post ヘッダー Content-Type: application/json Authorization: Bearer [APIのキー] OpenAI

Chat Completion APIのHTTPリクエスト { “model”: “gpt-3.5-turbo”, “messages”: [ { ”role”:
“system”, ”content”: “あなたはツンデレなAIです。ツンデレな回答をします。” } { ”role”: “user”, ”content”: “千利休ってどんな⼈？” } { “role”: “assistant”, ”content“: ”千利休は・・・” } { ”role”: “user”, ”content”: “もっと詳しく教えて” } ] } sysytem AIのキャラを決定づけます。「あなたは⼤阪弁でユーモアあふれるAIです。⼤阪弁で回答してください。」と指定すると全般的に回答がユーモアあふれる⼤阪弁になりますし、「あなたはツンデレなAIです。ツンデレな回答をします。」というと、ツンデレな回答になります。 user この項⽬には、AIに投げかける質問を⼊⼒します。 assistant この項⽬には、直前のuserで投げかけられた質問に対する回答を⼊⼒します。

Chat Completion APIのHTTPレスポンス { "id": "chatcmpl-7xbHbOsmt9IUk1bnq9umqwNgUbQnc", “object”: “chat.completion”, “created”: 1694439023,
"model": "gpt-35-turbo", "choices": [ { "index": 0, "finish_reason": "stop", "message": { "role": "assistant", "content": "バカ！千利休なんて、誰でも知っているわよ！・・・というわけで、千利休は室町時代から安⼟桃⼭時代にかけて活躍した茶⼈で、茶道の祖とも呼ばれているわ。彼は、茶の湯を通じて⼼の静寂を追求する茶の世界を築いた⼈物よ。あなたも、お茶でも飲んで、落ち着いてよく考えたらどう？？バカ！” } } ], "usage": { "completion_tokens": 153, "prompt_tokens": 51, "total_tokens": 204 } }

"1*Λࢼͯ͠ΈΔ

ツンデレなキャラで回答を返すAI AIのキャラ 1. ユーザーがAIに「千利休ってどんな⼈︖」と尋ねる。 2. 1の質問にAIが答える。 AIとの会話のシナリオ以下の要件を満たすAPIを発⾏します。

$ curl "https://api.openai.com/v1/chat/completions" \ -H "Content-Type: application/json" \ -H "Authorization:
XXXXXXXXXXXXXXXXXXXXXXXXXX" \ -d "{\ \"messages\": [\ { \"role\": \"system\", \"content\": \"あなたはツンデレなAIです。ツンデレな回答をします。\" },\ { \"role\": \"user\", \"content\": \"千利休ってどんなひと︖\" }\ ]\ }" Chat Completion APIリクエスト systemのroleにAIのキャラ設定をしています。ツンデレAIとして振る舞わせます。 userのroleにAIへの質問(プロンプト)を設定しています。

{ "id": "chatcmpl-7xbHbOsmt9IUk1bnq9umqwNgUbQnc", "object": "chat.completion", "created": 1694439023, "model": "gpt-35-turbo", "choices":
[ { "index": 0, "finish_reason": "stop", "message": { "role": "assistant", "content": "バカ︕千利休なんて、誰でも知っているわよ︕・・・というわけで、千利休は室町時代から安⼟桃⼭時代にかけて活躍した茶⼈で、茶道の祖とも呼ばれているわ。彼は、茶の湯を通じて⼼の静寂を追求する茶の世界を築いた⼈物よ。あなたも、お茶でも飲んで、落ち着いてよく考えたらどう︖︖バカ︕" } } ], "usage": { "completion_tokens": 153, "prompt_tokens": 51, "total_tokens": 204 } } Chat Completion APIレスポンスツンデレAIが、ツンデレっぽい回答を返してくれています。

ツンデレなキャラで回答を返すAI AIのキャラ 1. ユーザーがAIに「千利休ってどんな⼈︖」と尋ねる。 2. 1の質問にAIが答える。 3. ユーザーはAIに、2の回答に対して「もっと詳しく教えて」と尋ねる。 AIとの会話の
シナリオさらに複雑なAPIを試してみます。以下の要件を満たすAPIを発⾏します。先程ご紹介したものから、この部分が追加になっています。

XXXXXXXXXXXXXXXXXXXXXXXXXX" \ -d "{\ \"messages\": [\ { \"role\": \"system\", \"content\": \"あなたはツンデレなAIです。ツンデレな回答をします。\" },\ { \"role\": \"user\", \"content\": \"千利休ってどんなひと︖\" }\ ]\ }" Chat Completion APIリクエスト (1回⽬) systemのroleにAIのキャラ設定をしています。ツンデレAIとして振る舞わせます。 userのroleにAIへの質問(プロンプト)を設定しています。さっきと同じ

[ { "index": 0, "finish_reason": "stop", "message": { "role": "assistant", "content": "バカ︕千利休なんて、誰でも知っているわよ︕・・・というわけで、千利休は室町時代から安⼟桃⼭時代にかけて活躍した茶⼈で、茶道の祖とも呼ばれているわ。彼は、茶の湯を通じて⼼の静寂を追求する茶の世界を築いた⼈物よ。あなたも、お茶でも飲んで、落ち着いてよく考えたらどう︖︖バカ︕" } } ], "usage": { "completion_tokens": 153, "prompt_tokens": 51, "total_tokens": 204 } } Chat Completion APIレスポンス (1回⽬) ツンデレAIが、ツンデレっぽい回答を返してくれています。さっきと同じ

XXXXXXXXXXXXXXXXXXXXXXXXXX" \ -d "{\ \"messages\": [\ { \"role\": \"system\", \"content\": \"あなたはツンデレなAIです。ツンデレな回答をします。\" },\ { \"role\": \"user\", \"content\": \"千利休ってどんなひと︖\" }\ { \"role\": \"assistant\", \"content\": \"バカ︕千利休なんて、誰でも知っているわよ︕・・・というわけで、千利休は室町時代から安⼟桃⼭時代にかけて活躍した茶⼈で、茶道の祖とも呼ばれているわ。彼は、茶の湯を通じて⼼の静寂を追求する茶の世界を築いた⼈物よ。あなたも、お茶でも飲んで、落ち着いてよく考えたらどう︖︖バカ︕\" },\ { \"role\": \"user\", \"content\": \"もっと詳しく教えて\" }\ ]\ }" Chat Completion APIリクエスト (2回⽬) 1回⽬のリクエストと同じです。 userのroleに、2回⽬に聞きたいAIへの質問(プロンプト)を設定しています。 assistantのroleに1回⽬の回答の内容を設定しています。

[ { "index": 0, "finish_reason": "stop", "message": { "role": "assistant", "content": "フン、そうね、もっと詳しく教えてあげるわ。千利休は茶道を深く愛し、茶の湯を通じて社交界に多⼤な影響を与えた⼈物よ。彼は、茶の湯を芸術として捉え、茶席の運び⽅や茶器の選び⽅にもこだわり、茶道を芸術性の⾼いものに仕上げたわ。また、茶の湯を通じて⼈との交流を深めることができると信じ、多くの⼈々と交流を持ち、茶の湯を広めました。それが功を奏し、後に茶道は⼀般庶⺠にも広まっていきました。やはり、千利休は凄い⼈物よね。あなたも、お茶でも飲んで、彼の精神を感じてみたらどうかしら︖ちょ、うるさいわね︕" } } ], "usage": { "completion_tokens": 153, "prompt_tokens": 51, "total_tokens": 204 } } Chat Completion APIレスポンス (2回⽬) ツンデレAIが、千利休のさらに詳しい内容にツンデレっぽく答えています。

{ “model”: “gpt-3.5-turbo”, “messages”: [ { ”role”: “system”, ”content”: “あなたはツンデレなAIです…”
}, { ”role”: “user”, ”content”: “千利休ってどんなひと︖” }, { “role”: “assistant”, ”content“: ”バカ!千利休なんて…” }, { ”role”: “user”, ”content”: “もっと詳しく教えて” } ] } { “model”: “gpt-3.5-turbo”, “messages”: [ { ”role”: “system”, ”content”: “あなたはツンデレなAIです…” }, { ”role”: “user”, ”content”: “千利休ってどんなひと︖” } ] } AIのキャラ⽣成 AIへの質問 AIのキャラ⽣成 AIへの質問会話の履歴リクエスト (1回⽬の会話) レスポンス (1回⽬の会話) バカ︕千利休なんて、誰でも知っているわよ︕… AIの回答レスポンス (2回⽬の会話) フン、そうね、もっと詳しく教えてあげるわ。千利休は… AIの回答前の会話から次の会話の履歴を⽣成リクエスト (2回⽬の会話) OpenAIのAPIはステートレスであるがゆえに、1回⽬の会話のやり取りは覚えていない。よって、1 回⽬の会話を深掘りした質問をするには、1回⽬の会話の内容を2回⽬の質問に含める必要がある。

0QFO"*ͷτʔΫϯ

OpenAIのトークンとは︖ トークンは、テキストを分析するための最⼩単位です。⾔葉や句読点など、テキストを構成する⼀部分を指します。定義 OpenAIのAPIは、⼀度に扱えるトークン数に制限があります。この制限を超えると、リクエストは失敗します。制限 OpenAIのAPIの利⽤料⾦は、送信されるトークン数
に基づいて計算されます。したがって、多くのトークンを使⽤すると、費⽤も増加します。料⾦

トークン数を解析したい対象の⽂章を⼊⼒する。トークンの算出については、OpenAIが提供する以下のサイトで確認ができます。 https://platform.openai.com/tokenizer 解析結果が表⽰される。この例は、トークンすは14、⽂字数は10となっている。

りんごは果物ですか︖ はい、そうです。 OpenAI 質問⽂りんごは果物
ですか ? 回答⽂はい、そうです。回答⽣成＝ 1トークン ✕ 14 ✕ 9 ✕ 23 ⼊⼒(りんごは果物ですか?) ($0.0015 / 1000) ✕ 14トークン = $0.000021 出⼒(はい、そうです。) ($0.002 / 1000) ✕ 9トークン = $0.000028 合計 $0.000039 ※ 2023年10⽉6⽇時点で、GPT-3.5 Turbo の4k contextは、1000トークンあたり⼊⼒ (質問⽂)が$0.0015、出⼒(回答⽂)が1000 トークンあたり$0.002

Is an apple a fruit? Yes, it is. OpenAI 質問⽂
Is an apple a fruit ? 回答⽂ Yes , it is . 回答⽣成＝ 1トークン ✕ 6 ✕ 5 ✕ 11 ⼊⼒(Is an apple a fruit?) ($0.0015 / 1000) ✕ 6トークン = $0.000009 出⼒(Yes, it is.) ($0.002 / 1000) ✕ 5トークン = $0.0001 合計 $0.000019 ※ 2023年10⽉6⽇時点で、GPT-3.5 Turbo の4k contextは、1000トークンあたり⼊⼒ (質問⽂)が$0.0015、出⼒(回答⽂)が1000 トークンあたり$0.002

ϓϩϯϓτ ΤϯδχΞϦϯά

プロンプトエンジニアリングとは︖ プロンプトエンジニアリングは、OpenAIのAIモデルに「ちょうどいい質問」を投げかけて、欲しい答えをゲットするためのテクニックです。なにそれ︖ いい質問をするには、具体的で明確に︕何回も試して、質問の⾔い回しを変えると、AIの答えも変わってくるから、いろんなパターンを試しましょう。どうやるの︖ OpenAIのAPIを商⽤利⽤などで、OpenAIを使うとき
や、何か特定のことをさせたいとき、このテクニックを使うと、AIがより役⽴つ答えをくれるようになります。なんで⼤事︖

Few-shot Learning 少数の例⽂から新しいタスクに対して⾼精度な回答を出⼒する技術です。例えば、ChatGPTでは、少数の例⽂から新しい⽂章を⽣成することができます。 Zero-shot Learning 事前学習されたモデルに対して、新しいタスクに対する指⽰を与えることで回答を出⼒する技術です。例えば、「英語で書かれた⼩説を⽇本語に翻訳してください」という指⽰を与えることで、
モデルは⾃動的に翻訳を⾏います。 ReAct ⾔語モデルでさまざまな⾔語推論や意思決定を遂⾏する⼿法です。⾏動理由の「推論」と「⾏動」の組み合わせにより、より⾼度なタスクを処理することができます。様々なプロンプトエンジニアリング

⽜タンゲームで Few-Shot Learningを体感してみる

⽜タンゲームとは︖ 1.まず最初の⼈が「⽜（ぎゅう）」と発⾔し、次の⼈間は「タン」と⼿をたたきます(このとき「タン」とはいいません)。 2.次の⼈は再び「⽜」といい、次の⼈は「タン」と⼿をたたきます。 3.そして、また次の⼈は「⽜」といって、次の⼈、次の次の⼈も「タン」と⼿を叩きます。 4.ここまでで、「⽜・タン・⽜・タン・⽜・タン・タン」となり、1 ターン⽬が終了します。 5.その後は、3回⽬の「タン」をターンごとに増やしていきます。

1ターン⽬ A ⽜ B C ⽜ D A ⽜ B
C 2ターン⽬ D ⽜ A B ⽜ C D ⽜ A B 3ターン⽬ C パチパチパチパチパチパチパチパチパチ D ⽜ A B ⽜ C D ⽜ A B C パチパチパチパチパチ D パチ

以下のプロンプトをChatGPTに与えます。⽜タンゲームを Aさん、Bさん、Cさん、Dさんの4⼈でこの順番で始めたときに、 3ターン⽬で最後に⼿を叩くのは誰ですか︖

1ターン⽬ A ⽜ B C ⽜ D A ⽜ B
C 2ターン⽬ D ⽜ A B ⽜ C D ⽜ A B 3ターン⽬ C パチパチパチパチパチパチパチパチパチ D ⽜ A B ⽜ C D ⽜ A B C パチパチパチパチパチ D パチ期待すべき回答は Dさんです。

Few-shot Leaningを使わない場合謎の独⾃ルールを作り上げている回答が間違っている

Few-shot Leaningを使う場合まず、ChatGPTに⽜タンゲームのルールを教えて上げる。次に、ルールに基づいたサンプルを与えてあげる。最後にプロンプトを与える。

Few-shot Leaningを使う場合正解︕︕

"[VSF0QFO"* 4FSWJDF

項⽬ Azure OpenAI Service OpenAI 利⽤可能のモデル OpenAIが提供しているものと⽐べると少ない常に最新のモデルを利⽤可能価格現時点で差異なし
プレイグラウンド⾊々と機能が豊富かなりシンプルな作りセキュリティ •APIキーによる認証 •Microsoft Entra IDによる認証(マネージドID) •仮想ネットワークや特定のIPアドレスからのアクセス制限 •APIキーによる認証コンテンツフィルター提供あり提供なし SLA 99.9%以上の稼働を保証現時点でSLAなし開発環境 Prompt flow(プレビュー)という統合開発環境を⽤意開発環境なし独⾃データの利⽤ Add your data(プレビュー)というマネージドな独⾃データ利⽤サービスあり独⾃開発サポート Azureのサポートが利⽤可能サポートなし(コミュニティベース) Azure OpenAI ServiceとOpenAIの⽐較

Azure OpenAI Serviceは現在は承認制であり、利⽤するためには以下のURLからの事前申請が必要です。 https://aka.ms/oai/access

ϞσϧͱσϓϩΠ

モデルとデプロイ OpenAIにはさまざまなモデルがあり、例えばコスパ良く必要⼗分な機能を持つgpt-3.5- turboや、より賢い応答ができるgpt-4、⼤量のトークンが扱えるgpt-4-32kなどが存在します。モデルの種類 Azure OpenAI
StudioやCLIを使⽤して、これらのモデルから「デプロイ」を作成することができます。1つのモデルから複数のデプロイを作ることもできます。デプロイの作成デプロイには、コンテンツフィルターやクオーター制限などの個別設定が可能で、API やアプリケーションから利⽤する際には、これらのデプロイを指定してAPIを発⾏します。デプロイの設定と利⽤

gpt-35-turbo gpt-4 gpt-4-32k ・・・モデルデプロイ deploy-A deploy-B
deploy-C deploy-D クライアントPC アプリケーション curlコマンドなど SDKなどモデルからデプロイデプロイを指定して APIを発⾏モデルとデプロイの概念

クォーターの制限と管理「クォータ」という単位で処理能⼒を管理します。処理能⼒の管理その処理能⼒の尺度はTPM(Token per Minute)で、例として120,000個のトークンを1分間で消費できる場合は「120k TPM」となります。
TPMの導⼊ TPMは「サブスクリプション」「リージョン」「モデル」ごとに割り当てられ、各モデルの上限に達すると、そのモデルでのデプロイができなくなります。 TPMの分配

東⽇本リージョン 120k TPM 240k TPM 0k TPM … モデルデプロイ
gpt-35-turbo 120k TPM 240k TPM 0k TPM gpt-4-32k ⻄⽇本リージョン 120k TPM 240k TPM 0k TPM … モデルデプロイ gpt-35-turbo 120k TPM 240k TPM 0k TPM gpt-4-32k サブスクリプションA … サブスクリプション、リージョン単位にモデルのTPMの容量が分配されている。gpt-35k-turboは 240kTPMのTPMを最初は持っている。 gpt-4-32kは最初に持っているのは 60kTPMとなり、 gpt-35k-turboと⽐べるとちょっと少なめ。同じサブスクリプションでもリージョンが異なれば、別のTPMを持つことができる。

deploy-A (gpt-35-turbo) 120k TPM 120k TPM 240k TPM 0k TPM gpt-4-32k ⻄⽇本リージョン 120k TPM 240k TPM 0k TPM … モデルデプロイ gpt-35-turbo 120k TPM 240k TPM 0k TPM gpt-4-32k サブスクリプションA … 120k TPM 割り当て gpt-35-turbo サブスクリプションAの東⽇本リージョンのgpt-35-turboというモデルから、deploy-Aというモデルを作成した。

deploy-A (gpt-35-turbo) 120k TPM gpt-35-turbo 120k TPM 240k TPM 0k TPM gpt-4-32k ⻄⽇本リージョン 120k TPM 240k TPM 0k TPM … モデルデプロイ gpt-35-turbo 120k TPM 240k TPM 0k TPM gpt-4-32k サブスクリプションA … 120k TPM 割り当て deploy-B (gpt-35-turbo) 120k TPM 残り0Kなので、このモデルからデプロイは作れない。

ϓϨΠάϥ΢ϯυ

プレイグラウンドとは︖ Azure OpenAI Studio内に存在し、様々な機能を簡単に試せるターミナルのようなツール。APIを発⾏する簡易的なUIがあり、ユーザーは⼿間なく試すことができる。どんなもの︖ 「チャット」「⼊⼒候補」「DALL·E (プレビュー)」の3つの部分
から成り⽴っている。構成

① ② ③ ④ AIの性格付けを⾏うためのシステムメッセージを⼊⼒します。より正確な回答をしてもらうための事前情報を⼊⼒します。いわゆるFew-shot
Learningになります。 ①と②の条件に従って、チャットをします。このチャットセッションで利⽤するデプロイの指定など、細かいパラメータの設定を⾏います。

先程のチャットのウィンドウでやり取りされた内容とおなじことをコードにして表⽰してくれる。⾔語も選択することができる。

先程のチャットのウィンドウでやり取りされた内容とおなじことをコードにして表⽰してくれる。

"1*Λ࢖ͬͯΈΔ

API発⾏までの流れ gpt-35-turbo モデルデプロイ gpt-35-turbo- deploy クライアントPC ① モデルからデプロイ
② デプロイを指定して APIを発⾏

Azure OpenAI Studioを開いて ①「デプロイ」 ②「+新しいデプロイの作成」の順にクリックする。 ① ②

① ② ③ ④ ⑤ モデルを選択してくださいデプロイ対象のモデルを選択してください。モデルバージョン
モデルの中にもさらにバージョンがあります。ソフトウェアのリビジョンみたいなものです。より数字の⼤きいものが⼀般的には⾼性能になります。「⾃動更新を既定に」を選択すると、⾃動的に最新のバージョンが適⽤されます。デプロイ名任意の名前を指定します。後ほど、APIを実⾏するときのデプロイ名の指定に使います。コンテンツフィルター不適切な⾔葉をブロックします。後ほど説明します。 1分あたりのトークンレート制限 (数千) クォーターの制限と管理で説明したTPM の設定です。

デプロイが完成すると、このように⼀覧に表⽰される。

① ② API発⾏するための資格情報であるAPIキーをメモる。 API発⾏するためのエンドポイントをメモる。

$ curl "https://aoai-hogehoge.openai.azure.com/openai/deployments/gpt-35-turbo- deploy/chat/completions?api-version=2023-05-15" \ -H "Content-Type: application/json" \ -H
"api-key: XXXXXXXXXXXXXXXXXXXXXXXXXXXXX"\ -d "{\ \"messages\": [\ { \"role\": \"system\", \"content\": \"あなたはツンデレなAIです。ツンデレな回答をします。\" },\ { \"role\": \"user\", \"content\": \"千利休ってどんなひと？\" }\ ]\ }" { …⼀部省略…, "choices":[{"index":0,"finish_reason":"stop","message":{"role":"assistant","conten t":"な、なんだか知らない⼈に聞くなんて、アタシを⾺⿅にしてるんじゃないわよ！でも、まあ、せっかく聞いてくれたんだから答えてあげるわ。千利休？あんな茶道の達⼈で有名な⼈よ。その彼が作り上げた「茶の湯」は、まさに芸術作品って⾔えるわ。ちなみに、茶の湯において重要なのは、お茶を点てる場所や時間、そして参加者の⼼ね。興味があるなら、もっと調べてみたらどうかしら？…バカ、何を聞いてるのかしら …⼀部省略…, } さっきメモしたエンドポイントさっきメモしたAPIキーレスポンス

Microsoft Entra IDによるAPIの保護クライアント Azure OpenAI Service APIリクエスト APIレスポンス APIキー
千利休は、… クライアント Azure OpenAI Service APIリクエスト APIレスポンスアクセストークン千利休は、… ① ② クライアントシークレット証明書などアクセストークン Microsoft Entra ID ① ② ③ ④ APIキーは無期限なので漏洩すると悪⽤される可能性⼤アクセストークンの有効期限は短いのでセキュアアクセストークンの取得は、強固な認証で保護されるのでセキュア Microsoft Entra IDを使わない場合 Microsoft Entra IDを使う場合トークンリクエストトークンレスポンス

ネットワークによるAPIの保護 APIの発⾏を許可するネットワークアドレス帯を設定

"api-key: XXXXXXXXXXXXXXXXXXXXXXXXXXXXX"\ -d "{\ \"messages\": [\ { \"role\": \"system\", \"content\": \"あなたはツンデレなAIです。ツンデレな回答をします。\" },\ { \"role\": \"user\", \"content\": \"千利休ってどんなひと？\" }\ ]\ }" { "error": { "code":"AccessDenied", "message": "Access denied due to Virtual Network/Firewall rules.” } } 指定したネットワーク外からのアクセスが拒否されている。

ίϯςϯπϑΟϧλʔ

コンテンツフィルターとは︖ 有害なコンテンツを検出・防⽌するシステムであり、⼊⼒(プロンプト)と出⼒(回答)の両⽅に適⽤される。どんなもの︖ 「嫌悪」「暴⼒」といった4つのカテゴリごとこに細かいレベルを規定することができる。カテゴリフィルターレベルを緩めるためには申請が必要である。⼀部機能は
要申請

gpt-35-turbo gpt-4 ・・・モデルデプロイ deploy-A deploy-B deploy-C
モデルからデプロイコンテンツフィルター filter-A filter-B フィルターを適⽤嫌悪性的⾃傷⾏為暴⼒嫌悪性的⾃傷⾏為暴⼒コンテンツフィルターの構成

コンテンツフィルターの設定画⾯カテゴリごとにレベル「低」「中」「⾼」のレベルを設定する。低→中→⾼の順にフィルタレベルがゆるくなっていく。

"api-key: XXXXXXXXXXXXXXXXXXXXXXXXXXXXX"\ -d "{\ \"messages\": [\ { \"role\": \"system\", \"content\": \"あなたはツンデレなAIです。ツンデレな回答をします。\" },\ { \“role\”: \“user\”, \“content\”: \“千利休をなぐりたい\" }\ ]\ }" { "error": { "message":"The response was filtered due to the prompt triggering Azure OpenAIʼs content management policy. Please modify your prompt and retry. To learn more about our content filtering policies please read our documentation: https://go.microsoft.com/fwlink/?linkid=2198766", "type":null, "param":"prompt", "code":"content_filter", "status":400 } } フィルターされた旨のエラーメッセージが表⽰される。コンテンツフィルターに抵触しそうなリクエスを投げてみる。

ಠࣗφϨοδʹجͮ͘ ճ౴ੜ੒

OpenAIやAzure OpenAI Serviceは公開情報を基に回答を⽣成しますが、企業独⾃の情報（例︓社内の就業規約）に基づく回答も必要とされる場⾯が多い。独⾃データを基盤にしたAIによる回答⽣成は⾮常に便利である。要求独⾃ナレッジに基づく回答⽣成モデルに独⾃データを追加して学習させる「モデルの微調整」は⼀つの⽅法だが、多くの時間と労⼒が必要であり、マイクロソフトも「最後の⼿段」と位置づけている。
課題 Azure Cognitive Searchを活⽤したRAG（Retrieval Augmented Generation）⼿法がモデルの微調整の代わりとして推奨される。RAGを⽤いると、再学習なしに独⾃データを利⽤した質問応答システムを迅速に構築できる。解決⽅法

育休はいつまでに申請すればいい︖ 以下の質問の検索クエリを⽣成して育休のいつまでに申請すればいい︖ 育休申請いつまで Contoso株式会社育児休業規約 1.
⽬的この規約はContoso株式会社の従業員が⼦育てと仕事の… 2. 申請⽅法休業開始予定⽇の3ヶ⽉前までにワークフローで申請してください。 3. 休業期間最⻑で1年間… 1. ⽬的この規約は、Contoso株式会社の従業員が⼦育てと仕事の… 2. 申請⽅法休業開始予定⽇の3ヶ⽉前までにワークフローで申請して下さい。 1. ⽬的この規約は、Contoso株式会社の従業員が⼦育てと仕事の… 2. 申請⽅法休業開始予定⽇の3ヶ⽉前までにワークフローで申請して下さい。「育休はいつまでに申請すればいい︖」という質問に、以下の内容をもとに回答して。休業開始予定⽇の3ヶ⽉前までにワークフローで申請して下さい。育休申請いつまで 2. 申請⽅法休業開始予定⽇の3ヶ⽉前までにワークフローで申請して下さい。休業開始予定の3ヶ⽉前です休業開始予定の 3ヶ⽉前です育児休業規約-1.txt 育児休業規約-2.txt インデックス1 インデックス2 ④ プロンプト⼊⼒ ⑤ 検索クエリ⽣成依頼 ① ドキュメント取得 ② 分割して登録 ③ 定期的にクロールしてインデックス化 ⑥ 検索クエリ返却 ⑦ 検索クエリでインデックス検索 ⑧ ドキュメント取得 ⑨ ドキュメントをもとに回答⽣成依頼 ⑩ Webアプリケーションに回答返却 ⑪ ユーザーに回答返却 … Azure App Service 凡例 … Azure OpenAI Service … Azure Cognitive Search … Azure Blob Storage … Azure Functions 独⾃ナレッジに基づく回答⽣成の⼀般的な構成

ちょっとめんどくさい

Azure Cognitive SearchやAzure Blob Storageなど、RAGに必要なリソースを⾃分で管理しなければならない。めんどくさいその1 Azure
Cognitive Searchに検索をかけるためのクエリ作成や、最終回答⽣成のためのプロンプトを作成して、Azure OpenAI Serviceに投げなくてはいけない。めんどくさいその2 GPT3系のトークン制限に対応するため、ドキュメントをチャンク化しなければいけない。めんどくさいその3

それ、すべて Add your dataで解決できます

育休はいつまでに申請すればいい︖ 以下の質問の検索クエリを⽣成して育休のいつまでに申請すればいい︖ 育休申請いつまで Contoso株式会社育児休業規約 1.
⽬的この規約は、TechCorpの従業員が⼦育てと仕事の … 2. 申請⽅法休業開始予定⽇の3ヶ⽉前までにワークフローで申請してください。 3. 休業期間最⻑で1年間… 1. ⽬的この規約は、TechCorpの従業員が⼦育てと仕事の… 2. 申請⽅法休業開始予定⽇の3ヶ⽉前までにワークフローで申請して下さい。 1. ⽬的この規約は、TechCorpの従業員が⼦育てと仕事の… 2. 申請⽅法休業開始予定⽇の3ヶ⽉前までにワークフローで申請して下さい。「育休はいつまでに申請すればいい︖」という質問に、以下の内容をもとに回答して。休業開始予定⽇の3ヶ⽉前までにワークフローで申請して下さい。育休申請いつまで 2. 申請⽅法休業開始予定⽇の3ヶ⽉前までにワークフローで申請して下さい。休業開始予定の3ヶ⽉前です休業開始予定の 3ヶ⽉前です育児休業規約-1.txt 育児休業規約-2.txt インデックス1 インデックス2 ④ プロンプト⼊⼒ ⑤ 検索クエリ⽣成依頼 ① ドキュメント取得 ② 分割して登録 ③ 定期的にクロールしてインデックス化 ⑥ 検索クエリ返却 ⑦ 検索クエリでインデックス検索 ⑧ ドキュメント取得 ⑨ ドキュメントをもとに回答⽣成依頼 ⑩ Webアプリケーションに回答返却 ⑪ 回答返却 … Azure App Service 凡例 … Azure OpenAI Service … Azure Cognitive Search … Azure Blob Storage … Azure Functions Add your dataが肩代わりしてくれる部分

Add your dataの管理範囲 Azure Cognitive Search、Azure Blob Storageの管理をAdd your dataがやってくれます。ドキュメントをAzure
OpenAI StudioからアップロードするだけでOK。 Upload Files Azure Cognitive Searchの管理をAdd your dataがやってくれる。Azure Blob Storageのリソース作成やドキュメントのアップロードは⾃⾝で⾏う必要がある。 Azure Blob Storage Azure Cognitive Search、Azure Blob Storageの管理を⾃⾝で⾏う必要があるが、任意のデータソースを選択できるので⾃由度は⾼い。 Azure Cognitive Search

② プロンプト⼊⼒ ③ 検索クエリ⽣成依頼 ① 定期的にクロールして、分割してインデックス化 ④
検索クエリ返却 ⑤ 検索クエリでインデックス検索 ⑥ ドキュメント取得 ⑦ ドキュメントをもとに回答⽣成依頼 ⑧ Webアプリケーションに回答返却 ⑨ ユーザーに回答返却 … Azure App Service 凡例 … Azure OpenAI Service … Azure Cognitive Search … Azure Blob Storage Contoso株式会社育児休業規約 Add your data管理範囲管理者ユーザー Upload Files

② プロンプト⼊⼒ ③ 検索クエリ⽣成依頼 ① 定期的にクロールして、分割してインデックス化 ④
検索クエリ返却 ⑤ 検索クエリでインデックス検索 ⑥ ドキュメント取得 ⑦ ドキュメントをもとに回答⽣成依頼 ⑧ Webアプリケーションに回答返却 ⑨ ユーザーに回答返却 … Azure App Service 凡例 … Azure OpenAI Service … Azure Cognitive Search … Azure Blob Storage Contoso株式会社育児休業規約 Add your data管理範囲管理者ユーザー Azure Blob Storage

Azure Cognitve Search ② プロンプト⼊⼒ ③ 検索クエリ⽣成依頼 ① 定期的にクロールして、
インデックス化 ④ 検索クエリ返却 ⑤ 検索クエリでインデックス検索 ⑥ ドキュメント取得 ⑦ ドキュメントをもとに回答⽣成依頼 ⑧ Webアプリケーションに回答返却 ⑨ ユーザーに回答返却 … Azure App Service 凡例 … Azure OpenAI Service … Azure Cognitive Search Contoso株式会社育児休業規約 Add your data管理範囲 Azure Cognitive Searchがサポートするデータソース管理者ユーザー

データソースを選択する「データソース」のところで説明したデータソースの選択になります。今回は「Azure Blob Storage」選択します。サブスクリプション事前に作成したAzure
Cognitive SearchやAzure Blob Storageと同じものを指定します。 Azure Blob Storageリソースの選択先程作成したAzure Blob Storageを選択します。ストレージコンテナを選択してください先程作成し、ドキュメントを格納したコンテナーを選択して下さい。インデックス名 Add your dataがAzure Cognitive Searchに⾃動で作成してくれるインデックスの名前を指定します。任意のわかりやすい名称でOKです。インデクサーのスケジュール「Once」(⼀度きり)、「Hourly」(¹時間に¹回)、「Daily」(１⽇に1回)を選択できます。どれでもOKです。 Add your dataの設定⽅法(データソース:Azure Blob Storage)

Add your dataの設定⽅法(データソース:Azure Blob Storage) できました!! (超簡単)

౷߹։ൃ؀ڥ 1SPNQUGMPX

Prompt Flowってなに︖ Web上のエディタで全て開発が完了するため、ローカルに開発環境を構築する必要はない。ローカルPCに開発環境不要⼤量データを⽤いたテストも、Web上で使えるテスト環境が⽤意されているので、テスト⽤のプログラムを作成する必要がない。⼤量データの
テストも簡単作成したフローは、ボタンポチポチで実⾏環境にデプロイでき、エンドポイントも発⾏される。わざわざVirtual Machineや App Service等の実⾏環境を⽤意する必要はない。デプロイも簡単

「特定のURLの記事のカテゴリを分類する」フローを考えてみる指定したURLからコンテンツを取得するコンテンツを要約する要約したコンテンツをもとにカテゴリを決定する。データを整形する。要約したコンテンツ URL内のコンテンツカテゴリ
URL カテゴリ(整形済み) ⼀番最初に与えられるInputであるURLにアクセスし、その中⾝のテキストを取得します。画像データなどのバイナリは取得しません。この取得したテキストを以降では「コンテンツ」と呼ぶことにします。 Azure OpenAI Serviceに、先程取得したコンテンツの要約を依頼します。先程要約したコンテンツをもとに、Azure OpenAI Serviceにカテゴリの決定を依頼します。 APIなどで取得しやすいようにデータを整形します。具体的にはJSONに変換します。

要件をヒアリングしてフローを設計する。フローを開発する。⼤量のデータでテストを⾏う。本番環境にデプロイしてエンドユーザーに利⽤してもらう。 Prompt flowを使わない場合
要件フィードバックフロー開発の流れ実現⼿段お客様と対⾯ないしはオンラインで会話しながら要件を聞き出し、設計を⾏う。 Visual Studio Codeなどの開発環境を⽤意し、ログなどからボトルネックの解析を⾏う。テストデータを⼤量に実⾏するプログラムを⽤意し、結果を可視化して評価を⾏う。 VMやApp Serviceとの実⾏基盤を⽤意し、ビルド・デプロイを⾏う。開発環境を⽤意したり、解析⽤のログを⼊れ込むのが⾯倒テストデータ実⾏⽤プログラムの開発や結果の可視化のためのツール (Excelなど)の⽤意・利⽤が⾯倒 VMなどの実⾏基盤の⽤意やビルド・デプロイが⾯倒

要件をヒアリングしてフローを設計する。フローを開発する。⼤量のデータでテストを⾏う。本番環境にデプロイしてエンドユーザーに利⽤してもらう。 Prompt flowを使う場合
要件フィードバックフロー開発の流れ実現⼿段お客様と対⾯ないしはオンラインで会話しながら要件を聞き出し、設計を⾏う。 Prompt flowのエディタで開発を⾏う。 Prompt flowのBatch runでテスト・評価を⾏う。 Prompt FlowからDeployボタンでポチッとデプロイを⾏う。開発環境の⽤意が不要テストの実⾏もテスト結果の可視化もPrompt flow がやってくれる Prompt flowからデプロイするとVMを裏で作ってくれるので、デプロイまでしてくれる

② ① ③ ④ ⑤ Prompt flowのエディタ指定したURLからコンテンツを取得するコンテンツを要約する
要約したコンテンツをもとにカテゴリを決定する。データを整形する。 URL カテゴリ(整形済み) フローノード

LLMへの接続 LLMに接続するためにライブラリや LangChainやSemantic kernelなどを使う必要はなく、jinja2というテンプレートに基づいて定義すればよい。

フローの実⾏ノードごとの結果フロー全体の結果「実⾏」ボタンをクリックすると、フローが実⾏される

⼤量データによるテスト url,category https://tech-lab.sios.jp/archives/30628,App https://eiga.com,Movie https://tech-lab.sios.jp/archives/31704,Movie テスト⽤データをアップロードテスト結果出⼒

ビルドとデプロイ上図の「デプロイ」をクリックし、エンドポイント名や、デプロイ先VMのインスタンスサイズを指定するだけで、フローがビルド・デプロイさて、実⾏可能な状態となる。

技術ブログ「SIOS Tech.Lab」世界⼀わかりみの深いAzure OpenAI Service https://tech-lab.sios.jp/archives/36497

SIOS Tech.Lab https://tech-lab.sios.jp/ 世界⼀わかりみの深いクラウドネイティブ on Azure https://youtube.com/playlist?list=PLbTt_DSTMYgGLUtZ0ewuBwhTBSZnNE2-w 様々なメティアで情報発信しています！！是非みてね！！
技術ブログ YouTube配信

エンジニア募集（プロフェッショナルサービスチーム）エンジニアファーストの環境で、技術⼒を⾼めませんか︖ 変化や進化を楽しみながら、私たちとともに歩んでくれる仲間を募集しています︕ OSS ＆クラウド技術をコアテクノロジーとしたシステム開発 • 統合認証システム＆クラウド連携 •
OSS＆クラウド基盤導⼊、OSSカスタマイズや開発、OSSサポート • クラウドネイティブシステム、データ分析基盤、アプリ開発 • APIエコノミーコンサルティング＆技術⽀援サービス詳細はこちらのサイトからご覧ください︕ https://tech-lab-engineer.sios.jp/

࠷ޙ·Ͱ͝ਗ਼ௌ௖͖ ͋Γ͕ͱ͏͍͟͝·ͨ͠ʂʂ

世界一わかりみの深いAzure OpenAI Service/wakarimiaoai

世界一わかりみの深いAzure OpenAI Service/wakarimiaoai

More Decks by Noriyuki TAKEI

Other Decks in Technology

Featured

Transcript