Public Preview お客様の多様なユースケースに適 したLLMを選ぶ Azure AI Foundry のプロビジョ ニング済みスループット General Availability Azure AI Foundry モデル間での容 量のデプロイと予約 モニタリングダッシュボード リソースの使用状況、パフォーマ ンス、コンプライアンスに関する リアルタイムの洞察を提供 プロビジョニングされたスルー プットの動的スピルオーバー Public Preview サービスを中断なしにトラフィッ クバーストを管理 プロンプトキャッシング General Availability 応答時間の短縮、スループットの スケーリング、トークンコストの 削減 バッチ大規模ワークロード のサポート 最大数十億のトークンが大量の バッチリクエスト処理を高速化 Public Preview General Availability General Availability Public Preview Public Preview Public Preview
“How is the weather in Paris in May?” <シンプルなクエリ> “Plan a 5-day itinerary from Paris to Venice for a vegan family of 10” <複雑なクエリ> ルーター (AI モデル) gpt-4.1- mini gpt-4.1- nano … a b ダイナミック・インテリ ジェント・ルーティング 最適な応答 <アウトプット> a b Step 1 ユーザーは、Chat Completions API または Responses API を使用してエ ンドポイントを呼び出し Step 2 ルーターは、入力パラメーター (プロンプト、 ツールの使用など) を評価し、最適なモデルに 動的にルーティング Step 3 エンドポイントは、 もとになるモデルの応答を返す
ソース間のシームレスな統合を可能に Azure API Management Build Local & Remote MCP Servers Tools Community Enterprise Windows MCP Clients & Host Copilot Studio VS Code Foundry Agent Visual Studio Semantic Kernel Registry GitHub Copilot C# MCP SDK Microsoft Connectors Azure Functions Microsoft Teams Windows