Slide 18
Slide 18 text
チャット内容の要約
チャットの応答 AIメモリーの生成
速度重視 品質重視
タスク分割+LLM適材適所+HA構成の例
構造安定性重視
OpenAI API
GPT-4o mini
OpenAI API
GPT-4o
OpenAI API
GPT-4o
プライマリモデル セカンダリモデル
複数サービス x 複数モデルで
フェールソフト
複数サービス x 同一モデルで
ロードバランシング
LLMごとの特性を活かす
(Structured Outputモードを利用)
Azure OpenAI Service
GPT-4o mini
Amazon Bedrock
Claude 3.5 Sonnet
Azure OpenAI Service
GPT-4o