Azure OpenAI Dev Dayにおいて発表したLLMシステム開発のTips集です。
◆Prompting
System Prompt は構造化・再利用を考慮せよ
Prompt Store を作って複数のエージェントでプロンプトの部品を共有
Lost in the Middleに配慮したプロンプトづくり
プロンプトの精度向上、ほとんど CoT の亜種
JSON出力を使いこなせ
◆RAG
ドキュメント情報の抽出は GPT-4o と OCR 情報を組み合わせる
前ページの履歴を残しながら解析することでページ間のつながりを配慮
表形式はMarkdownでなくJSONが有効
検索対象は必ずしもチャンクした本文ではない
検索クエリと検索対象ドキュメントの両方でキーワードを意識した情報抽出を
◆LLM運用上の最新アップデート
ログはユーザニーズの宝庫。必ず取得し分析できるまでのパイプラインを整えること
コンテンツフィルタリング機能を理解し、非同期化も含めた適切な設定を
トークナイザの効率化で実質のコストが変化している
リージョンを指定しないGlobal Deploymentを上手く活用しよう