Upgrade to Pro — share decks privately, control downloads, hide ads and more …

【re:Invent2025 Notion reCap】AIエージェントを制御する “Agen...

【re:Invent2025 Notion reCap】AIエージェントを制御する “Agent SOP(Standard Operating Procedures)” をチームで継続的に管理・更新する

Avatar for fujioka-a

fujioka-a

January 23, 2026
Tweet

More Decks by fujioka-a

Other Decks in Technology

Transcript

  1. Agent SOP って何? 先に要点お伝えすると… ① Agent SOP = Markdownで”手順+制約”を定義して、 LLMの判断ブレを抑える

    ② Agent SOPを使うことによって、ワークフロー型AIエージェント よりも軽量に構築管理できるが、厳密性は落ちる
  2. Agent SOP って何? Agent SOPが求められる背景として • 多くの業務には順序や決まりごとがあります • Ex. re:Capイベントの開催

    • 企画 → 会場を予約 → 集客 → etc. [順序] • 予算は◯万円以内、東京駅周辺で [決まりごと] • 順序や決まりごと(制約)がある業務の効率化は、 ワークフロー型のAIエージェントを使うのが有効です ※ Anthropic「Building effective agents」より意訳 AIエージェントは2分類される • Agent : LLMが自立的に、プロセスやツール使用を判断 • Workflow:事前に定義されたプロセスに沿って、LLM呼び出しやツール使用
  3. Agent SOP って何? この課題感に対して、 Markdownに手順&制約を自然言語で書いて、プロンプトとしてLLMに 渡すというAgent SOP(標準操作手順)を実践することで、 LLMにブレの少ない作業をさせることが可能になります! 処理A 処理B

    処理C ワークフロー型 の場合 処理D プログラミング言語を使って、 エージェント自体に処理や分岐を定義 Agent SOP の場合 処理A 処理B --処理C --処理D 入力 自然言語で処理や分岐を記述し、 入力としてエージェントに渡す →正確だが手間が大きい →カンタンだがブレるリスクあり (agent/workflowの中間的存在)
  4. Agent SOPの設定イメージ Markdown形式でプロンプトのように 指示を記載します ✓ SOPの概要を書く ✓ 箇条書きで各ステップの処理を書く ✓ 各処理に制約(Constraint)を書く

    # 実装SOP 「探索、計画、実装、コミット」のワークフローに従っ て、コードタスクを実装するための指針です。 可読性と保守性を優先して、対象のプログラミング言語 における慣用的なコードを生成します。 ## ステップ ### 1. 指示・コンテキストの確認 指示内容を解釈して、依頼された実装に関連するドキュ メントを、/docs配下から取得します 制約(Constraints) - MUST: /docs配下から関連するドキュメントを探索し て読み込む。 - SHOULD: ルートのREADME.mdを読み込む。 - MUST NOT: 指示内容に対して、推測を挟まないでく ださい。 ### 2. 実装計画の作成 ・・・・ ステップでのエージェントの 判断基準となる制約(Constraints) を 、 RFC 2119形式 でを使って指示 利用するには、作成したSOPを プロンプトやMCPでエージェントに 渡す、それだけ!!
  5. Agent SOPのセットアップ&構築 実行の流れは以下のイメージです ※私はローカルでAgentを起動しましたが、問題なく試せました ※python環境+Strandsライブラリ+AWS認証権限(Bedrock) のみでOKです SOP Strands Agent (SOP付き)

    ①「〇〇ファイルをインプット として、実装SOPを実行 してください」として指示 ②SOPが指示されたことを理解し、SOPファイルを読み込んで、 アクションを逐次決定してワークフローのように駆動する ③逐次決定された アクションを実行 ファイル入出力, プログラム実行 など…
  6. Agent SOPのメリット・デメリット ✓ メリット ✓ Markdownなので、エージェントの判断基準やフローを エージェントの実装変更なしで手軽にブラッシュアップできる ✓ SOPの判断軸(手順や制約)を毎回提供するため、 長い作業でも手戻りが少なくエージェントが連続的に駆動できる

    ✓ デメリット ✓ モデル依存で、指示への忠実度・再現度は変化する ✓ 判断基準やフローをLLMに委ねるので、トークン消費が激しい チームでMarkdownのSOPを ブラッシュアップ・管理するなら、 Notionは有効な選択肢の1つ
  7. まとめ ✓ Agent SOP = Markdownで”手順+制約”を定義して、 LLMの判断ブレを抑える ✓ Agent SOPを使うことによって、ワークフロー型AIエージェント

    よりも軽量に構築管理できるが、厳密性は落ちる ✓ 手軽に更新できるMarkdownを扱うSOPは、 繰り返しブラッシュアップして精度をあげていきます ✓ Notionを、チームで議論・合意してSOPを育てる場として 使うのが有効です × Notion
  8. AWS公式から以下のAgent SOPが 公開されていて、ライブラリとして使用可能 GitHub -Agent SOP- pdd 計画 ラフな説明から、プロンプト駆動開発に沿って、 設計書・実装計画・TODOリストを具体化

    codebase- summary ドキュメン テーション コードを読み取ることで、アーキテクチャや処 理フローなどを整理し、ドキュメントを生成 code-task- generator タスク作成 ラフな説明などから、タスクを計画し、構造化 されたファイル形式で生成・出力 code-assist 実装 Explore → Plan → Code → Commit の流れで、 テスト駆動開発(TDD)に基づく実装 eval 評価 Strands Evals SDKを用いて、AIエージェントの 評価設計からテストデータ生成、実行、 結果分析を支援 Agent SOPの公式情報
  9. Agent SOPのセットアップ&構築 SOPをセットアップ&構築します →ライブラリのインストール後に以下の実装だけで ミニマム版を試すことができます!! (pdd SOPの場合) from strands import

    Agent from strands_tools import editor, shell from strands_agents_sops import pdd agent = Agent( system_prompt=pdd, tools=[editor, shell] ) agent(“pdd SOPを実行してください。日本語でお願いします。") while(True): agent(input("\nInput: "))
  10. 自前のAgent SOPを作ってみる お作法を理解すれば、 Agent SOPは自前で手軽に作れます。 (※PRレビュー用のSOPを例に説明します) ポイントは主に2つ! ①Parameters ②Constraints(制約) 判断基準にグラデーションを持たせる

    ▼レビュー基準 Critical Major Minor 判断やアクションに対する縛りを与える ▼コーディング自体のレビュー MUST: コード規約に合致すること SHOULD: 潜在的リファクタリングを 特定することが望ましい MUST NOT: 可読性を犠牲にした 実装修正の提案を禁ずる ▼レビュー観点 バランス セキュリティ重視 メンテナンス性重視 エージェント実行時に 事前に用意したパラメータ一覧から どれを使用するか選択する パラメータを加味して、制約を受けながら 判断&アクション