Context Engineeringの取り組み

2026/2/4 李俊起 Context Engineeringの取り組み AI運用勉強会 #2

自己紹介 2026/2/4 2 名前李俊起（イジュンギ） / Joonki Lee
所属 KINTOテクノロジーズ株式会社 Platform Group / Platform Engineer 関心分野 Observability Kubernetes 生成AI

アジェンダ 2026/2/4 3 • 開発しているAgentについて • Context関連で直面した課題 • Context Engineeringの手法
• アラート原因分析Agentへの適用 • まとめ

2026/2/4 4 アラート原因分析AI Agent

どういうAgentか 2026/2/4 5 • NewRelic、CloudWatch、Grafanaからのアラート発報をトリガーに、原因分析を行い、原因と対策をSlackに通知してくれる LangGraphで作ったReact Agent（Single Agent） https://speakerdeck.com/nutslove/aratodakedekokomadefen-xi-dekiruno-ai-agentdeqie-rikai-kuaratodui-ying-noxin-shi-dai
詳細については去年の CNDW2025で発表した資料をご参照ください！

2026/2/4 6 Context関連で直面した課題

Context Window管理 2026/2/4 7 • Context溢れ ➢ 1回の推論で複数のツールが呼び出されたりすると、Outputが膨大な量になって、LLMのInput Tokenの上限を超過してエラーになる

2026/2/4 8 Context Engineeringの手法

Context Engineeringとは 2026/2/4 9 • Agent（LLM）が適切な判断を下すために必要な情報（Context）を設計・管理するための概念・手法 • Agentの普及により、System Promptの管理（Prompt
Engineering）だけではなく、Contextの管理が重要になってきた • Agentのステップが長くなったり、ToolからのOutputが大きかったりすると、 Contextが肥大化していく https://www.blog.langchain.com/context-engineering-for-agents/

Contextが肥大化すると何が問題なのか 2026/2/4 10 • LLMの回答精度低下 • LLMのInput Tokenの上限を超えてしまう ➢ Agentの処理が途中で中断されてしまう（実装による）
• LLM利用料金の高騰

Context Engineering手法（１）要約（Summarization） 2026/2/4 11 • Contextが大きくなったらそれまでのContextを要約し、 Context Windowが溢れることを防ぐ System
Prompt Human Input AI Message Tool Response N回目ステップ System Prompt Human Input AI Message Tool Response N＋１回目ステップ AI Message Tool Response Tool実行後、LLMに返す前にそれまでの内容を要約し、要約版をLLMに渡す System Prompt それまでの Tool実行結果などの要約 System Prompt それまでの Tool実行結果などの要約 AI Message Tool Response N＋２回目ステップ

Context Engineering手法（２） Sub Agent 2026/2/4 12 • Sub AgentはSupervisor Agentとは別の、
自分だけのContext Windowを持つ（Contextの隔離） • Toolの実行はSub Agentに任せて、Supervisor Agentには結果の要約だけを返すことで、 Supervisor AgentのContextをコンパクトに維持できる • ただ、LLMの呼び出し回数が多くなるので、実行時間が長くなる傾向にある Supervisor Agent Sub Agent Aシステムの WAFログからブロック動向を調べて昨日Aシステムにモロッコから大量の攻撃があったけど全てブロックされていたよ・・ Toolを使って取得した巨大な生のログ・・

Context Engineering手法（３） FileSystem 2026/2/4 13 • Toolからの巨大なOutputをそのままLLMに返すのではなく、全文はFileに退避し、LLMには一部のOutputとそのレファレンスだけを返す • 前提としてAgentにglob、grep、writeなど、FileSystemを操作できるTool
を与える必要があり、 LLMが必要に応じてFileから取得できるようにする https://www.blog.langchain.com/context-management-for-deepagents/

Context Engineering手法（４） Memory 2026/2/4 14 • System Promptに事前に定義しておくことが難しいユーザごと、システムごと、部署ごとなどの情報をDBなどに保存しておいて動的にLLMに渡す
• LangChain/LangGraphのStoreや AWSのAgentCore Memoryなどを使って実装可能 Memory DB Aユーザのメモリ（好みなど） Bユーザのメモリ（好みなど） Cユーザのメモリ（好みなど） Aユーザ Agent 質問 Aさんからの質問だ！ Aさんのユーザメモリを参考にしてAさんに合わせた回答をしよ！

A-skillの具体的な指示など Context Engineering手法（５） Skills 2026/2/4 15 • System Promptには必要最低限の情報だけを記載しておいて、詳細な指示や仕様などはFileに定義しておき、必要な時に必要な
情報だけを段階的にContextに取り込むことで、Contextの量を抑える（Progressive disclosure） Before System Prompt ------------------ Aの時は〜を使って、〜を確認して・・・ Bの時は〜を使って、〜を確認して・・・ After System Prompt --------------------------- Available skills name: A-skill description: A skillの簡略な説明 name: B-skill description: B skillの簡略な説明 FileSystem A-skill/ ├── SKILL.md ├── scripts/ ├── references/ └── assets/ B-skill/ ├── SKILL.md ├── scripts/ ├── references/ └── assets/ A-skillが必要なリクエスト Context Window

Context Engineering手法（６） ToolのOutput最適化 2026/2/4 16 • ToolからのOutputをLLMにより最適なフォーマットに変換した上でLLMに返す • ToolのOutputが一定のサイズを超える場合、Tool側で
Outputを返さずに「結果が大きすぎます。時間範囲やフィルタ条件を絞り込んでください」のようなガイドメッセージを返すことで、LLMが自らクエリを修正して再実行できるようにする

アラート原因分析Agentで試した手法 2026/2/4 17 • Sub Agentパターンは、結局Sub Agent側でも1回の推論で実行されるToolのOutputが大きすぎると同じ問題が起きる • Skills、Memoryは必要な時に必要な分だけをContextに取り入
れるための仕組みであって、ToolからのContext管理には適用できない • FileSystem手法は改修範囲が大きいため、まずは「要約」と「ToolのOutput最適化」２つを試すことに

2026/2/4 18 アラート原因分析Agentへの適用（１）要約

LangGraphでの要約 2026/2/4 19 • LangChain v1.0で追加されたSummarization MiddleWare の利用を検討したが、LangGraphではネイティブには使えず、 CustomのSummarization MiddleWareを自作することに
• LangGraphでは以下のように明示的に次のステップを指定する形なので、Tool実行後LLMに返す前に必ずSummarization Middlewareを挟むように修正 ➢ Summarization Middlewareで累積Token数を見て、Token数が基準値未満だったら何もせずそのままLLMに返して、基準を超えていたら要約してからLLMに返す workflow.add_edge("execute_tool", "custom_message_summarization_middleware") workflow.add_edge("custom_message_summarization_middleware", "call_llm")

要約処理でハマったポイント（１）要約しすぎの問題 2026/2/4 20 • 直面した問題 ➢ Contextを要約しすぎて、要約後に重要なポイントが抜け落ち、 Agentが同じToolを再実行したり、次のアクションを正しく判断できなくなる事象が起きた
• どう解決したか ➢ Structured Outputを使って、「それまでに実行したこと/その結果」、「発見したこと」、「まだ確認できてないこと」、「次の推奨アクション」を必ず残すようにして解決

要約処理でハマったポイント（２） Token計算 2026/2/4 21 • 直面した問題 ➢ 累積Token数のメタデータはLLM呼び出し後しか存在せず、Tool実行直後（LLMに返す前）のToolのOutputを含めた累積Token数は自分で求める必要があった
➢ BedrockのCountTokens APIがあったが、同じInput Tokenの上限が適用され、累積メッセージが大きすぎる場合、エラーになる • どう解決したか ➢ LangChainに内部でToken数計算に使う関数があったため、それを直接利用することで解決

要約処理でハマったポイント（３）要約のためのバッファが残ってない 2026/2/4 22 • 直面した問題 ➢ 要約のタイミングで、すでにContextがLLMのInput Tokenの上限を超えてしまっていて、要約させることができない
• どう解決したか ➢ Tokenの上限がより大きいLLM （Gemini）にフォールバック ➢ ToolのOutputが一定の文字数を超えた場合、超過分を切り捨ててからLLMに返す

2026/2/4 23 アラート原因分析Agentへの適用（２） ToolのOutput最適化

TOON（Token-Oriented Object Notation） 2026/2/4 24 • LLM入力用として設計された、JSONからトークンを最小限に抑え、モデルが構造を追いやすいコンパクトなフォーマットに変換してくれるライブラリ •
メトリクスなど、同じフィールド（timestamp, valueなど）が繰り返されるデータでは、JSONだとキーが毎回重複するのに対して、TOONは（CSVのように）ヘッダーを1回だけ宣言してデータだけを並べるため、特に効果が大きい • 導入後、約10％のToken数削減の効果が見られた https://toonformat.dev/guide/getting-started

※補足: Memoryを使ったユーザごとのカスタマイズ 2026/2/4 25 • 先日のUpdateで能動的にAgentを呼び出せるようになった • アラート契機の場合は、そのアラート分析に必要な情報とToolだけをピンポイントで事前に取得・設定してからAgentを実行するので、空振りが少ない
しかし、能動的なAgentは汎用的なので、空振りが多い • LangChain/LangGraphのStore機能を使ってユーザごとに専用のメモリ（例: 使ってる監視ツール、担当システムなど）を設定できるようにし、能動的な利用時でもユーザに合った適切な Toolや情報ソースを選択できるようにした

今後について 2026/2/4 26 • Sub Agentパターンで、Sub Agentは安価なModelを使ったり、 Contextの隔離で分析にかかるLLMのコストを削減できるか検証 • FileSystemを活用するパターンも試して、
ToolのOutputが大きい場合、切り捨てるのではなく、全文をFileに退避し、LLM が必要に応じてFileから参照できるようにする

2026/2/4 27 まとめ

要件にあったContext Engineering手法を選ぶ 2026/2/4 28 • 様々なContext Engineeringの手法が出ている • まずは要約など、手軽に試せるものから始めて、必要に応じて他の手法を追加していく
• 自分たちのAgentの要件にあった手法を選択

ご清聴ありがとうございました！

Context Engineeringの取り組み

Context Engineeringの取り組み

nutslove

More Decks by nutslove

Other Decks in Technology

Featured

Transcript

2026/2/4 李俊起 Context Engineeringの取り組み AI運用勉強会 #2

自己紹介 2026/2/4 2 名前李俊起（イジュンギ） / Joonki Lee

アジェンダ 2026/2/4 3 • 開発しているAgentについて • Context関連で直面した課題 • Context Engineeringの手法

2026/2/4 4 アラート原因分析AI Agent

2026/2/4 6 Context関連で直面した課題

Context Window管理 2026/2/4 7 • Context溢れ ➢ 1回の推論で複数のツールが呼び出されたりすると、Outputが膨大な量になって、LLMのInput Tokenの上限を超過してエラーになる

2026/2/4 8 Context Engineeringの手法

Context Engineeringとは 2026/2/4 9 • Agent（LLM）が適切な判断を下すために必要な情報（Context）を設計・管理するための概念・手法 • Agentの普及により、System Promptの管理（Prompt

Contextが肥大化すると何が問題なのか 2026/2/4 10 • LLMの回答精度低下 • LLMのInput Tokenの上限を超えてしまう ➢ Agentの処理が途中で中断されてしまう（実装による）

Context Engineering手法（１）要約（Summarization） 2026/2/4 11 • Contextが大きくなったらそれまでのContextを要約し、 Context Windowが溢れることを防ぐ System

Context Engineering手法（２） Sub Agent 2026/2/4 12 • Sub AgentはSupervisor Agentとは別の、

Context Engineering手法（４） Memory 2026/2/4 14 • System Promptに事前に定義しておくことが難しいユーザごと、システムごと、部署ごとなどの情報をDBなどに保存しておいて動的にLLMに渡す

A-skillの具体的な指示など Context Engineering手法（５） Skills 2026/2/4 15 • System Promptには必要最低限の情報だけを記載しておいて、詳細な指示や仕様などはFileに定義しておき、必要な時に必要な

Context Engineering手法（６） ToolのOutput最適化 2026/2/4 16 • ToolからのOutputをLLMにより最適なフォーマットに変換した上でLLMに返す • ToolのOutputが一定のサイズを超える場合、Tool側で

アラート原因分析Agentで試した手法 2026/2/4 17 • Sub Agentパターンは、結局Sub Agent側でも1回の推論で実行されるToolのOutputが大きすぎると同じ問題が起きる • Skills、Memoryは必要な時に必要な分だけをContextに取り入

2026/2/4 18 アラート原因分析Agentへの適用（１）要約

LangGraphでの要約 2026/2/4 19 • LangChain v1.0で追加されたSummarization MiddleWare の利用を検討したが、LangGraphではネイティブには使えず、 CustomのSummarization MiddleWareを自作することに

要約処理でハマったポイント（２） Token計算 2026/2/4 21 • 直面した問題 ➢ 累積Token数のメタデータはLLM呼び出し後しか存在せず、Tool実行直後（LLMに返す前）のToolのOutputを含めた累積Token数は自分で求める必要があった

要約処理でハマったポイント（３）要約のためのバッファが残ってない 2026/2/4 22 • 直面した問題 ➢ 要約のタイミングで、すでにContextがLLMのInput Tokenの上限を超えてしまっていて、要約させることができない

2026/2/4 23 アラート原因分析Agentへの適用（２） ToolのOutput最適化

TOON（Token-Oriented Object Notation） 2026/2/4 24 • LLM入力用として設計された、JSONからトークンを最小限に抑え、モデルが構造を追いやすいコンパクトなフォーマットに変換してくれるライブラリ •

今後について 2026/2/4 26 • Sub Agentパターンで、Sub Agentは安価なModelを使ったり、 Contextの隔離で分析にかかるLLMのコストを削減できるか検証 • FileSystemを活用するパターンも試して、

2026/2/4 27 まとめ

要件にあったContext Engineering手法を選ぶ 2026/2/4 28 • 様々なContext Engineeringの手法が出ている • まずは要約など、手軽に試せるものから始めて、必要に応じて他の手法を追加していく

ご清聴ありがとうございました！