Context is King？〜Verifiability時代とコンテキスト設計 / Beyond "Context is King"

Slide 1

Slide 1 text

Context is King？〜Verifiability時代とコンテキスト設計 2025年12月11日 Asterminds株式会社 r.kagaya 成果に繋がる AI エージェント活用の第一歩 - AI 猛者たちが実践する "コンテキスト設計術"

Slide 2

Slide 2 text

2022年に株式会社ログラスに入社経営管理SaaSの開発、開発生産性向上に取り組んだのち、生成AI/LLMチームを立ち上げ、新規AIプロダクトの立ち上げに従事、その後、25年8月に独立・現職翻訳を担当したAIエンジニアリングがオライリージャパンより出版 Asterminds（アスターマインズ）株式会社共同創業者・CTO r.kagaya(@ry0_kaga) 自己紹介

Slide 3

Slide 3 text

今日の内容 ● コンテキストエンジニアリングやコンテキスト管理のために、どういう観点が必要そうか？などを話します ● 個人での活用だけでなく、組織として管理する際の観点も含まれます ● 色んなコンテキストが登場します.. ● 具体的なツールの細かいTipsよりは、全体の設計や考え方よりの話です広くみれば、コンテキスト設計の話になっています..！

Slide 4

Slide 4 text

Verifiability is King？  

Slide 5

Slide 5 text

その前に

Slide 6

Slide 6 text

Context is King？

Slide 7

Slide 7 text

コンテキストは王様か？コンテキストの重要性は言わずもがな数年前のPrompt Engineeringは、Context Engineeringに拡張された（プロダクト・エージェント開発において顕著、プロンプトレベルの最適化とシステムレベルの設計最適化） AI活用においてもコンテキストをどう蓄積するか？加工するか？活用するか？は最重要な観点組織での利用やAI Opsを考えると尚更

Slide 8

Slide 8 text

LangChainのコンテキストエンジニアリング手法の分類例分類の一つ（書き込み、選択、圧縮、分割） AI活用におけるコンテキスト活用Tipsもどれかに分類されるものが多い（印象）

Slide 9

Slide 9 text

一方で、コンテキストは多ければ多い方が良いのか？

Slide 10

Slide 10 text

「パーソナルデータは新しい時代の石油か？」表現の元となった世界経済フォーラムレポート作成に関わった著者ブログから一部改変の上引用 > パーソナルデータは21世紀の石油という比喩は、石油（精製済みで価値あるもの）ではなく、原油と捉えるべきである。ただ集めるだけではなく、加工・分析して初めて意味を持つものであり、持つこと自体にもリスクがある引用: https://www.sakimura.org/2020/05/4637/

Slide 11

Slide 11 text

Context is not always King コンテキストウィンドウも増加し、ロングコンテキストのタスク性能も向上しているとは言え、一定のコンテキスト劣化（Context Rot）、アテンションバジェットは存在コンテキストも、「過ぎたるは及ばざるが如し」 Lost in the Middle needle hey stack プロンプトの「真ん中」にある情報を見落としやすい傾向大量のコンテキストになるにつれて、特定の情報を参照する能力は低下する傾向

Slide 12

Slide 12 text

優れたコンテキストエンジニアリングは、最小のコスト（トークン数）で、最大の成果or目的とする結果を引き出すコンテキストを設計すること

Slide 13

Slide 13 text

具体的には何をしたら良いのか？（自分も知りたい..）

Slide 14

Slide 14 text

考えている・取り組んでいる内容のご紹介

Slide 15

Slide 15 text

コンテキストエンジニアリングの実践

Slide 16

Slide 16 text

最近考えていることいかにコンテキストを自然に蓄積・加工するか、Verifiableにできるか？収集と加工の Ambient 人間が意識しなくてもコンテキストが貯まる・加工されていくプロセスをいかに作るか？人間の主体的なトリガーなしにも作動する Verifiabilityの担保全てのタスクは、Verifiabilityが担保されている限りにおいては自動化ができうるではVerifiabilityをどう担保する？

Slide 17

Slide 17 text

どういうコンテキスト管理・エンジニアリングができれば良いのか？ AI活用のためのコンテキスト管理で大事だと思っていること4選収集-加工-更新-利用のサイクル全てで頑張れる余地がありそう収集のAmbient化タスク特性による加工 Contextのデトックス人間が意識的に貯める以外で、業務の中で自然に収集される仕組みを作る議事録の自動格納から、Slackメッセージの自動収集とかも？収集されたコンテキストを、自社や自身のタスクで効果的に使える形に加工する e.g. メタデータ付与、一定のルールで抽出・分離・圧縮する古い/重複した情報が AIの判断を惑わせるのを防ぐ言うは易し HookやActionsで知識の自動更新などは始めやすい検索性能！必要な時に、必要な高信号なコンテキストだけを取得できるように必要な時に引き出せなければ、存在しないのと同じ

Slide 18

Slide 18 text

Slide 19

Slide 19 text

どういうコンテキスト管理・エンジニアリングができれば良いのか？ AI活用のためのコンテキスト管理で大事だと感じるポイントの例収集-加工-更新-利用のサイクル全てで頑張れる余地がある収集のAmbient化タスク特性による加工 Contextのデトックス人間が意識的に貯める以外で、業務の中で自然に収集される仕組みを作る議事録の自動格納から、Slackメッセージの自動収集とかも？収集されたコンテキストを、自社や自身のタスクで効果的に使える形に加工する e.g. メタデータ付与、一定のルールで抽出・分離・圧縮する古い/重複した情報が AIの判断を惑わせるのを防ぐ言うは易し... HookやActionsで知識の自動更新などは始めやすい検索性能！必要な時に、必要な高信号なコンテキストだけを取得できるように必要な時に引き出せなければ、存在しないのと同じ

Slide 20

Slide 20 text

Slide 21

Slide 21 text

Slide 22

Slide 22 text

Andrej Karpathy氏のVerifiability（検証可能性） AIの答えや行動が「正しいかどうか」を、自動的かつ確実に判定できるか？ Verifiableなタスクにおいては、AIは加速度的に学習・進化できる引用: https://karpathy.bearblog.dev/verifiability/

Slide 23

Slide 23 text

Verifiability（検証可能性）なタスクの3条件以下3つの特性を満たせば、自動化されたフィードバックループを回せる原文は、AIの学習に寄った内容だが、参考にできる点は多々ありそう Resettable Efficient Rewardable 何度でも最初からやり直せるか？タスクを繰り返し、初期状態から何度もやり直せること AIは試行錯誤を繰り返して、フィードバックサイクルを回せる短時間で大量の試行ができるか？タスクを高速に反復実行できること。膨大な量の練習やサイクルを回せることが最適化の高速化が期待できる結果の良し悪しを自動でスコアリングできる？タスクの結果を明確なスコアや基準で自動的に評価できること AIは何が良い結果かを学習できる

Slide 24

Slide 24 text

例えば: AI Interviewの自動チューニング 1. 理想の会話の流れを定義 2. 上記を元に、AIにAI Interviewを回答させる 3. 評価データとの「ズレ」をJudge AIが測定 4. スコアが最も高くなるまでひたすら回答・チューニングを繰り返させる

Slide 25

Slide 25 text

例えば: AI Interviewの自動チューニング 1. 理想の会話の流れを定義 2. 上記を元に、AIにAI Interviewを回答させる 3. 評価データとの「ズレ」をJudge AIが測定 4. スコアが最も高くなるまでひたすら回答・チューニングを繰り返させる一定自動で検証・チューニングのループを回すことができる

Slide 26

Slide 26 text

AIを上手く使うための一つの考え方はいかにVerifiabilityを成立させるか？にある（かも） AI駆動開発で言うガードレールも近い考え方だと思っている

Slide 27

Slide 27 text

Verifiableにもコンテキストはきっと必要

Slide 28

Slide 28 text

まとめ 

Slide 29

Slide 29 text

まとめ ● Context is not always King. ○ 過剰な情報はノイズになり得る。「足す」技術に加えて、「引く・磨く」技術 ● Context Engineeringの4要素を使いこなす ○ 書き込み/選択/圧縮/分離をタスク特性に合わせて組み合わせる ● 「貯める」から「回す（Ambient & Loop）」へ ○ 人間の作業負荷なくコンテキストが構造化・蓄積されるパイプライン ● Verifiability（検証可能性）はAI自動化の鍵 ○ Resettable（やり直し可）・Efficient（高速）・Rewardable（評価可）な環境を整え、フィードバックループを回し切る

Slide 30

Slide 30 text

おわり