【論文紹介】Agentic Context Engineering : Evolving Contexts for Self-Improving Language Models

Slide 1

Slide 1 text

1 論文紹介 Agentic Context Engineering: Evolving Contexts for Self-Improving Language Models Qizheng Zhang, Changran Hu, Shubhangi Upasani, Boyuan Ma, Fenglu Hong, Vamsidhar Kamanuru, Jay Rainton, Chen Wu, Mengmeng Ji, Hanchen Li, Urmish Thakker, James Zou, Kunle Olukotun 発展コミュニケーション(2025/12/22) 論文紹介者：数理工学専攻1年佐々木研究室白川桃子

Slide 23

Slide 23 text

用語集 LLM(大規模言語モデル) 膨大なテキストデータを学習することで，人間のように文脈理解/生成/応答ができるようなAIモデル．ファインチューニング既存のモデルについて追加で学習を行い，モデル内の数億〜数兆のパラメータを更新する．ドメインに特化したLLMを構築可能．トークン文章を分割しうる最小単位．(≒単語) プロンプトエンジニアリングプロンプト(=LLMへの指示文)が最適なものになるように設計する．コンテキストモデルが生成する際に参考にする，ユーザーの質問/外部情報/過去の対話内容などの文脈全体． RLHF いくつかの生成結果に対して人手でランキング形式のフィードバックを提示し，その内容をモデルの学習に組み込む手法．クエリユーザーからAIに対する質問/問い合わせ/要求のテキスト文． LLMエージェント LLMを基盤とし外部ツール(検索エンジン/APIなど)を活用しながら目標達成のために自律的に計画をたてタスクを遂行するシステム． testデータモデルの学習後に性能を評価するために使う，学習に一度も使っていない未知のデータ． ReAct 推論と行動を繰り返しながら必要な情報を検索し，それを基に新しい提案を生成する枠組み． ICL(In-Context Learning) プロンプト内でタスクを解くデモンストレーションを示し推論させる手法． GEPA トライアンドエラーで良いプロンプトを作成する手法． DC(CU) ノウハウをためながらプロンプトを全て書き直す手法． MIPROv2 指示とデモをベイズ最適化を用いてアップデートする手法． Multi-epoch testデータを複数回反復し，コンテキストを洗練するプロセス．バッチサイズ学習時に一度に処理するデータ数エポック数 trainデータ全体を何回繰り返して学習に用いたか 23

Slide 1

Slide 1 text

Slide 2

Slide 2 text

Slide 3

Slide 3 text

Slide 4

Slide 4 text

Slide 5

Slide 5 text

Slide 6

Slide 6 text

Slide 7

Slide 7 text

Slide 8

Slide 8 text

Slide 9

Slide 9 text

Slide 10

Slide 10 text

Slide 11

Slide 11 text

Slide 12

Slide 12 text

Slide 13

Slide 13 text

Slide 14

Slide 14 text

Slide 15

Slide 15 text

Slide 16

Slide 16 text

Slide 17

Slide 17 text

Slide 18

Slide 18 text

Slide 19

Slide 19 text

Slide 20

Slide 20 text

Slide 21

Slide 21 text

Slide 22

Slide 22 text

Slide 23

Slide 23 text

Slide 24

Slide 24 text