育つMemoryと残る汚染 - 家族エージェント3ヶ月で見えた責務の境界

1‹#› 育つMemory と残る汚染 NRI ネットコム TECH AND DESIGN STUDY #100
2026 年05 月28 ⽇志水友輔 NRI ネットコム株式会社ユースケのユースケース Case8 家族エージェント3 ヶ月で⾒えた責務の境界

あなたの記憶、嘘ですか？ホントですか？私は嘘もホントも昨日の晩飯も忘れます 2

Copyright （C ） NRI Netcom, Ltd. All rights reserved. 志水
友輔 ( しみずゆうすけ) NRI ネットコム株式会社 / Cloud Architect PoC ・アーキテクト・技術広報 AWS Ambassador(2023-25) Amazon Bedrock AgentCore/CDK/ カメラ/ つけ麺息子からのなぜなぜ攻撃で疲弊中 #nncstudy Blog: 3

Copyright （C ） NRI Netcom, Ltd. All rights reserved. 3
ヶ月の運⽤記録 #nncstudy 4

Copyright （C ） NRI Netcom, Ltd. All rights reserved. 何を作ったか
― 家族エージェントの構成 #nncstudy Runtime Memory LINE をインターフェースとした、家族向けの情報ハブエージェントプリントを撮って送り、持ち物や予定をLINE で聞く記憶機構: AgentCore Memory を活用独自機能: 画像分析機能（プリントやお知らせを OCR ＋構造化） 5 Lambda Bedrock AgentCore Webhook

Copyright （C ） NRI Netcom, Ltd. All rights reserved. AgentCore
Memory ：2 戦略で始めた理由 #nncstudy 6 戦略抽出ターゲット採用判断 Semantic 事実（Facts ）採用：家族情報は「事実」が中心 User Preference 嗜好（Preferences ）採用：好みの把握も有用 Summary 会話要約見送り：セッション超えの要約は不要 Episodic イベント・教訓見送り：タスク実行記録は不要

Copyright （C ） NRI Netcom, Ltd. All rights reserved. 採用しなかった選択肢（Knowledge
Base ） #nncstudy 7 構成特徴（役割）本構成での採用 AgentCore Memory 単独対話からの個人化（ユーザーとは誰か、過去に何があったか） ★ 採用（現状） Memory + KB 並走個人化＋原本ベースの事実知識（信頼できるソースは何か）見送り KB 単独 (RAG) 対話からの動的抽出を持たない、静的なナレッジ検索見送り公式推奨は Memory と Knowledge Base の「並走」だが、今回は Memory 単独構成を選択

Copyright （C ） NRI Netcom, Ltd. All rights reserved. Memory
の動作モデル (Extraction Job) #nncstudy 8 Memory の抽出処理は LLM ベースで行われます。「発話とレコードが1 対1 」ではありません。 1 つのJob が読んだ会話セットから、抽出LLM が複数の事実を並列に⽣成全て同じタイムスタンプ会話セット USER + ASSISTANT 抽出LLM ・命令（指⽰書）・データ事実 N 件（0 件もあり）

Copyright （C ） NRI Netcom, Ltd. All rights reserved. 短期記憶(Events)
と長期記憶(Records) #nncstudy 9 Events ( 短期記憶) 1 発話 = 1 event 会話の生ログ。コンテキストウィンドウに直接入る情報 90 日で期限切れ例：user 「土曜の英会話教室B の持ち物は？」　　agent 「プリントとお茶と... 」 Memory Records ( 長期記憶) 1 事実 = 1 record Extraction Job の出力。構造化されベクトル化された情報明示的に削除されるまで永続例：「英会話教室B に通っている」　　「英会話教室B では給食がある」 Events も Memory Extraction Job の入力になる

ヶ月で266 件 ― Memory はちゃんと育つ 3 ヶ月で 266 件の長期記憶が蓄積 5 actors / 50 sessions / 266 records メイン Actor (C998ff8d4...) に偏在：facts 196 件（76% ） Caffc Actor ：39 件 preferences は少なめ（嗜好は事実より抽出されにくい） Memory は自動で育つ ― AgentCore の良いところ #nncstudy 10

Copyright （C ） NRI Netcom, Ltd. All rights reserved. 自⼰汚染の発⾒
#nncstudy 11

Copyright （C ） NRI Netcom, Ltd. All rights reserved. 5/2
の会話タイムライン Step 0 （5/1 10:12 ）：幼稚園A 「春のえんそく」お知らせ画像分析（給食袋言及あり） Step 1 （5/2 09:54:24 ）：user 「毎週土曜の英会話教室B いくときの持ち物教えて」← 給食には触れていない Step 2 （5/2 09:54:33 ）：agent 誤回答「給食がある日は追加で：コップ、スプーン・フォーク入れ」 Step 3 （自動）：Memory Extraction Job が agent 出⼒を「事実」として保存 Step 4 （後刻）：次質問時、汚染レコードを参照して再び誤回答 Step 5 （10:18:17 ）：user 「英会話教室B には給食ない」と訂正 Step 6 （10:18:20 ）：agent 「完全に私の混乱でした」と謝罪 #nncstudy 12

Copyright （C ） NRI Netcom, Ltd. All rights reserved. 自⼰汚染とは
3 点突合（assistant 発話由来の立証） user 発話：「毎週土曜の英会話教室B ⾏くときの持ち物教えて」 assistant 発話：「給食がある日は追加で：コップ、スプーン・フォーク入れ」 Memory レコード：「英会話教室B では給食が提供される日がある」「給食」は user 発話に存在せず、assistant 発話と Memory にのみ存在訂正後（10:18 ）も汚染レコードは残存 / 3 日経過 / 16 ⽇経過時点でも⽣存定義：自⼰汚染 / self-contamination agent が混同して出した誤回答が、会話履歴経由で長期記憶に「事実」として固定化される現象 LLM の指示違反ではなく、データパイプライン仕様に起因する構造的現象言い換え：ハルシネーションの永続化 #nncstudy 13

Copyright （C ） NRI Netcom, Ltd. All rights reserved. 訂正しても残る
訂正発話は既存を Update せず、別レコードとして並列追加される既存の汚染レコードはそのまま残る → 訂正したのに、汚染①は消えない #nncstudy 14 時刻内容分類 5/2 09:54:33 英会話教室B に通っている正常 5/2 09:54:33 英会話教室B では給食日あり汚染① 5/2 10:18:20 英会話教室B がある日は給食がない訂正（並列追加）

日後、嘘は育っていた 5/12 に合成汚染が生成（5/2 汚染① + 幼稚園A コップ持参情報を合体） 16 日経過、4 レコード全て⽣存冒頭の266 件、実は嘘も育っていた #nncstudy 15 時刻内容分類 5/2 09:54:33 英会話教室B に通っている正常 5/2 09:54:33 英会話教室B では給食日あり汚染① 5/2 10:18:20 英会話教室B がある日は給食がない訂正（並列追加） 5/12 08:17:32 英会話教室B 給食日にコップ持参拡大汚染

Copyright （C ） NRI Netcom, Ltd. All rights reserved. 矛盾の並置
― Memory の仕様 vs 実機で起きたこと #nncstudy 16 Memory の仕様・公式の言い分実機で起きていること Extract ONLY from user messages agent の誤回答が事実として保存された学習して育つ訂正しても並列で残った Prioritize recency 16 日後にむしろ強化された

Copyright （C ） NRI Netcom, Ltd. All rights reserved. 戦略間対比
― facts 4 件 vs preferences 0 件同じ Memory リソース・同じ Actor ・同じ会話を入力汚染レコード：SEMANTIC （facts ） 4 件 / USER_PREFERENCE （preferences ） 0 件「USER_PREFERENCE は安全」と短絡しない両戦略のシステムプロンプトは同じ：user 発話のみ抽出と命令両戦略とも公式の仕様説明は同じ：実装は USER と ASSISTANT 両方を処理構造的弱点は両戦略共通差の正体 = 内容形式のミスマッチ SEMANTIC ：「事実」抽出 → 「給食日あり」は事実形でターゲット⼀致 USER_PREFERENCE ：「嗜好」抽出 → 事実形ではない #nncstudy 17

Copyright （C ） NRI Netcom, Ltd. All rights reserved. なぜ起きるか①
― 発生のメカニズム原因1 ：発生（段階①）= 公式ドキュメント自体が⽭盾している LLM への命令：「Extract ONLY from the user messages 」公式の仕様説明：「processes only USER and ASSISTANT role messages 」 LLM の入力データに ASSISTANT が混ざる以上、命令で完全には縛れない 5/2 の汚染はバグではなく仕様通りの挙動 #nncstudy 18

Copyright （C ） NRI Netcom, Ltd. All rights reserved. なぜ起きるか②
― 残存のメカニズム + 結論原因2 ：残存（段階③）= SEMANTIC Consolidation は recency 優先ではない「Prioritizing recency 」は USER_PREFERENCE 文脈 SEMANTIC Consolidation ：「New fact contradicts existing → use AddMemory 」訂正発話が来ても Update されず並列追加 → 5/12 のように増えていく結論：責務は Memory の外側に置くしかない DeleteMemoryRecord API はあるが、いつ消すかの判断は AgentCore の責務外プロンプト / パイプライン両面で完全制御は不可能訂正検知レイヤを自前で持つしかない #nncstudy 19

Copyright （C ） NRI Netcom, Ltd. All rights reserved. 全戦略の構造的弱点（EPISODIC
/ SUMMARY 含む）戦略によって汚染の形態が変わる SEMANTIC + USER_PREFERENCE は最も汚染が固定化しやすい組み合わせ #nncstudy 20 戦略発生残存構造的特徴 SEMANTIC 高高 5/2 観測ケース USER_PREFERENCE 中高推測 preference が残留 EPISODIC 高高 reasoning / tool が抽出対象、誤教訓が永続化 SUMMARY 中中 session スコープが防壁、誤要約は残る

Copyright （C ） NRI Netcom, Ltd. All rights reserved. 軽度の歪み3
つ（⾃⼰汚染との対比） ①〜③は「気づけば直る」軽度の歪み ④は構造的要因が別物（プロンプト命令で縛れない） #nncstudy 21 パターン深刻度直し方 ① 同一エンティティの呼称揺れ中気づけば修正可、検索精度低下 ② 同一スケジュールの重複・上書き不在中気づけば修正可、古い情報を返す ③ 時期相対表現の意味劣化中気づけば修正可、時系列誤判断 ④ 自⼰汚染高気づいても直らない / 時間とともに育つ

層モデル（内側 / Events / 外側）+ Knowledge Base 並走内側：AgentCore Memory （長期記憶、事実抽出、ベクトル検索） Events 層：短期記憶（生会話ログ、Extraction Job の入⼒）外側：訂正検知 / 削除ロジック（顧客側で実装） KB 並走：内側を補完する別アーキテクチャ AgentCore Memory （個人化）+ Bedrock KB / RAG （原本ベースの事実知識）原本ベースの retrieval で誤情報の検出余地が増える家族エージェントは現状未採用 → 対処策の選択肢として再評価 #nncstudy 23

Copyright （C ） NRI Netcom, Ltd. All rights reserved. 対処策の全体像
#nncstudy 24 対処策レイヤ効果 appendToPrompt 内側のプロンプト調整 △ デフォルトに同じ命令ありで効果限定 Self-managed strategy 内側の抽出ロジック自前化 ◎ 完全制御可、ただし工数⼤ Knowledge Base 並走内側を補完する別アーキ ◦ 原本ベースの retrieval で検出余地訂正検知 Lambda 外側 ◦ user の「違う」を検知して該当レコード削除 DeleteMemoryRecord 外側 ◦ 手動 or ⾃動で汚染レコード削除

Copyright （C ） NRI Netcom, Ltd. All rights reserved. 家族＝最小の組織
― 渡せた∕渡せなかった渡せたこと（agent / システム側に委ねて良かった）お知らせプリントの画像分析・構造化持ち物リストの整理・チェック過去の質問・回答の参照（コンテキスト維持）インタフェース選択（LINE に置いた判断）渡せなかったこと（人が責任を持つべきだった）「給食日があるか」のような事実の確証訂正の判断（user が「違う」と気づかなければ汚染は残り続けた）メモリの長期メンテナンス（古い汚染レコードの削除判断） #nncstudy 25

育つMemoryと残る汚染 - 家族エージェント3ヶ月で見えた責務の境界

育つMemoryと残る汚染 - 家族エージェント3ヶ月で見えた責務の境界

Yusuke Shimizu

More Decks by Yusuke Shimizu

Other Decks in Technology

Featured

Transcript

1‹#› 育つMemory と残る汚染 NRI ネットコム TECH AND DESIGN STUDY #100

あなたの記憶、嘘ですか？ホントですか？私は嘘もホントも昨日の晩飯も忘れます 2

Copyright （C ） NRI Netcom, Ltd. All rights reserved. 志水

Copyright （C ） NRI Netcom, Ltd. All rights reserved. 3

Copyright （C ） NRI Netcom, Ltd. All rights reserved. 何を作ったか

Copyright （C ） NRI Netcom, Ltd. All rights reserved. AgentCore

Copyright （C ） NRI Netcom, Ltd. All rights reserved. 採用しなかった選択肢（Knowledge

Copyright （C ） NRI Netcom, Ltd. All rights reserved. Memory

Copyright （C ） NRI Netcom, Ltd. All rights reserved. 短期記憶(Events)

Copyright （C ） NRI Netcom, Ltd. All rights reserved. 3

Copyright （C ） NRI Netcom, Ltd. All rights reserved. 自⼰汚染の発⾒

Copyright （C ） NRI Netcom, Ltd. All rights reserved. 5/2

Copyright （C ） NRI Netcom, Ltd. All rights reserved. 自⼰汚染とは

Copyright （C ） NRI Netcom, Ltd. All rights reserved. 訂正しても残る

Copyright （C ） NRI Netcom, Ltd. All rights reserved. 10

Copyright （C ） NRI Netcom, Ltd. All rights reserved. 矛盾の並置

Copyright （C ） NRI Netcom, Ltd. All rights reserved. 戦略間対比

Copyright （C ） NRI Netcom, Ltd. All rights reserved. なぜ起きるか①

Copyright （C ） NRI Netcom, Ltd. All rights reserved. なぜ起きるか②

Copyright （C ） NRI Netcom, Ltd. All rights reserved. 全戦略の構造的弱点（EPISODIC

Copyright （C ） NRI Netcom, Ltd. All rights reserved. 軽度の歪み3

Copyright （C ） NRI Netcom, Ltd. All rights reserved. 次にどうするか

Copyright （C ） NRI Netcom, Ltd. All rights reserved. 3

Copyright （C ） NRI Netcom, Ltd. All rights reserved. 対処策の全体像

Copyright （C ） NRI Netcom, Ltd. All rights reserved. 家族＝最小の組織

Copyright （C ） NRI Netcom, Ltd. All rights reserved. #nncstudy

Copyright （C ） NRI Netcom, Ltd. All rights reserved. #nncstudy