Building Serverless AI Memory with Mastra × AWS

Mastra × AWS におけるサーバーレスな AI メモリの実現 DynamoDB / Aurora
Serverless v2 / Aurora DSQL 実践比較 2025.12.20 JAWS-UG Presents - AI Builders Day Speaker : Yuichi Watanabe @Nulab Inc.

自己紹介 Yuichi Watanabe @Nulab Inc. X: @vvvatanabe GitHub: @vvatanabe 自己紹介

セッション概要 AIエージェントは LLM がステートレス。記憶層の設計が品質とコストに直結する。ここでは「運用負荷を抑える」前提で、どこに何を保存するかを整理する。ポイント DynamoDB / Aurora v2
/ DSQL の向き・不向き Memory 特有の落とし穴（サイズ、ページング、分析、スケールゼロ、運用）要件別の構成パターン（どれを採用すると“何が増える”か）セッション概要

前提：Mastra Memory（何を保存し、どう使う？）

前提：なぜ AI Agent の Memory は難しい？ LLM はステートレス。アプリ側で「記憶」を外部化する必要がある。ただし
Memory は一般的な CRUD とアクセスパターンが違う。追記が多い（会話ログは基本 append-only）一部は頻繁に更新（Working Memory の差分更新）意味検索が必要（Semantic Recall / RAG）サイズが増えやすい（Tool 出力の巨大 JSON、添付、ログ…）分析したくなる（改善ループ：どのツールが効いた？どこで詰まった？）前提：なぜ Memory が難しい？

Round 1 - Amazon DynamoDB スケール特性は良いが、クエリ形状が固定されやすい Round 1 - DynamoDB

スケールは強い。だが Memory は「別部品」と「回避策」が増えがち Mastra 公式アダプタ： @mastra/dynamodb 、内部は ElectroDB（シングルテーブル）特性：アイドル課金が小さい /
スパイク設計がしやすい / DB運用作業が少ない import { DynamoDBStore } from "@mastra/dynamodb"; import { Memory } from "@mastra/memory"; const agent = new Agent({ memory: new Memory({ storage: new DynamoDBStore({ name: "dynamodb", config: { tableName: "mastra-single-table", region: "us-east-1", }, }); }); Round 1 - DynamoDB

DynamoDB の得意・不得意 DynamoDB は想定したクエリは単純で速い。一方、想定外の条件追加は GSI 設計 or スキャンになりがち。
決め打ちの読み取り例：特定スレッドのメッセージを作成日時順に取る後から増える検索・分析例：metadata 条件で絞る、集計したい Memory は「改善のための分析要求」が後から増える → ここで負債化しやすい Round 1 - DynamoDB

DynamoDB の Memory で当たりやすい落とし穴ベクタ検索が別系統：DynamoDB 単体でベクタ検索をサポートしていない 400KB 制限：Tool 出力の巨大 JSON
で破綻しやすい条件検索：スキャン or 事前に GSI（将来の条件が読めない）ページングのギャップ：スレッド・メッセージの UI は offset、DynamoDB は cursor 結論：“DynamoDB が吸収してくれない制約” をアプリ側で吸収し続けることになりがち Round 1 - DynamoDB

DynamoDB の課題と解決策のパターン課題解決策代償 400KB S3オフロード（DDBは索引、本文はS3） GC / 書込順序
/ 整合性ベクタ検索 OpenSearch/pgvector/S3 Vectors など別部品検索と運用が二系統になる検索重要キーだけGSI、残りはETLで分析基盤へ先読み設計 or パイプラインページングカーソルとオフセットの対応表キャッシュ保持仕組みを作るコスト Round 1 - DynamoDB

Round 1 結論マッチする： Conversation History（スレッド・メッセージ）：単純な追加と一覧取得小さめの Working Memory：単一キー更新
+ 条件付き更新（OCC 風）マッチしにくい：柔軟検索・集計：GSI設計か別基盤へ Semantic Recall：ベクタストア別建て巨大ログ：S3オフロード前提になりやすい Round 1 - DynamoDB

Round 2 - Aurora Serverless v2 (PostgreSQL) SQL / JSON
/ トランザクションを使える一方、待機コストと再開遅延を考える Round 2 - Aurora Serverless v2（PostgreSQL）

SQL / JSON / トランザクション / pgvector を“同居”できる Mastra 公式アダプタ：
@mastra/pg 強み：SQL / JSONB / 整合性 / pgvector 論点：待機コスト・再開遅延（auto-pause）・アップデート運用 import { PostgresStore, PgVector } from "@mastra/pg"; const memory = new Memory({ storage: new PostgresStore({ connectionString: process.env.DATABASE_URL! }), vector: new PgVector({ connectionString: process.env.DATABASE_URL! }), }); Round 2 - Aurora Serverless v2（PostgreSQL）

SQL：分析クエリを“必要な時に”書ける例：改善ループで分析したくなるものスレッド単位の滞在時間 / 離脱サイン tool 呼び出しの傾向 metadata（プラン/言語/端末）別の傾向 DynamoDB だと「GSI設計
or ETL」が先に来やすいが、SQLならまず試して回せる Round 2 - Aurora Serverless v2（PostgreSQL）

pgvector：同居できるが、計算リソースを使うベクタ検索を同じDBで完結できて構成が単純ただしインデックス構築/維持でメモリ要求が増えやすいベクタの次元・件数が増えるほど特に HNSW（Hierarchical Navigable Small Worlds）
Aurora Serverless v2 では ACU（メモリ/CPU）設計がそのままコストに返る Round 2 - Aurora Serverless v2（PostgreSQL）

課題：Scale to Zero の現実（auto-pause） Aurora Serverless v2 は 0 ACU
で auto-pause できるが… 再開にレイテンシ（例：十数秒オーダー）長時間停止でさらに遅くなるケースも UX / SLO が厳しいと「0 ACUで止める」運用は採用しにくい Round 2 - Aurora Serverless v2（PostgreSQL）

課題：Reader/Writer の使い分け Aurora は Writer / Reader endpoint が分かれる。 @mastra/pg
は基本「単一pool」なので、分けたい場合はラッパーで吸収。 class AuroraSplitStore implements MastraStorage { constructor(private writer: PostgresStore, private reader: PostgresStore) {} // Read 系 → reader getThread(args) { return this.reader.getThread(args); } listMessages(args) { return this.reader.listMessages(args); } // Write 系 → writer saveThread(args) { return this.writer.saveThread(args); } saveMessages(args) { return this.writer.saveMessages(args); } } Round 2 - Aurora Serverless v2（PostgreSQL）

Round 2 結論：機能は揃うが、待機/運用コストと向き合う 1つのDBに寄せられる SQL / JSONB / 集計 /
整合性 / pgvector サーバーレス運用の論点 auto-pause 再開遅延（SLOに影響）アップデート計画・検証が必要スケールさせるなら Reader/Writer 分離の実装も発生「表現力」を取ると「待機と運用」が付いてくる。これを減らせないか？ → DSQL Round 2 - Aurora Serverless v2（PostgreSQL）

Round 3 - Amazon Aurora DSQL PostgreSQL 互換だが、分散 DB の前提を考慮する
Round 3 - Aurora DSQL

SQL を保ちつつ、従量寄りに寄せたい期待すること DynamoDB の弱点（柔軟検索・集計）を SQL で回収 Aurora v2 のジレンマ（待機/再開）を
軽くできないか DB運用（バージョン追従等）の工数を減らしたい Round 3 - Aurora DSQL

DSQL を Mastra から使う：アダプタで吸収する Mastra 公式アダプタが未整備 → @mastra/dsql を自作 PR:
#10930 （レビュー中） Round 3 - Aurora DSQL

DSQL を Mastra から使う：アダプタで吸収する内部で AWS公式の @aws/aurora-dsql-node-postgres-connector を使用 IAM 認証、接続トークン生成を隠蔽。
使用例： import { DSQLStore } from '@mastra/dsql'; const store = new DSQLStore({ id: 'my-dsql-store', host: 'abc123.dsql.us-east-1.on.aws', }); Round 3 - Aurora DSQL

踏んだポイント：DDL / スキーマ / JSON 非同期 DDL ストレージアダプタ内の初期化(インデックス作成)処理で「完了待ち」「失敗時リトライ」
「並行実行の制御」が必要 ALTER TABLE ADD COLUMN はできるが、制約付き追加ができない NOT NULL / DEFAULT / CHECK を “追加と同時” に適用できない前提の設計が必要 JSON/JSONB を列型として持てない TEXT 保存して必要時に CAST SELECT * FROM threads WHERE (metadata::jsonb)->>'plan' = 'pro'; Round 3 - Aurora DSQL

踏んだポイント：サイズ上限 TEXT / bytea がおおよそ2MB 上限、行サイズにも上限 Tool 出力が大きいと S3
オフロードが必要になる DynamoDB と同じ発想（DBは索引、本文はS3） PRを送っている @mastra/dsql はオフロード機能は未実装（改めて検討） Round 3 - Aurora DSQL

踏んだポイント：楽観的同時実行制御（OCC）楽観ロックによる競合時に SQLSTATE 40001 （serialization error）で失敗する対応：Exponential Backoff + Jitter
で再試行 → 再試行ロジックはアプリ全体に撒かずストレージアダプタに閉じ込める Round 3 - Aurora DSQL

Round 3 結論：SQL×従量寄り。ただし“分散DBの前提”は吸収が必要 DynamoDB の課題の一部を回収：SQL で検索・集計が書ける Aurora v2 の課題の一部を回収：待機コスト/運用を軽くできる実装コスト（ストレージアダプタでの吸収ポイント）
非同期DDL / 制約 / JSONの扱い / 競合（OCC+retry） pgvector が使えない（拡張未サポート前提） → Semantic Recall は別コンポーネントが必要 Round 3 - Aurora DSQL

補足：Amazon S3 Vectors 補足：Amazon S3 Vectors

サーバーレスなベクターストアとして切り出す S3 上のベクタに対して検索（vector bucket / vector index）大規模スケール例：1 index
あたり最大 20 億 vectors（以前は5,000万だったの40倍）など filterable / non-filterable metadata で絞り込み可能 DynamoDB / DSQL の “ベクタ検索を同居できない” を、別のサーバーレスサービスで補う補足：Amazon S3 Vectors

Mastra から使う：@mastra/s3vectors 当時公式のアダプタが無かったので @mastra/s3vectors を自作 Mastra本体にマージ済 PR:#6801 補足：Amazon S3 Vectors

Mastra から使う：@mastra/s3vectors 使用例： import { S3Vectors } from "@mastra/s3vectors"; const
vector = new S3Vectors({ vectorBucketName: process.env.S3_VECTORS_BUCKET!, clientConfig: { region: process.env.AWS_REGION! }, // 大きいテキストは filter に使わない（容量と制約対策） nonFilterableMetadataKeys: ["content"], }); const memory = new Memory({ vector }); 補足：Amazon S3 Vectors

課題：Semantic Recall は「単一 index 前提」現状の Mastra 本体の実装だと、Semantic Recall のベクトルが「単一の
index」に保存される。やりたいこと：テナント分離（セキュリティ）大規模SaaSで index を分割して運用（シャーディング）補足：Amazon S3 Vectors

回避策：RequestContext で Memory を差し替える Mastra は Request の文脈を受け取り、Memory決定を関数にできる。バケット単位での指定制限有り。
（インデックス単位で選択する仕組みが欲しい） new Agent({ memory: ({ requestContext }) => { const tenantId = requestContext.get<string>("tenantId"); return new Memory({ vector: new S3Vectors({ vectorBucketName: `my-vector-bucket-${tenantId}`, // バケット単位 clientConfig: { region: process.env.AWS_REGION! }, }), }); }, }); 補足：Amazon S3 Vectors

まとめまとめ

比較マトリクス観点 DDB + S3 Vectors Aurora v2 + pgvector
DSQL + S3 Vectors 待機コスト ◎ △（0ACU/再開遅延） ◎ 初回応答 ◎ △（再開が課題） ◎ 検索/分析 △（設計必須） ◎（SQL/JSONB/集計） ◦（SQLだが制約あり）実装コスト高（回避策多め）小（接続/運用が焦点）小（@mastra/dsql）運用コスト低中（バージョンアップ）低 Vector検索 ◦（S3 Vectors補完） ◎（DB内完結） ◦（S3 Vectors補完）まとめ

要件別・構成パターン A. SQL で分析・運用しつつ、寄せ先を 1 つにまとめたい Aurora Serverless v2 +
pgvector （検索、集計、JSON、ベクタを同居させやすい） B. 運用コストを抑え、SQLを使用したい Aurora DSQL + S3 Vectors 分散 DB 側の制約はアダプタに閉じ込める（ @mastra/dsql がマージされたら楽） C. 運用コストを抑え、まず動かしたい DynamoDB + S3 Vectors も候補ただし回避策（サイズ制限/Offload/別ベクタ/分析/ページング）は自前まとめ

ご清聴ありがとうございましたまとめ

Building Serverless AI Memory with Mastra × AWS

Building Serverless AI Memory with Mastra × AWS

More Decks by vvatanabe

Other Decks in Technology

Featured

Transcript