嗚呼、当時の本番環境の状態で AI Agentを再評価したいなぁ... / Ah, I wish I could re-evaluate the AI Agent in the production environment it was in back then...

嗚呼、当時の本番環境の状態で AI Agentを再評価したいなぁ ... 第16回 Data-Centric AI勉強会

© LayerX Inc. 3 バクラク事業部 BizOps部データグループ TechLead 兼 Platform
Engineering部 SRE Snowﬂake Squad 2025 Snowﬂake九州ユーザー会主宰 SNS 𝕏 civitaspo civitaspo その他画像を⼊れてね civitaspo （ｷﾋﾞﾀｽﾎﾟ/ きびちゃん）⾃⼰紹介

会社紹介

© LayerX Inc. 5 会社紹介すべての経済活動を、デジタル化する。 Mission ⼈類の未来をより良くする。そのために私たちは、テクノロジーの可能性を探求し、
経済活動における複雑で⼤きな課題に挑む。仕事や暮らしの中にある摩擦が解消され、それぞれの創造⼒が発揮されている。そんな希望あふれる優しいデジタル社会を、未来に残していくために。

© LayerX Inc. 6 会社紹介出典: シリーズBで150億円を調達。エンジニアの採⽤を強化し、AIエージェント事業をさらに加速 / ニュース /
株式会社LayerX

© LayerX Inc. 7 会社紹介⾦融基盤AI-DX エンタープライズ向け AIプラットフォームコーポレートAI-SaaS Fintech事業
Ai Workforce事業バクラク事業

バクラクの⽬指す世界と、信念

© LayerX Inc.　 9 バクラクの事業領域 Coming Soon AIエージェント HCM領域稟議・ワークフロー
領域 BSM / ARM領域 Payment 領域 Coming Soon

☀ Bassemer Venture Partners曰く基礎モデルのパフォーマンスが収束するにつれ、真の差別化要因は単なる精度ではなく、モデルが環境内でどのように、いつ、そしてなぜ機能するかを正確に把握することになるでしょう。評価をスケーラブルで説明可能、そしてエンタープライズ対応にできるスタートアップこそが、AI導入の次の波を切り開き、インフラの新たなフロンティアを定義するでしょう。 https://www.bvp.com/atlas/the-state-of-ai-2025

AI申請レビューの過去データを使った評価

🙌 AI Agentの過去データを使ったバックテスト基盤が欲しい 🛠 Dev: AI Agent機能の実験/評価がはかどる 👔 Sales: 提案に使える(この機能を導入すると一ヶ月で差し戻しがN件減ります)
󰠀 User: 自分で設定したAI Agent機能の効果をチェックできる 🤖 Agent: 自分で作ったレビュールールをチェックし、自己修復を回せるようになる。 Data-CentricにAI Agentの精度を改善し、ビジネスも改善していく基盤が欲しい！

😭 過去データなんてない！！ AI時代が到達する以前、特にB2B SaaSでは過去のデータにアクセスできることは重要な機能ではありませんでした(一体誰が過去の差し戻された時点の申請をもう一度見たいと思うでしょうか？)。

しかしAI時代の到来によりこの当たり前は大きく変わりました。今ではユーザー自身が過去のデータを使い、ユーザーが設定した AI Agentを評価する時代です。

😭 過去データにアクセスできる状態にしなくては！！！

Snowﬂakeで過去のデータベースの状態へアクセスする

© LayerX Inc. 21 • UDFの⼀種で、表形式のデータを返却できる機能 • BigQueryやDatabricksではTable Functions、またはTable-valued function
(TVF) と呼ばれる。補⾜: Tabular SQL UDFs (UDTFs) スナップショット機能のインターフェース出典: Tabular SQL UDFs (UDTFs) | Snowﬂake Documentation 出典: Table functions | BigQuery | Google Cloud Documentation 出典: Table-valued function (TVF) invocation | Databricks on AWS

おことわり

© LayerX Inc. 23 • ここからcivitaspoのパートでは、スナップショット取得機能のみにフォーカスしてお話します。 Data-Centric AIというかデータ基盤な話になるのをご容赦ください。 • DWHソリューションとしてSnowﬂakeを利⽤している前提で書いています。BigQueryなど他のソ
リューション向けにも補⾜をしますが、⾜りなければ質問してください。 • 『AI Agentのビジネス価値を計るバックテスト基盤の構築』を⽀えるSnowﬂake上での任意時点のスナップショット取得を実現するデータパイプライン - LayerX エンジニアブログにて弊社の事例を書きましたが、本スライドでは理解を促すために⼀部簡略化して説明しています。おことわり

スナップショット取得機能で使⽤するデータソース

© LayerX Inc. 25 • MySQLのテーブルを定期的にフルダンプしたデータ • MySQLのChange Data Capture
2種類のデータソースを使⽤するスナップショット取得機能で使⽤するデータソース

© LayerX Inc. 26 • Aurora Cluster ExportでS3にParquetとして定期的にフルダンプ • S3上のParquetファイルをSnowﬂakeからExternal
Tableとして参照 MySQLのテーブルを定期的にフルダンプしたデータスナップショット取得機能で使⽤するデータソース参考: Aurora Cluster Exportで出⼒したデータをdbtを使ってSnowﬂakeへImportする - LayerX エンジニアブログ

© LayerX Inc. 27 • AWSのAuroraが持つ機能。 • データベースに負荷をかけることなくS3へ全データをフルダンプできる。 • Aurora
MySQLだけでなく、Aurora PostgreSQLでも出⼒可能。 • 出⼒されるデータはParquetに変換される。 ◦ 型マッピング: Considerations for DB cluster snapshot exports - Amazon Aurora 補⾜: Aurora Cluster Export スナップショット取得機能で使⽤するデータソース参考: Exporting DB cluster data to Amazon S3 - Amazon Aurora

© LayerX Inc. 28 • Debeziumを使って、MySQLのbinlogからCDCを取得 • 取得したCDCはManaged Streaming for
Apache Kafkaを経由してSnowflakeへ • 平均約1分程度の遅延でSnowflakeに格納される MySQLのChange Data Capture（CDC）スナップショット取得機能で使⽤するデータソース参考: 『AI Agentのビジネス価値を計るバックテスト基盤の構築』を⽀えるSnowflake上での任意時点のスナップショット取得を実現するデータパイプライン - LayerX エンジニアブログ

© LayerX Inc. 29 • 様々なデータベースからCDCを取得するOSS ◦ MySQLの場合は binlog から
◦ PostgreSQLの場合は WAL から • Kafka Connectを使⽤している場合は Exactly-Once Semantics で動作させることが可能なため、重複や⽋損なくデータを Kafka に吸い出せる。 • 内部的には、binlog のファイル名とpos/row をKafka Connectのメモリ上で管理し、毎回確認することで重複‧⽋損を防いでいる。補⾜: Debezium スナップショット取得機能で使⽤するデータソース参考: Debezium

© LayerX Inc. 30 • SnowﬂakeでStreaming Data Ingestionを実現する機能 • 2025/09/23にV2がGAし、テーブルあたり10GB/sのスループットが出る
• 書き込みから読み出せるようになるまで5~10秒程度補⾜: Snowpipe Streaming V2 スナップショット取得機能で使⽤するデータソース参考: https://docs.snowﬂake.com/en/user-guide/snowpipe-streaming/snowpipe-streaming-high-performance-overview

スナップショット取得機能におけるデータ処理の仕組み

© LayerX Inc. 34 取得したい時刻に最も近い過去のフルダンプを取得スナップショット取得機能におけるデータ処理の仕組み 2025-11-12 03:00:00 2025-11-13 03:00:00
2025-11-12 18:54:11

© LayerX Inc. 35 • 条件に合致する⼀番近しいレコードとJOINするための構⽂ • 今回の例では単⼀の時点を与えられる想定だが、複数の時点を与えられ、それぞれの時点に最も近い過去のスナップショットを取得するっと⾔った要件だった場合、ASOF JOINでの取得が効率良い
補⾜: ASOF JOIN スナップショット取得機能におけるデータ処理の仕組み参考: ASOF JOIN | Snowﬂake Documentation

© LayerX Inc. 36 フルダンプを取得した時間から取得したい時間までのCDCを取得スナップショット取得機能におけるデータ処理の仕組み 2025-11-12 18:54:11 {"op" :"c",
"updated_at": "2025-11-12 03:11:00", "record": {"id": 5, "name": "taro", ...}} {"op" :"u", "updated_at": "2025-11-12 04:11:00", "record": {"id": 2, "name": "jiro-x", ...}} {"op" :"c", "updated_at": "2025-11-12 04:11:00", "record": {"id": 6, "name": "saburo", ...}} {"op" :"u", "updated_at": "2025-11-12 05:11:00", "record": {"id": 6, "name": "saburo-x", ...}} {"op" :"u", "updated_at": "2025-11-12 06:11:00", "record": {"id": 1, "name": "shiro-x", ...}} {"op" :"d", "updated_at": "2025-11-12 07:11:00", "record": {"id": 1, "name": "shiro-x", ...}} {"op" :"c", "updated_at": "2025-11-12 08:11:00", "record": {"id": 7, "name": "goro", ...}} {"op" :"d", "updated_at": "2025-11-12 09:11:00", "record": {"id": 7, "name": "goro", ...}} {"op" :"c", "updated_at": "2025-11-12 10:11:00", "record": {"id": 8, "name": "rokuro", ...}} {"op" :"u", "updated_at": "2025-11-12 11:11:00", "record": {"id": 8, "name": "rokuro-x", ...}} {"op" :"d", "updated_at": "2025-11-12 12:11:00", "record": {"id": 8, "name": "rokuro-x", ...}} {"op" :"u", "updated_at": "2025-11-12 13:11:00", "record": {"id": 3, "name": "nanakuro-x", ...}} {"op" :"u", "updated_at": "2025-11-12 14:11:00", "record": {"id": 3, "name": "nanakuro", ...}}

© LayerX Inc. 37 CDCデータをプライマリーキーに対して最新のレコードだけ取得スナップショット取得機能におけるデータ処理の仕組み 2025-11-12 18:54:11 {"op" :"c",
"updated_at": "2025-11-12 03:11:00", "record": {"id": 5, "name": "taro", ...}} {"op" :"u", "updated_at": "2025-11-12 04:11:00", "record": {"id": 2, "name": "jiro-x", ...}} {"op" :"c", "updated_at": "2025-11-12 04:11:00", "record": {"id": 6, "name": "saburo", ...}} {"op" :"u", "updated_at": "2025-11-12 05:11:00", "record": {"id": 6, "name": "saburo-x", ...}} {"op" :"u", "updated_at": "2025-11-12 06:11:00", "record": {"id": 1, "name": "shiro-x", ...}} {"op" :"d", "updated_at": "2025-11-12 07:11:00", "record": {"id": 1, "name": "shiro-x", ...}} {"op" :"c", "updated_at": "2025-11-12 08:11:00", "record": {"id": 7, "name": "goro", ...}} {"op" :"d", "updated_at": "2025-11-12 09:11:00", "record": {"id": 7, "name": "goro", ...}} {"op" :"c", "updated_at": "2025-11-12 10:11:00", "record": {"id": 8, "name": "rokuro", ...}} {"op" :"u", "updated_at": "2025-11-12 11:11:00", "record": {"id": 8, "name": "rokuro-x", ...}} {"op" :"d", "updated_at": "2025-11-12 12:11:00", "record": {"id": 8, "name": "rokuro-x", ...}} {"op" :"u", "updated_at": "2025-11-12 13:11:00", "record": {"id": 3, "name": "nanakuro-x", ...}} {"op" :"u", "updated_at": "2025-11-12 14:11:00", "record": {"id": 3, "name": "nanakuro", ...}}

© LayerX Inc. 38 • Window関数を条件にフィルタリングするときにQUALIFY句を使⽤する。 • 重複排除の⽂脈でrow_number() と⽤いられ
ることが多い。補⾜: QUALIFY 1 = ROW_NUMBER() OVER ( PARTITION BY pk ORDER BY updated_at DESC ) スナップショット取得機能におけるデータ処理の仕組み参考: QUALIFY | Snowﬂake Documentation

© LayerX Inc. 39 CDCデータを作成‧更新‧削除に分解スナップショット取得機能におけるデータ処理の仕組み 2025-11-12 18:54:11 {"op" :"c",
"updated_at": "2025-11-12 03:11:00", "record": {"id": 5, "name": "taro", ...}} {"op" :"u", "updated_at": "2025-11-12 04:11:00", "record": {"id": 2, "name": "jiro-x", ...}} {"op" :"u", "updated_at": "2025-11-12 05:11:00", "record": {"id": 6, "name": "saburo-x", ...}} {"op" :"d", "updated_at": "2025-11-12 07:11:00", "record": {"id": 1, "name": "shiro-x", ...}} {"op" :"d", "updated_at": "2025-11-12 09:11:00", "record": {"id": 7, "name": "goro", ...}} {"op" :"d", "updated_at": "2025-11-12 12:11:00", "record": {"id": 8, "name": "rokuro-x", ...}} {"op" :"u", "updated_at": "2025-11-12 14:11:00", "record": {"id": 3, "name": "nanakuro", ...}}

© LayerX Inc. 40 フルダンプデータから更新‧削除レコードをanti-join スナップショット取得機能におけるデータ処理の仕組み {"op" :"u", "updated_at": "2025-11-12
04:11:00", "record": {"id": 2, "name": "jiro-x", ...}} {"op" :"u", "updated_at": "2025-11-12 05:11:00", "record": {"id": 6, "name": "saburo-x", ...}} {"op" :"d", "updated_at": "2025-11-12 07:11:00", "record": {"id": 1, "name": "shiro-x", ...}} {"op" :"d", "updated_at": "2025-11-12 09:11:00", "record": {"id": 7, "name": "goro", ...}} {"op" :"d", "updated_at": "2025-11-12 12:11:00", "record": {"id": 8, "name": "rokuro-x", ...}} {"op" :"u", "updated_at": "2025-11-12 14:11:00", "record": {"id": 3, "name": "nanakuro", ...}} 2025-11-12 03:00:00

© LayerX Inc. 42 残ったデータに作成‧更新レコードをunion スナップショット取得機能におけるデータ処理の仕組み 2025-11-12 03:00:00 {"op" :"c",
"updated_at": "2025-11-12 03:11:00", "record": {"id": 5, "name": "taro", ...}} {"op" :"u", "updated_at": "2025-11-12 04:11:00", "record": {"id": 2, "name": "jiro-x", ...}} {"op" :"u", "updated_at": "2025-11-12 05:11:00", "record": {"id": 6, "name": "saburo-x", ...}} {"op" :"u", "updated_at": "2025-11-12 14:11:00", "record": {"id": 3, "name": "nanakuro", ...}}

完成形

© LayerX Inc. 45 完成形はWebで読んでください☺ 完成形参考: 『AI Agentのビジネス価値を計るバックテスト基盤の構築』を⽀えるSnowﬂake上での任意時点のスナップショット取得を実現するデータパイプライン -
LayerX エンジニアブログ

AI Agent評価基盤の構築

🙌 過去データにアクセスできるようになったぞ！！しかし、データがあるだけでは。。。

AI申請レビューは内部でサービスのAPIに依存している。APIを叩いた先には最新データしか入ってない。申請管理API テナント管理API AI申請レビューAgent アプリケーションDB(最新データのみ) 😭 AI Agentバックテストの難しさ

😭 AI Agentバックテストの難しさ依存データ取得先をSnowflakeで丸々入れ替えると、APIでやっていたデータの前後処理を丸々Agent側に移植しないといけない AI申請レビューAgent APIでやっていたデータの前後処理を全てSnowflakeのクエリで再現していくの？データが一致しているかをどうテストするの？ 🤔

😭 AI Agentバックテストの難しさ API経由ならデータ処理も含めることができる。けど、サービスAPIにSnowflake 切り替え機構を入れるの？クエリビルダーから変更になるひとに、Snapshot日付指定パラメータを伝搬させる処理も必要がある。結構大きな工事だなぁ。。。申請管理API テナント管理API AI申請レビューAgent

🤔APIの実装をほとんど変えずに API内部処理に Snowflake切り替え&日付指定を差し込めないか？

🛠 自作GORM Plugin！！

*gorm.DB.Callbackでクエリ前に処理を差し込める。

❄ Firn Firn（フィルン）とは、積もった雪が長期間経っても溶けずに残った、雪と氷の中間段階の積雪層です。雪の結晶同士の隙間（空隙）が完全には閉じていない状態を指し、国立極地研究所の研究では極地の氷床形成過程で重要な役割を果たすほか、過去の大気組成を復元するための情報源としても活用されています。社内GORM Pluginパッケージ「Firn」を作った！ 🤖 LLMを使用したSQL自動変換 📅
特定日付時点のスナップショットデータへの透過的なアクセス 🔌 GORMプラグインとしてのシームレスな統合 🛡 クエリガード機能によるセキュリティ保護

❄ Firn これだけで、LLMが内部で対象日付を使って SQLをSnapshotクエリに書き換える。 DBクライアント初期化にこれをかますだけで、 APIの他のコード変更は一切不要。

なぜLLMでSQLを書き換えるのか * 最初はSQLパーサーでクエリを決定論的に書き換える方法を試した。 * 実装が難しいかつ非常に複雑なロジックになってしまった。 * LLMを使う最大のネックはパフォーマンスですが、この機能はバッチテスト前提であり、即座にレスポンスが欲しいものではない。 * そのためLLMベースの書き換えに方向転換。

Firnでgorm.DB差し替え gorm.DBを差し替えるだけで、アプリケーションDBとSnowflakeの向き先を差し替え、LLMで初期化時に渡した対象日付でクエリを書き換える申請管理API テナント管理API AI申請レビューAgent Snapshot アプリケーションDB(最新データのみ) ❄ Firnで切り替え

バックテストできたよ！！

🤔今回の実装は既存 AI Agentを評価するための基盤作りで非常に苦労した最初から評価を入れやすい=AI Agentを改善しやすいシステムとして開発すべき。ではどういう設計ならよかったのか...

どういう設計が理想だったか

🐤 AI Agentに渡すAPI Toolは既存のサービス APIを気軽に流用しない普通に作ると、APIはリソース指向の設計になり、フロントエンドが柔軟にリソースをフェッチできる仕組みになっています。しかし、まとまったデータを得るためには段階的な複数回のAPI呼び出しを行うことになります。そうなるとAI Agentがコンテキストを集めるために、多くのAPIに依存することになります。

🐓 Workﬂow Toolとして実装する理想としては、必要なコンテキストを揃えるためのtoolをリソース志向APIではなく、一回の呼び出しで全てのコンテキストを取得できるような Workflow Tool として用意すべきです。
https://www.anthropic.com/engineering/writing-tools-for-agents > 評価タスクに適した、影響の大きい特定のワークフローを対象とした、思慮深いツールをいくつか構築し、そこからスケールアップしていくことをお勧めします。 by Anthropic

🐓 最初からツールが過去のデータにアクセスできる設計にしておく案 • 今回の実装が難しかった要因の一つはアプリケーションDBが最新のデータしか持っていないという点でした。 • 評価機能をユーザーに提供する場合、本番アプリケーションがデータ基盤に依存することになりリバースETLによるデータの同期管理の複雑さが発生します。 •
このような問題を回避するために取れる設計として、任意の時点のデータを再現するようなテーブルをアプリケーションDBに持ち、ツールでアクセスできるように最初からしておく方法も検討できます。

🐓 まとめると • Workﬂow Toolを実装し、アプリケーションが保存するCDCデータから過去の状態のデータを再現できるようなものにできると良いでしょう。ただこれだと、CDCデータの保存に膨大なコストがかかり、Workﬂow Toolの実装に時間がかかります。 • ビジネスに要求される速度とのトレードオフを考え、サービスにとって最適なバランスをとりま
しょう。

🐓 データセットをユーザー側で DBにロードできるようにしておく (1) 一方で全てのデータをアプリケーション DB側に保持しなくても、評価に必要なデータだけをアプリケーション DBに移しておくという方法もあります。これはユーザーにAgentを評価する機能を提供したい場合に有用なパターンです。

🐓 データセットをユーザー側で DBにロードできるようにしておく (2) この方式をとっているのが、カスタマーサービス向けAIサービスのFinであり、 Finではデータセットという単位で最大 50件のデータを読み込み、評価に利用できる機能をユーザーに提供しています。
https://fin.ai/

🐓 データセットをユーザー側で DBにロードできるようにしておく (3) • これであればCDCで全ての過去データを保存するコストを抑えた上で、評価に必要なデータだけを利用できるというバランスの取れた構成になります。
• デメリットとして、開発者がAI Agent を大きなデータで評価したい場合は毎回必要なデータをDBに読み込む

☀ まとめ • AI Agentを育てるための、評価基盤構築は難しいよ！ • 過去データを取れるように基盤作りをしよう！ • 評価を回せるようなアーキテクチャの上に AI
Agentを載せよう！

ブログでも今回の話を紹介してます！ https://tech.layerx.co.jp/entry/2025/10/30/085410 https://tech.layerx.co.jp/entry/snowflake-user-defined-timetravel-udtf-with-cdc-pipeline AI Agentブログリレーやってます！！今42日目！！

LayerXではBet AIするデータエンジニア、 MLエンジニア、 AIエンジニアを超絶募集中！！

© LayerX Inc. 71 • LayerXでは、⼀緒にデータ基盤、AI Agent基盤、ML基盤を作る仲間を⼤募集しています！！！ • 興味を持たれた⽅は是⾮ jobs.layerx.co.jp
へアクセスしてください！！！ We are hiring!!! おわりに【バクラク】データエンジニア【バクラク】ソフトウェアエンジニア_AI-UX 【バクラク】MLOpsエンジニア【バクラク】エンジニアリングマネージャー_AI‧機械学習領域

技術書典で本出します！

嗚呼、当時の本番環境の状態で AI Agentを再評価したいなぁ ... 第16回 Data-Centric AI勉強会

嗚呼、当時の本番環境の状態で AI Agentを再評価したいなぁ... / Ah, I wis...

嗚呼、当時の本番環境の状態で AI Agentを再評価したいなぁ... / Ah, I wish I could re-evaluate the AI ​​Agent in the production environment it was in back then...

More Decks by Civitaspo

Other Decks in Technology

Featured

Transcript

嗚呼、当時の本番環境の状態で AI Agentを再評価したいなぁ... / Ah, I wish I could re-evaluate the AI Agent in the production environment it was in back then...