データ分析AI Agentを動かして気づいた、今の基盤に足りないもの

STORES 株式会社 AI Agentを動かして気づいた、今の基盤に足りないもの STORES Data Lounge#1 AI時代のデータ基盤とデータ活用 2026年
2月

自己紹介小野嵩征（おのたかゆき） WEB系の会社に新卒入社 WEBエンジニア → データエンジニア STORES株式会社所属（2024年10月〜現在）
アナリティクスエンジニアデータ基盤の改善/データ活用推進を行っている三重県在住 2

複数プロダクトの成長を支える STORES のデータ基盤 3

本日お話しすること 4 データ分析AI Agent Kepler のこれまで実運用でぶつかった基盤の壁全社AI化の波とボトムアップ
の基盤構築データチームが目指す STORES新聞構想 01 02 03 04

Keplerとは 6 2025年9月30日から社内向けに開発したデータ分析 AI Agent 簡単なデータを出せることを最初の目標として構築利用技術 •
Google ADK • AgentEngine • Vertex AI RAG Engine • Next.js

Keplerでできること 7 スキーマ検索 SQL実行 SQL生成 Python実行年×カテゴリごとの売り上げ推移可視化し、傾向について分析してください
依頼回答

テーブル検索の過程や生成したSQLもKeplerが教えてくれる 8

Kepler 利用ログやフィードバックを眺める 9 みんなのKeplerへの「問い」からスキーマ検索の重要性に気づくこのテーブルの status カラムはどういう意味？売上を集計したいけど、どのテーブルを使えばいい？
法人番号のデータはある？ • 直接欲しいテーブルやカラムを指定して分析する人が少ない • データが場所を検索するために Keplerを利用する人が存在 → データ分析よりもデータ探しの精度をあげることの需要が高いことが判明

スキーマ検索時の課題 10 • 結合のためのキーのミス • 似たテーブルの誤用 • WHERE 条件の漏れ →
プロンプトで挙動制御するにも限界が... BigQuery のスキーマ情報のみだと

スキーマ検索の改善 11 ゴールデンクエリをRAG Engineに登録 # 1. AIが検索するためのコンテキスト（用途） name: "monthly_sales_by_category" description:
"月次・カテゴリ別の売上集計クエリ。" use_cases: ["売上推移", "カテゴリ別売上", "売上合計"] # 2. 迷わせない「結合の正解」と「業務ロジック」 sql: > SELECT d.year_month, p.category_name, SUM(f.gross_sales) AS total_sales FROM `stores.mart.fct_orders` f -- 正しいディメンション（切り口）の結合 JOIN `stores.mart.dim_dates` d ON f.date_id = d.date_id JOIN `stores.mart.dim_products` p ON f.product_id = p.product_id WHERE f.status = 'completed' -- 暗黙の業務ロジック（完了分のみ） AND f.is_test = FALSE -- AIが間違えやすいテスト除外 GROUP BY 1, 2 ※架空のクエリ 1. 結合キーとテーブルの正解を示す 2. 暗黙の業務ロジックを埋め込む 3. AIのための検索タグ → スキーマ検索時の補完に利用

ゴールデンクエリを登録した結果 12 ゴールデンクエリスキーマ SQL作成/実行 1. 依頼に関連したクエリを検索 2. 依頼に関連したクエリをもとにテーブルのスキーマを検索
3. 検索した結果を元に依頼を達成するためのSQLの生成と実行

導入後効果自分が欲しい時/知りたい時データに関することを聞けるように • データ基盤に欲しいデータ（テーブル / カラム）があるかの調査 • 簡単なデータ抽出/集計 →
とりあえず Keplerに聞いてみよう or 聞いてみたという文化が生まれた 13

Q. 変化はあったが、 Keplerによってデータの民主化は達成された…か？

データ基盤の課題が顕在化 A. 第一歩は踏み出せたが、曖昧な問いから真の課題解決まではいけない

壁① コンテキスト不足 17 テーブル定義だけでは伝わらない「暗黙知」テーブル定義にカラム説明を書いても、AIは「行間」が読めない • テスト除外の暗黙ルール「売上集計ならテストデータは除外する」がテーブル定義には書かれていない
• プロダクト固有の業務ロジックステータスの意味、集計期間の慣習、特定条件の除外など「人には当たり前」の知識 • カラム説明だけでは不十分 description を書いても、AIが「どう使うべきか」の文脈は伝わらない → AIが間違えるのはAIのせいではなく、基盤が「暗黙知」を教えきれていないから

壁① 解決策 18 3つの情報源で「暗黙知」をカバーする • ゴールデンクエリだけでは限界があるより深いビジネスロジックを記述しようとすると社内ドキュメントと二重定義に陥りやすい • 複数の情報源を網羅的に参照させる
1. 社内ドキュメント：ビジネスメンバーが定義した業務ロジックや用語の定義 2. ゴールデンクエリ：結合ロジック・暗黙の業務ルールの正解例 3. GitHub コード：データの発生方法・実装の背景 • データマートの要件定義を補完複数ソースの横断参照で、テーブル定義だけでは伝わらない文脈を補う → より曖昧な指示からでもAgentがデータ分析を行える世界を目指す

コンテキスト不足を補うためにチーム全員でAI Agentとメタデータ拡充 19 後で紹介予定の全社のSlack botの取り組みに参画しつつ AI Agent と協力しテーブル / カラムのメタデータを埋めていく

壁② 柔軟ではないデータモデリング 20 KeplerはOBT + αのテーブルを参照していたが、、 OBTの「作り方」に課題がある • 再利用可能な構造で作れていない OBT改修時の影響範囲が広がり、変更のス
ピードが落ちてしまう • 全ての分析要件を1テーブルで叶えようとしてカラム数が増加分析シナリオに対してどのカラムを使うかの選択難易度が高い状態に → ディメンショナルモデリングの上にOBTを作るのが理想

壁② 解決策 21 ディメンショナルモデリング（スタースキーマ）への再構築 • ファクトとディメンションの分離ファクト（事実）= 売上、注文などの数値データ、ディメンション（切り口）= 日付、商品、
顧客などの分析軸 • AIが多角的に自律分析できる構造へ依頼者の問いに合わせて切り口を自由に組み合わせて JOIN できるスタースキーマが AI 向き • アナリスト巻き込みのモデリング勉強会を開催中データアナリストの知見を取り込み、実務に即したモデル設計を推進引用) アジャイルデータモデリング組織にデータ分析を広めるためのテーブル設計ガイド

壁③ データ基盤のアップデート速度 22 データチームがスピードのボトルネックに • 安全に開発できる「ガードレール」の不在適切な権限整理ができておらず、他部署のメンバーがデータ基盤の開発に参加する　　　ハードルが高い。　　 •
開発環境が民主化されていない AIを使って他部署からPR（Pull Request）を出せても、手元で適切な検証が完結できない。　　 ※ PMや他エンジニアの人からPRは出してもらえてる • 結果：タスクの一極集中検証・リリース作業がデータチームに集中。 AIで分析が高速化しても「データがない」状態ですぐに足止めを食らってしまう。

壁③ 解決策 23 データ基盤開発の民主化 • 開発環境のセットアップ方法を他プロダクトに揃えるデータチーム固有の開発体験ではなく STORES のプロダクトとしての開発体験へ •
適切な権限設計開発に必要なロールをPrivileged Access Manager（PAM）を使って一時的に付与する仕組みの導入

Privileged Access Manager（PAM） 24 • 事前定義した権限を一時的に付与・管理（申請した期限が切れると自動で権限を剥奪） • コンソールまたは
gcloud コマンドから申請人やAI Agentが必要な時に権限を申請する • 申請/承認履歴を保持し、監査性を確保

組織に押し寄せる「全社AI化」の波 26 STORES の開発全般をサポートする Slack bot Kuroの登場 • 強力な開発サポートAIの稼働技術推進本部の主導により、
先週から全社Slack bot「Kuro」が稼働開始。 • ナレッジアクセス社内のGitHubリポジトリから社内のドキュメントまで、開発に必要なコンテキストを網羅的に閲覧可能。 • Slackで完結する「自律的な実行力」 Slackからの指示だけで、プロダクトのPR作成　　やブラウザの自動操作まで代行してくれる。

Kuroの登場によってデータ基盤が嬉しいこと 27 STORES の開発全般をサポートする Slack bot Kuroの登場 • 強力な開発サポートAIの稼働技術推進本部の主導により、
先週から全社Slack bot「Kuro」が稼働開始。 • ナレッジアクセス社内のGitHubリポジトリから社内のドキュメントまで、開発に必要なコンテキストを網羅的に閲覧可能。 • Slackで完結する「自律的な実行力」 Slackからの指示だけで、プロダクトのPR作成　　やブラウザの自動操作まで代行してくれる。

KuroとBigQueryを接続して新たな分析 AI Agentを模索中 28 MCP BigQuery MCP • 安全なBigQuery
操作（コストを抑える機能付き） • Keplerで作成していたゴールデンクエリのtool 全社ナレッジゴールデンクエリデータ基盤

ダミーデータでのそれっぽい分析イメージ 29

組織に押し寄せる「全社AI化」の波 30 BIの「外側」で加速するデータ分析ビジネスメンバーのAI利用 • KuroをきっかけにBigQueryとの疎通をMCP化したことで Claude Code / Cursor
等でもBIを介さない分析が行われるようになっていく • 今後BIツールを経由しないレポーティングが爆発的に増えていくすでに一部のPMの方がレポートを作り始めている → データ利活用のハードルが下がるのはいいこと

Claude Code × BigQuery MCP 利用者も徐々に増加中 31 来週の月曜日にClaude Code セットアップ会開きます

組織に押し寄せる「全社AI化」の波 32 AI時代、正確性とスピードの両立は難しい事業のフェーズによってスピードと正確性の求めるバランスは変わるもの今のフェーズは「100点満点のダッシュボード」を数日かけて作るよりも「80点でも今すぐわかるスピード」を優先するフェーズだと思う。 AIによるカオスな独自分析をルールで縛るのではなく、カオスを受け入れた上で基盤自体をどうすればよりよく成長させていけるかを考えるのが重要。

問いを資産にするボトムアップアプローチ 33 ユーザーの「問い」から基盤を進化させる AI Agentに集まる「みんなの問い」のログを分析。需要の高い問いを抽出し、 AIのための「ゴールデンクエリ」として登録・データマートへ反映し続けるサイクルの確立。

みんなで育てるデータ基盤 34 ユーザー全社Slack bot AI Agent 自律的に分析・判断データ基盤ゴールデンクエリ
データマートディメンショナルモデルメタデータ問い分析結果ゴールデンクエリの登録データ追加（PR）ユーザーも直接PRで貢献 Kepler 運用で気がついた課題を解決し、 Kuro をデータ分析の流れに組み込むとみんながAI Agentで分析を自律的に進めながらも安全に基盤強化していく未来が作れる

データチームが目指す STORES 新聞構想 36 「個人の問い」を全社の資産へ BI時代は共有されなかった個人の問いが、 AI Agentにすべて集約。『STORES
新聞』の創刊大量の問いから有意義な分析をAIが要約し、新聞化。新聞化していくことで昔の新聞を読めば組織の変化も追うことができる。新聞を起点とした業務の拡張ゴールデンクエリの拡充や、基盤へのPR作成など、「データ」から始まる業務バリエーションを増やしていく。売上は？顧客層は？トレンド？在庫は？成果は？ AI STORES新聞 STORES新聞 STORES新聞

最後に 37 AI Agentは組織のデータ力を映す鏡 AIが動かないのは、我々が教えきれていないから。 AIの進化を待つだけでは AIの真価を発揮できない今からAIがフル活用できる基盤とエコシステムを作りに行く。 AI Agent
を使わない前提であれば、現状のデータ基盤維持でもいいが、 AI Agent を組み込んだ上でデータで組織を成長させていくにはとりあえず AI Agentを入れて課題を顕在化させるのが第一歩だと思う。

データ分析AI Agentを動かして気づいた、今の基盤に足りないもの

データ分析AI Agentを動かして気づいた、今の基盤に足りないもの

ono.takayuki

More Decks by ono.takayuki

Featured

Transcript

STORES 株式会社 AI Agentを動かして気づいた、今の基盤に足りないもの STORES Data Lounge#1 AI時代のデータ基盤とデータ活用 2026年

自己紹介小野嵩征（おのたかゆき） WEB系の会社に新卒入社 WEBエンジニア → データエンジニア STORES株式会社所属（2024年10月〜現在）

複数プロダクトの成長を支える STORES のデータ基盤 3

本日お話しすること 4 データ分析AI Agent Kepler のこれまで実運用でぶつかった基盤の壁全社AI化の波とボトムアップ

本日お話しすること 5 データ分析AI Agent Kepler のこれまで実運用でぶつかった基盤の壁全社AI化の波とボトムアップ

Keplerとは 6 2025年9月30日から社内向けに開発したデータ分析 AI Agent 簡単なデータを出せることを最初の目標として構築利用技術 •

Keplerでできること 7 スキーマ検索 SQL実行 SQL生成 Python実行年×カテゴリごとの売り上げ推移可視化し、傾向について分析してください

テーブル検索の過程や生成したSQLもKeplerが教えてくれる 8

Kepler 利用ログやフィードバックを眺める 9 みんなのKeplerへの「問い」からスキーマ検索の重要性に気づくこのテーブルの status カラムはどういう意味？売上を集計したいけど、どのテーブルを使えばいい？

スキーマ検索時の課題 10 • 結合のためのキーのミス • 似たテーブルの誤用 • WHERE 条件の漏れ →

スキーマ検索の改善 11 ゴールデンクエリをRAG Engineに登録 # 1. AIが検索するためのコンテキスト（用途） name: "monthly_sales_by_category" description:

ゴールデンクエリを登録した結果 12 ゴールデンクエリスキーマ SQL作成/実行 1. 依頼に関連したクエリを検索 2. 依頼に関連したクエリをもとにテーブルのスキーマを検索

導入後効果自分が欲しい時/知りたい時データに関することを聞けるように • データ基盤に欲しいデータ（テーブル / カラム）があるかの調査 • 簡単なデータ抽出/集計 →

Q. 変化はあったが、 Keplerによってデータの民主化は達成された…か？

データ基盤の課題が顕在化 A. 第一歩は踏み出せたが、曖昧な問いから真の課題解決まではいけない

本日お話しすること 16 データ分析AI Agent Kepler のこれまで実運用でぶつかった基盤の壁全社AI化の波とボトムアップ

コンテキスト不足を補うためにチーム全員でAI Agentとメタデータ拡充 19 後で紹介予定の全社のSlack botの取り組みに参画しつつ AI Agent と協力しテーブル / カラムのメタデータを埋めていく

壁② 柔軟ではないデータモデリング 20 KeplerはOBT + αのテーブルを参照していたが、、 OBTの「作り方」に課題がある • 再利用可能な構造で作れていない OBT改修時の影響範囲が広がり、変更のス

壁② 解決策 21 ディメンショナルモデリング（スタースキーマ）への再構築 • ファクトとディメンションの分離ファクト（事実）= 売上、注文などの数値データ、ディメンション（切り口）= 日付、商品、

壁③ 解決策 23 データ基盤開発の民主化 • 開発環境のセットアップ方法を他プロダクトに揃えるデータチーム固有の開発体験ではなく STORES のプロダクトとしての開発体験へ •

Privileged Access Manager（PAM） 24 • 事前定義した権限を一時的に付与・管理（申請した期限が切れると自動で権限を剥奪） • コンソールまたは

本日お話しすること 25 データ分析AI Agent Kepler のこれまで実運用でぶつかった基盤の壁全社AI化の波とボトムアップ

組織に押し寄せる「全社AI化」の波 26 STORES の開発全般をサポートする Slack bot Kuroの登場 • 強力な開発サポートAIの稼働技術推進本部の主導により、

Kuroの登場によってデータ基盤が嬉しいこと 27 STORES の開発全般をサポートする Slack bot Kuroの登場 • 強力な開発サポートAIの稼働技術推進本部の主導により、

KuroとBigQueryを接続して新たな分析 AI Agentを模索中 28 MCP BigQuery MCP • 安全なBigQuery

ダミーデータでのそれっぽい分析イメージ 29

組織に押し寄せる「全社AI化」の波 30 BIの「外側」で加速するデータ分析ビジネスメンバーのAI利用 • KuroをきっかけにBigQueryとの疎通をMCP化したことで Claude Code / Cursor

Claude Code × BigQuery MCP 利用者も徐々に増加中 31 来週の月曜日にClaude Code セットアップ会開きます

みんなで育てるデータ基盤 34 ユーザー全社Slack bot AI Agent 自律的に分析・判断データ基盤ゴールデンクエリ

本日お話しすること 35 データ分析AI Agent Kepler のこれまで実運用でぶつかった基盤の壁全社AI化の波とボトムアップ

データチームが目指す STORES 新聞構想 36 「個人の問い」を全社の資産へ BI時代は共有されなかった個人の問いが、 AI Agentにすべて集約。『STORES

最後に 37 AI Agentは組織のデータ力を映す鏡 AIが動かないのは、我々が教えきれていないから。 AIの進化を待つだけでは AIの真価を発揮できない今からAIがフル活用できる基盤とエコシステムを作りに行く。 AI Agent