Upgrade to Pro — share decks privately, control downloads, hide ads and more …

データ分析AI Agentを動かして気づいた、今の基盤に足りないもの

Avatar for ono.takayuki ono.takayuki
February 26, 2026
450

データ分析AI Agentを動かして気づいた、今の基盤に足りないもの

2026/02/25 STORES Data Lounge「AI時代のデータ基盤とデータ活用」
https://hey.connpass.com/event/379343/
発表時間:20分

データ分析AI Agent「Kepler」を動かして気づいた課題とその対応についてまとめました。

また、開発サポートAIの登場によって全社的にAI化が進む中でのデータ基盤開発の民主化や、AI時代にデータチームがどういう基盤(「STORES新聞」構想など)を目指していきたいかについてお話ししています。

STORES 株式会社
データ本部 データ基盤グループ
小野 嵩征(ono.takayuki)/ アナリティクスエンジニア

Avatar for ono.takayuki

ono.takayuki

February 26, 2026
Tweet

Transcript

  1. 自己紹介 小野 嵩征(おの たかゆき) WEB系の会社に新卒入社 WEBエンジニア → データエンジニア STORES株式会社 所属(2024年10月〜現在)

    アナリティクスエンジニア データ基盤の改善/データ活用推進を行っている 三重県在住 2
  2. Kepler 利用ログやフィードバックを眺める 9 みんなのKeplerへの「問い」からスキーマ検索の重要性に気づく このテーブルの status カラムはどういう意 味? 売上を集計したいけど、どのテーブルを使えば いい?

    法人番号のデータはある? • 直接欲しいテーブルやカラムを指定 して分析する人が少ない • データが場所を検索するために Keplerを利用する人が存在 → データ分析よりもデータ探しの精度を あげることの需要が高いことが判明
  3. スキーマ検索時の課題 10 • 結合のためのキーのミス • 似たテーブルの誤用 • WHERE 条件の漏れ →

    プロンプトで挙動制御するにも限界が... BigQuery のスキーマ情報のみだと
  4. スキーマ検索の改善 11 ゴールデンクエリをRAG Engineに登録 # 1. AIが検索するためのコンテキスト(用途) name: "monthly_sales_by_category" description:

    "月次・カテゴリ別の売上集計クエリ。" use_cases: ["売上推移", "カテゴリ別売上", "売上合計"] # 2. 迷わせない「結合の正解」と「業務ロジック」 sql: > SELECT d.year_month, p.category_name, SUM(f.gross_sales) AS total_sales FROM `stores.mart.fct_orders` f -- 正しいディメンション(切り口)の結合 JOIN `stores.mart.dim_dates` d ON f.date_id = d.date_id JOIN `stores.mart.dim_products` p ON f.product_id = p.product_id WHERE f.status = 'completed' -- 暗黙の業務ロジック(完了分のみ) AND f.is_test = FALSE -- AIが間違えやすいテスト除外 GROUP BY 1, 2 ※架空のクエリ 1. 結合キーとテーブルの正解を示 す 2. 暗黙の業務ロジックを埋め込む 3. AIのための検索タグ → スキーマ検索時の補完に利用
  5. 壁① コンテキスト不足 17 テーブル定義 だけでは伝わらない「暗黙知」 テーブル定義にカラム説明を書いても、AIは「行間」が読めない • テスト除外の暗黙ルール 「売上集計ならテストデータは除外する」が テーブル定義には書かれていない

    • プロダクト固有の業務ロジック ステータスの意味、集計期間の慣習、特定条件の除外など「人には当たり前」の知識 • カラム説明だけでは不十分 description を書いても、AIが「どう使うべきか」の文脈は伝わらない → AIが間違えるのはAIのせいではなく、基盤が「暗黙知」を教えきれていないから
  6. 壁① 解決策 18 3つの情報源で「暗黙知」をカバーする • ゴールデンクエリだけでは限界がある より深いビジネスロジックを記述しようとすると社内ドキュメントと二重定義に陥りや すい • 複数の情報源を網羅的に参照させる

    1. 社内ドキュメント:ビジネスメンバーが定義した業務ロジックや用語の定義 2. ゴールデンクエリ:結合ロジック・暗黙の業務ルールの正解例 3. GitHub コード:データの発生方法・実装の背景 • データマートの要件定義を補完 複数ソースの横断参照で、テーブル定義だけでは伝わらない文脈を補う → より曖昧な指示からでもAgentがデータ分析を行える世界を目指す
  7. 壁② 柔軟ではないデータモデリング 20 KeplerはOBT + αのテーブルを参照していたが、、 OBTの「作り方」に課題がある • 再利用可能な構造で作れていない OBT改修時の影響範囲が広がり、変更のス

    ピードが落ちてしまう • 全ての分析要件を1テーブルで叶えようとし てカラム数が増加 分析シナリオに対してどのカラムを使うかの 選択難易度が高い状態に → ディメンショナルモデリングの上にOBTを作るのが理想
  8. 壁② 解決策 21 ディメンショナルモデリング(スタースキーマ)への再構築 • ファクトとディメンションの分離 ファクト(事実)= 売上、注文などの数値デー タ、ディメンション(切り口)= 日付、商品、

    顧客などの分析軸 • AIが多角的に自律分析できる構造へ 依頼者の問いに合わせて切り口を自由に組み合 わせて JOIN できるスタースキーマが AI 向き • アナリスト巻き込みのモデリング勉強会を開催 中 データアナリストの知見を取り込み、実務に即 したモデル設計を推進 引用) アジャイルデータモデリング 組織にデータ分析を広める ためのテーブル設計ガイド
  9. 壁③ データ基盤のアップデート速度 22 データチームがスピードのボトルネックに • 安全に開発できる「ガードレール」の不在 適切な権限整理ができておらず、他部署のメンバーがデータ基盤の開発に参加する    ハードルが高い。    •

    開発環境が民主化されていない AIを使って他部署からPR(Pull Request)を出せても、手元で適切な検証が完結でき ない。    ※ PMや他エンジニアの人からPRは出してもらえてる • 結果:タスクの一極集中 検証・リリース作業がデータチームに集中。 AIで分析が高速化しても「データがない」状態ですぐに足止めを食らってしまう。
  10. Privileged Access Manager(PAM) 24 • 事前定義した権限を一時的に付与・管理 (申請した期限が切れると自動で権限を剥奪) • コンソール または

    gcloud コマンドから申請 人やAI Agentが必要な時に権限を申請する • 申請/承認履歴を保持し、監査性を確保
  11. 組織に押し寄せる「全社AI化」の波 26 STORES の開発全般をサポートする Slack bot Kuroの登場 • 強力な開発サポートAIの稼働 技術推進本部の主導により、

    先週から全社Slack bot「Kuro」が稼働開始。 • ナレッジアクセス 社内のGitHubリポジトリから 社内のドキュメントまで、開発に必要な コンテキストを網羅的に閲覧可能。 • Slackで完結する「自律的な実行力」 Slackからの指示だけで、プロダクトのPR作成    やブラウザの自動操作まで代行してくれる。
  12. Kuroの登場によってデータ基盤が嬉しいこと 27 STORES の開発全般をサポートする Slack bot Kuroの登場 • 強力な開発サポートAIの稼働 技術推進本部の主導により、

    先週から全社Slack bot「Kuro」が稼働開始。 • ナレッジアクセス 社内のGitHubリポジトリから 社内のドキュメントまで、 開発に必要なコンテキストを網羅的に閲 覧可能。 • Slackで完結する「自律的な実行力」 Slackからの指示だけで、プロダクトのPR作成    やブラウザの自動操作まで代行してくれる。
  13. KuroとBigQueryを接続して新たな 分析 AI Agentを模索中 28 MCP BigQuery MCP • 安全なBigQuery

    操作 (コストを抑える機能付き) • Keplerで作成していたゴールデンク エリのtool 全社ナレッジ ゴールデン クエリ データ基盤
  14. 組織に押し寄せる「全社AI化」の波 30 BIの「外側」で加速するデータ分析 ビジネスメンバーのAI利用 • KuroをきっかけにBigQueryとの疎通をMCP化したことで Claude Code / Cursor

    等でもBIを介さない分析が行われるようになっていく • 今後BIツールを経由しないレポーティングが爆発的に増えていく すでに一部のPMの方がレポートを作り始めている → データ利活用のハードルが下がるのはいいこと
  15. みんなで育てるデータ基盤 34 ユーザー 全社Slack bot AI Agent 自律的に分析・判断 データ基盤 ゴールデンクエリ

    データマート ディメンショナルモデル メタデータ 問い 分析結果 ゴールデンクエリの登録 データ追加(PR) ユーザーも直接PRで貢献 Kepler 運用で気がついた課題を解決し、 Kuro をデータ分析の流れに組み込 むと みんながAI Agentで分析を自律的に進めながらも安全に基盤強化していく未来が作れる
  16. データチームが目指す STORES 新聞 構想 36 「個人の問い」を全社の資産へ BI時代は共有されなかった個人の問いが、 AI Agentにすべて集約。 『STORES

    新聞』の創刊 大量の問いから有意義な分析をAIが要約 し、新聞化。新聞化していくことで昔の新 聞を読めば組織の変化も追うことができ る。 新聞を起点とした業務の拡張 ゴールデンクエリの拡充や、基盤へのPR作 成など、「データ」から始まる業務バリ エーションを増やしていく。 売上は? 顧客層は? トレンド? 在庫は? 成果は? AI STORES新聞 STORES新聞 STORES新聞
  17. 最後に 37 AI Agentは組織のデータ力を映す鏡 AIが動かないのは、我々が教えきれていないから。 AIの進化を待つだけでは AIの真価を発揮できない 今からAIがフル活用できる基盤とエコシステムを作りに行く。 AI Agent

    を使わない前提であれば、現状のデータ基盤維持でもいいが、 AI Agent を組み込んだ上でデータで組織を成長させていくには とりあえず AI Agentを入れて課題を顕在化させるのが第一歩だと思う。