AIが活躍できるデータ基盤を目指して

by ono.takayuki

Embed

Start on current slide

Slide 1

Slide 1 text

STORES 株式会社小野嵩征 AI時代の意思決定を支える各社のデータ基盤Lunch Talk 2025年 9月 AIが活躍できるデータ基盤を目指して

Slide 2

Slide 2 text

自己紹介小野嵩征（おのたかゆき） WEB系の会社に新卒入社（2020年4月） WEBエンジニア → データエンジニア STORES株式会社所属（2024年10月〜現在）アナリティクスエンジニアデータ基盤の改善/データ活用推進を行なっている DATA Saber 中部コネクトで、コミュニティ活動中 2

Slide 3

Slide 3 text

本日お話しすること 3 1. 開発中の社内向けデータ分析 Agentのお話し 2. AI（データ分析 Agent Kepler）が活躍できる基盤にするための取り組み

Slide 4

Slide 4 text

目次 4 会社概要 STORES のデータ基盤 AI Agent Keplerについて AIが活躍するためにやっていることさいごに 01 02 03 04 05

Slide 5

Slide 5 text

目次 5 会社概要 STORES のデータ基盤 AI Agent Keplerについて AIが活躍するためにやっていることさいごに 01 02 03 04 05

Slide 6

Slide 6 text

会社概要 6 会社名 STORES 株式会社設立 2012年3月23日代表取締役社長佐藤裕介資本金 1億円所在地〒150-0011 東京都渋谷区東3丁目16番3号　エフ・ニッセイ恵比寿ビル4階事業内容インターネットビジネスの企画・開発・運営

Slide 7

Slide 7 text

サービス紹介 7 お店のデジタルをまるっとサポート。個人や中小事業の方々に向けて、お店のデジタル化をまるっと実現できる価値を提供しています。

Slide 8

Slide 8 text

サービス紹介 8 他　合計10個のサービスを提供

Slide 9

Slide 9 text

目次 9 会社概要 STORESのデータ基盤 AI Agent Keplerについて AIが活躍するためにやっていることさいごに 01 02 03 04 05

Slide 10

Slide 10 text

STORESのデータ基盤 10

Slide 11

Slide 11 text

STORESのデータ基盤 11

Slide 12

Slide 12 text

STORESのデータ基盤 12 データ分析 AI Agent Keplerくん

Slide 13

Slide 13 text

目次 13 会社概要 STORES のデータ基盤 AI Agent Keplerについて AIが活躍するためにやっていることさいごに 01 02 03 04 05

Slide 14

Slide 14 text

AI Agent Keplerについて 14 データチームが社内に提供するデータ分析Agent （9/29リリース）データから軌道を発見し、ビジネスに繋げることを期待してKeplerと命名データ基盤利用者のデータ活用をサポートする仲間

Slide 15

Slide 15 text

Keplerでできること 15 スキーマ検索 SQL実行 SQL生成 Python実行年×カテゴリごとの売り上げ推移可視化し、傾向について分析してください依頼回答

Slide 16

Slide 16 text

Keplerでできること 16

Slide 17

Slide 17 text

システム構成 17 利用技術 Next.js Google Agent Developer Kit Cloud Run Cloud SQL Cloud Storage BigQuery MCP Toolbox for Databases

Slide 18

Slide 18 text

なぜ作ったのか 18 データ基盤利用者の最初の壁をなくし、ビジネスを早く進めるため

Slide 19

Slide 19 text

データ活用のサイクル 19 課題データ収集集計/分析企画立案行動振り返りサイクルを早く回せれるほどビジネスも早く進みやすい

Slide 20

Slide 20 text

データ活用のサイクル 20 課題データ収集集計/分析企画立案行動振り返り最初の壁

Slide 21

Slide 21 text

データ活用を回すための最初の壁 21 データ基盤からデータを取り出し、課題解決を行うためにはハードルが存在 1. SQL/BIの知識が必要 2. 複数サービスのドメイン知識が必要 3. データがどこにあるかわからない 4. データ抽出後にデータを有効に使う方法がわからない

Slide 22

Slide 22 text

データ活用を回すための最初の壁 22 データ基盤からデータを取り出し、課題解決を行うためにはハードルが存在 1. SQL/BIの知識が必要 2. 複数サービスのドメイン知識が必要 3. データがどこにあるかわからない 4. データ抽出後にデータを有効に使う方法がわからない → データチームに依頼する or サポートを受ければ解決するが、　タイミングによっては依頼からリードタイムが発生することがある。　人のリソースは有限。

Slide 23

Slide 23 text

Keplerの登場により 23 1. SQL/BIの知識が必要 2. 複数サービスのドメイン知識が必要 3. データがどこにあるかわからない 4. データ抽出後にデータを有効に使う方法がわからない

Slide 24

Slide 24 text

Keplerの登場により 24 1. SQL/BIの知識が必要 → KeplerがSQLを生成/実行 2. 複数サービスのドメイン知識が必要 3. データがどこにあるかわからない 4. データ抽出後にデータを有効に使う方法がわからない

Slide 25

Slide 25 text

Keplerの登場により 25 1. SQL/BIの知識が必要 → KeplerがSQLを生成/実行 2. 複数サービスのドメイン知識が必要 → Keplerが社内ドキュメントを検索（展望） 3. データがどこにあるかわからない 4. データ抽出後にデータを有効に使う方法がわからない

Slide 26

Slide 26 text

Keplerの登場により 26 1. SQL/BIの知識が必要 → KeplerがSQLを生成/実行 2. 複数サービスのドメイン知識が必要 → Keplerが社内ドキュメントを検索（展望） 3. データがどこにあるかわからない → Keplerがスキーマ/カタログを検索 4. データ抽出後にデータを有効に使う方法がわからない

Slide 27

Slide 27 text

Keplerの登場により 27 1. SQL/BIの知識が必要 → KeplerがSQLを生成/実行 2. 複数サービスのドメイン知識が必要 → Keplerが社内ドキュメントを検索（展望） 3. データがどこにあるかわからない → Keplerがスキーマ/カタログを検索 4. データ抽出後にデータを有効に使う方法がわからない → Keplerがデータ分析をサポート

Slide 28

Slide 28 text

Keplerと協力して最初の壁を壊してデータ活用を進める 28 データ活用最初の壁

Slide 29

Slide 29 text

目次 29 会社概要 STORES のデータ基盤 AI Agent Keplerについて AIが活躍するためにやっていることさいごに 01 02 03 04 05

Slide 30

Slide 30 text

AIが活躍するためにやっていること 30 1. よく使うテーブルをまとめたワイドテーブルの作成 2. スキーマ情報の集約 3. dbt docsの内容をNotionに連携 4. Keplerへのフィードバックをもとに基盤とKeplerの改善

Slide 31

Slide 31 text

AIが活躍するためにやっていること 31 1. よく使うテーブルをまとめたワイドテーブルの作成 2. スキーマ情報の集約 3. dbt docsの内容をNotionに連携 4. Keplerへのフィードバックをもとに基盤とKeplerの改善

Slide 32

Slide 32 text

Keplerがスキーマ検索時に困ること 32 ネットショップのxx分析してテーブルA テーブルA´ テーブルA´´ 依頼回答似たテーブル、似たカラムが多い → 試行錯誤が多くなる → 意図しない結果になる

Slide 33

Slide 33 text

ワイドテーブルの作成 33 STORES サービス STORES サービス STORES サービスサービスに特化したワイドテーブル STORES サービス STORES サービス STORES サービスサービスをクロスして見たい時の要件をあつめたワイドテーブル AIにとっても人にとっても便利

Slide 34

Slide 34 text

AIが活躍するためにやっていること 34 1. よく使うテーブルをまとめたワイドテーブルの作成 2. スキーマ情報の集約 3. dbt docsの内容をNotionに連携 4. Keplerへのフィードバックをもとに基盤とKeplerの改善

Slide 35

Slide 35 text

各サービスの最新のスキーマを1つのリポジトリに集約 35 schema変更でトリガー schema 集約リポジトリ RDB DDLに変換&コミット各サービスリポジトリ GitHub Actions CREATE TABLE … schema.sql

Slide 36

Slide 36 text

各サービスの最新のスキーマを1つのリポジトリに集約集約リポジトリスキーマ変更通知開発時に参照スキーマ検索時に開発リポジトリのテーブル/カラムコメントを見にいく

Slide 37

Slide 37 text

AIが活躍するためにやっていること 37 1. よく使うテーブルをまとめたワイドテーブルの作成 2. スキーマ情報の集約 3. dbt docsの内容をNotionに連携 4. Keplerへのフィードバックをもとに基盤とKeplerの改善

Slide 38

Slide 38 text

dbt docsについて 38 dbt モデルファイル特に制御しなければ全モデルがdbt docsに出る加工レイヤーも反映

Slide 39

Slide 39 text

dbt docsに求める情報の粒度の違い（開発者） Exposures が見たい特定のsourceに依存したモデルを確認したい見たい情報が多い

Slide 40

Slide 40 text

dbt docsに求める情報の粒度の違い（データ基盤利用者）情報量が多いモデル名表記なので分かりにくい etc . 関心のある情報のみが出るのがベスト

Slide 41

Slide 41 text

スキーマ検索利用体験向上のため dbt docsに出すモデルの量を減らしたりして基盤利用者用のdbt dcosを提供すれば緩和されるかもしれないが

Slide 42

Slide 42 text

スキーマ検索利用体験向上のため dbt docsに出すモデルの量を減らしたりして基盤利用者用のdbt dcosを提供すれば緩和されるかもしれないが → 情報量減らした上で検索体験を高めたい。全社的に利用頻度の高いツールNotionへ移行

Slide 43

Slide 43 text

dbt docsの内容をNotionに連携

Slide 44

Slide 44 text

利用者用のカタログをNotionにしてみて Notion AI によって検索体験が上がった

Slide 45

Slide 45 text

利用者用のカタログをNotionにしてみて dbt の ymlを変更しなくてもデータカタログの情報を増やせるように

Slide 46

Slide 46 text

利用者用のカタログをNotionにしてみて Keplerがスキーマ検索時にNotionのデータも複合的に見れるように（展望）ネットショップの売上について教えて社内用語/テーブルの利用優先度スキーマ検索データが発生するロジックを検索依頼回答

Slide 47

Slide 47 text

AIが活躍するためにやっていること 47 1. よく使うテーブルをまとめたワイドテーブルの作成 2. スキーマ情報の集約 3. dbt docsの内容をNotionに連携 4. Keplerへのフィードバックをもとに基盤とKeplerの改善

Slide 48

Slide 48 text

フィードバックの収集 48 Keplerの回答に対してのフィードバックを収集

Slide 49

Slide 49 text

Keplerの改善 49 ● UI 改善 ○ SQLをコピーできるボタンをつけて欲しい ○ 文字サイズを大きくして欲しい ○ チャットの送信をSlackと同じ形式にして欲しい（Enter改行） ● Agent 改善 ○ xxx のデータも追加して欲しい ○ Agentのレスポンスを早くして欲しい ○ システムプロンプトの改善

Slide 50

Slide 50 text

データ基盤の改善 50 KeplerのセッションDBの活用（展望） Google Agent Developer Kitを利用するとCloud SQLにユーザーとAgentのやり取りログが保存される。保存されたやり取りログとフィードバックを使って基盤の改善に活かす

Slide 51

Slide 51 text

データ基盤の改善 51 BigQuery ジョブ実行履歴+セッションDBを使って基盤の継続的な改善ジョブ実行履歴利用ログ需要の高いテーブル問い合わせを抽出データ基盤へのデータ追加/データマート改善

Slide 52

Slide 52 text

目次 52 会社概要 STORES のデータ基盤 AI Agent Keplerについて AIが活躍するためにやっていることさいごに 01 02 03 04 05

Slide 53

Slide 53 text

さいごに 53 ● AI が活躍する基盤を目指すのであれば、まずはAIに働いてもらうのが大事 ● AI が活躍することは暗黙知を表出化する行為 ≒ 人も便利になる ● AI が活躍することがわかれば、全社的にメタデータを集めるとかデータマートを整備すると言ったことがやりやすくなる

Slide 54

Slide 54 text

まずはAIに働いてもらう - Google Agent Developer Kit 54 Google Agent Developer Kitを使う場合は 1. BigQueryのプロジェクトと検証用のデータセットを一つ作成 2. adk-sample にアクセス 3. python/agents/data-science のREADMEを参考にセットアップ 4. README通りにデプロイ 5. Cloud Runで動くデータ分析Agentの完成

Slide 55

Slide 55 text

55 ありがとうございました！

Slide 56

Slide 56 text

Slide 57

Slide 57 text

#2C85DE #F79A40 #EB75AA #EE5253 #10AC84 #6833D4 #0AB0DE #F5CC00 Text A Text Text Text Text Text Text Text Text Text A Text Text Text Text Text Text Text Text