AIが活躍できるデータ基盤を目指して
by
ono.takayuki
×
Copy
Open
Link
Embed
Share
Beginning
This slide
Copy link URL
Copy link URL
Copy iframe embed code
Copy iframe embed code
Copy javascript embed code
Copy javascript embed code
Share
Tweet
Share
Tweet
Slide 1
Slide 1 text
STORES 株式会社 小野 嵩征 AI時代の意思決定を支える 各社のデータ基盤Lunch Talk 2025年 9月 AIが活躍できるデータ基盤を目指して
Slide 2
Slide 2 text
自己紹介 小野 嵩征(おの たかゆき) WEB系の会社に新卒入社(2020年4月) WEBエンジニア → データエンジニア STORES株式会社 所属(2024年10月〜現在) アナリティクスエンジニア データ基盤の改善/データ活用推進を行なっている DATA Saber 中部コネクトで、コミュニティ活動中 2
Slide 3
Slide 3 text
本日お話しすること 3 1. 開発中の社内向けデータ分析 Agentのお話し 2. AI(データ分析 Agent Kepler)が活躍できる基盤にするための取り組み
Slide 4
Slide 4 text
目次 4 会社概要 STORES のデータ基盤 AI Agent Keplerについて AIが活躍するためにやっていること さいごに 01 02 03 04 05
Slide 5
Slide 5 text
目次 5 会社概要 STORES のデータ基盤 AI Agent Keplerについて AIが活躍するためにやっていること さいごに 01 02 03 04 05
Slide 6
Slide 6 text
会社概要 6 会社名 STORES 株式会社 設立 2012年3月23日 代表取締役社長 佐藤裕介 資本金 1億円 所在地 〒150-0011 東京都渋谷区東3丁目16番3号 エフ・ ニッセイ恵比寿ビル4階 事業内容 インターネットビジネスの企画・開発・ 運営
Slide 7
Slide 7 text
サービス紹介 7 お店のデジタルを まるっとサポート。 個人や中小事業の方々に向けて、 お店のデジタル化をまるっと 実現できる価値を提供しています。
Slide 8
Slide 8 text
サービス紹介 8 他 合計10個のサービスを提供
Slide 9
Slide 9 text
目次 9 会社概要 STORESのデータ基盤 AI Agent Keplerについて AIが活躍するためにやっていること さいごに 01 02 03 04 05
Slide 10
Slide 10 text
STORESのデータ基盤 10
Slide 11
Slide 11 text
STORESのデータ基盤 11
Slide 12
Slide 12 text
STORESのデータ基盤 12 データ分析 AI Agent Keplerくん
Slide 13
Slide 13 text
目次 13 会社概要 STORES のデータ基盤 AI Agent Keplerについて AIが活躍するためにやっていること さいごに 01 02 03 04 05
Slide 14
Slide 14 text
AI Agent Keplerについて 14 データチームが社内に提供する データ分析Agent (9/29リリース) データから軌道を発見し、 ビジネスに繋げることを期待してKeplerと命名 データ基盤利用者のデータ活用をサポートする仲間
Slide 15
Slide 15 text
Keplerでできること 15 スキーマ検索 SQL実行 SQL生成 Python実行 年×カテゴリごとの売り 上げ推移可視化し、傾 向について分析してく ださい 依頼 回答
Slide 16
Slide 16 text
Keplerでできること 16
Slide 17
Slide 17 text
システム構成 17 利用技術 Next.js Google Agent Developer Kit Cloud Run Cloud SQL Cloud Storage BigQuery MCP Toolbox for Databases
Slide 18
Slide 18 text
なぜ作ったのか 18 データ基盤利用者の最初の壁をなくし、ビジネスを早く進めるため
Slide 19
Slide 19 text
データ活用のサイクル 19 課題 データ収集 集計/分析 企画立案 行動 振り返り サイクルを早く回せれるほどビジネスも早く進みやすい
Slide 20
Slide 20 text
データ活用のサイクル 20 課題 データ収集 集計/分析 企画立案 行動 振り返り 最初の壁
Slide 21
Slide 21 text
データ活用を回すための最初の壁 21 データ基盤からデータを取り出し、課題解決を行うためにはハードルが存在 1. SQL/BIの知識が必要 2. 複数サービスのドメイン知識が必要 3. データがどこにあるかわからない 4. データ抽出後にデータを有効に使う方法がわからない
Slide 22
Slide 22 text
データ活用を回すための最初の壁 22 データ基盤からデータを取り出し、課題解決を行うためにはハードルが存在 1. SQL/BIの知識が必要 2. 複数サービスのドメイン知識が必要 3. データがどこにあるかわからない 4. データ抽出後にデータを有効に使う方法がわからない → データチームに依頼する or サポートを受ければ解決するが、 タイミングによっては依頼からリードタイムが発生することがある。 人のリソースは有限。
Slide 23
Slide 23 text
Keplerの登場により 23 1. SQL/BIの知識が必要 2. 複数サービスのドメイン知識が必要 3. データがどこにあるかわからない 4. データ抽出後にデータを有効に使う方法がわからない
Slide 24
Slide 24 text
Keplerの登場により 24 1. SQL/BIの知識が必要 → KeplerがSQLを生成/実行 2. 複数サービスのドメイン知識が必要 3. データがどこにあるかわからない 4. データ抽出後にデータを有効に使う方法がわからない
Slide 25
Slide 25 text
Keplerの登場により 25 1. SQL/BIの知識が必要 → KeplerがSQLを生成/実行 2. 複数サービスのドメイン知識が必要 → Keplerが社内ドキュメントを検索(展望) 3. データがどこにあるかわからない 4. データ抽出後にデータを有効に使う方法がわからない
Slide 26
Slide 26 text
Keplerの登場により 26 1. SQL/BIの知識が必要 → KeplerがSQLを生成/実行 2. 複数サービスのドメイン知識が必要 → Keplerが社内ドキュメントを検索(展望) 3. データがどこにあるかわからない → Keplerがスキーマ/カタログを検索 4. データ抽出後にデータを有効に使う方法がわからない
Slide 27
Slide 27 text
Keplerの登場により 27 1. SQL/BIの知識が必要 → KeplerがSQLを生成/実行 2. 複数サービスのドメイン知識が必要 → Keplerが社内ドキュメントを検索(展望) 3. データがどこにあるかわからない → Keplerがスキーマ/カタログを検索 4. データ抽出後にデータを有効に使う方法がわからない → Keplerがデータ分析をサポート
Slide 28
Slide 28 text
Keplerと協力して最初の壁を壊してデータ活用を進める 28 データ活用 最初の壁
Slide 29
Slide 29 text
目次 29 会社概要 STORES のデータ基盤 AI Agent Keplerについて AIが活躍するためにやっていること さいごに 01 02 03 04 05
Slide 30
Slide 30 text
AIが活躍するためにやっていること 30 1. よく使うテーブルをまとめたワイドテーブルの作成 2. スキーマ情報の集約 3. dbt docsの内容をNotionに連携 4. Keplerへのフィードバックをもとに基盤とKeplerの改善
Slide 31
Slide 31 text
AIが活躍するためにやっていること 31 1. よく使うテーブルをまとめたワイドテーブルの作成 2. スキーマ情報の集約 3. dbt docsの内容をNotionに連携 4. Keplerへのフィードバックをもとに基盤とKeplerの改善
Slide 32
Slide 32 text
Keplerがスキーマ検索時に困ること 32 ネットショップのxx分析して テーブルA テーブルA´ テーブルA´´ 依頼 回答 似たテーブル、 似たカラムが多い → 試行錯誤が多くなる → 意図しない結果になる
Slide 33
Slide 33 text
ワイドテーブルの作成 33 STORES サービス STORES サービス STORES サービス サービスに特化した ワイドテーブル STORES サービス STORES サービス STORES サービス サービスをクロスして 見たい時の要件をあつめた ワイドテーブル AIにとっても 人にとっても便利
Slide 34
Slide 34 text
AIが活躍するためにやっていること 34 1. よく使うテーブルをまとめたワイドテーブルの作成 2. スキーマ情報の集約 3. dbt docsの内容をNotionに連携 4. Keplerへのフィードバックをもとに基盤とKeplerの改善
Slide 35
Slide 35 text
各サービスの最新のスキーマを1つのリポジトリに集約 35 schema変更でトリガー schema 集約リポジトリ RDB DDLに 変換&コミット 各サービス リポジトリ GitHub Actions CREATE TABLE … schema.sql
Slide 36
Slide 36 text
各サービスの最新のスキーマを1つのリポジトリに集約 集約リポジトリ スキーマ変更通知 開発時に参照 スキーマ検索時に 開発リポジトリの テーブル/カラムコメント を見にいく
Slide 37
Slide 37 text
AIが活躍するためにやっていること 37 1. よく使うテーブルをまとめたワイドテーブルの作成 2. スキーマ情報の集約 3. dbt docsの内容をNotionに連携 4. Keplerへのフィードバックをもとに基盤とKeplerの改善
Slide 38
Slide 38 text
dbt docsについて 38 dbt モデルファイル 特に制御しなければ全モデルがdbt docsに出る 加工レイヤーも反映
Slide 39
Slide 39 text
dbt docsに求める情報の粒度の違い(開発者) Exposures が見たい 特定のsourceに依存したモデルを確 認したい 見たい情報が多い
Slide 40
Slide 40 text
dbt docsに求める情報の粒度の違い(データ基盤利用者) 情報量が多い モデル名表記なので分かりにくい etc . 関心のある情報のみが出るのがベスト
Slide 41
Slide 41 text
スキーマ検索 利用体験向上のため dbt docsに出すモデルの量を減らしたりして 基盤利用者用のdbt dcosを提供すれば緩和されるかもしれないが
Slide 42
Slide 42 text
スキーマ検索 利用体験向上のため dbt docsに出すモデルの量を減らしたりして 基盤利用者用のdbt dcosを提供すれば緩和されるかもしれないが → 情報量減らした上で検索体験を高めたい。 全社的に利用頻度の高いツールNotionへ移行
Slide 43
Slide 43 text
dbt docsの内容をNotionに連携
Slide 44
Slide 44 text
利用者用のカタログをNotionにしてみて Notion AI によって検索体験が上がった
Slide 45
Slide 45 text
利用者用のカタログをNotionにしてみて dbt の ymlを変更しなくてもデータカタログの情報を増やせるように
Slide 46
Slide 46 text
利用者用のカタログをNotionにしてみて Keplerがスキーマ検索時にNotionのデータも複合的に見れるように(展望) ネットショップ の 売上について教えて 社内用語/テーブルの利用優先度 スキーマ検索 データが発生するロジックを検索 依頼 回答
Slide 47
Slide 47 text
AIが活躍するためにやっていること 47 1. よく使うテーブルをまとめたワイドテーブルの作成 2. スキーマ情報の集約 3. dbt docsの内容をNotionに連携 4. Keplerへのフィードバックをもとに基盤とKeplerの改善
Slide 48
Slide 48 text
フィードバックの収集 48 Keplerの回答に対してのフィードバックを収集
Slide 49
Slide 49 text
Keplerの改善 49 ● UI 改善 ○ SQLをコピーできるボタンをつけて欲しい ○ 文字サイズを大きくして欲しい ○ チャットの送信をSlackと同じ形式にして欲しい(Enter改行) ● Agent 改善 ○ xxx のデータも追加して欲しい ○ Agentのレスポンスを早くして欲しい ○ システムプロンプトの改善
Slide 50
Slide 50 text
データ基盤の改善 50 KeplerのセッションDBの活用(展望) Google Agent Developer Kitを利用するとCloud SQLに ユーザーとAgentのやり取りログが保存される。 保存されたやり取りログとフィードバックを使って基盤の改善に活かす
Slide 51
Slide 51 text
データ基盤の改善 51 BigQuery ジョブ実行履歴+セッションDBを使って基盤の継続的な改善 ジョブ実行 履歴 利用ログ 需要の高い テーブル 問い合わせを 抽出 データ基盤への データ追加/データマート改善
Slide 52
Slide 52 text
目次 52 会社概要 STORES のデータ基盤 AI Agent Keplerについて AIが活躍するためにやっていること さいごに 01 02 03 04 05
Slide 53
Slide 53 text
さいごに 53 ● AI が活躍する基盤を目指すのであれば、まずはAIに働いてもらうのが大事 ● AI が活躍することは暗黙知を表出化する行為 ≒ 人も便利になる ● AI が活躍することがわかれば、全社的にメタデータを集めるとかデータマー トを整備すると言ったことがやりやすくなる
Slide 54
Slide 54 text
まずはAIに働いてもらう - Google Agent Developer Kit 54 Google Agent Developer Kitを使う場合は 1. BigQueryのプロジェクトと検証用のデータセットを一つ作成 2. adk-sample にアクセス 3. python/agents/data-science のREADMEを参考にセットアップ 4. README通りにデプロイ 5. Cloud Runで動くデータ分析Agentの完成
Slide 55
Slide 55 text
55 ありがとうございました!
Slide 56
Slide 56 text
56
Slide 57
Slide 57 text
#2C85DE #F79A40 #EB75AA #EE5253 #10AC84 #6833D4 #0AB0DE #F5CC00 Text A Text Text Text Text Text Text Text Text Text A Text Text Text Text Text Text Text Text