Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
[2025-09-30] Databricks Genie を利用した分析基盤とデータモデリン...
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
和田 悠佑
September 30, 2025
Technology
0
780
[2025-09-30] Databricks Genie を利用した分析基盤とデータモデリングの IVRy の現在地
「AI時代の意思決定を支える 各社のデータ基盤Lunch Talk」(
https://findy.connpass.com/event/368980/
) での発表資料です。
和田 悠佑
September 30, 2025
Tweet
Share
More Decks by 和田 悠佑
See All by 和田 悠佑
データ民主化のための LLM 活用状況と課題紹介(IVRy の場合)
wxyzzz
2
650
[2025-03-25] 初のホリゾンタル SaaS 領域で思うデータ分析職の価値
wxyzzz
0
580
Other Decks in Technology
See All in Technology
Oracle Cloud Observability and Management Platform - OCI 運用監視サービス概要 -
oracle4engineer
PRO
2
14k
セキュリティ はじめの一歩
nikinusu
0
1.5k
あたらしい上流工程の形。 0日導入からはじめるAI駆動PM
kumaiu
5
750
GSIが複数キー対応したことで、俺達はいったい何が嬉しいのか?
smt7174
3
130
クレジットカード決済基盤を支えるSRE - 厳格な監査とSRE運用の両立 (SRE Kaigi 2026)
capytan
6
2.4k
入社1ヶ月でデータパイプライン講座を作った話
waiwai2111
1
220
変化するコーディングエージェントとの現実的な付き合い方 〜Cursor安定択説と、ツールに依存しない「資産」〜
empitsu
4
1.3k
Meshy Proプラン課金した
henjin0
0
240
All About Sansan – for New Global Engineers
sansan33
PRO
1
1.3k
Bill One急成長の舞台裏 開発組織が直面した失敗と教訓
sansantech
PRO
1
190
ZOZOにおけるAI活用の現在 ~開発組織全体での取り組みと試行錯誤~
zozotech
PRO
4
4.7k
コスト削減から「セキュリティと利便性」を担うプラットフォームへ
sansantech
PRO
3
1.2k
Featured
See All Featured
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
133
19k
Sam Torres - BigQuery for SEOs
techseoconnect
PRO
0
180
Side Projects
sachag
455
43k
Unsuck your backbone
ammeep
671
58k
Introduction to Domain-Driven Design and Collaborative software design
baasie
1
580
More Than Pixels: Becoming A User Experience Designer
marktimemedia
3
310
How to optimise 3,500 product descriptions for ecommerce in one day using ChatGPT
katarinadahlin
PRO
0
3.4k
Agile Actions for Facilitating Distributed Teams - ADO2019
mkilby
0
110
Product Roadmaps are Hard
iamctodd
PRO
55
12k
Darren the Foodie - Storyboard
khoart
PRO
2
2.3k
Context Engineering - Making Every Token Count
addyosmani
9
650
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
234
17k
Transcript
Databricks Genie を利⽤した分析基盤と データモデリングの IVRy の現在地 AI時代の意思決定を⽀える 各社のデータ基盤Lunch Talk #data_findy
株式会社 IVRy アナリティクスエンジニア 和⽥悠佑 2025-09-30
2013 年: ヤフー(カーナビ、オークション) Android エンジニア、データサイエンティスト、etc, ... 2019 年: メルカリ(フリマ) 検索機能周りのデータアナリスト、エンジニア
2022 年: estie(不動産領域バーティカル SaaS) データ基盤エンジニアとして Snowflake や dbt の導⼊ 2024 年: IVRy(対話型⾳声AI SaaS) アナリティクスエンジニアとして、 データ分析や各種データモデルの整備 2 ⾃⼰紹介 和⽥ 悠佑 Analytics Engineer
IVRとAIであらゆる電話対応を効率化 「アイブリー」 3 プロダクト
累計5,000万着電に⾃動応答しています 4
5 今⽇話すこと IVRy のデータ分析基盤での AI 機能の活⽤の現在地を紹介 現時点での AI 活⽤に対する情報の共有
6 もくじ 1. データ基盤アーキテクチャ 2. AI/BI Genie 3. metric view
4. 現在地まとめ 5. 課題 6. おわりに
7 データ基盤アーキテクチャ
8 7 ⽉から Databricks に本格移⾏ 移⾏の背景 BigQuery への転送、ストレージコストの削減 (プロダクトは AWS)
エンジニアリングの⾃由度が⾼そうと判断 (データ‧機械学習)
データ基盤のアーキテクチャ ( https://findy-tools.io/companies/ivry/90/76 ) 9
10 データを社内で使うところ中⼼に紹介
11 分析データパイプライン Lake 層 (raw data) source 層 (staging 層)
warehouse 層 mart 層 intermediate 層
12 AI/BI Genie
13 集計‧分析に対する課題 データサークルへの依頼がボトルネック 各々が書いた集計クエリの品質がまちまち
14 Databricks に対する期待 データエンジニア観点ではコストダウン(当初の⽬的) 分析観点では⾃然⾔語でのデータ集計‧分析
15 AI/BI Genie データに対して⾃然⾔語で問い合わせできる Databricks 公式サイトより
データサークルに依頼するとリードタイムがかかる ビジネスメンバーが⾃分⾃⾝でやると、細かい定義に差がでうる 課題 Genie で解決できないだろうか? 16 返答の品質が担保できれば ビジネスメンバーが⾃分で必要なデータを Genie を使って取得できる
⾃分で完結できる上に、データの定義もズレない 理想
17 Genie 検証 raw data 側 MQL をカウントして SELECT COUNT_IF(is_mql)
AS mql FROM salesforce.hoge inner join …… is_mql ってカラム初めて⾒たかも……
18 Genie 検証 raw data 側 is_mql ってなんですか? 昔使っていて、 今使ってないやつっぽい
なるほどですね Salesforce Admin 様
19 Genie 検証 raw data 側 - 結果 😢 任意の
raw data に対して Genie でアプローチして 正確なデータを得るのは難しい Genie が悪いのではなく raw data が⼈間にとっても難しすぎる (メタデータが不⾜している)
20 Genie 検証 ダッシュボード側 ダッシュボードに登録されたデータに対して質問可能
21 内訳の可視化の切り替えはかなり正確
ダッシュボード⽤に整備されたデータに対しては Genie は正確に動作する 曖昧な問い合わせでもちゃんと解釈してくれる 「業種をサービス業に絞って」という指⽰も SQL 作成時は industry = 'サービス業(他に分類されないもの)'
とデータの中⾝を考慮してくれる 22 Genie 検証 Dashboard 側 - 結果 👍
23 IVRy の現在地 - Genie まずはダッシュボードと併⽤で Genie を使ってもらう⽅針に ダッシュボード内のデータの深堀りに活⽤ ダッシュボード作成⼯数削減効果も
ただし、ダッシュボード内で表現できないデータは Genie でも回答不能であることが課題
24 metric view
25 metric view セマンティックレイヤーの役割の View Databricks ドキュメントより
26 yml で定義(dbt 対応がまだ)
27 ダッシュボードや Genie と相性が良い SELECT month, MEASURE(revenue) FROM sample_metric_view GROUP
BY ALL SELECT client_id, MEASURE(revenue) FROM sample_metric_view GROUP BY ALL ⽉ごとに revenue を集計したい client 単位で revenue を集計したい
28 様々な要求に耐えうる粒度のデータが必要 ダッシュボードを深堀りする⽤途で Genie を使う場合 ダッシュボードで表⽰するよりも細かい粒度で データを保持しておく必要がある
今まで逃げていた アドホック集計で必要となるような粒度のデータも できるだけ事前に⽤意しておかないと AI 対応できない 29 AI 対応のためには逃げられない! (⾃分でスプシで加⼯するから) 全項⽬のデータください
(⼤変なんだよな……) ⼀旦、全体感を⾒るか、影響の⼤きいところ上位を⾒ましょう 依頼者
30 AI 時代でも、事前のデータモデリングが⼤事 Fact Table Dimension Table staging 層 mart
層 warehouse 層 ダッシュボード with Genie metric view として実装 (セマンティックレイヤー) ここが⼤事!
31 IVRy の現在地まとめ
32 IVRy の現在地 セマンティックレイヤーを metric view として実現 1 ダッシュボードと Genie
で metric view を参照 2 整備済みデータに対して Genie は有効に活⽤可能 3 様々な要求に耐えられるデータモデリングに奮闘中 4
33 課題
34 Genie をより⾃由度⾼く使いたい metric view をベースにした ダッシュボードと Genie の運⽤は metric
view の中⾝にキャップされる Genie はもうちょっとポテンシャルがありそうなので raw data 側でも使えるようにしていきたい
35 両側からデータ整備を推進中 Lake 層 mart 層 Analytics Engineer 側で ダッシュボードと
Genie を想定した セマンティックレイヤーの description 等を整備 Data Infra 側で Claude Code を使って Ruby on Rails のコードから description を⾃動⽣成
36 Genie の動作の調整 Genie に対する⾃然⾔語問い合わせの履歴は確認可能 評価もつけられるので、マイナス評価のものに対応していく
37 継続な普及活動が必要 問い合わせ結果に対して 👍 / 👎 で評価できるとしても 利⽤者はできないことに当たると遠ざかってしまう データの出⼝側から進める場合は 継続的に利⽤してもらう働きかけも課題になる
CEO が分析での AI に協⼒的で⼼強い Analytics Engineer 側はできないことをできるように データモデルを改善して社内展開 38 トップダウン⽀援も
39 おわりに
40 まとめ データの出⼝側から AI 利⽤を推進 1 整備されたデータに対して AI での集計は有⽤ 2
AI 時代もデータモデリングが⼤事 3 より曖昧な問い合わせへの対応の実現が課題 4
41 IVRy, AI で⾊々チャレンジしてます! 9/1 〜 30 まで各種領域で AI 関連のブログ発信してます!
ぜひご覧ください! https://note.com/ivry/n/na4f8be95a13b
42 We are Hiring!