Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
[2025-09-30] Databricks Genie を利用した分析基盤とデータモデリン...
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
和田 悠佑
September 30, 2025
Technology
860
0
Share
[2025-09-30] Databricks Genie を利用した分析基盤とデータモデリングの IVRy の現在地
「AI時代の意思決定を支える 各社のデータ基盤Lunch Talk」(
https://findy.connpass.com/event/368980/
) での発表資料です。
和田 悠佑
September 30, 2025
More Decks by 和田 悠佑
See All by 和田 悠佑
[2026-03-24] データ分析基盤において AI でチャレンジしていること
wxyzzz
1
720
データ民主化のための LLM 活用状況と課題紹介(IVRy の場合)
wxyzzz
2
930
[2025-03-25] 初のホリゾンタル SaaS 領域で思うデータ分析職の価値
wxyzzz
0
680
Other Decks in Technology
See All in Technology
All About Sansan – for New Global Engineers
sansan33
PRO
1
1.4k
Azure Lifecycle with Copilot CLI
torumakabe
3
970
[OpsJAWS 40]リリースしたら終わり、じゃなかった。セキュリティ空白期間をAWS Security Agentで埋める
sh_fk2
3
190
猫でもわかるKiro CLI(CDKコーディング編)
kentapapa
1
120
明日からドヤれる!超マニアックなAWSセキュリティTips10連発 / 10 Ultra-Niche AWS Security Tips
yuj1osm
0
510
Zero Data Loss Autonomous Recovery Service サービス概要
oracle4engineer
PRO
5
14k
Introduction to Sansan for Engineers / エンジニア向け会社紹介
sansan33
PRO
6
74k
Introduction to Sansan, inc / Sansan Global Development Center, Inc.
sansan33
PRO
0
3k
AI時代にデータ基盤が持つべきCapabilityを考える + Snowflake Data Superheroやっていき宣言 / Considering the Capabilities Data Platforms Should Have in the AI Era + Declaration of Commitment as a Snowflake Data Superhero
civitaspo
0
110
Eight Engineering Unit 紹介資料
sansan33
PRO
3
7.2k
Claude Code を安全に使おう勉強会 / Claude Code Security Basics
masahirokawahara
0
280
Digitization部 紹介資料
sansan33
PRO
1
7.3k
Featured
See All Featured
HU Berlin: Industrial-Strength Natural Language Processing with spaCy and Prodigy
inesmontani
PRO
0
320
Measuring Dark Social's Impact On Conversion and Attribution
stephenakadiri
1
180
The innovator’s Mindset - Leading Through an Era of Exponential Change - McGill University 2025
jdejongh
PRO
1
150
GraphQLとの向き合い方2022年版
quramy
50
15k
AI: The stuff that nobody shows you
jnunemaker
PRO
6
550
Stop Working from a Prison Cell
hatefulcrawdad
274
21k
Conquering PDFs: document understanding beyond plain text
inesmontani
PRO
4
2.6k
AI Search: Implications for SEO and How to Move Forward - #ShenzhenSEOConference
aleyda
1
1.2k
Deep Space Network (abreviated)
tonyrice
0
110
SEOcharity - Dark patterns in SEO and UX: How to avoid them and build a more ethical web
sarafernandez
0
170
The Cost Of JavaScript in 2023
addyosmani
55
9.8k
Darren the Foodie - Storyboard
khoart
PRO
3
3.2k
Transcript
Databricks Genie を利⽤した分析基盤と データモデリングの IVRy の現在地 AI時代の意思決定を⽀える 各社のデータ基盤Lunch Talk #data_findy
株式会社 IVRy アナリティクスエンジニア 和⽥悠佑 2025-09-30
2013 年: ヤフー(カーナビ、オークション) Android エンジニア、データサイエンティスト、etc, ... 2019 年: メルカリ(フリマ) 検索機能周りのデータアナリスト、エンジニア
2022 年: estie(不動産領域バーティカル SaaS) データ基盤エンジニアとして Snowflake や dbt の導⼊ 2024 年: IVRy(対話型⾳声AI SaaS) アナリティクスエンジニアとして、 データ分析や各種データモデルの整備 2 ⾃⼰紹介 和⽥ 悠佑 Analytics Engineer
IVRとAIであらゆる電話対応を効率化 「アイブリー」 3 プロダクト
累計5,000万着電に⾃動応答しています 4
5 今⽇話すこと IVRy のデータ分析基盤での AI 機能の活⽤の現在地を紹介 現時点での AI 活⽤に対する情報の共有
6 もくじ 1. データ基盤アーキテクチャ 2. AI/BI Genie 3. metric view
4. 現在地まとめ 5. 課題 6. おわりに
7 データ基盤アーキテクチャ
8 7 ⽉から Databricks に本格移⾏ 移⾏の背景 BigQuery への転送、ストレージコストの削減 (プロダクトは AWS)
エンジニアリングの⾃由度が⾼そうと判断 (データ‧機械学習)
データ基盤のアーキテクチャ ( https://findy-tools.io/companies/ivry/90/76 ) 9
10 データを社内で使うところ中⼼に紹介
11 分析データパイプライン Lake 層 (raw data) source 層 (staging 層)
warehouse 層 mart 層 intermediate 層
12 AI/BI Genie
13 集計‧分析に対する課題 データサークルへの依頼がボトルネック 各々が書いた集計クエリの品質がまちまち
14 Databricks に対する期待 データエンジニア観点ではコストダウン(当初の⽬的) 分析観点では⾃然⾔語でのデータ集計‧分析
15 AI/BI Genie データに対して⾃然⾔語で問い合わせできる Databricks 公式サイトより
データサークルに依頼するとリードタイムがかかる ビジネスメンバーが⾃分⾃⾝でやると、細かい定義に差がでうる 課題 Genie で解決できないだろうか? 16 返答の品質が担保できれば ビジネスメンバーが⾃分で必要なデータを Genie を使って取得できる
⾃分で完結できる上に、データの定義もズレない 理想
17 Genie 検証 raw data 側 MQL をカウントして SELECT COUNT_IF(is_mql)
AS mql FROM salesforce.hoge inner join …… is_mql ってカラム初めて⾒たかも……
18 Genie 検証 raw data 側 is_mql ってなんですか? 昔使っていて、 今使ってないやつっぽい
なるほどですね Salesforce Admin 様
19 Genie 検証 raw data 側 - 結果 😢 任意の
raw data に対して Genie でアプローチして 正確なデータを得るのは難しい Genie が悪いのではなく raw data が⼈間にとっても難しすぎる (メタデータが不⾜している)
20 Genie 検証 ダッシュボード側 ダッシュボードに登録されたデータに対して質問可能
21 内訳の可視化の切り替えはかなり正確
ダッシュボード⽤に整備されたデータに対しては Genie は正確に動作する 曖昧な問い合わせでもちゃんと解釈してくれる 「業種をサービス業に絞って」という指⽰も SQL 作成時は industry = 'サービス業(他に分類されないもの)'
とデータの中⾝を考慮してくれる 22 Genie 検証 Dashboard 側 - 結果 👍
23 IVRy の現在地 - Genie まずはダッシュボードと併⽤で Genie を使ってもらう⽅針に ダッシュボード内のデータの深堀りに活⽤ ダッシュボード作成⼯数削減効果も
ただし、ダッシュボード内で表現できないデータは Genie でも回答不能であることが課題
24 metric view
25 metric view セマンティックレイヤーの役割の View Databricks ドキュメントより
26 yml で定義(dbt 対応がまだ)
27 ダッシュボードや Genie と相性が良い SELECT month, MEASURE(revenue) FROM sample_metric_view GROUP
BY ALL SELECT client_id, MEASURE(revenue) FROM sample_metric_view GROUP BY ALL ⽉ごとに revenue を集計したい client 単位で revenue を集計したい
28 様々な要求に耐えうる粒度のデータが必要 ダッシュボードを深堀りする⽤途で Genie を使う場合 ダッシュボードで表⽰するよりも細かい粒度で データを保持しておく必要がある
今まで逃げていた アドホック集計で必要となるような粒度のデータも できるだけ事前に⽤意しておかないと AI 対応できない 29 AI 対応のためには逃げられない! (⾃分でスプシで加⼯するから) 全項⽬のデータください
(⼤変なんだよな……) ⼀旦、全体感を⾒るか、影響の⼤きいところ上位を⾒ましょう 依頼者
30 AI 時代でも、事前のデータモデリングが⼤事 Fact Table Dimension Table staging 層 mart
層 warehouse 層 ダッシュボード with Genie metric view として実装 (セマンティックレイヤー) ここが⼤事!
31 IVRy の現在地まとめ
32 IVRy の現在地 セマンティックレイヤーを metric view として実現 1 ダッシュボードと Genie
で metric view を参照 2 整備済みデータに対して Genie は有効に活⽤可能 3 様々な要求に耐えられるデータモデリングに奮闘中 4
33 課題
34 Genie をより⾃由度⾼く使いたい metric view をベースにした ダッシュボードと Genie の運⽤は metric
view の中⾝にキャップされる Genie はもうちょっとポテンシャルがありそうなので raw data 側でも使えるようにしていきたい
35 両側からデータ整備を推進中 Lake 層 mart 層 Analytics Engineer 側で ダッシュボードと
Genie を想定した セマンティックレイヤーの description 等を整備 Data Infra 側で Claude Code を使って Ruby on Rails のコードから description を⾃動⽣成
36 Genie の動作の調整 Genie に対する⾃然⾔語問い合わせの履歴は確認可能 評価もつけられるので、マイナス評価のものに対応していく
37 継続な普及活動が必要 問い合わせ結果に対して 👍 / 👎 で評価できるとしても 利⽤者はできないことに当たると遠ざかってしまう データの出⼝側から進める場合は 継続的に利⽤してもらう働きかけも課題になる
CEO が分析での AI に協⼒的で⼼強い Analytics Engineer 側はできないことをできるように データモデルを改善して社内展開 38 トップダウン⽀援も
39 おわりに
40 まとめ データの出⼝側から AI 利⽤を推進 1 整備されたデータに対して AI での集計は有⽤ 2
AI 時代もデータモデリングが⼤事 3 より曖昧な問い合わせへの対応の実現が課題 4
41 IVRy, AI で⾊々チャレンジしてます! 9/1 〜 30 まで各種領域で AI 関連のブログ発信してます!
ぜひご覧ください! https://note.com/ivry/n/na4f8be95a13b
42 We are Hiring!