Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
[2025-09-30] Databricks Genie を利用した分析基盤とデータモデリン...
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
和田 悠佑
September 30, 2025
Technology
0
820
[2025-09-30] Databricks Genie を利用した分析基盤とデータモデリングの IVRy の現在地
「AI時代の意思決定を支える 各社のデータ基盤Lunch Talk」(
https://findy.connpass.com/event/368980/
) での発表資料です。
和田 悠佑
September 30, 2025
Tweet
Share
More Decks by 和田 悠佑
See All by 和田 悠佑
データ民主化のための LLM 活用状況と課題紹介(IVRy の場合)
wxyzzz
2
870
[2025-03-25] 初のホリゾンタル SaaS 領域で思うデータ分析職の価値
wxyzzz
0
640
Other Decks in Technology
See All in Technology
ナレッジワークのご紹介(第88回情報処理学会 )
kworkdev
PRO
0
180
複数クラスタ運用と検索の高度化:ビズリーチにおけるElastic活用事例 / ElasticON Tokyo2026
visional_engineering_and_design
0
130
聲の形にみるアクセシビリティ
tomokusaba
0
170
類似画像検索モデルの開発ノウハウ
lycorptech_jp
PRO
5
1.1k
SRE NEXT 2026 CfP レビュアーが語る聞きたくなるプロポーザルとは?
yutakawasaki0911
0
230
Oracle Database@Google Cloud:サービス概要のご紹介
oracle4engineer
PRO
5
1.2k
kintone開発のプラットフォームエンジニアの紹介
cybozuinsideout
PRO
0
860
(Test) ai-meetup slide creation
oikon48
1
220
Shifting from MCP to Skills / ベストプラクティスの変遷を辿る
yamanoku
4
790
Google系サービスで文字起こしから勝手にカレンダーを埋めるエージェントを作った話
risatube
0
130
越境する組織づくり ─ 多様性を前提にしたチームビルディングとリードの実践知
kido_engineer
2
180
NewSQL_ ストレージ分離と分散合意を用いたスケーラブルアーキテクチャ
hacomono
PRO
1
160
Featured
See All Featured
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
360
30k
The AI Revolution Will Not Be Monopolized: How open-source beats economies of scale, even for LLMs
inesmontani
PRO
3
3.1k
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
234
17k
Music & Morning Musume
bryan
47
7.1k
Agile Leadership in an Agile Organization
kimpetersen
PRO
0
110
Lessons Learnt from Crawling 1000+ Websites
charlesmeaden
PRO
1
1.1k
Site-Speed That Sticks
csswizardry
13
1.1k
Building a A Zero-Code AI SEO Workflow
portentint
PRO
0
380
Dominate Local Search Results - an insider guide to GBP, reviews, and Local SEO
greggifford
PRO
0
99
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
231
22k
My Coaching Mixtape
mlcsv
0
69
Believing is Seeing
oripsolob
1
79
Transcript
Databricks Genie を利⽤した分析基盤と データモデリングの IVRy の現在地 AI時代の意思決定を⽀える 各社のデータ基盤Lunch Talk #data_findy
株式会社 IVRy アナリティクスエンジニア 和⽥悠佑 2025-09-30
2013 年: ヤフー(カーナビ、オークション) Android エンジニア、データサイエンティスト、etc, ... 2019 年: メルカリ(フリマ) 検索機能周りのデータアナリスト、エンジニア
2022 年: estie(不動産領域バーティカル SaaS) データ基盤エンジニアとして Snowflake や dbt の導⼊ 2024 年: IVRy(対話型⾳声AI SaaS) アナリティクスエンジニアとして、 データ分析や各種データモデルの整備 2 ⾃⼰紹介 和⽥ 悠佑 Analytics Engineer
IVRとAIであらゆる電話対応を効率化 「アイブリー」 3 プロダクト
累計5,000万着電に⾃動応答しています 4
5 今⽇話すこと IVRy のデータ分析基盤での AI 機能の活⽤の現在地を紹介 現時点での AI 活⽤に対する情報の共有
6 もくじ 1. データ基盤アーキテクチャ 2. AI/BI Genie 3. metric view
4. 現在地まとめ 5. 課題 6. おわりに
7 データ基盤アーキテクチャ
8 7 ⽉から Databricks に本格移⾏ 移⾏の背景 BigQuery への転送、ストレージコストの削減 (プロダクトは AWS)
エンジニアリングの⾃由度が⾼そうと判断 (データ‧機械学習)
データ基盤のアーキテクチャ ( https://findy-tools.io/companies/ivry/90/76 ) 9
10 データを社内で使うところ中⼼に紹介
11 分析データパイプライン Lake 層 (raw data) source 層 (staging 層)
warehouse 層 mart 層 intermediate 層
12 AI/BI Genie
13 集計‧分析に対する課題 データサークルへの依頼がボトルネック 各々が書いた集計クエリの品質がまちまち
14 Databricks に対する期待 データエンジニア観点ではコストダウン(当初の⽬的) 分析観点では⾃然⾔語でのデータ集計‧分析
15 AI/BI Genie データに対して⾃然⾔語で問い合わせできる Databricks 公式サイトより
データサークルに依頼するとリードタイムがかかる ビジネスメンバーが⾃分⾃⾝でやると、細かい定義に差がでうる 課題 Genie で解決できないだろうか? 16 返答の品質が担保できれば ビジネスメンバーが⾃分で必要なデータを Genie を使って取得できる
⾃分で完結できる上に、データの定義もズレない 理想
17 Genie 検証 raw data 側 MQL をカウントして SELECT COUNT_IF(is_mql)
AS mql FROM salesforce.hoge inner join …… is_mql ってカラム初めて⾒たかも……
18 Genie 検証 raw data 側 is_mql ってなんですか? 昔使っていて、 今使ってないやつっぽい
なるほどですね Salesforce Admin 様
19 Genie 検証 raw data 側 - 結果 😢 任意の
raw data に対して Genie でアプローチして 正確なデータを得るのは難しい Genie が悪いのではなく raw data が⼈間にとっても難しすぎる (メタデータが不⾜している)
20 Genie 検証 ダッシュボード側 ダッシュボードに登録されたデータに対して質問可能
21 内訳の可視化の切り替えはかなり正確
ダッシュボード⽤に整備されたデータに対しては Genie は正確に動作する 曖昧な問い合わせでもちゃんと解釈してくれる 「業種をサービス業に絞って」という指⽰も SQL 作成時は industry = 'サービス業(他に分類されないもの)'
とデータの中⾝を考慮してくれる 22 Genie 検証 Dashboard 側 - 結果 👍
23 IVRy の現在地 - Genie まずはダッシュボードと併⽤で Genie を使ってもらう⽅針に ダッシュボード内のデータの深堀りに活⽤ ダッシュボード作成⼯数削減効果も
ただし、ダッシュボード内で表現できないデータは Genie でも回答不能であることが課題
24 metric view
25 metric view セマンティックレイヤーの役割の View Databricks ドキュメントより
26 yml で定義(dbt 対応がまだ)
27 ダッシュボードや Genie と相性が良い SELECT month, MEASURE(revenue) FROM sample_metric_view GROUP
BY ALL SELECT client_id, MEASURE(revenue) FROM sample_metric_view GROUP BY ALL ⽉ごとに revenue を集計したい client 単位で revenue を集計したい
28 様々な要求に耐えうる粒度のデータが必要 ダッシュボードを深堀りする⽤途で Genie を使う場合 ダッシュボードで表⽰するよりも細かい粒度で データを保持しておく必要がある
今まで逃げていた アドホック集計で必要となるような粒度のデータも できるだけ事前に⽤意しておかないと AI 対応できない 29 AI 対応のためには逃げられない! (⾃分でスプシで加⼯するから) 全項⽬のデータください
(⼤変なんだよな……) ⼀旦、全体感を⾒るか、影響の⼤きいところ上位を⾒ましょう 依頼者
30 AI 時代でも、事前のデータモデリングが⼤事 Fact Table Dimension Table staging 層 mart
層 warehouse 層 ダッシュボード with Genie metric view として実装 (セマンティックレイヤー) ここが⼤事!
31 IVRy の現在地まとめ
32 IVRy の現在地 セマンティックレイヤーを metric view として実現 1 ダッシュボードと Genie
で metric view を参照 2 整備済みデータに対して Genie は有効に活⽤可能 3 様々な要求に耐えられるデータモデリングに奮闘中 4
33 課題
34 Genie をより⾃由度⾼く使いたい metric view をベースにした ダッシュボードと Genie の運⽤は metric
view の中⾝にキャップされる Genie はもうちょっとポテンシャルがありそうなので raw data 側でも使えるようにしていきたい
35 両側からデータ整備を推進中 Lake 層 mart 層 Analytics Engineer 側で ダッシュボードと
Genie を想定した セマンティックレイヤーの description 等を整備 Data Infra 側で Claude Code を使って Ruby on Rails のコードから description を⾃動⽣成
36 Genie の動作の調整 Genie に対する⾃然⾔語問い合わせの履歴は確認可能 評価もつけられるので、マイナス評価のものに対応していく
37 継続な普及活動が必要 問い合わせ結果に対して 👍 / 👎 で評価できるとしても 利⽤者はできないことに当たると遠ざかってしまう データの出⼝側から進める場合は 継続的に利⽤してもらう働きかけも課題になる
CEO が分析での AI に協⼒的で⼼強い Analytics Engineer 側はできないことをできるように データモデルを改善して社内展開 38 トップダウン⽀援も
39 おわりに
40 まとめ データの出⼝側から AI 利⽤を推進 1 整備されたデータに対して AI での集計は有⽤ 2
AI 時代もデータモデリングが⼤事 3 より曖昧な問い合わせへの対応の実現が課題 4
41 IVRy, AI で⾊々チャレンジしてます! 9/1 〜 30 まで各種領域で AI 関連のブログ発信してます!
ぜひご覧ください! https://note.com/ivry/n/na4f8be95a13b
42 We are Hiring!