Upgrade to Pro — share decks privately, control downloads, hide ads and more …

[2025-09-30] Databricks Genie を利用した分析基盤とデータモデリン...

Avatar for 和田 悠佑 和田 悠佑
September 30, 2025

[2025-09-30] Databricks Genie を利用した分析基盤とデータモデリングの IVRy の現在地

「AI時代の意思決定を支える 各社のデータ基盤Lunch Talk」( https://findy.connpass.com/event/368980/ ) での発表資料です。

Avatar for 和田 悠佑

和田 悠佑

September 30, 2025
Tweet

More Decks by 和田 悠佑

Other Decks in Technology

Transcript

  1. 2013 年: ヤフー(カーナビ、オークション) Android エンジニア、データサイエンティスト、etc, ... 2019 年: メルカリ(フリマ) 検索機能周りのデータアナリスト、エンジニア

    2022 年: estie(不動産領域バーティカル SaaS) データ基盤エンジニアとして Snowflake や dbt の導⼊ 2024 年: IVRy(対話型⾳声AI SaaS) アナリティクスエンジニアとして、 データ分析や各種データモデルの整備 2 ⾃⼰紹介 和⽥ 悠佑 Analytics Engineer
  2. 17 Genie 検証 raw data 側 MQL をカウントして SELECT COUNT_IF(is_mql)

    AS mql FROM salesforce.hoge inner join …… is_mql ってカラム初めて⾒たかも……
  3. 19 Genie 検証 raw data 側 - 結果 😢 任意の

    raw data に対して Genie でアプローチして 正確なデータを得るのは難しい Genie が悪いのではなく raw data が⼈間にとっても難しすぎる (メタデータが不⾜している)
  4. 27 ダッシュボードや Genie と相性が良い SELECT month, MEASURE(revenue) FROM sample_metric_view GROUP

    BY ALL SELECT client_id, MEASURE(revenue) FROM sample_metric_view GROUP BY ALL ⽉ごとに revenue を集計したい client 単位で revenue を集計したい
  5. 30 AI 時代でも、事前のデータモデリングが⼤事 Fact Table Dimension Table staging 層 mart

    層 warehouse 層 ダッシュボード with Genie metric view として実装 (セマンティックレイヤー) ここが⼤事!
  6. 32 IVRy の現在地 セマンティックレイヤーを metric view として実現 1 ダッシュボードと Genie

    で metric view を参照 2 整備済みデータに対して Genie は有効に活⽤可能 3 様々な要求に耐えられるデータモデリングに奮闘中 4
  7. 34 Genie をより⾃由度⾼く使いたい metric view をベースにした ダッシュボードと Genie の運⽤は metric

    view の中⾝にキャップされる Genie はもうちょっとポテンシャルがありそうなので raw data 側でも使えるようにしていきたい
  8. 35 両側からデータ整備を推進中 Lake 層 mart 層 Analytics Engineer 側で ダッシュボードと

    Genie を想定した セマンティックレイヤーの description 等を整備 Data Infra 側で Claude Code を使って Ruby on Rails のコードから description を⾃動⽣成
  9. 40 まとめ データの出⼝側から AI 利⽤を推進 1 整備されたデータに対して AI での集計は有⽤ 2

    AI 時代もデータモデリングが⼤事 3 より曖昧な問い合わせへの対応の実現が課題 4