Upgrade to Pro — share decks privately, control downloads, hide ads and more …

dbt Semantic Layer × Steep を2年間運用してみて感じたこと

Avatar for Taiki Hoshino Taiki Hoshino
March 25, 2026
120

dbt Semantic Layer × Steep を2年間運用してみて感じたこと

Avatar for Taiki Hoshino

Taiki Hoshino

March 25, 2026
Tweet

Transcript

  1. Data Engineering Study #34 最新トレンドから学ぶ「BIツールの進化と実践」 dbt Semantic Layer × Steep

    を 2年間運用してみて感じたこと Taiki Hoshino / Gaudiy Inc. 2026-03-25 ©️ Gaudiy Inc.
  2. Agenda 自己紹介 / 会社紹介 なぜ dbt Semantic Layer と Steep

    を選んだのか 2年間運用して感じたこと これからのBIツールのあり方 まとめ ©️ Gaudiy Inc. 1
  3. Agenda 自己紹介 / 会社紹介 なぜ dbt Semantic Layer と Steep

    を選んだのか 2年間運用して感じたこと これからのBIツールのあり方 まとめ ©️ Gaudiy Inc. 2
  4. 自己紹介 星野 太紀(Taiki Hoshino) @mochigenmai 2020 - 2022 : dely株式会社(現クラシル株式会社)

    データアナリスト 2022 - 現在 : 株式会社Gaudiy アナリティクスエンジニア(何でも屋) 趣味: シーシャ、ポーカー、古着 ©️ Gaudiy Inc. 3
  5. 会社紹介 Gaudiyは、誰もが好きや夢中で生きられる社会「ファン国家」の創造をビジョンに掲げ、 その実現をエンタメ領域から目指しています 1. Network Union
 共通のビジョンを持ち、集団行動のできるオンラインコミュニティ 2. Network Archipelago


    オンラインとオフライン(領土)がノード的につながるコミュニティ 3. Network State
 既存国家からの外交的な承認を得られたオンライン国家 https://note.com/yuyasan/n/nb734b2a0d949 ©️ Gaudiy Inc. 4
  6. 理想的なファンエコノミー ファンが自律分散的に共創や金融参加し、 なめらかに還元される BTSはファンが共通の志で共創や金融参加を行い、 結果ファンに機会や経済的還元が起こる理想的な循環を作ってます。 ファン 推し活で貢献 ➡️ このサイクルを株式市場ではなく、 トークンを使って実現可能に

    コンテンツ や夢を提供 BTS (事務所) 株価上昇による 経済的還元 金融参加 資金調達 企業価値 向上 株式市場 株還元 組織されたファン BTSとARMY ファンの力でとった アジア初のグラミー賞 BTSファン通称「ARMY」は、BTSのためになる行動を ファンが熟知し、 アルゴリズムの解析から、 研究、 支援ファ ンドなどをユーザーが主導している。 またHYBE株の上場 によってファンが株を買うなどのエコシステムも構築され ている理想のファンエコノミーの1つである。 イ・ジヘン & 桑畑 優香 『BTSとARMY わたした ちは連帯する』 イースト・プレス、 2021 「BTSファン経済圏」 の先にあるもの── 「NFT」 から 「DAO」 へ note.com/yuyasan/n/n65c43af16423 Yuya Ishikawa /Gaudiy CEO ©️ Gaudiy Inc. 5
  7. 事業構成 ファン国家を形づくるためのプロダクト郡 価値伝播 MyAnimeList 世界最大級の アニメ ・ マンガコミュニティサイト 世界240の国と地域のユーザーが利用し、 12億件以上の視聴・読書ビッグデータを有

    する、 世界最大級のアニメ ・ マンガコミュニ ティサイトです。 作品を軸に、 グローバルの ファン同士がつながり、 日本発IPの価値を世 界に拡げていきます。 ©️ Gaudiy I nc. 価値共創 Gaudiy Fanlink ファン共創型の
 コミュニティプラットフォーム 価値分配 Financial Labs Web3時代の
 あたらしい金融インフラ ブロックチェーンやAI技術を活用し、 あたら しい金融インフラの創 出を めざします。 既存 の金融システムで は評価 されづら かった、 ファンの熱量や貢献を 「経済の価値 」 に 変え、 あら ゆる価値が 循環する 持続的なファン 経 済圏をつく ります。 6 IP (知的財産コンテンツ) 独自のファンコ ミュニティ構築を支援するプラットフォーム サービスです。 ブロックチェーンやAI技術を 活用し、 ファンの熱量や貢献を評価 ・ 還元す るエコシステムを構築することで、 IPとファ ンが共創する世界をつく ります。
  8. Agenda 自己紹介 / 会社紹介 なぜ dbt Semantic Layer と Steep

    を選んだのか 2年間運用して感じたこと これからのBIツールのあり方 まとめ ©️ Gaudiy Inc. 8
  9. Steep導入の背景 データチーム: 社員1名 + 業務委託1名の2人体制 既存スタック: BigQuery + dbt Cloud

    SQLの手間と負担 SQLを書くスキルを持っている人は多いものの、データ自体のドメ イン知識が定着していないことが多く、以下のような状態だった データチームに依頼してSQLを作成してもらう データチームメンバーの工数負荷 Redashの既存クエリを修正し、データチームにレビュー依頼 SQLの作成・修正に時間がかかる レビュー依頼の心理的負荷が大きかった 新メンバーのオンボーディング課題 組織拡大で新メンバーが急増し、既存の数値に対してドリルダウン をすることで、事業の解像度を上げたいニーズが増えた SQLを書いたことない人は依頼をするしかない データチームメンバーの工数負荷 SQLを書いたことがあっても、データ自体のドメイン知識がない データチームメンバーの工数負荷 → セマ ン テ ィ ックレイヤ ー で解決を目指した ©️ Gaudiy Inc. 9
  10. dbt Semantic Layerを選んだ理由 dbt Cloud を 利 用 して い

    たことと、 接続で き るBIが 他より多かったため採 用(BIの 乗り換えも考慮 ) ツール dbt Semantic Layer ★ 対象 dbtユーザー dbt親和性 ◎ ネイティブ BI接続先 Steep, Hex, Mode等 判断 ◦ 採用 Cube 汎用 △ 別途構築 当時不安定 × 接続先が不安 Looker (LookML) Lookerユーザー × 無関係 Lookerにロックイン × 高コスト AtScale エンタープライズ △ 連携可 独自接続 × 規模が合わない Kyvos エンタープライズ × 無関係 独自接続 × 規模が合わない Holistics BI一体型 △ 連携可 Holisticsに閉じる × SL単体でない セマンティックレイヤーの選択肢(2024年1月時点) ©️ Gaudiy Inc. 10
  11. Steepを選んだ理由 利用者を制限して導入検証することで格安でスタートすることができたため採用 ツール Tableau Hex Mode Lightdash タイプ BI ノートブック

    BI / 分析 BI(Cloud, OSS) モバイル △ × × × 価格帯 $15-75/user/月 $36-75/editor/月 $6,000〜/年 インスタンス課金 Steep ★ BI ◦ $15/seat/月(3名無料) Klipfolio PowerMetrics メトリクス △ $99/月〜 Push.ai レポート - - Google Sheets ス プ レッ ドシ ート - 無料 dbt Semantic Layer 連携ツール比較(2024年1月時点) 11 ©️ Gaudiy Inc.
  12. Agenda 自己紹介 / 会社紹介 なぜ dbt Semantic Layer と Steep

    を選んだのか 2年間運用して感じたこと これからのBIツールのあり方 まとめ ©️ Gaudiy Inc. 12
  13. 大変だったこと : スタースキーマの徹底が必要 例: CVR(分子: 会員登録数 / 分母: GAランディング数)を集計したい場合 中間モデルをどう作成するべきかを意識しなければいけなかった

    → 結果としてリネージも綺麗になり開発の生産性が向上 Before dim__utm OK fct__landing NG fct__registration dim__user utmのフィルターがfct__registrationに届かない After dim__utm OK fct__landing OK 共通ディメンションでフィルターが効く fct__registration ©️ Gaudiy Inc. 13
  14. 大変だったこと : アドホック分析は残り続ける 例: xxxをしたユーザーの〇〇数を集計したい Step 1 factテーブルでxxxをしたユーザーを絞る Step 2

    そのユーザー群の〇〇数を集計 → → セマンティックレイヤーでは事前に定義できない アドホック分析のためのBIは別途必要 Semantic Layer (Steep) ・ 定点ダッシュボード ・ 事前定義されたメトリクス ・ ドリルダウン・フィルター アドホック BI (Redash) ・ 事前に定義できないクエリ ・ factを組み合わせた探索的分析 ・ 柔軟な可視化 ・ 定期的に古いクエリを削除 ©️ Gaudiy Inc. 14
  15. よかったこと:AIとの親和性 Steep対応で整備したことが、結果的にAI活用の土台になっていた(Text to SQL) AIデータ分析で重要と言われていること Steep対応でやっていたこと スキーマの可読性 テーブル名・カラム名が明確で、LLMが自然言語として解釈できる 参考: tigerdata.com

    / ariseanalytics.com / cloud.google.com ≒ スタースキーマの徹底 dimension/fact のデータセットやテーブルの命名規則が統一され、 テーブルの役割が一目でわかる状態に セマンティックメタデータの充実 カラムの意味・ビジネス定義がドキュメント化されている 参考: aws.amazon.com / nttdata.com / cloud.google.com ≒ descriptionの丁寧な記述 Steep上のカラム説明のためにdbtでカラムのdescriptionも漏れなく 記述していたため、AIもスキーマを正確に理解できる状態に JOINパスの明確化 テーブル間の結合経路が整理され、LLMが迷わない 参考: arxiv:2510.01989 / snowflake.com / cloud.google.com ≒ ファクトとディメンションの整理 スタースキーマでテーブル間の関係が整理され、JOINの道筋が限定さ れる状態に セマンティックレイヤーの整備 = AI活用の最良の投資 ©️ Gaudiy Inc. 15
  16. Agenda 自己紹介 / 会社紹介 なぜ dbt Semantic Layer と Steep

    を選んだのか 2年間運用して感じたこと これからのBIツールのあり方 まとめ ©️ Gaudiy Inc. 16
  17. アドホック分析の使い分けと変容 定点はセマンティックレイヤーで堅実に、アドホックはAIで柔軟に 自然言語クエリ 「XXXを出して」で SQLが自動生成される 定点観測 セマンティックレイヤーなど柔軟性のある仕組みで、 事前定義されたメトリクスを安定的にモニタリング 予測・ネクストアクション トレンド予測と次に

    分析すべきことを提案 使い捨てダッシュボード AIが可視化コードごと生成 用が済んだら捨てる アドホック分析 AIの登場で、「どのBIツールを使うか」ではなく 「何を知りたいか」から逆算して分析手段を選ぶ時代へ AI 異常検知・自動アラート データの異変をAIが 検知し通知 マルチエージェント分析 Agent Teamsで複数の 専門家視点から分析設計 何を定点で見て、何をAIに問うか。使い分けがデータ活用の質を決める 対話型データ探索 チャットで深掘りを続け データを探索 ©️ Gaudiy Inc. 17
  18. Agenda 自己紹介 / 会社紹介 なぜ dbt Semantic Layer と Steep

    を選んだのか 2年間運用して感じたこと これからのBIツールのあり方 まとめ ©️ Gaudiy Inc. 18
  19. まとめ 1. 少人数チームでもdbtの既存資産を活かし、セマンティックレイヤーで指標の一貫性を実現 dbt Cloud利用 × BI接続の多さ × 格安スタート →

    dbt Semantic Layer × Steep 2. セマンティックレイヤーの「制約」が品質とAI活用の土台になった スタースキーマの徹底 → モデリング品質向上 → Text-to-SQL精度が高かった 3. 定点観測はセマンティックレイヤーで堅実に、アドホックはAIで柔軟に 何を定点で見て、何をAIに問うか — 使い分けがデータ活用の質を決める ©️ Gaudiy Inc. 19