AIでデータ活用を加速させる取り組み / Leveraging AI to accelerate data utilization

Embed

Start on current slide

Slide 1

Slide 1 text

※本資料には弊社の秘密情報が含まれております。貴社限りとさせていただき、 SNS等へのアップロードを含め、貴社の関係者以外の方に開示されることのないようお願い申し上げます。 Conﬁdential AIでデータ活用を加速させる取り組み 2025/10/29 大規模データ×AI活用の現在地〜 Online Conference 2025 〜 Ubie株式会社 @okiyuki

Slide 2

Slide 2 text

2 自己紹介 Motoyuki Oki (@okiyuki99) Ubieでデータ利活用領域を担当 ● 大手通信会社やメガベンチャーを経て、2021/12よりUbieにjoin ● 事業部、分析基盤、プロダクト開発部それぞれでデータ利活用を進めて今は経営企画がメイン ● 注力領域 ○ データ分析 ○ アナリティクスエンジニアリング ○ 生成AIの探索と展開

Slide 3

Slide 3 text

3 Conﬁdential 今日のアジェンダ ● Ubieについて ● Ubieのデータ分析基盤 ● 事例1: AIによるdbt開発の民主化加速 ● 事例2: AIパートナーによるデータ業務の民主化加速 ● 事例3: AIが自走できるデータ分析に向けて ● AIでデータ活用を進めての振り返り　　　頂いた質問に回答しますので、ぜひたくさん投稿していただければ！

Slide 4

Slide 4 text

4 Conﬁdential Ubieについて 4

Slide 5

Slide 5 text

テクノロジーで人々を適切な医療に案内する「どうしてあの時病院に行かなかったのか」と重篤化して後悔する方、最悪の場合命を落とす方がいます。一方で多くの医療従事者は、早期に発見されていれば救えたはずの患者の死を、無念の思いで見届けています。さらに世界には、医療へのアクセスが困難な地域、医療資源が不足している国が数多く存在するのが現状です。私たちは医療先進国日本発の企業としてテクノロジーで世界中の医療に貢献します。 Mission 5

Slide 6

Slide 6 text

Slide 7

Slide 7 text

7 自分の症状を答えるだけで、参考病名や近くの医療機関等「受診の手がかり」が調べられます医療現場で実際に使われ鍛えられたAIを、生活者が適切な医療にかかる目安として開放しています (2020年提供開始) 無料で誰でもいつでもほぼ全ての症状で＊＊99% (1.3万超)の症状に対応情報アクセシビリティ好事例2023 選出総務省症状検索エンジン「ユビー」ダウンロードリンク https://ubie.go.link?adj_t=1c2ifxv9 生活者向け事業

Slide 8

Slide 8 text

8 生活者向け事業

Slide 9

Slide 9 text

9 病院向け事業（2024年5月から生成AIサービスを展開）

Slide 10

Slide 10 text

2020年のサービス提供開始以来、多くの方の適切な医療へのアクセスを支援しています 10 月間利用者数 1200万人提携医療機関数 1万5000以上累計利用回数 1億 8000 万回以上対応する症状 3500以上ユビーを利用した後実際に受診した人数（推計） 1838万人対応する病名 1100以上ユビーを利用したうち「受診してよかった」 91.1% アカウント登録数 500万人

Slide 11

Slide 11 text

11 Conﬁdential Ubieのデータ分析基盤 11

Slide 12

Slide 12 text

12 データ分析基盤の全体像 ● ほぼ全て Google Cloud で構成 ● DBからのETL / App からの Log Streaming に始まり、BIツール(Lightdash)までが分析基盤 ● 仮名加工化と4層に分かれた分析用領域のデータモデリングにdbtを利用しているデータエンジニアの@yosh_yumyum の資料に詳細が解説されています https://speakerdeck.com/yoshyu m/cd

Slide 13

Slide 13 text

13 Lightdash について全社員の約7割が利用するメインのBIツール。dbt modelsのコード上で分析軸やメトリックを定義し、GUIでインタラクティブにBI操作できる分析軸(dimension)と集計(metric)の定義例 LightdashでのExplore画面とDashboard画面

Slide 14

Slide 14 text

14 Conﬁdential 事例1: AIによるdbt開発の民主化加速 14

Slide 15

Slide 15 text

15 UbieのdbtレポジトリのPR数推移 ● 2021年から分析基盤にdbtを採用。BIツールLightdashの設定も同じレポジトリで管理 ● 2025年9月までの状況で月最大46名。1人あたり月平均15PR作成を記録。Ubie全体でも1,2位の規模 ● 2024年のdbt開発民主化施策だけでなく、2025年以降AIの力で生産力＆民主化が更に加速（後述) 2023年1月から2025年9月までの約3年のPR作成数の推移

Slide 16

Slide 16 text

16 UbieのdbtレポジトリのPR数推移 2023年1月から2025年9月までの約3年のPR作成数の推移ああ https://speakerdeck.com/okiyuki99/integrate-dbt-and-lightdash-into-ubie 今日はこちらを紹介！ ● PR作成者数 +10人増加 ● 1人あたり月平均 PR作成数も +20-30%増加

Slide 17

Slide 17 text

17 月間40人以上PR作成者のロール内訳ざっくり ● 特徴1: AE/DA/DE系のデータ系職種の平均PR作成数が多いのは当然ながら、POやSWE/SRE等のロールも上位に食い込む。AIの力で上位勢のPR作成数が上昇 ● 特徴2: さらに今までdbtに触ったことがなかったOps/デザイナー /QAエンジニアなどのロールにも広がった

Slide 18

Slide 18 text

18 取り組み1: 開発エージェント向けのルールの整備 for Cursor ● 2025年1-3月にCursor Editor用にdbtのデータマート開発手順を徹底的に整備し、開発時の共通ルールを可能な限りドキュメント化。結果、期待以上に自動化できることに社内は驚きと喜びの声 AIエージェントのおかげで dbt開発の大部分を自動化した話 : https://zenn.dev/ubie_dev/articles/d97c5ece4660bd

Slide 19

Slide 19 text

19 取り組み2: 複数AIエージェントが同じドキュメントを参照するようにSSoT化 ● Claude Codeを使うエンジニアも多く、dbtの開発レポジトリのドキュメント置き場をDiátaxis(ディアタクシス)フレームワークにそって再整理し、dbt開発ドキュメントの一元化。人間も見やすい : dbtの基本的用語や社内ルールの説明：特定の開発ステップに対応：詳細な仕様や横断的な知識：学習用のリソースで人が概観をつかむ用各開発エージェントのルールファイルには参照リンクだけ貼る(rule.mdc / CLAUDE.md / …. )

Slide 20

Slide 20 text

20 取り組み3: カスタムスラッシュコマンドを作成し、開発者の入力負担を最小限に ● カスタムスラッシュコマンド(例: /dbt_dev) によってあらかじめ登録した処理を実行でき、長いプロンプトを書く必要がなくなる ● dbtモデル開発時に必要なコンテキストとなるドキュメントを@で参照させたり引数を渡したりも可能

Slide 21

Slide 21 text

21 取り組み4: Slackをインタフェースとした開発や運用 ● 社内の独自開発エージェント(Uvin)にSlack上でメンションすると開発を開始してくれる ● Slackで話すだけなので、Opsメンバーも非常に真似しやすい ● 一定の手順が定まったオペレーショナルな作業でとても相性がよい ○ 例: あるプロジェクトで必要なカスタムデータの追加

Slide 22

Slide 22 text

22 Conﬁdential 事例2: AIパートナーによるデータ業務の民主化加速 22

Slide 23

Slide 23 text

23 生成AIの社内内製ツールの利用状況 ● 社内生成AI基盤 Dev Genius の週次利用者数は全社員の85% ● 複数LLMモデルをサポート / システムプロンプトの保存・共有 / Slackからの利用もサポート ● MCP等を使った社内データとの接続 / ワークフロー / エージェント機能なども搭載 UbieのAIパートナーを支えるコンテキストエンジニアリング実践：https://speakerdeck.com/syucream/ubienoaipatonawozhi-erukontekisutoenziniaringushi-jian

Slide 24

Slide 24 text

24 AIパートナー（AIP）とは？ UbieのAIパートナーを支えるコンテキストエンジニアリング実践：https://speakerdeck.com/syucream/ubienoaipatonawozhi-erukontekisutoenziniaringushi-jian

Slide 25

Slide 25 text

25 取り組み1：データ/アナリティクスエンジニアリングついて詳しいAIパートナー ● Ubie特有のデータモデリング・レイヤリング・開発規則などについて詳しい ● アナリティクスエンジニアリングの歴史・重要となるエンジニアリング思想もコンテキストに入れている … など AIパートナーとSlackで対話/協業していく体験により、疑問や悩みの壁打ちを自分のペースでできる人とAIパートナーとSlackでデータモデリングについて対話抽象的な質問に対しても、重要となる思想に基づき回答

Slide 26

Slide 26 text

26 AIパートナーのプロンプトの全体感（どんなプロンプト?）キャラクター知識スキル ● Ubieの業務知識・オンボーディング資料 ● Ubieのdbtモデル開発の手順・コーディングルール ● データ周りの業界知識・歴史(Deep Research) ● ペルソナ ● 個人ミッション ● 大事にしている哲学・思想 ● 行動指針 ● 口調・トーン (AIと壁打ちして作成) ● Ubieのダッシュボードの検索 ● データマート検索 ● 議事録検索 (Githubのコードベースや社内MCPサーバと連携。必要に応じて利用してくれる) プロンプトそれぞれはNotionで管理・接続されており、複数人でメンテ/再利用できるように

Slide 27

Slide 27 text

27 取り組み2：データスキル特化のAI（データディスカバリー） ● データマートに詳しいAI、ダッシュボードに詳しいAI、病気マスターに詳しいAI など特定のデータディスカバリータスクを高い精度で行えるスキルを持つAI 社内のデータマートに詳しいAI 社内のダッシュボードに詳しいAI

Slide 28

Slide 28 text

28 取り組み3：データスキル特化のAI（日々の活動データの活用） ● 日々のメンバーの活動から蓄積されたMeetingの議事録データに詳しいAI、社内の各メンバーが行った業務について詳しいAI… など日々の業務活動をデータ化することで作成できるAI 議事録データに詳しいAIに質問して議事録取得チケットシステムのタイトルや内容を集約してデータ化し、どういう活動をしたかの情報収集もできる

Slide 29

Slide 29 text

29 スキル/プロンプトの裏側を支えるデータ集約・メタデータ整備 ● 「動くものを作るだけ」ならインベストは小。一方、データ系の実務においては「高い精度」がほぼ必須 ○ 非構造化データを含むデータパイプラインの開発、AIが読みやすい形での集約大統一、参照できるようにするシステム設計、メタデータも一定の精度で入るように仕組み化.... など ● (宣伝) 議事録データを取り扱うAIパートナーの開発秘話はこれらを実施している良い事例 AI Readyなナレッジマネジメント〜議事録の利活用を例に: https://zenn.dev/ubie_dev/articles/8e8c107419601b

Slide 30

Slide 30 text

30 データ系AIパートナー利用状況 ● 月次で延べ40-50人程度。ユニーク人数で30人程度利用中と安定している

Slide 31

Slide 31 text

31 Conﬁdential 事例3: AIが自走できるデータ分析に向けて 31

Slide 32

Slide 32 text

32 道半ば... データ分析のAI適用が難しい点

Slide 33

Slide 33 text

33 道半ば... データ分析のAI適用が難しい点誤った結果や意味のない結果が出てもエラーを吐かずに出力。気づきにくい ● 例: メトリクスAの合計はXごとに見ないと意味のないなど正しさの制御

Slide 34

Slide 34 text

34 道半ば... データ分析のAI適用が難しい点誤った結果や意味のない結果が出てもエラーを吐かずに出力。気づきにくい ● 例: メトリクスAの合計はXごとに見ないと意味のないなど正しさの制御コンテキスト AIが賢くても、人のほうもデータやコンテキストに詳しく無いとSo what?になりやすい。一定人の学習も必要。

Slide 35

Slide 35 text

35 道半ば... データ分析のAI適用が難しい点誤った結果や意味のない結果が出てもエラーを吐かずに出力。気づきにくい ● 例: メトリクスAの合計はXごとに見ないと意味のないなど正しさの制御コンテキスト AIが賢くても、人のほうもデータやコンテキストに詳しく無いとSo what?になりやすい。一定人の学習も必要。誤った能力拡張それっぽい結果を容易に得られることから、武器に踊らされやすい。どんなにAIが便利でも、良い問題とセットでないと無駄になりやすい

Slide 36

Slide 36 text

36 取り組み1: データモデリングへの投資で正しさの制御 ● 究極的にはAIが(人間も)間違えようのないデータマートに絞ってそれを分析対象とする ○ 例1: リッチなメタデータ付き大福帳テーブルの準備 ○ 例2: ディメンショナルモデリング（1ファクトテーブル=1イベントのみを保存） ● セマンティックレイヤーで定義された指定済みのメトリクスやディメンションだけが使えるように ● ただし、普通にやるとインベスト大になるので、パイロットケースを定めてWINを得ながらの実行が大事ユビーでは分析のコアとなるようなデータ層で改めてモデリングルールを策定し、適用を開始

Slide 37

Slide 37 text

37 取り組み2: コンテキストを揃える・効率よく得る ● 共通用語がないとAIが混乱するというのは全体の共通理解になってきた（よね？） ● 打ち手は地道な啓蒙活動と、AIに学習させてAIに教えてもらうといった体験の浸透 ○ 人に聞くよりも、AIのほうが罪悪感なく聞きやすい ○ データが集まり、どういう改善をしたほうがよいかあとから振り返りやすい共通言語化の統一提案定義された用語の意味をAIパートナーで確認

Slide 38

Slide 38 text

38 第1優先多数取り組み3: 誤った能力拡張を避けるためにAIエージェントの利用者をフォーカス ● 利用者をセグメントに分けて、AIパートナーや分析AIエージェントを徐々に解放していく ● コンテキストの理解がAIの性能に大きく依存する。直接データを見れるエンジニアにはデータを渡す。 ● 以下は、全社の経営向け横断ダッシュボード策定プロジェクトの例：データはよくわからない・ブラックボックスデータに詳しい・自力で調査できるビジネス用語・コンテキストも詳しいビジネス用語・コンテキストは詳しくない自分同PrjのBiz・経営メンバ　エンジニア/ 他BIメンバ第2優先で拡張

Slide 39

Slide 39 text

39 Lightdash AI Agentsでシステマティックに行うために実践適用中 ● Lightdash内の分析エージェントの機能が強化され、実用段階に来ている ● dbtのレポジトリ内でメタデータを一元管理。AgentもIaCで構築しバージョン管理 AI Agentの設定画面弊社Yuさんの記事より： Supercharging BI with Lightdash AI: Agents https://yu-ishikawa.medium.com/lightdash-at-ubie-part-4-superc harging-bi-with-lightdash-ai-agents-06191f1381f2 利用できるdbt modelをtagで制御 dimensionやmetricsも選択可能利用できるユーザ・グループを制御プロンプトも自由に特定のSlackチャネルからも利用

Slide 40

Slide 40 text

40 Conﬁdential AIでデータ活用を進めての振り返り（＊個人的な見解） 40

Slide 41

Slide 41 text

41 データエンジニア/アナリティクスエンジニアって代替される？

Slide 42

Slide 42 text

42 データエンジニア/アナリティクスエンジニアって代替される？ Noで、現時点で仕事はAIに代替されるのではなく、AIを使いこなす重力が高まり続けている

Slide 43

Slide 43 text

43 データエンジニア/アナリティクスエンジニアって代替される？ Noで、現時点で仕事はAIに代替されるのではなく、AIを使いこなす重力が高まり続けているオーナーシップ AIによってデータ活用が更にたくさんの人に広がり続ける/期待が膨らむ。オーナーシップを持つ人とともに投資することで、1-2年後の生産性が大きく変わる

Slide 44

Slide 44 text

44 データエンジニア/アナリティクスエンジニアって代替される？ Noで、現時点で仕事はAIに代替されるのではなく、AIを使いこなす重力が高まり続けているオーナーシップ AIによってデータ活用が更にたくさんの人に広がり続ける/期待が膨らむ。オーナーシップを持つ人とともに投資することで、1-2年後の生産性が大きく変わる事実を保証する事実に対する価値が高まっている。事実に対して責任を持てるのは人。LLMには正しさの完全制御ではなく、ガードレールを飛び越えない品質の制御が必要に

Slide 45

Slide 45 text

45 データエンジニア/アナリティクスエンジニアって代替される？ Noで、現時点で仕事はAIに代替されるのではなく、AIを使いこなす重力が高まり続けているオーナーシップ AIによってデータ活用が更にたくさんの人に広がり続ける/期待が膨らむ。オーナーシップを持つ人とともに投資することで、1-2年後の生産性が大きく変わる事実を保証する事実に対する価値が高まっている。事実に対して責任を持てるのは人。LLMには正しさの完全制御ではなく、ガードレールを飛び越えない品質の制御が必要にイネイブリング AIの性能を最大限引き出すために、自分たち(人)の使いこなす力の向上が必要。ボトムアップ（個人の習熟度)とトップダウン（組織としてのBet）で支援する

Slide 46

Slide 46 text

46 AI-readyな基盤への実践的なステップ各企業によって分析基盤の状況は違うと思うが、最終的にはモデリングへの投資が一番の近道かもしれない？　フェーズ0 ● だれでも使えるAI Agentツールや基盤の容易（外部 or 内製) ○ リーガルやセキュリティとデータ業務でのスコープ整理　フェーズ1 ● 一定満足した水準で動くためのAI用のルール整備 ● 社内の成功事例やファンを作る　フェーズ2 　フェーズ3 ● 信頼のあるデータマートを作ってAIを躍動 ● メタデータ・コンテキスト拡充を組織の営みに ● 計画的なデータモデリングの導入 ● AIを評価して、質の低いメタデータを排除/更新インベストは大きくなるが、AI readyには継続的に投資が必要

Slide 47

Slide 47 text

47 AI-readyな基盤への実践的なステップ各企業によって分析基盤の状況は違うと思うが、最終的にはモデリングへの投資が一番の近道かもしれない？　フェーズ0 ● だれでも使えるAI Agentツールや基盤の容易（外部 or 内製) ○ リーガルやセキュリティとデータ業務でのスコープ整理　フェーズ1 ● 一定満足した水準で動くためのAI用のルール整備 ● 社内の成功事例やファンを作る　フェーズ2 　フェーズ3 ● 信頼のあるデータマートを作ってAIを躍動 ● メタデータ・コンテキスト拡充を組織の営みに ● 計画的なデータモデリングの導入 ● AIを評価して、質の低いメタデータを排除/更新インベストは大きくなるが、AI readyには継続的に投資が必要社内生成AI基盤 Dev Genius / Cursor Editor等のAIツール導入により試行回数の最大化

Slide 48

Slide 48 text

48 インベストは大きくなるが、AI readyには継続的に投資が必要 AI-readyな基盤への実践的なステップ各企業によって分析基盤の状況は違うと思うが、最終的にはモデリングへの投資が一番の近道かもしれない？　フェーズ0 ● だれでも使えるAI Agentツールや基盤の容易（外部 or 内製) ○ リーガルやセキュリティとデータ業務でのスコープ整理　フェーズ1 ● 一定満足した水準で動くためのAI用のルール整備 ● 社内の成功事例やファンを作る　フェーズ2 　フェーズ3 ● 信頼のあるデータマートを作ってAIを躍動 ● メタデータ・コンテキスト拡充を組織の営みに ● 計画的なデータモデリングの導入 ● AIを評価して、質の低いメタデータを排除/更新 Cursor Editor等のルール整備を集中的に進めてWin データ系スキルに特化したAIを複数リリースし、Slack上で浸透最大化

Slide 49

Slide 49 text

49 インベストは大きくなるが、AI readyには継続的に投資が必要 AI-readyな基盤への実践的なステップ各企業によって分析基盤の状況は違うと思うが、最終的にはモデリングへの投資が一番の近道かもしれない？　フェーズ0 ● だれでも使えるAI Agentツールや基盤の容易（外部 or 内製) ○ リーガルやセキュリティとデータ業務でのスコープ整理　フェーズ1 ● 一定満足した水準で動くためのAI用のルール整備 ● 社内の成功事例やファンを作る　フェーズ2 　フェーズ3 ● 信頼のあるデータマートを作ってAIを躍動 ● メタデータ・コンテキスト拡充を組織の営みに ● 計画的なデータモデリングの導入 ● AIを評価して、質の低いメタデータを排除/更新 Ubieでは数個のWINが出てきた段階で、まだ道半ば..... ここを専属で引っ張る人材の確保が急務

Slide 50

Slide 50 text

50 宣伝：UbieではフルサイクルBIエンジニア/データエンジニアを積極採用中！ ● 私たちが求める「フルサイクルBIエンジニア」は、上記のようなデータ利活用のプロセス全体を、一気通貫でリードしオーナーシップを発揮する役割です。特定の工程に特化するのではなく、あくまで事業価値の最大化というゴールから逆算し、ビジネス要件の整理、データプライバシーの考慮、データモデリングによるスケーラビリティの担保、利用者へのデータの価値提供まで、全てのプロセスにオーナーシップを持つ。それが、Ubieの「フルサイクルBIエンジニア」です。 ● これはガードレールのない未整備な領域において、ビジネスと技術を深く理解した上で最適なガードレールを敷き、全社員のデータ利活用を促進する、高度な0→1の挑戦です。AIに仕事を奪われるのではなく、AIにはできない役割を担い、複数のAIを使いこなす。まさに、これからの時代に求められるデータ職種の姿そのものだと考えています。 Ubieが採用を開始したフルサイクルBIエンジニアとは？： https://note.com/okiyuki/n/ndbd959fa1bd4 カジュアル面談希望者はDMまたはPittaにください

Slide 51

Slide 51 text

51 おわりに今日の内容 ● 事例1: AIによるdbt開発の民主化加速 ● 事例2: AIパートナーによるデータ業務の民主化加速 ● 事例3: AIが自走できるデータ分析に向けて ● AIでデータ活用を進めての振り返り今後もAI活用についての事例を紹介できればと思うのでフォローもよろしくおねがいします！ https://x.com/okiyuki99

Slide 52

Slide 52 text

※本資料には弊社の秘密情報が含まれております。貴社限りとさせていただき、 SNS等へのアップロードを含め、貴社の関係者以外の方に開示されることのないようお願い申し上げます。 Conﬁdential ありがとうございました！