Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
AIでデータ活用を加速させる取り組み / Leveraging AI to accelerat...
Search
okiyuki
October 29, 2025
Technology
6
1.9k
AIでデータ活用を加速させる取り組み / Leveraging AI to accelerate data utilization
2025/10/29 大規模データ×AI活用の現在地 〜 Online Conference 2025 〜
okiyuki
October 29, 2025
Tweet
Share
More Decks by okiyuki
See All by okiyuki
dbtとLightdash を社内へ浸透させるまでの取り組み / Integrate dbt and Lightdash into Ubie
okiyuki99
6
1.2k
Ubieのデータ品質の検査・維持・向上への取り組み
okiyuki99
3
2.5k
191016_KDD2019_Reading
okiyuki99
3
2.1k
190928_TokyoR81_Shiny
okiyuki99
3
2.2k
Other Decks in Technology
See All in Technology
AI エージェントを評価するための温故知新と Spec Driven Evaluation
icoxfog417
PRO
2
520
Moto: Latent Motion Token as the Bridging Language for Learning Robot Manipulation from Videos
peisuke
0
160
AIと自動化がもたらす業務効率化の実例: 反社チェック等の調査・業務プロセス自動化
enpipi
0
750
はじめての OSS コントリビューション 〜小さな PR が世界を変える〜
chiroito
4
350
なぜThrottleではなくDebounceだったのか? 700並列リクエストと戦うサーバーサイド実装のすべて
yoshiori
13
4.9k
Kubernetesと共にふりかえる! エンタープライズシステムのインフラ設計・テストの進め方大全
daitak
0
410
巨大モノリスのリプレイス──機能整理とハイブリッドアーキテクチャで挑んだ再構築戦略
zozotech
PRO
0
210
組織の“見えない壁”を越えよ!エンタープライズシフトに必須な3つのPMの「在り方」変革 #pmconf2025
masakazu178
1
580
メッセージ駆動が可能にする結合の最適化
j5ik2o
6
760
ステートレスなLLMでステートフルなAI agentを作る - YAPC::Fukuoka 2025
gfx
8
1.4k
Dev Containers と Skaffold で実現する クラウドネイティブ開発環境 ローカルのみという制約に挑む / Cloud-Native Development with Dev Containers and Skaffold: Tackling the Local-Only Constraint
bitkey
PRO
0
120
Bedrock のコスト監視設計
fohte
2
210
Featured
See All Featured
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
31
2.9k
The Illustrated Children's Guide to Kubernetes
chrisshort
51
51k
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
162
15k
Bash Introduction
62gerente
615
210k
Stop Working from a Prison Cell
hatefulcrawdad
272
21k
The Language of Interfaces
destraynor
162
25k
Designing for humans not robots
tammielis
254
26k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
231
22k
Embracing the Ebb and Flow
colly
88
4.9k
Building an army of robots
kneath
306
46k
Code Reviewing Like a Champion
maltzj
527
40k
Being A Developer After 40
akosma
91
590k
Transcript
※本資料には弊社の秘密情報が含まれております。貴社限りとさせていただき、 SNS等への アップロードを含め、貴社の関係者以外の方に開示されることのないようお願い申し上げます。 Confidential AIでデータ活用を加速させる取り組み 2025/10/29 大規模データ×AI活用の現在地 〜 Online Conference
2025 〜 Ubie株式会社 @okiyuki
2 自己紹介 Motoyuki Oki (@okiyuki99) Ubieでデータ利活用領域を担当 • 大手通信会社やメガベンチャーを経て、2021/12よ りUbieにjoin •
事業部、分析基盤、プロダクト開発部それぞれでデー タ利活用を進めて今は経営企画がメイン • 注力領域 ◦ データ分析 ◦ アナリティクスエンジニアリング ◦ 生成AIの探索と展開
3 Confidential 今日のアジェンダ • Ubieについて • Ubieのデータ分析基盤 • 事例1: AIによるdbt開発の民主化加速
• 事例2: AIパートナーによるデータ業務の民主化加速 • 事例3: AIが自走できるデータ分析に向けて • AIでデータ活用を進めての振り返り 頂いた質問に回答しますので、ぜひたくさん投稿していただければ!
4 Confidential Ubieについて 4
テクノロジーで人々を適切な医療に案内する 「どうしてあの時病院に行かなかったのか」と重篤化して後悔する方、最悪の場合命を落 とす方がいます。一方で多くの医療従事者は、早期に発見されていれば救えたはずの患 者の死を、無念の思いで見届けています。さらに世界には、医療へのアクセスが困難な地 域、医療資源が不足している国が数多く存在するのが現状です。私たちは医療先進国日 本発の企業としてテクノロジーで世界中の医療に貢献します。 Mission 5
6
7 自分の症状を答えるだけで、 参考病名や近くの医療機関等 「受診の手がかり」が調べられます 医療現場で実際に使われ鍛えられたAIを、 生活者が適切な医療にかかる目安として開放しています (2020年提供開始) 無料で 誰でも いつでも
ほぼ全ての症状で * *99% (1.3万超)の症状に対 応 情報 アクセシビリティ 好事例2023 選出 総務省 症状検索エンジン「ユビー」ダウンロードリンク https://ubie.go.link?adj_t=1c2ifxv9 生活者向け事業
8 生活者向け事業
9 病院向け事業(2024年5月から生成AIサービスを展開)
2020年のサービス提供開始以来、多くの方の適切な医療へのアクセスを支援しています 10 月間利用者数 1200万人 提携医療機関数 1万5000以上 累計利用回数 1億 8000 万回以上
対応する症状 3500以上 ユビーを利用した後 実際に受診した人数(推計) 1838万人 対応する病名 1100以上 ユビーを利用したうち 「受診してよかった」 91.1% アカウント登録数 500万人
11 Confidential Ubieのデータ分析基盤 11
12 データ分析基盤の全体像 • ほぼ全て Google Cloud で構成 • DBからのETL /
App からの Log Streaming に始まり、BIツール(Lightdash)までが分析基盤 • 仮名加工化と4層に分かれた分析用領域のデータモデリングにdbtを利用している データエンジニアの@yosh_yumyum の資料に詳細が解説されています https://speakerdeck.com/yoshyu m/cd
13 Lightdash について 全社員の約7割が利用するメインのBIツール。dbt modelsのコード上で分析軸やメトリックを定義し、GUIでイ ンタラクティブにBI操作できる 分析軸(dimension)と集計(metric)の定義 例 LightdashでのExplore画面とDashboard画面
14 Confidential 事例1: AIによるdbt開発の 民主化加速 14
15 UbieのdbtレポジトリのPR数推移 • 2021年から分析基盤にdbtを採用。BIツールLightdashの設定も同じレポジトリで管理 • 2025年9月までの状況で月最大46名。1人あたり月平均15PR作成を記録。Ubie全体でも1,2位の規模 • 2024年のdbt開発民主化施策だけでなく、2025年以降AIの力で生産力&民主化が更に加速(後述) 2023年1月から2025年9月までの約3年のPR作成数の推移
16 UbieのdbtレポジトリのPR数推移 2023年1月から2025年9月までの約3年のPR作成数の推移 ああ https://speakerdeck.com/okiyuki99/integrate-dbt-and-lightdash-into-ubie 今日はこちらを紹介! • PR作成者数 +10人増加 •
1人あたり月平均 PR作成数も +20-30%増加
17 月間40人以上PR作成者のロール内訳ざっくり • 特徴1: AE/DA/DE系のデータ系職種の平均PR作成数が多いのは当 然ながら、POやSWE/SRE等のロールも上位に食い込む。AIの力で 上位勢のPR作成数が上昇 • 特徴2: さらに今までdbtに触ったことがなかったOps/デザイナー
/QAエンジニアなどのロールにも広がった
18 取り組み1: 開発エージェント向けのルールの整備 for Cursor • 2025年1-3月にCursor Editor用にdbtのデータマート開発手順を徹底的に整備し、開発時の共通 ルールを可能な限りドキュメント化。結果、期待以上に自動化できることに社内は驚きと喜びの声 AIエージェントのおかげで
dbt開発の大部分を自動化した話 : https://zenn.dev/ubie_dev/articles/d97c5ece4660bd
19 取り組み2: 複数AIエージェントが同じドキュメントを参照するようにSSoT化 • Claude Codeを使うエンジニアも多く、dbtの開発レポジトリのドキュメント置き場をDiátaxis(ディ アタクシス)フレームワークにそって再整理し、dbt開発ドキュメントの一元化。人間も見やすい : dbtの基本的用語や社内ルールの説明 :特定の開発ステップに対応
:詳細な仕様や横断的な知識 :学習用のリソースで人が概観をつかむ用 各開発エージェントのルールファイルには 参照リンクだけ貼る(rule.mdc / CLAUDE.md / …. )
20 取り組み3: カスタムスラッシュコマンドを作成し、開発者の入力負担を最小限に • カスタムスラッシュコマンド(例: /dbt_dev) によってあらかじめ登録した処理を実行でき、長いプロンプ トを書く必要がなくなる • dbtモデル開発時に必要なコンテキストとなるドキュメントを@で参照させたり引数を渡したりも可能
21 取り組み4: Slackをインタフェースとした開発や運用 • 社内の独自開発エージェント(Uvin)にSlack上でメンションすると開 発を開始してくれる • Slackで話すだけなので、Opsメンバーも非常に真似しやすい • 一定の手順が定まったオペレーショナルな作業でとても相性がよい
◦ 例: あるプロジェクトで必要なカスタムデータの追加
22 Confidential 事例2: AIパートナーによる データ業務の民主化加速 22
23 生成AIの社内内製ツールの利用状況 • 社内生成AI基盤 Dev Genius の週次利用者数は全社員の85% • 複数LLMモデルをサポート /
システムプロンプトの保存・共有 / Slackからの利用もサポート • MCP等を使った社内データとの接続 / ワークフロー / エージェント機能なども搭載 UbieのAIパートナーを支えるコンテキストエンジニアリング実践 :https://speakerdeck.com/syucream/ubienoaipatonawozhi-erukontekisutoenziniaringushi-jian
24 AIパートナー(AIP)とは? UbieのAIパートナーを支えるコンテキストエンジニアリング実践 :https://speakerdeck.com/syucream/ubienoaipatonawozhi-erukontekisutoenziniaringushi-jian
25 取り組み1: データ/アナリティクスエンジニアリングついて詳しいAIパートナー • Ubie特有のデータモデリング・レイヤリング・開発規則などについて詳しい • アナリティクスエンジニアリングの歴史・重要となるエンジニアリング思想 もコンテキストに入れている … など
AIパートナーとSlackで対話/協業していく体験により、疑問や悩みの壁打ちを自分のペースでできる 人とAIパートナーとSlackでデータモデリングについて対話 抽象的な質問に対しても、重要となる思想に基づき回答
26 AIパートナーのプロンプトの全体感(どんなプロンプト?) キャラクター 知識 スキル • Ubieの業務知識・ オンボーディング 資料 •
Ubieのdbtモデ ル開発の手順・コー ディングルール • データ周りの業界 知識・歴史(Deep Research) • ペルソナ • 個人ミッション • 大事にしている哲 学・思想 • 行動指針 • 口調・トーン (AIと壁打ちして作成) • Ubieのダッシュ ボードの検索 • データマート検索 • 議事録検索 (Githubのコードベー スや社内MCPサーバと 連携。必要に応じて利用 してくれる) プロンプトそれぞれはNotionで管理・接続されており、複数人でメンテ/再利用できるように
27 取り組み2: データスキル特化のAI(データディスカバリー) • データマートに詳しいAI、ダッシュボードに詳しいAI、病気マスターに詳しいAI など特定のデータディスカ バリータスクを高い精度で行えるスキルを持つAI 社内のデータマートに詳しいAI 社内のダッシュボードに詳しいAI
28 取り組み3: データスキル特化のAI(日々の活動データの活用) • 日々のメンバーの活動から蓄積されたMeetingの議事録データに詳しいAI、社内の各メンバーが行った業 務について詳しいAI… など日々の業務活動をデータ化することで作成できるAI 議事録データに詳しいAIに質問して議事録取得 チケットシステムのタイトルや内容を集約してデータ化し、 どういう活動をしたかの情報収集もできる
29 スキル/プロンプトの裏側を支えるデータ集約・メタデータ整備 • 「動くものを作るだけ」ならインベストは小。一方、データ系の実務においては「高い精度」がほぼ必須 ◦ 非構造化データを含むデータパイプラインの開発、AIが読みやすい形での集約大統一、参照できるよ うにするシステム設計、メタデータも一定の精度で入るように仕組み化.... など • (宣伝)
議事録データを取り扱うAIパートナーの開発秘話はこれらを実施している良い事例 AI Readyなナレッジマネジメント〜議事録の利活用を例に: https://zenn.dev/ubie_dev/articles/8e8c107419601b
30 データ系AIパートナー利用状況 • 月次で延べ40-50人程度。ユニーク人数で30人程度利用中と安定している
31 Confidential 事例3: AIが自走できるデー タ分析に向けて 31
32 道半ば... データ分析のAI適用が難しい点
33 道半ば... データ分析のAI適用が難しい点 誤った結果や意味のない結果が出てもエラーを吐かずに出力。気づきにくい • 例: メトリクスAの合計はXごとに見ないと意味のないなど 正しさの制御
34 道半ば... データ分析のAI適用が難しい点 誤った結果や意味のない結果が出てもエラーを吐かずに出力。気づきにくい • 例: メトリクスAの合計はXごとに見ないと意味のないなど 正しさの制御 コンテキスト AIが賢くても、人のほうもデータやコンテキストに詳しく無いとSo
what?に なりやすい。一定人の学習も必要。
35 道半ば... データ分析のAI適用が難しい点 誤った結果や意味のない結果が出てもエラーを吐かずに出力。気づきにくい • 例: メトリクスAの合計はXごとに見ないと意味のないなど 正しさの制御 コンテキスト AIが賢くても、人のほうもデータやコンテキストに詳しく無いとSo
what?に なりやすい。一定人の学習も必要。 誤った能力拡張 それっぽい結果を容易に得られることから、武器に踊らされやすい。 どんなにAIが便利でも、良い問題とセットでないと無駄になりやすい
36 取り組み1: データモデリングへの投資で正しさの制御 • 究極的にはAIが(人間も)間違えようのないデータマートに絞ってそれを分析対象とする ◦ 例1: リッチなメタデータ付き大福帳テーブルの準備 ◦ 例2:
ディメンショナルモデリング(1ファクトテーブル=1イベントのみを保存) • セマンティックレイヤーで定義された指定済みのメトリクスやディメンションだけが使えるように • ただし、普通にやるとインベスト大になるので、パイロットケースを定めてWINを得ながらの実行が大事 ユビーでは分析のコアとなるようなデータ層で改めてモデリングルールを策定し、適用を開始
37 取り組み2: コンテキストを揃える・効率よく得る • 共通用語がないとAIが混乱するというのは全体の共通理解になってきた(よね?) • 打ち手は地道な啓蒙活動と、AIに学習させてAIに教えてもらうといった体験の浸透 ◦ 人に聞くよりも、AIのほうが罪悪感なく聞きやすい ◦
データが集まり、どういう改善をしたほうがよいかあとから振り返りやすい 共通言語化の統一提案 定義された用語の意味をAIパートナーで確認
38 第1優先 多数 取り組み3: 誤った能力拡張を避けるためにAIエージェントの利用者をフォーカス • 利用者をセグメントに分けて、AIパートナーや分析AIエージェントを徐々に解放していく • コンテキストの理解がAIの性能に大きく依存する。直接データを見れるエンジニアにはデータを渡す。 •
以下は、全社の経営向け横断ダッシュボード策定プロジェクトの例: データはよくわからない・ブラックボックス データに詳しい・自力で調査できる ビジネス用語・ コンテキストも 詳しい ビジネス用語・ コンテキストは 詳しくない 自分 同PrjのBiz・経営メンバ エンジニア/ 他BIメンバ 第2優先で拡張
39 Lightdash AI Agentsでシステマティックに行うために実践適用中 • Lightdash内の分析エージェントの機能が強化され、実用段階に来ている • dbtのレポジトリ内でメタデータを一元管理。AgentもIaCで構築しバージョン管理 AI Agentの設定画面
弊社Yuさんの記事より: Supercharging BI with Lightdash AI: Agents https://yu-ishikawa.medium.com/lightdash-at-ubie-part-4-superc harging-bi-with-lightdash-ai-agents-06191f1381f2 利用できるdbt modelをtagで制御 dimensionやmetricsも選択可能 利用できるユーザ・グループを制御 プロンプトも自由に 特定のSlackチャネルからも利用
40 Confidential AIでデータ活用を 進めての振り返り (*個人的な見解) 40
41 データエンジニア/アナリティクスエンジニアって代替される?
42 データエンジニア/アナリティクスエンジニアって代替される? Noで、現時点で仕事はAIに代替されるのではなく、AIを使いこなす重力が高まり続けている
43 データエンジニア/アナリティクスエンジニアって代替される? Noで、現時点で仕事はAIに代替されるのではなく、AIを使いこなす重力が高まり続けている オーナーシップ AIによってデータ活用が更にたくさんの人に広がり続ける/期待が膨らむ。オー ナーシップを持つ人とともに投資することで、1-2年後の生産性が大きく変わる
44 データエンジニア/アナリティクスエンジニアって代替される? Noで、現時点で仕事はAIに代替されるのではなく、AIを使いこなす重力が高まり続けている オーナーシップ AIによってデータ活用が更にたくさんの人に広がり続ける/期待が膨らむ。オー ナーシップを持つ人とともに投資することで、1-2年後の生産性が大きく変わる 事実を保証する 事実に対する価値が高まっている。事実に対して責任を持てるのは人。LLMには 正しさの完全制御ではなく、ガードレールを飛び越えない品質の制御が必要に
45 データエンジニア/アナリティクスエンジニアって代替される? Noで、現時点で仕事はAIに代替されるのではなく、AIを使いこなす重力が高まり続けている オーナーシップ AIによってデータ活用が更にたくさんの人に広がり続ける/期待が膨らむ。オー ナーシップを持つ人とともに投資することで、1-2年後の生産性が大きく変わる 事実を保証する 事実に対する価値が高まっている。事実に対して責任を持てるのは人。LLMには 正しさの完全制御ではなく、ガードレールを飛び越えない品質の制御が必要に イネイブリング
AIの性能を最大限引き出すために、自分たち(人)の使いこなす力の向上が必要。 ボトムアップ(個人の習熟度)とトップダウン(組織としてのBet)で支援する
46 AI-readyな基盤への実践的なステップ 各企業によって分析基盤の状況は違うと思うが、最終的にはモデリングへの投資が一番の近道かもしれない? フェーズ0 • だれでも使えるAI Agentツールや基盤の容易(外部 or 内製) ◦
リーガルやセキュリティとデータ業務でのスコープ整理 フェーズ1 • 一定満足した水準で動くためのAI用のルール整備 • 社内の成功事例やファンを作る フェーズ2 フェーズ3 • 信頼のあるデータマートを作ってAIを躍動 • メタデータ・コンテキスト拡充を組織の営みに • 計画的なデータモデリングの導入 • AIを評価して、質の低いメタデータを排除/更新 インベスト は大きくなる が、AI readyには 継続的に投資 が必要
47 AI-readyな基盤への実践的なステップ 各企業によって分析基盤の状況は違うと思うが、最終的にはモデリングへの投資が一番の近道かもしれない? フェーズ0 • だれでも使えるAI Agentツールや基盤の容易(外部 or 内製) ◦
リーガルやセキュリティとデータ業務でのスコープ整理 フェーズ1 • 一定満足した水準で動くためのAI用のルール整備 • 社内の成功事例やファンを作る フェーズ2 フェーズ3 • 信頼のあるデータマートを作ってAIを躍動 • メタデータ・コンテキスト拡充を組織の営みに • 計画的なデータモデリングの導入 • AIを評価して、質の低いメタデータを排除/更新 インベスト は大きくなる が、AI readyには 継続的に投資 が必要 社内生成AI基盤 Dev Genius / Cursor Editor等のAIツール導入 により試行回数の最大化
48 インベスト は大きくなる が、AI readyには 継続的に投資 が必要 AI-readyな基盤への実践的なステップ 各企業によって分析基盤の状況は違うと思うが、最終的にはモデリングへの投資が一番の近道かもしれない? フェーズ0
• だれでも使えるAI Agentツールや基盤の容易(外部 or 内製) ◦ リーガルやセキュリティとデータ業務でのスコープ整理 フェーズ1 • 一定満足した水準で動くためのAI用のルール整備 • 社内の成功事例やファンを作る フェーズ2 フェーズ3 • 信頼のあるデータマートを作ってAIを躍動 • メタデータ・コンテキスト拡充を組織の営みに • 計画的なデータモデリングの導入 • AIを評価して、質の低いメタデータを排除/更新 Cursor Editor等のルール整備を集中的に進めてWin データ系スキルに特化したAIを複数リリースし、Slack上で浸透最大化
49 インベスト は大きくなる が、AI readyには 継続的に投資 が必要 AI-readyな基盤への実践的なステップ 各企業によって分析基盤の状況は違うと思うが、最終的にはモデリングへの投資が一番の近道かもしれない? フェーズ0
• だれでも使えるAI Agentツールや基盤の容易(外部 or 内製) ◦ リーガルやセキュリティとデータ業務でのスコープ整理 フェーズ1 • 一定満足した水準で動くためのAI用のルール整備 • 社内の成功事例やファンを作る フェーズ2 フェーズ3 • 信頼のあるデータマートを作ってAIを躍動 • メタデータ・コンテキスト拡充を組織の営みに • 計画的なデータモデリングの導入 • AIを評価して、質の低いメタデータを排除/更新 Ubieでは数個のWINが出てきた段階で、まだ道半ば..... ここを専属で引っ張る人材の確保が急務
50 宣伝:UbieではフルサイクルBIエンジニア/データエンジニアを積極採用中! • 私たちが求める「フルサイクルBIエンジニア」は、上記のようなデータ利活用のプロセス全体を、一気通貫でリー ドしオーナーシップを発揮する役割です。特定の工程に特化するのではなく、あくまで事業価値の最大化という ゴールから逆算し、ビジネス要件の整理、データプライバシーの考慮、データモデリングによるスケーラビリティ の担保、利用者へのデータの価値提供まで、全てのプロセスにオーナーシップを持つ。それが、Ubieの「フルサ イクルBIエンジニア」です。 • これはガードレールのない未整備な領域において、ビジネスと技術を深く理解した上で最適なガードレールを
敷き、全社員のデータ利活用を促進する、高度な0→1の挑戦です。AIに仕事を奪われるのではなく、AIには できない役割を担い、複数のAIを使いこなす。まさに、これからの時代に求められるデータ職種の姿そのもの だと考えています。 Ubieが採用を開始したフルサイクルBIエンジニアとは?: https://note.com/okiyuki/n/ndbd959fa1bd4 カジュアル面談希望者はDMまたはPittaにください
51 おわりに 今日の内容 • 事例1: AIによるdbt開発の民主化加速 • 事例2: AIパートナーによるデータ業務の民主化加速 •
事例3: AIが自走できるデータ分析に向けて • AIでデータ活用を進めての振り返り 今後もAI活用についての事例を紹介できればと思うのでフォローもよろしくおねがいします! https://x.com/okiyuki99
※本資料には弊社の秘密情報が含まれております。貴社限りとさせていただき、 SNS等への アップロードを含め、貴社の関係者以外の方に開示されることのないようお願い申し上げます。 Confidential ありがとうございました!