Upgrade to Pro — share decks privately, control downloads, hide ads and more …

初めてのDatabricks勉強会

Sponsored · Ship Features Fearlessly Turn features on and off without deploys. Used by thousands of Ruby developers.

 初めてのDatabricks勉強会

・Databricks とは?
・なぜ生まれたのか ― 市場と課題
・コア構成と特徴(AIレディまで)
・エージェントの開発・運用
・開発者からビジネスユーザーへ(Genie One)
・デモで体感する

Avatar for Takaaki Yayoi

Takaaki Yayoi

July 02, 2026

More Decks by Takaaki Yayoi

Other Decks in Technology

Transcript

  1. はじめに 自己紹介 ©2026 Databricks Inc. — All rights reserved 弥生

    隆明 (やよい たかあき) シニア スペシャリスト ソリューションアーキテクト ▪ IHI・日立製作所・アクセンチュアで約20年、自然言語処理/機械学習に従事 ▪ 2020年 Databricks Japan 入社。専門は 生成AI / Databricks Apps / データ エンジニアリング ▪ 企業の生成AI活用と本番運用(LLMOps)を技術面から支援 ▪ Qiita で 2,300本超の技術記事を発信 ・ ユーザーコミュニティ「JEDAI」主宰 ▪ 共著『MLflowで実践するLLMOps』(技術評論社, 2026/4) ・ 青山学院大学 特別研究員
  2. Databricks とは? データと AI を“ひとつ”に束ねる基盤 あらゆるデータを 1か所に ・構造化〜非構造化まで ・BI も

    AI も同じ基盤 (レイクハウス) ・サイロを解消 統合ガバナンス ・Unity Catalog で一元管理 ・権限・監査・リネージが ひとつ ・誰が・どのデータに触れたか追 える データの隣で AI ・分析・機械学習・生成AI ・エージェントまで同じ場所で ・連携の作り込み不要 = データインテリジェンスプラットフォーム。データも AI も“ひとつ”で完結。 ©2026 Databricks Inc. — All rights reserved
  3. Databricks とは? データ + AI カンパニー 20,000+ グローバルのお客様 $4B+ 年間収益

    OSS開発者 Apache Spark、MLflow レイクハウスの発明者、生成 AI のパイオニア Gartner® Magic Quadrant リーダー(データサイエンス&機械学習プラットフォーム 2026) データと AI で、世界の 20,000 社以上に選ばれる基盤。 ©2026 Databricks Inc. — All rights reserved
  4. 課題 ① しかし、データ資産は散在しています ©2026 Databricks Inc. — All rights reserved

    データレイク 高コストとロックインに よる複雑性の悪夢です ガバナンス 機械学習 BI データ サイエンス 生成 AI オーケストレーション とETL データウェアハ ウス ストリーミング
  5. 課題 ② バラバラな資産 ― データ資産全体のガバナンスは困難です バラバラな資産 モデル レポート テーブル 生データ

    ガバナンスが困難 AI の規制 データプライバシー サイバー攻撃 資産が分断されるほど、全体のガバナンスは難しくなる。 ©2026 Databricks Inc. — All rights reserved
  6. 課題 ③ 業務の現場では“継ぎ接ぎ”が積み上がる 例:1つの資料を作るのに、複数のシステムを開いて・集めて・転記… 社内の分析環境 別システムの記録 各種フォーマット 表計算シート → 人が・開いて

    集めて・転記 → 仕組みも複数を 自分で繋いで 運用し続けている 誰が・どのデータに触れたかも追いづらい。こうして“継ぎ接ぎ”が積み上がる。 ©2026 Databricks Inc. — All rights reserved
  7. コア構成要素 Databricks データ・インテリジェンス・プラットフォーム データウェアハウス データの置き場所 AI 生成AIの活用 AI/BI ダッシュボード アプリ

    エージェントアプリ ↑ Lakeflow:取り込み・ETL・ストリーミング ↑ レイクハウス(ストレージ=“ひとつ”) Unity Catalog 統合 ガバナンス 保存〜変換〜分析〜AI〜アプリまで、同じ基盤で地続きに。 ©2026 Databricks Inc. — All rights reserved
  8. なぜ Databricks? Databricks はすべてを「ひとつ」に束ねる。 従来のやり方(継ぎ接ぎ) • 保存・分析・AI・アプリをサービスごとに用意して自分で 繋ぐ • 権限・監査はサービスごとにバラバラ

    • 増えるほど繋ぎ込みと運用が積み上がる Databricks(ひとつに束ねる) • 保存〜AI〜アプリまで同じ基盤で地続き • 権限・監査・来歴がひとつ=追える • 既存の資産はそのまま活かす (混在OK・置き換え不要) だから「増やしても破綻せず、安全に回せる」。 ©2026 Databricks Inc. — All rights reserved
  9. なぜ Databricks? Databricksで動作するネイティブアプリ:Databricks Apps Databricksのデータ、ガバナンスをそのまま活用したアプリを容易に構築 ©2026 Databricks Inc. — All

    rights reserved テンプレートを活用、あるいはAIアシス タントの力を借りることでアプリ開発を 容易にします アプリの本格運用に必要な インフラ管理(リソース管理、 ログ、認証など)はDatabricksによって ケアされます シンプル プロダクション品質 データアプリケーションは保護 され、適切にアクセス管理され、 より優れたセキュリティを提供 します 組み込みガバナンス
  10. 特徴 ② 統合ガバナンス 全てのデータ + AI のガバナンスを統合 単一のガバナンスモデル ・全てのデータ &

    AI 資産に  単一のガバナンスモデル ・オープンで標準準拠 追跡できる ・リネージ(来歴)を自動記録 ・監視・観測可能性 ・いつ誰が何にを把握 データへの信頼 ・一貫したアクセス制御 ・規制業界でも安心 ・データを安全に活用 データも AI もアプリも、同じガバナンスで“信頼できる”。 ©2026 Databricks Inc. — All rights reserved
  11. 特徴 ② 統合ガバナンス 「誰が・どのデータに・いつ触れたか」が1か所で追える 1 アクセス制御 部署・役割ごとに、見える 範囲をひとつの仕組みで管理 2 来歴(リネージ)

    データがどこから来てどう 使われたかを自動で追跡 3 監査 いつ誰が何に触れたかを記録 規制対応の証跡に データも AI もアプリも同じガバナンス。規制業界でも“安全なまま”使える。 ©2026 Databricks Inc. — All rights reserved
  12. 特徴 ③ AIレディ データの隣で、そのまま AI へ 基盤モデルを標準搭載 • Claude /

    GPT / Llama を プラットフォーム上で直接 利用可能 • 基盤モデルとして提供 RAG・本番提供まで • ベクトル検索(AI Search)で自 社データを検索=RAG • Model Serving で本番提供 AI も同じガバナンス • Unity Catalog がデータもAI 資 産も一元管理 • リネージ・権限が AI まで 延伸 データと AI が同じ基盤・同じガバナンス。連携の作り込み不要=“AIレディ”。 ©2026 Databricks Inc. — All rights reserved
  13. エージェント開発・運用に最適 つくる → 運用する を、同じ基盤で つくる(開発) • Agent Bricks(ノーコード) /

    Mosaic AI Agent Framework(カスタム) で企業データに根ざしたエー ジェント • 基盤モデル+自社データ+ツール(MCP)を 組み合わせ 運用する(デプロイ・評価・統制) • Model Serving / Managed MLflow で本番提供 • Agent Evaluation(AIジャッジ)で品質評価 • Unity Catalog・Unity AI Gateway でガード レール・監査 作って終わりでなく、評価・本番運用・統制まで一気通貫。 ©2026 Databricks Inc. — All rights reserved
  14. 開発者から、ビジネスユーザーまで 作る人も、使う人も。同じデータ基盤で。 開発者・データチーム • エージェント/アプリ/パイプラインを作る • SQL・Python・ML で自在に • 本番運用・統制まで同じ場所

    ビジネスユーザー • 専門知識なしで、日本語でデータを使う • 「聞くだけ」で答え・グラフ・レポート • SQL もプログラミングも不要 あなたのデータと会話できるとしたら?── その入口が、次にご紹介する Genie One。 ©2026 Databricks Inc. — All rights reserved
  15. Genie One 業務ユーザーのための “AI の同僚” こんな同僚 • データの専門家を待たずに、自分で聞ける • 日本語で質問

    → 答えとグラフが返る • SQL もプログラミングも不要 ただのチャットボットと違う • あなたの会社のデータを前提に答える • 答えの根拠(どのデータか)が見える • 権限のある範囲だけ=安全 “詳しい同僚に聞く”感覚で、誰でもデータを使える。これが Genie One。 ©2026 Databricks Inc. — All rights reserved
  16. Genieはすべての人に新たなAI機能をもたらす Genie エージェント Genie Code ビジネスを知るAI Genie One 統合ガバナンス Unity

    Catalog オープンフォーマット Postgres Lakehouse データウェアハウス Lakebase サーバレスPostgres Lakeflow 取り込み、ETL、ストリーミング 技術ユーザー データエンジニア データサイエンティスト アナリスト ビジネスユーザー ©2026 Databricks Inc. — All rights reserved 21
  17. Genie One いつもの場所で、そのまま使える 1 Web ブラウザ 専用画面でデータに質問・ 探索。 2 Slack

    / Teams 普段のチャットからそのまま質 問できる。 3 ドキュメント作成 回答をそのまま資料・ レポートへ。 新しいツールを覚える必要なし。今の働き方の中に AI の同僚が入る。 ©2026 Databricks Inc. — All rights reserved
  18. Genie One Slack / Teams からそのまま使える いつものチャットで Genie にメンションして質問 ―

    新しい画面を覚える必要なし。 ©2026 Databricks Inc. — All rights reserved
  19. Genie One あなたのビジネスを理解して答える 会社の文脈を横断 • テーブル・指標・ダッシュボードなどをまとめて理解 • “売上”“顧客”など社内の意味(定義)を共有 • 部署をまたいでも同じ答え

    使うほど賢く • フィードバックから継続的に改善 • よく使う質問・指標を学習 • 精度が上がっていく 汎用 AI と違い、“あなたの会社のこと”を分かったうえで答える。 ©2026 Databricks Inc. — All rights reserved
  20. Genie One 管理者は統制を保ったまま 1 権限はそのまま 見ていいデータだけが見える Unity Catalog のガバナンスを 継承。

    2 範囲を決められる どのデータを Genie に使わせる か管理者が設定。 3 監査できる 誰が何を聞いたか追える。 安心して全社展開。 「現場に開放」と「統制」を両立。だから安心して配れる。 ©2026 Databricks Inc. — All rights reserved
  21. デモ 本日のデモ:Databricks を触ってみる ① データが“ひとつ”の 場所に集まる › ② Genie に

    日本語で質問 › ③ AI を 動かす › ④ アプリ・ダッシュ ボードで共有 コードを書かず、データに聞いて・AI を動かして・共有できる。これを“ひとつ”で。 ©2026 Databricks Inc. — All rights reserved
  22. まとめ 今日の要点と、次の一歩 1 ひとつに束ねる 保存〜分析〜AI〜アプリを同じ 基盤で。権限・来歴・監査も一 元化。 2 誰でも触れる Genie

    One なら日本語で聞くだ け。SQL 不要、いつもの Slack からも。 3 安全なまま展開 Unity Catalog のガバナンスを 継承。 まずは小さく試す ― 日本語でデータに質問してみる。 ©2026 Databricks Inc. — All rights reserved