Upgrade to Pro — share decks privately, control downloads, hide ads and more …

データとAIで未来を創るDatabricks - 君の可能性を加速させるプラットフォーム

データとAIで未来を創るDatabricks - 君の可能性を加速させるプラットフォーム

学生の方向けにDatabricksを説明した資料です。抽象度高めで後半は事例紹介となっています。

Avatar for Takaaki Yayoi

Takaaki Yayoi

November 11, 2025
Tweet

More Decks by Takaaki Yayoi

Other Decks in Technology

Transcript

  1. ©2025 Databricks Inc. — All rights reserved 自己紹介 弥生 隆明

    (やよい たかあき) Databricks シニア スペシャリスト ソリューションアーキテクト ▪ 2020年からデータブリックス ジャパンにお いて、プレセールス、POCに従事 ▪ 専門領域は生成AI、データエンジニアリン グ、Webアプリケーション ▪ 前職はコンサル、総合電機メーカー にてデータ分析・Webサービス構築 などに従事。インド赴任経験あり。 ▪ Qiitaでいろいろ書いています。 2 @taka_aki
  2. ©2025 Databricks Inc. — All rights reserved データ+AIカンパニー クリエーター 10,000+

    グローバルのお客様 $2.4B+ 年間収益 4B+ の投資 レイクハウス の 発明者 生成AIの パイオニア LEADER 2025 Data Science & Machine Learning Analytic Stream Processing LEADER 2024 Data Science & Machine Learning
  3. 課題 ウェアハウスでの顧客分析と データレイクでの機械学習の 実施が、顧客体験を改善す るためのパーソナライゼー ションの提供の妨げになって いました。 ソリューション Databricksのレイク ハウスを用いることで、

    Disneyは購読者のデータを 統合し、効率的にパーソナラ イゼーションの機械学習モ デルを構築するためにオー プンプラットフォーム上で データのストリーミングを実 現しました。 加速された収益と解約率の削 減によって $39M+ 計算コストの削減 $30M 開発者の生産性の改善 40% インパクト
  4. ©2022 Databricks Inc. — All rights reserved 計画メンテナンス間の稼働時間 の増加 50%

    予期しないダウンタイムの削減 5% 課題 Rolls-Royceは、予兆保全を うまく取り込むことでコストと効 率性を改善したいと考えてい ましたが、データウェアハウス + データレイクの環境が大規 模機械学習の実行を妨げて いました。 ソリューション 13,000以上の飛行機におけ るメンテナンスの必要性を予 測するために、サプライヤー のデータとIoTセンサーデータ のストリーミングを統合するこ とで、Rolls-Royceはジェット エンジンの寿命を2倍にするこ とができました。 インパクト 二酸化炭素排出量の削減(4.8M 台の自動車と同等) 22M tons
  5. 課題 LLMをデジタルアシスタントと して導入したいと考えている が、機密情報の漏洩リスクか ら商用モデルの利用には制 約がある ソリューション ハッカソンの中で、米空軍はオー プンソースのLLMを活用し、18万件 の試験飛行関連文書で強化

    (RAG)しました。これにより、文脈 に即した適切な回答を生成したり、 飛行試験計画や安全計画に類似 した文書を作成したりできるように なりました。 時間の節約 従来、作成に数週間かかっていた米空 軍の試験文書が、同等の品質を維持し たまま瞬時に生成できるようになりまし た。 コスト削減 作業の自動化により、米空軍はコストを 大幅に削減することが可能になります。 インパクト ブログ記事 >
  6. ©2024 Databricks Inc. — All rights reserved Replitはオンラインの統合開発環境(IDE)です 課題 Replitは、次世代のソフトウェ

    ア開発者を支援するためにカ スタムのコード生成モデルを 導入したいと考えていました が、時間とエンジニアリングリ ソースが 不足していました。 ソリューション Replitは、Mosaic AI Trainingを 活用して27億パラメータの大規模 言語モデル(LLM)をトレーニング し、コード生成モデル 「Ghostwriter」をゼロから構築し ました。 インパクト 3日 でLLMのトレーニングを (従来は数週間〜数か月)を 実現 1日 で生データから本番環境への モデル展開までを一貫して実 行 ケーススタディ >
  7. ©2025 Databricks Inc. — All rights reserved データ エンジニアリング BI

    データウェアハウス データサイエンス & AI Mosaic AI Lakeflow AI/BI Databricks SQL セキュリティ、ガバナンス、カタログの統合 Unity Catalog Databricksデータインテリジェンスプラットフォーム 信頼性と共有のための統合データストレージ Delta Lake データのセマンティクスを理解するために生成AIを活用 データインテリジェンスエンジン オープンデータレイク すべての生データ (ログ、テキスト、音声、動画、画像)
  8. 22