Slide 1

Slide 1 text

©2023 Databricks Inc. — All rights reserved | Confidential and proprietary 1 データ活用の強い味方 Databricksで実現する データを生かす基盤のつ くり方・活用の ポイント Databricks シニアソリューションアーキテクト 弥生 隆明

Slide 2

Slide 2 text

自己紹介 弥生 隆明 (やよい たかあき) Databricksシニアソリューションアーキテクト ▪ 2020年からデータブリックス ジャパンにおいて、プレセー ルス、POCに従事 ▪ 前職はコンサルティングファーム、総合電機メーカーにて データ分析・Webサービス構築などに従事。 インド赴任経験あり。 ▪ Qiitaでいろいろ書いています。

Slide 3

Slide 3 text

©2023 Databricks Inc. — All rights reserved 投資 $3B 市場価値は5兆円以上 従業員数 5000+ (2年前は1500人) 収益(ARR) $1B+ (1,360億円) データレイクハウスの 発明者でパイオニア 導入企業数 10000+ レイクハウスカンパニー のクリエーターが 2013年に起業 知る人ぞ知るデカコーン Databricksは2022年も 攻勢を続ける | Coral Capital

Slide 4

Slide 4 text

アジェンダ ● DXとは ● DX推進やデータ活用における課題 ● 課題を解決するDatabricks レイクハウス ● ベストプラクティス

Slide 5

Slide 5 text

アジェンダ ● DXとは ● DX推進やデータ活用における課題 ● 課題を解決するDatabricks レイクハウス ● ベストプラクティス

Slide 6

Slide 6 text

©2023 Databricks Inc. — All rights reserved デジタルトランスフォーメーション(DX)とは 変化の激しい現代ではDXやデータ活用は非常に重要な取り組みです • 「DX(デジタルトランスフォーメーション)」とは、企業がAI、IoT、ビッグデータなどのデジタル 技術を用いて、業務フローの改善や新たなビジネスモデルの創出だけでなく、レガシーシス テムからの脱却や企業風土の変革を実現させることを意味します。 • DXでは単に既存のプロセスをIT化するのではなく、働き方やビジネスプロセスの変革も重 要となります。 • データ活用もDXにおいて重要な取り組みとなっています。 DX(デジタルトランスフォーメーション)とは? 意味・定義をわかりやすく解説 - 株式会社モンスターラボ

Slide 7

Slide 7 text

アジェンダ ● DXとは ● DX推進やデータ活用における課題 ● 課題を解決するDatabricks レイクハウス ● ベストプラクティス

Slide 8

Slide 8 text

©2023 Databricks Inc. — All rights reserved DX推進やデータ活用における課題 しかしながら、様々な課題がDXやデータ活用を妨げています • 組織:組織全体での推進力不足 • 部署間の連携が不十分 • スモールスタートによる成功体験の蓄積が困難 • システム:レガシーシステムによるDXの阻害 • AIプロジェクトを推進しようにも思うようにデータを活用できない • 最新技術を活用できる環境がない • 人:人材不足 • AI技術者、データサイエンティスト、データエンジニアなどは市場で 奪い合いの状況

Slide 9

Slide 9 text

アジェンダ ● DXとは ● DX推進やデータ活用における課題 ● 課題を解決するDatabricks レイクハウス ● ベストプラクティス

Slide 10

Slide 10 text

©2023 Databricks Inc. — All rights reserved レイクハウスとは 10

Slide 11

Slide 11 text

©2023 Databricks Inc. — All rights reserved 11 データ ウェアハウス データ レイク レイクハウス データ、アナリティクス、AIワーク ロード全てを統合する シンプルなプラットフォーム

Slide 12

Slide 12 text

©2023 Databricks Inc. — All rights reserved 12 データ ウェアハウス データ レイク データレイクに データ管理とデータガバナンスをも たらすオープンアプローチ トランザクションによる優れた信頼性 インデックスによりデータ処理速度を 48倍に きめ細かいアクセスコントロールリストによる大 規模データガバナンスを実現

Slide 13

Slide 13 text

©2023 Databricks Inc. — All rights reserved Databricksレイクハウスプラットフォーム シンプル 13 プラットフォームセキュリティ/管理 オープンデータレイク データマネジメント、ガバナンス データ エンジニアリン グ BI/SQL アナリティクス データ サイエンス/ ML リアルタイム データ アプリケーション Databricksレイクハウス プラットフォーム オープン コラボレーティブ ✓ ✓ ✓ 非構造化、準構造化、構造化、ストリーミングデータ

Slide 14

Slide 14 text

©2023 Databricks Inc. — All rights reserved Databricksレイクハウスプラットフォーム シンプル 14 ✓ 全てのデータユースケースに対 するデータ、アナリティクス、AI を一つの共通したプラットフォー ムで統合 プラットフォームセキュリティ/管理 オープンデータレイク データマネジメント、ガバナンス データ エンジニアリン グ BI/SQL アナリティクス データ サイエンス/ ML リアルタイム データ アプリケーション Databricksレイクハウス プラットフォーム 非構造化、準構造化、構造化、ストリーミングデータ

Slide 15

Slide 15 text

©2023 Databricks Inc. — All rights reserved Databricksレイクハウスプラットフォーム オープン 15 ✓ オープンソースのスタンダード、 フォーマットによるデータエコシ ステムの統合 世界で最も成功しているオープ ンソースプロジェクトによるイノ ベーションを活用したプラット フォーム 3000万以上 月間ダウンロード

Slide 16

Slide 16 text

©2023 Databricks Inc. — All rights reserved Databricksレイクハウスプラットフォーム オープン 16 ✓ オープンソースのスタンダードと フォーマットによる データエコシステムの統合 データランドスケープの パートナー 450以上 Azure Data Factory ビジュアルETL & データ取り込み データ提供者 Amazon Redshift Azure Synapse レイクハウス プラットフォーム ビジネスインテリジェンス Google BigQuery Amazon SageMaker Azure Machine Learning 機械学習 Google AI Platform AWS Glue ガバナンスの集中管理 トップコンサルティング & SIパートナー

Slide 17

Slide 17 text

©2023 Databricks Inc. — All rights reserved Databricksレイクハウスプラットフォーム コラボレーティブ 17 ✓ データ、AIワークフロー全体を 通じたデータチームの コラボレーションの統合 データアナリスト データエンジニア データ サイエンティスト モデル ダッシュボード ノートブック データセット

Slide 18

Slide 18 text

©2023 Databricks Inc. — All rights reserved 機能概要 18

Slide 19

Slide 19 text

©2023 Databricks Inc. — All rights reserved レイクハウスで実現するML/BI/ETL 同じデータですべてのワークロードを実現 • 機械学習モデルの開発、運用 • 大量データに対するBI • データパイプラインの開発、運用 Delta LakeとUnity Catalogで実現する データレイクハウス • 容量無制限かつ安価なストレージ • DWH以上のパフォーマンス • バッチ処理、ストリーム処理への対応 • トランザクション保証 • すべてのデータに対するガバナンス(権限管理/ 監査/リネージ) Unity Catalog データサイエンス / 機械学習(ML) BI/DWH データ エンジニアリング / ETL ビジネス アナリスト データ エンジニア データ サイエンティスト

Slide 20

Slide 20 text

©2023 Databricks Inc. — All rights reserved レイクハウスガバナンスのための Unity Catalog すべてのデータ資産のガバナンス、管理 • ウェアハウス、テーブル、カラム • データレイク、ファイル • 機械学習モデル • ダッシュボード、ノートブック 機能 • データリネージ • 属性ベースのアクセス制御 • セキュリティポリシー • テーブル、カラムレベルのタグ • 監査 • データ共有

Slide 21

Slide 21 text

©2023 Databricks Inc. — All rights reserved DatabricksにおけるML & データサイエンス 機械学習 • モデルレジストリ、再現性、本格運用への 投入 • 再現性確保にDelta Lakeを活用 • シチズンデータサイエンティストのための AutoML データサイエンス • インタラクティブ分析向けコラボレーティブ ノートブック、ダッシュボード • Python、Java、R、Scalaのネイティブサ ポート • Delta Lakeデータのネイティブサポート

Slide 22

Slide 22 text

©2023 Databricks Inc. — All rights reserved Databricksにおけるデータエンジニアリング • Databricksワークフローによるデータ オーケストレーション • Delta Live Tablesによる完全なデータパ イプラインの管理 • Delta Lakeによるキュレーテッド データレイクアプローチを通じて データエンジニアリングをシンプルに

Slide 23

Slide 23 text

©2023 Databricks Inc. — All rights reserved DatabricksにおけるSQLワークロード • Delta LakeにおけるBI、SQLワークロー ドの優れた性能、同時実行性 • 分析に適したネイティブSQLインタフェー ス • Delta Lakeの最新データに直接 クエリーすることによるBIツールの サポート

Slide 24

Slide 24 text

©2023 Databricks Inc. — All rights reserved DX推進におけるDatabricksの効用 DatabricksがDXをドライブします • 組織:組織全体での推進力不足 • AIプロジェクトでの部署間コラボレーションを支援(AIモデル、データ、ダッシュボードなどの共有、 ノートブックの同時参照・編集) • 機能単位の課金ではなく、計算資源の使用量に基づく従量課金でスモールスタートが簡単 • システム:レガシーシステムによるDXの阻害 • 高信頼・高品質データパイプラインを容易に実現し、AIプロジェクトを強力に支援 • ツールの乱立を防ぎシステムをシンプルに • 大規模言語モデルを含む最新のオープンテクノロジーを容易に活用、環境構築も容易 • 人:人材不足 • 最新技術を活用できることが採用における優位性に • 多くの事例でデータサイエンティスト、データエンジニア、アナリストの生産性を向上

Slide 25

Slide 25 text

©2023 Databricks Inc. — All rights reserved リアルワールドデータ解析と デジタルマーケティングの革新 25 ソリューション ● Microsoft社及び、Databricks社のサ ポートによりAzure Databricksを導入 ● Delta Lakeによりデータレイクのデータ に信頼性と管理性を提供 ● Apache Sparkを活用した並列分散処 理による処理の高速化 ● 異なるチームがコラボレーションできる ワークスペース 導入効果 ● インフラ構築、保守に要する社内リソー スが不要に ● 従量課金モデルによりデータ規模に合 わせてコストの最適化が可能に ● マルチ言語 (Python/Scala/R/Java/SQL)対応によ り、柔軟なデータ分析が可能に ● Azure Databricksチームのサポートに よる円滑な基盤運用 ● ワークスペースを活用することによる チーム間の円滑なコミュニケーションの 実現 課題 ● リアルワールドデータは 1ファイルのサイ ズが1TBを超えることもあり、この規模の データを既存環境では処理できなかっ た。 ● データサイエンスチームと ICTチームが 円滑にコラボレーションすることが困難 であった。 田辺三菱製薬がDXを加速! 「Azure Databricks」を活用してリアルワールドデータの分析基盤を構築 ● 適切な医療を適切なタイミングに適切な 患者様に届けること。 ○ 成長戦略とバリューチェーンの生 産性向上に向けたデジタル基盤 の構築 ○ デジタルトランスフォーメーション の推進 ビジネスゴール

Slide 26

Slide 26 text

©2023 Databricks Inc. — All rights reserved 差別化要素 26

Slide 27

Slide 27 text

クラウド事業者のネィティブサービスとの違い 生データ (Bronze) 標準化データ (silver/Gold) モデル インプット モデル ファイル 予測 データ モニタリング / ビジネスビュー  データエンジニア データサイエンティスト クレン ジング 特徴量エンジ 基礎統計 EDA モデル学習 デプロイ 推論 ビジネスアナリスト RDBサービス 各種検索 レポーティング クラウドサービス (複数サービス組合せ、 IaaS思想) Databricks (統合プラットフォーム、 Data+AIの民主化思想) 生データ (Bronze) 標準化データ (silver/Gold) モデル インプット モデル ファイル 予測 データ モニタリング / ビジネスビュー レイクハウスプラットフォーム 1つのノートブックで全てを実現 クレンジ ング Databricks Notebook EDA 特徴量エンジ Databricks Notebook モデル 学習 Databricks Notebook デプロイ 推論 Databricks Notebook (MLFLOW) 各種検索 レポーティング Databricks Notebook (Databricks SQL ) データサイエンティスト ML エンジニア ビジネスサイド データエンジニア 高 速 なサ イクル が 困 難 IAMって何 ? 仮 想 クラウド って? ・・・ シングル インスタンス チームでの コラボは? 監査ログは どうする? 各種 知識要! 監視 AIに関わるライフサイクルの全プロセスを、一つの環境で効率的に実施可能 AIサービス AIサービス AIサービス ETLサービス ETLサービス

Slide 28

Slide 28 text

特定機能サービスとの違い AIに関わるライフサイクルの全プロセスを、一つの環境で効率的に実施可能 クラウドDWH (機能特化、他のサービスとの連携が前提 ) Databricks (統合プラットフォーム、 Data+AIの民主化思想) 単体では データサイエンス / AI に対応不可 追加のコスト、システム統合、管理、スキル保有 者が必要に • AI機能が不在なため、他のAI製品パートナー に依存 AIに関わるライフサイクル全てをシンプルに • データサイエンティスト、データエンジニアチー ムが同じ環境から大規模データにアクセスして 活用 • 自動化されたAIのライフサイクルを実現 モデル 構築 モデル 配備 データ 準備 クラウド DWH

Slide 29

Slide 29 text

©2023 Databricks Inc. — All rights reserved データドリブンかつフレキシブルで スピーディな開発を支援 29 Databricks Case Study Book: 〜次世代データ分析基盤 レイクハウス 導入事例〜 課題 ● 業務で生じたさまざまなデータを分析できる 統合的な活用基盤が欲し い ● 社内に分散したデータを統合するデータパイプライン を構築したい ● データ分析に関わる作業を標準化し、データを扱える人材を徐々に 増やしていきたい ソリューション ● データ取り込み、前処理、分析、可視化などが可能な オールインワンの 環境が実現 ● データのリアルタイムなダイレクト処理が可能に、データの民主化を実 現 ● BIツールを使った分析の前段階での手作業による処理が不要に、工数 が大幅に削減される

Slide 30

Slide 30 text

アジェンダ ● DXとは ● DX推進やデータ活用における課題 ● 課題を解決するDatabricks レイクハウス ● ベストプラクティス

Slide 31

Slide 31 text

©2023 Databricks Inc. — All rights reserved Databricksベストプラクティス トピックは大量にありますので、今回は以下にフォーカスします • Databricksの環境構築 • 複数プロジェクト、複数部門でDatabricksを活用するケース • Databricksの活用 • 効率的なデータパイプラインの構築 • 他サービス・他製品との連携

Slide 32

Slide 32 text

©2023 Databricks Inc. — All rights reserved Databricksの環境構築 単一の環境(ワークスペース)を使用するよりも複数環境が一般的です • 利用されるお客様の要件に応じてワークスペースを分割します。これによって、ワークス ペースの合目的性が高まります。 • Dev/Stage/Prod • 部門別 • しかし、ワークスペースを分割することで、データがサイロ化しては意味がありません。ここ でUnity Catalogを活用します。

Slide 33

Slide 33 text

©2023 Databricks Inc. — All rights reserved Databricksの環境構築 Unity CatalogはDatabricksの様々な資産に対するガバナンスを管理します クラウド ストレージ (S3, ADLS, GCS) * コンテナ / バケット 監査ログ Databricks ワークスペース アカウントレベ ルユーザ管理 ストレージ 認証情報 メタストア リネージュエク スプローラ ACLストア データエクスプ ローラ アクセス管理 Unity Catalog ✔ ユーザー

Slide 34

Slide 34 text

©2023 Databricks Inc. — All rights reserved Databricks ワークスペース 2 Unity Catalogなし Unity Catalogあり Databricks ワークスペース 1 Databricks ワークスペース Databricks ワークスペース Unity Catalog ユーザー管理 メタストア クラスター SQLウェアハウス クラスター SQLウェアハウス ユーザー管理 メタストア クラスター SQLウェアハウス ユーザー管理 メタストア クラスター SQLウェアハウス Databricksの環境構築 複数ワークスペースで活用するデータを一元管理できます

Slide 35

Slide 35 text

©2023 Databricks Inc. — All rights reserved dev Schema databases Tables/ Views Unity メタストア staging bu_dev bu_staging Schema databases Tables/ Views prod bu_prod Schema databases Tables/ Views Schema databases Tables/ Views Schema databases Tables/ Views Schema databases Tables/ Views SDLC(ソフト ウェア開発ライ フサイクル)環 境スコープごと 3レベル名前空間のカタログ レベルによって、技術要件、 ビジネス要件にそってデー タベースやテーブル、ビュー を整理することができます。 BUごと team_x_sandbox team_y_sandbox Schema databases Tables/ Views Schema databases Tables/ Views チームのサンド ボックスごと 中央チームがカタログ +スキーマを所有。 中央チームが権限付与を実施。 GRANT USAGE on GRANT USAGE, CREATE on チームがテーブルを所有。チー ムX/Yによって権限付与。チー ムXやチームYは別のチームと はデータを共有しません。 Databricksの環境構築 要件に応じて3レベル名前空間でデータを管理します

Slide 36

Slide 36 text

©2023 Databricks Inc. — All rights reserved Databricksの環境構築 参考資料 • Databricks Unity Catalogのベストプラクティス • Databricksにおけるアイデンティティ管理のベストプラクティス • Databricksにおける機能的ワークスペースの構成方法 • Databricksのデータガバナンスベストプラクティス • AWSにおけるDatabricksデプロイメントについてまとめてみた

Slide 37

Slide 37 text

©2023 Databricks Inc. — All rights reserved Databricksの活用:Delta Live Tables AIにせよBIにせよデータが命です • Databricksでは高信頼・高性能データパイプラインを容易に構築できるソリューションであ るDelta Live Tables(DLT)を提供しています。 • Delta Live Tablesの背後ではDelta LakeとApache Sparkの構造化ストリーミングが動 作します。従来であれば、(リアルタイム)データパイプラインを構築するためには、自分の手 でApache Sparkの構造化ストリーミングのロジックや、Delta Lakeの操作ロジックを記述 する必要があり、さらにはエラーハンドリング、品質チェック、監視の仕組みを実装しなくて はなりませんでした。 • Delta Live Tablesを活用することで、開発者は処理のHowではなく、必要とするデータの Whatを宣言することでデータパイプラインを構築することができます。

Slide 38

Slide 38 text

©2023 Databricks Inc. — All rights reserved Delta Lakeはレイクハウスのいしずえと言えます クレンジング 拡張されたデータ ビジネスレベルの 集計データ 生データ ブロンズ シルバー ゴールド

Slide 39

Slide 39 text

©2023 Databricks Inc. — All rights reserved 品質 ETLを通じてレイクハウスのいしずえを築きます Data Lake CSV, JSON, TXT… Kinesis BI & Reporting Streaming Analytics Data Science & ML クレンジング 拡張されたデータ ビジネスレベルの 集計データ 生データ ブロンズ シルバー ゴールド

Slide 40

Slide 40 text

©2023 Databricks Inc. — All rights reserved でも、現実はそんなにシンプルなものではありません 大規模データに対してデータの品質と信頼性を維持するのは複雑で不安定なものになります Data Lake CSV, JSON, TXT… Kinesis BI & Reporting Streaming Analytics Data Science & ML

Slide 41

Slide 41 text

©2023 Databricks Inc. — All rights reserved 大規模ETLは複雑かつ不安定なものです Data Lake CSV, JSON, TXT… Kinesis BI & Reporting Streaming Analytics Data Science & ML 貧弱な データ品質 データ品質の監視、 強制が困難 データのリネージュを追 跡できない パイプライン オペレーションが困 難 詳細なデータレベルでの 貧弱な観察可能性 エラーハンドリングと リカ バリが面倒 複雑な パイプライン の開発 依存性を構築、維持 することが困難 バッチとストリーム 処理を切り替えるのが 困難

Slide 42

Slide 42 text

©2023 Databricks Inc. — All rights reserved Delta Live Tablesのご紹介 BRONZE SILVER GOLD 新鮮かつ高品質データを構築、管理するシンプルな方法 パイプラインの容易な開発、維持 データパイプライン(バッチ、ストリーミング)を構 築、管理するための記述ツール 自動テスト ビルトインの品質管理、データ品質モニタリング 簡素化されたオペレーション パイプラインオペレーションに対するディープな 可視化を通じた自動エラーハンドリング

Slide 43

Slide 43 text

©2023 Databricks Inc. — All rights reserved データパイプラインの容易な構築、維持 ビジネスロジックとテーブルの依存関 係を含めて、記述的にデータパイプラ インを構築します 構造化/非構造化データをバッチ、ス トリーミングで実行します 環境に渡ってETLパイプラインを再利 用できます

Slide 44

Slide 44 text

©2023 Databricks Inc. — All rights reserved データに対する信頼性 Deltaのエクスペクテーションにより不 正なデータがテーブルに流れ込むこと を防ぎます 事前定義されたエラーポリシー(失敗、 欠損、警告、データ検疫)によってデー タ品質エラーを回避、対策します 長期にわたるデータ品質のトレンドを モニタリングします

Slide 45

Slide 45 text

©2023 Databricks Inc. — All rights reserved 信頼性とオペレーションのシンプルさを 保ちながらスケールします オペレーションの状態とデータリネー ジュをビジュアルで追跡できるツール を用いたパイプラインオペレーション のディープな可視性の獲得 自動エラーハンドリングおよび容易な リトライによるダウンタイムの削減 シングルクリックによるデプロイメント、 アップグレードによる メンテナンスのスピードアップ

Slide 46

Slide 46 text

©2023 Databricks Inc. — All rights reserved ShellはDatabricks Delta Live Tablesを活用して、1.3兆行のセンサーデータを容易に処理し、迅速 な洞察抽出、MLイノベーションのためにETL開発、管理をシンプルにしています。 ユースケース ● サプライチェーン、オペレーション、製品開発、マーケティング、 顧客体験にインパクトを与える 70以上のユースケース チャレンジ ● 複雑なデータパイプラインがもたらすオペレーション負荷によっ て、数百万のセンサーから送られる大量の IoTデータをアクショ ン可能な洞察につなげることが困難だった ソリューション ● Delta Lakeにおけるデータウェアハウス、 BI、機械学習統合する レイクハウスアーキテクチャによって、以前は次元不可能であっ たユースケースの実現が可能に ● Delta Live Tables (DLT)を用いることで、Shellは信頼性がありス ケーラブルなデータパイプラインを構築可能に ● 自動ジョブメンテナンスとディープなパイプラインの可視性によっ て時間とリソースを節約 “Delta Live Talbesは、我々のチームがこの規模のデータの管理に費やす時間と労力を削減します。既存のレイクハウスアーキテ クチャを拡張するこの機能によって、 DatabricksはETLとデータウェアハウス市場に破壊的なイノベーションをもたらしています。こ のことは、我々のような企業にとっては重要なことです。イノベーションパートナーとして Databricksと共に働けることは、我々にとっ てエキサイティングなことです。 ” Dan Jeavons, GM Data Science

Slide 47

Slide 47 text

©2023 Databricks Inc. — All rights reserved Databricksの活用:Delta Live Tables 参考資料 • Delta Live Tablesのコンセプト • Delta Live TablesのFAQ • Delta Live Tablesのベストプラクティス • Delta Live Tablesによる小売業者へのリアルタイムデータのデリバリー • Databricks Delta Live Tablesでチェンジデータキャプチャをシンプルに

Slide 48

Slide 48 text

©2023 Databricks Inc. — All rights reserved Databricksの活用:データモデリング 様々なデータモデリング手法をサポートしています • DatabricksではDWHでよく使用さ れるスタースキーマ、Data Vaultな どのデータモデルの構築をサポート しています。そのための PK/FK/Idententy Columnsなどの 機能を提供しています。 • Data Vaultモデルの延長として、エ ンドユーザーのクエリーを簡単にす るためにディメンショナルモデルのス タースキーマをロードすることも可能 です。

Slide 49

Slide 49 text

©2023 Databricks Inc. — All rights reserved Databricksの活用:データモデリング 参考資料 • Delta Lakeを用いてDatabricksでスタースキーマを実装する5つのシンプルなステップ • DatabricksレイクハウスプラットフォームにおけるData Vault実装の規範的ガイド • DatabricksレイクハウスにおけるData Vaultのベストプラクティスと実装 • モダンレイクハウスにおけるディメンションモデリングのベストプラクティスと実装

Slide 50

Slide 50 text

©2023 Databricks Inc. — All rights reserved Databricksの活用:他製品との連携 Databricksの特徴の一つは「オープン」です。 • Databricksで数多くのワークロードをサポートしていますが、リバースETLなど専門の製品を活用 した方が効率的なケースは多くございます。 • DatabricksレイクハウスプラットフォームはAPIを公開しており、それを活用することで様々な製品 ・ソリューションを簡単にインテグレーションすることができます。インテグレーションのハブとして動 作するDatabricks Partner Connectが提供されています。 • さらには、データ、AIモデルを簡単に共有できるDatabricks Market Placeも公開されました。

Slide 51

Slide 51 text

©2023 Databricks Inc. — All rights reserved 幅広いエコシステム

Slide 52

Slide 52 text

©2023 Databricks Inc. — All rights reserved Databricksの活用:他製品との連携 リバースETLでのHightouchの活用 • 通常のDatabricksでのETLは、ソースデータからAI/BIで活用するデータに変換する処理を行いま す。 • この処理済みのデータをビジネスアプリケーションに還元するのがリバースETLです。このためのソ リューションとしてHightouchを活用することができます。

Slide 53

Slide 53 text

©2023 Databricks Inc. — All rights reserved 利用者にとっての価値 最新のデータツール・AI ツールとレイク ハウスを容易に接続。レイクハウスが分 析ユースケースを強化します。 Partner Connect はクラスター、トーク ン、接続ファイルなどのリソースを自動的 に構成するので、パートナーソリューショ ンの統合をシンプルにします。 Databricksの活用:他製品との連携 インテグレーションをスムーズにするDatabricks Partner Connect

Slide 54

Slide 54 text

©2023 Databricks Inc. — All rights reserved データ利用者にとっての価値 様々なデータセットや資産を発見し、 シームレスにアクセス。 データ提供者にとっての価値 自身のビジネスをDatabricksエコシステ ムに拡大して露出を増やし、セールスサ イクルを加速するためにデータセット、 ノートブックなどの資産を配布。 データパートナー etc. Databricksの活用:他製品との連携 データセットを共有できるDatabricks Marketplace

Slide 55

Slide 55 text

©2023 Databricks Inc. — All rights reserved Databricksの活用:他製品との連携 参考資料 • DatabricksにおけるリバースETLでのHightouchの活用 • 人気のデータとAIツールをレイクハウスに連携できるDatabricks Partner Connectのご紹介 • Databricks Partner Connectにおける新たなパートナーインテグレーションの発表 • Databricks Partner Connectにおけるdbt Cloudのローンチ

Slide 56

Slide 56 text

©2023 Databricks Inc. — All rights reserved まとめ 56

Slide 57

Slide 57 text

©2023 Databricks Inc. — All rights reserved データ統合 + データ分析 + AI活用 の全てを行える SaaS型統合データ分析基盤「レイクハウス・プラットフォーム」を提供 データ活用を強力に推進

Slide 58

Slide 58 text

©2023 Databricks Inc. — All rights reserved Thank you