Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
DTD_Databricksことはじめ
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
BrainPad
January 29, 2026
Technology
220
0
Share
DTD_Databricksことはじめ
BrainPad
January 29, 2026
More Decks by BrainPad
See All by BrainPad
BrainPad AAA_AIエージェントの社会実装する上での壁 / Barriers to the Social Implementation of AI Agents
brainpadpr
1
110
白金鉱業Meetup_Vol.22_Orbital Senseを支える衛星画像のマルチモーダルエンベディングと地理空間のあいまい検索技術
brainpadpr
2
330
DTD_AIエージェント開発プロジェクトのメソッドを体系化してみる
brainpadpr
1
280
【採用候補者向け】BrainPad AAAご紹介資料
brainpadpr
0
1.5k
DTD_はじめての因子分析_理論とビジネス活用.pdf
brainpadpr
2
2.5k
DTD_TensorRTを用いた自然言語処理モデルの高速化
brainpadpr
0
84
DTD_生成AIアシスタントのコスト最適化
brainpadpr
1
190
白金鉱業Vol.21【初学者向け発表枠】身近な例から学ぶ数理最適化の基礎 / Learning the Basics of Mathematical Optimization Through Everyday Examples
brainpadpr
1
680
三田データ_BrainPadAAA_AIエージェント元年を振り返る
brainpadpr
1
220
Other Decks in Technology
See All in Technology
Babylon.js を使って試した色々な内容 / Various things I tried using Babylon.js / Babylon.js 勉強会 vol.5
you
PRO
0
230
Cursor Subagentsはいいぞ
yug1224
2
140
GitHub Copilotを極める会 - 開発者のための活用術
findy_eventslides
4
2.1k
不確実性と戦いながら見積もりを作成するプロセス/mitsumori-process
hirodragon112
1
190
Cortex Code君、今日から内製化支援担当ね。
coco_se
0
270
ストライクウィッチーズ2期6話のエイラの行動が許せないのでPjMの観点から何をすべきだったのかを考える
ichimichi
1
110
ZOZOTOWNリプレイスでのSkills導入までの流れとこれから
zozotech
PRO
4
2.5k
2026-04-02 IBM Bobオンボーディング入門
yutanonaka
0
200
Microsoft Fabricで考える非構造データのAI活用
ryomaru0825
0
650
AWS DevOps Agent or Kiro の使いどころを考える_20260402
masakiokuda
0
180
Oracle Cloud Infrastructure(OCI):Onboarding Session(はじめてのOCI/Oracle Supportご利⽤ガイド)
oracle4engineer
PRO
2
17k
会社紹介資料 / Sansan Company Profile
sansan33
PRO
16
410k
Featured
See All Featured
Everyday Curiosity
cassininazir
0
190
Building Adaptive Systems
keathley
44
3k
The Cost Of JavaScript in 2023
addyosmani
55
9.8k
The Spectacular Lies of Maps
axbom
PRO
1
680
Understanding Cognitive Biases in Performance Measurement
bluesmoon
32
2.8k
DevOps and Value Stream Thinking: Enabling flow, efficiency and business value
helenjbeal
1
160
Design in an AI World
tapps
0
190
Neural Spatial Audio Processing for Sound Field Analysis and Control
skoyamalab
0
240
AI Search: Where Are We & What Can We Do About It?
aleyda
0
7.2k
Leveraging Curiosity to Care for An Aging Population
cassininazir
1
210
Are puppies a ranking factor?
jonoalderson
1
3.2k
Kristin Tynski - Automating Marketing Tasks With AI
techseoconnect
PRO
0
210
Transcript
Databricksことはじめ 2026年 01月29日(Ver1.0) 村田匡
©BrainPad Inc. Strictly Confidential 1. 自己紹介、DEのお仕事紹介 2. Databricks PJで使うと良さそうな機能 3.
DatabricksをML・BIで使うとどうなるか? 4. ノーコード/ローコードツールを使ってみた 5. まとめ
©BrainPad Inc. Strictly Confidential 3 1. 自己紹介 ・経歴: ・ 2013年
医療機器の会社に勤務 ・ 2021年 フリーランスのDSとして活動 ・ 2025年 株式会社ブレインパッド 入社 データエンジニアリングユニット プラットフォーム開発 ・プロジェクト経験: ・小売業でのデータ分析基盤の構築 ・統計関連の案件 ・趣味: ・統計学の勉強 ・ボードゲーム ・子供と遊ぶ
©BrainPad Inc. Strictly Confidential 4 1. BrainPad DE(データエンジニアリングユニット)のお仕事の紹介 • GCP、AWSを使ってデータ分析基盤の構築(DEUプラットフォーム
一般)
©BrainPad Inc. Strictly Confidential 5 1. BrainPad DE(データエンジニアリングユニット)のお仕事の紹介 • GCP、AWSを使ってデータ分析基盤の構築(DEUプラットフォーム
一般) • Databricksの社内向けデモ環境を立ち上げ(DEU 一部メンバーのみ)
©BrainPad Inc. Strictly Confidential 6 1. Databricksのパートナーになりました ブレインパッド、 Databricksの「システムインテグレーター コンサルティングパートナー」に登録
https://www.brainpad.co.jp/news/2025/12/04/24594
©BrainPad Inc. Strictly Confidential 1. 自己紹介、DEのお仕事紹介 2. Databricksとは? PJで使うと良さそうな機能 3.
DatabricksをML・BIで使うとどうなるか? 4. ノーコード/ローコードツールを使ってみた 5. まとめ
©BrainPad Inc. Strictly Confidential 8 2. Databricksとは? 概要や特徴 Databricksとは?: 大規模なデータ分析、AI開発などを1つの場所で行うための
統合データ分析プラットフォーム • どこが便利なのか? • 使っているクラウド環境に接続するだけでOK • AWS、Azure、GCPなど、現在の環境・データをそのまま利用可能 • 環境が変わっても同じように使える • データの移行作業なども不要
©BrainPad Inc. Strictly Confidential 9 2. Databricksとは? 概要や特徴 Databricksで主にこんなことができます •
ETL:データの加工 • 定期実行(Job, Pipeline) • データ増分の自動取り込み(Auto Loader) • 大規模データの処理(Spark) • 加工後のテーブルを管理(Data Lineage) • BI:ダッシュボードで可視化して傾向を見る • データ分析:PythonやSQLで可視化 • ML:機械学習モデルを構築 https://docs.databricks.com/aws/ja/introduction/
©BrainPad Inc. Strictly Confidential 10 2. Databricksとは? よく質問を受ける内容 Q. クラウドの標準的な機能だけで同じことはできませんか?
A. 機能的には可能ですが、構築・運用にコストや手間がかかりそうです… • 比較:クラウドvs Databricks • 1. 分析やモデル管理機能を作る手間の有無 • 使い慣れた機能が良い粒度で入っている • 2. パフォーマンスや処理速度 • 処理エンジン(Spark)による大量データの高速分散処理が可能 • 3. データガバナンス(セキュリティ管理) • 「Unity Catalog」という機能により、ファイル、テーブル、AIモデルの権限を一元管理できる • ファイル、テーブル、AIモデルなどにアクセス権を細かく割り振れる
©BrainPad Inc. Strictly Confidential 1. 自己紹介、DEのお仕事紹介 2. Databricksとは? PJで使うと良さそうな機能 3.
DatabricksをML・BIで使うとどうなるか? 4. ノーコード/ローコードツールを使ってみた 5. まとめ
©BrainPad Inc. Strictly Confidential 12 3. Databricks PJで使うと良さそうな機能 • Unity
Catalog • Data Lineage • Serverless SQL Warehouse • Genie
©BrainPad Inc. Strictly Confidential 13 3. Databricks PJで使うと良さそうな機能 • Unity
Catalogで一元管理 • データやモデルなどにアクセスさせたい人、させたくない人を制御できる Cloud AWS, GCP,Azure など Unity Catalog in databricks
©BrainPad Inc. Strictly Confidential 14 3. Databricks PJで使うと良さそうな機能 • Unity
Catalogで一元管理 • データやモデルなどにアクセスさせたい人、させたくない人を制御できる
©BrainPad Inc. Strictly Confidential 15 3. Databricks PJで使うと良さそうな機能 • Unity
Catalogで一元管理 • データやモデルなどにアクセスさせたい人、させたくない人を制御できる アクセス可能にしたい アカウントを追加する アクセスの種別を追加する
©BrainPad Inc. Strictly Confidential 16 3. Databricks PJで使うと良さそうな機能 • Data
Lineage • テーブルを加工・保存した履歴を追跡できる どんな列が 増えたかがわかる どのテーブルを加工して 作成されたかがわかる
©BrainPad Inc. Strictly Confidential 17 3. Databricks PJで使うと良さそうな機能 • Serverless
SQL Warehouse • 計算資源をクラウドから別途用意することなく、コンピュートリソースを利用できる
©BrainPad Inc. Strictly Confidential 19 3. Databricks PJで使うと良さそうな機能 • Genie:コードの生成・補完、AIエージェントなどを行うLLMが利用できる
©BrainPad Inc. Strictly Confidential 20 3. Databricks PJで使うと良さそうな機能 • Genie:コードの生成・補完、AIエージェントなどを行うLLMが利用できる
©BrainPad Inc. Strictly Confidential DatabricksをML・BIで使うとどうなるか?
©BrainPad Inc. Strictly Confidential DatabricksをML・BIで使うとどうなるか?
©BrainPad Inc. Strictly Confidential 23 3. Data Lineage • データ加工で、テーブルのトラッキング(Unity
Catalog のData Lineage) どんな列が 増えたかがわかる どのテーブルを加工して 作成されたかがわかる
©BrainPad Inc. Strictly Confidential 24 3. 定期実行 Job • データ加工で、処理の方針が決まったら定期実行スケジュールを組める(Job)
https://docs.databricks.com/aws/ja/jobs/monitor いつ処理が 失敗しているかがわかる いつどの処理が 実行されたかがわかる
©BrainPad Inc. Strictly Confidential 25 3. Titanicデータの概要(補足) 姉妹兄弟/配偶者の数 親/子供の数 Master:男の子
3人の兄弟と来た 1人の親と来た Mrs:既婚女性 兄弟や旦那さんとは来てない 2人の親か子と来た
©BrainPad Inc. Strictly Confidential 26 3. MLモデルの管理 • 作成したモデルを管理
©BrainPad Inc. Strictly Confidential 27 3. MLモデルの管理 • モデルを管理し続けていて、例えば評価結果が閾値よりも値が低くなったらアラート 0.60
を下回っているので アラートを出す メールやSlackに通知が送られる
©BrainPad Inc. Strictly Confidential DatabricksをML・BIで使うとどうなるか? notebookで
©BrainPad Inc. Strictly Confidential 29 3. EDA Python • 通常のnotebookのように可視化ライブラリを扱える
• PythonでもSQLでも簡単な可視化をVisualizeツールで可視化可能 コードが長い… その割に書くことはお決まり
©BrainPad Inc. Strictly Confidential 30 3. EDA GoogleColabの場合
©BrainPad Inc. Strictly Confidential 31 3. EDA PythonやSQL • 通常のnotebookのように可視化ライブラリを扱える
• PythonでもSQLでも簡単な可視化をVisualizeツールで可視化可能
©BrainPad Inc. Strictly Confidential 32 3. EDA PythonやSQL • 通常のnotebookのように可視化ライブラリを扱える
• PythonでもSQLでも簡単な可視化をVisualizeツールで可視化可能
©BrainPad Inc. Strictly Confidential 33 3. DatabricksをML・BIで使うとどうなるか? Genie(補足) • Genieで自然言語によるEDA
©BrainPad Inc. Strictly Confidential 34 3. DatabricksをML・BIで使うとどうなるか? Genie • Genieで自然言語によるEDA
名前の長さについて 調べてみることにしました。
©BrainPad Inc. Strictly Confidential 35 3. DatabricksをML・BIで使うとどうなるか? Genie • Genieで自然言語によるEDA
©BrainPad Inc. Strictly Confidential 36 3. DatabricksをML・BIで使うとどうなるか? Genie • Genieで自然言語によるEDA
©BrainPad Inc. Strictly Confidential DatabricksをML・BIで使うとどうなるか? ダッシュボードで
©BrainPad Inc. Strictly Confidential 38 3. EDA BIでダッシュボードを使う • 既存のBIツールのようにダッシュボードを組める
©BrainPad Inc. Strictly Confidential 39 3. EDA BIでダッシュボードを使う • ダッシュボードはGenieと会話しながら組んでもらえる
©BrainPad Inc. Strictly Confidential 1. 自己紹介、DEのお仕事紹介 2. Databricksとは? PJで使うと良さそうな機能 3.
DatabricksをML・BIで使うとどうなるか? 4. ノーコード/ローコードツールを使ってみた 5. まとめ
©BrainPad Inc. Strictly Confidential 41 4.ノーコード/ローコードツールを使ってみた • Lakeflow Designer:自然言語でテーブルを加工・処理などできる https://www.databricks.com/jp/blog/announcing-lakeflow-designer-no-code-etl
©BrainPad Inc. Strictly Confidential 42 4.ノーコード/ローコードツールを使ってみた • Lakeflow Designer:自然言語でテーブルを加工・処理などできる
©BrainPad Inc. Strictly Confidential 43 4.ノーコード/ローコードツールを使ってみた • Lakeflow Designer:自然言語でテーブルを加工・処理などできる
©BrainPad Inc. Strictly Confidential 44 4.ノーコード/ローコードツールを使ってみた • Lakeflow Designer:自然言語でテーブルを加工・処理などできる
©BrainPad Inc. Strictly Confidential 45 4.ノーコード/ローコードツールを使ってみた • Lakeflow Designer:自然言語でテーブルを加工・処理などできる
©BrainPad Inc. Strictly Confidential 1. 自己紹介、DEのお仕事紹介 2. Databricksとは? PJで使うと良さそうな機能 3.
DatabricksをML・BIで使うとどうなるか? 4. ノーコード/ローコードツールを使ってみた 5. まとめ
©BrainPad Inc. Strictly Confidential 47 5. まとめ Databricksを触ってみた所感 • 良いと思ったところ:
• 分散処理による高速処理ができる • 可視化が簡単にできる • データやモデルの管理が便利 • 今後に期待したいところ: • 参考記事が少ない印象
株式会社ブレインパッド 106-0032 東京都港区六本木三丁目1番1号 六本木ティーキューブ TEL:03-6721-7002 FAX:03-6721-7010 www.brainpad.co.jp
[email protected]
本資料は、未刊行文書として日本及び各国の著作権法に基づき保護されております。本資料には、株式会社ブレインパッド所有の特定情報が含まれており、これら情報に基づく本資料の内容は、貴社以外の第三者に開示されること、また、本資料を評価する以外の目的で、その 一部または全文を複製、使用、公開することは、禁止されています。また、株式会社ブレインパッドによる書面での許可なく、それら情報の一部または全文を使用または公開することは、いかなる場合も禁じられております。
©BrainPad Inc.