Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
DTD_Databricksことはじめ
Search
BrainPad
January 29, 2026
Technology
0
110
DTD_Databricksことはじめ
BrainPad
January 29, 2026
Tweet
Share
More Decks by BrainPad
See All by BrainPad
DTD_AIエージェント開発プロジェクトのメソッドを体系化してみる
brainpadpr
1
100
【採用候補者向け】BrainPad AAAご紹介資料
brainpadpr
0
980
DTD_はじめての因子分析_理論とビジネス活用.pdf
brainpadpr
2
2.2k
DTD_TensorRTを用いた自然言語処理モデルの高速化
brainpadpr
0
34
DTD_生成AIアシスタントのコスト最適化
brainpadpr
1
150
白金鉱業Vol.21【初学者向け発表枠】身近な例から学ぶ数理最適化の基礎 / Learning the Basics of Mathematical Optimization Through Everyday Examples
brainpadpr
1
600
三田データ_BrainPadAAA_AIエージェント元年を振り返る
brainpadpr
1
180
DTD_メタデータ管理とデータ品質管理の具体化
brainpadpr
0
190
DTD_これから始めるMCP基本のキ
brainpadpr
3
300
Other Decks in Technology
See All in Technology
生成AIを活用した音声文字起こしシステムの2つの構築パターンについて
miu_crescent
PRO
2
190
Data Hubグループ 紹介資料
sansan33
PRO
0
2.7k
MCPでつなぐElasticsearchとLLM - 深夜の障害対応を楽にしたい / Bridging Elasticsearch and LLMs with MCP
sashimimochi
0
160
[CV勉強会@関東 World Model 読み会] Orbis: Overcoming Challenges of Long-Horizon Prediction in Driving World Models (Mousakhan+, NeurIPS 2025)
abemii
0
130
広告の効果検証を題材にした因果推論の精度検証について
zozotech
PRO
0
170
All About Sansan – for New Global Engineers
sansan33
PRO
1
1.3k
Agile Leadership Summit Keynote 2026
m_seki
1
600
SREのプラクティスを用いた3領域同時 マネジメントへの挑戦 〜SRE・情シス・セキュリティを統合した チーム運営術〜
coconala_engineer
2
640
Greatest Disaster Hits in Web Performance
guaca
0
220
予期せぬコストの急増を障害のように扱う――「コスト版ポストモーテム」の導入とその後の改善
muziyoshiz
1
1.8k
GSIが複数キー対応したことで、俺達はいったい何が嬉しいのか?
smt7174
3
150
生成AI時代にこそ求められるSRE / SRE for Gen AI era
ymotongpoo
5
3.1k
Featured
See All Featured
Why You Should Never Use an ORM
jnunemaker
PRO
61
9.7k
Claude Code どこまでも/ Claude Code Everywhere
nwiizo
61
52k
Faster Mobile Websites
deanohume
310
31k
Leadership Guide Workshop - DevTernity 2021
reverentgeek
1
200
Applied NLP in the Age of Generative AI
inesmontani
PRO
4
2k
Primal Persuasion: How to Engage the Brain for Learning That Lasts
tmiket
0
250
Music & Morning Musume
bryan
47
7.1k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
12
1.4k
So, you think you're a good person
axbom
PRO
2
1.9k
HU Berlin: Industrial-Strength Natural Language Processing with spaCy and Prodigy
inesmontani
PRO
0
210
Navigating Team Friction
lara
192
16k
Introduction to Domain-Driven Design and Collaborative software design
baasie
1
580
Transcript
Databricksことはじめ 2026年 01月29日(Ver1.0) 村田匡
©BrainPad Inc. Strictly Confidential 1. 自己紹介、DEのお仕事紹介 2. Databricks PJで使うと良さそうな機能 3.
DatabricksをML・BIで使うとどうなるか? 4. ノーコード/ローコードツールを使ってみた 5. まとめ
©BrainPad Inc. Strictly Confidential 3 1. 自己紹介 ・経歴: ・ 2013年
医療機器の会社に勤務 ・ 2021年 フリーランスのDSとして活動 ・ 2025年 株式会社ブレインパッド 入社 データエンジニアリングユニット プラットフォーム開発 ・プロジェクト経験: ・小売業でのデータ分析基盤の構築 ・統計関連の案件 ・趣味: ・統計学の勉強 ・ボードゲーム ・子供と遊ぶ
©BrainPad Inc. Strictly Confidential 4 1. BrainPad DE(データエンジニアリングユニット)のお仕事の紹介 • GCP、AWSを使ってデータ分析基盤の構築(DEUプラットフォーム
一般)
©BrainPad Inc. Strictly Confidential 5 1. BrainPad DE(データエンジニアリングユニット)のお仕事の紹介 • GCP、AWSを使ってデータ分析基盤の構築(DEUプラットフォーム
一般) • Databricksの社内向けデモ環境を立ち上げ(DEU 一部メンバーのみ)
©BrainPad Inc. Strictly Confidential 6 1. Databricksのパートナーになりました ブレインパッド、 Databricksの「システムインテグレーター コンサルティングパートナー」に登録
https://www.brainpad.co.jp/news/2025/12/04/24594
©BrainPad Inc. Strictly Confidential 1. 自己紹介、DEのお仕事紹介 2. Databricksとは? PJで使うと良さそうな機能 3.
DatabricksをML・BIで使うとどうなるか? 4. ノーコード/ローコードツールを使ってみた 5. まとめ
©BrainPad Inc. Strictly Confidential 8 2. Databricksとは? 概要や特徴 Databricksとは?: 大規模なデータ分析、AI開発などを1つの場所で行うための
統合データ分析プラットフォーム • どこが便利なのか? • 使っているクラウド環境に接続するだけでOK • AWS、Azure、GCPなど、現在の環境・データをそのまま利用可能 • 環境が変わっても同じように使える • データの移行作業なども不要
©BrainPad Inc. Strictly Confidential 9 2. Databricksとは? 概要や特徴 Databricksで主にこんなことができます •
ETL:データの加工 • 定期実行(Job, Pipeline) • データ増分の自動取り込み(Auto Loader) • 大規模データの処理(Spark) • 加工後のテーブルを管理(Data Lineage) • BI:ダッシュボードで可視化して傾向を見る • データ分析:PythonやSQLで可視化 • ML:機械学習モデルを構築 https://docs.databricks.com/aws/ja/introduction/
©BrainPad Inc. Strictly Confidential 10 2. Databricksとは? よく質問を受ける内容 Q. クラウドの標準的な機能だけで同じことはできませんか?
A. 機能的には可能ですが、構築・運用にコストや手間がかかりそうです… • 比較:クラウドvs Databricks • 1. 分析やモデル管理機能を作る手間の有無 • 使い慣れた機能が良い粒度で入っている • 2. パフォーマンスや処理速度 • 処理エンジン(Spark)による大量データの高速分散処理が可能 • 3. データガバナンス(セキュリティ管理) • 「Unity Catalog」という機能により、ファイル、テーブル、AIモデルの権限を一元管理できる • ファイル、テーブル、AIモデルなどにアクセス権を細かく割り振れる
©BrainPad Inc. Strictly Confidential 1. 自己紹介、DEのお仕事紹介 2. Databricksとは? PJで使うと良さそうな機能 3.
DatabricksをML・BIで使うとどうなるか? 4. ノーコード/ローコードツールを使ってみた 5. まとめ
©BrainPad Inc. Strictly Confidential 12 3. Databricks PJで使うと良さそうな機能 • Unity
Catalog • Data Lineage • Serverless SQL Warehouse • Genie
©BrainPad Inc. Strictly Confidential 13 3. Databricks PJで使うと良さそうな機能 • Unity
Catalogで一元管理 • データやモデルなどにアクセスさせたい人、させたくない人を制御できる Cloud AWS, GCP,Azure など Unity Catalog in databricks
©BrainPad Inc. Strictly Confidential 14 3. Databricks PJで使うと良さそうな機能 • Unity
Catalogで一元管理 • データやモデルなどにアクセスさせたい人、させたくない人を制御できる
©BrainPad Inc. Strictly Confidential 15 3. Databricks PJで使うと良さそうな機能 • Unity
Catalogで一元管理 • データやモデルなどにアクセスさせたい人、させたくない人を制御できる アクセス可能にしたい アカウントを追加する アクセスの種別を追加する
©BrainPad Inc. Strictly Confidential 16 3. Databricks PJで使うと良さそうな機能 • Data
Lineage • テーブルを加工・保存した履歴を追跡できる どんな列が 増えたかがわかる どのテーブルを加工して 作成されたかがわかる
©BrainPad Inc. Strictly Confidential 17 3. Databricks PJで使うと良さそうな機能 • Serverless
SQL Warehouse • 計算資源をクラウドから別途用意することなく、コンピュートリソースを利用できる
©BrainPad Inc. Strictly Confidential 19 3. Databricks PJで使うと良さそうな機能 • Genie:コードの生成・補完、AIエージェントなどを行うLLMが利用できる
©BrainPad Inc. Strictly Confidential 20 3. Databricks PJで使うと良さそうな機能 • Genie:コードの生成・補完、AIエージェントなどを行うLLMが利用できる
©BrainPad Inc. Strictly Confidential DatabricksをML・BIで使うとどうなるか?
©BrainPad Inc. Strictly Confidential DatabricksをML・BIで使うとどうなるか?
©BrainPad Inc. Strictly Confidential 23 3. Data Lineage • データ加工で、テーブルのトラッキング(Unity
Catalog のData Lineage) どんな列が 増えたかがわかる どのテーブルを加工して 作成されたかがわかる
©BrainPad Inc. Strictly Confidential 24 3. 定期実行 Job • データ加工で、処理の方針が決まったら定期実行スケジュールを組める(Job)
https://docs.databricks.com/aws/ja/jobs/monitor いつ処理が 失敗しているかがわかる いつどの処理が 実行されたかがわかる
©BrainPad Inc. Strictly Confidential 25 3. Titanicデータの概要(補足) 姉妹兄弟/配偶者の数 親/子供の数 Master:男の子
3人の兄弟と来た 1人の親と来た Mrs:既婚女性 兄弟や旦那さんとは来てない 2人の親か子と来た
©BrainPad Inc. Strictly Confidential 26 3. MLモデルの管理 • 作成したモデルを管理
©BrainPad Inc. Strictly Confidential 27 3. MLモデルの管理 • モデルを管理し続けていて、例えば評価結果が閾値よりも値が低くなったらアラート 0.60
を下回っているので アラートを出す メールやSlackに通知が送られる
©BrainPad Inc. Strictly Confidential DatabricksをML・BIで使うとどうなるか? notebookで
©BrainPad Inc. Strictly Confidential 29 3. EDA Python • 通常のnotebookのように可視化ライブラリを扱える
• PythonでもSQLでも簡単な可視化をVisualizeツールで可視化可能 コードが長い… その割に書くことはお決まり
©BrainPad Inc. Strictly Confidential 30 3. EDA GoogleColabの場合
©BrainPad Inc. Strictly Confidential 31 3. EDA PythonやSQL • 通常のnotebookのように可視化ライブラリを扱える
• PythonでもSQLでも簡単な可視化をVisualizeツールで可視化可能
©BrainPad Inc. Strictly Confidential 32 3. EDA PythonやSQL • 通常のnotebookのように可視化ライブラリを扱える
• PythonでもSQLでも簡単な可視化をVisualizeツールで可視化可能
©BrainPad Inc. Strictly Confidential 33 3. DatabricksをML・BIで使うとどうなるか? Genie(補足) • Genieで自然言語によるEDA
©BrainPad Inc. Strictly Confidential 34 3. DatabricksをML・BIで使うとどうなるか? Genie • Genieで自然言語によるEDA
名前の長さについて 調べてみることにしました。
©BrainPad Inc. Strictly Confidential 35 3. DatabricksをML・BIで使うとどうなるか? Genie • Genieで自然言語によるEDA
©BrainPad Inc. Strictly Confidential 36 3. DatabricksをML・BIで使うとどうなるか? Genie • Genieで自然言語によるEDA
©BrainPad Inc. Strictly Confidential DatabricksをML・BIで使うとどうなるか? ダッシュボードで
©BrainPad Inc. Strictly Confidential 38 3. EDA BIでダッシュボードを使う • 既存のBIツールのようにダッシュボードを組める
©BrainPad Inc. Strictly Confidential 39 3. EDA BIでダッシュボードを使う • ダッシュボードはGenieと会話しながら組んでもらえる
©BrainPad Inc. Strictly Confidential 1. 自己紹介、DEのお仕事紹介 2. Databricksとは? PJで使うと良さそうな機能 3.
DatabricksをML・BIで使うとどうなるか? 4. ノーコード/ローコードツールを使ってみた 5. まとめ
©BrainPad Inc. Strictly Confidential 41 4.ノーコード/ローコードツールを使ってみた • Lakeflow Designer:自然言語でテーブルを加工・処理などできる https://www.databricks.com/jp/blog/announcing-lakeflow-designer-no-code-etl
©BrainPad Inc. Strictly Confidential 42 4.ノーコード/ローコードツールを使ってみた • Lakeflow Designer:自然言語でテーブルを加工・処理などできる
©BrainPad Inc. Strictly Confidential 43 4.ノーコード/ローコードツールを使ってみた • Lakeflow Designer:自然言語でテーブルを加工・処理などできる
©BrainPad Inc. Strictly Confidential 44 4.ノーコード/ローコードツールを使ってみた • Lakeflow Designer:自然言語でテーブルを加工・処理などできる
©BrainPad Inc. Strictly Confidential 45 4.ノーコード/ローコードツールを使ってみた • Lakeflow Designer:自然言語でテーブルを加工・処理などできる
©BrainPad Inc. Strictly Confidential 1. 自己紹介、DEのお仕事紹介 2. Databricksとは? PJで使うと良さそうな機能 3.
DatabricksをML・BIで使うとどうなるか? 4. ノーコード/ローコードツールを使ってみた 5. まとめ
©BrainPad Inc. Strictly Confidential 47 5. まとめ Databricksを触ってみた所感 • 良いと思ったところ:
• 分散処理による高速処理ができる • 可視化が簡単にできる • データやモデルの管理が便利 • 今後に期待したいところ: • 参考記事が少ない印象
株式会社ブレインパッド 106-0032 東京都港区六本木三丁目1番1号 六本木ティーキューブ TEL:03-6721-7002 FAX:03-6721-7010 www.brainpad.co.jp
[email protected]
本資料は、未刊行文書として日本及び各国の著作権法に基づき保護されております。本資料には、株式会社ブレインパッド所有の特定情報が含まれており、これら情報に基づく本資料の内容は、貴社以外の第三者に開示されること、また、本資料を評価する以外の目的で、その 一部または全文を複製、使用、公開することは、禁止されています。また、株式会社ブレインパッドによる書面での許可なく、それら情報の一部または全文を使用または公開することは、いかなる場合も禁じられております。
©BrainPad Inc.