Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
DTD_Databricksことはじめ
Search
BrainPad
January 29, 2026
Technology
0
190
DTD_Databricksことはじめ
BrainPad
January 29, 2026
Tweet
Share
More Decks by BrainPad
See All by BrainPad
BrainPad AAA_AIエージェントの社会実装する上での壁 / Barriers to the Social Implementation of AI Agents
brainpadpr
1
81
白金鉱業Meetup_Vol.22_Orbital Senseを支える衛星画像のマルチモーダルエンベディングと地理空間のあいまい検索技術
brainpadpr
2
300
DTD_AIエージェント開発プロジェクトのメソッドを体系化してみる
brainpadpr
1
220
【採用候補者向け】BrainPad AAAご紹介資料
brainpadpr
0
1.3k
DTD_はじめての因子分析_理論とビジネス活用.pdf
brainpadpr
2
2.4k
DTD_TensorRTを用いた自然言語処理モデルの高速化
brainpadpr
0
75
DTD_生成AIアシスタントのコスト最適化
brainpadpr
1
180
白金鉱業Vol.21【初学者向け発表枠】身近な例から学ぶ数理最適化の基礎 / Learning the Basics of Mathematical Optimization Through Everyday Examples
brainpadpr
1
660
三田データ_BrainPadAAA_AIエージェント元年を振り返る
brainpadpr
1
200
Other Decks in Technology
See All in Technology
モジュラモノリス導入から4年間の総括:アーキテクチャと組織の相互作用について / Architecture and Organizational Interaction
nazonohito51
1
500
Go標準パッケージのI/O処理をながめる
matumoto
0
230
VLAモデル構築のための AIロボット向け模倣学習キット
kmatsuiugo
0
280
Kiro Powers 入門
k_adachi_01
0
120
実践 Datadog MCP Server
nulabinc
PRO
2
240
脳内メモリ、思ったより揮発性だった
koutorino
0
390
「通るまでRe-run」から卒業!落ちないテストを書く勘所
asumikam
2
260
SRE NEXT 2026 CfP レビュアーが語る聞きたくなるプロポーザルとは?
yutakawasaki0911
1
450
猫でもわかるKiro CLI(AI 駆動開発への道編)
kentapapa
0
270
CyberAgentの生成AI戦略 〜変わるものと変わらないもの〜
katayan
0
280
visionOS 開発向けの MCP / Skills をつくり続けることで XR の探究と学習を最大化
karad
1
950
WebアクセシビリティをCI/CDで担保する ― axe DevTools × Playwright C#実践ガイド
tomokusaba
2
180
Featured
See All Featured
From Legacy to Launchpad: Building Startup-Ready Communities
dugsong
0
180
How to build a perfect <img>
jonoalderson
1
5.3k
The Pragmatic Product Professional
lauravandoore
37
7.2k
16th Malabo Montpellier Forum Presentation
akademiya2063
PRO
0
74
Google's AI Overviews - The New Search
badams
0
930
Leading Effective Engineering Teams in the AI Era
addyosmani
9
1.7k
Collaborative Software Design: How to facilitate domain modelling decisions
baasie
0
160
A brief & incomplete history of UX Design for the World Wide Web: 1989–2019
jct
1
320
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
PRO
199
73k
AI: The stuff that nobody shows you
jnunemaker
PRO
3
450
Taking LLMs out of the black box: A practical guide to human-in-the-loop distillation
inesmontani
PRO
3
2.1k
GitHub's CSS Performance
jonrohan
1032
470k
Transcript
Databricksことはじめ 2026年 01月29日(Ver1.0) 村田匡
©BrainPad Inc. Strictly Confidential 1. 自己紹介、DEのお仕事紹介 2. Databricks PJで使うと良さそうな機能 3.
DatabricksをML・BIで使うとどうなるか? 4. ノーコード/ローコードツールを使ってみた 5. まとめ
©BrainPad Inc. Strictly Confidential 3 1. 自己紹介 ・経歴: ・ 2013年
医療機器の会社に勤務 ・ 2021年 フリーランスのDSとして活動 ・ 2025年 株式会社ブレインパッド 入社 データエンジニアリングユニット プラットフォーム開発 ・プロジェクト経験: ・小売業でのデータ分析基盤の構築 ・統計関連の案件 ・趣味: ・統計学の勉強 ・ボードゲーム ・子供と遊ぶ
©BrainPad Inc. Strictly Confidential 4 1. BrainPad DE(データエンジニアリングユニット)のお仕事の紹介 • GCP、AWSを使ってデータ分析基盤の構築(DEUプラットフォーム
一般)
©BrainPad Inc. Strictly Confidential 5 1. BrainPad DE(データエンジニアリングユニット)のお仕事の紹介 • GCP、AWSを使ってデータ分析基盤の構築(DEUプラットフォーム
一般) • Databricksの社内向けデモ環境を立ち上げ(DEU 一部メンバーのみ)
©BrainPad Inc. Strictly Confidential 6 1. Databricksのパートナーになりました ブレインパッド、 Databricksの「システムインテグレーター コンサルティングパートナー」に登録
https://www.brainpad.co.jp/news/2025/12/04/24594
©BrainPad Inc. Strictly Confidential 1. 自己紹介、DEのお仕事紹介 2. Databricksとは? PJで使うと良さそうな機能 3.
DatabricksをML・BIで使うとどうなるか? 4. ノーコード/ローコードツールを使ってみた 5. まとめ
©BrainPad Inc. Strictly Confidential 8 2. Databricksとは? 概要や特徴 Databricksとは?: 大規模なデータ分析、AI開発などを1つの場所で行うための
統合データ分析プラットフォーム • どこが便利なのか? • 使っているクラウド環境に接続するだけでOK • AWS、Azure、GCPなど、現在の環境・データをそのまま利用可能 • 環境が変わっても同じように使える • データの移行作業なども不要
©BrainPad Inc. Strictly Confidential 9 2. Databricksとは? 概要や特徴 Databricksで主にこんなことができます •
ETL:データの加工 • 定期実行(Job, Pipeline) • データ増分の自動取り込み(Auto Loader) • 大規模データの処理(Spark) • 加工後のテーブルを管理(Data Lineage) • BI:ダッシュボードで可視化して傾向を見る • データ分析:PythonやSQLで可視化 • ML:機械学習モデルを構築 https://docs.databricks.com/aws/ja/introduction/
©BrainPad Inc. Strictly Confidential 10 2. Databricksとは? よく質問を受ける内容 Q. クラウドの標準的な機能だけで同じことはできませんか?
A. 機能的には可能ですが、構築・運用にコストや手間がかかりそうです… • 比較:クラウドvs Databricks • 1. 分析やモデル管理機能を作る手間の有無 • 使い慣れた機能が良い粒度で入っている • 2. パフォーマンスや処理速度 • 処理エンジン(Spark)による大量データの高速分散処理が可能 • 3. データガバナンス(セキュリティ管理) • 「Unity Catalog」という機能により、ファイル、テーブル、AIモデルの権限を一元管理できる • ファイル、テーブル、AIモデルなどにアクセス権を細かく割り振れる
©BrainPad Inc. Strictly Confidential 1. 自己紹介、DEのお仕事紹介 2. Databricksとは? PJで使うと良さそうな機能 3.
DatabricksをML・BIで使うとどうなるか? 4. ノーコード/ローコードツールを使ってみた 5. まとめ
©BrainPad Inc. Strictly Confidential 12 3. Databricks PJで使うと良さそうな機能 • Unity
Catalog • Data Lineage • Serverless SQL Warehouse • Genie
©BrainPad Inc. Strictly Confidential 13 3. Databricks PJで使うと良さそうな機能 • Unity
Catalogで一元管理 • データやモデルなどにアクセスさせたい人、させたくない人を制御できる Cloud AWS, GCP,Azure など Unity Catalog in databricks
©BrainPad Inc. Strictly Confidential 14 3. Databricks PJで使うと良さそうな機能 • Unity
Catalogで一元管理 • データやモデルなどにアクセスさせたい人、させたくない人を制御できる
©BrainPad Inc. Strictly Confidential 15 3. Databricks PJで使うと良さそうな機能 • Unity
Catalogで一元管理 • データやモデルなどにアクセスさせたい人、させたくない人を制御できる アクセス可能にしたい アカウントを追加する アクセスの種別を追加する
©BrainPad Inc. Strictly Confidential 16 3. Databricks PJで使うと良さそうな機能 • Data
Lineage • テーブルを加工・保存した履歴を追跡できる どんな列が 増えたかがわかる どのテーブルを加工して 作成されたかがわかる
©BrainPad Inc. Strictly Confidential 17 3. Databricks PJで使うと良さそうな機能 • Serverless
SQL Warehouse • 計算資源をクラウドから別途用意することなく、コンピュートリソースを利用できる
©BrainPad Inc. Strictly Confidential 19 3. Databricks PJで使うと良さそうな機能 • Genie:コードの生成・補完、AIエージェントなどを行うLLMが利用できる
©BrainPad Inc. Strictly Confidential 20 3. Databricks PJで使うと良さそうな機能 • Genie:コードの生成・補完、AIエージェントなどを行うLLMが利用できる
©BrainPad Inc. Strictly Confidential DatabricksをML・BIで使うとどうなるか?
©BrainPad Inc. Strictly Confidential DatabricksをML・BIで使うとどうなるか?
©BrainPad Inc. Strictly Confidential 23 3. Data Lineage • データ加工で、テーブルのトラッキング(Unity
Catalog のData Lineage) どんな列が 増えたかがわかる どのテーブルを加工して 作成されたかがわかる
©BrainPad Inc. Strictly Confidential 24 3. 定期実行 Job • データ加工で、処理の方針が決まったら定期実行スケジュールを組める(Job)
https://docs.databricks.com/aws/ja/jobs/monitor いつ処理が 失敗しているかがわかる いつどの処理が 実行されたかがわかる
©BrainPad Inc. Strictly Confidential 25 3. Titanicデータの概要(補足) 姉妹兄弟/配偶者の数 親/子供の数 Master:男の子
3人の兄弟と来た 1人の親と来た Mrs:既婚女性 兄弟や旦那さんとは来てない 2人の親か子と来た
©BrainPad Inc. Strictly Confidential 26 3. MLモデルの管理 • 作成したモデルを管理
©BrainPad Inc. Strictly Confidential 27 3. MLモデルの管理 • モデルを管理し続けていて、例えば評価結果が閾値よりも値が低くなったらアラート 0.60
を下回っているので アラートを出す メールやSlackに通知が送られる
©BrainPad Inc. Strictly Confidential DatabricksをML・BIで使うとどうなるか? notebookで
©BrainPad Inc. Strictly Confidential 29 3. EDA Python • 通常のnotebookのように可視化ライブラリを扱える
• PythonでもSQLでも簡単な可視化をVisualizeツールで可視化可能 コードが長い… その割に書くことはお決まり
©BrainPad Inc. Strictly Confidential 30 3. EDA GoogleColabの場合
©BrainPad Inc. Strictly Confidential 31 3. EDA PythonやSQL • 通常のnotebookのように可視化ライブラリを扱える
• PythonでもSQLでも簡単な可視化をVisualizeツールで可視化可能
©BrainPad Inc. Strictly Confidential 32 3. EDA PythonやSQL • 通常のnotebookのように可視化ライブラリを扱える
• PythonでもSQLでも簡単な可視化をVisualizeツールで可視化可能
©BrainPad Inc. Strictly Confidential 33 3. DatabricksをML・BIで使うとどうなるか? Genie(補足) • Genieで自然言語によるEDA
©BrainPad Inc. Strictly Confidential 34 3. DatabricksをML・BIで使うとどうなるか? Genie • Genieで自然言語によるEDA
名前の長さについて 調べてみることにしました。
©BrainPad Inc. Strictly Confidential 35 3. DatabricksをML・BIで使うとどうなるか? Genie • Genieで自然言語によるEDA
©BrainPad Inc. Strictly Confidential 36 3. DatabricksをML・BIで使うとどうなるか? Genie • Genieで自然言語によるEDA
©BrainPad Inc. Strictly Confidential DatabricksをML・BIで使うとどうなるか? ダッシュボードで
©BrainPad Inc. Strictly Confidential 38 3. EDA BIでダッシュボードを使う • 既存のBIツールのようにダッシュボードを組める
©BrainPad Inc. Strictly Confidential 39 3. EDA BIでダッシュボードを使う • ダッシュボードはGenieと会話しながら組んでもらえる
©BrainPad Inc. Strictly Confidential 1. 自己紹介、DEのお仕事紹介 2. Databricksとは? PJで使うと良さそうな機能 3.
DatabricksをML・BIで使うとどうなるか? 4. ノーコード/ローコードツールを使ってみた 5. まとめ
©BrainPad Inc. Strictly Confidential 41 4.ノーコード/ローコードツールを使ってみた • Lakeflow Designer:自然言語でテーブルを加工・処理などできる https://www.databricks.com/jp/blog/announcing-lakeflow-designer-no-code-etl
©BrainPad Inc. Strictly Confidential 42 4.ノーコード/ローコードツールを使ってみた • Lakeflow Designer:自然言語でテーブルを加工・処理などできる
©BrainPad Inc. Strictly Confidential 43 4.ノーコード/ローコードツールを使ってみた • Lakeflow Designer:自然言語でテーブルを加工・処理などできる
©BrainPad Inc. Strictly Confidential 44 4.ノーコード/ローコードツールを使ってみた • Lakeflow Designer:自然言語でテーブルを加工・処理などできる
©BrainPad Inc. Strictly Confidential 45 4.ノーコード/ローコードツールを使ってみた • Lakeflow Designer:自然言語でテーブルを加工・処理などできる
©BrainPad Inc. Strictly Confidential 1. 自己紹介、DEのお仕事紹介 2. Databricksとは? PJで使うと良さそうな機能 3.
DatabricksをML・BIで使うとどうなるか? 4. ノーコード/ローコードツールを使ってみた 5. まとめ
©BrainPad Inc. Strictly Confidential 47 5. まとめ Databricksを触ってみた所感 • 良いと思ったところ:
• 分散処理による高速処理ができる • 可視化が簡単にできる • データやモデルの管理が便利 • 今後に期待したいところ: • 参考記事が少ない印象
株式会社ブレインパッド 106-0032 東京都港区六本木三丁目1番1号 六本木ティーキューブ TEL:03-6721-7002 FAX:03-6721-7010 www.brainpad.co.jp
[email protected]
本資料は、未刊行文書として日本及び各国の著作権法に基づき保護されております。本資料には、株式会社ブレインパッド所有の特定情報が含まれており、これら情報に基づく本資料の内容は、貴社以外の第三者に開示されること、また、本資料を評価する以外の目的で、その 一部または全文を複製、使用、公開することは、禁止されています。また、株式会社ブレインパッドによる書面での許可なく、それら情報の一部または全文を使用または公開することは、いかなる場合も禁じられております。
©BrainPad Inc.