Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Lakehouse×生成AI Databricksで体験する次世代データ分析ハンズオン 短縮版
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
島村学
May 17, 2025
Technology
30
0
Share
Lakehouse×生成AI Databricksで体験する次世代データ分析ハンズオン 短縮版
SocioInfo#30「AIとデータ利活用とRAG」(自然言語処理,AI,RAG,データ分析他)時にて発表した資料の一部です。
島村学
May 17, 2025
More Decks by 島村学
See All by 島村学
Databricks で Iceberg を試してみた
shimamura
0
580
Databricks における Apache Iceberg の活用ポイント
shimamura
0
420
Other Decks in Technology
See All in Technology
Bill One 開発エンジニア 紹介資料
sansan33
PRO
5
18k
【PHPカンファレンス小田原2026】Webアプリケーションエンジニアにも知ってほしい オブザーバビリティ の本質
fendo181
0
560
機能・非機能の学びを一つに!Agent Skillsで月間レポート作成始めてみた / Unifying Bug & Infra Insights — Building Monthly Quality Reports with Agent Skills
bun913
5
3.9k
AgentCore RuntimeからS3 Filesをマウントしてみる
har1101
3
400
BIツール「Omni」の紹介 @Snowflake中部UG
sagara
0
260
シン・リスコフの置換原則 〜現代風に考えるSOLIDの原則〜
jinwatanabe
0
180
Autonomous Database - Dedicated 技術詳細 / adb-d_technical_detail_jp
oracle4engineer
PRO
5
13k
AIペネトレーションテスト・ セキュリティ検証「AgenticSec」ご紹介資料
laysakura
0
1.6k
Introduction to Sansan, inc / Sansan Global Development Center, Inc.
sansan33
PRO
0
3k
2026年春から始めるOpenTelemetry | sogaoh's LT @ PHP Conference ODAWARA 2026
sogaoh
PRO
0
110
Databricksを用いたセキュアなデータ基盤構築とAIプロダクトへの応用.pdf
pkshadeck
PRO
0
290
All About Sansan – for New Global Engineers
sansan33
PRO
1
1.4k
Featured
See All Featured
The Cult of Friendly URLs
andyhume
79
6.8k
コードの90%をAIが書く世界で何が待っているのか / What awaits us in a world where 90% of the code is written by AI
rkaga
61
43k
The Pragmatic Product Professional
lauravandoore
37
7.2k
Why Mistakes Are the Best Teachers: Turning Failure into a Pathway for Growth
auna
0
110
Impact Scores and Hybrid Strategies: The future of link building
tamaranovitovic
0
250
How STYLIGHT went responsive
nonsquared
100
6k
Design of three-dimensional binary manipulators for pick-and-place task avoiding obstacles (IECON2024)
konakalab
0
400
Claude Code どこまでも/ Claude Code Everywhere
nwiizo
64
54k
Leveraging Curiosity to Care for An Aging Population
cassininazir
1
210
The State of eCommerce SEO: How to Win in Today's Products SERPs - #SEOweek
aleyda
2
10k
How to Ace a Technical Interview
jacobian
281
24k
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.7k
Transcript
SocioInfo#30 Lakehouse × 生成AI Databricksで体験する 次世代データ分析ハンズオン 島村 学
はじめに Lakehouse と 生成 AI というホットなテーマについてハンズオンを通して理解を深めていた だきます。 理論編としてデータ分析業界において注目されている Lakehouse と
Databricks に解 説します。 ハンズオンとして、 Databricks 上でメダリオンアーキテクチャにより Lakehouse の構築を 行い、 そのデータに対する生成 AI によるデータ分析を実施していただきます。
自己紹介 (1/2) Databricks Champion 認定者 データ分析システムにおける アーキテクト兼データエンジニア 株式会社ジール 島村 学
自己紹介 (2/2) DAMA のイベントにて登壇 IT 記事のブロガーです
理論編
Lakehouse とは (1/2) Lakehouse とは、 Data Lake と Data Warehouses
を組み合わせたデータ基盤アーキテクチャです。 オープンなフォーマットで低価格のストレージにデータを格納するなどの特徴があります。 出所:Lakehouse: A New Generation of Open Platforms that Unify Data Warehousing and Advanced Analytics
メダリオンアーキテクチャとは Lakehouse の普及とともに、メダリオンアーキテクチャというデータ設計パターンが注目されています。 ブロンズ (Bronze)・シルバー (Silver)・ゴールド (Gold)の3つのレイヤーを順次通過させることで、データの構造 と品質を段階的に向上させていく方法論であり、Lakehouse 構築時のベストプラクティスの1つです。 出所:メダリオンアーキテクチャ
(medallion architecture) | Databricks
1. Databricks にログイン Databricks にログインします。接続先 URL、および、接続情報は別途送付します。 続きは参加者のみです。
ハンズオンの実施に向けて
Microsoft 最近のクラウドサービスを利用するにはスマホなどで認証する方法がデフォルトの動作となっているため、 今回はお待ちのスマホで Microsoft Authenticator というアプリをダウンロードしてください。 iPhone 版 Android 版
ハンズオン
ハンズオン概要 Databricks のログインからはじめて、Databricks にてメダリオンアーキテクチャでデータ を蓄積を行い、生成 AI によるデータ分析を実施していただきます。下記の実施手順を実施 します。 Databricks にログイン
GitHub からコードを取得 「00_config」ノートブックの実行 「01_medallion_architecture 」ノートブックの実行 「03_data_analysis_by_gen_ai」ノートブックの実行
1. Databricks にログイン Databricks にログインします。接続先 URL、および、接続情報は別途送付します。 続きは参加者のみです。