Upgrade to PRO for Only $50/Year—Limited-Time Offer! 🔥
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Lakehouse×生成AI Databricksで体験する次世代データ分析ハンズオン 短縮版
Search
島村学
May 17, 2025
Technology
0
24
Lakehouse×生成AI Databricksで体験する次世代データ分析ハンズオン 短縮版
SocioInfo#30「AIとデータ利活用とRAG」(自然言語処理,AI,RAG,データ分析他)時にて発表した資料の一部です。
島村学
May 17, 2025
Tweet
Share
More Decks by 島村学
See All by 島村学
Databricks で Iceberg を試してみた
shimamura
0
520
Databricks における Apache Iceberg の活用ポイント
shimamura
0
340
Other Decks in Technology
See All in Technology
Lambdaの常識はどう変わる?!re:Invent 2025 before after
iwatatomoya
1
490
今からでも間に合う!速習Devin入門とその活用方法
ismk
1
700
mairuでつくるクレデンシャルレス開発環境 / Credential-less development environment using Mailru
mirakui
4
400
新 Security HubがついにGA!仕組みや料金を深堀り #AWSreInvent #regrowth / AWS Security Hub Advanced GA
masahirokawahara
1
1.9k
生成AI時代におけるグローバル戦略思考
taka_aki
0
180
AWSセキュリティアップデートとAWSを育てる話
cmusudakeisuke
0
270
MLflowで始めるプロンプト管理、評価、最適化
databricksjapan
1
210
【AWS re:Invent 2025速報】AIビルダー向けアップデートをまとめて解説!
minorun365
4
520
[デモです] NotebookLM で作ったスライドの例
kongmingstrap
0
140
Sansanが実践する Platform EngineeringとSREの協創
sansantech
PRO
2
850
エンジニアリングをやめたくないので問い続ける
estie
2
1.2k
20251209_WAKECareer_生成AIを活用した設計・開発プロセス
syobochim
7
1.5k
Featured
See All Featured
Connecting the Dots Between Site Speed, User Experience & Your Business [WebExpo 2025]
tammyeverts
10
730
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
25
1.6k
Fantastic passwords and where to find them - at NoRuKo
philnash
52
3.5k
Being A Developer After 40
akosma
91
590k
The Cult of Friendly URLs
andyhume
79
6.7k
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
46
2.6k
Building Adaptive Systems
keathley
44
2.9k
Keith and Marios Guide to Fast Websites
keithpitt
413
23k
How To Stay Up To Date on Web Technology
chriscoyier
791
250k
The Invisible Side of Design
smashingmag
302
51k
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
37
2.6k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
285
14k
Transcript
SocioInfo#30 Lakehouse × 生成AI Databricksで体験する 次世代データ分析ハンズオン 島村 学
はじめに Lakehouse と 生成 AI というホットなテーマについてハンズオンを通して理解を深めていた だきます。 理論編としてデータ分析業界において注目されている Lakehouse と
Databricks に解 説します。 ハンズオンとして、 Databricks 上でメダリオンアーキテクチャにより Lakehouse の構築を 行い、 そのデータに対する生成 AI によるデータ分析を実施していただきます。
自己紹介 (1/2) Databricks Champion 認定者 データ分析システムにおける アーキテクト兼データエンジニア 株式会社ジール 島村 学
自己紹介 (2/2) DAMA のイベントにて登壇 IT 記事のブロガーです
理論編
Lakehouse とは (1/2) Lakehouse とは、 Data Lake と Data Warehouses
を組み合わせたデータ基盤アーキテクチャです。 オープンなフォーマットで低価格のストレージにデータを格納するなどの特徴があります。 出所:Lakehouse: A New Generation of Open Platforms that Unify Data Warehousing and Advanced Analytics
メダリオンアーキテクチャとは Lakehouse の普及とともに、メダリオンアーキテクチャというデータ設計パターンが注目されています。 ブロンズ (Bronze)・シルバー (Silver)・ゴールド (Gold)の3つのレイヤーを順次通過させることで、データの構造 と品質を段階的に向上させていく方法論であり、Lakehouse 構築時のベストプラクティスの1つです。 出所:メダリオンアーキテクチャ
(medallion architecture) | Databricks
1. Databricks にログイン Databricks にログインします。接続先 URL、および、接続情報は別途送付します。 続きは参加者のみです。
ハンズオンの実施に向けて
Microsoft 最近のクラウドサービスを利用するにはスマホなどで認証する方法がデフォルトの動作となっているため、 今回はお待ちのスマホで Microsoft Authenticator というアプリをダウンロードしてください。 iPhone 版 Android 版
ハンズオン
ハンズオン概要 Databricks のログインからはじめて、Databricks にてメダリオンアーキテクチャでデータ を蓄積を行い、生成 AI によるデータ分析を実施していただきます。下記の実施手順を実施 します。 Databricks にログイン
GitHub からコードを取得 「00_config」ノートブックの実行 「01_medallion_architecture 」ノートブックの実行 「03_data_analysis_by_gen_ai」ノートブックの実行
1. Databricks にログイン Databricks にログインします。接続先 URL、および、接続情報は別途送付します。 続きは参加者のみです。