Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Lakehouse×生成AI Databricksで体験する次世代データ分析ハンズオン 短縮版
Search
Sponsored
·
SiteGround - Reliable hosting with speed, security, and support you can count on.
→
島村学
May 17, 2025
Technology
0
26
Lakehouse×生成AI Databricksで体験する次世代データ分析ハンズオン 短縮版
SocioInfo#30「AIとデータ利活用とRAG」(自然言語処理,AI,RAG,データ分析他)時にて発表した資料の一部です。
島村学
May 17, 2025
Tweet
Share
More Decks by 島村学
See All by 島村学
Databricks で Iceberg を試してみた
shimamura
0
540
Databricks における Apache Iceberg の活用ポイント
shimamura
0
380
Other Decks in Technology
See All in Technology
Webhook best practices for rock solid and resilient deployments
glaforge
2
310
インフラエンジニア必見!Kubernetesを用いたクラウドネイティブ設計ポイント大全
daitak
1
390
コスト削減から「セキュリティと利便性」を担うプラットフォームへ
sansantech
PRO
3
1.6k
ECS障害を例に学ぶ、インシデント対応に備えたAIエージェントの育て方 / How to develop AI agents for incident response with ECS outage
iselegant
4
460
Context Engineeringが企業で不可欠になる理由
hirosatogamo
PRO
3
680
プロポーザルに込める段取り八分
shoheimitani
1
670
Ruby版 JSXのRuxが気になる
sansantech
PRO
0
170
30万人の同時アクセスに耐えたい!新サービスの盤石なリリースを支える負荷試験 / SRE Kaigi 2026
genda
4
1.4k
OpenShiftでllm-dを動かそう!
jpishikawa
0
140
AIエージェントを開発しよう!-AgentCore活用の勘所-
yukiogawa
0
190
M&A 後の統合をどう進めるか ─ ナレッジワーク × Poetics が実践した組織とシステムの融合
kworkdev
PRO
1
520
猫でもわかるKiro CLI(セキュリティ編)
kentapapa
0
130
Featured
See All Featured
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
38
2.7k
Product Roadmaps are Hard
iamctodd
PRO
55
12k
DBのスキルで生き残る技術 - AI時代におけるテーブル設計の勘所
soudai
PRO
62
50k
A designer walks into a library…
pauljervisheath
210
24k
Leveraging Curiosity to Care for An Aging Population
cassininazir
1
170
Making Projects Easy
brettharned
120
6.6k
Lessons Learnt from Crawling 1000+ Websites
charlesmeaden
PRO
1
1.1k
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
31
2.7k
How to Ace a Technical Interview
jacobian
281
24k
Optimizing for Happiness
mojombo
379
71k
From Legacy to Launchpad: Building Startup-Ready Communities
dugsong
0
140
WENDY [Excerpt]
tessaabrams
9
36k
Transcript
SocioInfo#30 Lakehouse × 生成AI Databricksで体験する 次世代データ分析ハンズオン 島村 学
はじめに Lakehouse と 生成 AI というホットなテーマについてハンズオンを通して理解を深めていた だきます。 理論編としてデータ分析業界において注目されている Lakehouse と
Databricks に解 説します。 ハンズオンとして、 Databricks 上でメダリオンアーキテクチャにより Lakehouse の構築を 行い、 そのデータに対する生成 AI によるデータ分析を実施していただきます。
自己紹介 (1/2) Databricks Champion 認定者 データ分析システムにおける アーキテクト兼データエンジニア 株式会社ジール 島村 学
自己紹介 (2/2) DAMA のイベントにて登壇 IT 記事のブロガーです
理論編
Lakehouse とは (1/2) Lakehouse とは、 Data Lake と Data Warehouses
を組み合わせたデータ基盤アーキテクチャです。 オープンなフォーマットで低価格のストレージにデータを格納するなどの特徴があります。 出所:Lakehouse: A New Generation of Open Platforms that Unify Data Warehousing and Advanced Analytics
メダリオンアーキテクチャとは Lakehouse の普及とともに、メダリオンアーキテクチャというデータ設計パターンが注目されています。 ブロンズ (Bronze)・シルバー (Silver)・ゴールド (Gold)の3つのレイヤーを順次通過させることで、データの構造 と品質を段階的に向上させていく方法論であり、Lakehouse 構築時のベストプラクティスの1つです。 出所:メダリオンアーキテクチャ
(medallion architecture) | Databricks
1. Databricks にログイン Databricks にログインします。接続先 URL、および、接続情報は別途送付します。 続きは参加者のみです。
ハンズオンの実施に向けて
Microsoft 最近のクラウドサービスを利用するにはスマホなどで認証する方法がデフォルトの動作となっているため、 今回はお待ちのスマホで Microsoft Authenticator というアプリをダウンロードしてください。 iPhone 版 Android 版
ハンズオン
ハンズオン概要 Databricks のログインからはじめて、Databricks にてメダリオンアーキテクチャでデータ を蓄積を行い、生成 AI によるデータ分析を実施していただきます。下記の実施手順を実施 します。 Databricks にログイン
GitHub からコードを取得 「00_config」ノートブックの実行 「01_medallion_architecture 」ノートブックの実行 「03_data_analysis_by_gen_ai」ノートブックの実行
1. Databricks にログイン Databricks にログインします。接続先 URL、および、接続情報は別途送付します。 続きは参加者のみです。