Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Lakehouse×生成AI Databricksで体験する次世代データ分析ハンズオン 短縮版
Search
島村学
May 17, 2025
Technology
34
0
Share
Lakehouse×生成AI Databricksで体験する次世代データ分析ハンズオン 短縮版
SocioInfo#30「AIとデータ利活用とRAG」(自然言語処理,AI,RAG,データ分析他)時にて発表した資料の一部です。
島村学
May 17, 2025
More Decks by 島村学
See All by 島村学
Databricks で Iceberg を試してみた
shimamura
0
600
Databricks における Apache Iceberg の活用ポイント
shimamura
0
430
Other Decks in Technology
See All in Technology
ハーネスエンジニアリングをやりすぎた話 ~そのハーネスは解体された~
gotalab555
5
1.9k
Anthropic「Long-running a gents」をGeminiで再現してみた
tkikuchi
0
730
運用システムにおけるデータ活用とPlatform
sansantech
PRO
0
140
Good Enough Types: Heuristic Type Inference for Ruby
riseshia
1
380
AgentCore×VPCでの設計パターンn選と勘所
har1101
4
360
Chasing Real-Time Observability for CRuby
whitegreen
0
540
AI時代 に増える データ活用先
takahal
0
350
データ定義の混乱と戦う 〜 管理会計と財務会計 〜
wonohe
0
170
コミュニティ・勉強会を作るのは目的じゃない
ohmori_yusuke
0
280
Agents CLI と Gemini Enterprise Agent Platform で マルチエージェント開発が楽しくなる!
kaz1437
0
190
基盤を育てる 外部SaaS連携の運用
gamonges_dresscode
1
130
GitHub Copilot Dev Days
tomokusaba
0
110
Featured
See All Featured
Designing Experiences People Love
moore
143
24k
Scaling GitHub
holman
464
140k
The Limits of Empathy - UXLibs8
cassininazir
1
310
Beyond borders and beyond the search box: How to win the global "messy middle" with AI-driven SEO
davidcarrasco
3
120
Jess Joyce - The Pitfalls of Following Frameworks
techseoconnect
PRO
1
140
The agentic SEO stack - context over prompts
schlessera
0
760
Building AI with AI
inesmontani
PRO
1
930
Rebuilding a faster, lazier Slack
samanthasiow
85
9.5k
Six Lessons from altMBA
skipperchong
29
4.2k
Building a A Zero-Code AI SEO Workflow
portentint
PRO
0
470
How to Talk to Developers About Accessibility
jct
2
190
The AI Search Optimization Roadmap by Aleyda Solis
aleyda
1
5.7k
Transcript
SocioInfo#30 Lakehouse × 生成AI Databricksで体験する 次世代データ分析ハンズオン 島村 学
はじめに Lakehouse と 生成 AI というホットなテーマについてハンズオンを通して理解を深めていた だきます。 理論編としてデータ分析業界において注目されている Lakehouse と
Databricks に解 説します。 ハンズオンとして、 Databricks 上でメダリオンアーキテクチャにより Lakehouse の構築を 行い、 そのデータに対する生成 AI によるデータ分析を実施していただきます。
自己紹介 (1/2) Databricks Champion 認定者 データ分析システムにおける アーキテクト兼データエンジニア 株式会社ジール 島村 学
自己紹介 (2/2) DAMA のイベントにて登壇 IT 記事のブロガーです
理論編
Lakehouse とは (1/2) Lakehouse とは、 Data Lake と Data Warehouses
を組み合わせたデータ基盤アーキテクチャです。 オープンなフォーマットで低価格のストレージにデータを格納するなどの特徴があります。 出所:Lakehouse: A New Generation of Open Platforms that Unify Data Warehousing and Advanced Analytics
メダリオンアーキテクチャとは Lakehouse の普及とともに、メダリオンアーキテクチャというデータ設計パターンが注目されています。 ブロンズ (Bronze)・シルバー (Silver)・ゴールド (Gold)の3つのレイヤーを順次通過させることで、データの構造 と品質を段階的に向上させていく方法論であり、Lakehouse 構築時のベストプラクティスの1つです。 出所:メダリオンアーキテクチャ
(medallion architecture) | Databricks
1. Databricks にログイン Databricks にログインします。接続先 URL、および、接続情報は別途送付します。 続きは参加者のみです。
ハンズオンの実施に向けて
Microsoft 最近のクラウドサービスを利用するにはスマホなどで認証する方法がデフォルトの動作となっているため、 今回はお待ちのスマホで Microsoft Authenticator というアプリをダウンロードしてください。 iPhone 版 Android 版
ハンズオン
ハンズオン概要 Databricks のログインからはじめて、Databricks にてメダリオンアーキテクチャでデータ を蓄積を行い、生成 AI によるデータ分析を実施していただきます。下記の実施手順を実施 します。 Databricks にログイン
GitHub からコードを取得 「00_config」ノートブックの実行 「01_medallion_architecture 」ノートブックの実行 「03_data_analysis_by_gen_ai」ノートブックの実行
1. Databricks にログイン Databricks にログインします。接続先 URL、および、接続情報は別途送付します。 続きは参加者のみです。