Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Databricks Lakehouse Federationで 運用負荷ゼロのデータ連携
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Kenji Matsuda
March 26, 2026
Technology
150
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
Databricks Lakehouse Federationで 運用負荷ゼロのデータ連携
Kenji Matsuda
March 26, 2026
Other Decks in Technology
See All in Technology
toB プロダクトから見たWAF
tokai235
0
250
5分でわかる Amazon Connect_20260608
hwangbyeonghun
0
130
秘密度ラベル初心者が第1歩でつまづかないための「設計・運用」ポイント
seafay
PRO
1
510
フルAIで個人開発して学んだあれこれ / yuruai vol.1
isaoshimizu
0
150
技術・能力を向上する原理原則 #きのこセッションa #きのこ2026
bash0c7
0
140
AI-DLCを “そのまま導入しなかった”話 ~組織に合わせてアジャストした 私たちの実践共有~
hiroramos4
PRO
1
440
AI 不只幫你寫 Code: 當專案從 300 暴增到 1500, 我們如何撐住 DevOps
appleboy
0
280
打造你的 AI 工作流:Agent Skill + MCP 實戰工作坊
appleboy
0
160
GitHub Copilot運用のリアル ~AI Credit時代にどう向き合うか~
takafumisu2uk1
0
490
「ビジネスがわかるエンジニア」とは何か?
ryooob
0
350
週末にループ・エンジニアリングの理解を深めるためのスライド
nagatsu
0
590
作る力から、見極める力へ — AI時代に広がるエンジニアの価値と役割
rince
0
360
Featured
See All Featured
The Curious Case for Waylosing
cassininazir
1
400
The Impact of AI in SEO - AI Overviews June 2024 Edition
aleyda
5
1.1k
B2B Lead Gen: Tactics, Traps & Triumph
marketingsoph
0
160
Testing 201, or: Great Expectations
jmmastey
46
8.2k
Amusing Abliteration
ianozsvald
1
210
Information Architects: The Missing Link in Design Systems
soysaucechin
0
980
Marketing to machines
jonoalderson
1
5.5k
Leadership Guide Workshop - DevTernity 2021
reverentgeek
1
310
16th Malabo Montpellier Forum Presentation
akademiya2063
PRO
0
150
Tips & Tricks on How to Get Your First Job In Tech
honzajavorek
1
550
Being A Developer After 40
akosma
91
590k
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
37
6.5k
Transcript
@IVRy Inc. All rights reserved. Databricks Lakehouse Federationで 運⽤負荷ゼロのデータ連携 株式会社IVRy
データエンジニア 松⽥ 健司 JEDAI Meetup! AIエージェント特集 - Lakebase連携からセキュリティまで
ヤフー株式会社(2014 - 2016) 新卒⼊社し、広告配信システムのDMP開発に従事。 株式会社カケハシ(2016 - 2025) 薬局向けSaaSのスタートアップに6⼈⽬として参画。 ソフトウェア開発を起点に、データエンジニア、 エンジニアリングマネージャーまで、事業の成⻑に
合わせて幅広く経験。 株式会社IVRy(2025) データエンジニアとして、データ基盤の構築に従事。 松⽥ 健司 Data Engineer @ken_3ba 2
IVRとAIであらゆる電話対応を効率化 「アイブリー」 3 プロダクト
IVRy Data Hub をリリース 4
5 オフィスの壁が拡張されました
@IVRy Inc. All rights reserved. 今⽇話すこと 6 https://zenn.dev/ivry/articles/databricks-lakehouse-federation-guide
@IVRy Inc. All rights reserved. アジェンダ 7 1. なぜ Lakehouse
Federation を導入したのか 2. 導入後の構成と View の自動作成の仕組み 3. ハマったポイント 4. まとめと今後
@IVRy Inc. All rights reserved. Lakehouse Federationとは? 8 外部データベースのデータをコピーせず に
Unity Catalog 経由で直接クエリできる機能 メリット • データコピー不要 → ETLジョブ・ストレージコスト削減 • リアルタイム参照 → ソースDBの最新データを直接参照 • Unity Catalog でガバナンス統一 → アクセス制御・リネージを一元管理 なぜ Lakehouse Federation を導⼊したのか
@IVRy Inc. All rights reserved. IVRyのデータアーキテクチャ 9 なぜ Lakehouse Federation
を導⼊したのか https://findy-tools.io/companies/ivry/90/76
@IVRy Inc. All rights reserved. 10 なぜ Lakehouse Federation を導⼊したのか
課題:テーブルが増えるたびに 人手が必要 な運用だった Created by Nano banana
@IVRy Inc. All rights reserved. アジェンダ 11 1. なぜ Lakehouse
Federation を導入したのか 2. 導入後のアーキテクチャと View の自動作成の仕組み 3. ハマったポイント 4. まとめと今後
@IVRy Inc. All rights reserved. 12 導⼊後のアーキテクチャとView の⾃動作成の仕組み 導入後のアーキテクチャ パフォーマンスを考慮し、大規模テーブルはdltHubによる差分更新を維持
@IVRy Inc. All rights reserved. 13 導⼊後のアーキテクチャとView の⾃動作成の仕組み Viewを自動作成・削除するテーブルの選定 作成と削除はDatabricks
SQLで、対象外はdbtで管理
@IVRy Inc. All rights reserved. アジェンダ 14 1. なぜ Lakehouse
Federation を導入したのか 2. 導入後の構成と View の自動作成の仕組み 3. ハマったポイント 4. まとめと今後
@IVRy Inc. All rights reserved. 15 ハマったポイント その1: NLB の
PrivateLink 設定 PrivateLink経由の通信はSGのチェックをスルーする必要があった https://docs.databricks.com/aws/en/security/network/serverless-networ k-security/pl-to-internal-network
@IVRy Inc. All rights reserved. 16 ハマったポイント その2: NCCの制約 ワークスペースが単一のNCCにしかバインドできなかったため、
全ワークスペースを 1つのNCCに統合する方針 で運用
@IVRy Inc. All rights reserved. 17 ハマったポイント その3: ServerlessとClassicで接続ルートが異なる 一部のジョブがClassicのままだったためFederationカタログを参照すると
エラーが発生した →ServerlessはPricateLink、ClassicはVPC Pering経由に! https://docs.databricks.com/aws/en/security/network/serverless-network-security/ pl-to-internal-network
@IVRy Inc. All rights reserved. アジェンダ 18 1. なぜ Lakehouse
Federation を導入したのか 2. 導入後の構成と View の自動作成の仕組み 3. ハマったポイント 4. まとめと今後
@IVRy Inc. All rights reserved. 19 まとめと今後 まとめ: 導入の成果 大規模テーブルと
PII テーブルは Federation から除外し、 安全かつパフォーマンスの良い構成に Before After テーブルの追加 Slack申請→手動対応 自動 データ鮮度 数時間に一度 リアルタイム コスト ジョブとストレージ ゼロ 運用負荷 ジョブ監視・障害対応 ほぼゼロ
@IVRy Inc. All rights reserved. 20 まとめと今後 今後 1. データ削除時の影響
◦ PostgreSQLのデータが削除されると後続のデータ利用に影響が出る問題 への対応 2. 大規模テーブルの対応 ◦ dltHubをLakeflow Connectを利用してCDC 更新へ移行し、 よりリアルタイムかつコスト削減した連携を目指す
@IVRy Inc. All rights reserved. we are hiring 21