Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Databricks Lakehouse Federationで 運用負荷ゼロのデータ連携
Search
Kenji Matsuda
March 26, 2026
Technology
150
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
Databricks Lakehouse Federationで 運用負荷ゼロのデータ連携
Kenji Matsuda
March 26, 2026
Other Decks in Technology
See All in Technology
2026 AI Memory Architecture
nagatsu
0
580
UIパーツの設計を「型」から読み解く 〜TSKaigiのセッションから得た学び〜
yud0uhu
0
100
Microsoft のサポートとフィードバック総まとめ
murachiakira
PRO
0
120
toB プロダクトから見たWAF
tokai235
0
250
Flow 不死:AI 時代 DevOps 的不變本質
cheng_wei_chen
2
550
千葉での単身赴任からAWSをやり続け、千葉に戻ってきた話
yama3133
1
120
AIチャットの改善から見えた、良いAI体験とは / What Constitutes a Good AI Experience: Insights from Improving AI Chat
kubode
0
130
いまさら聞けない「仕様駆動開発入門」 〜AI活用時代の開発プロセスを考える〜
findy_eventslides
2
230
#エンジニアBooks 30分でわかる 「技術記事を書く技術」 / engineer-books 2026-06-30
jnchito
1
130
AIAU_UMEMOGU_ninomiya_slide
ninomiya_ii
0
280
初めてのDatabricks勉強会
taka_aki
2
190
そこにあるから地図ができる~位置を示す"モノ"を愉しむ~ - Interface 2026年6月号GPS特集オフ会 / interface_202606_GPS_offline
sakaik
1
120
Featured
See All Featured
Mobile First: as difficult as doing things right
swwweet
225
10k
A designer walks into a library…
pauljervisheath
211
24k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
35
3.5k
Building Adaptive Systems
keathley
44
3.1k
Information Architects: The Missing Link in Design Systems
soysaucechin
0
980
Color Theory Basics | Prateek | Gurzu
gurzu
0
370
How to train your dragon (web standard)
notwaldorf
97
6.7k
Chrome DevTools: State of the Union 2024 - Debugging React & Beyond
addyosmani
10
1.2k
Principles of Awesome APIs and How to Build Them.
keavy
128
18k
Building a Modern Day E-commerce SEO Strategy
aleyda
45
9.1k
Fashionably flexible responsive web design (full day workshop)
malarkey
408
66k
Chasing Engaging Ingredients in Design
codingconduct
0
230
Transcript
@IVRy Inc. All rights reserved. Databricks Lakehouse Federationで 運⽤負荷ゼロのデータ連携 株式会社IVRy
データエンジニア 松⽥ 健司 JEDAI Meetup! AIエージェント特集 - Lakebase連携からセキュリティまで
ヤフー株式会社(2014 - 2016) 新卒⼊社し、広告配信システムのDMP開発に従事。 株式会社カケハシ(2016 - 2025) 薬局向けSaaSのスタートアップに6⼈⽬として参画。 ソフトウェア開発を起点に、データエンジニア、 エンジニアリングマネージャーまで、事業の成⻑に
合わせて幅広く経験。 株式会社IVRy(2025) データエンジニアとして、データ基盤の構築に従事。 松⽥ 健司 Data Engineer @ken_3ba 2
IVRとAIであらゆる電話対応を効率化 「アイブリー」 3 プロダクト
IVRy Data Hub をリリース 4
5 オフィスの壁が拡張されました
@IVRy Inc. All rights reserved. 今⽇話すこと 6 https://zenn.dev/ivry/articles/databricks-lakehouse-federation-guide
@IVRy Inc. All rights reserved. アジェンダ 7 1. なぜ Lakehouse
Federation を導入したのか 2. 導入後の構成と View の自動作成の仕組み 3. ハマったポイント 4. まとめと今後
@IVRy Inc. All rights reserved. Lakehouse Federationとは? 8 外部データベースのデータをコピーせず に
Unity Catalog 経由で直接クエリできる機能 メリット • データコピー不要 → ETLジョブ・ストレージコスト削減 • リアルタイム参照 → ソースDBの最新データを直接参照 • Unity Catalog でガバナンス統一 → アクセス制御・リネージを一元管理 なぜ Lakehouse Federation を導⼊したのか
@IVRy Inc. All rights reserved. IVRyのデータアーキテクチャ 9 なぜ Lakehouse Federation
を導⼊したのか https://findy-tools.io/companies/ivry/90/76
@IVRy Inc. All rights reserved. 10 なぜ Lakehouse Federation を導⼊したのか
課題:テーブルが増えるたびに 人手が必要 な運用だった Created by Nano banana
@IVRy Inc. All rights reserved. アジェンダ 11 1. なぜ Lakehouse
Federation を導入したのか 2. 導入後のアーキテクチャと View の自動作成の仕組み 3. ハマったポイント 4. まとめと今後
@IVRy Inc. All rights reserved. 12 導⼊後のアーキテクチャとView の⾃動作成の仕組み 導入後のアーキテクチャ パフォーマンスを考慮し、大規模テーブルはdltHubによる差分更新を維持
@IVRy Inc. All rights reserved. 13 導⼊後のアーキテクチャとView の⾃動作成の仕組み Viewを自動作成・削除するテーブルの選定 作成と削除はDatabricks
SQLで、対象外はdbtで管理
@IVRy Inc. All rights reserved. アジェンダ 14 1. なぜ Lakehouse
Federation を導入したのか 2. 導入後の構成と View の自動作成の仕組み 3. ハマったポイント 4. まとめと今後
@IVRy Inc. All rights reserved. 15 ハマったポイント その1: NLB の
PrivateLink 設定 PrivateLink経由の通信はSGのチェックをスルーする必要があった https://docs.databricks.com/aws/en/security/network/serverless-networ k-security/pl-to-internal-network
@IVRy Inc. All rights reserved. 16 ハマったポイント その2: NCCの制約 ワークスペースが単一のNCCにしかバインドできなかったため、
全ワークスペースを 1つのNCCに統合する方針 で運用
@IVRy Inc. All rights reserved. 17 ハマったポイント その3: ServerlessとClassicで接続ルートが異なる 一部のジョブがClassicのままだったためFederationカタログを参照すると
エラーが発生した →ServerlessはPricateLink、ClassicはVPC Pering経由に! https://docs.databricks.com/aws/en/security/network/serverless-network-security/ pl-to-internal-network
@IVRy Inc. All rights reserved. アジェンダ 18 1. なぜ Lakehouse
Federation を導入したのか 2. 導入後の構成と View の自動作成の仕組み 3. ハマったポイント 4. まとめと今後
@IVRy Inc. All rights reserved. 19 まとめと今後 まとめ: 導入の成果 大規模テーブルと
PII テーブルは Federation から除外し、 安全かつパフォーマンスの良い構成に Before After テーブルの追加 Slack申請→手動対応 自動 データ鮮度 数時間に一度 リアルタイム コスト ジョブとストレージ ゼロ 運用負荷 ジョブ監視・障害対応 ほぼゼロ
@IVRy Inc. All rights reserved. 20 まとめと今後 今後 1. データ削除時の影響
◦ PostgreSQLのデータが削除されると後続のデータ利用に影響が出る問題 への対応 2. 大規模テーブルの対応 ◦ dltHubをLakeflow Connectを利用してCDC 更新へ移行し、 よりリアルタイムかつコスト削減した連携を目指す
@IVRy Inc. All rights reserved. we are hiring 21