Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Databricks Lakehouse Federationで 運用負荷ゼロのデータ連携
Search
Kenji Matsuda
March 26, 2026
Technology
140
0
Share
Databricks Lakehouse Federationで 運用負荷ゼロのデータ連携
Kenji Matsuda
March 26, 2026
Other Decks in Technology
See All in Technology
TypeScriptとAngular Signal で実現する保守性の高いアプリケーション設計 - 3層アーキテクチャによる責務分離の実践(たつかわ) https://2026.tskaigi.org/talks/10
nealle
1
350
oracle-to-databricks-migration-with-llm-and-dbt
casek
0
160
DI コンテナ自動生成ツールを実装してみた / intro-autodi
uhzz
0
870
ルール・ロール・ツールを創る / Creating Rules, Roles and Tools
ks91
PRO
0
170
AIコーディングエージェントの活用で、コードは静かに肥大化した
yosukeshinoda
1
370
AIのために、AIを使った、Effect-TSからの脱却 〜テストを活用した安全なリファクタリングの進め方〜
bitkey
PRO
1
570
テストコードのないプロジェクトにテストを根付かせる
tttol
0
160
責任あるソフトウェアエンジニアリングの紹介4章・5章 / RSE_Ch4-5
ido_kara_deru
0
340
TSKaigi 2026 - 10秒のビルドを1秒へ:tsdownが切り拓く2026年のTypeScriptライブラリ開発
teamlab
PRO
2
270
まだ道半ば、AI-DLCを歩み始めている話
news_it_enj
2
190
シンデレラなんかになりたくない!ガラスの靴が割れた時代にどう歩く?
nomizone
0
190
食べログのサーキットブレーカー導入を振り返って
atpons
0
110
Featured
See All Featured
Groundhog Day: Seeking Process in Gaming for Health
codingconduct
0
190
Primal Persuasion: How to Engage the Brain for Learning That Lasts
tmiket
0
340
Utilizing Notion as your number one productivity tool
mfonobong
4
310
Marketing to machines
jonoalderson
1
5.3k
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
52
5.9k
Accessibility Awareness
sabderemane
1
130
Making the Leap to Tech Lead
cromwellryan
135
9.8k
What the history of the web can teach us about the future of AI
inesmontani
PRO
1
570
Understanding Cognitive Biases in Performance Measurement
bluesmoon
32
2.9k
Facilitating Awesome Meetings
lara
57
6.9k
HTML-Aware ERB: The Path to Reactive Rendering @ RubyCon 2026, Rimini, Italy
marcoroth
1
98
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
287
14k
Transcript
@IVRy Inc. All rights reserved. Databricks Lakehouse Federationで 運⽤負荷ゼロのデータ連携 株式会社IVRy
データエンジニア 松⽥ 健司 JEDAI Meetup! AIエージェント特集 - Lakebase連携からセキュリティまで
ヤフー株式会社(2014 - 2016) 新卒⼊社し、広告配信システムのDMP開発に従事。 株式会社カケハシ(2016 - 2025) 薬局向けSaaSのスタートアップに6⼈⽬として参画。 ソフトウェア開発を起点に、データエンジニア、 エンジニアリングマネージャーまで、事業の成⻑に
合わせて幅広く経験。 株式会社IVRy(2025) データエンジニアとして、データ基盤の構築に従事。 松⽥ 健司 Data Engineer @ken_3ba 2
IVRとAIであらゆる電話対応を効率化 「アイブリー」 3 プロダクト
IVRy Data Hub をリリース 4
5 オフィスの壁が拡張されました
@IVRy Inc. All rights reserved. 今⽇話すこと 6 https://zenn.dev/ivry/articles/databricks-lakehouse-federation-guide
@IVRy Inc. All rights reserved. アジェンダ 7 1. なぜ Lakehouse
Federation を導入したのか 2. 導入後の構成と View の自動作成の仕組み 3. ハマったポイント 4. まとめと今後
@IVRy Inc. All rights reserved. Lakehouse Federationとは? 8 外部データベースのデータをコピーせず に
Unity Catalog 経由で直接クエリできる機能 メリット • データコピー不要 → ETLジョブ・ストレージコスト削減 • リアルタイム参照 → ソースDBの最新データを直接参照 • Unity Catalog でガバナンス統一 → アクセス制御・リネージを一元管理 なぜ Lakehouse Federation を導⼊したのか
@IVRy Inc. All rights reserved. IVRyのデータアーキテクチャ 9 なぜ Lakehouse Federation
を導⼊したのか https://findy-tools.io/companies/ivry/90/76
@IVRy Inc. All rights reserved. 10 なぜ Lakehouse Federation を導⼊したのか
課題:テーブルが増えるたびに 人手が必要 な運用だった Created by Nano banana
@IVRy Inc. All rights reserved. アジェンダ 11 1. なぜ Lakehouse
Federation を導入したのか 2. 導入後のアーキテクチャと View の自動作成の仕組み 3. ハマったポイント 4. まとめと今後
@IVRy Inc. All rights reserved. 12 導⼊後のアーキテクチャとView の⾃動作成の仕組み 導入後のアーキテクチャ パフォーマンスを考慮し、大規模テーブルはdltHubによる差分更新を維持
@IVRy Inc. All rights reserved. 13 導⼊後のアーキテクチャとView の⾃動作成の仕組み Viewを自動作成・削除するテーブルの選定 作成と削除はDatabricks
SQLで、対象外はdbtで管理
@IVRy Inc. All rights reserved. アジェンダ 14 1. なぜ Lakehouse
Federation を導入したのか 2. 導入後の構成と View の自動作成の仕組み 3. ハマったポイント 4. まとめと今後
@IVRy Inc. All rights reserved. 15 ハマったポイント その1: NLB の
PrivateLink 設定 PrivateLink経由の通信はSGのチェックをスルーする必要があった https://docs.databricks.com/aws/en/security/network/serverless-networ k-security/pl-to-internal-network
@IVRy Inc. All rights reserved. 16 ハマったポイント その2: NCCの制約 ワークスペースが単一のNCCにしかバインドできなかったため、
全ワークスペースを 1つのNCCに統合する方針 で運用
@IVRy Inc. All rights reserved. 17 ハマったポイント その3: ServerlessとClassicで接続ルートが異なる 一部のジョブがClassicのままだったためFederationカタログを参照すると
エラーが発生した →ServerlessはPricateLink、ClassicはVPC Pering経由に! https://docs.databricks.com/aws/en/security/network/serverless-network-security/ pl-to-internal-network
@IVRy Inc. All rights reserved. アジェンダ 18 1. なぜ Lakehouse
Federation を導入したのか 2. 導入後の構成と View の自動作成の仕組み 3. ハマったポイント 4. まとめと今後
@IVRy Inc. All rights reserved. 19 まとめと今後 まとめ: 導入の成果 大規模テーブルと
PII テーブルは Federation から除外し、 安全かつパフォーマンスの良い構成に Before After テーブルの追加 Slack申請→手動対応 自動 データ鮮度 数時間に一度 リアルタイム コスト ジョブとストレージ ゼロ 運用負荷 ジョブ監視・障害対応 ほぼゼロ
@IVRy Inc. All rights reserved. 20 まとめと今後 今後 1. データ削除時の影響
◦ PostgreSQLのデータが削除されると後続のデータ利用に影響が出る問題 への対応 2. 大規模テーブルの対応 ◦ dltHubをLakeflow Connectを利用してCDC 更新へ移行し、 よりリアルタイムかつコスト削減した連携を目指す
@IVRy Inc. All rights reserved. we are hiring 21