クラウドDWH を活⽤したデータ基盤の構築が進む中、オンプレミスの業務データをいかに効率よく連携するかが重要な課題となっています。その中でも、ログベースのChange Data Capture(CDC)による差分抽出は広く知られている⼿法ですが、RDBMS ごとにログの仕様や取得⽅法が異なるため、実装や運⽤には⼯夫が求められる場⾯も少なくありません。
さらに、抽出したデータをクラウドDWH にどう送るかという転送アーキテクチャの構成も重要な要素です。⼤量データや⾼頻度更新に対応するには、各DWH の特性を踏まえた運⽤⽅法や転送の仕組みに⼯夫が必要になります。
本セッションでは、RDB 別CDC 実装/運⽤のポイントと課題、およびデータパイプラインツールの「CData Sync」を活⽤したクラウドDWH への効率的なデータ転送⼿法を解説します。