Slide 1

Slide 1 text

Datastreamを使用したリアルタイム データストリーミングの紹介 株式会社ZOZO
 技術本部 MA部 MA開発ブロック
 
 佐久間 貴人 Copyright © ZOZO, Inc. 1

Slide 2

Slide 2 text

© ZOZO, Inc. 株式会社ZOZO 技術本部 MA部 MA開発ブロック 2023年12月中途入社 MAシステムの開発・運用を担当 好き:自転車、音楽、スケボー 佐久間 貴人 2

Slide 3

Slide 3 text

© ZOZO, Inc. 3 ● Datastreamとは ○ 変更データキャプチャ(CDC)とは ○ ユースケースの紹介 ● 事例紹介 ● その他のストリーミング系機能の紹介 ○ BigQuery continuous queries ○ Apache Kafka for BigQuery ● 今後試したいこと ● まとめ 本日話すこと 引用元:https://techblog.zozo.com/entry/google-cloud-next-2024

Slide 4

Slide 4 text

© ZOZO, Inc. 4 Datastreamとは

Slide 5

Slide 5 text

© ZOZO, Inc. 5 Datastreamとは サーバーレスで使いやすい変更データ キャプチャ(CDC)およびレプリケーション サービス データを確実に、かつ最小限のレイテンシで同期 ● BigQuery ● Cloud Storage ● Dataflow ○ Cloud SQL ○ Spanner ○ … Datastream ● MySQL ● PostgreSQL ● Oracle ● SQL Server(★) 引用元:https://cloud.google.com/datastream/docs/overview?hl=ja

Slide 6

Slide 6 text

© ZOZO, Inc. 6 変更データキャプチャ(CDC)とは ソースとなるデータで発生した変更(挿入・更新・削除)をリアルタイムで検出・キャプチャする技術 参考:https://www.integrate.io/jp/blog/what-is-change-data-capture-ja/ ● ログベース ○ パフォーマンスへの影響が最小限 ○ 包括的なデータキャプチャ ○ 効率 ● トリガーベース ○ リアルタイムのデータキャプチャ ○ 柔軟性

Slide 7

Slide 7 text

© ZOZO, Inc. 7 ユースケースの紹介

Slide 8

Slide 8 text

© ZOZO, Inc. 8 ユースケース ● データ複製 ● CQRSモデルの更新 ● 全文検索

Slide 9

Slide 9 text

© ZOZO, Inc. 9 ユースケース ● データ複製 ● CQRSモデルの更新 ● 全文検索

Slide 10

Slide 10 text

© ZOZO, Inc. 10 データ複製 引用元:https://cloud.google.com/sql/docs/mysql/replication

Slide 11

Slide 11 text

© ZOZO, Inc. 11 ユースケース ● データ複製 ● CQRSモデルの更新 ● 全文検索

Slide 12

Slide 12 text

© ZOZO, Inc. 12 CQRSモデルの更新 引用元:https://techblog.zozo.com/entry/implementation-of-cqrs-using-outbox-and-cdc-with-dynamodb

Slide 13

Slide 13 text

© ZOZO, Inc. 13 ユースケース ● データ複製 ● CQRSモデルの更新 ● 全文検索

Slide 14

Slide 14 text

© ZOZO, Inc. 14 全文検索 引用元:https://techblog.zozo.com/entry/migrating-zozotown-search-platform ZOZOTOWNの検索基盤における Elasticsearch移行で得た知見

Slide 15

Slide 15 text

© ZOZO, Inc. 15 事例紹介

Slide 16

Slide 16 text

© ZOZO, Inc. 16 引用元:https://assets.swoogo.com/uploads/3815612-661fdf0a5b993.pdf p.021

Slide 17

Slide 17 text

© ZOZO, Inc. 17 引用元:https://assets.swoogo.com/uploads/3815612-661fdf0a5b993.pdf p.022

Slide 18

Slide 18 text

© ZOZO, Inc. 18 ZOZOでのDatastream利用例 ● AWS Aurora MySQLからBigQueryにレプリケーション ZOZO データセンター Datastream BigQuery Aurora MySQL 参考:https://qiita.com/shiozaki/items/ff088ee14e55ca575100

Slide 19

Slide 19 text

© ZOZO, Inc. 19 その他ストリーミング系 機能の紹介

Slide 20

Slide 20 text

© ZOZO, Inc. 20 BigQuery continuous queries 引用元:https://assets.swoogo.com/uploads/3782565-661824fc35037.pdf p.019

Slide 21

Slide 21 text

© ZOZO, Inc. 21 Apache Kafka for BigQuery ● BigQueryと容易に統合可能なマネージドのApache Kafkaがプレビュー 参考:https://cloud.google.com/products/apache-kafka-for-bigquery Apache Kafka BigQuery

Slide 22

Slide 22 text

© ZOZO, Inc. 22 今後試したいこと

Slide 23

Slide 23 text

© ZOZO, Inc. 23 RTM(リアルタイムマーケティング) ● 顧客一人ひとりにパーソナライズしたコンテンツをリアルタイム配信 引用元:リアルタイムマーケティングシステムの紹介とそのリプレイス計画: https://techblog.zozo.com/entry/real-time-marketing-system 参考:全社共通データ基盤を廃止して新しいデータ基盤に引越した話:https://techblog.zozo.com/entry/data-infrastructure-replacement

Slide 24

Slide 24 text

© ZOZO, Inc. 24 Realtime-datapump ● BigQueryの変更データをキャプチャし、リアルタイムにデータを処理 引用元:マーケティングオートメーションシステムを支えるリアルタイムデータ連携基盤をリプレイスした話: https://techblog.zozo.com/entry/ma-realtime-data-infrastructure-replacement マーケティングオートメーションシステムを支えるリアルタイム データ連携基盤をリプレイスした話 Google Kubernetes Engine BigQuery continuous queries

Slide 25

Slide 25 text

© ZOZO, Inc. 25 まとめ

Slide 26

Slide 26 text

© ZOZO, Inc. 26 まとめ ● BigQueryがますます強力になっている ○ continuous queriesすごそう

Slide 27

Slide 27 text

© ZOZO, Inc. 27 まとめ ● BigQueryがますます強力になっている ○ continuous queriesすごそう ● 運用DBをBigQueryに複製したいニーズが多そう ○ そのための仕組みにDatastreamが便利 ○ Apache Kafka for BigQueryにも期待

Slide 28

Slide 28 text

No content