Apache_Kafka_and_Modernization.pdf

YugabyteDB Japan Hour #5 Apache Kafka® and Modernization - How
Old Data Meets New Data Shinichi Hashitani, Solutions Engineer, Oct. 2022. #YugabyteDB #Conﬂuent

Modernization Approaches #YugabyteDB #Conﬂuent

@ShinHashitani | developer.confluent.io #1 New Apps - Microservices Independent Scalability
コンポーネント単位でデプロイ& スケール可能。アプリケーションの成長に応じて個々が独自のライフサイクルによってサービスを管理。個々のスケールが可能 - ボトルネックとなる局所のみの増強により全体スループットを向上。 Cascading Failure (連鎖障害) あるサービスが応答出来なくなると、そのサービスにリクエストするサービスが応答不能となる。1サービスの障害、高負荷による反応速度低下が全体的な停止 /パフォーマンス低下に繋がる。 Data Consistency サービス毎に独立したデータストアを持つ - 異なるサービス間でデータ整合性を保つ必要がある。2PCやSagaの様なパターンではデータ同期コストが高く処理も複雑になる。スケールしにくい。

@ShinHashitani | developer.confluent.io #2 CQRS CQRS Command Query Responsibility Segregation
- CRUD (Command) と検索 (Query) の役割とデータストアを分離するアプローチ。既存システムへの影響を抑えつつ、ボトルネックになりがちな検索機能を別のサービスとして切り離す。 Change Data Capture データベースの更新を抽出/イベント化し連携することで、別データストア間のデータ整合性を非同期に保つ手法。更新イベントは漏れなく、順序通り連携する必要がある。 Command Query

@ShinHashitani | developer.confluent.io #3 Monolith Decomposition (Stranglar) 段階的オフロードアプリの機能性は損なわず、基幹系の主機能以外を部分的に分離。
ドメイン毎に独立したサービスとして切り出す。基幹系の延命 or リプレースアドオンや付随する別ドメインの機能を全て切り離すことにより基幹系自体の更新が容易になる。場合によっては最後に残ったコアも新規のサービスでリプレースする。

How Do You Keep Data Consistency Across?

Kafka and Data Consistency #YugabyteDB #Conﬂuent

@ShinHashitani | developer.confluent.io Event, Total Order, and Data Consistency “Streams
and Tables in Apache Kafka: A Primer”, Michael Noll, Conﬂuent Blog. チェスの一手一手とチェス盤の状態は同じデータの異なる表現方法。 • チェス盤はある特定時点での完全な状態 (State) を表現できる。 • チェスの一手一手を漏れなく順序通り適用すればチェス盤の状態を再現できる。

@ShinHashitani | developer.confluent.io How Database Works fsync buffer load 処理は全てメモリ上でなされる。
処理に必要なデータはメモリに読み込まれる。処理後更新されたデータは定期的にストレージと同期される。処理はログとして記録される。障害発生時、ストレージへの同期が未完の処理を漏れなく順序通り実行することでデータを復元する。

@ShinHashitani | developer.confluent.io How Kafka Works customer login: abc order
confirmed: #001 order updated: #002 customer login: efg order canceled: #003 package received: #a01 at dist center: #b02 left dist center: #a02 delivered: #a01 customer C: 0001 order U: 0003 payment U: 0002 payment C: 0003 customer U: 0002 store-order order conﬁrmed: #001 order updated: #002 order canceled: #003 store-customer customer login: abc customer login: efg logistic package received: #a01 left dist center: #a02 delivered: #a01 at dist center: #b02 orderdb-c customer C: 0001 customer U: 0002 orderdb-o order U: 0003 orderdb-p payment C: 0003 payment U: 0002

@ShinHashitani | developer.confluent.io How Kafka Stores Data イベントはトランザクションログとして保存イベントはログとして永続化され、同じイベントを何度でも読み込み処理する事が可能。Pullモデ
ルでもある為、イベントを漏れなく順序通り高速に連携出来る仕組みとなっている。 customer login order conﬁrmed order updated customer logout order canceled Append-Only Immutable 1 2 3 4 5 6 8 7 10 9 11 12 1 2 3 4 5 6 8 7 Old New

@ShinHashitani | developer.confluent.io Kafka Connect - あらゆるSource/Sinkと繋げる Oracle SQL Server
DB2 Elastic Yugabyte Kafka Connect API Kafka Pipeline Connector Connector Connector Connector Connector Connector Sources Sinks S3 Kafka標準の接続API 様々なデータストアと接続し、差分更新の取得とトラッキングを標準化した仕様。どの Source/Sinkとも一貫した方法で接続できる。実装であるConnectorは接続情報を設定するだけで利用可能 - 更新情報がKafkaにデータとして渡る or データをターゲットに更新する。

@ShinHashitani | developer.confluent.io ksqlDB - リアルタイム処理 with SQL Kafka Storage
Capture events, launch connectors Perform continuous transformations (aggregate, ﬁlter, join) Create materialized views Serve lookups against materialized views Transform Filter Join Aggregate Window Query End-to-Endのリアルタイムデータフローを SQLで実現 ksqlDB Compute Introduction to ksqlDB

@ShinHashitani | developer.confluent.io Old Data Meets New Data Platform Destination
Systems Source Systems Oracle Database CDC Connector PostgreSQL Extract Load Transform Schema Registry ksqlDB Security Governance Resiliency 様々なデータソースから Kafka Connectを利用して Kafkaにリアルタイムイベントとして転送 1 2 3 ストリームとして流れているデータに対してksqlDBによってリアルタイムに加工加工を終えたストリームを Kafka Connectを利用してタイムリーにシンクにフィード

Kafka and YugabyteDB #YugabyteDB #Conﬂuent

@ShinHashitani | developer.confluent.io How and When to Consume Data Oracle
Database Old Data to New Platform Clickstream Edge/IoT Real-Time Processing Data as a Product Data Analytics ACID Transaction Massive Recordset Real-Time Alert Master Data Mgmt Fraud Detection User Interaction Inventory Financial Transactions Source of Truth どこでデータを消費するのか？時系列データの即時集計、不正検知、ユーザーエンドポイントとの通信等、データの鮮度とリアルタイム性が高い処理はKafka/ksqlDBによる処理が向いている。しかしユースケースの多くはSource of Truthに関わるトランザクション処理。ここではYugabyteの様な堅牢かつ可用性の高いストレージが重要な役割を果たす。誰がデータを消費するのか？リアルタイム処理の作法には慣れと異なる経験値が必要。開発者が求めるデータアクセスはリレーショナルモデルが一般的。より多くの開発者がデータを利用するためには、彼らに馴染みのあるYugabyteの方がリーチを広げやすい。

@ShinHashitani | developer.confluent.io Central Nervous System and New Source of
Truth Old Source of Truth Oracle Database New Source of Truth New Data Real-Time Alert Fraud Detection User Interaction Master Data Mgmt Inventory Financial Transactions Central Nervous System あらゆるデータソースが繋がり、Productとしてのデータをリアルタイムで利用システムに供給する。リアルタイムアクションはその場で消費し活用する。 New Source of Truth レガシーな基幹システム/データをクラウドネイティブな基盤に段階的に移行し、最終的にはここを新たな基幹とする。

Your Apache Kafka® journey begins here developer.conﬂuent.io

Apache_Kafka_and_Modernization.pdf

Apache_Kafka_and_Modernization.pdf

hashi

More Decks by hashi

Featured

Transcript

YugabyteDB Japan Hour #5 Apache Kafka® and Modernization - How

Modernization Approaches #YugabyteDB #Conﬂuent

@ShinHashitani | developer.confluent.io #1 New Apps - Microservices Independent Scalability

@ShinHashitani | developer.confluent.io #2 CQRS CQRS Command Query Responsibility Segregation

@ShinHashitani | developer.confluent.io #3 Monolith Decomposition (Stranglar) 段階的オフロードアプリの機能性は損なわず、基幹系の主機能以外を部分的に分離。

How Do You Keep Data Consistency Across?

Kafka and Data Consistency #YugabyteDB #Conﬂuent

@ShinHashitani | developer.confluent.io Event, Total Order, and Data Consistency “Streams

@ShinHashitani | developer.confluent.io How Database Works fsync buffer load 処理は全てメモリ上でなされる。

@ShinHashitani | developer.confluent.io How Kafka Works customer login: abc order

@ShinHashitani | developer.confluent.io How Kafka Stores Data イベントはトランザクションログとして保存イベントはログとして永続化され、同じイベントを何度でも読み込み処理する事が可能。Pullモデ

@ShinHashitani | developer.confluent.io Kafka Connect - あらゆるSource/Sinkと繋げる Oracle SQL Server

@ShinHashitani | developer.confluent.io ksqlDB - リアルタイム処理 with SQL Kafka Storage

@ShinHashitani | developer.confluent.io Old Data Meets New Data Platform Destination

Kafka and YugabyteDB #YugabyteDB #Conﬂuent

@ShinHashitani | developer.confluent.io How and When to Consume Data Oracle

@ShinHashitani | developer.confluent.io Central Nervous System and New Source of

Your Apache Kafka® journey begins here developer.conﬂuent.io