Slide 1

Slide 1 text

Redis 多数据中心 双向同步 祝辰 Redis multi-data center two-way synchronization

Slide 2

Slide 2 text

1 开篇 2 经典 Redis架构 3 4 目 录 CONTENTS 分布式理论 双向/多向同步的问题 CRDT 5

Slide 3

Slide 3 text

开篇

Slide 4

Slide 4 text

19世纪的通讯 “At 12:30 am on April 4th, 1841 President William Henry Harrison died of pneumonia just a month after taking office. The Richmond Enquirer published the news of his death two days later on April 6th. The North- Carolina standard newspaper published it on April 14th. His death wasn’t known of in Los Angeles until July23rd, 110 days after it hadoccurred.”

Slide 5

Slide 5 text

1881 年的一张地图 展示了一条消息从伦敦出发 • 绿色的区域可以在 10 天以 内到达 • 黄色的区域需要 10-20 天 • 粉色的区域需要 20-30 天 • 蓝色的区域需要 30-40 天 • 棕色的区域需要 40 天以上 的时间

Slide 6

Slide 6 text

21 世纪的通讯 同样的一张地图 在今天, 仅仅需要毫秒级 别的时间, 一条消息可以 被全世界共享起来 互联网的规模也从单独 一个数据中心的部署方 式转变为多数据中心,甚 至是跨区域的部署模式

Slide 7

Slide 7 text

多区域部署 Serverless 分 布式存储

Slide 8

Slide 8 text

经典 Redis 架构

Slide 9

Slide 9 text

Redis 内存数 据库 支持多种 数据结构 支持主 从架构

Slide 10

Slide 10 text

缓存服务 分布式锁 消息队列 计数器

Slide 11

Slide 11 text

• 到德国法兰克福站点,平均延迟在 176ms 左右 • 到美西站点,平均延迟在 160ms 左右

Slide 12

Slide 12 text

对于 Redis 的数据存储有着强依赖.机票 的业务需要从上游供应商处收集舱位信 息,Redis 的多种数据结构类型对于储存 这种数据 比较方便. 同时由于供应商是在全球分布的特性, 就更需要一个能够多点写入的 Redis 集 群, 支持海外站点和国内站点同时进行读写; 并解决因此可能出现的数据一致性问题. 需求的产生

Slide 13

Slide 13 text

DRC 的概念是在近年来,云计算兴起, 多站点部署的场景下,延伸出来对于数 据共享的一个需求. 多站点部署的架构, 对于单元化部署的 应用来讲, 跨数据中心的数据访问一直 是一个最大的痛点. 目前很多用户 • 抑或是采取了同一份写入到两个站 点的数据库 • 抑或是跨站点写入数据库同时同步 回来(例如 AWS 的AURORA) 这两种方式都没有从根本上解决问题, DRC 概念的出现,让大家对分布式存储 又有了新的期待 Data Replication Center

Slide 14

Slide 14 text

目前在实现单元化的部署过程中, 跨数据 中心的数据访问一直是一个业务的痛点. 是否我们也能够有自己的一套 DRC? 来完 成每个站点的单独写入读取,而不用关心 底层存储的一致性和同步问题. 对此需求进行分析后,我们决定开发一个 Redis的 DRC 架构,来支撑携程集群的应 用 单元化部署,而不仅仅是限制于 Redis 数据 的双向同步. Redis For DRC

Slide 15

Slide 15 text

分布式理论

Slide 16

Slide 16 text

一致性 分区容忍性 高可用性

Slide 17

Slide 17 text

传统关系型数据库为代表的 CA 新兴的NO-SQL为代表的 CP 分布式数据库则更多的关心 AP

Slide 18

Slide 18 text

Availability Strong Eventually Consistency Partition 技 术 选 型 首先,P(网络分区)是首 要考虑因素 其次,跨区域部署就是 为了提高可用性 最后,我们使用" 最终一 致性" 来解决数据冲突

Slide 19

Slide 19 text

双向同步的共同问题

Slide 20

Slide 20 text

双向回 环 环形复 制 数据一 致性 网络模 型的选 择 双向/多向同步有哪些共同的问题

Slide 21

Slide 21 text

网络通讯的 模型选择

Slide 22

Slide 22 text

Redis A: •set k v Redis B: •set kv 发生在端对端的互相同步过程中 假设有两个 Redis: A 和 B • A 收到客户端的请求:set kv • A 将请求通知到 B • B 收到请求后,再次通知 A 解决方案: 标记客户端类型 双向回环 client Set kv

Slide 23

Slide 23 text

set kv set kv set kv 复制回环 发生在多个点的互相同步过程 中 与双向回环的不同点在于 如果标记了客户端来源,则无 法处理 A -> B -> C -> A 的问题 解决方案: • 标记数据来源 • 只转发来自应用的数据(不 转发复制过来的数据) 复制回环 client Set kv

Slide 24

Slide 24 text

多站点之间的数据强最终一致性 SEC ---CRDT (Strong Eventually Consistency) Whereas eventual consistency is only a liveness guarantee (updates will be observed eventually), strong eventual consistency (SEC) adds the safety guarantee that any two nodes that have received the same (unordered) set of updates will be in the same state. If, furthermore, the system is monotonic, the application will never suffer rollbacks.

Slide 25

Slide 25 text

CRDT (Conflict-free Replicated Data Types)

Slide 26

Slide 26 text

Conflict-Free Data Types Wiki释义 In distributed computing, a conflict-free replicated data type (CRDT) is a data structure which can be replicated across multiple computers in a network, where the replicas can be updated independently and concurrently without coordination between the replicas, and where it is always mathematically possible to resolve inconsistencies which mightresult.

Slide 27

Slide 27 text

并发冲突 举个栗子: LWW(Last Writer Wins)-Register: 适用于 K/V 类型的存储 解决数据冲突的方式是通过使用 unix timestamp 或类似自然时间的计数 方 法,来达到数据的最终一致性 CRDT 可以做什么

Slide 28

Slide 28 text

State- based replication Operation- based replication CRDT Replication CRDT 的类型

Slide 29

Slide 29 text

State-based CRDTs are called convergent replicated data types, or CvRDTs. In contrast to CmRDTs, CvRDTs send their full local state to other replicas, where the states are merged by a function which must be commutative,associative, and idempotent. State-based Replication 发送端将自身的 全量状态 发送给接收端, 接 收端执行 merge 操作, 来达到和发送端状态 一致的结果 State-base replication 适用于不稳定的网络 系统, 通常会有多次重传 要求数据结构能够支持 交换律/结合律/幂等 性 这些特性 State-based Replication

Slide 30

Slide 30 text

Operation-based CRDTs are referred to as commutative replicated data types, or CmRDTs. CmRDT replicas propagate state by transmitting only the update operation. For example, a CmRDT of a single integer might broadcast the operations (+10) or (−20). 发送端将状态的改变转换为 操作/Log 的形式发送 给接收端, 接收端执行 update 操作, 来达到和发送 端状态一直的结果 Op-based replication 只要求数据结构满足 commutative 的特性,不要求 idempotent Operation-based Replication

Slide 31

Slide 31 text

State-based Replication • 通常是基于全量状态进行同步,这样的结果是造成的网络流量 太大,且同步的效率低下.在同步机制已经建立的系统中,我们 更倾向于使用 Op-based replication,以达到节省流量和快速 同步 的目的 Op-based Replication • 基于 unbounded resource 的假设上进行论证的学术理念,在 实 践过程中,不可能有无限大的存储资源,将某个站点的全部 数 据缓存下来,这样就带来一个问题, 如果新加节点或者网络 断 开过久时,我们的存储资源不足以缓存所有历史的操作,从 而 使得复制操作无法进行.此时,我们需要借助 State-based replication 进行多个站点之间,状态的merge操作 CRDT Replication

Slide 32

Slide 32 text

增量同步 • Redis master 接收到客户端的操作,将对数据库产 生 修改的操作转发送给slave,slave 执行和 master 同样 的操作,达到master-slave数据一致的目的 全量同步 • master将自身数据库以快照形式(RDB文件)发送给 slave, slave通过加载快照文件,达到和 master数据 一致的目 的 • 适用于新添加 slave或同步缓冲区溢出时,master与 slave 同步 Redis Master-Slave Replication

Slide 33

Slide 33 text

FullSync • 由于物理上的限制,一台机器不可能无限制地 Hold 所有的操作历史.在 新节点加入的情况下,State-Based Replication 就比较适合这种场景. PartiallySync • 而由于 Redis 的实现本身具有增量同步的特性,那么,Operation- based Replication就很适合这种场景,不用把系统的整个状态发送出 去,而是 仅仅发送一个 op-log AdvancedFullSync • 然而, 对于断点续传的场景中, 我们缓存 op-log 的 buffer 可能已经不 够 用, 但此时对端由 hold 了一部分的历史信息. 这时候, Delta-based state replication就比较合适 Redis CRDT Replication实 现

Slide 34

Slide 34 text

Key/Value • LWW Register Map • Add Wins • LWW Expire • LargerTTL Wins GC CRDT 在 Redis 中的实现

Slide 35

Slide 35 text

CRDT 在 Redis 中的实现 CRDT 的基本信息 • vectorclock • global id • timestamp • merge操作

Slide 36

Slide 36 text

正常同步的场景 Data Type: Strings Use Case: Common SETs Conflict Resolution:None 并发冲突的场景 Data Type:Strings Use Case: Concurrent SETs Conflict Resolution: Last Write Wins (LWW) Redis String

Slide 37

Slide 37 text

正常同步的场景 Data Type:Maps Use Case: Common HSET Conflict Resolution:None 并发冲突的场景 - 1 Data Type:Maps Use Case: Concurrent HSET Conflict Resolution: ADD WINS Redis Map

Slide 38

Slide 38 text

并发冲突的场景 - 2 Data Type:Maps Use Case: ConcurrentHSET Conflict Resolution: LWW – Last Write Wins 并发冲突的场景 - 3 Data Type:Maps Use Case: ConcurrentHSET Conflict Resolution: ADD WINS && LWW – Last Write Wins Redis Map

Slide 39

Slide 39 text

正常同步的场景 Data Type:Strings Use Case: Common EXPIRATION Conflict Resolution: None 并发冲突的场景 Data Type:Strings Use Case: Concurrent EXPIRATION Conflict Resolution: Larger TTL wins Exipre 操作产生并发冲突时,我们采用 Larger TTL Wins 的策略 Redis String Expiration

Slide 40

Slide 40 text

GC 问题

Slide 41

Slide 41 text

Data Replication Center CRDT 的未来 面对大型分布式系统,Consistency/Availability/Partition在跨区域多活的场景下如何取舍? 显然P(网 络分区)是首要考虑因素。 其次,跨区域部署就是为了提高可用性,而且对于常见的一致性协议,不管是2PC、Paxos还是raft,在 此 场景下都要做跨区域同步更新,不仅会降低用户体验,在网络分区的时候还会影响可用性,因此C必 定被排在最后。那是不是C无法被满足了呢? Conflict-free Replicated Data Types

Slide 42

Slide 42 text

CRDT⼊门 A CRDT Primer Part I: Defanging Order Theory A CRDT Primer Part II: Convergent CRDTs CRDT相关论文 •重 点 推 荐 :A comprehensive study of Convergent and Commutative Replicated Data Types •Conflict-free replicated data types •Delta State Replicated Data Types •CRDTs: Making δ-CRDTs Delta-Based •Key-CRDT Stores •A Conflict-Free Replicated JSON Datatype •OpSets: Sequential Specifications for ReplicatedDatatypes

Slide 43

Slide 43 text

系列讲座 Talks RedisConf18: CRDTs and Redis—From Sequential to Concurrent Executions by Carlos Baquero QCon London 2018: CRDTs and the Quest for Distributed Consistency by Martin Kleppmann “CRDTs Illustrated” by Arnout Engelen Coding CRDT Dmitry Ivanov & Nami Naserazad - Practical Demystification of CRDT (Lambda Days 2016) ElixirConf 2015 - CRDT: Datatype for the Apocalypse by Alexander Songe GOTO 2016 • Conflict Resolution for Eventual Consistency • Martin Kleppmann CRDTs in IPFS Journal Club - 2018 06 13 CRDT JSON Datatype, by Gonçalo Pestana Notes and blog posts CRDT Tutorial forBeginners Conflict-Free Replicated Data Types (CRDTs), An Offline Camp passion talk CRDT Notes by Paul Frazee Towards a unified theory of Operational Transformation and CRDT by Raph Levien A simple approach to building a real-time collaborative text editor Data Laced with History: Causal Trees & Operational CRDTs

Slide 44

Slide 44 text

本PPT来自携程技术沙龙,更多活动信息可关注“携程技术中心”微信公众号。 Thanks!