数据一致性（二）

时间 2019-11-09

标签数据一致性栏目 Zookeeper 繁體版

原文原文链接

咱们流连于事物的表象，知足浅尝辄止的片刻欢愉，却几乎从不久留。咱们在人生的道路上争先恐后，却吝于用片刻思考目标和方向。

概述

至今没有接触过MySQL多主的状况，即存在多个MySQL实例同时负责读写请求（抛弃只读库）。思考后认为：没有这么实现的技术难点在于：数据的一致性得不到保证。此外，还会涉及：html

MySQL采用自增主键索引的话，多主之间的数据同步简直是灾难。
内部锁机制的优点大打折扣，跨主库间的锁应该也是灾难级别的吧。

那么支持分布式的其余数据库又是怎么搞定这个问题的呢？好比Cassandra，多个节点之间能够同时处理读写请求，那么它是如何处理节点间数据同步以保证一致性的呢？mysql

MySQL数据的一致性

We think this is an unacceptable burden to place ondevelopers and that consistency problems should be solved at the database level

细细想一想，MySQL自身实现的数据一致性也是至关复杂的。以Innodb举例，若是经过普通索引执行查询，首先获取到的仅仅是主键索引，后面还须要经过主键索引来获取完整的记录。查询如此，更新亦如此。算法

`Master-Slave`模式

一般状况下，MySQL部署都是一主多从。Master做为更新DB的入口，而Slave的数据经过binlog来进行同步。因此大胆想想，有没有可能出现一种状况（假设id=1记录原始的name值为neojos）：sql

## 第一次同步数据
update s-1 set name="neojos-1" where id = 1;    ## 失败
update s-2 set name="neojos-1" where id = 1;    ## 成功
update s-3 set name="neojos-1" where id = 1;    ## 成功

## 第二次同步数据
update s-1 set name="neojos-2" where id = 1;    ## 成功
update s-2 set name="neojos-2" where id = 1;    ## 失败
update s-3 set name="neojos-2" where id = 1;    ## 成功

最后，数据库从某一个时间点开始，Master和Salve的数据会变得不一致了固然不可能，MySQL在数据同步上作了很是硬的约束。包括Slave_IO_Running、Slave_SQL_Running以及Seconds_Behind_Master等。数据库

并发下的数据一致性

MySQL并发下的数据一致性是经过锁来保证的。并发的请求，谁先拿到X锁，谁就有修改的权限。锁相似扮演了一个操做版本号的做用。微信

`X`	`IX`	`S`	`IS`
`X`	Conflict	Conflict	Conflict	Conflict
`IX`	Conflict	Compatible	Conflict	Compatible
`S`	Conflict	Conflict	Compatible	Compatible
`IS`	Conflict	Compatible	Compatible	Compatible

理解冲突

以数据读取和写入为切入点，引伸出两个工做中可能可能遇到的冲突问题，并经过加锁以及设置版本号来避免冲突的发生。网络

Go的并发问题

下面是一个简单的Go Test代码问题：求1-100的累加和。咱们经过Goroutine和最普通的两个方式分别计算。同时，在代码的末尾对两种方式的计算结果进行了比较并打印输出。数据结构

// 输出结果每次都是变化的。其中一次：5499 != 5050
func TestSum1To100(t *testing.T) {

    result1 := 0
    result2 := 0
    
  // 并发的进行计算
    var wg sync.WaitGroup
    for i := 1; i <= 100; i++ {
        wg.Add(1)
        go func(m int) {
            defer wg.Done()
            result1 += m
        }(i)
    }

  // 正常的For循环
    for i := 1; i <= 100; i++ {
        result2 += i
    }

    wg.Wait()
    if result1 != result2 {
        t.Fatalf(" %d != %d", result1, result2)
    }
}

并发状况下，每一个goroutine在读取result1到result1=result1+1的过程当中，没法保证result1不被别的goroutine所修改。并发

从MySQL解决问题的思路来考虑：加锁。咱们要对读取result1到result1=result1+1的过程进行加锁，保证这个过程是同步的。异步

一对多状况

在国内第三方支付（微信/支付宝）场景中，用户是否支付了某个商品，是经过服务端接受第三方异步回调通知的方式，来做为判断依据的。而回调通知存在相应的重试策略，并且都要求幂等处理。

假设下面一个场景，咱们建立了以user_id为惟一索引的表（user_pay）用于统计该用户支付成功的次数，以及用户支付明细表（user_pay_detail），二者是一对多的对应关系。服务端每次收到第三方的支付回调，都在user_pay_detail追加一条新记录，同时相应的调整user_pay的信息。

若是在回调过程当中，存在这样一个场景：在03-02号收到了支付回调通知，对数据进行了调整。而在03-15号的时候却又收到了02-01的回调通知（该通知已经在02-01处理过了）。如何保证user_pay中的数据不会被多加一次？

固然，解决办法很是简单。其中一个解决办法即是：在user_pay中记录上一次回调通知的时间戳，以此做为这行记录的版本号，后续也只有大于该版本号的通知才会被处理。

`CAP`

了解一下分布式的环境下的CAP定理，这里主要强调一下：Consistency。在分布式系统中，存在多节点同时对外提供读写服务，数据存储多份副本的状况。那么，这些节点在同步数据的过程当中，可能会由于网络或者机器的缘由致使数据同步失败，从而形成各个节点数据不一致的状况发生。

`Last-write-wins`

Last-write-wins表示在对一条记录应用多个修改的时候，最后的改动会覆盖掉以前的操做，返回给客户端的记录都以最后一次的改动为准。

这也是分布式系统解决冲突的一个策略。基于timestamp的版本控制系统，好比HBase。每次操做都会给记录附加一个timestamp的版本号。这样一来，当某些数据发生冲突时，咱们就能够简单的认为最新的记录是准确的。

但实际上，基于Last-write-wins的策略并不必定是正确的。好比多个节点对同一条记录进行修改。首先，节点服务上的时间钟不是严格相等的；其次，客户端发出的请求时间，跟到达节点服务的时间也是没有任何联系的。

`vector clock`

先说一下须要用到向量时钟的场景。咱们在写数据时候，常常但愿数据不要存储在单点。如db1，db2均可以同时提供写服务，而且都存有全量数据。而client不论是写哪个db都不用担忧数据写乱问题。可是现实场景中每每会碰到并行同时修改。致使db1和db2数据不一致。因而乎就有人想出一些解决策略。向量时钟算是其中一种。简单易懂。可是并无完全解决冲突问题，现实分布式存储补充了不少额外技巧。

文章vector clock 向量时钟算法解释的实在是太完美了，这里就不冗余解释了。下图是一个分布式服务的示例，各个节点均可以提供读写服务。

`Cassandra`的思路

KV类型的分布式数据库在存储对象时，存储的是对象序列化的结果。举个例子：

有一个jbellis的对象，初始值为{'email': 'jbellis@example.com', 'phone': '555-5555'}，咱们认为这个初始值为V0
以后修改了jbellis的邮件地址，这时候值记做V1，{'email': 'jbellis@illustration.com', 'phone': '555-5555'}。但由于网络或其余问题，在同步数据到其余节点的时候失败了，致使该修改仅仅被成功写到了其中一个节点上
接着，咱们更新jbellis中的电话信息。但咱们读取到的jbellis是V0，因此，修改后的V3为{'email': 'jbellis@example.com', 'phone': '444-4444'}

从Last-write-wins的角度考虑，咱们采纳了V2的值，而丢弃了V1。简单直接，但不必定正确；

从vector clock的角度来看，当同步V2到其余节点时，就会发生数据冲突，由于当前节点的版本为[V0, V2]，而其余节点的版本是[V0, V1]，这时候就须要依靠具体的冲突解决策略。

而Cassandra在存储数据结构上作了处理，将对象中email和phone单独存储，并给每一个column都指定一个独立的timestamp做为版本号。这样，当冲突发生时，就能够简单运用Last-write-wins策略了。

A column is the basic data structure of Cassandra with three values, namely key or column name, value, and a timestamp. Given below is the structure of a column.

总结

实事求是，具体问题具体分析。请记住，对你而言，上面这些方法可能都不合适。

参考文章：