分布式事务概述（资料）

时间 2019-11-26

原文原文链接

什么是分布式系统

　　分布式系统是由一组经过网络进行通讯、为了完成共同的任务而协调工做的计算机节点组成的系统。分布式系统的出现是为了用廉价的、普通的机器完成单个计算机没法完成的计算、存储任务。其目的是利用更多的机器，处理更多的数据。html

分布式系统分为分布式计算（computation）与分布式存储（storage）。计算与存储是相辅相成的，计算须要数据，要么来自实时数据（流数据），要么来自存储的数据；而计算的结果也是须要存储的。在操做系统中，对计算与存储有很是详尽的讨论，分布式系统只不过将这些理论推广到多个节点罢了。java

常见的分布式存储系统： MogileFS、GlusterHSmysql

常见的分布式文件系统有 ：GFS、HDFS、Lustre 、Ceph 、GridFS 、mogileFS、TFS、FastDFSlinux

常见追踪系统： Jaeger、Zipkin等；nginx

分布式是指将不一样的业务分布在不一样的地方。而集群指的是将几台服务器集中在一块儿，实现同一业务。

分布式中的每个节点，均可以作集群。而集群并不必定就是分布式的。web

分布式系统怎么将任务分发到这些计算机节点：分而治之，即分片redis

存储，每一个节点存一部分数据就好了。当数据规模变大的时候，Partition是惟一的选择，同时也会带来一些好处：算法

　　（1）提高性能和并发，操做被分发到不一样的分片，相互独立spring

　　（2）提高系统的可用性，即便部分分片不能用，其余分片不会受到影响sql

分布式系统中有大量的节点，且经过网络通讯。单个节点的故障（进程crash、断电、磁盘损坏）是个小几率事件，但整个系统的故障率会随节点的增长而指数级增长。

分布式框架

常见的分布式软件 :

分布式文件存储的数据库 : Mongodb

分布式代码管理工具： Gitlab

分布式缓存数据结构存储系统 : Redis/Memcached

分布式

分布式的体系模块

分布式任务处理服务：负责具体的业务逻辑处理

分布式节点注册和查询：负责管理全部分布式节点的命名和物理信息的注册与查询，是节点之间联系的桥梁

分布式DB：分布式结构化数据存取

分布式Cache：分布式缓存数据（非持久化）存取

分布式文件：分布式文件存取

网络通讯：节点之间的网络数据通讯

监控管理：搜集、监控和诊断全部节点运行状态

分布式编程语言：用于分布式环境下的专有编程语言，好比Elang、Scala

分布式算法：为解决分布式环境下一些特有问题的算法，好比解决一致性问题的Paxos算法

分布式计算系统：

1. 传统基于msg的系统
2. MapReduce-like 系统
3. 图计算系统
4. 基于状态（state）的系统
5. Streaming 系统

主流分布式系统设计分类

1. 分布式存储系统
2. 分布式计算系统
3. 分布式管理系统

分布式存储系统：

1. 结构化存储
2. 非结构化存储
3. 半结构化存储
4. In-memory 存储

分布式存储系统还有一系列的理论、算法、技术做为支撑：例如 Paxos, CAP, ConsistentHash, Timing (时钟), 2PC, 3PC 等等

上述四个子方向概述分类

结构化存储：典型的场景就是事务处理系统或者关系型数据库（RDBMS）。传统的结构化存储都是从单机作起的，

PostgreSQL 也是近几年来势头很是强劲的一个 RDBMS. 咱们发现，传统的结构化存储系统强调的是：（1）结构化的数据（例如关系表）。（2）强一致性（例如，银行系统，电商系统等场景）（3）随机访问（索引，增删查改，SQL 语言）。

非结构化存储（no-structed storage systems) ： 非结构化存储强调的是高可扩展性，典型的系统就是分布式文件系统。

扩展

大数据组成部分

• HDFS：分布式存储系统，包含NameNode，DataNode。

NameNode：元数据，DataNode。

DataNode：存数数据。

arn：能够理解为MapReduce的协调机制，本质就是Hadoop的处理分析机制，分为ResourceManager NodeManager。 • MapReduce：软件框架，编写程序。

• Hive：数据仓库能够用SQL查询，能够运行Map/Reduce程序。用来计算趋势或者网站日志，不该用于实时查询，须要很长时间返回结果。

• HBase：数据库。很是适合用来作大数据的实时查询。Facebook用Hbase存储消息数据并进行消息实时的分析；

• ZooKeeper：针对大型分布式的可靠性协调系统。Hadoop的分布式同步等靠Zookeeper实现，例如多个NameNode，active standby切换。

• Sqoop：数据库相互转移，关系型数据库和HDFS相互转移Mahout：可扩展的机器学习和数据挖掘库。用来作推荐挖掘，汇集，分类，频繁项集挖掘。

常见问题：

1. 近些年分布式系统领域都在作些什么。
2. 为何如今投入分布式系统的学习和研究是值得的。

分布式系统挑战

　第一，异构的机器与网络：

　　　　分布式系统中的机器，配置不同，其上运行的服务也可能由不一样的语言、架构实现，所以处理能力也不同；节点间经过网络链接，而不一样网络运营商提供的网络的带宽、延时、丢包率又不同。怎么保证你们齐头并进，共同完成目标，这四个不小的挑战。

　　第二，广泛的节点故障：

　　　　虽然单个节点的故障几率较低，但节点数目达到必定规模，出故障的几率就变高了。分布式系统须要保证故障发生的时候，系统仍然是可用的，这就须要监控节点的状态，在节点故障的状况下将该节点负责的计算、存储任务转移到其余节点

　　第三，不可靠的网络：

　　　　节点间经过网络通讯，而网络是不可靠的。可能的网络问题包括：网络分割、延时、丢包、乱序。

　　　　相比单机过程调用，网络通讯最让人头疼的是超时：节点A向节点B发出请求，在约定的时间内没有收到节点B的响应，那么B是否处理了请求，这个是不肯定的，这个不肯定会带来诸多问题，最简单的，是否要重试请求，节点B会不会屡次处理同一个请求。

分布式系统特性

　　可扩展性

　　可用性与可靠性

　高性能

　　一致性

常见的分布式文件系统：

分布式构架图

概念与实现

负载均衡：

　　　　Nginx：高性能、高并发的web服务器；功能包括负载均衡、反向代理、静态内容缓存、访问控制；工做在应用层

　　　　LVS： Linux virtual server，基于集群技术和Linux操做系统实现一个高性能、高可用的服务器；工做在网络层

webserver：

　　　　Java：Tomcat，Apache，Jboss

　　　　Python：gunicorn、uwsgi、twisted、webpy、tornado

service：

　　　　SOA、微服务、spring boot，django

容器：

　　　　docker，kubernetes

cache：

　　　　memcache、redis等

协调中心：

　　　　zookeeper、etcd等

　　　　zookeeper使用了Paxos协议Paxos是强一致性，高可用的去中心化分布式。zookeeper的使用场景很是普遍，以后细讲。

rpc框架：

　　　　grpc、dubbo、brpc

　　　　dubbo是阿里开源的Java语言开发的高性能RPC框架，在阿里系的诸多架构中，都使用了dubbo + spring boot

消息队列：

　　　　kafka、rabbitMQ、rocketMQ、QSP

　　　　消息队列的应用场景：异步处理、应用解耦、流量削锋和消息通信

实时数据平台：

　　　　storm、akka

离线数据平台：

　　　　hadoop、spark

　　　　PS: apark、akka、kafka都是scala语言写的，看到这个语言仍是很牛逼的

dbproxy：

　　　　cobar也是阿里开源的，在阿里系中使用也很是普遍，是关系型数据库的sharding + replica 代理

db：

　　　　mysql、oracle、MongoDB、HBase

搜索：

　　　　elasticsearch、solr

日志：

　　　　rsyslog、elk、flume

常见的分布式文件系统有，GFS、HDFS、Lustre 、Ceph 、GridFS 、mogileFS、TFS、FastDFS

GFS（Google File System）

--------------------------------------

Google公司为了知足本公司需求而开发的基于Linux的专有分布式文件系统。。尽管Google公布了该系统的一些技术细节，但Google并无将该系统的软件部分做为开源软件发布。

使用Master->Slave设计，元数据信息主要由Master管理，这样的设计大大下降系统的实现难度。

为防止Master压力过大，限制了数据存储大量，GFS中数据存储单元使用Chunk表示，Chunk支持64M。

Master节点掌握整个集群数据存储核心数据，集群扩展能力受限于master节点内存，好比：大量小文件致使元数据信息爆满。

分布式文件系统多副本，可支持容错的读取数据，根据负载状况，最近副本取数据。

由于集群支持容错，故障自动恢复，因此整个集群能够扩展到很大规模，在传统MPI、MPP中没法支持很大规模。

而今天咱们也看到MPP和

下面分布式文件系统都是类 GFS的产品。

热点数据

在分布式非结构化数据存储中，是很是常见的，好比咱们某个公共库文件或程序，为使用方便和容错，你们把它存储在HDFS，它被切块存储于100个节点的集群某3个机器中，因为大量业务系统或者程序随机加载引用，致使某3个机器压力特别大，看到监控系统飘红。

咱们能够经过增长副本数量，来让更多副本能提供访问服务，解决问题。

早期使用MapReduce/Spark系统，为缩短计算时间，默认3副本，咱们提升到6，9个，增长数据本地化计算的概率。

元数据

集群扩展Slave受限于Master节点内容，元数据信息都存在Master，而且常驻内存，大量小文件也会形成Master性能降低。

快照

使用copy-on-writer实现，基本上不会对现有数据读取有影响。

只读数据存储

[1] 适合追加方式的写入和读取操做

[2] 不多有随机写入操做

目前HDFS，GFS主要用来存储海量的离线数据，提供海量非结构化数据存储场景。

若是须要支持随机写、更新、删除数据，就选其余系统，好比：Kudu

冗余解决方案

容错考虑须要，有三倍冗余，目前主要有Erasure Codes实现，奇偶校验方法，能够缩小大量存储占用。

注意：

[1] 没有在文件系层面提供任何的Cache机制，访问顺序读取加载大量文件，Cache支持意义不大

[2] 单个应用执行时机会不会重复读取数据

[3] GFS/HDFS适合流式读取一个大型数据集

[4] 在大型数据集中随机seek到某个位置，以后每次读取少许数据，提高效率。

[5] GFS/HDFS设计预期是使用大量的不可靠节点组件集群，所以，灾难冗余是此类系统设计的核心。

[6] 存储固定大小的Chunk，容易从新均衡数据。

[7] 原子记录追加，保障系统数据一致性。

[8] 中心Master设计，让复杂的分布式系统实现简单化，不用考虑数据一致性，元数据同步问题。

GFS/HDFS设计初衷，保障有大量并发读写操做时，可以提供很高的合计吞吐量。

经过分离控制流(Master)和数据流(Chunk client)来实现，因此咱们常常提起的Edge节点会对整个系统性能有很大的影响。

Master节点负载太高，经过Chunk租约将控制权交给主副本(主Chunk)，将Master压力降到最低。

目前相似GFS的开源实现，主流选择HDFS，并且HDFS在实现上，弥补不少GFS中的不足。我也没看到有可替代HDFS的系统，由于有HDFS造就今天繁荣的Hadoop生态系统，数据分析引擎、数据存储引擎百花齐放。

软件系统的设计与实现是为解决现实问题而出现，设计上会有不少权衡，不一样的权衡造就不一样的系统，各自有擅长的场景。

HDFS

--------------------------------------
Hadoop 实现了一个分布式文件系统（Hadoop Distributed File System），简称HDFS。 Hadoop是Apache Lucene创始人Doug Cutting开发的使用普遍的文本搜索库。它起源于Apache Nutch，后者是一个开源的网络搜索引擎，自己也是Luene项目的一部分。Aapche Hadoop架构是MapReduce算法的一种开源应用，是Google开创其帝国的重要基石。

Ceph

---------------------------------------

是加州大学圣克鲁兹分校的Sage weil攻读博士时开发的分布式文件系统。并使用Ceph完成了他的论文。

说 ceph 性能最高，C++编写的代码，支持Fuse，而且没有单点故障依赖，因而下载安装，因为 ceph 使用 btrfs 文件系统，而btrfs 文件系统须要 Linux 2.6.34 以上的内核才支持。

但是ceph太不成熟了，它基于的btrfs自己就不成熟，它的官方网站上也明确指出不要把ceph用在生产环境中。

Lustre

---------------------------------------

Lustre是一个大规模的、安全可靠的，具有高可用性的集群文件系统，它是由SUN公司开发和维护的。

该项目主要的目的就是开发下一代的集群文件系统，能够支持超过10000个节点，数以PB的数据量存储系统。

目前Lustre已经运用在一些领域，例如HP SFS产品等。

FastDFS

---------------------------------------

是一款相似Google FS的开源分布式文件系统，是纯C语言开发的。

FastDFS是一个开源的轻量级分布式文件系统，它对文件进行管理，功能包括：文件存储、文件同步、文件访问（文件上传、文件下载）等，解决了大容量存储和负载均衡的问题。特别适合以文件为载体的在线服务，如相册网站、视频网站等等。

FastDFS 是一个由 C 语言实现的开源轻量级分布式文件系统，

FastDFS is an open source high performance distributed file system (DFS). It's major functions include: file storing, file syncing and file accessing, and design for high capacity and load balance.

翻译： FastDFS 是一个开源的高性能分布式文件系统（DFS）。它的主要功能包括：文件存储，文件同步和文件访问，以及高容量和负载平衡。

官方论坛 http://bbs.chinaunix.net/forum-240-1.html

FastDfs google Code http://code.google.com/p/fastdfs/

分布式文件系统FastDFS架构剖析 http://www.programmer.com.cn/4380/

TFS

-------------------------------------

TFS（Taobao !FileSystem）是一个高可扩展、高可用、高性能、面向互联网服务的分布式文件系统，主要针对海量的非结构化数据，它构筑在普通的Linux机器集群上，可为外部提供高可靠和高并发的存储访问。TFS为淘宝提供海量小文件存储，一般文件大小不超过1M，知足了淘宝对小文件存储的需求，被普遍地应用在淘宝各项应用中。它采用了HA架构和平滑扩容，保证了整个文件系统的可用性和扩展性。同时扁平化的数据组织结构，可将文件名映射到文件的物理地址，简化了文件的访问流程，必定程度上为TFS提供了良好的读写性能。

官网： http://code.taobao.org/p/tfs/wiki/index/

GridFS文件系统

-------------------------------------
MongoDB是一种知名的NoSql数据库，GridFS是MongoDB的一个内置功能，它提供一组文件操做的API以利用MongoDB存储文件，GridFS的基本原理是将文件保存在两个Collection中，一个保存文件索引，一个保存文件内容，文件内容按必定大小分红若干块，每一块存在一个Document中，这种方法不只提供了文件存储，还提供了对文件相关的一些附加属性（好比MD5值，文件名等等）的存储。文件在GridFS中会按4MB为单位进行分块存储。

1、什么是事务

普通数据库事务（简称：事务，Transaction）是指一个单数据库节点执行过程当中的一个逻辑单位由一个有限的数据库操做序列构成，这一系列数据库操做序列组成的逻辑单位具备强原子性，或所有执行，或所有不执行。该事务拥有如下四个特性，习惯上被称为 ACID 特性:

原子性（Atomicity）：事务做为一个总体被执行，包含在其中的对数据库的操做要么所有被执行，要么都不执行。
一致性（Consistency）：事务应确保数据库的状态从一个一致状态转变为另外一个一致状态。一致状态是指数据库中的数据应知足完整性约束。除此以外，一致性还有另一层语义，就是事务的中间状态不能被观察到（这层语义也有说应该属于原子性）。
隔离性（Isolation）：多个事务并发执行时，一个事务的执行不该影响其余事务的执行，如同只有这一个操做在被数据库所执行同样。
持久性（Durability）：已被提交的事务对数据库的修改应该永久保存在数据库中。在事务结束时，此操做将不可逆转。

普通数据库事务的单节点性，因此也叫本地事务。以下是普通事务的架构形态:

相对于普通数据库事务而言，分布式事务是指会涉及到操做多个数据库节点的事务，事务的参与者、支持事务的服务器、资源服务器以及事务管理器分别位于分布式的不一样数据库节点上，是将对单库事务的概念扩大到了对多个库的事务，分布式事务方案也是为了保证分布式系统中各个数据库节点的数据一致性。普通数据库事务具备强一致性特色。分布式事务则不一样，根据数据一致性的强弱要求，分布式事务分刚事务和柔事务。

刚事务：听从ACID理论，实际中由于考虑用户体验和并发性能，不多有听从ACID的分布式事务实施方案
柔事务：听从CAP理论或其变种BASE理论的事务，主流分布式事务一致性方案都属于这类

以下是当前常见的分布式事务的架构形态:

2、分布式事务一致性指导方案

为了解决分布式事务一致性问题，前人在性能和数据一致性的权衡过程当中总结了许多经典的协议和算法。比较著名的有：XA协议、2PC、3PC、TCC、Paxos、Raft、Zab、ISR、SAGA模型、最大努力型。固然，除了这些以外，业界用的最多的实际上是基于MQ实现。本文列举具备表明性的几个方案进行概述讲解。

3、指导方案分析

XA协议:

最先的分布式事务模型是 X/Open 国际联盟提出的 X/Open Distributed Transaction Processing（DTP）模型，也就是你们常说的 X/Open XA 协议，简称XA 协议。

XA模型由2部分组成:全局事务管理(调度)器(TM)和本地资源管理(RM)，本地资源管理器每每由数据库实现，事务管理器做为全局的调度者，负责各个本地资源的提交和回滚。XA 协议描述了 TM 与 RM 之间的接口，容许多个资源在同一分布式事务中访问。XA实现分布式事务的原理以下:

XA使用2PC提交保证原子性:

1. 应用程序（AP，Application）向 TM 申请开始一个全局事务。

2. 针对要操做的 RM，AP 会先向 TM 注册（TM 负责记录 AP 操做过哪些 RM，即分支事务），TM 经过 XA 接口函数通知相应 RM 开启分布式事务的子事务，接着 AP 就能够对该 RM 管理的资源进行操做。

3. 当 AP 对全部 RM 操做完毕后，AP 根据执行状况通知 TM 提交或回滚该全局事务，TM 经过 XA 接口函数通知各 RM 完成操做。TM 会先要求各个 RM 作预提交，全部 RM 返回成功后，再要求各 RM 作正式提交，XA 协议要求，一旦 RM 预提交成功，则后续的正式提交也必须能成功；若是任意一个 RM 预提交失败，则 TM 通知各 RM 回滚。

4. 全部 RM 提交或回滚完成后，全局事务结束。

XA优势：知足原子性、隔离性。

XA缺点：太依赖数据库层事务、锁，影响性能开销，存在数据不一致性(不过全部分布式事务方案都不是强一致性事务)

总的来讲，XA协议比较简单，并且一旦商业数据库实现了XA协议，使用分布式事务的成本也比较低。可是，XA也有致命的缺点，那就是性能不理想，特别是在交易下单链路，每每并发量很高，XA没法知足高并发场景。XA目前在商业数据库支持的比较理想，在mysql数据库中支持的不太理想，mysql的XA实现，没有记录prepare阶段日志，主备切换回致使主库与备库数据不一致。许多nosql也没有支持XA，这让XA的应用场景变得很是狭隘。

2PC:

XA协议中保证事务原子性的机制就是使用2PC 。

二阶段提交(Two-phaseCommit)是指，在计算机网络以及数据库领域内，为了使基于分布式系统架构下的全部节点在进行事务提交时保持一致性而设计的一种算法(Algorithm)。一般，二阶段提交也被称为是一种协议(Protocol))。在分布式系统中，每一个节点虽然能够知晓本身的操做时成功或者失败，却没法知道其余节点的操做的成功或失败。当一个事务跨越多个节点时，为了保持事务的ACID特性，须要引入一个做为协调者的组件来统一掌控全部节点(称做参与者)的操做结果并最终指示这些节点是否要把操做结果进行真正的提交(好比将更新后的数据写入磁盘等等)。所以，二阶段提交的算法思路能够归纳为：参与者将操做成败通知协调者，再由协调者根据全部参与者的反馈情报决定各参与者是否要提交操做仍是停止操做。

所谓的两个阶段是指：第一阶段：准备阶段(投票阶段)和第二阶段：提交阶段（执行阶段）。

准备阶段:

事务协调者(事务管理器)给每一个参与者(资源管理器)发送Prepare消息，每一个参与者要么直接返回失败(如权限验证失败)，要么在本地执行事务，写本地的redo和undo日志，但不提交。

准备阶段细化为以下三件事：

1.协调者节点向全部参与者节点询问是否能够执行提交操做(vote)，并开始等待各参与者节点的响应。

2.参与者节点执行询问发起为止的全部事务操做，并将Undo信息和Redo信息写入日志。（注意：若成功这里其实每一个参与者已经执行了事务操做）

3.各参与者节点响应协调者节点发起的询问。若是参与者节点的事务操做实际执行成功，则它返回一个”赞成”消息；若是参与者节点的事务操做实际执行失败，则它返回一个”停止”消息。

提交阶段:

若是协调者收到了参与者的失败消息或者超时，直接给每一个参与者发送回滚(Rollback)消息；不然，发送提交(Commit)消息；参与者根据协调者的指令执行提交或者回滚操做，释放全部事务处理过程当中使用的锁资源。(注意:必须在最后阶段释放锁资源)，下图描述了2pc成功和失败的过程:

二阶段提交可以提供原子性的操做，可是具备以下几个缺点：

1. 同步阻塞问题。执行过程当中，全部参与节点都是事务阻塞型的。当参与者占有公共资源时，其余第三方节点访问公共资源不得不处于阻塞状态。

2. 单点故障。因为协调者的重要性，一旦协调者发生故障。参与者会一直阻塞下去。尤为在第二阶段，协调者发生故障，那么全部的参与者还都处于锁定事务资源的状态中，而没法继续完成事务操做。（若是是协调者挂掉，能够从新选举一个协调者，可是没法解决由于协调者宕机致使的参与者处于阻塞状态的问题）

3. 数据不一致。在二阶段提交的阶段二中，当协调者向参与者发送commit请求以后，发生了局部网络异常或者在发送commit请求过程当中协调者发生了故障，这回致使只有一部分参与者接受到了commit请求。而在这部分参与者接到commit请求以后就会执行commit操做。可是其余部分未接到commit请求的机器则没法执行事务提交。因而整个分布式系统便出现了数据部一致性的现象。

4. 二阶段没法解决的问题：协调者再发出commit消息以后宕机，而惟一接收到这条消息的参与者同时也宕机了。那么即便协调者经过选举协议产生了新的协调者，这条事务的状态也是不肯定的，没人知道事务是否被已经提交。

因为二阶段提交存在着诸如同步阻塞、单点问题、脑裂等缺陷，因此，研究者们在二阶段提交的基础上作了改进，提出了三阶段提交。

3PC:

三阶段提交（Three-phase commit），也叫三阶段提交协议（Three-phase commit protocol），是二阶段提交（2PC）的改进版本。

PC除了引入超时机制外，将事务过程分为3个阶段:CanCommit、PreCommit、DoCommit:

CanCommit:

3PC的CanCommit阶段其实和2PC的准备阶段很像。协调者向参与者发送commit请求，参与者若是能够提交就返回Yes响应，不然返回No响应。

1. 事务询问：协调者向参与者发送CanCommit请求。询问是否能够执行事务提交操做。而后开始等待参与者的响应。

2. 响应反馈：参与者接到CanCommit请求以后，正常状况下，若是其自身认为能够顺利执行事务，则返回Yes响应，并进入预备状态。不然反馈No 。

PreCommit:

协调者根据CanCommit阶段参与者的反应状况来决定是否能够继续事务的PreCommit操做。根据响应状况，有如下两种可能。

假如协调者从全部的参与者得到的反馈都是Yes响应，那么就会执行事务的预执行。

1. 发送预提交请求:协调者向参与者发送PreCommit请求，并进入Prepared阶段。

2. 事务预提交:参与者接收到PreCommit请求后，会执行事务操做，并将undo和redo信息记录到事务日志中。

3. 响应反馈若是参与者成功的执行了事务操做，则返回ACK响应，同时开始等待最终指令。

如CanCommit阶段有任何一个参与者向协调者发送No响应或者PreCommit阶段的任何一个参与者返回操做失败，或者协调者等待超时以后，协调者都没有接到参与者的响应，那么就执行事务的中断。

1. 发送中断请求协调者向全部参与者发送abort请求。

2. 中断事务参与者收到来自协调者的abort请求以后（或超时以后，仍未收到协调者的请求），执行事务的中断。

doCommit阶段:

该阶段进行真正的事务提交，也能够分为如下两种状况。

执行提交:

1. 发送提交请求:协调接收到参与者发送的ACK响应，那么他将从预提交状态进入到提交状态。并向全部参与者发送doCommit请求。

2. 事务提交:参与者接收到doCommit请求以后，执行正式的事务提交。并在完成事务提交以后释放全部事务资源。

3. 响应反馈:事务提交完以后，向协调者发送Ack响应。

4. 完成事务:协调者接收到全部参与者的ack响应以后，完成事务。

中断事务:

协调者没有接收到参与者发送的ACK响应（多是接受者发送的不是ACK响应，也可能响应超时），那么就会执行中断事务。

1. 发送中断请求协调者向全部参与者发送abort请求

2. 事务回滚参与者接收到abort请求以后，利用其在阶段二记录的undo信息来执行事务的回滚操做，并在完成回滚以后释放全部的事务资源。

3. 反馈结果参与者完成事务回滚以后，向协调者发送ACK消息

4. 中断事务协调者接收到参与者反馈的ACK消息以后，执行事务的中断。

2PC与3PC区别:

相对于2PC，3PC主要解决单点故障问题，并减小阻塞，由于一旦参与者没法及时收到来自协调者的信息以后，他会默认执行commit。而不会一直持有事务资源并处于阻塞状态。可是这种机制也会致使数据一致性问题，由于，因为网络缘由，协调者发送的abort响应没有及时被参与者接收到，那么参与者在等待超时以后执行了commit操做。这样就和其余接到abort命令并执行回滚的参与者之间存在数据不一致的状况。

TCC(Try-Confirm-Cancel)方案:

TCC是由支付宝架构师提供的一种柔性解决分布式事务解决方案，TCC（Try-Confirm-Cancel）分布式事务模型相对于 XA 等传统模型，其特征在于它不依赖资源管理器（RM）对分布式事务的支持，而是经过对业务逻辑的分解来实现分布式事务。

支付宝官网提到，TCC 模型认为对于业务系统中一个特定的业务逻辑，其对外提供服务时，必须接受必定不肯定性，即对业务逻辑初步操做的调用仅是一个临时性操做，调用它的主业务服务保留了后续的取消权。若是主业务服务认为全局事务应该回滚，它会要求取消以前的临时性操做，这就对应从业务服务的取消操做。而当主业务服务认为全局事务应该提交时，它会放弃以前临时性操做的取消权，这对应从业务服务的确认操做。每个初步操做，最终都会被确认或取消。

根据具体的业务服务，TCC分布式事务模型须要业务系统提供以下三段业务逻辑:

1. 初步操做 Try：完成全部业务检查，预留必须的业务资源。

2. 确认操做 Confirm：真正执行的业务逻辑，不做任何业务检查，只使用 Try 阶段预留的业务资源。所以，只要 Try 操做成功，Confirm 必须能成功。另外，Confirm 操做需知足幂等性，保证一笔分布式事务有且只能成功一次。

3. 取消操做 Cancel：释放 Try 阶段预留的业务资源。一样的，Cancel 操做也须要知足幂等性。

TCC 分布式事务模型包括三部分：

1. 主业务服务：主业务服务为整个业务活动的发起方，服务的编排者，负责发起并完成整个业务活动。

2. 从业务服务：从业务服务是整个业务活动的参与方，负责提供 TCC 业务操做，实现初步操做（Try）、确认操做（Confirm）、取消操做（Cancel）三个接口，供主业务服务调用。

3. 业务活动管理器：业务活动管理器管理控制整个业务活动，包括记录维护 TCC 全局事务的事务状态和每一个从业务服务的子事务状态，并在业务活动提交时调用全部从业务服务的 Confirm 操做，在业务活动取消时调用全部从业务服务的 Cancel 操做。

一个完整的 TCC 分布式事务流程以下：

1. 主业务服务首先开启本地事务；

2. 主业务服务向业务活动管理器申请启动分布式事务主业务活动；

3. 而后针对要调用的从业务服务，主业务活动先向业务活动管理器注册从业务活动，而后调用从业务服务的 Try 接口；

4. 当全部从业务服务的 Try 接口调用成功，主业务服务提交本地事务；若调用失败，主业务服务回滚本地事务；

5. 若主业务服务提交本地事务，则 TCC 模型分别调用全部从业务服务的 Confirm 接口；若主业务服务回滚本地事务，则分别调用 Cancel 接口；

6. 全部从业务服务的 Confirm 或 Cancel 操做完成后，全局事务结束。

TCC 分布式事务模型仅提供两阶段原子提交协议，保证分布式事务原子性。事务的隔离交给业务逻辑来实现。TCC 模型的隔离性思想就是经过业务的改造，在第一阶段结束以后，从底层数据库资源层面的加锁过渡为上层业务层面的加锁，从而释放底层数据库锁资源，放宽分布式事务锁协议，提升业务并发性能。

总之，TCC 分布式事务模型的业务实现特性决定了其能够跨 DB、跨服务实现资源管理，将对不一样的 DB 访问、不一样的业务操做经过 TCC 模型协调为一个原子操做，解决了分布式应用架构场景下的事务问题。TCC 模型经过 2PC 原子提交协议保证分布式事务的的原子性，把资源层的隔离性上升到业务层，交给业务逻辑来实现。TCC 的每一个操做对于资源层来讲，就是单个本地事务的使用，操做结束则本地事务结束，规避了资源层在 2PC 和 2PL 下对数据库资源占用致使的性能低下问题。

基于MQ实现:

消息中间件在分布式系统中的主要做用：异步通信、解耦、并发缓冲。基于MQ实现分布式事务一致性是一种异步确保型的实现方案，将同步阻塞的事务变成异步的，避免对数据库事务的争用。

所谓的消息事务就是基于消息中间件的两阶段提交，本质上是对消息中间件的一种特殊利用，它是将本地事务和发消息放在了一个分布式事务里，保证要么本地操做成功而且对外发消息成功，要么二者都失败，阿里开源的RocketMQ就支持这一特性，具体原理以下：

事务过程分为4步:

1. A系统向消息中间件发送一条预备消息

2. 消息中间件保存预备消息并返回成功

3. A执行本地事务

4. A发送提交消息给消息中间件

经过以上4步完成了一个消息事务。对于以上的4个步骤，每一个步骤均可能产生错误，下面一一分析：

步骤1出错，则整个事务失败，不会执行A的本地操做

步骤2出错，则整个事务失败，不会执行A的本地操做

步骤3出错，这时候须要回滚预备消息，怎么回滚？答案是A系统实现一个消息中间件的回调接口，消息中间件会去不断执行回调接口，检查A事务执行是否执行成功，若是失败则回滚预备消息

步骤4出错，这时候A的本地事务是成功的，那么消息中间件要回滚A吗？答案是不须要，其实经过回调接口，消息中间件可以检查到A执行成功了，这时候其实不须要A发提交消息了，消息中间件能够本身对消息进行提交，从而完成整个消息事务。

基于消息中间件的两阶段提交每每用在高并发场景下，将一个分布式事务拆成一个消息事务（A系统的本地操做+发消息）+B系统的本地操做，其中B系统的操做由消息驱动，只要消息事务成功，那么A操做必定成功，消息也必定发出来了，这时候B会收到消息去执行本地操做，若是本地操做失败，消息会重投，直到B操做成功，这样就变相地实现了A与B的分布式事务。原理以下：

上面的方案可以完成A和B的操做，但A和B并非严格一致，而是最终一致的，这里牺牲了一致性，换来了性能的大幅度提高。因此这种玩法也是有风的，若是B一直执行不成功，那么一致性会被破坏，具体要不要玩，仍是得看业务可以承担多少风险。

总之，基于可靠消息队列的最终一致性这个假设前提，事务消息的MQ方案是目前公认的较为理想的分布式事务解决方案，各大电商都在应用这一方案。这种方式适合的业务场景普遍，并且可靠。不过目前主流的开源MQ（ActiveMQ、RabbitMQ、Kafka）均未实现对可靠消息队列及事务的支持，因此需二次开发或者新造轮子，因此也是成本最大的。

4、结束语

本文一开始讲解了什么是分布式事务及分布式事务的架构场景，而后从 XA 、2PC、3PC、TCC 、基于MQ这些典型方案，讲述了这些经常使用的分布式事务模型，介绍了其实现机制和优缺点。后续的文章咱们会详细分章节介绍主流分布式事务的技术实施细节及相关中间件。

参考连接：

https://mp.weixin.qq.com/s/dCQKjrURQ2pn1_lqWlorBg

https://blog.csdn.net/m0_37450089/article/details/80215231

转载自Itweet的博客：文章集合: http://www.itweet.cn/blog/archive

连接：

分布式系统和事务的实现原理： https://mp.weixin.qq.com/s/vrPby2KwNeFxvpHNzAu7qw

什么是分布式消息中间件？： https://www.cnblogs.com/hzmark/p/mq.html

MQ ( 16篇 ) : https://www.cnblogs.com/hzmark/category/1025980.html

Rabbitmq集群高可用部署详细： https://www.cnblogs.com/knowledgesea/p/6535766.html

.Net使用RabbitMQ详解： https://www.cnblogs.com/knowledgesea/p/5296008.html

分布式系统： https://www.cnblogs.com/hzmark/category/1203121.html

centos 系统下安装配置FastDFS步骤分享 : https://www.jb51.net/os/RedHat/61572.html

分布式文件系统设计，该从哪些方面考虑？ : https://mp.weixin.qq.com/s/cZTvaoKHqrjpj9lmbePurA

分布式事务介绍：https://mp.weixin.qq.com/s/WHWNAOK4C8wgd4CjcWviHQ

分布式文件系统：原理、问题与方法 : https://mp.weixin.qq.com/s?src=3&timestamp=1535250605&ver=1&signature=vx*N7EvfFqpmUOjwGF9wUIcxy31qP2i1s0ow3-ZGdLH8ashU2glg5Dt8yNC331AbxVfIplgM4Az-jygABJwdRjs*UoMkcbZL4xfLpnB5oRANlSb*EBajphoo0xvvY0oJ8QEDGxAYL9*wZoTLXkJnd7XxmMihBCjg*kfVpzOqEVY=

分布式文件系统FastDFS详解 ：https://mp.weixin.qq.com/s?src=11&timestamp=1535250605&ver=1083&signature=tJEC0IqAT2O5JH80u44PlSET2YirDw41lIAMCTrTgcxeAjgHeyBtOK3Ly9PlRqHM4X4iQ2Qn4AV4wnRf9J2kQeHstn0kfctbBK9F4ToYKUx*it-vx-xR-Fw7tsqAczXm&new=1

架构之路搭建FastDFS分布式文件系统 ：https://mp.weixin.qq.com/s?src=11&timestamp=1535250605&ver=1083&signature=XSeIInfunYFwfG9vcl7rTSiyJx-VSHqVP83GetVy7CH3-lvGxogfZGKGANleAgamgEBPUZVuwGAbqA-w18hdRh1BZiNqiWLg9qlTch3HAk1ePoarwGJyYk4UyU8U2ym*&new=1

分布式文件系统FastDFS如何作到高可用 ： https://mp.weixin.qq.com/s?src=11&timestamp=1535250605&ver=1083&signature=RFIh9fGMVdp8HBAViHMf4LKHRgOJvEwQsmxPF-xQFlmxyiCuhgS6LXk-8jck1H9w-HI139t419FdDIH5ghMUltp*jls9LAyzPtSJER5e-pQYrVrcOrpUYHS3QA-W8IN7&new=1

分布式文件系统FastDFS架构剖析 : https://mp.weixin.qq.com/s?src=3&timestamp=1535252384&ver=1&signature=rPPUC6IxXtg-sD2Tj*NF89QdXmOOJtvp9x-bO*AcH*TGv7YbB3QOGkrDTysmxxHp3MYyAV*j268PdOjOKTFUzdC9SWoU9nVFpE-XtdrIs446XLn7cfHpApTqXQ*yOKCfcupOenuevak3fKzJG1PAFg==

干货 | 分布式文件系统 - FastDFS（一） : https://mp.weixin.qq.com/s?src=3&timestamp=1535252618&ver=1&signature=*kjuZWR9tISwgU4sdz8HLpyAuBYPKIbizZYd8Tb3-I1U9UpdrYgPb5a7QbEdBsUWtUqNynKCQv**M2I1t9IjWSc0Yuggt13xjI2zM-TqsNeSPxLbz3SpjMmw4*Ivhg2YqnpBvCdDwMsp0X4ubQ8hfX0Udpq3qp84GPS1fU3O22w=

FastDFS高性能分布式文件系统 ：https://mp.weixin.qq.com/s?src=11&timestamp=1535252618&ver=1083&signature=kgl8ktTnJRr4pOzJKXFD7pS*d7aDLXCUuiFpjPQBonmZmR*I-DeSqUv9yiDw5UwiQYQTPFL62PdK*V7*zcpTJrhR1nbRkaIQUyxVev28VBN8674EHg9bHq2pt6v1IREx&new=1

干货 | 分布式文件系统 - FastDFS 配置 Nginx 模块及上传测试（完结篇） ：https://mp.weixin.qq.com/s?src=3&timestamp=1535252618&ver=1&signature=*kjuZWR9tISwgU4sdz8HLpyAuBYPKIbizZYd8Tb3-I1LoeT0MTN*D6jQMDYLcSEDO-pWGC*m-5bXHud4fWJHjDMseLinSt1sVQ-99IBTKSHiO*4-nK5h9Y-WA1wtdh1xjAZodfn0jOoUh6OyaPzAayEHzsbdTsBO4Dxlhri2V*8=

干货 | 分布式文件系统 - FastDFS 在 CentOS 下配置安装部署 ：https://mp.weixin.qq.com/s?src=3&timestamp=1535252618&ver=1&signature=*kjuZWR9tISwgU4sdz8HLpyAuBYPKIbizZYd8Tb3-I3szzLAqcQXYlAhjLSRmUeb4YyXsA5gErU*JFC6*Avsa8*aAuimt6LQsQtdAG-bx2lfJbiCub1Veb3FQOXUMByA5qPA-ha8WTvF4kZV2xz4dJiSa5mzEiqddSqxQdATKkk=

项目架构之FastDFS分布式文件系统 : https://mp.weixin.qq.com/s?src=11&timestamp=1535267942&ver=1083&signature=qslhqnZEz9zvCjKPlGtWkToFbQ1oAVd0ctTiDBoaIeYTomVToickyVHKpCiMlXSRCJLM0N0FMHltQagMjo1NjhYZehE6*jFaqe28AgTjdoWex6R7lWMhUL8A7uu9UKG3&new=1

FastDFS分布式文件系统 : https://mp.weixin.qq.com/s?src=11&timestamp=1535267942&ver=1083&signature=ncBzyxafFAXv-iQUpp83emAbqq0ot0G3DMDBNYhv0IohbCH1qKfKWQt5UvsYUWj8*Olc7W7Z6FFhmqD1JNTNm1AfquRh3Rdl3wIcUmMSidy1OBtaMUB2eSGPZFoTNm8K&new=1

FastDFS 分布式文件系统的安装与使用（单节点） : https://mp.weixin.qq.com/s?src=11&timestamp=1535267942&ver=1083&signature=75cVDME8QkLJwTyFRc9sfsmZW0FpgPnEh9fp4bJQlMxRouDi98UN*lke0qbRiBC6qKKXgfqUWv6mLTy*PPr*BJvdePOBTDNO0E3B0Oc7dEDQdCGUuqbz6ITFIMc-kimQ&new=1

分布式文件系统FastDFS介绍及搭建部署完整流程 : https://mp.weixin.qq.com/s?src=11&timestamp=1535268195&ver=1083&signature=2SFG3TxTLfbegAfMoHBvmuFB*acd9I6HeQR0TspIeZAwJkqKuwgxsHY4DyVLs*6cLCGb*StyeMP*nbDobNdeX7BI1Em2F6EA-pzq9hw5e3pZYU-rNq7X9BO-3Mbw4P0u&new=1

分布式文件管理系统FastDFS ： https://mp.weixin.qq.com/s?src=11&timestamp=1535269195&ver=1083&signature=dpgkjQy4jb0hihpDqRmBKtHywEx8yu4w4oLZ75T7sHhZPUySM-bkoszg857a91sV9bJIa3xa-DDdXPuYQpDgZ1wOwOCWMNQAwA8CTVLaEu35ISoTFq1VXndFyUm8WmB*&new=1

分布式 or SAN文件系统、SAS交换为什么普及难？ ： https://mp.weixin.qq.com/s?src=3&timestamp=1535269195&ver=1&signature=HAa4AgVAbUJmuheQjSSZGZcnuaSy4vC55F*SKwDMJzxmk-ULk2sRiT9XLoNgFGfQDxuJg0IJWn2uUAGLkdDz7K6fuVw2kLUDwLghPtbC0YqD6aIK2FRgcwgJFr9AMBXaNL25GQKhOi*fwwwjX-RS4A==

案例：HDFS分布式文件系统 : https://www.sogou.com/tx?ie=utf-8&hdq=sogou-addr-cc9657884708170e&query=%E6%A1%88%E4%BE%8B%EF%BC%9AHDFS%E5%88%86%E5%B8%83%E5%BC%8F%E6%96%87%E4%BB%B6%E7%B3%BB%E7%BB%9F

GlusterFS分布式文件系统使用简介: https://mp.weixin.qq.com/s?src=3&timestamp=1535252384&ver=1&signature=L1C7usG9nhuvVUS9dkoQ4L0C3uwt3mRI*sGWWChs3izzW7cdYuNpkTK2HixU11NmRGlUrsm1K*35IxNR8BaJr561nAgXz0IykwhfoLRZyNhqRZ*-D8iFCP73NxgDnXNR0NELUHpYeKpQcEkjLICPfG1Yb5dJUIqC2yP8zjMFz1w=

Gluster FS分布式文件系统 : https://mp.weixin.qq.com/s?src=3&timestamp=1535268195&ver=1&signature=VKBEOhsvHdcT1qUa778fPvxtVbYBJ6IWJS0O9tJvlAwq1MlxQ1cj8YCQtSFYtvUMB-AR-PgOXJpa9rxy0OZTKzTVk7ONpFX-CbFpPBTuqC3b-XivI0aWu7JEaHZcTPVr7BEXbtjV8OKovjZXz8OX6g==

Google分布式文件系统（GFS） : https://mp.weixin.qq.com/s?src=3&timestamp=1535268195&ver=1&signature=ZEtptritsk29pYA7lHS-7wjBZnSHIMvaTujfm5i-6CCEYCOaePbdZtRwDFnNpSI4xdBJAKiZTGPiRF4KUEoI*twryqyswxfjk0Tp91CG2nWkAOYs6qyTj8LpNdscOq0EE-boP3IzR1p2u-n5-ptqHQ==

分布式文件系统Mogilefs介绍 : https://mp.weixin.qq.com/s?src=3&timestamp=1535252384&ver=1&signature=L1C7usG9nhuvVUS9dkoQ4L0C3uwt3mRI*sGWWChs3ix9ur8Uf1*Kp9gNB4agA2U1I5MC1mDnarFJEQR2GEuo2ptOFDHTrIvoqRn2SZ9dpWCMobg*UktDl*VNu*PQ8*sAiX0AWTWa9W6QuD2O2EvtwNZ3lnvttqmMVeW-HwOpMl4=

淘宝分布式文件系统TFS设计 : https://mp.weixin.qq.com/s?src=3&timestamp=1535252384&ver=1&signature=rPPUC6IxXtg-sD2Tj*NF89QdXmOOJtvp9x-bO*AcH*Tw6hUV6maokZVrSdQO7XR35iyGbiHENEflmAwsOrdsy7dMJ*mp3o1VX1SqqAnEZJc7as2WZeApDCBzF5FZkJXCd16gRA25TIdx388pwatDfg==

spark

浅谈Spark RDD API中的Map和Reduce ： https://www.jb51.net/article/126333.htm

Spark三种属性配置方式详解 : https://www.jb51.net/article/126324.htm

Spark实现K-Means算法代码示例 : https://www.jb51.net/article/126031.htm

Spark运行时产生的临时目录的问题 : https://www.ixdba.net/archives/2018/08/1250.htm

spark client mode和cluster mode的区别 : https://www.ixdba.net/archives/2018/08/1233.htm

Spark多种运行模式以及每种模式的执行方法 : https://www.ixdba.net/archives/2018/08/1192.htm

扫盲：Hadoop分布式文件系统（HDFS）基础概念讲解！：https://mp.weixin.qq.com/s?src=11&timestamp=1535252618&ver=1083&signature=i1zSWfI8X*TgJufQD4xkjNdw*ENFDeFKwWIKp4H3Eser3t6q6OhLpgl1CR1tjdbj8tV05FQuLOsGwxqeqoneL9U-kBZc0*gZz8ZtGVBKBVw4gTJB7HN6OrBpIpaH576B&new=1

区块链给咱们带来什么-IPFS分布式文件系统 ：https://mp.weixin.qq.com/s?src=11&timestamp=1535252618&ver=1083&signature=-y0HgciTaSc1dZeKKaZJDZB0DGu3ZObLE*r60JWE3Ce1qnpQxDKBeBSDSLtoulJ39CUQ88KDaLTTme1HMA4rt34Je6E6*-N*-AesmDpzcKpxBLfHcUbeICU3Q*pE3FqZ&new=1

IPFS—点对点的分布式文件系统（三）：https://mp.weixin.qq.com/s?src=11&timestamp=1535267655&ver=1083&signature=QSxEFMEKiHFYTzOWfJQf40XNSWkWRAFKqSjV5Qsb5rQk1olMHWPnu4oS4ivoPDFVodPt2ubKGEOHbRK8sOSwzNzQLf44xO8LUiN0ml6yUcL0iYUcyC3MGlDZbFedv3EA&new=1

IPFS—点对点的分布式文件系统（二）：https://mp.weixin.qq.com/s?src=11&timestamp=1535267655&ver=1083&signature=QSxEFMEKiHFYTzOWfJQf40XNSWkWRAFKqSjV5Qsb5rQ9TBGYWvxUMYOyO-gOqdiw1SN-Uxe2pdHmf7ZiCoMo4AFiTJnGFwz6zVNAs5UTfGApkUasu*OetC6CzNcyoxrX&new=1

IPFS —— Go 实现的分布式文件系统 : https://mp.weixin.qq.com/s?src=3&timestamp=1535268195&ver=1&signature=CpfJpQymWKMovehcjRVjTEhRqVpDyV9*k9OyZXNcFpU9Al2c8UxBcSWuKW8ojJWlK19T40acSVTDLsmcVBw8hdQB5*ohu-3T1ZLw7D0Vm6s2J1g7fiJXureOwEjpET*ORF*mjkeeLdQqxhGdqesGkg==

【焦点】分布式文件系统的备份 : https://mp.weixin.qq.com/s?src=11&timestamp=1535268195&ver=1083&signature=f1w746*FM9IBHTdftKDO9ZJjf5EQj5FlHdJ5d2i32eQXnrKqGVygsELs6-pscy7L2csSZOyyo0viNk*z8hPVwOrpyzPypOCflQroodGUp-G9OfyBZ3WDiaOA3KZLQaM0&new=1

常见的分布式文件系统介绍： http://blog.csdn.net/xyw591238/article/details/51441250

MongoDB GridFS 数据读取效率 benchmark
http://blog.nosqlfan.com/html/730.html

nginx + gridfs 实现图片的分布式存储安装（一年后出问题了）

http://www.cnblogs.com/zhangmiao-chp/archive/2011/05/05/2038285.html

基于MongoDB GridFS的图片存储

http://liut.cc/blog/2010/12/about-imsto_my-first-open-source-project.html

nginx+mongodb-gridfs+squid

http://1008305.blog.51cto.com/998305/885340

分布式锁 : https://mp.weixin.qq.com/s/frT3AlgX1M4bcdIbfMXpNQ

分布式基础学习（1）--分布式文件系统 :https://mp.weixin.qq.com/s?src=3&timestamp=1535252384&ver=1&signature=vx*N7EvfFqpmUOjwGF9wUIcxy31qP2i1s0ow3-ZGdLH8ashU2glg5Dt8yNC331Ab0XbKro9HyKPm5KDGTuYe91sjfnkDgORhgGMc7Eqy9BOh51cYMYWZMJEP293D3J3SmQ*mzMZtnbMWP-woPrHSDsvKQce4pDpbAF*UPJHd6CA=

常见分布式文件系统大盘点：https://mp.weixin.qq.com/s?src=11&timestamp=1535267655&ver=1083&signature=0WeQe5IIK7M40bOO4tFi*eX3lgMVGP4GiOa6bVM7YrrkskoLX2iFl3-k*r9c-V5BD2Z*gEIEHQRSjDp9*DhpWKTND7Jgfj*ou5BSm1vEwgdL3PuRgRtyHF7ZQAm8KINB&new=1

轻松搭建分布式文件系统 : https://blog.csdn.net/m0_37450089/article/details/80215231

分布式系统的高效运维要点： https://blog.csdn.net/chdhust/article/details/78238599

分布式系统failover测试之拔盘插盘操做 : https://blog.csdn.net/chdhust/article/details/53131599

搭建分布式文件系统 : https://ericfu.me/build-distributed-file-system/

大数据： https://ericfu.me/archives/

HDFS的诞生 : https://mp.weixin.qq.com/s/x73Z-bBXXibbPvmMPxzwwQ

分布式系统之数据分片 : http://www.cnblogs.com/xybaby/p/7076731.html

分布式事务及通用解决方案 : https://mp.weixin.qq.com/s/3juaRe2iqi3iUOWMEkANoQ

大数据之数据采集 : https://mp.weixin.qq.com/s/36UfbwxukYf1FI3LQdpZXw

Cache一致性协议之MESI : https://mp.weixin.qq.com/s/jm8Nd49YIdwYf0jzDlTOXg

百度开源架构-分布式锁dlock : https://mp.weixin.qq.com/s/IZkoh1BY6vLNqtkti7EyIw

Kafka 系列：

CentOS7上如何安装Kafka?CentOS7上安装Kafka教程 : https://www.jb51.net/os/RedHat/541702.html

CentOS上使用Squid+Stunnel搭建代理服务器教程： https://www.jb51.net/os/RedHat/415615.html

分离式or超融合，分布式存储建设时的两种部署模式： https://www.jianshu.com/p/611b7c179df8

分布式应用：

一文详解分布式系统数据分片难题 ： https://mp.weixin.qq.com/s/vwshiESDGqrvAtOQaBNKPg难题

分布式系统的架构思路 : http://blog.51cto.com/13904503/2164247

大型分布式网站架构：缓存在分布式系统中的应用： https://blog.csdn.net/qq_39627461/article/details/81007454

大型分布式网站架构：缓存在分布式系统中的应用 : http://www.cnblogs.com/AIPAOJIAO/p/9326084.html

阿里分布式服务框架Dubbo的架构总结 : https://www.cnblogs.com/AIPAOJIAO/p/9294215.html

大型网站架构系列：分布式消息队列（一）： https://mp.weixin.qq.com/s/eRpvdD5Udvwdj4mrAfQFBg

大型网站架构系列：消息队列（二） : https://mp.weixin.qq.com/s/BSXP9DEEc7HNQD3kRozSXQ

大型网站架构系列：缓存在分布式系统中的应用（一）： https://mp.weixin.qq.com/s/xp_qZToZAbLnmfo8rq39Vg

大型网站架构系列：缓存在分布式系统中的应用（二） : https://mp.weixin.qq.com/s/CnyMkOMrzLLKDZ2FQRfJ9w

大型网站架构系列：缓存在分布式系统中的应用（三）：https://mp.weixin.qq.com/s/zDRITPG8Qbeg2mRnUfzxaQ

大型网站架构系列：电商网站架构案例(3) : https://mp.weixin.qq.com/s/qgNKu4wOKeTCfIJNgKT2Rw

大型分布式网站架构技术总结： https://mp.weixin.qq.com/s/ozG0tss4JREx8txLnORQFw

负载均衡详解

大型网站架构系列：负载均衡详解（1）： https://mp.weixin.qq.com/s/xbtLnhT42clXsuiP-C9bDg

大型网站架构系列：负载均衡详解（2） : https://mp.weixin.qq.com/s/ufpGLqCWlE0LlqdlIRB3Eg

大型网站架构系列：负载均衡详解（3） : https://mp.weixin.qq.com/s/uaCykNu4diXpqOPCz4YZJg

大型网站架构系列：负载均衡详解（4） : https://mp.weixin.qq.com/s/vWW5H3sTaSkAieN299a4bw

Glusterfs

CentOS 6.5安装部署Glusterfs : http://blog.51cto.com/zlyang/1690055

换个角度看GlusterFS分布式文件系统 : http://blog.51cto.com/zlyang/1684400

glusterfs——volume管理 : http://blog.51cto.com/zlyang/1684311

分布式文件系统HDFS解读 : https://mp.weixin.qq.com/s/kXRLnOuRCWCEv9Bz-dJ9Ig

FastDFS 系统

CentOS7搭建FastDFS+Nginx : http://blog.51cto.com/ygqygq2/2091651

fastdfs添加新group注意事项 : http://blog.51cto.com/ygqygq2/2136589

VMware下CentOS6.8配置GFS文件系统： http://blog.51cto.com/ygqygq2/1871300

分布式文件系统FastDFS详解 : https://www.cnblogs.com/ityouknow/p/8240976.html

那必定都是你的错！- 一次FastDFS并发问题的排查经历 : https://www.cnblogs.com/ityouknow/p/8123998.html

FastDFS 集群安装配置 : https://www.cnblogs.com/ityouknow/p/7769142.html

分布式文件系统FastDFS架构剖析： https://www.ixdba.net/archives/2014/04/311.htm

大型网站架构系列：电商网站架构案例(1) ： https://mp.weixin.qq.com/s/W8n3tkH6cAT4OyXbxqzw2g

大型网站架构系列：电商网站架构案例(2) ： https://mp.weixin.qq.com/s/j5c75ePAIwPmRI9VlCzfhA

大型网站架构系列：电商网站架构案例(3) ： https://mp.weixin.qq.com/s/qgNKu4wOKeTCfIJNgKT2Rw

分布式一致性系统的动态替换实现机制

1. Paxos成员组变动

http://oceanbase.org.cn/?p=160

Paxos & Raft 分布一致性算法 Slideshare ： https://ericfu.me/paxos-raft-share/

2. 如何完美实现Paxos算法成员组变动
http://www.sohu.com/a/136589596_446710

Openshift Origin

Openshift Origin v1.3.x新增功能部署-Centos7　　　　　　：　http://www.pangxie.space/docker/1182

Openshift Origin版本升级(v1.2.x->v1.3.x)-Centos7　　　　　： http://www.pangxie.space/docker/1176

在openshift部署fabric8-Centos7 ： http://www.pangxie.space/docker/1154

搭建分布式Openshift Origin-Centos7 ： http://www.pangxie.space/docker/989

搭建单机版Openshift Origin-Centos7 ；http://www.pangxie.space/docker/964

分布式与大数据系统 (80篇) : https://blog.csdn.net/chdhust/article/category/2202603

分布式一致性 (43) : https://blog.csdn.net/chdhust/article/category/5650785

分布式存储系统 (22): https://blog.csdn.net/chdhust/article/category/1384021

分布式消息系统 (23) : https://blog.csdn.net/chdhust/article/category/2472965

分布式日志系统 (7) : https://blog.csdn.net/chdhust/article/category/2302509

分布式服务框架 (2) : https://blog.csdn.net/chdhust/article/category/5642291

分布式集群管理 (2) : https://blog.csdn.net/chdhust/article/category/5643953

分布式数据库 (3) : https://blog.csdn.net/chdhust/article/category/2559193

安全技术研究 : https://blog.csdn.net/chdhust/article/category/2289747

大数据：

大数据学习路线： https://mp.weixin.qq.com/s/P0JFoDo5kTp81_eZOvfnEg

大数据在电竞平台的应用： https://mp.weixin.qq.com/s/P0JFoDo5kTp81_eZOvfnEg

W3Cschool

Apache Pig教程： https://www.w3cschool.cn/apache_pig/

Apache Kafka 教程： https://www.w3cschool.cn/apache_kafka/

Apache Storm教程： https://www.w3cschool.cn/apache_storm/

Hadoop教程： https://www.w3cschool.cn/hadoop/

impala教程 : https://www.w3cschool.cn/impala/

Zookeeper教程 : https://www.w3cschool.cn/zookeeper/

RabbitMQ

如何用好消息队列RabbitMQ？ : https://www.jianshu.com/p/b39e5edf3e5c

缓存

Memcached (第一篇) : https://www.cnblogs.com/kissdodog/p/3549488.html

缓存概述 : https://www.cnblogs.com/kissdodog/archive/2013/05/23/3094830.html

System.Web.Caching.Cache类缓存各类缓存依赖 : https://www.cnblogs.com/kissdodog/archive/2013/05/07/3064895.html

Hibernate

Hibernate 高级教程： http://www.voidcn.com/course/project/ooabed

Hibernate 教程（程序园博客）： http://www.voidcn.com/course/project/rmpfby

【转载整理】Hibernater的锁机制 : https://www.cnblogs.com/yingsong/p/7646313.html

（Clob的写入和读取-java）更新数据库报错：SQL Error: 1461, SQLState: 72000 ORA-01461: 仅能绑定要插入 LONG 列的 LONG 值 : https://www.cnblogs.com/yingsong/p/5685790.html

Hibernate 操做 oracle数据库，报错总结 : https://www.cnblogs.com/yingsong/p/5283863.html

Hibernate关联关系（二） Cascade级联 : https://www.cnblogs.com/yingsong/p/5197828.html

【转载】Hibernate 关联关系 : https://www.cnblogs.com/yingsong/p/5197826.html

Hibernate JPA实体继承的映射(一) 概述 : https://www.cnblogs.com/yingsong/p/5179975.html

Hibernate JPA实体继承的映射(二) @MappedSuperclass : https://www.cnblogs.com/yingsong/p/5179961.html

Mycat

Mycat学习实战-Mycat读写分离 : http://blog.51cto.com/ygqygq2/1981542

Mycat学习实战-Mycat分片 : http://blog.51cto.com/ygqygq2/1981540

Mycat学习实战-Mycat全局主键 : http://blog.51cto.com/ygqygq2/1976279

Mycat学习实战-Mycat的zookeeper集群模式 : http://blog.51cto.com/ygqygq2/1974592

Mycat学习实战-Mycat基本功能 : http://blog.51cto.com/ygqygq2/1974299

Mycat学习实战-Mycat初识 : http://blog.51cto.com/ygqygq2/1973653

MyBatis 文档： http://www.voidcn.com/course/project/ejatyd

Apache

原 Kafka安全认证SASL下附带工具的配置使用 : https://blog.csdn.net/u012842205/article/details/73648170

原 Apache Kafka0.10.0.0集群部署 : https://blog.csdn.net/u012842205/article/details/73250288

原集群Kafka配置SASL用户名密码认证 : https://blog.csdn.net/u012842205/article/details/73188684

原单机节点Kafka配置SASL用户名密码认证 : https://blog.csdn.net/u012842205/article/details/73188534

原 Apache Cassandra3.10集群安装部署 : https://blog.csdn.net/u012842205/article/details/72781463

原 Apache Hive2.1.1安装部署 : https://blog.csdn.net/u012842205/article/details/71713842

HBase

原 HBase概述 : https://blog.csdn.net/u012842205/article/details/52267263

原 HBase使用总结 : https://blog.csdn.net/u012842205/article/details/52267291

原 Hbase增删改查、关联查询、关系型数据库转化： https://blog.csdn.net/ioy84737634/article/details/52554605

hbase分布式集群搭建 : https://www.cnblogs.com/ityouknow/p/7343996.html

HBase shell 命令介绍 : https://www.cnblogs.com/ityouknow/p/7344001.html

HBase高可用原理与实践 : https://mp.weixin.qq.com/s/BlG7qYL12Hbjl4nYSr8_nA

原 Sqoop1.4.6安装与使用（一） : https://blog.csdn.net/u012842205/article/details/53377103

原 Sqoop1.4.6安装与使用（二） : https://blog.csdn.net/u012842205/article/details/53378703

GPFS分布式文件系统在云计算环境中的实践： http://www.talkwithtrend.com/Article/218939

Mfs分布式文件系统总结： http://blog.51cto.com/11638832/1969271

MFS分布式文件系统 : http://blog.51cto.com/11638832/1873980

分布式文件系统之MooseFS----管理优化荐： http://blog.51cto.com/nolinux/1602616

分布式文件系统之MooseFS----部署： http://blog.51cto.com/nolinux/1601385

分布式文件系统之MooseFS----介绍荐： http://blog.51cto.com/nolinux/1600890

分布式文件系统--MogileFS 荐： http://blog.51cto.com/guoting/1561354

分布式存储系统MogileFS（一）之基本概念： http://blog.51cto.com/cuchadanfan/1699333

分布式存储系统MogileFS（二）之简单配置： http://blog.51cto.com/cuchadanfan/1699335

GalaCloud分布式加密存储网络 : https://mp.weixin.qq.com/s/eXQYQh3Zi3bclJwdoTxYSQ

Kafka

Kafka简明教程： https://www.jianshu.com/p/3d178a233bfa

kafka丢数据问题分析： https://www.jianshu.com/p/954d3c75500d

kafka 无消息丢失配置转： https://www.jianshu.com/p/0898406ccbae

KAFKA 删除 topic ： https://www.jianshu.com/p/f55136b86adb

spark向kafka写入数据(转) ： https://www.jianshu.com/p/cea421e72dec

Flume+Kafka收集Docker容器内分布式日志应用实践 : https://mp.weixin.qq.com/s/DWD6N6q4ECCuB-wrCjk0OA

kafka权威指南第二章第6节 Kafka集群配置与调优 : https://mp.weixin.qq.com/s/MbFMnU_r9lFvLnA2bJuSsQ

kafka 数据可靠性深度解读 :https://mp.weixin.qq.com/s/in4qytXdE7GwHrE2JNYbDw

Spark

Spark入门基础教程 : https://www.jianshu.com/p/05d64ec96781

https://www.cnblogs.com/atomicbomb/tag/Spark/

Spark sql读取数据库和ES数据进行处理代码： https://www.cnblogs.com/atomicbomb/p/6678531.html

spark streaming的理解和应用： https://www.cnblogs.com/atomicbomb/p/6834447.html

Spark on Yarn with Hive实战案例与常见问题解决荐 : http://blog.51cto.com/xpleaf/2296151

Spark on Yarn做业运行架构原理解析 : http://blog.51cto.com/xpleaf/2294303

Spark做业运行架构原理解析 : http://blog.51cto.com/xpleaf/2293921

日志分析实战之清洗日志小实例1：使用spark&Scala分析Apache日志 : https://mp.weixin.qq.com/s/8Hnhk9HbB4T5byvWLQSOmg

Spark笔记整理（四）：Spark RDD算子实战 : http://blog.51cto.com/xpleaf/2108481

Spark笔记整理（五）：Spark RDD持久化、广播变量和累加器 : http://blog.51cto.com/xpleaf/2108614

Spark笔记整理（六）：Spark高级排序与TopN问题揭密 : http://blog.51cto.com/xpleaf/2108763

Spark笔记整理（十三）：RDD持久化性能测试（图文并茂） : http://blog.51cto.com/xpleaf/2288316

分布式惟一ID的几种生成方案： https://mp.weixin.qq.com/s/Klmyffj5oVejHjg81vSe5w

经常使用的分布式事务解决方案 : https://mp.weixin.qq.com/s/_Tz9z1tGxcrICsXqH8gDhQ

分布式数据库在商业银行设计与实践相关的20个问题 ： https://mp.weixin.qq.com/s/ByD1PSdxayVDFA_c1LZ4Pw

分布式数据库TiDB在商业银行的设计与实践

http://www.talkwithtrend.com/Document/detail/tid/419235

TiDB集群安装

http://www.talkwithtrend.com/Document/detail/tid/419205

postgresql分布式数据库架构

http://www.talkwithtrend.com/Document/detail/tid/418759

Greenplum数据库最佳实践

http://www.talkwithtrend.com/Document/detail/tid/418755

分布式事务概述 （资料）

什么是分布式系统

分布式的体系模块

扩展

大数据组成部分

分布式系统挑战

分布式系统特性

分布式构架图

概念与实现

只读数据存储

冗余解决方案

1、什么是事务

2、分布式事务一致性指导方案

3、指导方案分析

分布式系统和事务的实现原理 ： https://mp.weixin.qq.com/s/vrPby2KwNeFxvpHNzAu7qw

什么是分布式消息中间件？ ： https://www.cnblogs.com/hzmark/p/mq.html

Rabbitmq集群高可用部署详细 ： https://www.cnblogs.com/knowledgesea/p/6535766.html

.Net使用RabbitMQ详解 ： https://www.cnblogs.com/knowledgesea/p/5296008.html

分布式系统 ： https://www.cnblogs.com/hzmark/category/1203121.html

分布式文件系统设计，该从哪些方面考虑？ : https://mp.weixin.qq.com/s/cZTvaoKHqrjpj9lmbePurA

分布式锁 : https://mp.weixin.qq.com/s/frT3AlgX1M4bcdIbfMXpNQ

轻松搭建分布式文件系统 : https://blog.csdn.net/m0_37450089/article/details/80215231

搭建分布式文件系统 : https://ericfu.me/build-distributed-file-system/

HDFS的诞生 : https://mp.weixin.qq.com/s/x73Z-bBXXibbPvmMPxzwwQ

分布式系统之数据分片 : http://www.cnblogs.com/xybaby/p/7076731.html

分布式事务及通用解决方案 : https://mp.weixin.qq.com/s/3juaRe2iqi3iUOWMEkANoQ

大数据之数据采集 : https://mp.weixin.qq.com/s/36UfbwxukYf1FI3LQdpZXw

Cache一致性协议之MESI : https://mp.weixin.qq.com/s/jm8Nd49YIdwYf0jzDlTOXg

百度开源架构-分布式锁dlock : https://mp.weixin.qq.com/s/IZkoh1BY6vLNqtkti7EyIw

大型网站架构系列：消息队列（二） : https://mp.weixin.qq.com/s/BSXP9DEEc7HNQD3kRozSXQ

大型网站架构系列：负载均衡详解（2） : https://mp.weixin.qq.com/s/ufpGLqCWlE0LlqdlIRB3Eg

大型网站架构系列：电商网站架构案例(1) ： https://mp.weixin.qq.com/s/W8n3tkH6cAT4OyXbxqzw2g

大型网站架构系列：电商网站架构案例(2) ： https://mp.weixin.qq.com/s/j5c75ePAIwPmRI9VlCzfhA

大数据在电竞平台的应用 ： https://mp.weixin.qq.com/s/P0JFoDo5kTp81_eZOvfnEg

Apache Pig教程 ： https://www.w3cschool.cn/apache_pig/

Apache Kafka 教程 ： https://www.w3cschool.cn/apache_kafka/

Apache Storm教程 ： https://www.w3cschool.cn/apache_storm/

Hadoop教程 ： https://www.w3cschool.cn/hadoop/

impala教程 : https://www.w3cschool.cn/impala/

Zookeeper教程 : https://www.w3cschool.cn/zookeeper/

缓存

Hibernate

Hibernate 高级教程 ： http://www.voidcn.com/course/project/ooabed

Hibernate 教程 （程序园博客）： http://www.voidcn.com/course/project/rmpfby

MyBatis 文档 ： http://www.voidcn.com/course/project/ejatyd

kafka 数据可靠性深度解读 :https://mp.weixin.qq.com/s/in4qytXdE7GwHrE2JNYbDw

分布式事务概述（资料）

分布式系统和事务的实现原理： https://mp.weixin.qq.com/s/vrPby2KwNeFxvpHNzAu7qw

什么是分布式消息中间件？： https://www.cnblogs.com/hzmark/p/mq.html

Rabbitmq集群高可用部署详细： https://www.cnblogs.com/knowledgesea/p/6535766.html

.Net使用RabbitMQ详解： https://www.cnblogs.com/knowledgesea/p/5296008.html

分布式系统： https://www.cnblogs.com/hzmark/category/1203121.html

大数据在电竞平台的应用： https://mp.weixin.qq.com/s/P0JFoDo5kTp81_eZOvfnEg

Apache Pig教程： https://www.w3cschool.cn/apache_pig/

Apache Kafka 教程： https://www.w3cschool.cn/apache_kafka/

Apache Storm教程： https://www.w3cschool.cn/apache_storm/

Hadoop教程： https://www.w3cschool.cn/hadoop/

Hibernate 高级教程： http://www.voidcn.com/course/project/ooabed

Hibernate 教程（程序园博客）： http://www.voidcn.com/course/project/rmpfby

MyBatis 文档： http://www.voidcn.com/course/project/ejatyd