一种异构数据库同步的简单方法

  标题有点高大上,是为了解决实际应用中的一个问题。作了一个Android应用,用于记录平常消费帐单,开始是单机版的,我老婆说太low了,起码要能看到彼此的消费状况吧。为此,我还专门写了一套基于protobuf的RPC组件,用于网络通讯,http://www.cnblogs.com/zmkeil/p/5176758.html。html

  应用自己比较简单,几张简单粗暴的UI,涵盖了增、删、改各类功能,外加一个后台service组件,用于上传帐单,并同步他人帐单。也算是麻雀虽小五脏俱全吧,看几张效果图。代码见https://github.com/zmkeil/MyBill,能够直接安装使用,不想帐单被我偷窥的话,在配置中将服务器地址乱填便可。mysql

        

要作的事情

  言归正传,按照DBA的工做方式,数据库同步的最简单方法就是把一个库上的全部操做,完彻底全地在另外一个库上执行一遍,mysql的主从库,就是利用binlog来复制全部的insert、update、delete等操做,来实现同步的,这其实也是一种增量同步的思想。借鉴这一思想,在这个应用中咱们主要作两个事情:android

  1. 把本身的帐单操做上传到服务端;
  2. 把别人的帐单操做从服务端同步下来。

这里为了把复杂度降到最低,咱们只定义了两种帐单操做:insert、update。在表中增长一个is_deleted字段,update该字段来实现删除功能。
  把握一个最基本的原则,服务端只负责记录帐单操做,不保存任何客户端的状态(如已经同步了哪些操做等),换而言之,服务端只提供最基本的需求:1)有新操做来,我把操做写到数据库中,而且把该操做记录下来,供别人同步;2)要同步别人的操做,那你须要提供从哪一条开始同步,最多同步多少条等操做。git

接口预览

首先看一下protobuf-rpc的service,很是简单,只有一个接口。github

package microbill;
option cc_generic_services = true;

message Record {
  enum Type {
    NEW = 0;
    UPDATE = 1;
  }
  required Type	type = 1;
  required string	id = 2;
  required fixed32 year = 3;
  required fixed32 month = 4;
  optional fixed32 day = 5;
  optional fixed32 pay_earn = 6;
  optional string gay = 7;
  optional string comments = 9;
  optional fixed32 cost = 10;
}

message BillRequest {
  required string gay = 1;

  // push self's records
  repeated Record records = 2;

  // pull other's records
  optional fixed32	begin_index = 3;
  optional fixed32	max_line = 4 [default = 10];
}

message BillResponse {
  required bool	status = 1;
  optional string	error_msg = 2;

  repeated Record	records = 4;
}

service BillService {
  rpc update(BillRequest) returns (BillResponse);	
}

Request有三方面信息:sql

  • 当前用户是谁
  • 本次要上传的帐单操做(能够为空,已经所有上传完了)
  • 须要同步的别人的帐单操做的起始index(是以 1,2,3… 这样编号的,具体实现见后面),以及最多同步几个操做(防止数据包过大)。

Response有两方面信息:数据库

  • 本次上传是否成功
  • 若是别人有新操做的话,records中记录了别人的新操做。

具体实现

  下面来看具体的实现。android中固然是使用了sqlite来记录帐单,服务端则采用mysql。应用自己不须要实时性,但要可靠,不能出现数据重复、缺失等。客户端上程序运行的周期很短,用户可能打开记录一下就关闭了,并且网络也不必定开启。服务端的运行环境就相对稳定不少,程序能够一直运行(只要不crash),网络也较稳定。重点要解决的问题:数组

  1. 客户端如何知道哪些操做已经成功上传了,还有那些操做等待上传?
  2. 服务端接收到多个用户上传上来的操做,怎么保存、管理,才能方便地供别人来同步?
  3. 客户端怎么记录已经同步了别人的哪些操做?

  第一个问题,主要针对第一个事情。这个比较简单,纯粹是客户端上的事,不须要服务端配合。能够参考mysql的binlog思想,专门以一个records.txt文件来记录全部的操做,格式以下:服务器

index	    operate	    id

一、index从1开始,依次递增,惟一标示该次操做。这样就能够用另外一个文件updated_index.txt来记录已经上传到了哪一条(是顺序上传的),这个文件很是简单,只要记录一个index便可。那么下次上传时,首先根据updated_index.txt找到须要上传的起始index,而后到records.txt中去找(直接seek到第index行便可),每次默认上传2条操做。仅当response.status = true时,才更新updated_index.txt文件(即原index += 2)。这里有两个问题:网络

  • 日积月累,records.txt会不会很大,每次上传都从头开始seek会很耗性能。这里我按照月份分隔了,每月单独记一份文件。服务端就不会有这问题,由于数据是常住内存的。
  • 有时候因为网络问题,一次上传已经到了服务端,服务端作了更新,可是response却没能正确回到客户端,那么客户端就不会更新updated_index.txt,下次会重复上传这些操做记录。不要紧,服务端入库时作了去重(很简单,只要使用primary key的特性便可);可是仍然记录到操做列表中了,别的客户端会下载到重复的操做,也不要紧,客户端下载时也作了去重。哈哈!这里有点坑,是我老婆发现的。

二、operate记录操做类型,如前所述,只有insert,update两种操做
三、id记录了本次操做的的对象(库中的id字段值),若是按照binlog的话,应该记录操做的数据(如cost,comment,day等),但那样会比较复杂。因此只记录了id值,而后再到库中去反查具体的数据。这边有个可优化点:对于update操做,可能只更新了一个字段,但这里会把全部字段所有填写到request中。

  • 补充说明下,这里的id是string类型的,格式“user_year_month_INT”,以用户名、年、月和一个递增的整数组成,这样保证每一个用户的id不会相同。

 

  第2、三个问题,主要针对第二个事情,其实是客户端和服务端配合,来达到多个客户端间同步的目的。首先说明一下:服务端全部的帐单都记录在一张表中,也是以id做为key值,如前所述,这个id值是不对重复的。
一、服务端按照用户维度,对上传上来的操做记录进行管理。为每个用户准备一个队列,队列中的元素和客户端上records.txt文件中的每条记录相似。不一样的是,这里记录的是别人的操做:每当有用户上传新操做记录来时,服务端首先将该操做写库,而后在全部其余用户的队列中增长上这条操做。
二、另外每一个用户准备一个文件(append模式打开),每条操做记录写到队列以前,先写到文件中。那么服务端重启时,就能够从文件中恢复队列了。
三、客户请求到来时,首先取出其中的begin_index,max_line字段,而后到他本身的队列中找,若是begin_index已经超过了队列的长度,说明没有新的更新;不然找出max_line条操做记录,根据其中的id到库中反查具体数据,填充response.records(同客户端)。

  • 这里有个问题,若是同时有不少用户,那么除了本身,其余人都是混在一块儿的。因为只有我和我老婆两我的用,这里就将就了;实际上,能够在队列元素中,多加一个字段user,就能够区分开了。

四、客户端用一个sync_index.txt文件,记录下次要同步的别人的操做记录index,初始为1,每次response.records不为空时,更新该值(+= respons.records.count())。

小结

刚开始想得很简单,不过到如今前先后后快4个月了,呵呵~~ 总算如今有个比较OK的版本了,代码不够严谨,补了又补,功能还行。

记得刚开始写RPC框架时,热情高涨,天天下班写到凌晨二、3点,那时候正好是最冷的时候,给本身点个赞。后来写android,就比较拖沓了,和用户操做直接相关的,会比较烦。

到此告一段落。

附:

RPC框架,http://www.cnblogs.com/zmkeil/p/5176758.html服务端代码,https://github.com/zmkeil/microbill-server.gitandroid代码,https://github.com/zmkeil/MyBill.git

相关文章
相关标签/搜索