谈谈KV存储集群的设计要点

时间 2019-11-12

原文原文链接

版权声明：本文由廖念波原创文章，转载请注明出处:
文章原文连接：https://www.qcloud.com/community/article/150mysql

来源：腾云阁 https://www.qcloud.com/communityweb

Key-value存储系统，是很是广泛的需求，几乎每一个在线的互联网后台服务都须要KV存储，咱们团队在KV存储方面，经历过几个时期，我本身深感要作好不容易。redis

这里扯远一点，展开说一下：算法

第一个时期，很早期的时候，咱们的数据存储在mysql表里，按照用户帐号简单的分库分表，为了保证访问高并发，利用每一个mysql服务器的内存作数据缓存；主备两套分布在不一样IDC，业务逻辑本身作副本同步。当时主要的问题是：内存的数据结构扩展困难、运维工做琐碎、数据同步机制自己的缺陷致使不能作异地IDC部署，这些缺点对于业务飞速发展、一地机房已经不够用的局面很是被动sql

第二个时期，咱们设计了新的KV存储系统，其用户数据结构容易扩展、具有能够多地部署的数据同步机制，很好的应对了新时期业务发展的须要。为了设备成本考虑，咱们把数据作冷热分离，访问频繁的数据会加载到专门的cache层，且对于不一样的访问模型，挂载不一样架构的cache，另一个file层专门作数据持久化。这样的设计，使得架构太复杂，bug收敛速度慢，运维工做相比之前甚至更复杂了。缓存

第三个时期，为了应对广泛的KV存储需求，咱们以公共组件的形式从新设计了KV存储，做为团队标准的组件之一，获得了大规模的应用。结合同期抽象出来的逻辑层框架、路由管理等其余组件，团队的公共基础组件和运维设施建设的比较完备了，整个业务的开发和运维实现了标准化。但这个阶段就用了咱们团队足足2年多时间。服务器

不一样于无数据的逻辑层框架，KV存储系统的架构设计会更复杂、运维工做更繁琐、运营过程当中可能出现的情况更多、bug收敛时间会更长。一句话：团队本身作一个KV存储系统是成本很高的，并且也有比较高的技术门槛。微信

设计一个KV存储，须要考虑至少这些方面：数据结构

如何组织机器的存储介质，一般是内存、磁盘文件；例如用hash的方式组织内存架构
如何设计用户的数据结构，使得通用、易于扩展、存储利用率高；例如PB序列化、Json、XML方式
友好的访问接口，而不仅是get / set一整个value
如何作集群分布、如何sharding、如何作到方便的扩缩容；例如一致性hash算法
如何作数据冗余、副本间如何同步、一致性问题；副本间如何选举master
备份与恢复、数据校验与容错
读写性能
其余可能的特殊需求：例如咱们设计过一个KV存储，用于存储一些公众号的个数不受限粉丝列表

上面八点，业内的KV存储组件通常都会考虑到，或者各有特点，各自优点在伯仲之间。可是综合过去的经验教训，咱们以为有一点很容易被忽视：可运维性、运维自动化、黑盒化运维。

举一个例子，前面提到的咱们第二个时期的KV存储系统，刚开始应用的时候，一次扩容过程会有10多步的运维操做，包括load数据、作增量同步、屡次修改机器状态、数据比对等等，须要运维同事以高度的责任心来完成。另外就是运维同事必须如该KV存储架构设计者同样深入理解系统背后的原理和细节，不然就不能很好的执行运维操做，这个要求也很是高，新老交接周期长，还容易出运维事故。

基于上面的考虑，同事为了让用户更容易学习和接受，毫秒服务引擎在redis cluster的基础上，实现了运维web化，并加上了集群的监控。

毫秒服务引擎(msec, 取英文名Mass Service Engine in Cluster的首字母组合)是腾讯一个开源框架，其创做冲动和构建经验，来自QQ后台团队超过10年的运营思考。官网:

毫秒引擎能够经过web界面方便的进行：

集群概要状态查看
能够在web上方便的完成平常的运维操做：新搭集群、扩缩容、故障机器的恢复：
请求量、内存使用、cpu等各类状态信息可直观监控，也能够按IP粒度查看

限于篇幅和时间限制，详细的可见腾讯云服务市场、毫秒服务引擎官网，或者微信公众号:msec-engine