Ping++ 是国内领先的支付解决方案 SaaS 服务商。自 2014 年正式推出聚合支付产品,Ping++ 便凭借“7行代码接入支付”的极致产品体验得到了广大企业客户的承认。sql
现在,Ping++ 在持续拓展泛支付领域的服务范围,旗下拥有聚合支付、帐户系统、商户系统三大核心产品,已累计为近 25000 家企业客户解决支付难题,遍及零售、电商、企业服务、O2O、游戏、直播、教育、旅游、交通、金融、房产等等 70 多个细分领域。数据库
Ping++ 连续两年入选毕马威中国领先金融科技 50 强,并于 2017 成功上榜 CB Insights 全球 Fintech 250 强。从支付接入、交易处理、业务分析到业务运营,Ping++ 以定制化全流程的解决方案来帮助企业应对在商业变现环节可能面临的诸多问题。安全
Ping++ 数据支撑系统主要由流计算类、报表统计类、日志类、数据挖掘类组成。其中报表统计类对应的数据仓库系统,承载着数亿交易数据的实时汇总、分析统计、流水下载等重要业务:架构
随着业务和需求的扩展,数仓系统历经了屡次发展迭代过程:并发
以上两个方案基本知足业务需求,可是都仍存在一些问题:运维
因此须要作出进一步的迭代整合,咱们属于金融数据类业务,重要性安全性不能忽视、性能也得要有保障,通过咱们漫长的调研过程,最终,由 PingCAP 研发的 TiDB 数据库成为咱们的目标选型。分布式
TiDB 具有的如下核心特征是咱们选择其做为实时数仓的主要缘由:工具
并追踪造成了如下数据支撑系统架构:性能
新的方案给咱们的业务和管理带来了如下的提高和改变:优化
TiDB 是 PingCAP 公司受 Google Spanner / F1 论文启发而设计的开源分布式 NewSQL 数据库。从下图 Google Spanner 的理念模型能够看出,其设想出数据库系统把数据分片并分布到多个物理 Zone 中、由 Placement Driver 进行数据片调度、借助 TrueTime 服务实现原子模式变动事务,从而对外 Clients 能够提供一致性的事务服务。所以,一个真正全球性的 OLTP & OLAP 数据库系统是能够实现的。
咱们再经过下图分析 TiDB 总体架构:
能够看出 TiDB 是 Spanner 理念的一个完美实践,一个 TiDB 集群由 TiDB、PD、TiKV 三个组件构成。
生产集群部署状况:
现已稳定运行数月,对应的复杂报表分析性能获得了大幅提高,替换 ADS、ES 后下降了大量运维成本。
TiSpark 是将 Spark SQL 直接运行在分布式存储引擎 TiKV 上的 OLAP 解决方案。下一步将结合 TiSpark 评估更加复杂、更高性能要求的场景中。
目前数仓 TiDB 的数据是由订阅平台订阅 RDS、DRDS 数据而来,系统复杂度较高。TiDB 具有了出色的分布式事务能力,彻底达到了 HTAP 的级别。
TiKV 基于 Raft 协议作复制,保证多副本数据的一致性,能够秒杀当前主流的 MyCat、DRDS 分布式架构。且数据库的可用性更高,好比咱们对生产 TiDB 集群全部主机升级过磁盘(Case记录),涉及到各个节点的数据迁移、重启,但作到了相关业务零感知,且操做简单,过程可控,这在传统数据库架构里是没法轻易实现的。
咱们计划让 TiDB 逐渐承载一些 OLTP 业务。
DDL 优化:目前 TiDB 实现了无阻塞的 online DDL,但在实际使用中发现,DDL 时生成大量 index KV,会引发当前主机负载上升,会对当前集群增长必定的性能风险。其实大部分状况下对大表 DDL 并非很频繁,且时效要求并非特别强烈,考虑安全性。建议优化点:
针对以上问题,咱们也咨询了 TiDB 官方技术人员,官方的回复以下:
最后,特此感谢 PingCAP 全部团队成员对 Ping++ 上线 TiDB 各方面的支持!
✎ 做者:宋涛 Ping++ DBA