干货分享:CDC实时数据复制,大神教你调性能

数据实时复制任务的成与败,取决于多方面的因素,例如:被复制数据自己状况,源系统和目标系统的自身运行情况,网络通信方面,系统架构设计和实施人员专业技术水平等等。面对复杂而艰巨的任务,IBM 公司专业化实施团队积累了丰富的经验,如下是咱们此次分享的 IBM InfoSphere CDC性能调优的重点内容。html

1. 明白数据复制的需求和使用场景

改善并提高数据复制做业性能是双向互动的操做,以知足业务需求和目标为根本出发点,其缘由是:数据库

  • 当对某个运行进程做了调优,并解决了该方面的性能瓶颈后,可能在该进程的上游或下游地方,又产生了新的性能瓶颈,让你很难能作到调整某一部分,就能解决性能上存在的所有问题。
  • 数据复制过程当中,业务运做在不一样时间段内会有不一样的要求,并非一成不变的。例如:在业务交易时间段,数据实时变动频繁,对 CDC 时延(Data Latency)要求较高,才能达致业务目标;可是,在业务日终结算处理时间段,则更多地聚焦于海量数据的后期加工和批量处理,反而对 CDC 时延(Data Latency)要求较低。

所以,咱们在优化数据复制的做业运行性能时,一切以业务需求为目标,采起合适手段来解决问题。不然,难以一箭双鵰,还影响业务运做。性能优化

2. 监控整体性能状况

在肯定调优方案前,须要监察 CDC 数据复制做业的整体性能情况,其中包括:网络

CDC DataStore 健康情况。架构

数据管理

CDC进程运行时内存的使用状况,占用率最高达 70%左右为最佳工具

数据管理

数据管理

利用 CDC Management Console探测潜在的性能瓶颈性能

数据管理

如下例子,其监控信息结果说明了目标端系统是性能瓶颈,数据从源系统复制传送速度快于目标系统的处理速度。测试

数据管理

3. 收集做业运行统计信息以进行分析

IBM CDC 提供了全面收集做业运行过程当中性能明细信息的有效手段,如下是以复制 Oracle 数据库数据的做业为例子,所收集的信息种类和手段。大数据

数据管理

4. 完成性能调优任务

根据上述的复制Oracle 数据库数据的做业为例子,肯定调优的方法以下。优化

数据管理

该策略为:

  • 在源系统保持捕获合理的数据增量和传送数据量 batch size;
  • 在目标系统调整合理的更新数据量 batch size,并仅对变化的字段进行更新(缺省是所有字段更新),以发挥最大处理性能;
  • 须要有丰富数据库性能调优经验和 IBM CDC 工具熟练使用技巧。

5. 评估性能优化结果

IBM CDC 做业调优前,其运行结果:

数据管理

从上图信息可发现:数据从源系统不断地快速复制传送到目标系统,可是目标系统性能存在瓶颈,时延不断地增大到最高峰值而没回落,直到数据复制快结束时才开始回落。

IBM CDC 做业调优后,其运行结果:

数据管理

从上图信息可发现:目标系统 CPU资源使用率明显地比源系统高得多,数据库性能得以充分发挥。数据复制的时延不算高,平均值和峰值差距不大。所以,CDC 做业调优工做是富有成效的。 相对比其余友商的测试结果, IBM CDC 综合能力和主要功能都稍胜一筹。若是有兴趣想了解更多的 IBM CDC数据复制技术及经验,请参阅:http://bigdata.evget.com/

更多大数据与分析相关行业资讯、解决方案、案例、教程等请点击查看>>>

相关文章
相关标签/搜索