一个大胆的猜测:若是GitHub的数据库用的是OceanBase

今日,GitHub技术负责人Jason Warner的一篇技术深度解析稿成为IT圈爆款。文中,Jason坦诚地对外讲述了10月21日100G光缆设备故障后,Github服务降级的应急过程以及反思总结。程序员

从Jason Warner的文章中不难看出,形成断网43秒瘫痪24小时的罪魁祸首是数据库。因为部署在两个数据中心的数据库集群没有实时同步。意外发生时,Github的工程师担忧数据丢失,不敢快速将主数据库安全切换到东海岸的备份数据中心。
1数据库

程序员们在GitHub这篇“忏悔录”下面留言,表达对数据库集群的“哀悼”。但更多IT从业者关心的问题是,如何避免这样的灾难事件降临到本身的公司,本身维护的系统。安全

蚂蚁金服OceanBase分布式数据库专家认为,这次Github事件是典型的城市级故障。若是系统采用的是高可用的三地五中心解决方案,就能够自如应对。服务器

就在一个月前,今年的杭州云栖大会上,蚂蚁金服副CTO胡喜现场模拟剪断支付宝近一半的服务器光缆。只用了26秒,模拟环境中的支付宝就彻底恢复了正常,这背后便是OceanBase城市级别故障的自愈能力。
2分布式

原来,Github相似银行采用的传统数据库两地三中心模式,即“主库(主机房)+同城热备库(同城热备机房)+异地灾备库(异地灾备机房)”。这种方式下一般只有主机房的服务器能提供写服务。若是主城市出现城市级故障,灾备城市的数据库虽然能够工做,但因为没有同步的最新数据,所以灾备库的数据是有损的。阿里云

但在三地五中心部署下,任何单个城市故障,OceanBase都不会中止服务,数据也不会有任何损失。spa

Github表示,为了保证数据完整性,他们不得不牺牲恢复时间。其实,这个问题采用三地五中心方案能够更好的应对。城市故障时,OceanBase只要活着的两个城市的三个机房两两之间可以通讯,就能够正常服务,也不会有任何的数据损失。3d

双十一广告:阿里云双十一1折拼团活动:已满6人,都是最低折扣了
【满6人】1核2G云服务器99.5元一年298.5元三年 2核4G云服务器545元一年 1227元三年
【满6人】1核1G MySQL数据库 119.5元一年
【满6人】3000条国内短信包 60元每6月
参团地址:http://click.aliyun.com/m/1000020293/blog

做者: 华蒙
原文连接
本文为云栖社区原创内容,未经容许不得转载。事件

相关文章
相关标签/搜索