考拉海购全面云原生迁移之路

image.png
今年 8 月底,入驻“阿里动物园”一周年的考拉海购首次宣布战略升级,在现有的跨境业务基础上,将重点从以“货”为中心变成以“人”为中心,全面发力会员电商。
数据库

外界不知道的是,对考拉海购来讲,不仅是完成了业务升级,目前考拉已全面拥抱云原生,大幅提高运维效率,并加速业务的迭代升级。考拉海购技术负责人谢聘超在云栖大会演讲中分享了考拉海购的云原生迁移之路,如下是演讲内容整理。安全

今年年初,咱们就完成了考拉所有迁移至阿里云。但咱们认为这还不够,又给本身定了新的 KPI ,9 月以前让全部的应用拥抱云原生。
image.png
网络

迁移融合,与时间赛跑

20亿美圆收购网易考拉,在阿里的收购历史上,既不是最大,也不是最难的。但半年完成整合、未满一年提出战略升级,在阿里的历史上从未有过。运维

快速的整合升级首先是由技术驱动的。性能

这一年多咱们都在跟时间赛跑。

在迁移过程当中,必须保证业务不受损、所有线上服务全程可用。但现实是,原机房距离太远,致使每一次的网络传输大概有 50 毫秒的延时,给不停服迁移带来了巨大的困难。
image.png
当时想到了一个比较完美的解决方案,在机房间挖了一条光纤,并创建了考拉独立的VPC,进行数据同步。既让网络流畅互通,又保证了数据安全。可是困难又来了。若是慢慢切换,流量先放 1% 、再放 5% 、再放 10% ,对于用户体验来讲,损伤很大。试想,若是客户下一个单须要3秒钟,客服电话就要被打爆了。

测试

疫情期间,考拉海购团队紧急进行内测。把各个环节、全部的测试链路分批所有进行了测试,保证了整个链路的完整性。那个夜晚真的是提心吊胆。必须保证没有灰度,才能作切换。阿里云

最终,考拉海购全量完成了迁移,性能没有出现任何问题。整个迁移过程比较稳定顺滑,到了阿里云,云网络这块也放心多了。spa

考拉海购 100% 全站迁移至阿里云后,稳定支撑了今年 3.8 女神节大促。这是考拉迁移上云后的首个大促,当天流量峰值较 2019 年双 12 增加了 72% ,但相比以前成本大幅度下降。考拉海购各业务线也在当天被证实 100% 打通,造成闭环。blog

整个迁移过程当中,阿里云提供了很大的帮助。阿里云 EPC 安全方案、数据迁移方案很是成熟。此外,阿里云总体的能力支撑也很完整,迁移数据库、 ES 的成本很低,没有出现不兼容的状况。接口

阿里云提供了一个很强的功能,叫有状态的容器。之前的迁移是容器迁过来,IP地址就丢掉了。有了有状态的容器,能够保持 IP 地址不变。此外,阿里云产品提供了便捷的界面,可自助操做。这些产品优点对效率提高和成本节约的价值极其巨大。

下一步,全面拥抱云原生

完成了第一阶段的目标以后,考拉海购开始了全面的云原生之路。
image.png
云原生帮助考拉海购在运维效率上有了大幅提高。云原生产品提供了众多 API ,能够基于产品的运维接口进行组合,开发出系统,总体运维变得很是灵活。

在弹性上,考拉海购主要关注两方面,一是大促先后的弹性,二是白天高峰期和晚上低峰期的弹性。第一点比较常见,第二点借助于阿里云的弹性能力,也能够实现单日内的弹性收缩,对平常成本的节约很是有效。
image.png
在容灾方便,阿里云原生产品自然多 AZ 容灾能力,极大地加速了考拉海购同城多活能力的建设,所以考拉海购才能在短期内很快扩展到多机房,并具有多AZ的容灾能力。

其次,基于 ARMS 和 PTS ,在业务不改造的状况下(个别特殊逻辑除外),就能完成全链路压测能力的接入,增量业务也能够零成本接入全链路压测,解决了业务监测和问题排查层面的诸多难题。

这就是阿里云自然的优点,由于这些云产品通过了历年双十一的检测,所要面临的问题场景和复杂度也是业界最难的,能经得住这些场景的考验,才历练了阿里云产品的能力。

用一年多时间从新出发,考拉海购现在走出了一条创新路径,成为国内数一数二的会员电商平台。来自考拉海购官方的数据显示,截至 2020 年 6 月 30 日,考拉海购会员规模同比增加 23% 。会员凸显出高客单、高活跃、高复购的特色:会员年客单价是非会员的 7.3 倍,月度活跃是非会员的 2.4 倍,年订单数是非会员的 4 倍。

原文连接 本文为阿里云原创内容,未经容许不得转载。

相关文章
相关标签/搜索