2017年12月31日,罗振宇在上海举办了《时间的朋友》跨年演讲。node
这场四个小时的跨年演讲吸引了近万的现场观众和超过百万的直播观众。数据库
今天想和你们分享的是,在这场知识晚会的背后,获得App、电商平台技术人员和阿里云团队保驾护航的故事。后端
罗辑思惟&阿里云服务器
罗辑思惟是著名的知识服务商和运营商,有微信公众号、知识类音视频节目、知识服务获得App等产品。随着品牌日积月累的沉淀,其跨年演讲和其相关业务需求不断增大。微信
罗辑思惟大量核心业务运行在阿里云,目前团队使用了ECS、CDN、OSS、多款云数据库、负载均衡、容器服务、全链路压测PTS、Web应用防火墙、媒体转码、数据可视化等20多款产品。网络
对于这次阿里云护航,罗辑思惟的技术负责人沈仁奎表示:“很是感谢阿里倾囊相授双11成功经验,做为产品的用户很感动,大家服务很是贴切,完全融入到咱们团队了解咱们的业务形态,给出不少有价值、切实际的建议,对咱们帮助很大。”架构
全链路压测负载均衡
技术大考前的必备演习性能
全链路压测是应战业务大促不可缺乏的关键技术,这是阿里历年备战双11的利器,在这次罗辑思惟备战中它一样被应用得淋漓尽致。测试
经过全链路压测规划跨年期间的系统容量,肯定基准吞吐量和扩容缩容策略,找到特定场景下集群服务器配比和集群的短板,对于压测中发现的问题及时调整。
相比于经验判断和通常意义上的线上压测,全链路压测与业务场景更紧密相连,找到不一样业务场景下的临界峰值,计算出每一个业务应用的数量值,由点及线、由线及面从而得到总体状况;经过性能测试服务PTS(Performance TestingService)编排全局业务场景和构造真实业务流量,达到让业务和技术架构提早经历业务洪峰的检验,确保跨年活动和平常核心服务的稳定性和健壮性。
罗辑思惟的全链路压测接口愈200个,总体覆盖率超过50%,囊括了其获得APP和其独立电商平台的全部核心业务。
在不到三个月的时间内,罗辑思惟和阿里云PTS团队一共进行了大大小小愈七百次的单链路压测、十六轮完整形态全链路压测,压测所耗费的资源至关于一百多万用户一同测试两个多小时。
为了避免影响到罗辑思惟用户的体验,其中一些全链路压测都是在半夜和凌晨进行的。
因为压测范围广,其发现问题能力和提高效果也至关显著。压测前后总计发现数百问题,通过逐一排查,压测目标的几乎全部主要后端服务的业务系统都被优化改造。
举例说明,在压测中发现node侧应用CPU飙升的瓶颈,经过接入阿里Node.js性能平台,定位、分析异常并解决应用核心错误。通过技术人员们的不懈努力,系统吞吐能力提高上百倍。
ECS在手
资源呼风唤雨
在传统的基于IDC搭建业务状况下,必不可少的担忧就是业务发展受制于固定且有限的资源。
若是资源储备过多,那么在平常平峰或流量低谷时,就会形成巨大的资源浪费;但是若是资源准备不充分,在流量高峰时,又影响到用户体验。
云计算时代,弹性计算是首要优点。罗辑思惟选用了阿里云ECS,该产品具有海量资源的弹性交付能力,能够保证在一分钟内建立出近1000台云服务器。
罗辑思惟平常状况下按照必定比例选用包年月和按量的两种服务器付费方式,在这次跨年演讲中增大了按量计费的服务器用量,峰值时该种服务器达1000+台,大大下降了计算资源成本和前期筹划准备成本。
除去成本以外,更重要的是使用效果和体验。从计算性能稳定性而言,一般状况下,总体的ECS业务可靠性比线下物理机可靠性有大幅提高(99.95%业务可用性保证);若搭配高性能SSD云盘,则至关于数据可靠性和业务可用性双重保险,这也是罗辑思惟这次的选择。
另外,ECS提供丰富的企业级实例,罗辑思惟选用了最新一代基于skylake处理器、25G网络的企业级实例、大数据分析的D1型实例、高性能数据库I2型实例等,在性能和成本上都很出色地知足了需求。