以微信小程序相册为例,看Serverless DevOps最佳实践

近日,云+社区技术沙龙“高效智能运维”圆满落幕。本期沙龙围绕运维展开了一场技术盛宴,从AIOps、Serverless DevOps、蓝鲸PaaS平台、K8S等分享关于业务运维的技术实践干货,同时带来腾讯海量业务自研上云实践,推进传统运维向云运维转型。本文是孔令飞老师关于腾讯云 Serverless 的运维能力,Serverless 对运维的影响,微信小程序相册的运维案例等内容的分享。本文首发于「云加社区」公众号web

1、前言:在互联网时代咱们的核心诉求是什么?

在开始讲以前,先来看下,在互联网时代咱们的核心诉求是什么?——咱们的核心诉求是应用,可以提供业务能力的应用。正则表达式

以下图所示,为了能让应用对外提供服务,咱们还须要能在某个地方部署应用,须要一系列的系统资源,好比计算、网络、存储、数据库等;等应用部署起来以后,咱们还要更新应用、监控应用的运行状态等,这几个维度基本涵盖了咱们的全部需求。算法

为了知足这些需求,在应用层面,咱们引入了软件架构,好比单体架构和微服务开发框架。借助 Doker、KVM 等来提供系统资源。借助 EFK、Promethus、Coding 来实现应用生命周期管理。随着这些组件的引入,咱们须要花费人力来对这些资源进行运维。底层的系统资源咱们须要系统运维、虽然 EFK,Promethus 组件能够提供业务运维能力,但咱们也须要对这些平台进行运维。其实咱们真正须要的运维是业务运维。sql

那么有没有一种手段,让咱们尽量少或者不进行系统系统和平台运维呢?答案是有的,咱们能够采用 Serverless 的技术方案。本次分享,我会借助腾讯云 Serverless 产品,来讲明 Serverless 技术是如何淡化用户的平台运维和系统运维的。docker

本次分享将从如下几方面讲解:数据库

什么是 Serverless小程序

Serverless 的业务运维能力后端

Serverless 与 IaaS 层运维能力对比微信小程序

微信小程序相册是如何在 Serverless 技术下作运维api

2、Serverless 介绍

Serverless:云计算新趋势

在讲什么是 Serverless 以前,我想先给你们展现下 Serverless 目前有多火。

最近几年微服务和 k8s 很火,这是一张 Serverless 跟他们的热度对比图,蓝色的曲线是 Serverless 的热度曲线图,能够看到从 2016 年开始,Serverless 的热度是要大于微服务和 k8s 的。右边这张图展现了 Serverless 产品化落地状况。,Serverless 最初是在 2010 年被提出,2014 年 aws 推出了 lambda 服务,把 Serverless 产品化,并收到了很好的效果,微软、google 和 IBM 看到后,也分别在 2016 年推出了本身的 Serverless 产品。阿里云和腾讯云也分别在 2017 年推出了本身的 Serverless 产品。

2. 什么是 Serverless?

这里介绍下什么是 Serverless。这是一张逻辑架构图,最上面是咱们的 application,下面是系统资源。咱们能够经过虚拟机、容器、数据库、存储等来提供系统资源。同时,咱们须要对这些系统资源进行维护,好比:资源申请、环境搭建、容灾、扩缩容等。Serverless 是什么呢,Serverless 就是把底层的这些资源以及对这些资源的运维都交给云厂商来维护、这些资源对业务来讲是黑盒的,业务只须要关注本身业务逻辑的开发便可。这种架构思想和方法就是 Serverless。

Serverless 直译过来叫无服务器,实际上他不是真的不须要服务器,只不过服务器由云厂商来维护,Serverless 是一种软件系统架构思想和方法,不是软件框架、类库或者工具,它的核心思想:无须关注底层资源,好比:CPU、内存和数据库等,只需关注业务开发。

咱们把系统资源进行 Serverless 化,这些系统资源大概分为 2 大类,一种是 CaaS:compute as a service 用来提供计算能力,一种是 BaaS:backend as a service,至关于把第三方组件也 Serverless 化,用户也不用去关注第三方组建的搭建和运维,只须要调用 api 去使用便可。因此 Serverless 大概能够理解为:CaaS + BaaS。

3. Physical Machine vs. Virtaul Machine vs. Container vs. Serverless

这里咱们经过对比来看下 Serverless 所能提供的价值。在软件研发领域,咱们绕不开的 2 个环节是软件的部署和运维。若是咱们要上线一个业务,在物理机阶段,咱们要去购买物理服务器,而后还可能须要去建本身的机房,安装制冷设备,招聘运维人员,而后在上面搭建一系列的基础设施,好比:虚拟化,操做系统,容器等,有不少工做要去作。到了虚拟机这一阶段,云厂商维护了硬件和虚拟化这 2 个基础设施,到了容器这一阶段云厂商又维护了 OS、容器和 Runtime,能够看到用户须要作的运维工做愈来愈少。而后到了 Serverless 这个阶段,用户只须要关注 Function,也就是只须要关注本身的业务逻辑。能够看到随着阶段的演进用户须要关注的点愈来愈少,愈来愈聚焦于本身的业务逻辑。因此在 物理机阶段咱们开发一个业务可能须要 8 我的,在 Serverless 阶段,咱们只须要 2 我的,节省了不少人力,咱们能够把节省的人力投入到业务研发这块儿,提升产品的迭代速度,进而提升产品的竞争力。

由这张图咱们也能够看到,过去十多年云计算实际上是一个“去基础架构”的过程。这个过程可让用户聚焦于本身真正须要的业务开发上,而不是底层的计算资源上。Serverless 符合云计算发展的方向,这种特有的模式使 Serverless 存在潜在的巨大价值。用一张图来形容下,就是 Serverless 能够认为是云计算的终极形态。

4. Serverless 运行示例

前面说的可能比较抽象这里,来举个在腾讯云 Serverless 平台上运行函数的例子。

若是一个用户想用云函数,首先要在本地作业务开发,当研发把函数编码完成后经过咱们提供的 VSCode 插件能够很方便的把代码部署到咱们的平台上,函数里面可能会调用第三方的 BaaS 服务。接下来,会将该函数绑定各类触发器,好比:API 网关、Ckafka、COS 等。而后咱们经过调用 API 网关、往 COS 上传文件等方式,来产生触发事件,进而触发绑定的函数,执行业务逻辑。当请求来的时候,平台会根据请求量的大小,去自动或缩容后端的 Function 实例。能够看到整个过程用户是不须要作任何系统层面的运维工做。

5. Serverless 实战

这里经过一个 video 来看下如何建立和执行云函数。

3、Serverless 业务运维能力

接下来介绍下,腾讯云 Serverless 平台是如何提供开箱即用的业务运维能力。主要经过 4 个方面来介绍:工具建设、DevOps、日志、监控告警。

1.工具建设

腾讯云 Serverless 提供了多个工具来协助研发进行开发和调试、帮助运维更容易的将函数部署上线。国内用户用的比较多的 IDE 是 VS CODE,为此,咱们开发了 VS CODE 插件,能够方便开发进行函数的开发和部署。咱们也提供 web 版本的 IDE,能够直接在网页上作开发,咱们还提供命令行工具,可使开发直接在 Linux 终端进行开发和运维工做,同时基于命令行工具,还能够对接各类 DevOps 平台或者作一些自动化的工做。

2. DevOps 解决方案

除了开发者工具,咱们也提供完善的 DevOps 支持,从最佳实战,到工做流,到工具链,以及产品打通,咱们都提供了不少方案和支持。

好比工做流这里,咱们支持编码、构建、打包、部署、测试和发布等一系列流程。在工具这里,咱们提供了:CLI、应用模型等。产品这里,咱们打通了不少产品供用户很方便的跟这些产品进行交互,利用这些产品提供的能力,好比: Git 仓库,API 网关 等。这个是 DevOps 支持。

3. Coding DevOps

这是经过 Coding DevOps 来管理 Serverless 应用 CICD 的几个截图。经过 Coding 的持续集成,能够记录每个函数应用的构建日志,测试日志。Coding 的制品库能够对函数镜像作集中存储以及作历史版本追溯。最后运维人员能够经过 Coding 部署将函数部署到不一样的环境中。

4. 日志

日志这里咱们支持 2 种日志查询方式。一种是能够直接在咱们的 Serverless 平台进行查询,可以查看函数调用成功与否,各阶段的调用时间,以及用户打印在日志或者标准输出的日志,支持用户按 RequestId 去搜索日志。另外咱们还支持用户将日志输出到腾讯云日志服务系统,将日志持久化存储,在日志服务系统中,用户能够根据正则表达式来搜索日志,也能够自定义检索规则,方便下次检索,还能够基于日志进行告警。

5. 监控告警

咱们提供 3 个维度的监控。提供本月调用次数、本月资源量、本月出流量的监控。提供按地域划分的调用次数、运行时间、错误次数、并发个数、受限次数监控,这些监控指标都是用户很关心的指标。另外咱们也提供函数级别的监控:调用次数、资源超过限制次数、函数执行超时时间、内存超过限制次数等监控指标。全部这些监控指标均可以在腾讯云监控系统上配置告警,提供业务级别的监控能力。

4、 Serverless 系统运维能力

这里来看下 Serverless 提供的系统运维能力。Serverless 底层会为每一个用户建立一个 mvm,mvm 是轻量级的虚拟机,提供最强的安全隔离,轻量化虚拟机能够作到毫秒级启动,延时很是低。在 mvm 中建立 docker 容器,而后将用户的函数调度到 docker 容器中执行,经过 docker 进行进程级别的隔离同时经过容器来分配更细力度的资源,从而提升系统资源利用率,下降成本。同时在函数执行时会有一套调度算法,能够实时的根据 CPU、内存、网络 IO、请求量指标来进行扩容。知足用户业务高峰期的请求需求。当用户请求量降下来后,也会定时的进行缩容,释放资源,减小成本。全部这些能力都是云厂商来运维,不须要用户运维,用户只须要关注本身的业务逻辑便可。也就是说用户能够省去系统运维这方面的工做,只须要关注业务运维便可。

5、Serverless 与 IaaS 运维能力对比

这里经过跟 IaaS 层提供的运维能力进行对比,来更直观的体验一下 Serverless 所带来的运维效率的提高。 运维能力对比,主要按 2 个维度来对比: 1. 基本运维能力 2. 核心运维能力

1. 资源建立

(1) IaaS

先说说传统的 IaaS 应用,运维是如何开展的。首先是资源建立的阶段,这一阶段通常开始于开发部门对运维部门发起新应用的上线申请。收到申请后,运维部门通常会,根据需求文档,在各个可用区内,建立一批虚拟机,而后配置好网络,防火墙和路由规则。因为跨部门,就涉及排期的问题,速度并不会很快。

集群建立好后,再安装开发部门声明的软件好比运行时 JDK,服务器 Tomcat。而后运维部门会安装一些运维软件好比监控工具 Prometheus,日志工具 logstash,或者一些其余的软件好比安全软件,全链路追踪软件。

机器安装好后,就须要配置 DevOps 流程线。把机器加入到流水线的各个环境中,好比开发环境,预发环境,若是开发者比较多可能还会有第二套开发环境和第二套预发环境。最后就是生产环境,运维人员,为了高可用和容错,事先会将生产环境分为几个不一样的小集群,分别部署在不一样的可用区内。至此在运维人员的努力下,快的可能须要几天,好比企业内部有自动化运维平台。慢的可能须要几个星期,所有手动配置,才能把全部的环境给搭建起来。而且 CICD 的工具的部署及维护也须要运维部门花费大量的人力,好比,Jenkins 集群,GitLab 服务器,Chef 服务器等。

而且环境的验收来来回回又可能再花上几天。因此整个流程下来可能须要好几周时间。最后才会进入开发流程。

(2)Serverless

咱们来看下 Serverless 技术,是如何提供系统资源的,在介绍 Serverless 的时候咱们说到,Serverless 底层的系统资源不须要用户去申请和运维,因此就不须要资源的申请和软件的按照这个阶段,同时 Serverless 平台提供了开箱便可用的 DevOps 功能。在 Serverless 下,用户只须要进行最后一步的开发便可。

能够看到在 Serverless 下,咱们不须要建立任何资源,由于无需运维因此能够提升研发效率进而提升产品的竞争力。

2.业务部署

在虚拟机时代,部署一个业务,须要运维介入,同时须要配置操做系统环境、而后再对业务组件进行配置。同时业务运维还须要本身实现蓝绿发布和回滚的逻辑,比较复杂。

在容器时代、部署一个业务也须要运维介入,同时运维须要编写复杂的 yaml 文件,对运维人员有了更多的技能要求。每次部署的时候,还须要修改 yaml 文件,而后执行一堆命令部署业务,虽然要比虚拟机时代要简单不少,可是仍是有必定的工做量。

在 Serverless 平台上,只须要开发上传代码,便可完成部署。同时,Serverless 平台已经实现了蓝绿发布和回滚的功能,不须要研发去关注这块儿,把业务部署的复杂度降到最低。

3.监控告警

在传统的应用中,绝大多数的监控都依赖于运维人员来配置,包括网络监控,系统监控,应用监控,和业务监控。可是在 Serverless 应用中,首先应用监控,系统监控,网络监控里面的绝大部分监控,都不须要再关注了,而且平台不会将其暴露出来,暴露出来的会是些更高级别的指标,好比调用次数,运行时间,运行内存,并发执行数,受限次数等。可是业务监控仍是须要自行收集,经过捞日志的方式。

4. 故障排查

传统的应用故障排查的手段通常都很是丰富,好比全链路追踪,各种监控等。可是这仅仅限于大公司拥有比较强的技术实力,由于这些故障排查工具集的搭建和维护也是一个耗费人力的过程。在小公司内通常一般只能经过日志和走查代码来排查。

腾讯云 Serverless 平台提供了很是多的故障排查工具。好比全链路追踪功能,各个维度的监控,以及专业的日志查询功能。因此 Serverless 时代故障排查工具也不须要运维人员来搭建了。

5. 弹性扩缩

弹性伸缩是运维一个核心的能力,弹性伸缩你们通常关注的是扩缩时间。在虚拟机阶段,若是资源不够了,须要申请虚拟机,申请完以后须要登录虚拟机作一些系统级别的配置和部署,通常是小时级。在容器阶段,借助于k8s的弹性扩缩能力,但 k8s 的弹性扩缩容策略通常也只能作到分钟级。但在 Serverless 这个阶段,能够作到实时的毫秒级的扩缩容。

6. 故障恢复

故障恢复是另外一个运维须要关注的点。在虚拟机阶段,故障恢复逻辑须要运维实现,若是运维没有一些故障恢复逻辑,出故障后须要运维介入,若是运维手工介入响应会很慢,同时也可能由于认为的一些失误致使业务异常,有风险。在容器阶段,借助 k8s 的自愈能力,能够实现秒级的故障恢复,可是在 Serverless 阶段,由于每次请求都是一个新的实例,因此就不存在故障恢复这一工做。

7. 性能调优

性能调优一直就是个比较高级的问题,须要丰富经验。传统应用的调优通常涉及,虚拟机参数,数据库参数,网络参数,Linux 参数,运行时参数,服务器参数。可是因为 Serverless 应用的特殊性,此类底层参数的调优由云厂商来进行调优。用户只须要进行代码级别的性能调优便可。

8. 安全保障

传统的 IaaS 应用因为技术栈复杂,灵活度很大因此安全须要保障的领域也很是多。好比主机和网络安全,应用安全,访问控制管理,终端安全,数据安全等都须要运维安全人员来关注。 大公司通常会为此保持一个大的安所有门来保障集团的安全。可是小公司若是也要维持这样一个部门,业务就会被极大的拖累,以至于小公司业务的安全很是难保障。好比有些数据库不改密码,或者暴露公网 IP 等,小公司不可能有精力去对这些产品进行充分调研。

可是 Serverless 下,底层资源由云厂商来进行维护,安全性由云厂商提供专业的保障,好比,腾讯云 Serverless 平台会提供网络隔离,执行环境与管理环境隔离,函数资源限制,文件系统目录限制,系统调用也会有限制。能够在提升安全保障的同时,节省这一部分人力。运维安全就主要用户代码的安全维护了。

开发流程

6、案例:微信小程序相册如何在 Serverless 下去作运维

这里举一个微信小程序相册的例子,看一下如何在 Serverless 下去作运维,若是没有 Serverless 的话,咱们想开发一个相册小程序,首先要去组件 Team 可能须要N周,而后要注册各类帐号,须要几天。接下来咱们要作一些跟运维相关的工做,好比:购买域名、购买 CVM、域名备案等,购买完资源以后还须要安装 Nginx、安装 Mysql、安装监控和日志系统等,这块儿大概须要 3 周时间,甚至更多时间。接下来才会进入到真正的业务开发阶段。因此像若是开发一个小程序的话,通常是须要一两个月的时间。

最终上线后,我须要维护…

当咱们把小程序开发完成后,还面临各类复杂的运维工做。好比要运维一大堆服务器相关的组件、测试复杂、还要花费不少人力保障安全和稳定性。

只关注核心业务

这张图是 Serverless 下的解决方案,能够看到,云厂商将资源申请和相关组件的部署都 Serverless 化了,这部分运维工做由云厂商来维护,不须要用户关心,用户只须要关注核心业务逻辑开发和数据库相关的 CRUD 便可。大大简化了开发流程和运维工做量。

微信小程序相册在 Serverless 解决方案下,一个同事只花了 2 周时间便完成了核心业务逻辑的开发。

讲师介绍

孔令飞,腾讯云高级架构师,负责腾讯云云函数的产品拓展工做,协助用户一块儿搭建基于Serverless的系统架构,和产品经理一块儿完成云函数平台的规划建设。以前在Red Hat和联想作过虚拟化相关的测试和研发工做,有过大规模容器集群的研发和架构经验,对虚拟化、容器等云计算相关技术有深层次的理解。


相关文章
相关标签/搜索