做者 | KubeVela 项目维护者来源 | 阿里巴巴云原生公众号前端

做为 OAM（Open Application Model）在 Kubernetes 上的实现，KubeVela 项目从 oam-kubernetes-runtime 演进至今不过半年多时间，但发展势头很是迅猛，不只连续登上 GitHub Go 语言趋势榜首和 HackerNews 首页，更是迅速收获了包括 MasterCard、Springer Nature、第四范式、SILOT、Upbound 等来自世界各地、不一样行业的终端用户，甚至还出现了像 Oracle Cloud、Napptive 等基于它构建的商业化产品。就在 2021年3月底，KubeVela 社区宣布包含全部稳定版 API 的 v1.0 版本发布，正式开始向企业级生产可用迈进。git

不过，若是你对云原生领域不太关注，可能对 KubeVela 尚未作过太深刻的了解。别着急，本文就借着 v1.0 发布之际，为你详细的梳理一次 KubeVela 项目的发展脉络，解读它的核心思想和愿景，领悟这个正冉冉升起的云原生应用管理平台之星背后的“道之所在”。github

首先，什么是 KubeVela？web

一言以蔽之，KubeVela 是一个“可编程式”的云原生应用管理与交付平台。编程

但是，什么是“可编程”呢？它跟 Kubernetes 又是什么关系？它能帮助咱们解决什么问题？架构

PaaS 系统的“能力困境”

PaaS 系统（好比 Cloud Foundry、Heroku 等）自诞生以来，就以其简单、高效的应用部署体验而被全部人津津乐道。然而，你们也知道，咱们今天的“云原生”，倒是一个 Kubernetes 大行其道的世界，曾经的 PaaS（包括 Docker）到底遇到了什么问题呢？app

其实任何一个尝试使用过 PaaS 的人，都会对这种系统的一个本质缺陷感触颇深，那就是 PaaS 系统的“能力困境”。运维

图 1 - PaaS系统的能力困境模块化

如图 1 所示，PaaS 系统在最开始使用的时候，每每体验很是好，也总能恰如其分地解决问题。但随着使用时间的推移，一个很是讨厌的状况就会出现：应用的诉求，开始超过 PaaS 系统可以提供的能力。而更可怕的是，一旦这个问题出现，用户对 PaaS 系统的满意度就会断崖式下跌，这是由于不管是从新开发平台增长功能，仍是修改应用去适配平台，都是一项投入巨大但收益很低的事情。更况且全部人这时候都会开始对平台失去信心：谁知道下一次系统或者应用大改，是否是很快又要发生了？工具

这个“命门”，能够说是 PaaS 虽然具有云原生所需的一切要素、却最终未能成为主流的主要缘由。

而相比之下，Kubernetes 的特色就比较突出了。尽管 Kubernetes 被人诟病“复杂”，但随着应用复杂度的提高，Kubernetes 的优势就会慢慢体现出来，尤为是当用户的诉求开始须要你去经过 CRD Controller 支持的时候，你必定会庆幸：幸好当初选了 K8s。

这里的缘由在于，Kubernetes 的本质实际上是一个强大和健壮的基础设施能力接入平台，也就是所谓的 The Platform for Platform。它的这套 API 和工做方式，自然不适合直接跟人去进行交互，但却可以以很是一致的方式接入任何基础设施能力，为平台工程师构建 PaaS 等上层系统提供“无限弹药”。这种“BUG 级”的基础设施能力供给方式，让再精密的 PaaS 系统相比之下都像是一个碍手碍脚的“玩具”，这一点对于不少正挣扎于构建内部应用平台的大型企业来讲（它们才是 PaaS 厂商真正想赢取的用户）无异因而久旱逢甘霖。

云原生 PaaS ：新瓶装旧酒

前面提到的一点其实很重要：假如一个大型企业要决定采纳一个 PaaS 系统仍是选择 Kubernetes，平台团队每每才是能决定拍板的那一方。但另外一方面，平台团队的意见虽然重要，并不意味着最终用户的想法就能够无论了。事实上，在任何一个组织中，直接创造价值的业务团队才持有最高的话语权，只不过起做用的时间稍晚而已。

因此在绝大多数状况下，任何一个平台团队拿到 Kubernetes 以后，并不会直接去让业务去学习 Kubernetes，而是会基于 Kubernetes 构建一个“云原生” PaaS，用它去服务业务方。

咦，因而乎你们兜兜绕绕，又回到了故事的原点。惟一的变化是，我们今天这个 PaaS 是基于 K8s 实现的，确实轻松了很多。

但实际状况呢？

这个基于 Kubernetes 构建 PaaS 的故事，看似美好，其实整个过程却不免有些“心酸”。说的好听点是开发 PaaS，其实 80% 的工做是在设计和开发 UI，剩下的工做则是安装和运维 K8s 插件。而更使人遗憾的是，咱们这样构建出来的 PaaS，其实跟之前的 PaaS 没有本质不一样，任什么时候候用户诉求改变，咱们都须要花大量时间从新设计、修改前端、排期上线。结果就是，K8s 突飞猛进的生态和无限可扩展的特性，都被“封印”在咱们亲手构建的 PaaS 之下“不见天日”。终于有一天，业务方也实在忍不住要问了：大家平台团队上了 K8s，到底有啥价值？

上面这个“为了解决 PaaS 的固有限制，结果又引入一个新的 PaaS 和限制”的困局，是现今不少公司在落地云原生技术的过程当中遇到的一个核心问题。咱们彷佛再一次把用户锁定在一层固定的抽象和能力集当中。所谓云原生化的好处，仅仅体如今我们本身开发这个平台变得简单了 —— 而对业务用户来讲，这彷佛没什么太大的意义。

更为麻烦的是，云原生和 K8s 的引入，也让运维人员这个角色变得很是微妙。原本，他们所掌握的业务运维最佳实践，是整个公司中最重要的经验和资产。然而，在企业云原生化以后，这个工做的内容都必须交给 K8s 去接管。因此，不少人都说，K8s 要让“运维”失业了，这个说法虽然有点夸张，但确实反映出了这个趋势带来的焦虑。并且咱们不由也在从另外一个角度思考，云原生化的背景下，应用运维的经验和最佳实践，又该怎么落实？就拿一个简单的工做负载举例子，一个 K8s Deployment 对象，哪些字段暴露给用户、哪些不能，虽然体如今 PaaS 的 UI 上，但确定不能是靠前端开发说了算的吧。

KubeVela：下一代可编程式应用平台

阿里巴巴是整个业界在云原生技术上的先行者之一。因此上述这个围绕着应用平台的云原生技术难题，相对也比较早的暴露了出来。在 2019 年底，阿里基础技术团队与研发效能团队合做针对这个问题进行了大量的探索与尝试，最终提出了“可编程式”应用平台的思想，并以 OAM 和 KubeVela 开源项目的方式同你们见面。这套体系，目前已经迅速成为了阿里构建应用平台的主流方式。

简单地说，所谓“可编程”，指的是咱们在构建上层平台的过程当中，不会直接在 Kubernetes 自己上叠加抽象（哪怕只是一个 UI），而是经过 CUE 模板语言这种代码化（Code）的方式来抽象和管理、并透出基础设施提供的能力。

举个例子，好比阿里的某个 PaaS 要对用户提供一个能力叫作 Web Service，这个能力是指任何须要从外部访问的服务，都以 K8s Deployment + Service 的方式来部署，对用户暴露镜像、端口等配置项。

在传统方法中，咱们可能会实现一个 CRD 叫作 WebService，而后在它的 Controller 里来封装 Deployment 和 Service。但这必然会带来前面 PaaS “能力困境”的问题：

咱们应该给用户暴露几种 Service 类型？将来用户想要其余类型怎么办？
用户 A 和用户 B 须要暴露的字段不统一该怎么办？好比咱们容许用户 B 修改 Label，但用户 A 不能够，那这个 PaaS 该怎么设计？
……

而在 KubeVela 中，像上面这样面向用户的功能，则能够经过一段简单的 CUE 模板来描述（这里有完整的例子）。而当你编写好这样一个 CUE 文件以后，直接经过一句 kubectl apply，用户就能够当即使用到这个能力：

$ kubectl apply -f web-service.yaml

更重要的是，只要执行上面这条命令，KubeVela 就会自动根据 CUE 模板内容生成这个能力的帮助文档和前端表单结构，因此用户马上就会在 PaaS 里面看到这个 WebService 功能如何使用（好比有哪些参数、字段类型），而且直接使用它，以下图 2 所示：

图 2 - KubeVela 自动生成表单示意图

在 KubeVela 中，平台的全部能力好比金丝雀发布、Ingress，Autoscaler 等等，都是经过这种方式定义、维护和透出给用户的。这种端到端打通用户体验层与 Kubernetes 能力层的设计，使得平台团队能够以极低的成本快速实现 PaaS 以及任何上层平台（好比 AI PaaS，大数据 PaaS），同时高效地响应用户的持续演进诉求。

1. 不仅是 Kubernetes 原生，是 Platform-as-Code

尤其重要的是，在实现层，KubeVela 并非简单的在客户端去渲染 CUE 模板，而是使用 Kubernetes Controller 去渲染和维护生成的 API 对象。这里的缘由有三点：

Kubernetes Controller 自然适合维护用户层抽象到底层资源之间的映射，而且经过控制循环（Reconcile）机制永远确保二者的一致性，而不会发生 IaC（Infrastructure-as-Code）系统里常见的 Configuration Drift（配置漂移）问题（即：底层资源跟用户层的输入发生不一致）。
平台团队编写的 CUE 模板 kubectl apply 到集群以后，就变成了一个 Kubernetes 中的一个自定义资源（Custom Resource），它表明了一个抽象化、模块化的平台能力。这个能力能够被全公司的平台团队复用，也能够继续修改演进，并且它是 Namespace 化的资源，因此平台的不一样租户能够分配同名但不同的模板，互不影响。这样完全解决了不一样租户对同一个能力的使用诉求不同的问题。
若是随着时间推移，用户对平台功能的设计提出了新的要求，那么平台维护团队只须要安装一个新的模板，新的设计就会马上生效，平台自己不须要作任何修改，也不用重启或者从新部署。并且新模板也会马上被渲染成表单出如今用户 UI 上。

因此说，KubeVela 的上述设计，从根本上解决了传统 IaC 系统用户体验虽好，可是生产环境上“靠不住”的老大难问题，又在绝大多数状况下让整个平台响应用户需求的时间从原先的数周，下降到几小时，彻底打通了云原生技术与最终用户体验之间的壁垒。而它彻底基于 Kubernetes 原生方式实现，确保了整个平台严格的健壮性，而且不管任何 CI/CD 以及 GitOps 工具，只要它支持 Kubernetes，就必定支持 KubeVela，没有任何集成成本。

这套体系，被你们形象的称为：Platform-as-Code（平台即代码）。

2. 别急，KubeVela 固然支持 Helm

提到 KubeVela 以及 CUE 模板这些概念，不少小伙伴就开始问了：KubeVela 跟 Helm 又是什么关系啊？

实际上，Helm 和 CUE 同样，都是一种封装和抽象 Kubernetes API 资源的工具，并且 Helm 使用的是 Go 模板语言，自然适配 KubeVela Platform-as-Code 的设计思路。

因此在 KubeVela v1.0 中，任何 Helm 包均可以做为应用组件被部署起来，而且更重要的是，不管是 Helm 组件仍是 CUE 组件，KubeVela 里的全部能力对它们都适用。这就使得经过 KubeVela 交付 Helm 包能够给你带来一些很是重要可是现有工具很难提供的能力。

举个例子，Helm 包其实不少是来自第三方的，好比 Kafka Chart，可能就是 Kafka 背后的公司制做的。因此通常状况下，你只能用，但不能改它里面的模板，不然修改后的 Chart 你就得本身维护了。

而在 KubeVela 中，这个问题就很容易解决。具体来讲，KubeVela 提供一个运维侧的能力叫作 Patch，它容许你以声明式的方式给待交付组件（好比 Helm 包）里封装的资源打 Patch，而不用去关心这个字段有没有经过 Chart 模板透出来，并且 Patch 操做的时机，是在资源对象被 Helm 渲染出来以后、提交到 Kubernetes 集群处理以前的这个时间，不会让组件实例重启。

再好比，经过 KubeVela 内置的灰度发布系统（即：AppRollout 对象），你还能够将 Helm 包做为一个总体进行渐进式发布且无需关心工做负载类型（即：哪怕 Chart 里是 Operator，KubeVela 也能够进行灰度发布），而不是像 Flagger 等控制器那样只能针对单一的 Deployment 工做负载进行发布。此外，若是将 KubeVela 同 Argo Workflow 集成，你还能够轻松的指定 Helm 包的发布顺序和拓扑等更复杂的行为。

因此说，KubeVela v1.0 不只支持 Helm，它的目标是成为交付、发布和运维 Helm Chart 最强大的平台。一些社区同窗已经在本文发布以前就火烧眉毛的试用了这部分功能，你们能够移步到这篇文章来阅读。

3. 全自助式用户体验和云原生时代的运维

得益于 Platform-as-Code 的设计，基于 KubeVela 的应用平台自然对用户是自助式的使用方式，如图 3 所示。

图 3 - KubeVela 自助式能力交付流程图

具体来讲，平台团队只须要极小的人力成本就能够在系统中维护大量的、代码化的“能力模板”。而做为平台的终端用户，业务团队只须要根据本身的应用部署需求在 PaaS UI 上选择几个能力模板，填入参数，就能够自助式的完成一次交付，不管这个应用多么复杂，业务用户的学习成本都很是低，而且默认就会遵循模板中所定义的规范；而这个应用的部署和运维过程，则由 Kubernetes 以自动化的方式去管理，从而减轻了业务用户大量的心智负担。

而更为重要的是，这种机制的存在，让运维人员再次成为了平台团队中的核心角色。具体的说，他们经过 CUE 或者 Helm 设计和编写能力模板，而后把这些模版安装到 KubeVela 系统中给业务团队使用。你们试想一下，这个过程，其实就是运维人员把业务对平台的诉求，结合整个平台的最佳实践，以代码化的方式固化成可被复用和定制的能力模块的过程。并且这个过程当中，运维并不须要去进行复杂的 K8s 定制和开发，只须要理解 k8s 的核心概念便可。另外一方面，这些代码化的能力模块，复用性极高，变动和上线很是容易，而且大多数状况下不须要额外的研发成本，能够说是最敏捷的“云原生”运维实践，可以真正让业务感觉到云原生“研发、交付、运维高效一体化”的核心价值。

4. 多环境多集群、多版本应用交付

KubeVela v1.0 的另外一个重大更新，就是改进了系统的部署结构，提供了 Control Plane （控制平面）模式，从而具有了面向多环境、多集群进行版本化应用交付的能力。因此如今，一个典型的生产环境 KubeVela 部署形态以下图 4 所示：

图 4 - KubeVela 控制平面部署形态示意图

在这个场景下，KubeVela 支持为多环境应用进行描述，支持为应用配置 Placement 策略以及应用多版本同时部署在线、并经过 Istio 进行灰度的发布模型。你们能够经过这个文档进行深刻了解。

在 v1.0 发布以后，KubeVela 会围绕上述架构进行持续的演进，其中的一个主要的工做项就是将 KubeVela Dashboard、CLI 和 Appfile 所有迁移和升级到同 KubeVela 控制平面经过 gRPC 进行交互，而不是像以前的版本那样须要直接跟目标集群打交道。这部分工做目前尚在进行中，欢迎对构建下一代“可编程式”开发者体验有心得的同窗一块儿来参与。与此同时，欧洲知名科技出版商 Springer Nature 也正在一块儿参与这部分工做以便从 CloudFoundry 上平滑迁移到 KubeVela。

结语

若是咱们总结一下 KubeVela 今天的设计与能力，其实不难发现它是今天云原生应用平台发展的一条必然路径：

彻底基于 Kubernetes 构建，自然的被集成能力和普适性，自然透出 Kubernetes 及其生态的全部能力而不是叠加抽象；
基于 X-as-Code 的平台能力模块化，配合 OAM 模型实现超低成本的能力封装、抽象和组装机制，快速敏捷的响应用户需求，提供全自助、无锁定的应用管理与交付体验；
基于 Kubernetes 控制器模式进行组件解封装和应用部署，确保最终一致性、确保应用交付与运维流程的健壮性；
内置以应用为单位的发布策略和面向多环境、多集群交付策略，极大地补充了社区目前以单一工做负载为中心的发布能力；
不管应用部署多么复杂，只须要 1-2 个 Kubernetes YAML 文件就能作完整的描述，自然适合而且大大简化 GitOps 工做流，极大程度下降了终端用户使用云原生和 Kubernetes 的上手成本，而且不带来任何能力或者抽象锁定。

更重要的是，KubeVela 以 Platform-as-Code 的设计思想，给将来基于云原生的应用平台团队提出了更加合理的组织方式：

平台 SRE 负责 Kubernetes 集群和组件的健壮性；
平台研发工程师负责开发 CRD Controller，同 Kubernetes 内置能力一块儿对应用层提供完整的应用管理、运维和基础设施能力；
业务运维结合业务诉求，负责将最佳实践代码化为 CUE 或者 Helm 模板，将平台的能力模块化；
业务用户以彻底自助化的方式使用平台的模块化能力来进行应用管理与交付，心智负担低，部署效率高。

而基于这套体系，KubeVela 应用平台还能够用来实现强大的“无差异”应用交付场景，达成彻底与环境无关的云端应用交付体验：

组件提供方将应用交付所需的能力（工做负载、运维行为、云服务）定义为 Helm 包或者 CUE 包，注册到 KubeVela 系统当中；
应用交付人员使用 KubeVela 组装上述模块化能力成为一个彻底与基础设施无关的应用部署描述，同时能够借助 KubeVela 的 Patch 等能力定制和覆盖组件提供方的配置，或者定义复杂的部署拓扑；
经过多环境、多集群交付模型定义应用在不一样环境中的部署形态和交付策略，配置不一样版本应用实例的流量分配策略。

KubeVela v1.0 的发布是咱们基于 OAM 模型以及云原生应用交付使用场景最大化验证的结果，它不只表明了稳定的API，还表明了成熟的使用范式。然而这不表明结束，而是一个全新的开始，它开启了一个“可编程式”应用平台的将来，这是一个可以充分释放云原生潜力、让最终用户和软件交付方从第一天开始就充分享受云原生技术魅力的有效路径。咱们期待这个项目能达成它最朴素的愿景：Make shipping applications more enjoyable!

了解更多

您能够经过以下材料了解更多关于 KubeVela 以及 OAM 项目的细节：

项目代码库：https://github.com/oam-dev/kubevela/，欢迎 Star/Watch/Fork！
项目官方主页与文档：https://kubevela.io/，同时欢迎参加由“云原生社区”组织的 KubeVela 文档中文本地化翻译工做！
项目钉钉群：23310022；Slack：CNCF #kubevela Channel。

KubeVela 1.0 ：开启可编程式应用平台的将来