全票经过!网易数帆开源项目Kyuubi进入Apache孵化器

北京时间2021年6月21日,全球顶级开源组织Apache基金会宣布,网易数帆开源的大数据项目Kyuubi以全票经过的表现,正式进入Apache基金会孵化器。 根据投票结果,Kyuubi得到了13个约束性投票(binding votes)和8个无约束性投票(non-binding votes),投票所有持赞赞成见,无弃权票和反对票。html

Kyuubi 项目 Apache 孵化进展

Kyuubi 是网易第一款贡献给 Apache 基金会进入孵化器的开源项目。开源至今,Kyuubi 已累积接受了 29 位国内外开发者超过 200 个以上的提交。固然,进入Apache 孵化器只是一小步。 将来, Kyuubi 社区将遵循「The Apache Way」, 打造更加多元化的生态和社区,由衷地欢迎更多的贡献者、用户可以参与到Kyuubi社区中来。git

Kyuubi 系统介绍

Kyuubi 的命名源自中国神话《山海经》,意为“九尾狐”。狐会喷火,象征Spark;狐有九尾,类比多租户,在Spark上实现多租户是系统设计之初的主要目的。而后咱们取了《火影忍者》动漫中角色九尾的罗马音['kju:bi:],做为言简意赅的项目名称。github

Kyuubi 的最终目标是让“大数据平民化”。为实现这个目标,Kyuubi遵循“专业人作专业事”的准则,经过 Kyuubi的 C/S 架构,服务端大数据专家能够将 Spark 等大数据算力极致优化并高度封装后提供出来,业务端专家可经过该算力直接在本身擅长的业务领域处理数据产生价值,二者之间也经过简单的接口进行必要且有效的直接交互。apache

Kyuubi 使用场景

替换 HiveServer2,轻松得到 10~100 倍性能提高安全

  • Kyuubi 高度兼容 HiveServer2 接口及行为,支持无缝迁移
  • Kyuubi 分层架构,消除客户端兼容性问题,支持无感升级
  • Kyuubi 支持 Spark SQL 全链路优化及再加强,性能卓著
  • 高可用、多租户、细粒度权限认证各类企业级特性通通都有

构建 Serverless Spark 平台架构

  • Serverless Spark 目标绝对不是让用户调用Spark的API、继续写 Spark 做业
  • 经过 Kyuubi 预置的 Engine 模块,用户无需理解 Spark 逻辑, 入门门槛极低
  • 用户只需经过JDBC及SQL操做数据专一自身业务开发便可,资源弹性伸缩,0运维
  • 支持资源管理器(Kubernetes, YARN等),Engine 生命周期,Spark 动态资源分配3级不一样粒度全方位的资源弹性策略
  • 支持YARN/Kubernetes多种资源管理器同时调度,保障历史做业安全迁移上云
  • Spark 自适应查询引擎(AQE)及 Kyuubi AQE plus,提供澎湃动力

构建统一数据湖探索分析管理平台框架

  • 支持 Spark 全部官方数据源及第三方数据源
  • 支持 Spark DSv2 元数据管理,直观进行数据湖构建及管理
  • 支持 Apache Iceberg/Hudi, DeltaLake等全部主流数据湖框架
  • 一个接口一个引擎一份数据,提供统一的分析查询、数据摄取、数据湖管理平台
  • 批流一体,支持流式做业(Upcoming)

致谢

Kyuubi的成长和发展,尤为是进入Apache基金会孵化器,获得了来自各个组织的广大开源热爱者、贡献者以及终端用户的支持。less

在此,特别感谢给Kyuubi提供指导的Champion和Mentors:姜宁 Willem Ning Jiang 、章剑锋 Jeff Zhang、张铎 Duo Zhang、Akira Ajisaka。此外,也感谢提出issue和建议的伙伴们,以及国内外数十家企业用户的贡献与支持。运维

很高兴Kyuubi项目获得Apache基金会的承认。Kyuubi项目做为网易数帆‘人人用数据,每天用数据’理念的支撑技术,以及打造统一云原生操做系统的重要组件,咱们把它捐献给Apache基金会,回馈社区,为普惠大数据贡献咱们的力量。将来,网易数帆会在面向企业数字化的基础软件领域,和各个开源社区进行更加普遍和密切的合做。 ——网易副总裁汪源ide

欢迎加入Kyuubi社区

Kyuubi 社区将践行"Community Over Code"的 Apache 社区文化,欢迎更多的组织和我的参与到Kyuubi社区建设,促进Kyuubi社区发展。

更多 Apache 孵化进展请参考:https://incubator.apache.org/projects/kyuubi

更多阅读

项目原始地址:https://github.com/NetEase/kyuubi

项目原始文档:https://kyuubi.readthedocs.io/en/latest/index.html

Kyuubi: 网易数帆开源的企业级数据湖管理平台(架构篇)

大数据实战:Kyuubi 与 Spark ThriftServer 的全面对比分析

提效 7 倍,Apache Spark 自适应查询优化在网易的深度实践及改进

拥抱开源,咱们是认真的-网易易数2020年Apache Spark贡献总结

网易汪源:统一负载与多云环境的“开放姿态”,才是云原生

【视频】Kyuubi:开源企业级Serverless Spark框架

相关文章
相关标签/搜索