Apache Doris Roadmap 2021

图片

 

随着 Doris 愈来愈普遍的被在各个公司落地使用,Doris 开发团队也在不断地收集社区用户的需求和问题反馈。html

 

为了更好地帮助用户了解 Doris 的发展方向和开发计划,百度 Doris 团队梳理了 2021 年正在进行和将要开展的工做计划。数据库

 

1. 向量化执行引擎apache

 

Doris 一直以易用性和功能性著称、而且在高并发点查询、多表 Join 等复杂多维分析场景有良好的性能表现。微信

可是在单纯的算子性能方面依然有很是大的优化空间。今年咱们会将查询层全部执行算子实现向量化,该工做预计将Doris的总体性能提高5倍左右。并发

 

2. 稳定性改进框架

 

随着Doris用户的增加,一些稳定性方面的共性问题也开始凸显。这些问题主要集中在内存OOM、查询耗时不稳定,以及一些新功能合入后引起的系统稳定性问题。Doris今年也会重点提高Doris的稳定性,包括更合理的内存管理、更精细的线程调度等。运维

同时咱们将尝试引入更加规范的单元测试和回归测试框架以进一步提高代码质量。ide

 

3. 查询优化器的改进高并发

 

Doris 现有的查询优化器源自早期版本的 Impala 查询优化器。但随着多年的不断迭代、修复和功能升级,目前的优化器已经和Impala社区有很大的不一样,而且由于一些历史缘由致使当前的优化器框架在扩展性和维护性方面都存在问题。因此在现有框架上增长更高级的优化器功能时每每会引起更多的问题。性能

所以,咱们计划引入一套新的查询优化器框架来改善这个问题。新的优化器可能会和现有优化器在很长一段时间内同时存在,以期经过社区用户的反馈和迭代来不断完善。

 

4. 复合类型的支持

 

部分业务会有包括Array、Map、Struct等复合类型的需求。好比在用户画像和用户行为分析中常用的 Array 类型。Doris 社区目前已经完成了部分复合类型的工做,今年咱们将会继续推动这方面的研发。

 

5. 大数据生态建设

 

随着ES、Flink、Pulsar、数据湖等新一代的大数据组件的流行,Doris 也在不断的和这些系统进行整合。目前社区已经完成了部分 Flink 相关的工做。

咱们也在推动和其余系统的整合。这个工做可以帮助Doris更好的和企业现有的数据基础组件进行打通,进一步下降Doris的接入成本。

 

6. 多租户和存储计算分离

 

多租户从两个角度出发,一方面是企业对于多业务线权限管理的需求,另外一方面是对不一样租户资源隔离的需求。目前不少企业在使用 Doris 时都不得不分别创建一套离线集群和一套在线集群,以隔离不一样的业务场景防止资源上的相互抢占,这样也极大的增长了数据维护成本。

咱们将会在今年尝试经过两种途径来解决这个问题,一个是经过资源标签的方式将Doris集群进行节点级的划分,并限制不一样的用户只能使用指定资源标签下的节点,从而达到在一个集群内物理隔离的效果。

第二个途径是存储计算分离,采用存储资源共享,计算资源独立的方式来知足业务需求。

 

7. 可观测性

 

系统的可观测性直接影响到运维人员对系统的把控程度。如一些用户反馈的慢查询没法定位、节点运行状态不透明、系统瓶颈没法排查等问题。咱们将尝试引入如 OpenTelemetry 等标准化的 tracing 框架来改善这个问题,但愿可以帮助运维人员更快的定位系统问题。

 

 

Join US

 

 

 

以上研发方向都已处于正在进行或即将展开中。咱们诚邀社区的小伙伴一同参与讨论开发,共同打造一款完美的分析型数据库系统。

若是你对以上任何方向感兴趣,但愿一同开发,或者有其余的建议或意见,能够经过如下渠道参与:

 

1. 订阅并发送邮件至dev@doris.apache.org‍

 

以 Apache Way 的方式参与社区,订阅方式见官网:

 

 

 

 

 

 

 

 

 

 

http://doris.incubator.apache.org/master/zh-CN/community/subscribe-mail-list.html#_1-发送订阅邮件

 

邮件列表是 Apache 社区最经常使用的沟通方式。咱们会积极回复邮件列表中的问题。

 

 2. 在Doris论坛发帖留言

 

在百度开发者社区Doris论坛发帖留言讨论:

 

https://ai.baidu.com/forum/topic/list/209

 

咱们也会不按期的将一些用户常见问题在论坛中进行汇总和答复,方便用户查找。

 

 

 3. 微信公众号后台留言

 

 

直接在 ApacheDoris 微信公众号后台留言,您能够留下您的联系方式,咱们将与您取得联系。

 

 

 4. 加入Baidu Doris 团队

 

 

Baidu Doris 团队主要负责Doris内核研发、商业化支持、云端服务和私有化部署。同时也负责维护Doris开源社区,欢迎有大数据系统内核研发经验的同窗加入咱们。您能够经过公众号后台留言或者发送简历至 talent-doris.baidu.com,咱们虚位以待。

相关文章
相关标签/搜索