官宣！阿里Blink和Flink合并计划出炉

时间 2020-02-09

原文原文链接

apache已公开合并计划，点击可阅读原文《Batch as a Special Case of Streaming and Alibaba's contribution of Blink》，由AI前线进行了翻译。html

**春节前一周，通过社区内部讨论，阿里巴巴大数据引擎 Blink 做为 Flink 的分支正式开源。今天，Apache Flink 官方网站发文对 Blink 贡献回 Flink 项目的意义做进一步说明，并公布了 Blink 和 Flink 的合并计划。社区的合并计划最初会将重点放在有界 / 批处理功能上，社区将对 SQL/Table API 模块进行重组，将 Blink 查询规划器（优化器）和运行时（操做符）合并为当前 SQL 运行时的附加查询处理器。通过一段过渡期以后，将开发新的查询处理器，而当前的处理器极可能会被弃用。为了合并 Blink 的调度加强功能和有界数据的做业恢复功能，Flink 社区也在努力重构当前的调度功能。git

前不久，经社区讨论，阿里巴巴决定将 Blink 贡献回 Flink 项目。为何说这对 Flink 来讲是一件大事？这对 Flink 的用户和社区来讲意味着什么？这与 Flink 的总体愿景有着怎样的关系？让咱们退后一步，一探究竟。github

针对 Blink 的贡献形式，Flink 社区讨论邮件以下：算法

https://lists.apache.org/thre...apache

统一的批处理和流式处理方法网络

从早期开始，Flink 就有意采用统一的批处理和流式处理方法。其核心构建块是“持续处理无界的数据流”：若是能够作到这一点，还能够离线处理有界数据集（批处理），由于有界数据集就是在某个时刻结束的数据流。数据结构

不少项目（例如 Flink、Beam 等）都支持“流式处理优先，将批处理视为流式处理的特殊状况”的理念，这个理念也常常被认为是构建跨实时和离线数据应用程序的强大方式，能够大大下降数据基础设施的复杂性。架构

为何批处理器仍然存在？ide

“批处理只是流式处理的一个特例”并不意味着全部的流式处理器都能用于批处理——流式处理器的出现并无让批处理器变得过期：性能

纯流式处理系统在批处理工做负载时实际上是很慢的。没有人会认为使用流式处理器来分析海量数据是个好主意。

像 Apache Beam 这样的统一 API 一般会根据数据是持续的（无界）仍是固定的（有界）将工做负载委托给不一样的运行时。

Flink 提供了一个流式 API，能够处理有界和无界的场景，同时仍然提供了单独的 DataSet API 和运行时用于批处理，由于速度会更快。

那么“批处理只是流式处理的一个特例”这种想法出了什么问题？

其实这种范式并无错。统一批处理和流式处理 API 只是一个方面，咱们还须要利用“有界数据”这个特殊状况的某些特征来应对批处理用例。毕竟，批处理器就是专门为这种特殊状况而准备的。

创建在流式运行时之上的批处理

咱们始终认为，同时拥有一个可用于流式处理和批处理的运行时是可能的。一个流式处理优先的运行时也能够利用有界数据流的特殊属性进行快速的批处理，就像批处理器那样。而这就是 Flink 所采用的方法。

Flink 包含了一个网络栈，支持低延迟 / 高吞吐的流式数据交换和高吞吐的批次 shuffle。它还提供了不少流式运行时操做符，也为有界输入提供了专门的操做符，若是你选择了 DataSet API 或 Table API，就可使用这些操做符。

所以，Flink 实际上在早期就已经展现出了一些使人印象深入的批处理性能。下面的基准测试有点旧了，但在早期很好地验证了咱们的架构方法。

排序 3.2TB（80GB/ 节点）数据所使用的时间（以秒为单位）

还差些什么？

为了总结这个方法，并让 Flink 在有界数据（批处理）方面达到最新的水平，咱们须要作出更多的加强。咱们认为下面这些特性是实现咱们愿景的关键：

真正统一的运行时操做符栈：目前，有界和无界操做符具备不一样的网络和线程模型，不会混在一块儿，也不匹配。最初是由于批处理操做符遵循的是“拉取模型”（为了方便批处理算法），而流式操做符遵循的是“推模型”（能够得到更好的延迟 / 吞吐量）。在统一的操做符栈中，持续流式操做符是基础。在操做有界数据时，若是没有延迟方面的约束，API 或查询优化器能够从更大的操做符集中选择合适的操做符。例如，优化器能够选择一个特殊的链接操做符，先彻底读取第一个输入流，而后再读取第二个输入流。

利用有界数据流来减少容错范围：若是输入数据是有界的，能够在 shuffle（内存或磁盘）期间缓冲数据，并在发生故障后重放数据。这样能够实现更细粒度的故障恢复，也更有效。

利用有界数据流操做符的属性进行调度：持续无界的流式应用程序须要同时运行全部操做符。基于有界数据的应用程序能够根据其中一个操做符如何消费数据（例如，先构建哈希表，再探测哈希表）来调度另外一个操做符。这样作能够提升资源效率。

为 DataStream API 启用这些特殊优化：目前只有 Table API 在处理有界数据时激活了这些优化。

SQL 的性能和覆盖范围：SQL 是事实上的标准数据语言，虽然它被用在持续流式处理种，但并不适用于有界 / 批处理的状况。为了与最佳批处理引擎展开竞争，Flink 须要提高 SQL 查询执行覆盖率和性能。虽然 Flink 的核心数据平面具备很高的性能，但 SQL 执行的速度在很大程度上取决于优化器规则、丰富的操做符和代码生成，等等。

如今来讲说 Blink

Blink 是 Flink 的一个分支，最初在阿里巴巴内部建立的，针对内部用例对 Flink 进行改进。Blink 添加了一系列改进和集成（https://github.com/apache/fli... ），其中有不少与有界数据 / 批处理和 SQL 有关。实际上，在上面的功能列表中，除了第 4 项外，Blink 在其余方面都迈出了重要的一步：

统一的流式操做符：Blink 扩展了 Flink 的流式运行时操做符模型，支持选择性读取不一样的输入源，同时保持推送模型的低延迟特性。这种对输入源的选择性读取能够更好地支持一些算法（例如相同操做符的混合散列链接）和线程模型（经过 RocksDB 的连续对称链接）。这些操做符为“侧边输入”（https://cwiki.apache.org/conf... ）等新功能打下了基础。

Table API 和 SQL 查询处理器：与最新的 Flink 主分支相比，SQL 查询处理器是演变得最多的一个组件：

Flink 目前将查询转换为 DataSet 或 DataStream 程序（取决于输入的特性），而 Blink 会将查询转换为上述流式操做符的数据流。

Blink 为常见的 SQL 操做添加了更多的运行时操做符，如半链接（semi-join）、反链接（anti-join）等。

查询规划器（优化器）仍然是基于 Apache Calcite，但提供了更多的优化规则（包括链接重排序），而且使用了适当的成本模型。

更加积极的流式操做符连接。

扩展通用数据结构（分类器、哈希表）和序列化器，在操做二进制数据上更进一步，并减少了序列化开销。代码生成被用于行序列化器。

改进的调度和故障恢复：最后，Blink 实现了对任务调度和容错的若干改进。调度策略经过利用操做符处理输入数据的方式来更好地使用资源。故障转移策略沿着持久 shuffle 的边界进行更细粒度的恢复。不需从新启动正在运行的应用程序就能够替换发生故障的 JobManager。

Blink 的变化带来了大幅度的性能提高。如下数据由 Blink 开发者提供，给出了性能提高的粗略状况。

在 TPC-H 基准测试中，Blink 与 Flink 1.6.0 的相对性能。Blink 性能平均提高 10 倍

在 TPC-DS 基准测试中，Blink 与 Spark 的性能，将全部查询的总时间汇总在一块儿。

Blink 和 Flink 的合并计划

Blink 的代码目前已经做为 Flink 代码库的一个分支（https://github.com/apache/fli... ）对外开放。合并这么多变动是一项艰巨的挑战，同时还要尽量保持合并过程不要形成任何中断，并使公共 API 尽量保持稳定。

社区的合并计划最初将重点放在上述的有界 / 批处理功能上，并遵循如下方法以确保可以顺利集成：

为了合并 Blink 的 SQL/Table API 查询处理器加强功能，咱们利用了 Flink 和 Blink 都具备相同 API 的事实：SQL 和 Table API。在对 Table/SQL 模块（https://cwiki.apache.org/conf...）进行一些重组以后，咱们计划将 Blink 查询规划器（优化器）和运行时（操做符）合并为当前 SQL 运行时的附加查询处理器。能够将其视为同一 API 的两个不一样的运行器。最开始，可让用户选择要使用哪一个查询处理器。

通过一个过渡期以后，将开发新的查询处理器，而当前的处理器极可能会被弃用，并最终被丢弃。由于 SQL 是一个定义良好的接口，咱们预计这种转换对用户来讲几乎没有影响。

为了合并 Blink 的调度加强功能和有界数据的做业恢复功能，Flink 社区已经在努力重构当前的调度功能，并添加对可插拔调度和故障转移策略的支持。

在完成这项工做后，咱们就能够将 Blink 的调度和恢复策略做为新查询处理器的调度策略。最后，咱们计划将新的调度策略应用于有界 DataStream 程序。

扩展的目录支持、DDL 支持以及对 Hive 目录和集成的支持目前正在进行单独的设计讨论。

总结

咱们相信将来的数据处理技术栈会以流式处理为基础：流式处理的优雅，可以以相同的方式对离线处理（批处理）、实时数据处理和事件驱动的应用程序进行建模，同时还能提供高性能和一致性，这些实在是太吸引人了。

要让流式处理器实现与专用批处理器相同的性能，利用有界数据的某些属性是关键。Flink 支持批处理，但它的下一步是要构建统一的运行时，并成为一个能够与批处理系统相竞争的流式处理器。阿里巴巴贡献的 Blink 有助于 Flink 社区加快实现这一目标。

本文做者：云学习小组

阅读原文

本文为云栖社区原创内容，未经容许不得转载。