Flink SQL 的 9 个示例

时间 2020-05-13

标签 flink sql 示例栏目 SQL 繁體版

原文原文链接

做者：贺小令（晓令）java

本文由阿里巴巴技术专家贺小令分享，社区志愿者郑仲尼整理。文章基于 Flink 1.9 版本，从用户的角度来说解 Flink 1.9 版本中 SQL 相关原理及部分功能变动，但愿对你们有所帮助。主要内容分享如下三个部分:算法

TableEnvironment 的设计与使用场景

Catalog 的设计以及 DDL 实践

Blink Planner 的几点重要改进及优化

TableEnvironment

FLIP-32 中提出，将 Blink 彻底开源，合并到 Flink 主分支中。合并后在 Flink 1.9 中会存在两个 Planner：Flink Planner 和 Blink Planner。sql

在以前的版本中，Flink Table 在整个 Flink 中是一个二等公民。而 Flink SQL 具有的易用性、使用门槛低等特色深受用户好评，愈来愈被重视，Flink Table 模块也所以被提高为一等公民。而 Blink 在设计之初就考虑到流和批的统一，批只是流的一种特殊形式，因此能够用同一个TableEnvironment来表述流和批。编程

TableEnvironment 总体设计

图1 新 Table Environment 总体设计api

从图 1 中，能够看出，TableEnvironment 组成部分以下：缓存

flink-table-common：这个包中主要是包含 Flink Planner 和 Blink Planner 一些共用的代码。
flink-table-api-java：这部分是用户编程使用的 API，包含了大部分的 API。
flink-table-api-scala：这里只是很是薄的一层，仅和 Table API 的 Expression 和 DSL 相关。
两个 Planner：flink-table-planner 和 flink-table-planner-blink。
两个 Bridge：flink-table-api-scala-bridge 和 flink-table-api-java-bridge，从图中能够看出，Flink Planner 和 Blink Planner 都会依赖于具体的 JAVA API，也会依赖于具体的 Bridge，经过 Bridge 能够将 API 操做相应的转化为 Scala 的 DataStream、DataSet，或者转化为 JAVA 的 DataStream 或者 Data Set。

新旧 TableEnvironment 对比

在 Flink 1.9 以前，原来的 Flink Table 模块，有 7 个 Environment，使用和维护上相对困难。7 个 Environment 包括：StreamTableEnvironment、BatchTableEnvironment 两类，JAVA 和 Scala 分别 2 个，一共 4 个，加上 3 个父类，一共就是 7 个。性能优化

在新的框架之下，社区但愿流和批统一，所以对原来的设计进行精简。首先，提供统一的 TableEnvironment，放在 flink-table-api-java 这个包中。而后，在 Bridge 中，提供了两个用于衔接 Scala DataStream 和 Java DataStream 的 StreamTableEnvironment。最后，由于 Flink Planner 中还残存在着 toDataSet() 相似的操做，因此，暂时保留 BatchTableEnvironment。这样，目前一共是 5 个 TableEnvironment。网络

由于将来 Flink Planner 将会被移除，BatchTableEnvironment 就会被废弃，整个 TableEnvironment 的设计也会更加简洁明了。数据结构

新 TableEnvironment 的应用

本节中，将介绍新的应用场景以及相关限制。下图详细列出了新 TableEnvironment 的适用场景：app

图2 新 Table Environment 适应场景

第一行，简单起见，在后续将新的 TableEnvironment 称为 UnifyTableEnvironment。在 Blink 中，Batch 被认为是 Stream 的一个特例，所以 Blink 的 Batch 可使用 UnifyTableEnvironment。

UnifyTableEnvironment 在 1.9 中有一些限制，好比它不可以注册 UDAF 和 UDTF，当前新的 Type System 的类型推导功能尚未完成（Java、Scala 的类型推导还没统一），因此这部分的功能暂时不支持。此外，UnifyTableEnvironment 没法和 DataStream 和 DataSet 互转。

第二行，Stream TableEnvironment 支持转化成 DataStream，也能够注册 UDAF 和 UDTF。若是是 JAVA 写的，就注册到 JAVA 的 StreamTableEnvironment，若是是用 Scala 写的，就注册到 Scala 的 StreamTableEnvironment。

注意，Blink Batch 做业不支持 Stream TableEnvironment ，由于目前 Batch 无法和 DataStream 互转，因此 toDataStream() 这样的语义暂时不支持。从图中也能够看出，目前Blink Batch只能使用 TableEnvironment。

最后一行，BatchTableEvironment 可以使用 toDataSet() 转化为 DataSet。

从上面的图 2 中，能够很清晰的看出各个 TableEnvironment 可以作什么事情，以及他们有哪些限制。

接下来，将使用示例对各类状况进行说明。

示例1：Blink Batch

EnvironmentSettings settings = EnvironmentSettings.newInstance().useBlinkPlanner().inBatchMode().build();
TableEnvironment tEnv = TableEnvironment.create(settings);
tEnv…
tEnv.execute(“job name”);

从图 2 中能够看出，Blink Batch 只能使用 TableEnvironment（即UnifyTableEnvironment），代码中，首先须要建立一个 EnvironmentSetting，同时指定使用 Blink Planner，而且指定用 Batch 模式。之因此须要指定 Blink Planner，是由于目前 Flink 1.9 中，将 Flink Planner 和 Blink Planner 的 jar 同时放在了 Flink 的 lib 目录下。若是不指定使用的 Planner，整个框架并不知道须要使用哪一个 Planner，因此必须显示的指定。固然，若是 lib 下面只有一个 Planner 的 jar，这时不须要显示指定使用哪一个 Planner。

另外，还须要注意的是在 UnifyEnvironment 中，用户是没法获取到 ExecutionEnvironment 的，即用户没法在写完做业流程后，使用 executionEnvironment.execute() 方法启动任务。须要显式的使用 tableEnvironment.execute() 方法启动任务，这和以前的做业启动很不相同。

示例 2：Blink Stream

EnvironmentSettings settings = EnvironmentSettings.newInstance().useBlinkPlanner().inStreamingMode().build();
StreamExecutionEnvironment execEnv = …
StreamTableEnvironment tEnv =  StreamTableEnvironment.create(execEnv, settings);
tEnv…

Blink Stream 既可使用 UnifyTableEnvironment，也可使用 StreamTableEnvironment，与 Batch 模式基本相似，只是须要将 inBatchMode 换成 inStreamingMode。

示例 3：Flink Batch

ExecutionEnvironment execEnv = ...
BatchTableEnvironment tEnv = BatchTableEnvironment.create(execEnv);
tEnv...

与以前没有变化，不作过多介绍。

示例 4：Flink Stream

EnvironmentSettings settings = EnvironmentSettings.newInstance().useOldPlanner().inStreamMode().build();
TableEnvironment tEnv = TableEnvironment.create(settings);
tEnv…
tEnv.execute(“job name”);

Flink Stream 也是同时支持 UnifyEnvironment 和 StreamTableEnvironment，只是在指定 Planner 时，须要指定为 useOldPlanner，也即 Flink Planner。由于将来 Flink Planner 会被移除，所以，特地起了一个 OlderPlanner 的名字，并且只可以使用 inStreamingMode，没法使用 inBatchMode。

Catalog 和 DDL

构建一个新的 Catalog API 主要是 FLIP-30 提出的，以前的 ExternalCatalog 将被废弃，Blink Planner 中已经不支持 ExternalCatalog 了，Flink Planner 还支持 ExternalCatalog。

新 Catalog 设计

下图是新 Catalog 的总体设计：

图3 新 Catalog 设计

能够看到，新的 Catalog 有三层结构（..），最顶层是 Catalog 的名字，中间一层是 Database，最底层是各类 MetaObject，如 Table，Partition，Function 等。当前，内置了两个 Catalog 实现：MemoryCatalog 和 HiveCatalog。固然，用户也能够实现本身的 Catalog。

Catalog 可以作什么事情呢？首先，它能够支持 Create，Drop，List，Alter，Exists 等语句，另外它也支持对 Database，Table，Partition，Function，Statistics 等的操做。基本上，经常使用的 SQL 语法都已经支持。

CatalogManager 正如它名字同样，主要是用来管理 Catalog，且能够同时管理多个 Catalog。也就是说，能够经过在一个相同 SQL 中，跨 Catalog 作查询或者关联操做。例如，支持对 A Hive Catalog 和 B Hive Catalog 作相互关联，这给 Flink 的查询带来了很大的灵活性。

CatalogManager 支持的操做包括：

注册 Catalog（registerCatalog）
获取全部的 Catalog（getCatalogs）
获取特定的 Catalog（getCatalog）
获取当前的 Catalog（getCurrentCatalog）
设置当前的 Catalog（setCurrentCatalog）
获取当前的 Database(getCurrentDatabase)
设置当前的 Database(setCurrentDatabase)

Catalog 虽然设计了三层结构，但在使用的时候，并不须要彻底指定三层结构的值，能够只写Table Name，这时候，系统会使用 getCurrentCatalog，getCurrentDatabase 获取到默认值，自动补齐三层结构，这种设计简化了对 Catalog 的使用。若是须要切换默认的 Catalog，只须要调用 setCurrentCatalog 就能够了。

在 TableEnvironment 层，提供了操做 Catalog 的方法，例如：

注册 Catalog（registerCatalog）
列出全部的 Catalog（listCatalogs）
获取指定 Catalog（getCatalog）
使用某个 Catalog（useCatalog）

在 SQL Client 层，也作了必定的支持，可是功能有必定的限制。用户不可以使用 Create 语句直接建立 Catalog，只能经过在 yarn 文件中，经过定义 Description 的方式去描述 Catalog，而后在启动 SQL Client 的时候，经过传入 -e +file_path 的方式，定义 Catalog。目前 SQL Client 支持列出已定义的 Catalog，使用一个已经存在的 Catalog 等操做。

DDL 设计与使用

有了 Catalog，就可使用 DDL 来操做 Catalog 的内容，可使用 TableEnvironment 的 sqlUpdate() 方法执行 DDL 语句，也能够在 SQL Client 执行 DDL 语句。

sqlUpdate() 方法中，支持 Create Table、Create View、Drop Table、Drop View 四个命令。固然，inset into 这样的语句也是支持的。

下面分别对 4 个命令进行说明：

Create Table：能够显示的指定 Catalog Name 或者 DB Name，若是缺省，那就按照用户设定的 Current Catalog 去补齐，而后能够指定字段名称，字段的说明，也能够支持 Partition By 语法。最后是一个 With 参数，用户能够在此处指定使用的 Connector，例如，Kafka，CSV，HBase 等。With 参数须要配置一堆的属性值，能够从各个 Connector 的 Factory 定义中找到。Factory 中会指出有哪些必选属性，哪些可选属性值。

须要注意的是，目前 DDL 中，还不支持计算列和 Watermark 的定义，后续的版本中将会继续完善这部分。

Create Table [[catalog_name.]db_name.]table_name(
  a int comment 'column comment',
  b bigint,
  c varchar
)comment 'table comment'
[partitioned by(b)]
With(
    update-mode='append',
    connector.type='kafka',
    ...
)

Create View：须要指定 View 的名字，而后紧跟着的是 SQL。View 将会存储在 Catalog 中。

CREATE VIEW view_name AS SELECT xxx

Drop Table&Drop View：和标准 SQL 语法差很少，支持使用 IF EXISTS 语法，若是未加 IF EXISTS ，Drop 一个不存在的表，会抛出异常。

DROP TABLE [IF EXISTS] [[catalog_name.]db_name.]table_name

SQL Client 中执行 DDL：大部分都只支持查看操做，仅可使用 Create View 和 Drop View。Catalog，Database，Table ，Function 这些只能作查看。用户能够在 SQL Client 中 Use 一个已经存在的 Catalog，修改一些属性，或者作 Description，Explain 这样的一些操做。

CREATE VIEW
DROP VIEW
SHOW CATALOGS/DATABASES/TABLES/FUNCTIONS l USE CATALOG xxx
SET xxx=yyy
DESCRIBE table_name
EXPLAIN SELECT xxx

DDL 部分，在 Flink 1.9 中其实基本已经成型，只是还有一些特性，在将来须要逐渐的完善。

Blink Planner

本节将主要从 SQL/Table API 如何转化为真正的 Job Graph 的流程开始，让你们对 Blink Planner 有一个比较清晰的认识，但愿对你们阅读 Blink 代码，或者使用 Blink 方面有所帮助。而后介绍 Blink Planner 的改进及优化。

图4 主要流程

从上图能够很清楚的看到，解析的过程涉及到了三层：Table API/SQL，Blink Planner，Runtime，下面将对主要的步骤进行讲解。

Table API&SQL 解析验证：在 Flink 1.9 中，Table API 进行了大量的重构，引入了一套新的 Operation，这套 Operation 主要是用来描述任务的 Logic Tree。

当 SQL 传输进来后，首先会去作 SQL 解析，SQL 解析完成以后，会获得 SqlNode Tree(抽象语法树)，而后会紧接着去作 Validate（验证），验证时会去访问 FunctionManger 和 CatalogManger，FunctionManger 主要是查询用户定义的 UDF，以及检查 UDF 是否合法，CatalogManger 主要是检查这个 Table 或者 Database 是否存在，若是验证都经过，就会生成一个 Operation DAG（有向无环图）。

从这一步能够看出，Table API 和 SQL 在 Flink 中最终都会转化为统一的结构，即 Operation DAG。

生成RelNode：Operation DAG 会被转化为 RelNode(关系表达式) DAG。

优化：优化器会对 RelNode 作各类优化，优化器的输入是各类优化的规则，以及各类统计信息。当前，在 Blink Planner 里面，绝大部分的优化规则，Stream 和 Batch 是共享的。差别在于，对 Batch 而言，它没有 state 的概念，而对于 Stream 而言，它是不支持 sort 的，因此目前 Blink Planner 中，仍是运行了两套独立的规则集（Rule Set），而后定义了两套独立的 Physical Rel：BatchPhysical Rel 和 StreamPhysical Rel。优化器优化的结果，就是具体的 Physical Rel DAG。

转化：获得 Physical Rel Dag 后，继续会转化为 ExecNode，经过名字能够看出，ExecNode 已经属于执行层的概念了，可是这个执行层是 Blink 的执行层，在 ExecNode 中，会进行大量的 CodeGen 的操做，还有非 Code 的 Operator 操做，最后，将 ExecNode 转化为 Transformation DAG。
生成可执行 Job Graph：获得 Transformation DAG 后，最终会被转化成 Job Graph，完成 SQL 或者 Table API 的解析。

Blink Planner 改进及优化

Blink Planner 功能方面改进主要包含以下几个方面：

更完整的 SQL 语法支持：例如，IN，EXISTS，NOT EXISTS，子查询，完整的 Over 语句，Group Sets 等。并且已经跑通了全部的 TPCH，TPCDS 这两个测试集，性能还很是不错。
提供了更丰富，高效的算子。
提供了很是完善的 cost 模型，同时可以对接 Catalog 中的统计信息，使 cost 根据统计信息获得更优的执行计划。
支持 join reorder。
shuffle service：对 Batch 而言，Blink Planner 还支持 shuffle service，这对 Batch 做业的稳定性有很是大的帮助，若是遇到 Batch 做业失败，经过 shuffle service 可以很快的进行恢复。

性能方面，主要包括如下部分：

分段优化。
Sub-Plan Reuse。
更丰富的优化 Rule：共一百多个 Rule ，而且绝大多数 Rule 是 Stream 和 Batch 共享的。
更高效的数据结构 BinaryRow：可以节省序列化和反序列化的操做。
mini-batch 支持（仅 Stream）：节省 state 的访问的操做。
节省多余的 Shuffle 和 Sort（Batch 模式）：两个算子之间，若是已经按 A 作 Shuffle，紧接着他下的下游也是须要按 A Shuffle 的数据，那中间的这一层 Shuffle，就能够省略，这样就能够省不少网络的开销，Sort 的状况也是相似。Sort 和 Shuffle 若是在整个计算里面是占大头，对整个性能是有很大的提高的。

深刻性能优化及实践

本节中，将使用具体的示例进行讲解，让你深刻理解 Blink Planner 性能优化的设计。

■ 分段优化

示例 5

create view MyView as select word, count(1) as freq from SourceTable group by word; insert into SinkTable1 select * from MyView where freq >10;
insert into SinkTable2 select count(word) as freq2, freq from MyView group by freq;

上面的这几个 SQL，转化为 RelNode DAG，大体图形以下：

图5 示例5 RelNode DAG

若是是使用 Flink Planner，通过优化层后，会生成以下执行层的 DAG：

图6 示例 5 old planner DAG

能够看到，old planner 只是简单的从 Sink 出发，反向的遍历到 Source，从而造成两个独立的执行链路，从上图也能够清楚的看到，Scan 和第一层 Aggregate 是有重复计算的。

在 Blink Planner 中，通过优化层以后，会生成以下执行层的 DAG：

图7 示例 5 Blink Planner DAG

Blink Planner 不是在每次调用 insert into 的时候就开始优化，而是先将全部的 insert into 操做缓存起来，等到执行前才进行优化，这样就能够看到完整的执行图，能够知道哪些部分是重复计算的。Blink Planner 经过寻找能够优化的最大公共子图，找到这些重复计算的部分。通过优化后，Blink Planner 会将最大公共子图的部分当作一个临时表，供其余部分直接使用。

这样，上面的图能够分为三部分，最大公共子图部分（临时表），临时表与 Filter 和 SinkTable1 优化，临时表与第二个 Aggregate 和 SinkTable 2 优化。

Blink Planner 实际上是经过声明的 View 找到最大公共子图的，所以在开发过程当中，若是须要复用某段逻辑，就将其定义为 View，这样就能够充分利用 Blink Planner 的分段优化功能，减小重复计算。

固然，当前的优化也不是最完美的，由于提早对图进行了切割，可能会致使一些优化丢失，从此会持续地对这部分算法进行改进。

总结一下，Blink Planner 的分段优化，其实解的是多 Sink 优化问题（DAG 优化），单 Sink 不是分段优化关心的问题，单 Sink 能够在全部节点上优化，不须要分段。

■ Sub-Plan Reuse

示例 6

insert into SinkTabl
select freq from (select word, count(1) as freq from SourceTable group by word) t where word like 'T%'
union all
select count(word) as freq2 from (select word, count(1) as freq from SourceTable group by word) t group by freq;

这个示例的 SQL 和分段优化的 SQL 实际上是相似的，不一样的是，没有将结果 Sink 到两个 Table 里面，而是将结果 Union 起来，Sink 到一个结果表里面。

下面看一下转化为 RelNode 的 DAG 图：

图 8 示例 6 RelNode DAG

从上图能够看出，Scan 和第一层的 Aggregate 也是有重复计算的，Blink Planner 其实也会将其找出来，变成下面的图：

图9 示例 6 Blink Planner DAG

Sub-Plan 优化的启用，有两个相关的配置：

table.optimizer.reuse-sub-plan-enabled （默认开启）
table.optimizer.reuse-source-enabled（默认开启）

这两个配置，默认都是开启的，用户能够根据本身的需求进行关闭。这里主要说明一下 table.optimizer.reuse-source-enabled 这个参数。在 Batch 模式下，join 操做可能会致使死锁，具体场景是在执行 hash-join 或者 nested-loop-join 时必定是先读 build 端，而后再读 probe 端，若是启用 reuse-source-enabled，当数据源是同一个 Source 的时候，Source 的数据会同时发送给 build 和 probe 端。这时候，build 端的数据将不会被消费，致使 join 操做没法完成，整个 join 就被卡住了。

为了解决死锁问题，Blink Planner 会先将 probe 端的数据落盘，这样 build 端读数据的操做才会正常，等 build 端的数据所有读完以后，再从磁盘中拉取 probe 端的数据，从而解决死锁问题。可是，落盘会有额外的开销，会多一次写的操做；有时候，读两次 Source 的开销，可能比一次写的操做更快，这时候，能够关闭 reuse-source，性能会更好。

固然，若是读两次 Source 的开销，远大于一次落盘的开销，能够保持 reuse-source 开启。须要说明的是，Stream 模式是不存在死锁问题的，由于 Stream 模式 join 不会有选边的问题。

总结而言，sub-plan reuse 解的问题是优化结果的子图复用问题，它和分段优化相似，但他们是一个互补的过程。

注：Hash Join：对于两张待 join 的表 t1, t2。选取其中的一张表按照 join 条件给的列创建hash 表。而后扫描另一张表，一行一行去建好的 hash 表判断是否有对应相等的行来完成 join 操做，这个操做称之为 probe (探测)。前一张表叫作 build 表，后一张表的叫作 probe 表。

■ Agg 分类优化

Blink 中的 Aggregate 操做是很是丰富的：

group agg，例如：select count(a) from t group by b
over agg，例如：select count(a) over (partition by b order by c) from t
window agg，例如：select count(a) from t group by tumble(ts, interval '10' second), b
table agg ，例如：tEnv.scan('t').groupBy('a').flatAggregate(flatAggFunc('b' as ('c', 'd')))

下面主要对 Group Agg 优化进行讲解，主要是两类优化。

■ Local/Global Agg 优化

Local/Global Agg 主要是为了减小网络 Shuffle。要运用 Local/Global 的优化，必要条件以下：

Aggregate 的全部 Agg Function 都是 mergeable 的，每一个 Aggregate 须要实现 merge 方法，例如 SUM，COUNT，AVG，这些都是能够分多阶段完成，最终将结果合并；可是求中位数，计算 95% 这种相似的问题，没法拆分为多阶段，所以，没法运用 Local/Global 的优化。
table.optimizer.agg-phase-strategy 设置为 AUTO 或者 TWO_PHASE。
Stream 模式下，mini-batch 开启；Batch 模式下 AUTO 会根据 cost 模型加上统计数据，选择是否进行 Local/Global 优化。

示例 7

select count(*) from t group by color

没有优化的状况下，下面的这个 Aggregate 会产生 10 次的 Shuffle 操做。

图 10 示例 7 未作优化的 Count 操做

使用 Local/Global 优化后，会转化为下面的操做，会在本地先进行聚合，而后再进行 Shuffle 操做，整个 Shuffle 的数据剩下 6 条。在 Stream 模式下，Blink 其实会以 mini-batch 的维度对结果进行预聚合，而后将结果发送给 Global Agg 进行汇总。

图 11 示例 7 通过 Local/Global 优化的 Count 操做

■ Distinct Agg 优化

Distinct Agg 进行优化，主要是对 SQL 语句进行改写，达到优化的目的。但 Batch 模式和 Stream 模式解决的问题是不一样的：

Batch 模式下的 Distinct Agg，须要先作 Distinct，再作 Agg，逻辑上须要两步才能实现，直接实现 Distinct Agg 开销太大。
Stream 模式下，主要是解决热点问题，由于 Stream 须要将全部的输入数据放在 State 里面，若是数据有热点，State 操做会很频繁，这将影响性能。

Batch 模式

第一层，求 distinct 的值和非 distinct agg function 的值，第二层求 distinct agg function 的值。

示例 8

select color, count(distinct id), count(*) from t group by color

手工改写成：

select color, count(id), min(cnt) from (
   select color, id, count(*) filter (where $e=2) as cnt from (       
      select color, id, 1 as $e from t --for distinct id 
      union all
      select color, null as id, 2 as $e from t -- for count(*) 
  ) group by color, id, $e 
) group by color

转化的逻辑过程，以下图所示：

图 12 示例 8 Batch 模式 Distinct 改写逻辑

Stream 模式

Stream 模式的启用有一些必要条件：

必须是支持的 agg function：avg/count/min/max/sum/first_value/concat_agg/single_value；
table.optimizer.distinct-agg.split.enabled（默认关闭）

示例 9

select color, count(distinct id), count(*) from t group by color

手工改写成：

select color, sum(dcnt), sum(cnt) from (
  select color, count(distinct id) as dcnt, count(*) as cnt from t 
  group by color, mod(hash_code(id), 1024)
) group by color

改写前，逻辑图大概以下：

图 13 示例 9 Stream 模式未优化 Distinct

改写后，逻辑图就会变为下面这样，热点数据被打散到多个中间节点上。

图14 示例 9 Stream 模式优化 Distinct

须要注意的是，示例 5 的 SQL 中 mod(hash_code(id),1024)中的这个 1024 为打散的维度，这个值建议设置大一些，设置过小产生的效果可能很差。

总结

本文首先对新的 TableEnvironment 的总体设计进行了介绍，而且列举了各类模式下TableEnvironment 的选择，而后经过具体的示例，展现了各类模式下代码的写法，以及须要注意的事项。

在新的 Catalog 和 DDL 部分，对 Catalog 的总体设计、DDL 的使用部分也都以实例进行拆分讲解。最后，对 Blink Planner 解析 SQL/Table API 的流程、Blink Planner 的改进以及优化的原理进行了讲解，但愿对你们探索和使用 Flink SQL 有所帮助。

1. Flink SQL 的 9 个示例
2. Apache Flink SQL示例
3. Flink SQL代码示例（scala版本）
4. Flink Table API示例
5. 9-Flink中的Time
6. Oracle SQL示例
7. flink sql-clent MATCH_RECOGNIZE kafka 例子
8. Flink 1.7.2 dataset transformation 示例
9. Spark SQL示例
10. Apache Flink 入门示例demo
更多相关文章...
• Thymeleaf+SpringMVC5示例 - Thymeleaf 教程
• Thymeleaf Servlet Hellow World示例 - Thymeleaf 教程
• Flink 数据传输及反压详解
• 漫谈MySQL的锁机制