大概4月,Flink1.13就发布了,参加 了Flink1.13 的Meetup,收获仍是挺多,从大的方面讲就是FlingSql的改进和优化,资源调度管理方面的优化,以及流批一体Flink在运行时与DataStream API的优化,另外就是State backend 模块的优化,本篇文章既是当时作的笔记,又是在后续查阅官网等作的补充,html
Flink 的一个主要目标取得了重要进展,即让流处理应用的使用像普通应用同样简单和天然。Flink 1.13 新引入的被动扩缩容使得流做业的扩缩容和其它应用同样简单,使用者仅须要修改并行度便可。react
这个版本还包括一系列重要改动使使用者能够更好理解流做业的效能。当流做业的效能不及预期的时候,这些改动能够使使用者能够更好的分析缘由。这些改动包括用于识别瓶颈节点的负载和反压视觉化、分析运算元热点程式码的 CPU 火焰图和分析 State Backend 状态的 State 存取效能指标sql
在刚刚发布的 1.13 版本中,Flink SQL 带来了许多新 feature 和功能提高,在这里围绕 Winddow TVF,时区支持,DataStream & Table API 交互,hive 兼容性提高,SQL Client 改进 五个方面apache
flip-145 window tvfapi
window 性能优化缓存
flip-162时区分析性能优化
flip-163 改进sql-client,hive兼容性网络
flip-136 加强datastrem 和 table的转换架构
Flink 1.13 新增了被动资源管理模式与自适应调度模式,具有灵活的伸缩能力,与云原生的自动伸缩技术相结合,可以更好地发挥云环境下弹性计算资源的优点,是 Flink 全面拥抱云原生技术生态的又一重要里程碑。本次议题将对 Flink 1.13 中的被动资源管理、自适应调度、自定义容器模板等新特性,我以为这个的扩展才是Flink这次版本特别重要的一个feature函数
在 1.13 中,针对流批一体的目标,Flink 优化了大规模做业调度以及批执行模式下网络 Shuffle 的性能,从而进一步提升了流做业与批做业的执行性能;同时,在 DataStream API 方面,Flink也正在完善有限流做业的退出语义,从而进一步提升不一样执行模式下语义与结果的一致性
api下面的shuffle架构实现
更多能够查看Flink官网 https://ci.apache.org/projects/flink/flink-docs-release-1.13/release-notes/flink-1.13/
参考部分:https://tw511.com/a/01/34869.html
吴邪,小三爷,混迹于后台,大数据,人工智能领域的小菜鸟。
更多请关注