精通Apache Flink必读系列文章

Flink是最接近于谷歌Dataflow大数据分析平台的设计的开源分布式计算引擎,其核心设计理念与Spark有很大的不一样。网络

从设计出发点,Flink是一个流计算处理计算引擎,把批处理视为无限流计算的一种特例,Spark是批处理计算引擎,把流处理视为迷你批处理,由于设计上的差别,致使在对处理时延要求高的场景中,Flink更加合适。架构

从生态上来讲,两者都有SQL、机器学习、图计算等基本的组件,可是Spark在丰富程度、成熟度方面比Flink有优点。机器学习

关于Flink的资料已经至关多了,笔者就不作多此一举写了,要掌握Flink的精妙,必需要了解其底层的基本原理,如下是必读的资料:异步

理解Flink的设计原则
Google Stream 101越了批处理的流处理世界分布式

Google Stream 102超越了批处理的流处理世界学习

Flink原理和实现
Flink的架构和拓扑概览大数据

理解 Flink 中的计算资源优化

Flink如何生成ExecutionGraph及物理执行图设计

Flink 生成StreamGraph事件

Flink Window的实现原理

Flink中的状态管理

Flink中的反压Back-Pressure

Flink Operator Chain原理

Flink内存管理

Flink异步快照机制-Failover

数据流的类型和操做

Flink Async IO(异步IO)

Flink SQL
Flink SQL的大部分代码实现是阿里巴巴的Blink团队贡献给Apache的。

Flink SQL 核心功能解密

Flink SQL维表Join和异步优化

Flink SQL 异步IO设计

Flink SQL数据去重的技巧和思考

Flink SQL TOP N的挑战与实现

Flink SQL 流计算“撤回(Retraction)”案例分析

Flink SQL 解决热点问题的大杀器MiniBatch

Flink Table API&SQL的概念和通用API

Flink CEP复琐事件处理
Flink-CEP论文与源码解读之状态与状态转换

Flink之CEP-API简介

Flink之CEP案例分析-网络攻击检测

Flink-CEP之NFA

Flink-CEP之NFA编译器

Flink-CEP之模式流与运算符

Flink事务
Flink Streaming Ledger 支持流式处理ACID事务!

Flink源码解析
Apache Flink源码解析 DataStream API

Flink Exactly Once语义
flink的两阶段提交协议-实现端到端的Exactly Once语义

Flink案例
Flink在惟品会的实践

Flink在美团的实践应用

Flink在G7的实践

Flink在饿了么的应用

基于Flink的实时特征平台在Flink的应用

未完待续!  

相关文章
相关标签/搜索