Flink是最接近于谷歌Dataflow大数据分析平台的设计的开源分布式计算引擎,其核心设计理念与Spark有很大的不一样。网络
从设计出发点,Flink是一个流计算处理计算引擎,把批处理视为无限流计算的一种特例,Spark是批处理计算引擎,把流处理视为迷你批处理,由于设计上的差别,致使在对处理时延要求高的场景中,Flink更加合适。架构
从生态上来讲,两者都有SQL、机器学习、图计算等基本的组件,可是Spark在丰富程度、成熟度方面比Flink有优点。机器学习
关于Flink的资料已经至关多了,笔者就不作多此一举写了,要掌握Flink的精妙,必需要了解其底层的基本原理,如下是必读的资料:异步
理解Flink的设计原则
Google Stream 101越了批处理的流处理世界分布式
Google Stream 102超越了批处理的流处理世界学习
Flink原理和实现
Flink的架构和拓扑概览大数据
理解 Flink 中的计算资源优化
Flink如何生成ExecutionGraph及物理执行图设计
Flink 生成StreamGraph事件
Flink Window的实现原理
Flink中的状态管理
Flink中的反压Back-Pressure
Flink Operator Chain原理
Flink内存管理
Flink异步快照机制-Failover
数据流的类型和操做
Flink Async IO(异步IO)
Flink SQL
Flink SQL的大部分代码实现是阿里巴巴的Blink团队贡献给Apache的。
Flink SQL 核心功能解密
Flink SQL维表Join和异步优化
Flink SQL 异步IO设计
Flink SQL数据去重的技巧和思考
Flink SQL TOP N的挑战与实现
Flink SQL 流计算“撤回(Retraction)”案例分析
Flink SQL 解决热点问题的大杀器MiniBatch
Flink Table API&SQL的概念和通用API
Flink CEP复琐事件处理
Flink-CEP论文与源码解读之状态与状态转换
Flink之CEP-API简介
Flink之CEP案例分析-网络攻击检测
Flink-CEP之NFA
Flink-CEP之NFA编译器
Flink-CEP之模式流与运算符
Flink事务
Flink Streaming Ledger 支持流式处理ACID事务!
Flink源码解析
Apache Flink源码解析 DataStream API
Flink Exactly Once语义
flink的两阶段提交协议-实现端到端的Exactly Once语义
Flink案例
Flink在惟品会的实践
Flink在美团的实践应用
Flink在G7的实践
Flink在饿了么的应用
基于Flink的实时特征平台在Flink的应用
未完待续!