推荐系统-07-lambda架构

Lambda 架构

Lambda 架构由Storm的做者Nathan Marz提出,其设计目的在于提供一个能知足大数据系统关键特性的架构,包括高容错、低延迟、可扩展等。其整合离线计算与实时计算,融合不可变性、读写分离和复杂性隔离等原则,可集成Hadoop, Kafka, Spark,Storm等各种大数据组件。
Lambda 架构可分解为三层Layer,即Batch Layer, Real-Time(Speed) Layer和Serving Layer。架构

Batch Layer : 存储数据集,在数据集上预先计算查询函数,并构建查询所对应的View。Batch Layer能够很好的处理离线数据,但有不少场景数据是不断实时生成且须要实时查询处理,对于这状况, Speed Layer更为适合。函数

Speed Layer : Batch Layer处理的是全体数据集,而Speed Layer处理的是最近的增量数据流。Speed Layer为了效率,在接收到新的数据后会不断更新Real-time View,而Batch Layer是根据全体离线数据集直接获得Batch View。oop

Serving Layer : Serving Layer用于合并Batch View和Real-time View中的结果数据集到最终数据集。大数据

推荐系统之lambda架构

斗鱼大数据架构

相关文章
相关标签/搜索