学习笔记-MapReduce

推荐系统:     offline层:对海量数据离线计算。 MapReduce spark     Nearline层:利用流式处理对海量数据进行实时加工 storm     online 层:负责在线计算处理,相对简单的逻辑运算。WebPy。 一致性hash算法:为了解决因特网中的热点HostPot问题 最基本的海量数据思想:分而治之思想: 按数据量划分。传统的hash:分布式mysql 按流量
相关文章
相关标签/搜索