[Hadoop] 实际应用场景之 - 百度

百度在2008年就开始使用Hadoop作为其离线数据分析平台,从Hadoop v0.18/0.19开始,300台机器,2个集群,现在的规模为2W台节点以上,最大集群接近4,000节点,每日处理数据20PB+,每日作业数120,000+ Hadoop在百度主要用于如下场景: 日志的存储和统计; 网页数据的分析和挖掘; 商业分析,如用户的行为和广告关注度等; 在线数据的反馈,及时得到在线广告的点击情况
相关文章
相关标签/搜索