大数据相关业务

搜索引擎 Google三驾马车GFS,MapReduce,Bigtable初衷就是用于搜索领域。 1.搜索引擎涉及以下3部分: 1).爬虫——数据收集中心,一个互联网世界的缩影 2).索引系统——分析整理爬虫收集到的资源,为检索系统提供数据 3).检索系统——从预处理好的资源里挑选出用户最满意的结果最快最好的展现 2.架构图: 3.基于MapReduce的建库系统(建库流) • 目的:建立供检索使
相关文章
相关标签/搜索