360 搜索的百亿级网页搜索引擎架构实现

目前 360 搜索每日抓取的网页数量高达十亿,已经收录的网页基本上是万亿级别的网页集合,实际可检索的网页是在一个百亿级别的网页集合里。前端 目前 360 搜索的单日流量是亿级 pv。咱们目前的在线、离线机群有几万台服务器来维护这么大量级的计算。web 主要内容 我今天的分享的主要会侧重于百亿级网站搜索引擎架构的一些核心模块的理论设计。本次分享内容分为如下四个模块:算法 如何设计搜索引擎 百亿级网页
相关文章
相关标签/搜索