百度、谷歌等搜索引擎的实现原理

时间 2019-12-04

原文原文链接

原理介绍-百度、谷歌等搜索引擎的实现思路引言第一步分词第二步匹配关键词第三步清洗得到的文章第四步排序输出重点说明引言本文只是介绍实现思路针对使用技术进行介绍，无相关代码。推荐技术solr ,hadoop ,lucene/ElasticSearch,nutch一条龙服务前端第一步分词推荐使用IKanalyze或者mmseg4j，对中英文良好的支持，做用为将一句话拆成多个词汇。

>>阅读原文<<