百度搜索引擎——超链分析

提及百度搜索引擎,面试的时候问到过,特此总结一番,并根据网上所了解的进行综合汇总!面试

背景:超链分析技术始源于百度,是新一代的搜索引擎关键技术,已为世界各大搜索引擎广泛采用!在李彦宏申请《超链文件检索系统和方法》这个专利的时候,当时的搜索引擎并无把连接计入到关键词的相关性中,当时的搜索引擎对于网页相关性的判断主要依靠的是页面关键词的密度。数据库

技术阐述:网站

用比较生动的网上案例来讲明:搜索引擎

有一个大学足球队要选拔球技好的新成员,辅导员来到班里,问班里的学生:“大家谁足球踢的好”?同窗A举手,站起来讲:“我踢的好”。同窗B:“我踢的好,我在一个业余足球队担任前锋”。同窗C:“我踢得好,我在高中就是校队前腰,平均每场比赛有3次助攻”。(以上属于自吹自擂 ,也就是页面关键词密度)同窗D:“我踢得好,不信你问问班里的其余同窗,个人技术是一流的。”而后班里的同窗纷纷表示,D的技术很好,司职后卫堪称铁卫,意识一流,跑动积极等等。最后,辅导员选择了推荐同窗D。咱们来回顾一下:足球队就是用户,提出需求“选拔球技好的新成员”;辅导员是搜索引擎,在用户提出需求以后,开始为用户提供选择项;同窗A、B、C、D是搜索引擎数据库中存在的网站,其中A、B与C都是在本身说本身好,并且一个比一个说的好听,这就是关键词密度;同窗D不只本身说本身厉害,其余同窗也证实了其技术一流。其余同窗就是“外链”。辅导员推荐了同窗D,由于不只他说本身好,其余同窗也说他好,相对其余三位同窗,他更有说服力。辅导员只负责推荐,至于足球队是否选用D同窗,这个就要看试训之类的时候他的表现。
spa