细品谷歌vs百度

前言

前不久打开我对谷歌浏览器的新的认知,我和很多人一样,听到谷歌,第一个想到的不是gmail而是他的对手百度,想想两者对比,给我的感觉谷歌比百度强点,但是为什么呢?两者有什么渊源,联系和区别呢?所以开始寻找相关资料,写下这篇博文总结一下。
在这里插入图片描述

算法上的了解

链接:https://www.zhihu.com/question/20019508/answer/13698842
谷歌的算法与百度的算法到底有什么不同?

简单讲,其不同是方方面面的。先明确一个概念。网页排序算法其实只是一个统称,并不对应一个唯一的具体算法,而是一个混杂了多种算法的排序逻辑,本质上是一个排序系统。就好像一道菜的做法,从洗菜、腌制、烹煮、调味是有很多道工序的,不是一句“大火烹算法”或“小火煮算法”能概括的。所以不能简单地说谷歌在用A算法,而百度在用B算法。两套系统是由不同研发人员,在不同的时间和地域,基于不同的资源、用户需求、用户反馈、设计思想、评价方式构造的两个不同的排序系统。可以类比MSN和QQ,亚马逊和天猫,它们的展现形式和使用体验或许类似,但内部构造的区别却是方方面面的。如果要准确回答这个问题,必须首先了解百度和Google各自的排序算法。据坊间传闻,了解Google核心排序算法的全球总人数加起来不超过20人(包括Larry Page在内),而且这些人都在Google总部,甚至连前谷歌中国高##层都不在其中。当然这只是传闻,我相信实际人数会比这个高,其机#密程度也没到这种地步,但无论如何,我想LZ在知乎是不可能得到确切答案的(这种商业机#密即使真的有人知道,他也不可能明说的,否则就等着被起诉吧)。我只就信息检索常识的角度来说一下可能会不同的方面,以及它们对排序结果的影响,让大家有个大概的认识。这里不涉及任何公司的技术和机#密,所有涉及技术均可以从信息检索文献中查到。信息检索系统,仅就排序而言,主要流程可以归纳为两部分:特征选取,特征使用。前者选择/抽取特征,后者利用特征进行排位计算。所谓特征就是反应当前查询下,各个网页好坏的一个指标,比如PageRank,BM25,用户的个性化倾向,用户反馈等。匹配度越高的网页应该排序越靠前。

  1. 特征选取的不同除了在信息检索学术界有很多公认比较好的特征两家都会使用外–比如关键词的命中比例、命中紧邻程度、命中位置、PageRank(百度用李彦宏申请专利的一个类似特征)。两个公司会根据自己不同的需要和想法使用不同的特征。比如Google的用户分布在全球各地,肯定要非常重视语言/地域特征,搜中文给中文网页更好,搜英文给英文网页就好,即使同样搜英文,大陆用户、美国用户期望看到的结果也往往不同。而百度由于在初期很长的时间内只做中文搜索,这些特征初期估计没有或者用的很轻。再比如google有gmail的账号体系,而百度有知道、贴吧的账号体系,两者能够获得用户的个性化特征也是不同的(关于个人信息的收集,互联网无隐私不是什么秘密,大家心里有数就好)。总之两家由于自身定位和信息来源的不同,拿到和使用的特征是不一样的。

2)使用特征方法的不同
仅科普一下这个概念吧,目前利用特征主要方法主要有两种:人工规则、机器学习。两者最大的区别在于,前者的规则是开发人员拍脑袋想出来的,后者的规则是使用统计学方法由机器学出来的(具体怎么学请参见《机器学习》相关知识,简单讲就是你先人工标注大量搜索结果,注意是大量的,并告诉机器哪些是好结果,哪些是差结果,然后让机器通过这些例子自己总结规律。之后就可以让机器利用这些规律自动判断新的搜索结果好坏了)。这两种方法其实各有利弊,人工规则精准,但过于武断,后期会变得过于复杂庞大,不灵活;机器学习更贴合实际数据,但需要大量准确的标注数据,且不善于针对性地处理比较罕见的查询。总之,即使两家公司用相同的特征,使用的方法也不可能完全相同;如果都用机器学习,标注数据和优化标准会有不同;如果都用规则,具体规则也会不同。这一切取舍选择,会以大部分实际用户的需求作为准绳。从这个角度讲,百度不是更懂中文,而是更懂中国网民,尤其是占绝大部分的草根网民。综上所述,两者算法不同处有很多。但无论如何不同,占绝大多数的用户需求会决定最终的排序效果。所以从结果而言google多国语言搜索更好、学术搜索更高;而百度娱乐搜索更好、草根需求满足更好。除了某些在知乎写了不能发表的内容,无论方法有多不同,搜索结果都是由绝大部分用户需求所决定的。

  1. 常见谣言
    1) 百度竞价排名,Google没有这是一条流传甚广的过时信息,广到现在很多学计算机的同学也这么认为。百度最早的确是竞价排名,但那已经是N年前的事情了。竞价排名指的是对自然网页的排序,最终由网页所属方竞价,价高者排前面。其实2009年百度的凤巢系统上线之后,百度网页排名和广告排名正式分开。网页排名从此就不涉及竞价排名了,网页按网页匹配去排,广告按竞价去排,两者展示的位置独立,两者的排序也是不同部门在负责。从绩效考核和成本收益比的角度来推测,目前百度的网页结果应该是按照系统排序打分排出来的,并不涉及钱的问题。任何公司的排序算法都会不定期升级,因此如果你是靠SEO做到了排名靠前,但网页内容并不优胜于其它网页的话,在下次升级之后可能就找不到了,更相关的网页会排上来。很多流传说这是因为没给百度钱,很多人深以为然。。。反正我觉得不靠谱。简单的反证法:在这个竞争白热化的互联网时代,如果百度在公开卖网页排序排名,第二天连居委会老大妈都会看到微博截图、电话录音、360弹窗。实际情况是大妈们在快乐地跳广场舞。。。很多知友会说,可是现在百度网页结果还是有很多广告啊(尤其是虚假的),我点到的都是广告!额…其实,你如果仔细看的话,广告结果后面都有“百度推广”四个字,有一些关键字会给广告加深一点的底色…而这些自然网页结果都是没有的…原则上讲…百度确实做到了广告与自然结果分开,至于是否容易辨识…就看大家各自眼力了。相信引入更多竞争后这些会慢慢好转。其实Google也是有广告的,广告也是竞价的,可能中文的广告少一点节操高一点而已,这是当今所有主流搜索引擎的盈利模式。另外还有很多人说,百度的广告是在网页结果上方的,Google是在右侧栏的,你去Google搜一下”鲜花“试试。至于广告虚不虚假,公平的说,这和百度没太大关系。
    2)搜索排名就是PageRankPageRank只是其中一个特征。由于大量的SEO就像@谷健民所说,这个特征目前的使用权重已经比最初有所降低。但不管怎么样,PageRank离整个排序系统还差得很远,就像毛笔质量和如何考中状元的关系一样。
    小结
    想要清晰全面了解两者的算法几乎不可能,随着近几年谷歌加强对本土化的重视,搜索特征的完善,内容是看,和百度差别不大,但是相对而言,百度市场重点还是中国,作为广告商更加优先选择百度,数量也较多,所以产生广告问题,但是百度同样存在骗取点击率(个人看法),相对于谷歌,百度将广告设置顶部,有点…

市场份额

为什么谷歌相对较快

因为谷歌浏览器 每一个标签都是一个单独的进程,在页面开的少的情况下,谷歌是比百度快的,但是开多了的情况下,还是比百度快的,因为开多了的情况,就会类似于 墓碑机制 把前面没在访问的页面 只保留核心数据 比如说 访问的url地址 再回过头访问的话,又要重新加载那个页面了,而百度也是差不多的,但是百度你把所有的标签页面都关闭的时候,百度还在还会保留一个初始页,但是谷歌就会关闭掉了,谷歌浏览器是谷歌为了推广他的各种服务 谷歌地图啦 谷歌邮箱啦 而产生的浏览器 所以 追求速度,百度呢 ?速度也很快,但是更加追求各种功能。

百度谷歌异同

谷歌和百度的相同之处:
1.两者都比较注重外链。外链在整个优化的过程中, 起到至关重要的作用, 你做的关键词外链越 多,质量越高,不管是百度还是谷歌,都会取得一个很好的排名。
2.对待作弊违法站点处罚都很严厉,评判标准也很严格。
3.都会针对用户进行一定的优化,方便用户搜索。

谷歌与百度的不同之处:
1.谷歌在搜索结果上显的更客观, 尤其在搜索技术性文章的时候,
结果更加精准。而百度则更侧重于中国网民的搜索习惯,搜索结果更加大
众化。这就是为什么技术人员更喜欢用谷歌,而百度更符合大众口味的原 因。

2.在收录网站的时候,百度与谷歌也有所不同。 google收录新站的速度比较快,一般的新站,如果被收录的首页,在 接下来的很短的一段时间里,整个网站大部分网页都会被收录。百度收录网站的过程就是一个比较平缓的进程,它 在一开始就会审核你网站的所有文章,分析文章的价值,有选择的进行收录,这个过程持续不断, 收录量也不会有太大波动, 一直呈上升趋势, 除非你的网站作弊或者被降权。也有些不同饿表现形式.。一般情况下,谷歌的收录量都要比百度大。

3.百度与谷歌他们在 SEO技术上的一些差别。
在 TITLE标题上,百度对含有多个关键词的标题比谷歌更友好些,谷歌就不一定了。对于百度来说,标题非常重要,你可以不设置关键词和描 述, 但一定不能忽视标题, 并且标题最好是用词语组合。

4.在页面更新上,谷歌要比百度快很多。
一般做一个关键词页面,第二天甚至更快,谷歌就会收录,并且会有 一个很好的排名,但是你要想保持也不是件容易的事情,在接下来的 几天里,如果你的内容可读性不是很高,谷歌的排名会慢慢下降,直到你 找不到。而百度收录关键词页面就会慢很多,审查也更加严格,但是 一旦你的关键词页面被收录,并且获得了一个好的排名,这个位置很长一 段时间就会是你的,除非你的网站被降权或者作弊了。 经过多年的发展虽然百度早已成为中文搜索引擎的老大,但谷歌是世 界搜索引擎的龙头。凭借着其强大的技术后盾和卓越的性能,谷歌决 心要在中文搜索的市场里分得一杯羹。官方说法是谷歌目前占中文搜索 20%的份额,并且随着谷歌官方技术不断投入并呈现出不断增长趋势.

谷歌与百度的各自优缺点
谷歌
1、优点:
a,搜寻速度快和资料丰富, 页面布局合理, 新闻更新及时, 单位面积信息量较大, 图片使用的较为充分;
b,关键词邮件订阅服务 Google alert 可以提供网页及新闻的及时信息提供。
2、缺点:
a,责任意识稍差。 谷歌搜索出现的内容更多一些,
但是有好多不良的东西也会搜 到;
b,Google站点有时会出现不稳定的情况。登陆缓慢,无法登陆,死链接等问题, Google会有死链接出现,很多网页无法打开;
c,信息本土化有待加强。 Google一部分新闻源是国外站点,会无法登陆。

百度
1、优点:
a,最大的中文搜索网站,搜索能力强。生活搜索,生活话题可以选用此引擎, 此外个性化的知道平台, 很强大, 适合搜索一般问题, 很快找到你想要的东西的 答案,某些很偏的也能找到;
b,国内涉及范围细。特别是百度百科,内容正式准确,视频链接各大知名网站,贴吧活跃;
2、缺点:
a,有很多人瞎回答问题,浑水摸鱼,滥竽充数的答案太多;
b,搜索结果受到人工干涉。

谷歌的几个亮点

1.运行速度,搜索速度快。
2.在搜索时产生广告更加注重用户体验。
3.最近开源,而且内容丰富自由,可以使用插件和脚本。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

两者的渊源

链接:http://www.tool77.com/wenku/download/be3e1ad5148a442da98bd1a2665fa744
Google创立于1998年,百度创立于2000年。Google依靠PageRank算法起家,百度有类似的专利,二者的思路也差不多,申请专利是前后脚的事,几乎同时想到了近似的计算网页排序的方法。与其它本土新创公司相比,百度在起点上堪称得天独厚,与世界级公司的初始差距几可忽略不计。

然而一路走来,二者间的差距却越来越大。Google市值目前接近1900亿美元,百度仅为200多亿美元;Google2009年营收接近250亿美元,百度不足6亿美元;Google是公认的全球互联网霸主,而百度依然只是一个土狼。

对百度而言,这样的比较或许并不公平,因为二者所依托的市场背景太不一样了。在创业初期,美国的互联网普及程度、用户水平、商业环境和人才资源远非中国能比,美国网民基本上是社会的主流人群,而当时的中国网民绝对是社会中的一个“草根族群”。网民素质所决定的市场需求,影响了二者不同的发展路径,十年来Google不断向企业商务服务方面扩张,百度则更多地偏向音乐、社区、视频等与娱乐相关的领域。

不少人批评百度“只会模仿,不懂创新”,似乎不符合实际。百度是中国互联网界绝无仅有的从创立之日起就以技术立业的公司,并以此为核心建设自己的企业文化。当时是互联网的“圈地时代”,新浪、腾讯、阿里巴巴等公司只要能圈到一块地未来就可能挣钱,但百度一开始圈到的,是最贫瘠的一块地——用技术为用户提供服务,用户觉得好才用。

这与创始人李彦宏的特点有关,他从骨子里相信技术,相信技术可以改变商业,可以带来商业回报。他做到了他相信的一切,并把这种相信带进了百度的骨子里,建立了百度的“工程师文化”。

百度的创新,基本上可以划分为三个时期:一是2000—2005年,专注于做搜索,致力于改善用户体验、探索商业模式,并创造性地针对本土特点推出了音乐搜索;二是2006-2008年,百度开始向社区化转型,推出了贴吧、百科、百度HI等社区化产品;三是2008年至今,百度开始向电子商务转型,百度币、有啊以及与日本乐天的合作都是这种尝试的产物。第三阶段尚未得到成功的证明,但前两个阶段确实做得有声有色。李彦宏证明了百度确实比Google “更懂中文”。 但批评者并没有错,虽然Google已退出中国内地,在全球范围来看,百度跟Google的差距在进一步加大。国内有种说法,“中国互联网有两个半巨头,一个是腾讯,一个是阿里巴巴,半个是百度”。从目前的市场价值上来说,百度并不弱于腾讯和阿里巴巴,但是有分析认为百度在战略布局、商业模式可持续性、市场辐射能力、对社会整体的影响力上已开始与这两家存在某种距离。

冰冻三尺,非一日之寒。百度创立时的基因缺失为这种局面埋下了伏笔。李彦宏相信技术能改变商业,能带来商业回报,百度的创立有更明确的商业预期,上市之后迫于资本市场压力,盈利动机更是直接。但Google不一样,Google的创办与谢尔盖·布林、拉里·佩奇以个人身份无法申请PageRank算法的专利密切相关,当时Google的两位创始人还是没有走出校门的研究生,因此Google创办时就少了一些商业考量,多了一点理想主义。 这是一种微妙但极其重要的差异,Google也因此具备一家伟大公司的基因。Google“不作恶”的价值观、“整合全球信息”的使命感,让它能够吸引全球最优秀的人才,并在战略和视野上有了天然的、竞争对手无法企及的高度。 这同样也是极其重要的优势,看一家技术公司有没有未来,看最优秀的人才向何处流动就知道了。在战略上,Google进军操作系统、浏览器、手机,看似与主营业务完全不搭,但“整合全球信息”提供了价值出发点和发展动力—使命是可以通过搜索技术来实现的,实现这一使命不能仅仅依靠搜索技术。

总体上说,百度的价值观和使命没有Google清晰。百度有自己的一套文本,但听起来更像是后来总结出来的。从早期的坚守“不断开发、创新”这一使命,到如今的“让人们更便捷地获取信息,找到所求”,可以发现这当中反映出技术主义者对技术发展终极目标的迷失,百度眼中搜索就是一切,而在用户眼中,搜索仅仅是一种应用,一种改善生活的工具!

百度早期的发展颇有点像中国版的Google,但上市之后,百度成为人们眼中的“大公司”,或者本身以大公司自居。人们对百度“缺乏创新”的批评越来越多,进军视频也好,发力电子商务也罢,都给人一种“百度已经失去创新精神,看到行业内什么比较热就去插一脚,生怕缺位”的感觉。从表面上看,是百度的战略定位和打造生态系统的能力偏弱,真正的原因是——百度在该制定战略时难以超越现实商业考虑,没有一个坚定的使命感为其战略选择背书。

缺乏清晰、坚定的使命感和价值观,还会导致商业伦理的缺位和企业内聚力的不足。饱受诟病的竞价排名,走马灯式的高层团队变动,都是这一缺陷的外部体现。Google也陆续有高层离开,但是核心团队——谢尔盖·布林、拉里·佩奇和埃里克·施密特这“三驾马车”始终保持稳定,这也为战略前瞻性提供了稳定的结构支撑。反观百度,李彦宏所著的《相信中国》一书封面上五位创业元老,如今只剩李一人仍在百度。

与阿里巴巴这样的本土创业公司相比,百度文化的乖张之处则更为明显。诚然,百度的技术起点要高很多,它有天生的工程师文化,强调宽松、开放、自由,至少在表面上也营造出了类似氛围。阿里巴巴有点不太像互联网公司,技术型公司的感觉要差一些,但吊诡的是,阿里巴巴更愿意容纳很多不同的风格,更善于学习,能宽容某些与自身文化冲突极为激烈的新东西,在某种程度上是“让天下没有难做的生意”的愿景成就了它的强大内在文化黏性。再看似乎洋溢自由气息的百度,强硬的“工程师文化”,很难让空降的高管树立起权威,更容易扼杀超越技术局限的新鲜创意。李彦宏本人内向、固执,而他几乎是百度“唯一的大脑”,如果只有这一个大脑在真正思考全局性的问题—对于身处技术与市场以秒速变化的行业的大公司来说,即便领军者是不世出的天才,也必然走向衰弱。

必须强调的是,百度今天依然是中国互联网界,乃至中国企业界最具创新性的技术型公司之一;相比大多数企业而言,它决策迅速、针对性强,是少有的高科技、精英型的企业。对于中国创业者来说,“心有多大,舞台就有多大”绝不是一句空话,低头耕地、聚焦市场决定了企业能不能活下来,而抬头看天、拥有超越商业的使命和价值观,决定了企业能不能做大、做强、做久。 当本土市场逐渐饱和,百度不得不把目光投向国际市场的时候,价值观与企业基因的影响将越来越重要,可以说直接决定了百度的下一个十年。