Yahoo浮沉录

Yahoo这一路曾经出过不少好技术web

然而,任何人若是只是把 Yahoo 看成一家缺少聚焦的企业来看也许忽视了公司内部的那些创新—偶尔甚至还有一些很好的产品创意。就拿搜索来讲吧,咱们说的不是付费搜索,而是指表明实际搜索结果的蓝色连接。Stata 在担任 CTO 以前曾作了不少年的搜索,他说 Google 曾告诉他,Google 对 Yahoo 相对小的团队(且人员大都不须要斯坦福的学位)可以跟住 Google,甚至在某些领域挑战极限是如何的吃惊。算法

大部分工做都是在他 2004 年到 Yahoo 以前完成的,是收购 Inktomi 的成果,但最令他感到自豪的时刻之一发生在他到 Yahoo 以后:Google 中止显示其索引的 URL 数量的那一刻,由于他宣称 Google 意识到在这方面本身没法拉开 Yahoo。跟微软的交易里面有一件事是你们都没注意到的,即 Yahoo 几乎也跟 Google 也达成了相似的交易,直到政府出面阻止。Stata 认为,要说 Google 交易有可能的话,其惟一的理由是 Yahoo 对搜索的态度是如此的无情。(他还指出,若是你看看如今 Yahoo 的搜索引擎就会发现,它仍然负责页面设计以及在侧栏展现的全部附加信息)数据库

早在 2005 年的时候 Yahoo 就试图要成为社会化搜索的领导者,所以才收购了 Flickr 和 Delicio.us,并发布了像 Yahoo Answers 那样的新服务。该公司甚至还考虑过按照用户的社交网络来进行搜索结果排名,Stata 说,但最终仍是没法摆脱内容,由于它历来都未能产生足够庞大的社交图谱来启动这项排名。(尽管要是 Yahoo 360 不是独立于搜索团队而建,而且能利用流行的 Yahoo Messenger 服务的话将会是另外一个故事)网络

“若是没有维基百科的话,咱们可能会过得更好,尤为是 Answers,”他补充说。并发

Yahoo 为用户对首页内容进行个性化的努力至关使人印象深入—至少从理论上来讲如此—哪怕是在他们低估了本身的媒体公司心态的状况下。那时候 Yahoo 已经收集了大量有关用户的数据,以及 Yahoo 上面哪些类型的文章受欢迎的数据。该公司的搜索专家推断 Yahoo 能够经过开发机器学习算法来预测哪些文章会受到哪一类读者的欢迎,而后定向针对这些来对首页内容进行自动定制。机器学习

然而,Stata 解释说,该公司最终不得不选定一种办法来让人类编辑及定向算法进行协做,一块儿来选出 Yahoo 首页的最佳页面,而后将其呈现给合适的读者。有时候,他们会对文章进行简单的 A/B 测试,而后让被测试受众点击的内容分发到更广的范围。工具

“咱们对圣诞节试了 6 种办法,而后想建立内容分类器,但仍是失败了,”Stata 说:“……流行的就是流行的(没有类别之分)。”oop

David Ku 认为内容优化的随意性结果是 Yahoo 在搜索方面的相对失败。内容个性化已经有一些已知的技术,但就像广告同样,这些技术有助于了解谁在特定时间在找什么,或者是带着目的的个性化,如 Facebook 关注于你的朋友那里流行些什么游戏学习

“若是是针对个人话,”Ku 说:“那么个性化最好要好点。”测试

无论怎样,一切以Hadoop为轴心

Yahoo 最成功,也是最出名的的一项技术努力也许要数 Hadoop,正是 Yahoo 帮助培育了这个开源大数据平台并让它在 2011 年时成长为成熟的企业平台。

Yahoo 投入了成百上千万美圆(也可能高达数十亿)到 Hadoop 的开发当中,然后者也赢得了从定向内容到搜索的 Yahoo“每一个点击背后”的使能者之荣誉,能够说基本上是这样的,至少从这些点击涉及到分析、定向内容或搜索结果这些方面来讲是正确的。Yahoo 是在 2006 年引进 Hadoop 的,为的是帮助对页面进行索引,以便能与 Google 在搜索上进行竞争(Hadoop 终于在几年以后为搜索提供支撑),但后来它证实本身在 Panama(Yahoo 为广告商、内容优化、定向广告及许多其余用户提供的分析工具)的后期迭代升级方面也能提供足够的支持。

Hadoop 刺激了 Yahoo 基础设施的若干变化,引导打造富含数据和设计的在线体验的新方式,Ku 说。在整个公司范围内,有一个提供内容与分析数据之间的连续循环,从而能为用户、广告商及 Yahoo 带来更好的结果。

尽管如此,这并不保证获得普遍采用,由于 Yahoo 的部门之间每每是独立运做的,对于相同的技术会有不一样的想法,Stata 说。实际上,他认可,搜索团队对此跟其余任何人同样难逃其咎—在集中精力与 Google 做战时搜索团队采起了一种“地堡心态”。Hadoop 是第一个出自搜索并流向各个方向且被认为有用的东西。

“它的确从技术上帮助将公司凝聚到了一块儿,”Stata 说。

Usama Fayyad 是在 Hadoop 还没有彻底在 Yahoo 内部起势的 2008 年离职的。他认可从某些方面来讲 Hadoop 是个救世主,彻底适合于某些工做,但他也指出 Hadoop“肩负的担子太重”。“Hadoop 几乎就像是一种宗教信仰,”他说。

在他离开以前,Yahoo 在关系数据库、NoSQL 数据库,甚至一种名为 Everest 的列式数据库(为与定向广告相关的大数据查询而设计)上投入重金。Yahoo 决定把不少的负载全压到 Hadoop 身上,这部分是因为对该技术着迷,部分是由于要通力协做专一于更少的事情上,而他则把 Yahoo 的这种作法视为是用推土机去推一颗石子。

的确,Bassel Ojjeh 的新公司 nPario 就由于聚焦 Hadoop 的决定而受益,此举也让达到产品质量的时间比预期更长了一点。 nPario 利用了 Everest 技术做为其分析引擎的一部分(如今是在 Hadoop 上面跑 Everest),有一段时间把 Yahoo 看成本身的一个客户。

当你讨论的是这样一个大规模的系统时,Fayyad 解释说,它最终会变成一个与技术问题程度至关的业务问题:“维护(Hadoop 集群)的成本跟计算创造出来的价值相比是否值得?”对于 Yahoo 和许多其余公司遵循相同路径的特定负载来讲,答案颇有多是否认的。

他暗示 Yahoo 由于 Hadoop 而失去了几位最好的数据科学家,这些人看到在其余地方针对更为合适的技术进行特定计算的机会。(也就是说,Yahoo 的投入可能为他人利用 Hadoop 技术作了嫁妆)

最后,想让用户浏览仍须要一个理由

不管是致力于 Hadoop 也好,投入重金到 Panama 上也罢,或者是 Yahoo 那些数不清的收购(包括新任 CEO Marissa Mayer 作出的那些),在公司不能早点认识到本身的处境并致力于门户之外的任何一件事情的状况下,讨论这些决定是否明智基本上是没有意义的。不论是作搜索的 Google,仍是后面作社交的 Facebook 等,其余公司对于消费者会如何使用本身来访问 web 都有着一个更加清楚的愿景,而后成为了你们优先选择的接入点。

你须要“某个理由说明为何你要让那个服务成为你生活的一部分,” David Ku 说。缺少聚焦的 Yahoo 没有用信息或朋友来勾住你,而是提供(平庸的)服务及内容的融合,最终无法为吸引用户使用提供充分的理由。

“Yahoo 没有把下一代用户做为本身的定位,” Ojjeh 说:“真的,Yahoo 是给我这种年纪的人用的。”

Ku 认为新任的 CEO Mayer 迄今为止对于 Yahoo 是有好处的,至少她为一家一度停滞的公司注入了活力和动力,而且真心想要改善用户体验。然而,她仍须要为公司寻找核心业务(嘿,也许就是媒体也说不定呢!),并找到把它集成进用户生活中的方法。他指出,微软和 Google 早已根植到设备的世界里并利用这些设备做为消费者接入点了。

不过,即使这些年 Yahoo 误入歧途且排名已经大幅下挫,但 Mayer 并不是无米下锅。该公司仍然有一些很是棒的技术、技术人员以及对数据的学院知识。还有着亿万用户和经过它的各类服务而来的访客。

“我仍在创业……一切都是白手起家,” Fayyad 说:“想象一下,要是你给我一个客户群而后说,‘OK,Usama,你能够拿这 700 万用户起步。你打算怎么作?’我会怎么作?我会告诉你,绝对会让你大吃一惊。”

[本文编译自:gigaom.com]

相关文章
相关标签/搜索