阿里研究员吴翰清:世界须要什么样的智能系统?

阿里妹导读:吴翰清,被你们亲切地称为“小黑”“道哥”。他是阿里巴巴研究员,更是一位“白帽黑客”。15岁,考入西安交大少年班,毕业后应聘阿里。23岁,成为阿里最年轻的高级技术专家。32岁,被评选为2017年度全球35位35岁如下的青年科技创新人才(TR35)。网上有许多关于他的猜想,然而,他始终保持低调,专一于本身热爱的事业。2014年以后,他几乎再也不写文章;但在今天,他有话想说,关于本身,关于科技,关于将来,说给你听,说给世界听。程序员

不得不说的话

在过去的18个月里,我拒绝了全部的采访,投入了所有的精力专心在作一件事情。因此我想先借着这篇文章澄清一下18个月以来网上的全部关于个人新闻、抖音视频等,都是好事者编撰的个人段子,用来吸收流量的假新闻。这些假新闻让我很苦恼,由于这些新闻将我描绘成为了我最不想成为的人,里面的我是一个符号,而不是真实的我。我为此专门给今日头条写过信,要求审核并过滤这类不实传播,但只清净了一个月。我想再进一步只有向监管部门反馈,以及继续保留法律追责的权利。数据库

这些未经我许可的新闻和视频,将我描绘成了一个无所不能的人,连带着马老师也受到了牵连。我想有没有我,马老师都睡得很安稳。阿里的安全是上千名工程师共同努力的结果,我一我的的力量在其中的贡献极其微薄。我也从没有黑过阿里的网站,只是之前由于工做性质在受权的状况下对阿里的业务系统作过不少的安全测试。咱们不该该捧吹以破坏为目的的黑客,那是犯罪,是我最不想成为的人。我过去的工做是对抗黑客攻击,打击网络犯罪,所以以破坏系统的黑客来描述曾经的我,是对我最大的羞辱。真正的黑客精神是挑战权威,追求开放、自由,而并不是入侵计算机系统。我想是时候终止这些不正确的传播了。浏览器

至于我过去取得的一点不足为人道的成就,我想99%的读者都没搞明白我为何会在2017年被评为 MIT TR35,你们只是在看个热闹,鼓鼓掌。但我不须要这样的掌声,我不须要你们为我我的鼓掌,我但愿你们是为个人做品鼓掌。这也是为何在2014年之后我几乎再也不写文章的缘由。我但愿你们记住的是个人做品,我对社会的贡献,而非我我的的成长轨迹。从这个角度来看,我对本身还很是不满意,人们关注个人经历多过个人做品,因此我还得加倍努力。安全

就我我的来讲,从2017年下半年开始,我离开了网络安全领域,进入到了今天你们所说的人工智能领域。我带领团队在浙江,在上海,在重庆建设了不少关键的基础设施系统。尤为是2018年在上海作的事情,倾注了个人全部心血,我历来没有如此认真地作过一件事情,结果也很好。只是这些事情并未曾对外宣传,故不为外人所知。这18个月来关于我我的的假新闻满天飞,让我啼笑皆非,由于这些段子手连我最引觉得豪的事情都没搞清楚。服务器

因此我今天决定写一篇文章,做为一名工程师,我想把我对将来的判断写下来,也许能够帮助一些人少走一点弯路。只表明我的的见解,不表明公司的观点。网络

科技的进步是为了解放生产力

我将生产力的进步分为五个阶段:体力劳动,机械化,电气化,信息化,智能化。其中每一次科技的进步,都会带来生产力的解放,对社会的改变是巨大的。工具

在140年前发生的第二次科技革命,让电力深刻到各行各业。自从中央发电站和交流电变压器等关键技术构建的电力基础设施成型后,获取电力的成本逐渐下降,各类各样的电气应用开始涌现,人们获取到了新的、稳定的能源。性能

咱们如今知道电力最先是应用在电话、电报、电灯上的,也正是电气照明这一需求,拉动了电力基础设施的发展。由于在当时电力的用途比较单调,并无今天这么琳琅满目的电器。在100年前爱迪生通用电气与威斯汀豪斯之间的主要竞争就是聚焦在电气照明领域。咱们很难说在这个过程当中,究竟是电灯泡更重要,仍是发电站更重要。我曾经比喻说当前云计算面临的窘境,就是「中央发电站」已经造出来了,咱们有单集群上万台服务器规模的算力基础设施,可是「电灯泡」在哪里却没有找到。咱们用「中央发电站」在点「煤气灯」,今天托管在云计算上的业务,大多数依然是「信息化系统」。而理想中的会消耗大量算力的应用,应当是「智能化系统」。咱们一直在苦苦追寻云计算的「电灯泡应用」,却梦寐以求。学习

这里须要讲清楚「信息化系统」和「智能化系统」的区别。我认为「信息化系统」的本质是编辑数据库,一个业务系统若是存在大量人工交互,依赖于人提交表单来完成业务,那么就是一个信息化系统。而我理想中的「智能化系统」,应该是以自动完成任务为目的,以任务做为输入,以完成的结果做为输出,中间的过程应该是机器高度自动化完成的。以其完成任务的复杂度,来评价其智能程度的高低。测试

从这个角度看,「智能手机」并不智能,依然是个「信息化系统」。市面上形形色色的智能系统也都只是冠上了智能的名号在鱼目混珠。我并非说「信息化系统」没有价值,信息化系统颇有价值,但不是下个时代的东西。自从计算机技术发展以来,产生的各色各样的信息化系统极大地改变了世界,完成了从「电气化」到「信息化」转型升级的重要一步。这就是咱们看到各色各样的计算机系统开始应用在各个领域,帮助人们更加高效的管理工做和提供服务。

互联网在这一过程当中扮演了放大做用。我认为互联网自己并非生产力,互联网只是链接了成千上万个信息化系统,从而具有了规模效应。互联网是规模经济,能让一个系统的价值实现上千倍、上万倍的放大,可是生产力是信息化系统自己提供的。可以接收互联网链接服务的终端,是浏览器,是 iOS 和 Android,这些端的演进自己是重要的。百度经过互联网链接了人和信息,腾讯经过互联网链接人和人,阿里经过互联网链接了人和信息化服务。可是这些都不是下一个时代的东西。

下一个时代会发生的事情,首先是出现智能化系统对信息化系统的升级换代,而后会出现经过互联网链接全部智能化系统的公司。智能化对信息化的升级换代,是一次巨大的生产力进步,处于社会变革中的商业公司的结局是适者生存。从历史来看,在信息化时代的PC操做系统升级换代到移动操做系统,其过程就是天翻地覆的。苹果的iPhone 发布以后,全部的开发者都再也不给微软的 Windows 写软件,而转去给 iOS 写软件,对微软带来了强烈的冲击,若是不是微软后来又抓住了云计算的机遇,就极可能会今后一蹶不振。从商业发展的角度看相似事件必定会发生,在信息化时代的庞然大物极可能随着一次生产力的变革就变得无足轻重。那么如今全部的问题在于,将来世界须要的智能系统究竟是什么?

让机器得到智能,一直是计算机科学家孜孜以求的事情。在过去简单的专家系统,依靠经验和规则,也能处理简单的任务。但有一个弊病是对于专家经验未覆盖的异常状况,机器就不知道怎么处理了。因此后来出现了数据驱动诞生的智能。

咱们看到当机器具有必定的智能后,就能处理相对简单的任务,从而部分地解放人的生产力,此时增长机器规模就等同于增长人力的规模。而机器智能和人的智能又各有所长,机器运算量大且不知疲倦,所以对于不少工做都有可能作到精细化管理。这每每能带来成本的节约。

好比在过去公交车的排班是按照经验,在一个线路里设置好公交车的数量,可是若是市民的出行状况发生波动时,公交车的供需关系之间必定会存在差别,有的线路会繁忙,有的线路则会空闲,从而出现资源的浪费。要解决这一问题须要先统计清楚每辆公交车每一趟的精确载客人数,再依靠机器智能精细化的调度公交车到不一样的线路,就能在同等资源下实现效率最优。所以使用机器智能的好处是显而易见的。

五年前作不出大规模的机器智能系统

咱们看到在生产力发展的过程当中,从信息化到智能化的这一转型升级正在到来,已经到了爆发的前夜。这得益于四项技术的成熟:云计算、大数据、IoT、网络链接技术。

咱们知道机器智能当前的发展是得益于对脑科学的研究,以及算力的进步,让神经网络进化到了深度学习,从而在视觉、语音等领域有了重大突破。算力的重要性毋庸置疑,可是光有算力依然难以在实际的应用中取得成功,还须要其余几项技术的成熟。在当前的技术环境来讲,云计算为智能提供了足够的算力,是算力基础设施;大数据技术提供了数据处理的方法论和工具,是数据基础设施(当前尚未垄断性的数据基础设施,碎片化严重);IoT 技术将智能设备的成本降到了足够低,为部署丰富的神经元感知设备提供了基础;网络链接技术,从4G到5G,为数据的高速传输提供了重要基础。

若是有科技树这种说法的话,那么机器智能的大规模应用,就须要先点亮前四个技术,这是基础。在五年之前,这几项技术的成本是制约咱们将智能技术大规模应用的主要瓶颈。到今天已经逐渐成熟了。

在一项新技术刚出现的时候,咱们每每会遇到两个问题。

第一个问题是人才的稀缺性问题。咱们知道一个懂深度学习或其余机器智能技术的博士生刚毕业的年薪可能比得上一个工做了十年的程序员。业界各处都须要机器智能,供不该求。

第二个问题是技术的成本问题。新技术刚出来的成本必定是昂贵的,就像云计算刚出来的时候也是先解决能力问题,再解决效率问题。我前些时看一个报告,AWS 的 EC2 推出到如今连续降价了57次。咱们熟知的摩尔定律,计算的性能每18个月翻一倍,也就意味着同等算力的硬件每18个月会降一半的成本。机器智能做为新技术也有一样的规律,在一开始咱们不要期望它的成本会足够便宜到能进入千家万户,新技术的普及须要时间。只是咱们每每火烧眉毛。

这两个问题决定了机器智能在一开始的时候,应该首先被应用在对社会效率撬动最大的那个点上。从商业上咱们要找到这样的场景,来让这项技术脱离实验室,走向社会,经过商业来源源不断的滋养这项技术的迅速成长。

世界须要什么样的机器智能系统

这两个问题随着时间的推移很快就能解决。但今天产业界真正碰到的问题我认为是搞偏了方向。这体如今两个方面。

第一个问题是将来不该该存在一个「人工智能」的产业,咱们今天的分类就分错了。就像自电力基础设施诞生以来,各行各业都须要用电,所以电力成为了一个关键生产要素。我认为将来智能也是一个关键生产要素,每一个行业都须要,所以不须要单独划分一我的工智能产业。单独搞了一我的工智能产业,反倒不知道这些公司在干什么了,这些公司本身也产生了困惑。最终应该像今天的零售业同样,每一个作零售的都有个电商部门,会经过互联网来作营销和销售。将来每一个企业也应该有一个部门,就是负责他们的智能系统的建设与训练。要像训练宠物同样训练智能系统,使他具有智能。这不是某一家人工智能公司要作的事情,而是每家公司都要本身作的事情。

第二个问题和机器智能技术的发展有关。由于最近此次机器智能的热点是从深度学习开始,在视觉、语音等领域有了巨大突破,所以产业化后的企业每每都是在作视觉、语音、天然语言处理等工做。可是咱们千万别忘了完整的人脑智能是从「感知」到「行动」,并经过不断的反馈完成高频率的协同,最终诞生了智能。

只作「感知」是一个巨大的误区,从技术上讲没有问题,可是从商业上讲创造的社会价值就颇有限了,由于其解放的生产力相对是有限的。

从生产力发展的角度来说,评判一个智能系统的社会价值,应该以它解放生产力的多少来衡量。只作「感知」就是只能看,可是作了这么多大型项目后,我发现全部的价值创造都是在于「处置」环节。所以只作感知,很难讲清楚投入产出是否值得,可是一旦开始进入到「行动」环节,就会开始解放生产力,价值是可被量化的。这里的行动,是机器智能实现了对人力或其余设备的调度。

实际上从技术发展的角度看,咱们早就拥有了让机器智能作决策的能力。搜索引擎和个性化推荐,就是典型的经过机器智能作决策。经过天天处理海量的数据,最终实现精细化的匹配。

因此我认为一个完整的「智能系统」,是包含了「感知」与「行动」,其中支撑行动的是决策和调度的技术。而衡量这个智能系统是否有价值的标准,是看其解放的生产力的多少。

遗憾的是,到今天为止我认为业界并不存在一个理想的「智能系统」。业界当前的状态我称之为「有智能,没系统」。不少人工智能的创业公司拥有局部的智能能力,好比视觉、语音、NLP、知识图谱、搜索、推荐等中的一项或多项技术,可是不多有公司有完整的技术栈。而像 BAT 等公司具有完整的技术栈,可是却并无将全部的技术整合成为「感知」+「行动」的一个完整系统,而是各项技术以碎片化的形式存在。尤为是将全部技术应用到某一个具体场景中解决某一个具体问题的,更是寥寥无几,而这正是催生出这一智能系统的关键所在。因此这是一个工程化的问题,工程化的挑战在于整合全部智能技术,实现完整的「感知」+「行动」能力,并有效的控制成本,实现对开发者友好的接口。

在智能技术的角度来看,「自动驾驶」和「智能音箱」是两个完整的从「感知」到「行动」闭环的场景。我认为这两个场景能够用来打磨机器智能技术,可是当前在商业上比较难成功。「自动驾驶」解放了全部的驾驶员,对解放生产力的价值很是明显,可是由于受制于今天城市的道路基础设施,所以对老城市的意义不大。今天城市的道路不是为自动驾驶设计的,也很难容纳下自动驾驶的汽车。所以自动驾驶更适合航空、航海、物流等领域,商业范围一下小了不少。「智能音箱」综合了多项机器智能技术,其核心技术「对话机器人」被称为人工智能领域的圣杯,想要作好难度至关之大。可是「智能音箱」当前的阶段对家庭中各类任务的生产力解放极其有限,价值很难讲清楚,最后沦为玩物的可能性比较大。尽管如此,随着时间的推移,随着基础设施的更新换代,这两项技术也会逐渐焕发出他们的生命力。

若是用航空业来比喻的话,今天的智能技术,就比如造飞机,市面上已经有了不少零件和引擎,可是全部的厂商都拿着零件当飞机卖,客户觉得他买了一架飞机,其实只是买了个零件(由于生产力并无获得多大的解放)。而今天真正的难点在于飞机设计图纸都尚未。

因此我打算先画一张,造架飞机玩玩。

构建智能时代

飞机想要真正飞上天,还须要几个东西。

首先是飞行员。飞行员不必定要懂得怎么造飞机,造飞机是个门槛很高的活。可是飞行员要懂得怎么开飞机,最后还要让人人都能坐飞机。我认为飞行员就是将来各个企业里智能部门的员工,他们负责训练买来的智能系统,让智能系统真正具有智能。因为各个企业拥有的数据的不一样,以及「飞行员」技能的高低和责任心,最后的各个企业的智能系统的聪明程度也会出现差别。世界是丰富多彩的。

其次是航道。我认为航道依然是基础设施提供商的,包括运营商、云计算厂商等。

最后是机场。机场须要负责全部航班的调度和协同,为全部的飞机提供服务。这是最有意思的地方。我认为「机场」是最后真正的商业模式,就像苹果的 AppStore同样。

我认为在智能时代的「机场」,最重要的工做是给机器智能系统提供服务,而并不是给人提供服务。

想象一下将来互联网里,70%-80%的人口是机器智能,他们处理了将来世界的绝大多数工做,而每个机器智能又是有一个主人的。其主人能够是我的,也能够是组织,但都是有主权的。每个机器智能存在的目标都是为了完成某个或多个任务。那么为全部的机器智能提供服务,就会是一个巨大的商业模式。

机器智能系统的自动协同是通往将来的关键路径

同时我也认为当前的机器智能产业,过于重视人与机器的交互,而忽视了机器与机器的交互。然后者才是更重要的事情。由于人与机器的交互依然是回到了信息化系统的老路上去,而机器与机器的自动协同,则是在进一步将智能系统的价值实现规模放大。

所以将来有必要给全部的机器智能定义一套语言,他们之间的交流能够像人同样拥有本身的语言,实现简单的逻辑。而全部机器智能之间的交互与协同,是不须要人工干预的,就像你家的孩子与邻居家的孩子本身会去玩耍同样,你不须要干预到他们的交流之中,他们本身会各取所需地完成各自的任务。

以「一网通办」的业务举例。在当前一网通办的主流实现办法是将政府各委办局的数据实现全量汇聚后,进行数据治理,并梳理流程,重塑业务。这种大数据应用的思路依然是停留在信息化建设的老路上,其弊端是想推进新技术落地的前提是流程先改革,同时各个不一样地区的高度定制化致使很难在全国实现规模化的产品。但其实也能够有另一种智能化的建设思路,让每一个委办局本身建一个机器智能系统,其任务就是代替公务员处理各自的窗口业务。当市民来提交一个申请时,通过认证后,该委办局的机器智能系统就根据所需材料,自行向其余委办局的机器智能系统发出协同请求,通过几轮机器智能之间的交流和协同以后,市民很快就获得了他想要的结果。这种多个机器智能系统之间自动协同的机制,对流程的冲击明显会小不少。

机器智能之间的交互与协同须要经过网络链接到一块儿,但安全性是可控的,由于是业务之间的协同,而并不是数据自己发生了交换。由于每个机器智能都有本身的主人,全部的训练过程也都发生在其主体内部,所以数据并不须要被拿出来交换共享。主人能够设定机器智能什么能说,什么不能说,全部的安全控制都发生在智能系统内部,而一旦链接到互联网要与其余机器智能协同或使用「机场」提供的服务,就会转为「默认不信任」模式。

至于机器智能系统到底部署在公共云仍是专有云,这并非一个重要的问题,主人爱部署在哪里就部署在哪里。因此时至今日,云计算依然有被管道化的危险,就像运营商被互联网内容提供商管道化同样,将来云计算厂商也可能会被智能厂商管道化。由于云计算和大数据都不是智能。

A组

也所以,为了以上这些构想,我受命在阿里云成立「A组」。「A组」成立的使命就是为了构建出这一机器智能系统,让智能时代更快的到来。

我认为这是一件须要整个社会共同努力三十到五十年的事情,就像在过去的三十到五十年咱们在信息化建设上付出的全部努力同样。

以上,就是我想对世界说的话。

我说,你听。


原文连接 本文为云栖社区原创内容,未经容许不得转载。

相关文章
相关标签/搜索