百度余凯:数据是极好的竞争壁垒,

百度余凯:数据是极好的竞争壁垒

 

转载自「大数据文摘」可快捷关注算法

昨日,极客公园创新大会在北京开幕,百度深度学习研究院(IDL)副院长余凯发表演讲,阐述大数据时代,人工智能与深度学习的发展。安全

 

如下是余凯的演讲实录:网络

各位朋友早上好!在个人演讲以前,先给你们看一段有趣的视频。你们看这辆车开进咱们会场,正从个人左侧往右侧开过来,上面没有人,它自平衡行走,看起来有点诡异。为何咱们会作这样有趣的自行车?它是真正的自行车,之前的自行车不是本身行走的。为何作这个事情,这个就涉及到我今天演讲的话题,就是百度大脑所思考的人机关系。学习

 

你们可能会好奇,什么是人工智能?这是一个很严肃的学术话题,今天这个会场我想咱们抱着对科技的热情,不须要那么严肃,你们跟我同样是科技的粉丝,看过这样的电影,这个小机器人,它具备至关高的智能。首先这个小机器人具备感知的能力,他有眼睛,能够感知这个环境:哪一个地方是路,哪一个地方是障碍。测试

 

感知的基础上它就会思考和理解,理解什么呢?好比说这个地方是平地它能够走,这个地方是下去的坡,它不能走,这就是理解。在理解的基础上,它说会去控制,去决策。因此说你看,从感知、理解到决策,在一个小的机器人身上体现得淋漓尽致,这就是很是直观地感受人工智能涉及的几个方面。大数据

 

智能的本质是学习搜索引擎

在今天的市场上面,充斥着智能设备,有智能手机、智能手表、智能水杯,前一段谷歌说作智能汤匙,咱们在作智能筷子。它们为何叫智能产品?他们是否是真的有智能?咱们来思考一下。咱们把全部的产品放在一边,另一边是六七十年代的老式收音机。他们有什么不一样,都是在人操控的状况下去完成一些任务,从这个角度讲,他们看似并无太多的不一样。人工智能

 

思考这个问题,实际上能够帮助咱们区分如今的这些智能产品,哪些多是不必定智能的。举个例子,若是在座的跟我是同一个年纪的话,在小学的时候学过一篇课文,讲板凳的故事,爱因斯坦作了一个小板凳,作的很粗陋,根据这个情况咱们能不能说他不聪明。跟同年代的小朋友和作的小板凳比,你能够得出结论这我的不是那么聪明。爱因斯坦作这个板凳以前,每一天都在作好多板凳,每一次都在提高,根据他过去作的经验和教训去改进他的下一次。若是动态地看,你会发现他是一个不断学习成长的曲线。spa

 

这里面智能的本质在于什么呢?在于你是否是随着经验不断地演化,不断地进步,正如咱们的主题叫觉醒叫进化,进化其实是智能的本质。这里面的经验是什么呢?经验就是数据。你随着过去的经验数据可以不断地学习,不断地提高,今天可能不聪明,可是明天你会变得更聪明,这是智能的本质。因此学习是智能的本质。翻译

 

经验数据与深度学习

这里面提到一个很是重要的方面,就是经验。在计算机科学和人工智能领域,咱们叫它经验数据。经验就是数据,数据就是经验。这就涉及到咱们今天常常提到的所谓大数据,是由于咱们如今迎来一个伟大的时代,这个时代就是大数据的时代。咱们来看看,移动互联网给咱们带来怎么样的深入变化。

 

好比说这是2005年圣彼得教堂门口的广场上,不少的信众在等待教皇的选举结果。八年之后新的一代教皇从新选举,一样是那批信众,咱们看到移动互联网怎么改变世界,每一个人都链接了他的设备,这些设备无时无刻都在产生数据。今天在座的每一个人跟我同样链接平均两到三个设备,个人口袋里面就有两个手机。

 

可是这个数据到2020年,呈现不断爆炸性增加的趋势,甚至有比这个预测更加夸张的。前段时间乌镇大会上孙正义说到,2020年每一个人要链接1000个设备。这个不必定那么夸张,每一个钮扣可能都是一个智能的链接设备。移动互联网时代万物互联,随之而来的就是数据的爆增。大量的数据给咱们带来史无前例的机会,因此说咱们从万物互联到大数据时代,大数据时代随之而来的就是无处不在的智能。

 

最近几年,咱们在人工智能领域常常听到最引人瞩目的领域就是深度学习。跟大数据时代悄然地发生在一块儿,这里面有它深入的时代背景。咱们看一下这个曲线,咱们的横轴是数据规模,传统的人工智能的算法下,数据到了必定程度效果再也不提高。对于深度学习,咱们看是怎样的曲线。随着数据不断增加,效果会不断地提高。因此说深度学习能够帮助咱们去吸取数据所带来的红利。从技术的角度是这样看,若是从商业的角度来看,你会看到若是你的商业模式也是随着数据的增加陈兴国ian这样的曲线,那说明什么?我要恭喜你,你有一个很是好的壁垒,一个竞争壁垒。

 

为何?由于收集数据须要时间,别人要得到一样的能力,他须要花更长的时间,因此你永远跑在前面,搜索引擎就是这样的一个模式。基于大数据的商业模式是有很好的竞争壁垒。

 

百度深度学习的落地点

百度过去两年在深度学习这个领域能够说是作了不少工做。到今天,百度大脑这个项目已经取得了至关大的进展。它是一个无时不刻在学习、演进和进化的系统。两个月前我给你们介绍的时候,我介绍的是百亿级的参数构建世界上最大的深度神经网络,今天我把百亿级改为千亿级,能够构建更大规模的深度神经网络。

 

具体落地的有哪些呢?深度学习开始是受到大脑结构的启发。今天咱们更可能是从统计和计算的角度来看待这个问题,另外也有不少的学者从仿真大脑的生物学角度去作这方面的研究,这两条路应该是齐头并进,互通有无,互相帮助的。

 

至于谈到百度深度学习在内部落地在什么地方,咱们能够看到在搜索、广告投放、图像识别和语音识别这些领域,都有至关大的进展。好比说咱们看搜索,没有用到深度学习时,绿色的是咱们在搜索满意度上面领先竞争对手的比例,用了深度学习之后,过去一年咱们提高的比例是这样子的。从另一个角度讲,它也是目前深度学习技术用在天然语言方面最成功的一个例子。

 

固然,在广告投放这个领域,整个百度凤巢广告系统已经进入深度学习的时代,广告的点击率提高很是显著,具体的数字是商业秘密,我不能讲,是百分比两位数的提高,这个对公司的营收是有一个巨大贡献。

 

在语音这一块,能够说咱们过去两年里面语音识别率不断提高,移动搜索中文语音识别咱们是世界领先的。在图像这个领域,去年咱们在物体检测模型上单个模型是世界最好,谷歌是第二。

 

你们可能会关心,在过去几年里面,技术的发展在图像分类这个领域是一个怎样的量变到质变的过程,咱们仍是看图像分类的例子。这边我给你们演示的是在最近这几年,世界上最好的成绩是怎么样变化的。2010年世界最好的成绩在那个地方,整个深度学习往前发展,咱们看到每一年它都是以很快的速度向前演进。在2014年年末的时候,这个结果是到5.9%这样的错误率,这是百度作到的,也是世界上目前最高的图像识别准确率,你们可能会很关心,它比起人类的能力是什么水平。人类的水平在这个地方,差很少接近5%的错误率。

 

咱们刚才讲的图像和语音,反映在咱们的产品就是百度翻译APP,你能够用中文语音说,立刻自动翻译成英文。它还能够拍照,外国人来上海,看到这样的菜单,拍照之后图像就能识别翻译成英文,能够理解这个菜是什么菜。

 

用人工智能的技术能够帮助小朋友有更快乐的童年,暑假能够有更多的时间玩。这不是直接帮你作题,它是告诉你知识点在什么地方。

 

关于人脸识别的技术发展,也跟你们汇报一下最新成果。在最通用的人脸识别的测试上面Facebook宣布作到最好的成果是97.35%,百度同事取得了更激动人心的进展,最好的人脸识别准确率是99.62%。斯坦福大学科研人员最近用人作了一个测试,人在这个数据上面达到99.2%。

 

我必须给你们澄清,机器的算法作到接近人的水平,其实只是说数据级上面作到人类的水平,总体来说,如今机器智能的水平离人仍是有差距的,咱们还在努力中。

 

你们小时候有可能作过看图说话,你看到图片要用天然的语言描述这个图片的故事是什么。对于左边的这幅图,若是用一个天然语言描述说是一个黄色的bus,对另一幅图像咱们用天然的语言的句子“下午的阳光照进房间”描述这样一个场景。这些语言实际上不是人来写的,是机器生成的。

 

不少人工智能的算法在不断地积累它的势能,改变人们生活的方方面面,好比说机器人领域,具体的例子就是高度自动化的驾驶,这是百度深度学习研究院的团队同窗们在改装的各类车,这边是咱们的一个车上面的感知器演示,集成了雷达、红外、摄像头,每个感知器覆盖了不一样方面,有各自的优点和劣势,怎么样集成在一块儿对道路的状况有一个理解,自动地去行驶。

 

咱们基于这些传感器对道路有三维的理解,这个理解作的比人更精确。好比说今天的导航系统只知道你在哪条路上,不知道在哪一个车道上,咱们利用更先进的感知系统可使车定位在车道上面,精度是10-20厘米的距离。咱们能够预见后面1-2年时间里面,导航系统会发生翻天覆地的变化,在北京的街头你要上立交桥的时候,有的时候前面有三五个分岔口,怎么走你会蒙掉,立刻科技就会帮助你。

 

这是咱们作的针系统,用深度学习开发图像识别技术,用低成本的摄像头帮你完成任务。彻底没有人的自动驾驶不是咱们追求的目标,这是很难作到,十年以后也许可以作到,中间是逐步实现的过程,它从辅助驾驶开始,经过感知器通知司机发生了什么情况。整个系统是让人去享受交通系统带来的便捷和安全,但并非取代人。咱们强调的是人车一体的驾驶,这就回到了一开始个人演讲题目——对人机关系的思考。

 

伟大的技术之因此伟大,在于让每一个平凡的人更伟大

咱们稍微回顾一下人工智能的发展原点,这个原点很大意义上是因为图灵测试,人工智能是研发可以取代人的机器,这样作是否是好,咱们要有本身的一些思考。咱们在百度过去作的产品里面,能够稍微反思一下,有两个产品。第一个是PK大咖,一个普通的人给本身照张像,找到很像的明星,用户很欢迎,每一个普通人都有作明星的梦想。另一个产品是拍照写诗,图像识别之后不光是识别,它还生成一首诗,更加复杂和先进。但从用户的反映来说,用户对这个拍照写诗的兴趣不是那么大,为何呢?由于这个产品只是去显示机器有多么的伟大,跟每一个普通用户到底有什么关系。

 

咱们看另一个例子,左边是人工智能历史上里程碑式的进展——IBM的深蓝,它下象棋的能力可以达到人类冠军的水平,后面IBM什么事情也没有发生。另一边也是人工智能技术,就是搜索引擎。搜索引擎使得在北京的一个小孩子,跟在遥远山村的小孩子只要有网络,获取知识的能力是同样的,一个在山村的小孩子也能够获取知识,能够有梦想。这个技术实际上对社会产生了巨大影响。

 

咱们回到一开始开场的视频,这个自行车能够跟着你走。你跑步的时候,衣服能够放在上面,水能够放在上面,本身能很轻松地跑。或者你在何时吹一个口哨,它能够跟随你跑进房间。你们想到什么,这是车吗?我想大家在座的答案跟我想的是同样,它像是一个小黑马驹。因此说这个是咱们对人机关系的一个思考。

 

咱们认为伟大的技术之因此伟大,不是说让机器更伟大,它最重要的意义在于让每一个平凡的人更伟大,更有创造力,他的生活更加美好。

 

最后我修改引述毛主席的一句语录:世界是咱们的,它也是机器人的。可是归根到底它是属于可以创造机器人,可以和机器人和谐共处而且利用机器人为我所服务的人的,谢谢你们。

相关文章
相关标签/搜索