浪潮之巅,程序员如何拥抱新技术?

回想从前,AI、云计算、5G……几年前还以为遥远的技术,在快速发展之中,有了落地方案,慢慢成为了新的基础设施。展望将来,自动驾驶、边缘计算、量子计算……这些新技术又将会带来怎样的变革?本文是对腾讯量子实验室专家研究员郝少刚、PreAngel合伙人 & 腾讯云最具价值专家(TVP)李卓桓、青宁信安科技联合创始人 & 腾讯云最具价值专家(TVP)白慧冬(笔名青润)三位老师在「云+社区沙龙online」的分享整理,但愿与你们一同交流。

点击视频,查看完整直播回放html

01 技术开拓者们的成长故事

青润:我接触计算机最先的是 86 年,那个时候仍是小学,就从 basic 开始学起,我本科学的是材料加工工程,毕业后又在中科院待了一年多,随后出来转行当程序员,算得上是中国最先一批职业软件工程师。实际上在 98 ~99 年以前,中国是没有软件工程师的,那个时候都是个体的程序员为主。git

在这个行业干了几年以后, 05 年我离开中国电信又回到中科院,开始作人脸识别和行为分析,从事如今你们常常提到的人工智能的一些基础科研工做。后来开始出来创业,第一次创业失败以后,去中国教育电视台待了几年,再次出来的时候本身发明了一个新的技术点,解决了一个基于能源再分配的节能方案,而后就有了我如今的公司。程序员

咱们如今在作畜牧业、动物保护等与动物相关的技术,其中一个技术方向可能听起来有点玄幻,可是这个方向咱们认为是能够实现的,称之为跨物种语言互通技术。这个技术仍在延续中,目前还只是初始阶段,相信未来会有更多的人加入到这个领域。github

郝少刚:个人名字是郝少刚,我是 06 年在清华物理系毕业,而后到了美国能源部国家实验室作科研工做,后来又转战工业界,首先在半导体光刻机公司 ASML 工做了几年,后来又到谷歌工做了几年,去年加入了腾讯量子实验室,如今在作一些跟量子计算相关的工做。咱们作的工做有偏科研的部分,也有在腾讯云上作一些应用架构方面的落地工做。算法

我是从学术界跨界到工业界的,因此对新技术是很是感兴趣的,甚至是一些如今看似很无厘头的好比生物类、半导体之类的新技术,我都充满着浓厚的兴趣。整个行业从科研的内核到硬件、半导体这一层,接着是外面的软件层面我都有从事过,我也帮金融领域的朋友写过一些自动化交易的算法,总之就是作的和接触到的东西比较“杂”。 数据库

李卓桓:先介绍一下我本身的工做,其实我在过去 10 年里一直是在作早期天使基金的投资工做,因此我如今的身份是一个投资人。咱们过去 10 年在整个移动互联网、人工智能等方向进行投资。我工做的基金叫 PreAngel 是一个很早期的小基金,咱们投过了大概几百个早期的移动互联网初创项目,还有一些其余的技术,好比区块链和我最近关注的人工智能,尤为是 NLP 对话,关于如何用计算机智能来替代掉人的一些重复性工做。 编程

我自己是一个热衷新技术的技术爱好者,如今我在投资以外,在 Github 上面也有一个特别大的开源项目叫 Wechaty,如今已经有接近 1 万个 star 了,被不少开发者用来专门作各类各样的聊天机器人,因此你们若是感兴趣的话,欢迎去看看或者和我交流聊天机器人方面的技术。安全

Git地址:https://github.com/wechaty/wechaty 服务器

其实我也有30年的代码经验,能够称得上是一名资深程序员。我在初中的时候就经过你们熟知的小霸王学习机自学了 basic ,而后在高中的时候自学了 C 和 C++ 等,后来 97 年到清华读书的时候,由于清华的网络很好就有幸参与到了第一轮互联网浪潮中来。当时中国第一个知名的门户是 ChinaRen,后来被搜狐收购了,我在里面作网络工程师。在第二轮互联网浪潮到来的时候,我又最先加入到优酷网,在优酷网负责全部的技术团队的组建,还有开发运维,我当时职位是首席科学家,专门负责全部的技术。微信

以后我本身出来创业,作了国内比较早的相似 Twitter 的网站 叽歪,后来这个项目并无作下去。在 2010年以后我开始基于我以前对技术的理解,还有在投资界的朋友与创业者的关系,集中精力去帮助早期的技术方向创业者,在公司早期创立的过程当中,经过天使投资的方式帮助到他们。

在最先期互联网时期, HTML 和 JacaScript 大行其道的时代,在 Web 1.0 和 2.0 尚未普及开 CSS 的时期,乃至到后来 08 年开始的移动互联网时代,再到如今的人工智能领域,深度算法、 AI 模型上,我都倾注了不少的时间在研究这些新技术,因此我绝对是一个铁杆的技术爱好者。

02 大咖们眼中的新技术

郝少刚::由于我接触的领域比较杂,一开始在搞科研的时候,主要是作一些并行计算的工做,因此那时候主要是用 Fortran 在写一些东西。因此当接触C++ 这些面向对象的概念的时候,我以为是比较新颖的。后来转战到工业界,特别是软件行业每隔几年就会有一个新的语言或者新的一套框架出来,我就想:面对这些层出不穷的技术,咱们该怎么样去追?

个人一个体会就是从最核心的基础科学,到外面的硬件半导体层,再到软件应用层面,和更外层如金融领域中的应用,越往内层的创新对时间跨度的控制就会越长,越外层的那些技术创新对时间的控制可能就会比较短,迭代的速度也会更快一些

这多是一种天然规律,越到内部它是有一些天然界规律支配的趋势,好比说量子力学如今都发展 100 多年了,可是人们如今才刚刚开始作量子计算机没多少年,因此前面的路还很长。半导体从上世纪四五十年代开始,你们作硅基半导体晶体管到如今再往前至少还能看到十到二十年的持续,因此这跨度也很长。

可是到了软件这个层面,可能几年间就会有一个新的框架或者新的语言出来,好比金融领域更是会不停的产生这样那样的投资组合来规避风险,可能很快就会有一个新的策略出现,因此技术迭代的时间尺度在不一样的层面上跨度是不太同样的,这是我对新技术的一点体会。

李卓桓:少刚,我这里有一个问题想问你:做为一名量子领域的专家,在过去很长一段时间里,硬件的摩尔定律都一直有效,硬件的性能增加也很是快,但最近咱们发现 CPU 速度开始渐渐跟不上了,这无疑会对将来产生很大的影响,甚至很多人开始对硬件的性能产生了一些悲观,不知道你怎么看待这一点?

郝少刚:对的,这里确定是会到达一个极限的。我以前待过的半导体公司 ASML 是一个光刻机设备公司,咱们作的是一些并行计算的模拟,如今像台积电还有三星已经能够量产 7 纳米的芯片了,甚至如今 5 纳米的芯片都已经有了。摩尔定律是每 18 个月晶体管的密度要翻一番,因此 5 纳米下一代就是 3 纳米,再往下多是 2 纳米等等。

光刻技术咱们能够假定它就像版画同样,作版画多是先刻一个板,而后套在一个纸上,再刷上相应的颜色,就获得了你的画。最重要的瓶颈在什么地方呢?在于你要刻多种颜色的时候要套色,而后下一次又拿另一层放上来作对齐的时候,发现对不齐了,它的极限就在 2 纳米这个地方,这是它的一个极限。

因此到 2 纳米如下芯片的良率就会下降,那么你的成本天然就提升了。这时候你们就会想出别的办法,我相信总会有新的办法出来的,不到万不得已你们也不会去动底层的东西,由于工业界像英特尔这些大公司,他们有那么多的投入在硅上面,因此硅的工业还会再往前走,只不过对于芯片的架构,可能在设计层面会有新的花样出来

李卓桓:最近中美国家间的龃龉愈来愈深,将来能够预见一段时间的技术封锁,各技术领域的人才往芯片或者芯片相关的方向流动,你以为这对于你们来讲会是一个更好的机会吗?

郝少刚:我以为这里是有机会的,如今在长三角地区其实已经看到这样的趋势了。咱们从事半导体硬件行业的这些同窗,他们的薪水开始提高。另外也有一些大的企业也开始从事生产一些相对没那么复杂的芯片,好比人工智能芯片虽然卖的贵,但实际从技术角度来说,它比 CPU 仍是要容易制做一些。另外包括有一些像光学类的芯片,它的线宽要求没必要太细,可能微米量级就能够。也就是说如今可能不须要特别先进的设备和技术咱们也能够先突破,而后开始进入。并且最近我注意到海外也有不少这一类的人才开始回流。

青润:其实物理学是我特别感兴趣的学科,惋惜最后路走“偏”了,大学去了沈阳的一个学校读材料加工工程,最后却发现,其实材料加工工程也是物理化学的一个很深刻的方向。可是在那边待了一年多以后,发现了一系列的问题,由于中国科研当时的体制让我感受很差发展,就直接自学计算机编程,本身学完了计算机相关的全部专业课程,随后一毕业就改行了。固然毕业以后又在那边干了半年,完成了导师交待的最后一批实验,也算是做为一名材料系学生所作的最后的贡献,后来那个方向就完全放弃了。

出来以后开始写 JAVA 代码,当时也遇到了一些问题:就是你们都在写代码,但上面的管理人员不懂,那个时候程序员的薪资确实比其余行业看上去要高一些,因此就有一些对技术不是特别感兴趣的人“混”了进来。固然很差说人家是混进来的,别人可以把这个事情接下来也说明自身是有必定的本事的,好比表达能力比较强,口才比较好等,更容易与一些上层管理来作沟通,而技术员每每拙于沟通,写代码的时候才感到是最幸福的时候。

到如今我一直都以为,在我当程序员 20多年的历程里面,最幸福的时候就是在 2000 年左右,那时我仍是一名单纯的程序员,个人任务就是千方百计的把功能实现。当时咱们是在IBM的Websphere上写东西,用的数据库是 db2,结果发现国内没有一本中文资料,只好到外网去查,当时国内可以买到一本书就叫《DB 2 从入门到精通》,结果哪有什么精通,就是把手册翻译了一遍就出书了。这也是后来我写书的时候极力要去避免的事,我这人可能在这方面比较笨,第一本书写了3年,后来又写了 6 年以后出版了第二版,说白了就是我 10 年就只写了一本书。

两千年开始接触 UML,刚开始也是各类抵触,可是真正在项目里把它用起来以后才发现这个东西真的很好用。尤为是从模型到代码的转换过程会让咱们的视野从代码层面真正脱离出来进入到架构和模块级别以上

当我发现了模型化以后,它会把你的视野从代码层提升到真正的架构层,例如当你进入到一个生产线上的时候,你很容易会被上面的某一个具体操做所吸引,这个很简单的机器结构就会锁住一我的,你会在那里面永远突破不出来,很难把本身的视野从这个点提高到整个生产线上。UML 就在软件开发领域起到了这个做用。

随后离开了电信,又进了中科院。为何进中科院?是由于当时咱们的研究员李老师,他是国际上人脸识别领排名前几位的专家,微软最先的人脸识别就是他带着团队作出来的,这个技术方向吸引了我。

在这个阶段中遇到了一系列的问题,好比当时人脸识别、行为分析和动态识别,如今你们常常提到的人工智能在咱们那个时候其实都已经在操做了,在操做的过程当中遇到了至关多的问题,由于那个时候还有点早期,市场理解度并不够,并且当时我也错过了一些机会,好比在 07 年有一个厦门的老板愿意投 1500 万,我当时直接傻了说:500 万还能够 1500 万我以为我接不住,后来就错过了这笔资金。

后来我出来创业的时候发现个体的力量在一个体系面前几乎是没有机会的,因此那次创业后来也失败了。你们感兴趣也能够搜索找到当时的一些信息,包括周华安作的水木社区上面,个人经历都曾经上过好几回十大排行榜。我以为水木是一个很是奇葩的社区,到如今仍是天天都有好几万人,甚至高峰的时候是 20万人同时在线,这是一个很是奇葩的事情。

李卓桓:当年你们没有其余的沟通渠道,我以为在我们的成长过程当中,像早期的 BBS 技术交流,对咱们产生了巨大的影响。我身边不少大神朋友都是当年的在 BBS 上认识的,由于当时能上网的人还不多,因此能见到的同时又学得很早的几乎都很厉害。

青润:其实这一项提到的新技术点还有一个事情,好比我 05 年再次进入中科院,离开企业应用软件行业,06 年忽然据说Spring 架构如何,我想说我毕竟写了那么多年架构代码,就回去看了一眼,结果发现这不就是 02 年咱们用过的东西吗?只是当年咱们没有把它提炼出来而已,没什么区别。因此若是你去查的话,能够找一本2002年出版的叫《J2EE核心模式》的书,那本书上有一个 helper 模式,和 Spring 几乎是彻底相同的,你们能够有兴趣的能够去查一下,固然这都是翻老古董的东西了,没有书的话不查也无所谓了。

因此咱们再来看,新的技术点究竟是什么?其实就是有些人把常常重复的东西提炼成为一个通用的点,而后把它标新立异提出来了。若是你没有提出来,那么就只能检讨,在枯燥的工做中,本身为何就没有想一想,把它作个简化提炼的工做呢?是抱怨本身的工做枯燥重复无心义,为何就没有想过更简单更能够偷懒的方式呢?程序员原本就是为了偷懒才来当程序员的嘛。

李卓桓:真正经典的东西,其实都是已经存在生活中不少年,可是我以为有一些新技术,它的价值在于会有一批人可以把重复出现的这些东西总结出来,而且把它作成一种模式,可让将来的全部人不用再去从头总结,或者再重复这些过去已经总结出来的东西,进而产生了新的一轮迭代。

郝少刚:如今市面上你们经常使用到的这些人工智能上的算法,可能都是几年前甚至 10 年前的论文,只不过如今用的人更多了,你们发现能够在更多的应用场景里面用到它们,而后才开始扩散开来,因此这些东西你们可能觉得它是新的,其实不少都已是 10 年前的产物了。

李卓桓:这里关于新旧的概念我以为也要分一下,一个东西出现了,我以为在没有被大众知道的状况下,在没有被大量应用到实际的生产生活中以前,就不可能真正去改造世界和创造价值,我认为就不能称之为存在。

真正的存在应该就像少刚刚才说的那样,好比人工智能反向梯度这种学习方法,实际上是上世纪就有的东西,可是它无法匹配相应的硬件能力,只有那么一些算法、论文放在那里。我以为从广义上来说,一个很厉害的新技术只有被人民群众用起来,这个瞬间才应该叫诞生。

郝少刚:其实对这种转变我是颇有体会的,由于那个时候搞科研,你会以为你作的东西都很好,只要写成论文而后放在那里就已经很是好了,有句诗说的是「花自有本心,何求美人折」,意思指的是:我已经长得这么好看了,即便没有人来折我也是能够的。

可是到了工业界之后,你就会发现这些成果最好仍是能尽可能改变到咱们的平常生活,就像另外一首诗「迟迟白日晚,袅袅秋风生。岁华尽摇落,芳意竟何成」。最后你这朵花也开了,开完也败了,可是没有人欣赏,芳意竟何成就是没有意义,没有感受,因此会有两个比较大的对比。

李卓桓:我发现不少技术圈的牛人同时也是文人,刚才少刚的诗已经达到了骚客的级别。

青润:我记得大概是 96 年,当我还在读本科的时候。我师姐作了一个铸造流体模型的计算,它的这个计算须要差很少 5 天以上的时间,常常在电脑上贴了一个「请勿关机正在作计算」的纸条,后来有一天我偶然帮她看了一下代码,我说:“你的这个模型最后处理出结果的那段,能够把它放到最后一块出”,就这么一句话,让总体的计算时间从 5 天多变成了 6 个多小时。

2005 年的时候,咱们在作人脸识别,当时有一个叫活体检测技术。像如今你们看到的活体检测技术其实叫活动检测,看你眨眼、晃晃头、笑一下和张张嘴,这叫活动检测,不叫活体检测。其实活体检测的是你的眼球对应的反光点的不规则波动,咱们在 04 年的时候就已经作到,可是当时若是作这个事情,咱们人脸识别的速度就会从 20 多秒直接变成了 5 分钟,用户确定无法接受了,这个时间你们等不起,因此这个技术后来就被拿下来了。

这表明了什么?说明当时的计算能力真的不够,我记得当时我在自动化所还拼凑了 1 台搭配 4 个 32G 内存挂载 10 块硬盘的一台机器,而后发现一台变压器彻底带不动,最后弄了两个变压器来带这台机器。在我离开以后这台机器也就被分拆成两台机器,由于确实太耗电了。当时的处理能力相比如今真的差太多了,能够这样说,如今随便一台普通智能手机都比咱们当年奔四的计算机处理能力要强,如今手机上几乎都可以作人脸识别了。

李卓桓:我以为咱们都是在各类暴露年龄啊,当年硬盘真是存 100 块好像都赶不上如今手机的存储容量大。

其实不一样的年代都会有不少技术特别吸引人,尤为是对我本身而言,我其实从很小的时候一直都会被各类技术所吸引,如今回想起来彷佛每年吸引个人技术后来都有了很大发展,但当时我只是以为很好玩。

好比在初中的时候以为游戏机很好玩,而后就会思索这个东西是怎么作出来,就去自学了 basic。在90年代的时候,basic 应该也属于很前卫的技术,虽然 basic 不是最好的语言。

在初中的时候就已经能用 basic 实现一些小数据的控制,而后发现还有不少的数据须要处理,因此我在高中的时候就自学了 FoxSpace,也属于那种很早期的数据库,我以为不少的新技术它是取决于人身边的各类需求,这种需求解决的时候就会出现不少之前没有的技术,如今为了解决这个需求所诞生的这种新技术在将来就会对不少事情作出改变。

我在上大学的时候首选北京,主要由于当时想要上网。我高中的时候咱们那个地区没有网,因此只能抱着电脑报看,电脑报是很早的一个电脑报纸,上面就有不少大城市的人说:“我又加了个 BBS ,个人电话线在晚上欢迎打给我,个人电话号码是多少等等”,由于那个时候想上网须要先打电话给那台服务器,而且那台服务器同时只能服务一我的,那个时代就会有这样的站长。

后来到了北京以后,以为互联网可以让你实时获得那么多的东西,可以让你没有任何限制获得那么多的信息,就感受很兴奋。当时我就作了一个动漫站,由于我很喜欢动漫,喜欢处处下动漫,当时也没有视频全都是小图片,但有不少小图片就已经很使人兴奋了,由于本身有这种收集数据的诉求,当时我就作了全清华最大的一个 FTP— “紫霞 FTP”。

紫霞站就是个人站,因此 zixia.net 这个域名就是当时我租下来自用的。我最开始试图想作一个网站,第一步是用 ASP,在 98~99年那时候,它还属于很先进的技术。由于那个时候没有开发成型的语言,就用 ASP 作论坛,当时用起来也确实很不错。可是再往前走,就会发现有一些限制,而后再去请教一些人,他们告诉我还有更好的东西,因此在那个时候我又接触了 leedays,为了实现全部的站,我就开始学习各类各样配置网络服务器的技术。

为了知足本身的玩兴而学了不少东西,因此我以为若是你真的想玩一些很前卫的技术,你就会发现有一些技术须要去学习,那么你就去学它就对了,由于你要相信本身喜欢的东西在将来必定不会错。

后来到了第一轮互联网浪潮的时候,我供职于国内一个叫  ChinaRen 的网站,后来被搜狐收购,当时我在的部门基本上只有 3 我的,但全部的服务器都要由咱们来作内核编译,包括各类邮件服务器的架设备份等,全部的都要作,也须要不断的学。

借着作这个的经历,我写了个人第一本书《leedays 网络编程》,仍是在清华读书期间写成的,后来随着须要作的东西不断增多,我又自学了 perl,甚至有一段时间任何东西我都想用 perl 来写,由于 perl 当时还很好。而后为了作毕设又不得不自学了JAVA ,在不少公司还要作 DBA,后来为了作服务器,要学当年超级难用的 RPC。虽然不少东西后来也再也不用了,意外却发现当年学的这些技术有不少竟成为了互联网中很是重要的一些能力。

给个人感觉就是:本身喜欢一个什么样的应用场景,当你想要在这个场景里面成为主人的时候,你就须要有不少 Powerful 的能力。这些技能点其实我以为就选本身喜欢的去点亮,会有很大的几率点亮到一个将来可以改变世界的,尤为是当年互联网兴起的时代,咱们看见这些技术对于以后的十年乃至更久都有很大的颠覆机会。

好比2008 年移动互联网诞生的时候,由于你们当时都在用电脑,你会发现不少人但愿有一个随身的移动设备,若是可以移动上网,拍脑壳想都知道这是特别炫酷的一件事。为此我甚至去学了 iOS 编程和安卓编程,还写了不少小的 demo,试图更深入的理解它们。虽然本身没有在移动互联网作公司,可是咱们 PreAngel 当时投了不少移动互联网公司,到最近这 5 年,个人兴趣又被一个新的技术完彻底全所吸引,它就是AI。为何会喜欢它呢?仍是由于我是一个特别笨特别懒的人,因此我就特别但愿找到一个方法可以让我借力。不过由于我在清华读的不是计算机系,算法基础相对较差,若是让我去作人脸识别,我以为和青润比起来,简直彻底不知道发生了什么事情。

如今的人工智能有一个什么样的机会呢?机会就在于如今算力有了很大提高以及让咱们摆脱了过去全部算法的桎梏。咱们发现咱们不须要去了解那些细节,之前的机器须要你告诉它具体怎么作,它才可以把这个事作好。如今的机器你会发现可以有一个新的能力,这种能力叫作「授之以鱼不如授之以渔」,就是你要教会机器本身去作,而不是说手把手的教它如何去作。如今的电脑我以为已经到了一个新的阶段,电脑可以本身去总结出来一些规律,而不须要你总结了以后让它背下来再去作。

我还发现这样的一个新技术在将来必定可以真正改变人类生产力,我和朋友分享说人工智能可能比互联网还要伟大,超过两个量级都不止。这是我对新技术的感觉,找到一个本身喜欢的新技术,我相信你们只要能作进去,最后收获都不会小。

郝少刚:很是赞成卓桓的说法,由于在量子计算领域咱们传统的办法都是一种演绎的办法,就是从最基本的原理出发,而后用公式推理出来。可是到了必定程度你再进行模拟的话,它的时间复杂度是很是高的,代价很大,可能这个时候就没办法进行扩展。有 AI 咱们就能够从另一方面,用概括和统计的办法从数据侧来看,因此咱们如今也在作一个新的尝试,但愿用 AI 的办法帮助咱们加速量子计算,也就是量子模拟。

另一点我以为卓桓说的也特别好,就像咱们的生活,每一天你要获得一些正反馈,而后你才可以比较开心的进入下一天。你喜欢那个东西,而后你获得了正反馈,才能更好持续下去,有收获。若是咱们获得的是负反馈,好比以为学的这些新东西是生活所迫必需要学,这就不是很开心了,效果也不会很好。

青润:兴趣很重要,就像我到如今还记得86年学计算机的时候,我是怎么成为老师最好的学生的,是由于有一天我把他气哭了,以后就特别内疚,才想要好好学习这门课,并且发现这门学科确实颇有意思。

想一想在 86 年那个时候,你可以在一个电脑屏幕上显示出本身定制的一些花纹纹路,还能够操做一些事物,相似于街头游戏机里面的一些东西,还能够本身把它拼装起来,那是一个多么新颖的事情啊。

后来街头的游戏机我就不去玩了,我发现我本身好像本身也能干,因而就开始本身编。固然编的就很通常了,由于那时候用的只有一个配色,硬件用的就是 310 机和苹果I型II型机,当时苹果I型II型咱们还不能常常用,由于价值很贵,咱们用的最多就是 310,这个 310 是日本模仿苹果的一款机型,不少朋友大概也就在书本上见过。

我最近在知乎上遇到了一我的,他说本身是由于兴趣才来作计算机的,而后越作越枯燥,就以为很无聊。我就回了一句话,我说怎么可能越作越无聊,真正有兴趣的人绝对不会由于你作的事情的重复性而感到无聊,只会以为可能还有地方没作好,因此这一点特别重要

03 处理与新技术的关系

李卓桓:我们都作了那么多年,在感叹过去这些“新”技术的时候,将来我相信还会有更多的新兴技术会出现。你们以为将来还会有哪些重大的技术将会出现,另外从技术人职业发展角度来看,咱们每个人应该怎样作好选择以应对将来技术发展?

郝少刚:我先谈一谈,若是是个人话,第一我以为仍是兴趣驱动,首先是你愿意去接触它,它是来发动你,激起你心里好奇的一个点。当你对平常正在作的事情已经很熟悉了,可能处在一个温馨区中,天天的事情在能够颇有效率得作完的状况下,你会有一些其余的时间,看一点这些东西,这个时候兴趣在其中会起到很是大的做用。

若是把兴趣抛开,就是你对将来趋势的一个判断,你可能对这个技术没什么兴趣,可是如今好像不少人都很关注这块,它之后可能会变成一个大事件,这时候你也能够对它有所关注。你但愿之后也能投身于这个领域,作出一些东西来,对整个社区和你们的生活产生一些贡献。这是目前我以为两大比较基本的因素,可能会驱使一我的去找他比较喜欢的技术点。

另外我以为若是咱们时间更多一些,或者你的好奇心更重一些,那就能够对一些“不沾边”的东西看得更广一些,好比说如今咱们得到知识的渠道太多了,并且很是的便宜。像上网得到知识的成本很低,资源很是多,因此我以为能够花不多的时间对不少东西均可以掌握个大概。好比二八原则,咱们花 20% 的精力,就能够对一个东西有 80% 的掌握,这样就能够把咱们的知识面和视野铺的更大一些。在新的领域里面,你可能又会发现一些使你感到有兴趣或者是你感到兴奋的一些点。

李卓桓:我以为少刚说的很对,如今和 10 年前不同了,和过去比起来,咱们获取信息的渠道愈来愈丰富,并且从另一个角度来看,互联网上可以制做出特别优秀内容的内容生产者,随着整个互联网的基数变大,也会愈来愈多。因此若是咱们可以用英文来搜索的话,咱们基本上可以很快的获得全球上最好最早进的新技术,以及那些顶级的讲师或者写手他们总结出来的特别高质量的文章和知识的教程。

因此从这个角度来说,其实咱们如今获取新知识的能力变得比之前强了不少。其次我想引伸出来另一个观点,从某种角度来讲,随着技术迭代的变快,咱们不可避免的会面临着咱们学过的知识会“过时”。

其实我一直不太相信知识会过时,由于当你可以学到一个新的知识的时候,最重要的是你要能学到这个知识背后的通用模式与思考问题的方法。其实若是咱们你们写程序用的语言多了以后,你会发现其实语言之间就是语法不一样,思惟模式和解决问题的思路都是相通的,咱们是能够经过不断学习这种新知识而沉淀出来,变成本身内化的一个通用的思惟模式。因此对于学习新技术,我以为彻底能够只是看它是否有足够有新的点可以去解决新的问题,并且我以为学了都不亏。

郝少刚:通用的东西在你身上沉淀下来之后,你学新的东西就会更快。你我的其实也是在不停的迭代,并且每次都迭代得更快,你就变成了一个更有效率的学习者,因此至关于咱们在训练本身大脑里面那些神经元,你训练的越多,它就越愿意去学习,越主动,越有好奇心,我以为正反馈是很是好的。

青润:就像刚才说到的人脸识别,其实我如今也写不动人脸识别代码了,虽然人脸识别代码不是我写的,可是对于人脸识别的理解,我反而有必定的心得,这也是我如今可以去作跨物种的语言互通技术的缘由。

我把这套思惟的方式转换到了一个应用场景内,好比说大家家有宠物狗,当它听到过一个声音,或者发出某一个声音的时候,会习惯性的抬一下左手,这时候我就会记录下来。当你须要它抬左手的时候,能让你发出的声音在狗那边听到的就是让它抬左手的指令,这样作到跨物种的语言互通,而不是依靠传统的巴普洛夫效应让狗听从指令。

这是我在第二次进中科院以后掌握到的最重要的东西,反而不是写的那些代码。还有人说你看看你如今多失败,你那么早进入人脸识别领域,如今的人脸识别公司却没有一个和你有关的。我说确实是没有一个和我有关的,可是如今几乎主流的人脸识别公司里面都有咱们那个组或者咱们那组相关联的痕迹在里面。其实不表明说你本身必定要在里面得到一些直接的东西,这些工做可能会在另外一个层面上产生相应的做用。

李卓桓:我还有另一个建议,咱们你们在学习新技术的时候,最好不要为了学而学,最好能找到一个让技术实际去落地的场景,哪怕是很是初级的一个场景,可是只要你可以把它实际用起来,你的学习收获、感受就会彻底不同。由于它再也不是一个死的知识,而是一个活的东西,是真正能解决问题的知识。

04 Q&A

Q:咱们处在机器配置这么好的年代,为何感受产出却不如之前呢?

李卓桓:其实这个问题是颇有表明性的,我以为若是咱们要作的话,首先就要把心态放长远。分为两块,第一,过去这 10 年,有不少的基础数据,具备表明性的像准确度,像坐火箭同样往上涨,但咱们不能期待之后永远是这样的。为何?由于过去 10 年的人工智能发展,不管是图像仍是 NLP ,它们最大的特色就是已经把过去全部基础研究的能力释放干净了。

像80~90年代的反向梯度传播和好久以前就有的卷积神经网络,最先是由于咱们没有算力,因此它们没有办法被释放出能力。但其实在过去的这5年多甚至10年中,不少基础研究的能力,典型的如图像的准度已经从92%、95%、97%,到如今人脸识别的准度都能达到百分之九十九点几了。因此接下来作这个领域的时候,并非说咱们的机器配置好了,就没有再提高的机会了,而是由于咱们已经提高不少了。

接下来咱们要作的事情我以为会有两个很大的机会,第一就是作新的基础研究,不是把 95%变成 95.5%,只专一于提高一两个百分点。而是要发掘新的问题,找到问题的新的解决办法。好比在天然语言处理里,不少语义的问题到如今其实尚未被真正解决,甚至都没有被定义出来,我以为要在学术领域努力解决这些问题,才会真的对人类产生很大的积极贡献。

第二点可能更切实际一点,咱们的开发者其实有一个很大的机会,如今有不少的人工智能算法可能已经达到了 99% 的准度,但其实它在真正的人文生活应用中,在真正的产品化落地上还很是的局限,有不少的场景,并无把技术真正用起来。好比说图像识别里面的物体检测就有不少的场景,它须要大量的这种能力,可是到如今为止并无一个产品真正能解决它们的问题,而像这样的落地机会也还有不少。

青润:我补充两点,第一,人脸识别的准确度尚未到九十九点几,这更可能是一种商业上的宣传。实际上在人脸识别里面咱们作的方式是什么?就是拿你的历史数据,抽取一个特征码,当你再一次过来验证的时候,就会再拍一张照片,用一样的算法来提取特征码,提取完两种特征码中间确定有差别,好比光照、倾角、脸的倾斜度都会有差别,而后这二者我作数值异或。数值异或的速度是很是快的,你们知道计算机里面最快的计算就是异或,计算这个百分比有多少是类似的,多少是不类似的,若是相差比较大的话,可能会再作一些图形的变换,好比说作一个倾角的转换,最后再来比较。

其实这里提到的就是两个概念:一个是识别率,另外一个是误识率。这二者之和是大于100%的。具体的缘由有兴趣的朋友能够详细了解一下人脸识别的相关技术以及定义方式。即便是识别率中等类似的那部分它也是有价值的,由于每一个人不一样时间的两张照片是不可能作到100%类似的,甚至80%以上的类似几率都很低,因而在商业计算中会把那个20%(这里是一个假设的数值)直接去掉而后折算出来的结果每每就能够达到90%多以上了。

实际上如今和咱们10多年前作的那套人脸识别算法和数值异或上的差别,到如今也没有特别大的突破,数值得分大概就在70%左右。但实际上在60%左右的时候就已经能够识别出是这我的了,15年前58%就已是一个比较高的得分了。

假如你用到的人脸识别设备比较多的话,会发现不少时候常常会折腾到不认识,还得从新识别才可能识别出来。这就是为何咱们在不断的调整门限,把这个门限值设定为70%仍是65%仍是60%,颇有可能你会偶然碰出一个很高的数值出来。

这就有人提到说人脸识别的时候,好比我带张人皮会怎么样呢?其实这个是真的能够蒙混过关的,不要认为是蒙混不过去的。若是让我来破解的话,能够说我有不少种方法来攻击现有这些系统,可是这种方式咱们通常不对外讲,由于讲多了没有太大意义,只能说明咱们本身这块东西没作好。

目前在计算能力上仍是不够,这个确实没有办法,真正计算力够的时候是何时呢?如今有可能在硅基芯片上是看不到了,可能量子计算机会带来但愿。

郝少刚:我可能没有青润那么悲观,我以为硅基半导体芯片仍是能够试一下,也欢迎你们到咱们腾讯云上来试一试,咱们腾讯云上有很强大的 GPU 集群,欢迎跟咱们联系。

Q:学AI要从那种语言开始学起?

郝少刚:我以为你们比较经常使用都是先从Python开始,由于像 PyTorch、TensorFlow 都支持得很好,另外 Python 是一个比较容易上手,对新用户比较友好的一种语言,我以为用 Python 开始就很好。

Q:AI药物研发到底前景如何?还有多长的路要走?

郝少刚:AI 药物研发已是一个趋势了,最近我看到国外权威杂志(《天然》杂志仍是《科学》杂志)上发表了一篇文章,他们用 AI 作了一些辅助的药物研发,在很短的时间内就进入了FDA 的审批流程,因此 AI 对药物研发的帮助仍是很是大的。

由于从分子治药角度来说,那些小分子数据库里面的分子量太大了,都是一些有机的东西,能达到上亿的量级。因此在大数据领域里,从数据这边来找规律,看哪些东西可以匹配到蛋白质的某一个特殊靶点位置等等这些,都是颇有效率颇有意义的。

至于说还有多长的路要走,须要看你怎么定义你认为的彼岸是多远?若是你的意思仅仅是 AI 技术用在制药领域的话,那么咱们如今已经在用了,并且可能还会一直会用下去,经历不停的迭代、加速优化的整个过程,模型也会作得愈来愈好。因此我以为不是问还有多长的路要走,而是说咱们可能之后用 AI 变成一个常态,在制药领域你们都会选择这个工具,它变成了一个不可或缺的工具,可能还须要至关长的一段时间。

Q:AI 技术水平愈来愈成熟了,在将来发展后会代替人工吗?

青润:这个问题背后会牵扯涉及到人类的生存安全的问题,而这个问题也是长期引起社会普遍思考和讨论的问题之一。关于 AI 未来会不会真的来害人,甚至国内某知名高校成立了一个学院,要专门研究人工智能法律基础相关的东西,尽可能减小人工智能对人的伤害。

我从写了多年代码的程序员角度来考虑,若是你们有看过一个连续剧——终结者外传,里面有这样一个画面,一个液态金属机器人在一大楼上指着下面和主角说:“你看路面上的各类机械车辆,它会按照红绿灯的指示来进行经过,可是没有一个机器人会闯红灯突破这个过程,因此会犯错的机器人是一个特别特殊的存在”。从目前的技术基础来讲,全部的无论你是什么形态的代码造成以后的人工智能算法或者它的逻辑实现算法都有自身的基础的,它仍是基于一个代码序列层展示出来的。

若是在代码序列展示中出现了这种闯红灯行为,说明了什么?它实际上是代码出现错误或者内存溢出了,可是这种溢出行为可能有连续性吗?其实从目前来看,还作不到溢出行为以后的连续性,他若是不能有连续性,换句话他这时候出错以后会带来什么结果?就是手机锁死了,随后手机就直接重启,重启以后他又恢复到正常状态,也就是说他的错误行为不会出现连续性的行为。

即便是我设定了这是一个杀人机器人,他就是为了杀人而存在的,假设有这样疯狂的技术员出现,这也是有可能的。可是他设定的也只是针对必定目标行为之下的连续性的程序延伸,也不会出现他会把全部的杀人模式都实现出来,也就是说由于异常而灭绝人类的杀人机器人不可能出现,可是针对单一目标的杀戮机器是有可能出现的。

再者你能够想到一点,人工智能能代替哪些人工呢?其实基础的可重复性的劳动都是能够取代的。

我从2004年开始有一个本身的研究方向,不是刚才所说的跨物种语音互通技术方向,而是抽象化脑力劳动的量化模型研究。这些东西最初的来源是在哪里?其实就来源于我 2000 年开始接触的 UML 的建模方法。从那里我发现了,也许可以把程序员的抽象化劳动,逐层量化出来一个可能的实现途径,因而就开始往下推动这一系列动做。相似于脑力劳动的抽象化量化,实际上机器未来可以带来的绝大部分也都是能够具体量化出来的东西,也就是说目前能被量化出来的工做,就是机器最优先会被取代的东西。

固然有人会说,如今连相似毕加索的画都能被机器画出来,但其实那也是一套代码和模型演算出来的结果,并非真的。因此不要认为那就是一个画家,其实仍是一种模仿性的行为。

Q:关于人工智能中天然语言处理在商业领域的应用,老师能给哪些建议?

李卓桓:这个问题正好问到了个人专业领域,我如今主要关注的就是人工智能技术领域里面,尤为 NLP 这个领域的应用,还有像多轮对话,如何在微信上面作这种自动化的客服问答,以及其余相似的这种人工智能应用。

回到在商业领域来应用这个话题里,我以为这个问题最大的价值在于说,咱们要意识到如今的 AI 算法实际上是有不少的局限性,即使对于不少的数据可以分类得很好,即使它在不少的场景里可以不知疲倦的工做,比人的效率还高,可是当它到了对话领域的时候,会面临着很大的挑战,尤为是和 CV图像处理比起来。由于CV图像处理中不少应用场景相对来说都是客观的场景,图中有没有一只猫或一只狗是一个绝对客观的场景,它的算法作起来比较容易。

可是到了天然语言领域的时候就带来了不少的不肯定性,好比一我的跟你说话的时候,可能一样的一句话表明着不一样的意思,甚至是表明着截然相反的意思。在不少时候,咱们在跟别人说话的时候,其实别人的语气以及当时现场的情境都和表达的真正意思有很深的关联,若是你只是把说的语音转成文字的话,可能会错失掉不少的信息。

因此对话领域若是要商业落地的话,我以为第一点就必定要意识到人工智能在这个场景里面有很是大的先天不足。那么是否是说就没有办法去作了?我以为彻底不是,其实如今有大量的机会能够把这种对话能力应用在不一样场景里的。

举一个很简单的例子,好比咱们能够去作一些降维打击的事情,好比如今咱们的天然语言处理已经能够对基本的单轮对话的语音转文字有很高的准确度,你们若是用微信语音转文字就会发现真的很好用。另外若是你去提问一个很清晰的问题,好比你做为乙方去应聘,把电脑当作甲方,你能够很认真的跟它讲明白一件事,其实基本上也能达到清晰沟通的效果,事实上在单轮对话里 AI 已经能够解决绝大多数的问题了。

那么咱们该如何抓住这其中的商业落地的机会呢?须要咱们去找到真正这样的场景,而后分辨清楚哪一些是超出咱们能力的,再把它们剔除掉,剩下的有能力作的这些简单场景里面,哪一些又是属于价值最大的,咱们就把它拿过来,在这些里面再去作最后的筛选。

其实某种角度来说这并非一个技术问题,像如今咱们的腾讯云提供的不少模型里面,咱们有不少 API 可以作不少的事情,但关键仍是在于你可否有那个创意。举一个简单的例子,移动互联网的时候,咱们你们都有手机,咱们都知道怎么写程序,怎么画一个方块,怎么填色,甚至怎么作一个3D的东西,可是这些东西在你的手上,你是否是就能作出一个用户都很喜欢愿意传播的手机应用出来呢?

不少的应用原理都很简单,并不须要很深的、很复杂的算法或者一些复杂的逻辑,可是它就可以打动用户。我以为在接下来的人工智能领域,其实有大量这样的机会,若是你们可以找到这样的机会,保持对人工智能局限的认知,去寻找一个没有被解决好的场景,而且判断清楚这个场景是否真的有价值?若是将来有价值就去试一试,这里面的机会真的很是多。

最后我再稍微作一个小广告,我过去几年专门研究过怎么作聊天机器人的多轮对话,因此在今年3月份的时候,我和另一个朋友专门出版了一本书《ChatBot 从零到一》,专门讲述一些如何来作对话和如何思考聊天机器人的应用场景,因此你们也能够去参考一下那本书,我是第二个做者。

Q:做为售前工程师而不是程序员出身,想请教老师怎样才能更好拥抱技术,掌握和提高软件技术或架构思惟水平?

郝少刚:其实我也不是程序员出身,我是学物理的,青润兄是学材料的,卓桓是学机械的,咱们三个都不是程序员出身的。那么怎样更好地拥抱新技术呢?首先你要喜欢它,对它有好奇心,而后你必定要去实际操做,你跟着作一遍,把里面的坑都踩一遍,等你再回头看的时候,就能更深刻的理解它了,等你下次再碰到这个事情的时候,你就知道该怎么办了。

Q:5G会对AI产生什么影响呢?

青润:由于我毕业以后在电信待过不少年,因此通讯也算是个人专业之一了。尤为是这几年咱们在藏区以牦牛开始作研究,也会注重相应的通讯技术对咱们的影响。其实如今 5G 和 AI 这二者并无太大直接关系,你们不用多想了,可是通讯技术对 AI 必定是有很重大的影响的。

为何这么说?由于通讯在它的传输速率以及通讯方式上,会决定未来 AI 的响应速度以及最终拿到的结果,因此这二者看似没有什么直接关系,但仍是能够交互产生颇有意思的事情。

例如咱们未来考虑在科技馆作一些展现,好比把某一个地方的场景直接 3D 还原出来,还原出一个真实的牦牛生活场景,但这些东西以目前的通讯技术来讲,只能经过 5G 技术来进行传输,由于 4G 的传输量是达不到咱们要求的。

在驱赶牦牛的过程当中,咱们会给用户一个相应的方式,让他能和牦牛之间产生一个互动。固然咱们不会作过于强迫动物行为的一些操做,好比用户跟它说右边的草质很好,指挥着牦牛往那边过去,这样的行为咱们会处理成一个牦牛能听懂的指令给到它,这种形态其实就是咱们正在和运营商一块儿合做推进的事情。

Q:5G的普遍应用会将计算工做所有放在云,舍弃端侧的算力吗?

李卓桓:这个问题很好,也是我相信的一个趋势,只不过我以为要修正一点,永远都没有绝对极端的状况,咱们是不会把全部的算力都放在云上的。可是我相信愈来愈多的算力,咱们能够从云上面直接拿来用,尤为是这样一些场景,咱们的随身设备没有足够强的算力,固然缘由是不少种的,好比出于成本上的考量,多是电池或者功耗不够,或者是一些其余状况等等。

可是咱们都知道如今云端的算力很强大,那咱们是否是可以直接把云端的算力拿到个人移动设备上来用?好比个人手机可能就不须要用不少的电来计算我 3D 图形,只须要把任务丢给云,而后把结果拿回来用就行,在这种全依赖云的状况下,个人手机电池也许能够用两天三天甚至更久,这就是一个很大的提高,因此我相信这绝对会是一个趋势。

再举一个例子,是我我的很是喜欢的一个产品,若是你们感兴趣能够去网上搜一搜,谷歌有一个产品叫作 Stadia 。它是一个游戏手柄,这个手柄拿回家以后,你不须要任何其余东西,就能用这个手柄来玩游戏。可能有人会疑惑主机在哪?主机其实就在谷歌云上面。

当你打开这个手柄,须要作的就是链接到你家里的 WiFi,链接好之后全部的游戏都在云上,玩的时候也不须要下载。你家里的电视也是链接到 WiFi,经过 Google Ground Caster这么一个专门用来投屏的设备显示游戏1080P的渲染画面,甚至它还支持 4K 渲染,只不过对带宽要求高一些,所有内容都在 Server 上。

因此就意味着你在本地操做游戏手柄往前走,你的命令会转到云上,而后云上将三维图形渲染,每一秒推给你 30 帧甚至 60 帧的画面,这样你就彻底能够在本地来玩这个游戏了。你也不用再下载游戏了,你们都知道如今游戏安装包愈来愈大,下载安装都很费劲。第二,你也再也不须要什么主机了,更新的麻烦也能够省去。只要你有一个手柄,家里有电视,你就能玩的很好,这就是一个家用游戏的场景。

其实我以为谷歌作这个场景更大的战略应该是放眼将来,好比若是如今咱们把手机作成眼镜那样的形式,面临的主要问题是没有很大的电池。可是之后若是网络足够好的话,咱们就只须要把视频传走,再把视频拿回来,如今的硬件发展处理这些东西是很是省力气的,因此我以为除了刚才提到的游戏之外,将来的人工智能尤为是很复杂的人工智能,也会受益于这种模式,让咱们的用户体验变得更好。

相关文章
相关标签/搜索