深度学习已至“瓶颈”?英特尔:数据处理是一剂良药

 

 

文章发布于公号【数智物语】 (ID:decision_engine),关注公号不错过每一篇干货。git

 

 

 

来源 | 新智元github

编辑 | 木青、金磊算法

 

霍金弟子Alan Yuille在前不久发表言论称,至少在计算机视觉领域,深度学习的瓶颈已至。然而,人工智能与大数据的发展是相辅相成的,数据将会推进人工智能的发展,促进更多技术应用落地,将人工智能带入一个新台阶——数据红利悄然将至。编程

 

深度学习已至“瓶颈”?数据处理或许是一剂良药。浏览器

 

前不久,霍金弟子、约翰霍普金斯大学教授 Alan Yuille 发表言论称,至少在计算机视觉领域,深度学习的瓶颈已至。安全

 

在此问题上,Alan Yuille 认为该领域最严峻的挑战是开发可以应对组合爆炸的算法,若是研究人员追求更多样性的方法和技术,而不只是追逐当前的流行趋势,这一领域将会获得更快的发展。网络

 

而如今,对于深度学习发展已经到了天花板的问题,彷佛有了另外的解决方案——数据。架构

 

英特尔公司架构图形与软件集团副总裁和数据分析技术总监马子雅框架

 

6月18-21日,以“打破理论与现实的壁垒”为主题的 O’Reilly 和英特尔人工智能大会在京举行。机器学习

 

大会期间,英特尔公司架构图形与软件集团副总裁和数据分析技术总监马子雅在被问到如何看待“深度学习到达瓶颈”的问题时表示,人工智能、数据分析界在此问题上长期以来有两派意见:

 

  • 一派意见认为人工智能的发展必定要经过对其算法的不断提高才能真正把 AI 推到一个新台阶;

  • 另外一派意见认为人工智能只作算法是不行的,如果不能更好地利用、分析数据,人工智能很快就会达到它的瓶颈。

 

而马子雅认为,两者是相辅相成的,如同事物发展规律迂回曲折,其最终结果会呈上升趋势。

 

人工智能一直有所精进,但其应用方面并非很是理想。自从有了大数据,对图像分析领域产生了突破性推动做用。

 

数据会推进人工智能的发展,会将人工智能带入一个新台阶,部署行业应用,推动人工智能落地:

 

“人工智能业务的需求紧紧地根植于数据,要充分利用以数据为中心的基础架构,充分利用将数据分析与人工智能无缝衔接起来的软件创新技术。”

 

而围绕数据为核心,英特尔在 AI 时代的战略图景也可经过这次大会有所了解:

 

  • 在软件方面,提供一系列通用工具集,帮助用户最大化利用硬件, 以及经过 BigDL 和 Analytics Zoo 构建统一的大数据分析与人工智能平台,帮助用户开发部署行业应用,推动人工智能落地;

     

  • 在硬件方面,提供完整的硬件产品组合和计算平台,知足用户从设备到边缘再到云端的不一样工做负载需求 。

     

  • 在产、学、研生态打造方面,英特尔宣布在中国成立大数据分析和人工智能创新院,进一步加快集成数据分析和AI的大规模创新与部署。

 

英特尔人工智能战略的核心在于,致力于给客户带来领先的人工智能硬件和软件产品组合,帮助用户搭建所须要的AI应用,帮助客户解决所面临的个性化问题。除了技术自己,英特尔还致力于与普遍的行业伙伴合做,一块儿面向共同服务的客户,开发全套、全面、完整的AI解决方案。

 

在AI时代,英特尔正在完成一次转型——从“芯片航母”到以数据为中心,深挖数据红利,释放数据价值,经过软硬件协同加速人工智能的行业应用。

 

01低门槛开源工具BigDL、Analytics Zoo,数据红利悄然将至

 

人类处于一个数据变革的时代——历史上 90% 的数据都是在过去几年产生的,而 50% 的数据倒是在短短两年所生成。

 

在过去的一段时间数据分析和人工智能获得了空前的发展。

 

但事实上到目前为止,只有 2% 的数据被真正的分析用来帮助人类的生产生活。人工智能是时候走出实验室了,走向落地应用了。

 

而这一过程须要一条完整的数据分析流水线:

 

  • 第一步,一般须要从生产线上收集大量的原始数据;

  • 第二步,要对这些原始数据进行大量的清理和预处理;

  • 第三步,利用数据分析、机器学习、深度学习对于清理过的数据进行概括总结;

  • 第四步,可视化。

 

这条流水线有着较高的门槛:20% 的任务是深度学习,但 80% 都是在作数据收集、数据存储、数据管理、数据清理、数据预处理。

 

这也正是英特尔开源 BigDL、Analytics Zoo 的重要缘由——下降门槛,让人工智能走出实验室。

 

目前,BigDL 和 Analytics Zoo 都已开源,大大下降了普通大数据用户和数据科学家在使用深度学习进行数据分析和构建人工智能应用时的门槛。

 

 

GitHub开源地址:

https://github.com/intel-analytics/BigDL

 

先来看看 BigDL,BigDL 是一个创建在大数据平台(Hadoop/Spark)之上原生的分布式深度学习库,它提供了在 Apache Spark 上丰富的深度学习功能,以帮助 Hadoop/Spark 成为一个统一的数据分析平台,为整个数据分析和机器学习过程提供比现有框架更加统一和集成化的支持。

 

 

GitHub开源地址:

https://github.com/intel-analytics/analytics-zoo

 

同时,在 Apache Spark、BigDL 以及 TensorFLow、Keras 的基础上又构建了一个大数据分析+ AI 的平台 Analytics Zoo,方便用户开发基于大数据、端到端的深度学习应用。

 

不止下降了开发者学习深度学习的门槛,在创建 AI 生态上,“释放数据红利”已经逐渐变成现实。

 

人工智能若是不能真正地效力于生产实践,实际上是没有任何价值的。看将来的趋势,必须先看到人工智能对于将来哪几个方面能产生比较大的影响。

 

英特尔经过 Analytics Zoo 构建统一的大数据分析和人工智能平台,帮助用户开发部署深度学习、人工智能和大数据分析的应用,携手众多合做伙伴和用户,共同推进人工智能部署,加速落地。

 

美的,韵达,欧洲核子研究组织(CERN)都在利用英特尔 Analytics Zoo 进行人工智能的落地。英特尔借助 BigDL 和 Analytics Zoo 几乎与各行各业的厂商展开了合做,实施部署了各类各样的人工智能的解决方案。

 

这其中就包括智慧医疗、智慧银行、智慧交通、智慧生产、智慧电信等等。英特尔也与大型云服务提供商、原型设备制造商、软件开发商进行合做,将技术整合产品当中,包括阿里巴巴、百度、腾讯、京东等等。

 

同时,英特尔还推进与产、学、研的深度合做,打造AI生态。

 

在大会上,英特尔宣布启动英特尔数据分析和人工智能研究院创新院。创新院的主要负责人是英特尔高级首席工程师、大数据技术全球 CTO 戴金权。

 

这个创新院的主要工做集中在如下几点:

 

  • 第一,加速人工智能在中国市场的落地,尤为是经过将它与数据分析进行整合来加速落地。

  • 第二,解决中国市场的最新需求,引领创新,创新用法、创新算法。第三,帮助中国市场更好地使用英特尔最新的软件和硬件技术。

 

02AI芯片,毫不能输的战场:不局限于CPU,须要研发多种硬件形式

 

现在 AI 芯片已经成为一个“毫不能输的战场”。

 

在 O’Reilly 大会期间,有着“芯片航母”之称的英特尔在接受媒体采访时透露了在硬件方面的布局图景。

 

马子雅表示:英特尔的硬件图景不仅集中在计算,咱们但愿英特尔的硬件可以比较全面,例如针对存储方面,英特尔开发了“傲腾”技术,另外英特尔也已经作了好久的网络架构技术。

 

而做为整个产业的根基,AI 芯片现在成为各大巨头纷纷争先想要占领的高地。收购 Nervana Systems,成为英特尔全面拥抱人工智能的一个重要节点。

 

英特尔全球副总裁兼人工智能产品事业部总经理 Naveen Rao 表示 AI 已经是英特尔“毫不能输的战场”。在 2019 年 1 月,英特尔推出了 Nervana 神经网络推理处理器。本次马子雅也透露对于 Nervana 的将来规划公司已有路线图,会在更合适的机会和你们分享。

 

马子雅强调将来的计算力不能局限于 CPU 一种,尤为是在 AI 时代,须要经过研发多种多样的硬件形式,保证计算力可以在固定每几年翻一番的速度继续下去,可能都不是集中在通用芯片上,有时候是专用和通用的结合。

 

事实上,尽管 CPU 再也不是“惟一”,但仍然是计算结构里不可或缺的重要组成部分。就如同 Naveen Rao 此前说得同样,只要是冯·诺依曼架构,“你必需要有一个 CPU”。

 

英特尔一大优点在于,市面上已经安装而且投入使用的 CPU,而硬件基础设施的更新则是逐步进行,“把旧的全扔掉而后换新的”并不现实。现在,全球有 3500 万公司使用英特尔的 CPU,眼下最火热的人工智能推理,也有近 90% 是在英特尔的芯片上完成。

 

英特尔在制程与封装上仍处于领先位置。制程工艺不断向更高的晶体管密度发展,为芯片带来更强的性能和更低的功耗。拥有领先的制程技术,是构建领先硬件产品的关键。

 

制程的领先仍然是英特尔继续发挥产品优点的关键因素,在 10 纳米领域英特尔继续推进产品的发展。在 Foveros 的制程中,英特尔的 3D 封装技术可实如今逻辑晶圆上堆叠逻辑处理单元,可以把逻辑芯片和逻辑芯片连在一块儿,更好地发挥异构功效。

 

另外,在 CPU 的周围,你能够放上 GPU、DSP、ISP,以及 NNP,或者各类新的架构。

 

 

英特尔认为,将来十年架构创新会是创新的主要驱动力,将继续带来指数级的扩展效应。除了常见的标量、矢量、矩阵和空间这四种计算架构外,英特尔在架构创新上还作了更多的工做,例如:

 

  • Loihi 神经拟态计算。它能够用超低的功耗去完成一个 GPU 用很高功耗才能完成的任务,并能经过学习获得一个新的网络。

  • 量子计算。量子计算是在架构上的另一个全新的超大并行规模计算。英特尔在量子计算有两个不一样的探索模式,一个是和业界相似的经过超导方式作量子位和量子芯片;另一种是基于英特尔比较擅长的硅处理工艺,用自旋的方式,目前也有了(自旋)量子位芯片,而且为了可以规模化的生产和测试,专门和产业界、学术界合做。

 

保持 CPU 王者的领先优点,同时开发适合 AI 时代的多种硬件形式, AI 化是英特发展硬件的将来方向。

 

03AI并不是“一策万能”:软硬件协同创新,实现超异构时代的技术愿景

 

事实上,过去几年间计算力正在以惊人的速率增加。计算力指数级上升的实现,正是基于硬件与软件的结合。若是想实现指数级的增加,必需要硬件和软件共同创新。

 

在讲述硬件将来图景时,马子雅提到须要研发多种多样的硬件形式。然而,AI 并不是“一策万能”。

 

没有一种方案能解决全部问题(one size doesn’t fit all),须要多样化的产品组合知足不一样人工智能应用的需求。

 

从某种程度上,在人工智能这一领域,英特尔更像是 AI 解决方案提供者,针对不一样的案例提供不一样的软硬件组合:

 

  • 从软件层面,英特尔主要集中在开源方面,例如开源 BigDL 和 Analytics Zoo。

  • 将来十年的计算创新由架构驱动。英特尔具有独具一格的优点,能够将标量(CPU)、矢量(GPU)、矩阵(AI)和空间(FPGA)等不一样架构整合到系统级平台和系统级封装,同时也在进行架构创新的新探索,好比 Loihi 神经拟态计算芯片、量子计算。

 

而怎样进行组合则是由客户的工做负载来决定,决定合适的软件和合适的硬件。

 

 

马子雅透露到,最有效的办法、为客户提供最好的解决方案,就是先知道他的工做负载是什么,而后找到相应的软件硬件结合来解决那个工做负载,这是最行之有效的。

 

英特尔强调在硬件上每获得一个指数级的性能提高,若是加上软件的话可能有两个指数级的性能提高。对于此,英特尔从操做系统再到上层整合成一个完整的全栈软件技术(Vertical Stack),而后在硬件架构中所有打通。

 

经过这种技术可以把各类性能,架构上全部软件的性能整合起来而后提供给用户,大大提升其在这些架构上获得的性能和算力。值得一提的是,英特尔“One API”项目将为开发者带来一套能提供一个统一编程模型的工具。针对跨多种架构的工做负载,这个模型简化了相关的开发工做。

 

对英特尔而言,就是要提供多样化的标量、矢量、矩阵和空间架构组合,以先进制程技术进行设计,由颠覆性内存层次结构提供支持,经过先进封装集成到系统中,使用光速互连进行超大规模部署,提供统一的软件开发接口以及安全功能,从而实现超异构计算的技术愿景。

 

AI 计算现在已经迈入超异构时代,硬件基础只是AI超级生态中的一个环节,可是以数据为中心的将来还须要更完整的系统思考,单一因素已经不足以知足多元化的将来计算需求,必须实现软硬件协同创新。

 

 

数智物语征稿启事0613.png

 

星标我,天天多一点智慧

 

相关文章
相关标签/搜索