揭秘人工智能(系列):深度学习是否过度夸大?

摘要: 深度学习可能不是过度夸大,也许它只是没有很好地被理解!

2012年左右,多伦多大学的研究人员首次使用深度学习来赢下了ImageNet,它是一项很是受欢迎的计算机图像识别竞赛。对于那些参与AI行业的人来讲,这是一个大问题,由于计算机视觉是使计算机可以理解图像背景的学科,也是人工智能中最具挑战性的领域之一。html

固然,与任何其余产生巨大影响的技术同样,深度学习成为炒做的焦点。不一样的公司和组织开始应用它来解决不一样的问题(或伪装应用它)。许多公司开始使用深度学习和先进的人工智能技术重塑其产品和服务。ios

与此同时,媒体也常常撰写有关人工智能和深度学习的故事,这些故事充满误导性,而且大可能是由那些对技术运做方式没有正确理解的人撰写。他们大多使用关于人工智能的耸人听闻的头条来博眼球,这些也促成了围绕深度学习的炒做。程序员

通过媒体的炒做后,许多专家认为深度学习被夸大了,它最终会消退并可能致使另外一个人工智能冬季,从而令人们对人工智能的兴趣和资金投入大幅降低。其中一些著名专家也认可,深度学习已经触底,其中包括一些深刻学习的先驱者。算法

但根据著名数据科学家和深度学习研究员杰里米·霍华德的说法,“深度学习过分夸大”的论点有点夸张。霍华德是fast.ai的创始人,<u style="box-sizing: border-box;">fast.ai</u>是一个非营利性的在线深度学习课程。编程

今年,霍华德在USENIX Enigma会议上发表的演讲中发表了许多反对深度学习的论点。整个视频很是清楚地说明了深度学习究竟作了什么和不作什么,这个演讲能够帮助你清楚地了解该领域。axios

如下是霍华德演讲主要反驳的几个论点:安全

深度学习只是一种时尚-明年它将是另外一回事(NO!)

许多人认为深度学习是忽然冒出来,最终也会忽然消失。网络

霍华德反驳解释到:“你今天在深度学习中实际看到的是几十年研究的结果,而这几十年的研究终于达到了实际上给出最早进成果的程度。”机器学习

人工神经网络的概念是深度学习算法的主要组成部分,它已存在数十年,第一个神经网络能够追溯到20世纪50年代。ide

Mark I Perceptron是1957年神经网络的第一个实现

可是,因为数十年的研究以及数据和计算资源的可用性,深度学习的概念已经从实验室走出并进入实际领域。

霍华德说:“利用深度学习,人们能够减小不少复杂的繁琐的事务,咱们应该期待看到[深度学习]继续发展下去而不是消失。”

深度学习和机器学习是一回事(NO!)

滥用人工智能词汇很容易致使了从业人员对行业的混淆和怀疑。有人说深度学习只是机器学习的另外一个别称,而其余人则认为它与其余AI技术(如支持向量机(SVM),随机森林和逻辑回归)属于同一水平。

但深度学习和机器学习并不相同,深度学习是机器学习的一个子集。一般,机器学习适用于基于训练数据的数学模型和行为规则的全部技术。ML技术已经投入生产使用了很长时间。

在深度学习以前,科学家们必须在编写“功能”或模块方面投入大量精力,这些功能能够执行模型想要执行的任务的一小部分。例如,若是你想建立一个能够检测猫的图像的AI模型,你将不得不编写较小的程序来检测猫的特征,如耳朵、尾巴、鼻子、皮毛。并且你必须使这些程序足够强大,以便从不一样角度和不一样光照条件下检测这些特征,并告诉不一样猫种之间的差别。最后你才能在这些功能之上进行机器学习。

若是你想解决更复杂的问题,如经过MRI扫描检测乳腺癌,那么建立特征将变得更具挑战性。霍华德说:“你将须要数十名领域专家与数十名计算机程序员和数学家合做,提出这些功能概念并对其进行编程。最后使用一个经典的机器学习模型,如逻辑回归。”这项工做大概须要数年的工做。

![经典的机器学习方法涉及许多复杂的步骤,须要数十名领域专家、数学家和程序员的合做
](https://upload-images.jianshu...

深度学习用神经网络取代了艰苦的经典机器学习过程。霍华德将神经网络描述为“无限灵活的函数”。这意味着神经网络能够应用于机器学习解决的大多数问题,而无需经过之前必须执行的全部特定于域的特征工程。

要想神经网络解决特定问题,你须要调整其参数。为此,深度学习使用“梯度降低”,这是一种通用优化算法,能够将神经网络的参数与其想要解决的问题相匹配。

最后,深度学习利用了近年来可用的GPU和专用硬件的强大功能,以合理快速和可扩展的方式执行这些任务。

霍华德说:“只有在过去的几年里,这三件事情才能让咱们真正使用神经网络来得到最早进的结果。”

所以,深度学习不是经过之前机器学习方法所涉及的专业知识密集型和容易出错的过程,而是提供样本数据(例如标记为猫图片,标记为癌症或非癌症的MRI扫描...)并训练神经元使用梯度降低的网络。神经网络比较并找到这些数据样本中的常见模式,并学习应用相同的知识来分类之前从未见过的新数据样本。

这种方法在过去几年中深刻学习了最流行的人工智能技术,并引起了使用深度学习的应用程序的爆炸式增加。

深度学习只对图像识别有益(NO!)

不少人都认可深度学习是一种很是有用的人工智能技术,但不少批评者都抱怨它的使用仅限于解决涉及图像分类的问题!

“图像识别很是重要!”霍华德说。几年前,霍华德和一组研究人员在肺部CT扫描上训练了一个深度神经网络,并建立了一种算法,能够检测恶性癌症肿瘤,这个算法的结果诊断的结果与四名人类放射科医师相比,假阳性和阴性率更低。

霍华德还指出,许多问题能够从新理解为图像识别问题。例如,在中国古代游戏围棋中击败世界冠军的深度学习算法AlphaGo其实是一个图像识别的卷积神经网络(CNN)。

“具体来讲,AlphaGo所作的是看了不少在真人玩过的围棋的例子”霍华德解释道。“基本上,他们最终作了一个图像识别神经网络,他们试图学习的东西不是这张照片是猫仍是狗,而是这是一张白子赢或黑赢的围棋照片。”这种方法一直是AlphaGo和许多掌握不一样棋盘和视频游戏的AI算法成功的关键因素。

关键是,许多问题能够转化为图像识别问题,并经过深度学习解决。例如,霍华德深度学习课程的学生建立了一个神经网络,该网络在鼠标移动和点击的图像行为上进行训练。在这种状况下,他建立了一个卷积神经网络,试图根据这些图片预测欺诈行为。

深度学习能够将鼠标移动和点击的视觉表示转变为欺诈检测应用程序

也就是说,深度学习也证实了其超越计算机视觉和图像识别领域的价值。

霍华德指出,深度学习如今也适用于大多数天然语言处理(NLP)问题,这包括机器翻译和文本摘要等领域。NLP是一个关键组件,它可使Siri,Alexa和Cortana等AI助手理解你的命令。(有一点要知道:深度学习对人类语言的掌握

深度学习还能够解决涉及结构化数据的问题,例如电子表格中的行和列。例如,你能够为神经网络提供一组表明金融交易及结果(欺诈或正常)的行,并对其进行训练以预测欺诈性交易。

霍华德指出,深度学习也能够应用于时间序列和信号问题,例如链接到网络的不一样IP地址的事件顺序或随时间收集的传感器数据。

深度学习的痛点

霍华德还指出了一些深度学习成效有限的领域,这些领域包括强化学习,对抗模型和异常检测。

一些专家认为强化学习是当前人工智能的圣杯。强化学习涉及开发AI模型而不向他们提供大量标记数据。在强化学习中,你为模型提供问题域的约束,并让它开发本身的行为规则。AlphaGo的高级版AlphaGo Zero就是使用强化学习从头开始训练本身,而后超过了AlphaGo。虽然深度强化学习是人工智能研究中比较有趣的领域之一,但它在解决现实问题方面没有明显的进展。Google Brain AI研究员Alex Irpan在深度强化学习的极限上有一篇引人深思的文章。

对抗模型是霍华德说起的另外一个深度学习痛点。对抗性示例是操纵输入可能致使神经网络以非理性方式运行的实例。有不少研究人员展现了对抗性<u style="box-sizing: border-box;">示例</u>如何可以成为对AI模型的攻击<u style="box-sizing: border-box;">者</u>。虽然已经作了一些努力来增强深层学习模式以对抗对抗性攻击,但到目前为止,成功有限。部分挑战源于神经网络很是复杂且难以解释的事实。

异常检测,霍华德谈到的第三个深度学习痛点也很是具备挑战性。通常概念是在基线数据上训练神经网络,并让它肯定偏离基线的行为。这是在网络安全中使用AI的主要方法之一,一些公司正在探索这一律念。可是,它仍然没法将本身确立为对抗安全威胁的很是可靠的方法。

深度学习是一个黑盒子

这是一个真正使人担心的问题,尤为是在人工智能模型被赋予关键决策的领域,例如医疗保健、自动驾驶汽车和刑事司法。那些愿意让深度学习表明他们作出决定的人须要知道推进这些决策的因素是什么?不幸的是,当你在训练神经网络时得到的性能优点会下降你在决策过程当中得到的可见性。这就是深度学习一般被称为“黑匣子”的缘由。

可是,如今已经有了不少有趣的研究来解释AI决策,并帮助工程师和最终用户理解影响神经网络输出的元素。

深度学习须要大量数据

通常认为,要建立一个新的深度学习模型,须要访问数百万和数十亿个带标签的示例,这就是为何只有大型科技公司才能建立它。

“须要大量数据的说法一般不正确,由于大多数人在实践中使用迁移学习”霍华德说。

迁移学习是机器学习中的一门学科,其中一个模型得到的知识被转移到执行相似任务的另外一个模型。与人类如何将知识从一个领域转移到另外一个领域相比,它很是原始。可是,迁移学习在深度学习领域是一个很是有用的工具,由于它使开发人员可以用更少的数据建立新模型。

霍华德解释说:“你从一个预先训练好的[神经]网络开始,而后为你的特定任务微调权重。通常来讲,若是你有大约1,000个示例,你应该可以创建一个良好的神经网络。”

你须要博士学位才​​能进行核心深度学习

深度学习是一个很是复杂的计算机科学领域,它涉及许多高级数学概念。可是在过去几年中,学术界已经建立了大量的工具和库来抽象出潜在的复杂性,并使你可以无须解决过多的数学问题来开发深度学习模型。

Fast.ai和Keras就是两个现成的库,可用于快速开发深度学习应用程序。还有不少在线课程,包括霍华德的fast.ai,Coursera和其余课程,使你可以开始深刻学习编程,只须要不多的编程知识。许多具备计算机科学之外背景的人已经可以将这些课程应用于现实世界的问题。

须要明确的是,深度学习研究仍然是一个很是先进和复杂的领域,人才既稀缺又昂贵。开发新的深度学习技术的人是一些最使人垂涎​​和收入极高的研究人员。但这并不意味着其余人须要拥有相同水平的知识才能在他们的应用程序中使用这些研究项目的结果。

深度学习须要大量的计算能力

“你可能会担忧你须要一个充满GPU的大房间,总的来讲这并非真的,我如今看到的绝大部分红功结果都是用一个GPU完成的。” 霍华德说

大型公司和组织进行的大型研究项目须要大量的GPU,例如一款机器人手用6144 CPU和8个GPU进行训练出来的。另外一个例子是OpenAI Five,一个训练有素的AI模型,能够玩著名的Dota 2在线战斗竞技游戏,OpenAI Five是用了128,000个CPU内核和256个GPU的训练的结果。

可是,大多数实际问题均可以经过单个GPU解决。例如,你能够经过一个GPU来完成霍华德的Fast.ai课程。

总结:

我建议你观看整个视频,其中,霍华德深刻研究了一些更专业的主题,例如你是否能够将深度学习应用于信息安全。重要的是咱们要了解深度学习的范围和限制以及机会和优点,由于它是咱们这个时代最有影响力的技术之一。深度学习不是过度夸大,也许它只是没有很好地被理解。



本文做者:【方向】

阅读原文

本文为云栖社区原创内容,未经容许不得转载。

相关文章
相关标签/搜索