人工智能

转自:  http://www.cnbruce.com/blog/showlog.asp?cat_id=37&log_id=1422html

 

在经历了蛮荒的PC互联网时代,混战的移动互联网时代,到现今最火的人工智能时代。大数据、云计算、机器学习的技术应用,已经使得IT从业者的门槛愈来愈高。套用一句樊登读书会的宣传口号“keep learning”,保持对新鲜技术的好奇心,保持对技术应用的责任心,持续关注、学习是每一个IT从业者的必备技能。

1、什么是人工智能?



人工智能(Artificial Intelligence),英文缩写为AI。

它是一个融合计算机科学、统计学、脑神经学和社会科学的前沿综合学科。

它使得计算机像人同样拥有智能能力,能够代替人类实现识别、认知,分析和决策等多种功能。

好比当你说一句话时,机器可以识别成文字,并理解你话的意思,进行分析和对话等。


2、人工智能发展简史



1956年,几个计算机科学家相聚在达特茅斯会议(Dartmouth Conferences),提出了“人工智能”的概念。其后,人工智能就一直萦绕于人们的脑海之中,并在科研实验室中慢慢孵化。

以后的几十年,人工智能一直在两极反转,或被称做人类文明耀眼将来的预言;或者被当成技术疯子的狂想扔到垃圾堆里。坦白说,直到2012年以前,这两种声音还在同时存在。

上世纪90年代,国际象棋冠军卡斯帕罗夫与"深蓝" 计算机决战,"深蓝"获胜,这是人工智能发展的一个重要里程碑。而 2016 年,Google 的 AlphaGo 赢了韩国棋手李世石,再度引起 AI 热潮。

过去几年,尤为是2015年以来,人工智能开始大爆发。很大一部分是因为GPU的普遍应用,使得并行计算变得更快、更便宜、更有效。

固然,无限拓展的存储能力和骤然爆发的数据洪流(大数据)的组合拳,也使得图像数据、文本数据、交易数据、映射数据全面海量爆发。



3、人工智能发展条件

一、硬件发展:AI 不断爆发热潮,是与基础设施的进步和科技的更新分不开的,从 70 年代 personal 计算机的兴起到 2010 年 GPU、异构计算等硬件设施的发展,都为人工智能复兴奠基了基础。

二、数据发展:互联网及移动互联网的发展也带来了一系列数据能力,令人工智能能力得以提升。

三、运算发展:计算机的运算能力从传统的以 CPU 为主导到以 GPU 为主导,这对 AI 有很大变革。

四、算法发展:算法技术的更新助力于人工智能的兴起,最先期的算法通常是传统的统计算法,如 80 年代的神经网络,90 年代的浅层,2000 年左右的 SBM、Boosting、convex 的 methods 等等。随着数据量增大,计算能力变强,深度学习的影响也愈来愈大。尤为是2011 年以后,深度学习的兴起,带动了现今人工智能发展的高潮。




4、机器学习:一种实现人工智能的方法

机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及几率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。

机器学习是人工智能的核心,是使计算机具备智能的根本途径,其应用遍布人工智能的各个领域,它主要使用概括、综合而不是演绎。

机器学习最基本的作法,是使用算法来解析数据、从中学习,而后对真实世界中的事件作出决策和预测。

与传统的为解决特定任务、硬编码的软件程序不一样,机器学习是用大量的数据来“训练”,经过各类算法从数据中学习如何完成任务。

机器学习最成功的应用领域是计算机视觉,虽然也仍是须要大量的手工编码来完成工做。人们须要手工编写分类器、边缘检测滤波器,以便让程序能识别物体从哪里开始,到哪里结束;写形状检测程序来判断检测对象是否是有八条边;写分类器来识别字母“STOP”。使用以上这些手工编写的分类器,人们总算能够开发算法来感知图像,判断图像是否是一个中止标志牌。

【机器学习有三类】:

第一类是无监督学习,指的是从信息出发自动寻找规律,并将其分红各类类别,有时也称"聚类问题"。

第二类是监督学习,监督学习指的是给历史一个标签,运用模型预测结果。若有一个水果,咱们根据水果的形状和颜色去判断究竟是香蕉仍是苹果,这就是一个监督学习的例子。

最后一类为强化学习,是指能够用来支持人们去作决策和规划的一个学习方式,它是对人的一些动做、行为产生奖励的回馈机制,经过这个回馈机制促进学习,这与人类的学习类似,因此强化学习是目前研究的重要方向之一。




5、深度学习:一种实现机器学习的技术

值得一提的是机器学习同深度学习之间仍是有所区别的,机器学习是指计算机的算法可以像人同样,从数据中找到信息,从而学习一些规律。虽然深度学习是机器学习的一种,但深度学习是利用深度的神经网络,将模型处理得更为复杂,从而使模型对数据的理解更加深刻。

深度学习是机器学习中一种基于对数据进行表征学习的方法。深度学习是机器学习研究中的一个新的领域,其动机在于创建、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本。

同机器学习方法同样,深度机器学习方法也有监督学习与无监督学习之分.不一样的学习框架下创建的学习模型非常不一样.例如,卷积神经网络(Convolutional neural networks,简称CNNs)就是一种深度的监督学习下的机器学习模型,而深度置信网(Deep Belief Nets,简称DBNs)就是一种无监督学习下的机器学习模型。



如上图,人工智能是最先出现的,也是最大、最外侧的同心圆;其次是机器学习,稍晚一点;最内侧,是深度学习,当今人工智能大爆炸的核心驱动。



6、人工神经网络:一种机器学习的算法

人工神经网络(Artificial Neural Networks)是早期机器学习中的一个重要的算法,历经数十年风风雨雨。神经网络的原理是受咱们大脑的生理结构——互相交叉相连的神经元启发。但与大脑中一个神经元能够链接必定距离内的任意神经元不一样,人工神经网络具备离散的层、链接和数据传播的方向。

例如,咱们能够把一幅图像切分红图像块,输入到神经网络的第一层。在第一层的每个神经元都把数据传递到第二层。第二层的神经元也是完成相似的工做,把数据传递到第三层,以此类推,直到最后一层,而后生成结果。

每个神经元都为它的输入分配权重,这个权重的正确与否与其执行的任务直接相关。最终的输出由这些权重加总来决定。

咱们以“中止(Stop)标志牌”为例,将一个中止标志牌图像的全部元素都打碎,而后用神经元进行“检查”:八边形的外形、消防车般的红颜色、鲜明突出的字母、交通标志的典型尺寸和静止不动运动特性等等。神经网络的任务就是给出结论,它究竟是不是一个中止标志牌。神经网络会根据全部权重,给出一个通过深思熟虑的猜想——“几率向量”。

回过头来看这个中止标志识别的例子。神经网络是调制、训练出来的,时不时仍是很容易出错的。它最须要的,就是训练。须要成百上千甚至几百万张图像来训练,直到神经元的输入的权值都被调制得十分精确,不管是否有雾,晴天仍是雨天,每次都能获得正确的结果。

只有这个时候,咱们才能够说神经网络成功地自学习到一个中止标志的样子;或者在Facebook的应用里,神经网络自学习了你妈妈的脸;又或者是2012年吴恩达(Andrew Ng)教授在Google实现了神经网络学习到猫的样子等等。

吴教授的突破在于,把这些神经网络从基础上显著地增大了。层数很是多,神经元也很是多,而后给系统输入海量的数据,来训练网络。在吴教授这里,数据是一千万YouTube视频中的图像。吴教授为深度学习(deep learning)加入了“深度”(deep)。这里的“深度”就是说神经网络中众多的层。

如今,通过深度学习训练的图像识别,在一些场景中甚至能够比人作得更好:从识别猫,到辨别血液中癌症的早期成分,到识别核磁共振成像中的肿瘤。Google的AlphaGo先是学会了如何下围棋,而后与它本身下棋训练。它训练本身神经网络的方法,就是不断地与本身下棋,反复地下,永不停歇。


7、人工智能的研究领域和分支

人工智能研究的领域主要有五层:

一、最底层是基础设施建设,包含数据和计算能力两部分,数据越大,人工智能的能力越强。

二、往上一层为算法,如卷积神经网络、LSTM 序列学习、Q-Learning、深度学习等算法,都是机器学习的算法。

三、第三层为重要的技术方向和问题,如计算机视觉,语音工程,天然语言处理等。还有另外的一些相似决策系统,像 reinforcement learning(编辑注:加强学习),或像一些大数据分析的统计系统,这些都能在机器学习算法上产生。

四、第四层为具体的技术,如图像识别、语音识别、机器翻译等等。

五、最顶端为行业的解决方案,如人工智能在金融、医疗、互联网、交通和游戏等上的应用,这是咱们所关心它能带来的价值。




8、人工智能的应用场景

一、计算机视觉
2000年左右,人们开始用机器学习,用人工特征来作比较好的计算机视觉系统。如车牌识别、安防、人脸等技术。而深度学习则逐渐运用机器代替人工来学习特征,扩大了其应用场景,如无人车、电商等领域。


二、语音技术
2010 年后,深度学习的普遍应用使语音识别的准确率大幅提高,像 Siri、Voice Search 和 Echo 等,能够实现不一样语言间的交流,从语音中说一段话,随之将其翻译为另外一种文字;再如智能助手,你能够对手机说一段话,它能帮助你完成一些任务。与图像相比,天然语言更难、更复杂,不只须要认知,还须要理解。


三、天然语言处理
目前一个比较重大的突破是机器翻译,这大大提升了原来的机器翻译水平,举个例子,Google 的 Translation 系统,是人工智能的一个标杆性的事件。2010 年左右, IBM 的"Watson"系统在一档综艺节目上,和人类冠军进行天然语言的问答并获胜,表明了计算机能力的显著提升。


四、决策系统
决策系统的发展是随着棋类问题的解决而不断提高,从 80 年代西洋跳棋开始,到 90 年代的国际象棋对弈,机器的胜利都标志了科技的进步,决策系统能够在自动化、量化投资等系统上普遍应用。


五、大数据应用
能够经过你以前看到的文章,理解你所喜欢的内容而进行更精准的推荐;分析各个股票的行情,进行量化交易;分析全部的像客户的一些喜爱而进行精准的营销等。机器经过一系列的数据进行判别,找出最适合的一些策略而反馈给咱们。


9、人工智能的将来之路

一、在计算机视觉上,将来的人工智能应更加注重效果的优化,增强计算机视觉在不一样场景、问题上的应用。

二、在语音场景下,当前的语音识别虽然在特定的场景(安静的环境)下,已经可以获得和人类类似的水平。但在噪音情景下仍有挑战,如原场识别、口语、方言等长尾内容。将来需加强计算能力、提升数据量和提高算法等来解决这个问题。

三、在天然语言处理中,机器的优点在于拥有更多的记忆能力,但却欠缺语意理解能力,包括对口语不规范的用语识别和认知等。人说话时,是与物理事件学相联系的,好比一我的说电脑,人知道这个电脑意味着什么,或者它是可以干些什么,而在天然语言里,它仅仅将"电脑"做为一个孤立的词,不会去产生相似的联想,天然语言的联想只是经过在文本上和其余所共现的一些词的联想, 并非物理事件里的联想。因此若是要真的解决天然语言的问题,未来须要去创建从文本到物理事件的一个映射,但目前仍没有很好的解决方法。所以,这是将来着重考虑的一个研究方向。

四、当下的决策规划系统存在两个问题,第一是不通用,即学习知识的不可迁移性,如用一个方法学了下围棋,不能直接将该方法转移到下象棋中,第二是大量模拟数据。因此它有两个目标,一个是算法的提高,如何解决数据稀少或怎么自动可以产生模拟数据的问题,另外一个是自适应能力,当数据产生变化的时候,它可以去适应变化,而不是能力有所降低。全部一系列这些问题,都是下一个五或十年咱们但愿很快解决的。




参考:
腾讯 AI Lab 张潼主任带你轻松 get AI 新知识
https://www.qcloud.com/community/article/666041

人工智能、机器学习和深度学习之间的区别和联系
https://www.cnblogs.com/dadadechengzi/articles/6575767.html

百度百科:人工智能
https://baike.baidu.com/item/%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD/9180

百度百科:机器学习
https://baike.baidu.com/item/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0

百度百科:深度学习
https://baike.baidu.com/item/%E6%B7%B1%E5%BA%A6%E5%AD%A6%E4%B9%A0/3729729

百度百科:人工神经网络
https://baike.baidu.com/item/%E4%BA%BA%E5%B7%A5%E7%A5%9E%E7%BB%8F%E7%BD%91%E7%BB%9C算法

相关文章
相关标签/搜索