什么是 AI、机器学习与深度学习?

什么是 AI、机器学习与深度学习?算法

你们好,我是杨锋,做为一个大数据从业人员,相信你们成天都在被 AI、机器学习、深度学习等一些概念轰炸。有时候甚至有点坐卧不安,一方面做为一个“业内人士”而自豪,二方面以为新概念一个接一个,本身不甚了解,有点恐惧。我一直相信一句台词——“喝了敌人的血,下次见面就不会再怕了”。学习知识亦然,不少时候,你以为很高深,其实是缺少清晰的概念。当你真的把这些概念理清楚后,每每会恍然大悟,万变不离其宗,原来不过如此。上网查了不少资料,很遗憾的是,99%的从业者语文都不怎么过关,连基本的定义都不会下。一个简单的“限定词+更大的集合”的定义模式都没有掌握,深表遗憾。因而仍是决定本身来梳理一下吧。有高人说过(花钱买的):你对一个领域的理解程度,彻底取决于你的头脑里有多少清晰的概念,以及可否把这些概念关联起来。废话少说,开始唠吧。网络

人工智能( Artificial Intelligence)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门技术科学。咱们来分解一下这个概念。“人工智能”是“一门技术科学”,它研究与开发的对象是“理论、技术及应用系统”,研究的目的是为了“模拟、延伸和扩展人的智能”。既然如此,那么买菜用的“计算器”算是人工智能吗?严格地说是算的,由于它至少作了“模拟”人在计算方面的智能,并扩展了这个能力(比人算得更快)。咱们天天编码驱动计算机去帮咱们干活,这个算是人工智能吗?也算的。因此,首先不用妄自菲薄,其实你们早已经是“人工智能”的从业者了。咱们如今看到的貌似很高端的技术,如图像识别、NLP,其实依然没有脱离这个范围,说白了,就是“模拟人在看图方面的智能”和“模拟人在听话方面的智能”,本质上和“模拟人在计算方面的智能”没啥两样,虽然难度有高低,但目的是同样的——模拟、延伸和扩展人的智能。另外,人工智能也不是啥新概念,事实上这是50年代提出的东西了(比大家老多了),如今这么火热,顶多只能算是“诈尸”,谈不上“新生”。机器学习

随着人对计算机科学的指望愈来愈高,要求它解决的问题愈来愈复杂,摧枯拉朽地打个小怪已经远远不能知足人们的诉求了。1+1好算,1+2也不难,这些已经能解决的问题暂且按下不表。要解决的问题域愈来愈复杂,即便是同一个问题,其面对的场景也愈来愈多。咱总不能每新出来一种场景,就让码农去查找switch,而后在default前去再加一个case吧;世间的场景千千万,那得多少个case啊,杀个码农祭天也保不齐会出问题啊。那怎么办呢?因而有人提出了一个新的思路——可否不为难码农,让机器本身去学习呢(提出这个概念的人必定作过码农)?好吧,如今机器学习的定义就出来了。机器学习即不须要码农添加case语句而让机器本身学会执行任务的人工智能技术。好像不太正规啊,好吧,再定义一下。机器学习就是用算法解析数据,不断学习,对世界中发生的事作出判断和预测的一项技术。研究人员不会亲手编写软件、肯定特殊指令集、而后让程序完成特殊任务;相反,研究人员会用大量数据和算法“训练”机器,让机器学会如何执行任务。这里有三个重要的信息:一、“机器学习”是“模拟、延伸和扩展人的智能”的一条路径,因此是人工智能的一个子集;二、“机器学习”是要基于大量数据的,也就是说它的“智能”是用大量数据喂出来的,若是缺乏海量数据,它也就啥也不是了;三、正是由于要处理海量数据,因此大数据技术尤其重要;“机器学习”只是大数据技术上的一个应用。经常使用的10大机器学习算法有:决策树、随机森林、逻辑回归、SVM、朴素贝叶斯、K最近邻算法、K均值算法、Adaboost算法、神经网络、马尔科夫。Apache有个开源项叫mahout,提供了这些经典算法的实现;可是后来spark出来了,因为在内存迭代计算方面的优点,一会儿抢过了这个风头,目前spark自带的MLlib被使用得更为普遍。虽然mahout也在向spark转,可是在技术的世界里就是这样的,只有新人笑,哪闻旧人哭。学习

相较而言,深度学习是一个比较新的概念,算是00后吧,严格地说是2006年提出来的。老套路,也给它下一个定义。深度学习是用于创建、模拟人脑进行分析学习的神经网络,并模仿人脑的机制来解释数据的一种机器学习技术。它的基本特色,是试图模仿大脑的神经元之间传递,处理信息的模式。最显著的应用是计算机视觉和天然语言处理(NLP)领域。显然,“深度学习”是与机器学习中的“神经网络”是强相关,“神经网络”也是其主要的算法和手段;或者咱们能够将“深度学习”称之为“改良版的神经网络”算法。深度学习又分为卷积神经网络(Convolutional neural networks,简称CNN)和深度置信网(Deep Belief Nets,简称DBN)。其主要的思想就是模拟人的神经元,每一个神经元接受到信息,处理完后传递给与之相邻的全部神经元便可。因此看起来的处理方式有点像下图(想深刻了解的同窗能够自行google)。大数据

神经网络的计算量很是大,事实上在很长时间里因为基础设施技术的限制进展并不大。而GPU的出现让人看到了曙光,也造就了深度学习的蓬勃发展,“深度学习”才一会儿火热起来。击败李世石的Alpha go便是深度学习的一个很好的示例。Google的TensorFlow是开源深度学习系统一个比较好的实现,支持CNN、RNN和LSTM算法,是目前在图像识别、天然语言处理方面最流行的深度神经网络模型。事实上,提出“深度学习”概念的Hinton教授加入了google,而Alpha go也是google家的。在一个新兴的行业,领军人才是多么的重要啊!google

总结:人工智能是一个很老的概念,机器学习是人工智能的一个子集,深度学习又是机器学习的一个子集。机器学习与深度学习都是须要大量数据来“喂”的,是大数据技术上的一个应用,同时深度学习还须要更高的运算能力支撑,如GPU。编码

想要更详细的了解,请访问华为云学院( edu.huaweicloud.com/courses/ ),课程获取密码,搜索:机器学习或者深度学习或者 AI ,通常人我不告诉他喔!人工智能

相关文章
相关标签/搜索