机器学习(Machine Learning,ML)
是使用计算机来彰显数据背后的真实含义,它为了把无序的数据转换成有用的信息。是一门多领域交叉学科,涉及几率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,从新组织已有的知识结构使之不断改善自身的性能。
它是人工智能的核心,是使计算机具备智能的根本途径,其应用遍布人工智能的各个领域,它主要使用概括、综合而不是演绎。python
机器学习是一门人工智能的科学,该领域的主要研究对象是人工智能,特别是如何在经验学习中改善具体算法的性能”。 “机器学习是对能经过经验自动改进的计算机算法的研究”。 “机器学习是用数据或以往的经验,以此优化计算机程序的性能标准。” 一种常常引用的英文定义是:A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E.算法
机器学习已经有了十分普遍的应用,例如:数据挖掘、计算机视觉、天然语言处理、生物特征识别、搜索引擎、医学诊断、检测信用卡欺诈、证券市场分析、DNA序列测序、语音和手写识别、战略游戏和机器人运用。网络
例如:识别动物猫架构
模式识别(Pattern recognition)、机器学习(machine learning)和深度学习(deep learning)机器学习
表明三种不一样的思想流派。模式识别是最古老的(做为一个术语而言,能够说是很过期的)。函数
机器学习是最基础的(当下初创公司和研究实验室的热点领域之一)。工具
深度学习是很是崭新和有影响力的前沿领域,咱们甚至不会去思考后深度学习时代。性能
1)机器学习就像是一个真正的冠军同样持续昂首而上;
2)模式识别一开始主要是做为机器学习的代名词;
3)模式识别正在慢慢没落和消亡;
4)深度学习是个崭新的和快速攀升的领域。
模式识别:智能程序的诞生学习
模式识别是70年代和80年代很是流行的一个术语。它强调的是如何让一个计算机程序去作一些看起来很“智能”的事情,例如识别“3”这个数字。并且在融入了不少的智慧和直觉后,人们也的确构建了这样的一个程序。例如,区分“3”和“B”或者“3”和“8”。早在之前,你们也不会去关心你是怎么实现的,只要这个机器不是由人躲在盒子里面假装的就好(图2)。不过,若是你的算法对图像应用了一些像滤波器、边缘检测和形态学处理等等高大上的技术后,模式识别社区确定就会对它感兴趣。光学字符识别就是从这个社区诞生的。所以,把模式识别称为70年代,80年代和90年代初的“智能”信号处理是合适的。决策树、启发式和二次判别分析等所有诞生于这个时代。并且,在这个时代,模式识别也成为了计算机科学领域的小伙伴搞的东西,而不是电子工程。从这个时代诞生的模式识别领域最著名的书之一是由Duda & Hart执笔的“模式识别(Pattern Classification)”。测试
机器学习:从样本中学习的智能程序
在90年代初,人们开始意识到一种能够更有效地构建模式识别算法的方法,那就是用数据(能够经过廉价劳动力采集得到)去替换专家(具备不少图像方面知识的人)。所以,咱们搜集大量的人脸和非人脸图像,再选择一个算法,而后冲着咖啡、晒着太阳,等着计算机完成对这些图像的学习。这就是机器学习的思想。“机器学习”强调的是,在给计算机程序(或者机器)输入一些数据后,它必须作一些事情,那就是学习这些数据,而这个学习的步骤是明确的。相信我,就算计算机完成学习要耗上一天的时间,也会比你邀请你的研究伙伴来到你家而后专门手工得为这个任务设计一些分类规则要好。
在21世纪中期,机器学习成为了计算机科学领域一个重要的研究课题,计算机科学家们开始将这些想法应用到更大范围的问题上,再也不限于识别字符、识别猫和狗或者识别图像中的某个目标等等这些问题。研究人员开始将机器学习应用到机器人(强化学习,操控,行动规划,抓取)、基因数据的分析和金融市场的预测中。另外,机器学习与图论的联姻也成就了一个新的课题---图模型。每个机器人专家都“无奈地”成为了机器学习专家,同时,机器学习也迅速成为了众人渴望的必备技能之一。然而,“机器学习”这个概念对底层算法只字未提。咱们已经看到凸优化、核方法、支持向量机和Boosting算法等都有各自辉煌的时期。
深度学习:一统江湖的架构
快进到今天,咱们看到的是一个夺人眼球的技术---深度学习。而在深度学习的模型中,受宠爱最多的就是被用在大规模图像识别任务中的卷积神经网络(Convolutional Neural Nets,CNN),简称ConvNets。
深度学习强调的是你使用的模型(例如深度卷积多层神经网络),模型中的参数经过从数据中学习得到。然而,深度学习也带来了一些其余须要考虑的问题。由于你面对的是一个高维的模型(即庞大的网络),因此你须要大量的数据(大数据)和强大的运算能力(图形处理器,GPU)才能优化这个模型。卷积被普遍用于深度学习(尤为是计算机视觉应用中),并且它的架构每每都是非浅层的。
知识表示
:
参考一下文章:
选择算法须要考虑的两个问题
举例
机器学习 开发流程
SciPy
、NumPy
(底层语言:C和Fortran)Matplotlib
Pandas