最近在研究机器学习,随手将学习的过程记录下来,方面本身的学习与回顾html
机器学习(Machine Learning,ML)是专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,从新组织已有的知识结构使之不断改善自身的性能的一门科学技术。python
它使用计算机技术,应用微积分、几率论、统计学、信息论、逼近论、凸分析、算法等多种不一样的理论与学科,针对分析目标创建有针对性的数据模型,经过对过往历史数据的学习(分类、回归、聚类等),完成基本算法模型,并能经过后续持续的学习(数据输入),在将杂乱的数据转换(输出)成有用信息的同时,还能不断优化改造自身。git
对于学习,人的学习过程,是经过观察(输入),根据过往经验对观察到的内容进行思考(处理),最后得出结论(输出)的过程。github
而机器学习是计算机利用已有的数据(通常是海量数据),得出了某种模型(算法模型),并利用此模型预测将来的一种方法。算法
机器学习主要解决的问题能够概括为:优化,预测,相关性。能够说,只要是涉及到优化,预测,个性化相关的问题,机器学习和深度学习均可以处理。apache
好比说,咱们去买百香果吃,咱们没有买百香果的经验,不知道那些是甜的那些是酸的,而后咱们买了一大堆回来,有大的、小的、轻的、重的、红的、紫的、白的、黄的、果皮光滑的、干皱的...而后每个都尝一便,最后发现,百香果原来有两大类,紫红和黄白两类,紫红类的,果皮越深(越紫越黑)的越甜,黄白类的越黄越甜,跟大小无关,跟果皮的光滑度无关,而一样大小,越重的果汁越多。黄白类的比紫红类的果子甜度更高一些。那么下次去买的时候,天然就懂得如何挑选了。编程
而机器学习跟买水果的过程相似,经过建模(对水果甜度的判断)、设计策略(针对百香果不一样的形状特性)和算法(品尝百香果,得出酸甜结论),而后输入大量数据(一大堆不一样种类与特征的百香果)进行训练,最后学会判断的过程(知道什么类型的百香果比较甜)。模型建好后,就能够针对更多的数据进行测试并输出结果(下次去买水果直接挑选学习后的水果类型,能够直接根据特征判断酸甜度),而这些结果也将不断的修正模型(买回来后继续品尝,观察酸甜度,继续总结经验,调整判断方法),提高模型的准确率,更好的帮咱们预测数据。网络
当前,机器学习普遍应用于搜索引擎、垃圾邮件处理、广告推荐、数据挖掘、图像识别、天然语言处理、生物特征识别、医学诊断、证券投资分析、DNA序列测序、语音和手写识别、机器人运用等诸多领域,且应用的领域愈来愈普遍。机器学习
入门学习机器学习,只须要掌握下面这些能力:编程语言
对于入门来讲,不必定要具有了全部的数学理论基础才能开始,不具有这些知识并不表明不能灵活操做各个机器学习库,只是有些算法的理解会更困难。这些基础理论在后续须要慢慢补上,它们关系到你在AI领域天花板的高度。而直接从实践入手,会更容易理解算法,对后续算法的深刻学习也有很大的帮助。
而想进阶成为专家,除了须要增强数学基础理论(高数、线性代数、统计学、几率论、信息论等数学基础)的学习外,还须要学习大数据相关的知识与技能(如:Hadoop、HBase、Spark、kafka、Flume、Sqoop、Storm等)。而后根据发展方向,有针对性的学习NLP、神经网络等内容,往更多更专业的领域深刻学习。
学习机器学习,须要分阶段按部就班学习,尽可能不要一会儿就深刻算法的推导中(除非你的数学理论很是扎实),不要试图掌握全部的相关数学知识再开始学习,不然很容易从入门到崩溃,从崩溃到放弃。
对于初学者,建议从这几方面来学习:
参考资料: