每一个部分由四节课组成,总共有16节课。那么,从这篇开始,咱们将连续对这门课作课程笔记,共16篇,但愿能对正在看这们课的童鞋有所帮助。下面开始第一节课的笔记:The Learning Problem。算法
什么是“学习”?学习就是人类经过观察、积累经验,掌握某项技能或能力。就好像咱们从小学习识别字母、认识汉字,就是学习的过程。而机器学习(Machine Learning),顾名思义,就是让机器(计算机)也能向人类同样,经过观察大量的数据和训练,发现事物规律,得到某种分析问题、解决问题的能力。编程
机器学习能够被定义为:Improving some performance measure with experence computed from data. 也就是机器从数据中总结经验,从数据中找出某种规律或者模型,并用它来解决实际问题。app
什么状况下会使用机器学习来解决问题呢?其实,目前机器学习的应用很是普遍,基本上任何场合都可以看到它的身影。其应用场合大体可概括为三个条件:机器学习
事物自己存在某种潜在规律函数
某些问题难以使用普通编程解决工具
有大量的数据样本可供使用学习
机器学习在咱们的衣、食、住、行、教育、娱乐等各个方面都有着普遍的应用,咱们的生活到处都离不开机器学习。好比,打开购物网站,网站就会给咱们自动推荐咱们可能会喜欢的商品;电影频道会根据用户的浏览记录和观影记录,向不一样用户推荐他们可能喜欢的电影等等,处处都有机器学习的影子。网站
本系列的课程对机器学习问题有一些基本的术语须要注意一下:人工智能
输入x3d
输出y
目标函数f,即最接近实际样本分布的规律
训练样本data
假设hypothesis,一个机器学习模型对应了不少不一样的hypothesis,经过演算法A,选择一个最佳的hypothesis对应的函数称为矩g,g能最好地表示事物的内在规律,也是咱们最终想要获得的模型表达式。
实际中,机器学习的流程图能够表示为:
对于理想的目标函数f,咱们是不知道的,咱们手上拿到的是一些训练样本D,假设是监督式学习,其中有输入x,也有输出y。机器学习的过程,就是根据先验知识选择模型,该模型对应的hypothesis set(用H表示),H中包含了许多不一样的hypothesis,经过演算法A,在训练样本D上进行训练,选择出一个最好的hypothes,对应的函数表达式g就是咱们最终要求的。通常状况下,g能最接近目标函数f,这样,机器学习的整个流程就完成了。
与机器学习相关的领域有:
数据挖掘(Data Mining)
人工智能(Artificial Intelligence)
统计(Statistics)
其实,机器学习与这三个领域是相通的,基本相似,但也不彻底同样。机器学习是这三个领域中的有力工具,而同时,这三个领域也是机器学习能够普遍应用的领域,总得来讲,他们之间没有十分明确的界线。
本节课主要介绍了什么是机器学习,什么样的场合下可使用机器学习解决问题,而后用流程图的形式展现了机器学习的整个过程,最后把机器学习和数据挖掘、人工智能、统计这三个领域作个比较。本节课的内容主要是概述性的东西,比较简单,因此笔记也相对比较简略。
这里附上林轩田(Hsuan-Tien Lin)关于这门课的主页:
http://www.csie.ntu.edu.tw/~htlin/
*注明:*
文章中全部的图片均来自台湾大学林轩田《机器学习基石》课程