机器学习-第一周

机器学习-第一周

这是机器学习的第一周课程,涉及到的内容较少,主要是认识一下什么是机器学习以及机器学习两个主要的分类:有监督学习和无监督学习。另外,经过一个最基础的线性回归模型来介绍机器学习中的一些相关的概念。算法

本周内容思惟导图

第一周内容思惟导图

Introduce

什么是机器学习?

A computer program is said to learn from experience E with respect to some task T and some performance measure P, if its performance on T,as measured by P,if its peformance on T,as measured by P,improves with experience E.——Tom Mitchell(1998)机器学习

这是Tom Mitchell在1998年给出的较为正式的关于“机器学习”这个概念的定义(这个定义好押韵啊)。函数

机器学习在咱们如今的生活中已经很常见,即便你本身可能尚未意识到。好比,苹果的Siri,微软的Contana,讯飞的语音识别,淘宝、京东等平台的推荐系统等等,都是机器学习在现实生活中的实际应用。咱们能够将机器学习简单理解为:研究如何使计算机具有必定学习能力的领域。学习

监督学习&无监督学习

监督学习和无监督学习是机器学习算法的两种不一样类型。orm

监督学习的基本思想是:咱们有一些训练样本,而且这些训练样本都具备对应的标签或者“正确答案”,使用这些训练样本进行模型训练,而后将未知的数据做为模型的输入,从而获得预测的标签或者“正确答案”。监督学习最多见的两类是回归问题和分类问题。回归问题获得的模型输出是连续的,而分类问题获得的模型输出是离散的。ip

无监督学习的基本思想是:咱们有一些训练样本,可是,这些样本并无对应的标签,或者都具备相同的标签,机器学习算法须要在这种状况下本身找出数据中具备的某种结构,从而达到学习的目的。好比聚类算法。get

简单通俗的说,监督学习是训练集有标签的学习算法,无监督学习是训练集没有标签的学习算法。监督学习是咱们教计算机如何去学习,经过告诉它对应的样本对应的答案。无监督学习须要机器本身从样本中学习,分析数据中存在的关联。标签是区分监督学习和无监督学习的一个主要标志。it

Linear Regression with One Variable

模型表示

监督学习的通常模型表示以下图:io

咱们将训练集做为学习算法的输入,而后学习算法能够从这些训练集中学习得出某种模型(获得假设函数的参数),再将未知数据做为模型的输入数据,从而获得模型求出的结果,这个结果就是机器学习算法经过学习而生成的结果。form

单变量线性回归模型

线性回归是咱们在高中的时候就接触过的知识,可是在当时也是只是了解,并无过多的认识。

维基百科对线性回归的定义以下:

在统计学中,线性回归(Linear regression)是利用称为线性回归方程的最小二乘函数对一个或多个自变量和因变量之间关系进行建模的一种回归分析。这种函数是一个或多个称为回归系数的模型参数的线性组合。只有一个自变量的状况称为简单回归,大于一个自变量状况的叫作多元回归。

在本周课程中,用于房价预测的单变量线性回归模型的函数表示就是一个一元一次函数,该函数中包含两个未知参数,也是须要求解的模型参数。

代价函数

代价函数能够用来评判一个模型对训练数据的拟合程度,特别是在线性回归模型中,它是一个关于代求解参数的函数。与线性回归模型中的假设函数不一样,假设函数是关于训练集中训练样本特征的函数。代价函数的表示以下图所示:

每组参数均可以获得某个具体的模型,可是通常的,模型预测出来的结果和实际结果都存在必定的偏差,将全部的差值的平方累加起来,再进行一些修正(1/2m),就是这组参数对应的代价。

梯度降低算法

梯度降低算法是一种用来求解模型参数得方法,其目标是最小化代价函数。梯度降低算法的定义以下图所示:

梯度降低算法

梯度降低算法每次迭代时,修改代价函数的参数(也就是Θ0和Θ1),从而但愿达到最小化代价函数的目的。

线性代数基础

很基础的线性代数知识,找本教材复习一下就能够。

相关文章
相关标签/搜索