[斯坦福大学2014机器学习教程笔记]第四章-多元线性回归的多特征量状况下的假设形式

    在这节中,咱们将开始讨论一种新的线性回归的版本。这是一种更为有效的形式,这种形式适用于多个变量或者多特征量的状况。学习

    在咱们以前的学习中,咱们只有一个单一特征变量x(以下面例子中的房屋面积),咱们但愿用这个特征量来预测y(以下面例子中的房屋价格)。咱们的假设就为hθ(x)=θ01x。spa

    可是,咱们在不少时候咱们不只有房屋面积这一个特征来预测房屋价格,咱们还会有卧室的数量、楼层的数量和房子的年龄多个特征来预测房屋价格。blog

    咱们用变量x1、x2、x3、x4来表示这里的四个特征,用y来表示预测的输出变量。索引

  • 咱们用n来表示特征量的数目,如这里的n=4。
  • 咱们用m来表示样本的数量
  • 咱们用x(i)表示第i个训练样本的输入特征量。举个例子,这个例子中x(2)表示第2个训练样本的特征向量,因此x(2)表示的就是向量[1416,3,2,40](列向量)。在这个表示方法中,2至关于一个训练集的一个索引。
  • 咱们用xj(i)来表示第i个训练样本中第j个特征量的值。这个例子中x3(2)表示第2个训练样本的特征向量里面的第3个特征值,因此它的值为2。

    既然咱们有了多个特征量,那咱们的假设形式应该写成什么样呢?变量

  • 咱们以前的假设形式为:hθ(x)=θ01x。
  • 如今咱们的假设形式为:hθ(x)=θ01x12x23x34x4。假如咱们有n个特征量,那么假设形式就为:hθ(x)=θ01x12x23x3+……+θnxn

    接下来,咱们要简化上面写出的表达方式。为了分别咱们设x0=1(这意味着对于第i个样本都有x0(i)=1)。固然你也能够认为咱们定义了一个额外的第0个特征量。在此以前咱们有n个特征量(x1,x2,……xn),因为咱们另外定义了一个第0特征量,而且取值恒为1,因此如今有n+1个特征量。因此咱们如今的特征向量X=[x0,x1,x2,……xn](列向量),这是一个n+1维的向量。同时咱们还能够把全部的参数写成一个向量,θ=[θ0,θ1,θ2,……θn](列向量),这也是一个n+1维的向量。方法

  •     这时咱们的假设形式能够写成:hθ(x)=θ0x01x12x23x3+……+θnxn

     更巧妙的是,咱们能够将这个式子写成θTX(θ的转置乘以X)im

相关文章
相关标签/搜索