为了求得参数θ,也能够不用迭代的方法(好比梯度降低法对同一批数据一直迭代),能够采用标准方程法一次性就算出了θ,并且还不用feature scaling(若是feature很少的话,好比一万如下,用这种方法最好)。函数
标准方程法介绍:3d
(1)blog
这里面,X的第一列是人为添加的,为了方便运算的,都置为1,后面才是真正的特征。方法
(2)im
下面是样本对应的输出:数据
(3)img
设拟合函数为: h(x) = θ0 * x0 + θ1 * x1 .... + θn * xn ( 其中x0 = 1)co
(4)ps
采用均方偏差定好代价函数参数
最终结果 :
证实:
要使得J最小,则有J对θ的导数=0,则
证完。
补充:
若不可逆,则
1)多是有两列是线性相关的,那么就删除一个特征;
2)多是特征值过多,则删除一些特征值。