样本数据的真实值为何须要作中心化处理

假设下面的七个点是原始数据,优化 不作中心化须要用 一维的线性回归:y=kx+b 拟合获得红线,红线更容易被一些离群点影响,而产生误差,而绿线更稳定一些,由于绿线是经过固定点的直线 中心化以后,假设改成,y=kx ,只优化k就能够获得绿线。 当数据量很大时,这两条线会趋于平行,也就等价了,可是在小数据量的时候仍是作中心化的效果更好一点。 基于以上几点对样本数据作中心化效果会更好,那去中心化 到底该
相关文章
相关标签/搜索