Machine Learning:Computing Parameters Analytically

Normal Equation 梯度下降提供了一种最小化J的方法。现在我们要讨论第二种方法,这是一种显式地执行最小化而不借助迭代的算法。 在正规方程中,我们将通过明确地针对J取导数并将其置为0,这使我们无需迭代即可找到最佳θ θ = ( X T X ) − 1 X T y θ=(X^{T}X)^{-1}X^{T}y θ=(XTX)−1XTy 正规方程不需要进行特征缩放 梯度下降和正规方程的比较 梯
相关文章
相关标签/搜索