面试问题零散整理(持续更新...)

1、为什么要做数据归一化,在梯度下降时有什么好处? 规避不同特征的数值大少带来的差异影响。 不做归一化的话,每一个特征所对应的的数据规模是不一样的。那么在求导数的时候,求得的很可能会导数比较大(比较小),最终即使乘以学习率后的步长比较大,导致整体不收敛。或者要进行多次迭代 2、梯度下降法和随机梯度下降法的区别? 梯度下降时,每个样本都会参与梯度的计算,那么在大样本情况下,提低下降的计算量将非常大;
相关文章
相关标签/搜索