吴恩达机器学习笔记(4)——特征归一化和学习速率

1. Feature Normalization(Feature Scaling) 在梯度下降算法中,当θ在一个较小的范围内时会快速下降,而在较大的范围内则下降的较为缓慢,所以当变量的取值范围非常不均匀时,算法会低效率地振动到最优解。 所以说,我们可以将每个变量固定在一个大致相同的范围内来加快梯度下降的速率。例如将变量控制在: 这不是一个绝对的区间,只要我们大致将变量控制在相似的取值范围内,就能够
相关文章
相关标签/搜索