机器学习粗略调参

转载自:原文连接 学习速率(learning rate,η) 运用梯度降低算法进行优化时,权重的更新规则中,在梯度项前会乘以一个系数,这个系数就叫学习速率η。下面讨论在训练时选取η的策略。html 固定的学习速率。若是学习速率过小,则会使收敛过慢,若是学习速率太大,则会致使代价函数振荡,以下图所示。就下图来讲,一个比较好的策略是先将学习速率设置为0.25,而后在训练到第20个Epoch时,学习速率
相关文章
相关标签/搜索