神经网络训练的一些建议(方差和偏差的问题:正则化)

参数和超参数 算法中的learning rate a(学习率)、iterations(梯度下降法循环的数量)、L(隐藏层数目)、n(隐藏层单元数目)、choice of activation function(激活函数的选择)都需要你来设置,这些数字实际上控制了最后的参数W和b的值,所以它们被称作超参数。 实际上深度学习有很多不同的超参数,之后我们也会介绍一些其他的超参数,如momentum、mi
相关文章
相关标签/搜索