CS231n lecture6 Note

训练神经网络 1.激活函数:使用relu作为激活函数,同时要小心设置学习率。学习率不能设置得太大,不然会导致梯度更新之后的权值数值变得很大,从而使得W和X加权求和之后的数值小于0,则所有的激活神经元都会变成dead neuron,dead neuron指的是当前神经元节点的输出激活值为0,并不代表最后的损失函数值为0,即损失函数对于当前层的激活值偏导数不为0(upstream gradient),
相关文章
相关标签/搜索