深度学习的输入数据集为什么要做均值化处理

一直不明白,在处理一些输入数据的时候为什么要减去均值。今天看了斯坦福大学的cs231n深度学习课程,其中在激活函数一章讲到: Consider what happens when the input to a neuron is always positive... 根据求导的链式法则,w的局部梯度是X,当X全为正时,由反向传播传下来的梯度乘以X后不会改变方向,要么为正数要么为负数,也就是说w权重
相关文章
相关标签/搜索