吴恩达 神经网络和深度学习 第三周浅层神经网络

单个样本                                                                                                                   多个样本 激活函数 tanh 比sigmle 好,是因为数据平均值为0. 但是数据太大或者太小,在激活函数对应的斜率为0,梯度下降很难,梯度消失。 relu 是默
相关文章
相关标签/搜索