人工神经网络中为什么ReLu要好过于tanh和sigmoid function？

时间 2021-07-12

标签人工神经网络 **函数繁體版

原文原文链接

先看sigmoid、tanh和RelU的函数图：第一，采用sigmoid等函数，算**函数时（指数运算），计算量大，反向传播求误差梯度时，求导涉及除法和指数运算，计算量相对大，而采用Relu**函数，整个过程的计算量节省很多。第二，对于深层网络，sigmoid函数反向传播时，很容易就会出现梯度消失的情况（在sigmoid接近饱和区时，变换太缓慢，导数趋于0，这种情况会造成信息丢失），这种现

>>阅读原文<<