sigmoid 和 softmax,BCE与CE loss function

一句话概括 sigmoid 激活函数 二分类的激活函数 解决我是和不是的问题 对应二元交叉熵损失函数 softmax 激活函数 多分类的激活函数 解决我们中哪个是的问题 对应多元交叉熵损失函数 二分类推导 为什么用交叉商: 梯度下降的角度:从下面的推导过程可以看出来sigmoid对应的交叉商最后的梯度是一种残差。mse 是高斯分布的最大似然,二CE是多项式分布的最大似然。https://zhuan
相关文章
相关标签/搜索