【机器学习】softmax函数总结

本来觉得softmax函数求导没啥难度的,结果本身写CNN的时候,梯度算的一直不对,查了半天才发现是由于softmax求导没求对。索性就开一篇Blog把softmax相关的都给记录一下。web softmax的定义 softmax函数以下: svg aLj=ezLj∑kezLk 其能够当作sigmoid函数在多元分布中的一个推广 至于softmax这个公式具体是怎么来的呢? 能够参照广义线性模型(
相关文章
相关标签/搜索