学习RNN中产生的几个概念性疑问和解答

通常使用的损失函数——似然函数,为什么要加负对数取做负对数似然函数? (我以前一直说使用的是交叉熵,现在想想其实并不准确,从参数估计的角度来看,怎么也是似然函数对吧?) 原因主要两点: 如果假设条件是独立同分布,那么似然函数往往是连乘的形式,这样子求偏导数,不容易;通过取对数的形式将连乘变为求和。 概率值是小数,多个连乘的情况下,容易造成下溢 参考链接 负对数似然函数与交叉熵的关联是什么? 似然用
相关文章
相关标签/搜索