为何分类问题使用交叉熵损失函数?

理由一: KL散度:衡量两个几率分布的差别 D ( P ∣ ∣ Q ) = H ( P , Q ) − H ( P ) D(P || Q) = H(P,Q)-H(P) D(P∣∣Q)=H(P,Q)−H(P) 其中, H ( P , Q ) = − ∑ i P ( i ) l o g Q ( i ) H(P,Q) =-\sum_iP(i)log Q(i) H(P,Q)=−∑i​P(i)logQ(i)
相关文章
相关标签/搜索