熵、联和熵与条件熵、交叉熵与相对熵是什么呢？详细解读这里有！

时间 2020-07-30

标签条件交叉相对什么详细解读这里繁體版

原文原文链接

熵是一个很常见的名词，在物理上有重要的评估意义，天然语言处理的预备知识中，熵做为信息论的基本和重点知识，在这里我来记录一下学习的总结，并以此与你们分享。html

一、熵

熵也被称为自信息，描述一个随机变量的不肯定性的数量。熵越大，代表不肯定性越大，所包含的信息量也越大，就说明很难去预测事件行为或者正确估值。
熵的公式定义：app

解答：机器学习

这里计算将相同几率的字符合并计算，结果代表什么呢？
结果说明传输一个字符平均只须要2.5个比特：学习

字符	a	b	c	d	e	f
编码	100	00	101	01	110	111

联和熵描述一对随机变量平均所须要的信息量。公式定义：
测试

与之联系密切的条件熵指的是：给定X的状况下，Y的条件熵为：编码

将以上公式（1）化简能够获得 spa

熵的连锁规则.net

设计

相对熵简称KL差别或KL距离，衡量相同时间空间里两个几率分布相对差别的测度。3d

根据公式可知，当两个随机分布彻底相同时，即p=q,其相对熵为0。当两个随机分布差异增长，相对熵的指望值也增大。
相对熵与互信息的联系以下证实：

交叉熵就是机器学习中常常提到的一种熵的计算。它究竟是什么呢？

在设计模型q时候，目的是使交叉熵最小，这样模型的表现更好，从而使模型更接近最真实的几率分布

在设计语言模型，一般用困惑度（

因此，寻找困惑度最小的模型成为模型设计的任务，一般指的是模型对于测试数据的困惑度。

在信息论的熵部分，咱们学到了什么呢？开始说到，这是NLP基础，也是入门机器学习的重要理论部分。

学习以后的一些记录，发现这部分知识在其余方面常常说起到，殊不知其原理知识，所以作了一个简单的总结备忘，与尔共享！

更好的阅读体验请转至个人CSDN博客哦！

个人CSDN博客：熵、联和熵与条件熵、交叉熵与相对熵是什么呢？来这里有详细解读！