基于互信息和左右信息熵的短语提取

1 互信息和信息熵的概念 2 算法流程 3 代码实现算法 1 互信息和信息熵的概念 1.1 互信息 互信息体现了两个变量之间的相互依赖程度。二元互信息是指两个事件相关性的量, 计算公式以下:blog image.png 互信息值越高, 代表X和Y相关性越高, 则X和Y 组成短语的可能性越大; 反之, 互信息值越低,X 和Y之间相关性越低, 则X 和Y之间存在短语边界的可能性越大。排序 公式中的X和
相关文章
相关标签/搜索