数据挖掘笔记-情感倾向点互信息算法

       点间互信息(PMI)主要用于计算词语间的语义类似度,基 本思想是统计两个词语在文本中同时出现的几率,若是几率越大,其相关性就越紧密,关联度越高。两个词语word1与word2的PMI值计算公式以下式所示为: P(word1&word2)表示两个词语word1与word2共同出现的几率,即word1与word2共同出现的文档数, P(word1)与P(word2)分别表示两个词语单独出
相关文章
相关标签/搜索