公式

1. 计算词境相似度 假如d1表示cat,d2表示dog,x1,x2,…,xn分别表示句子中单词正则化后出现的概率。 2. TF-IDF加权 TF: 词频 IDF:反文档频率 包含词条的文档越少,IDF越大,则说明词条具有很好的类别区分能力。 TF-IDF的计算: TF*IDF 3. 熵函数 条件熵函数 eg. 4. 互信息 互信息的计算:KL发散 5. 极大似然估计 对事件发生的次数归一化 当c
相关文章
相关标签/搜索