文本挖掘之详细总体的流程

一、分词算法 二、特征权重的计算网络 三、模型的选择ide (1)向量空间模型与布尔模型 spa (2)几率模型blog 四、特征选择文档 IG(特征选择),DF(文档频率),IF-IDF,ECE(指望交叉熵),X方,MI(文档互信息),WET(文档证据权重),OI,CC(相关系数)等经常使用的特征选择神经网络 在我前面的文章都有提到im 五、特征抽取d3 LDA(线性特征抽取),PCA(主成分分
相关文章
相关标签/搜索