主成分分析

        问题:假设在IR中咱们创建的文档-词项矩阵中,有两个词项为“learn”和“study”,在传统的向量空间模型中,认为二者独立。然而从语义的角度来说,二者是类似的,并且二者出现频率也相似,是否是能够合成为一个特征呢?session        《模型选择和规则化》谈到的特征选择的问题,就是要剔除的特征主要是和类标签无关的特征。好比“学生的名字”就和他的“成绩”无关,使用的是互信息
相关文章
相关标签/搜索