Tinghua Data Mining 3

特征选择3d

男女身高blog


男女抽烟 先验分布io

熵 衡量系统的不肯定性im

属性的价值 下降了不肯定性 下降的幅度越高越好d3

主成分分析数据

旋转是的数据间的correlation消失掉db

Q是正交阵img

七长八短,长宽相关性很差,信息丢失了不少。标签

线性判别分析co

两种颜色投影重叠,分类问题就很尴尬,无法处理 PCA不考虑Label 是无监督的

有标签的数据用LDA、

降维的时候保留类的区分信息

可分性

迄今为止,都是二分类问题

相关文章
相关标签/搜索