Python数据分析学习笔记(6)数据规约实战--以主成分分析PCA为例

一、相关理论: 1、数据规约:产生更小且保持数据完整性的新数据集。意义在于降低无效、错误数据;降低存储成本;少量且具有代表性的数据大幅加快,主要分为以下两类: ①属性规约:属性合并或删除无关维,目标是寻找最小子集使子集概率分布尽可能与原来相同。     常用方法: (1)合并属性 将就属性合并为新属性 {A1,A2,A3,B1,B2,C}——{A,B,C} (2)逐步向前选择 从空集开始,逐个加入
相关文章
相关标签/搜索