《数据挖掘导论》学习笔记02 数据

  2.1 数据类型 数据挖掘研究常常是为了适应新的应用领域和新的数据类型的需要而展开的。   属性与度量 属性是对象的性质或特性,它因对象而异,或随时间变化。为了用一种明确定义的方式做到这一点,我们需要测量标度。   数据集的类型 数据集的一般特性:维度、稀疏性和分辨率。   2.2 数据质量 通常必须解决的数据质量问题包括存在噪声和离群点,数据遗漏,不一致或重复,数据有偏差,或者不能代表它应该
相关文章
相关标签/搜索