数据预处理与关联

数据预处理与关联 数据质量的含义 正确性 一致性 完整性 可靠性 在建立数据仓库的时候,由于各种原因造成里数据错误的不可避免性,所以便需要对数据进行预处理。 形式 数据清理 缺失值:忽略、人工填写、全局变量填充、属性平均值填充、最可能值填充、所有同类样本平均值填充。 噪声数据:分箱(按箱平均值、按箱中指、按箱边界)、聚类、回归、计算机和人工检查结合 数据集成 实体识别 属性冗余 数据重复 数据值冲
相关文章
相关标签/搜索