《数据仓库与数据挖掘教程》ch02数据仓库原理 章节整理

数据仓库原理 多数据源问题 多数据源 数据仓库和数据挖掘的数据通常来自多种数据库或计算机应用系统或数据文件、web页面 多数据源在集成的问题 数据不一致:数据的不一致性主要指数据之间的矛盾性和不相容性。如职务升迁了,但工资数据却没有改变 属性差异:性别属性有的取“男”/“女”,长度为2;有的取“1”/“0”,长度为1 数据重复:数据源中存在两条或多条完全相同的记录,或者同一个数据冗余地存在于多个数
相关文章
相关标签/搜索