数据预处理03_ 数据集成

数据集成 数据集成就是将多个数据源中的数据合并,存放在一个一致的数据存储中:如存放在数据仓库中。这些数据源可能包括多个数据库、数据立方体或一般文件。 1.实体识别问题: 实体识别问题就是要合理匹配来自多个信息源的等价实体。 例如:如何确信一个数据库中的customer_id和另一个数据库中的cust_number指的是相同的属性?每个属性的元数据包括名字、含义、数据类型和属性的允许取值范围,以及处
相关文章
相关标签/搜索