数据仓库ETL工具——清洗和规范化(二)

过滤器及其度量 在数据体系中,总会有一些数据看起来没什么问题,一旦联系了上下文或者和其它数据放在一起就会发现数据存在问题,我们称这样的数据为异常数据。 在监测数据异常时,通常采用一下方式: 数据采样:对有问题的列进行分组,计算该表的行数,可以使用数据评估工具 约束类型:把各种不同类型的数据质量检查分为四大类型     √ 列属性约束:保证由源系统输入的数据包含系统的期望值,列属性约束检查的过滤器包
相关文章
相关标签/搜索