数据质量管理

阿里做了十年数仓也才打通整个数据质量管理,不是一个两个数仓的人说要管质量就能管的了的。。。。方方面面都得考虑 数据质量控制环节 1 数据生产环节 业务开发数仓说不上话,现有业务后有数仓,起初可能考虑不到,业务变化了等 2 采集同步阶段 尽量统一标准,控制好边界 3 数据模型设计 维度退化可能造成数据不一致 =>存好历史状态,保证元数据字典完整,尽早计算下面就不会各算各的了 4 ETL开发 & 指标
相关文章
相关标签/搜索