数据治理中 PyODPS 的正确使用方式

数据治理中 PyODPS 的正确使用方式 概述:表饱和度(字段是否为空)、字段阈值(数值类字段取值是否超出有效边界)是评估数据质量的关键指标,因为是单表内字段级别的校验和统计,而且几乎涉及全部表,范围大、逻辑简单、重复性强,结合 Python 开发效率高的特色,不少数据工程师会使用 PyODPS 进行相关功能的开发。本文基于 PyODPS 分别使用 3 种方式实现了“饱和度统计”功能,展现了它们的
相关文章
相关标签/搜索