2.3 缺损值和一般统计量

    接下来,我们要计算出两种数据值:缺损值和一般统计量。   缺损值主要指的是,数据列中存在缺少或漏掉的数据项,比如 customer_master 中缺少了顾客的姓名或邮箱,transaction 中缺少了交易的数量或金额等等。缺损值的大小对后面的分析非常重要,应尽量让缺损值越小越好。那么,首先计算一下 join_data 中各个数据列的缺损值,代码如下: join_data.isnull(
相关文章
相关标签/搜索