项目学习01--用户画像

1.赛题解读 预测目标(中国移动信用解释) 2.数据探索分析(EDA) 2.1数据基本情况:缺失值,各字段数据类型、数值型字段的统计分布 年龄为0,可能是主办方对缺失值数据填充,年龄大于100可能是异常数据 2.2观察变量的密度曲线(观察特征分布,为特征工程做准备) 大部分的用户近六个月的消费值在200以内,左偏 个别的点可以被当作是异常值进行处理,避免过拟合,或者训练和测试不是同分布等情况 2.
相关文章
相关标签/搜索