小白自学——房价预测(五)

数据分析(二) 上一篇中连续变量影响房价的分布图中,我们可以注意到sqft_basement、yr_renovated都有存在很多为0的数据。 为了更好的分析数据,我们可以考虑构建新的二值特征分别用来表示是否有地下室、是否曾翻新过。 kc_train['basement_present'] = kc_train['sqft_basement'].apply(lambda x: 1 if x > 0
相关文章
相关标签/搜索