特征工程:特征生成,特征选择(三)

特征生成 特征工程中引入的新特征,须要验证它确实能提升预测得准确度,而不是加入一个无用的特征增长算法运算的复杂度。html 1. 时间戳处理 时间戳属性一般须要分离成多个维度好比年、月、日、小时、分钟、秒钟。可是在不少的应用中,大量的信息是不须要的。好比在一个监督系统中,尝试利用一个’位置+时间‘的函数预测一个城市的交通故障程度,这个实例中,大部分会受到误导只经过不一样的秒数去学习趋势,实际上是不
相关文章
相关标签/搜索