时间特征.net
https://blog.csdn.net/haolexiao/article/details/85003454blog
这几天对于时间序列的预测,须要时间这一特征值,月份,星期等等。对于这些时间序列特征须要怎么去刻画和表示嗯?ci
one-hot方法io
一个直观想到的方法就是one-hot法,可是仔细考虑一下,one-hot真的适合表示时间序列吗?class
one-hot适用于的特征应该是分类特征,并且不一样类别之间的距离是没有差异的,好比红黄蓝三种颜色,汉字等等用one-hot表示是很好的。可是对于时间序列,5点和6点跟18点之间的距离明显是不一样的,因此用one-hot来度量的话,会损失很是多的信息。变量
数字表示方法
那么第二种能想到的方法就是用数字去表示,好比1表明1点,4表明4点等等,可是面临的一个问题就是23点明明和0点距离很近,可是用这种方法会致使23点和0点距离太远,形成一些偏差。error
形成上述偏差的因素在于时间序列有周期性,好比一天的24小时,一周的7天等等,那么咱们将其作一个转换,将其转换成周期变量便可dict
变量周期变量周期(cos(\frac{2\pi 变量}{周期}), sin(\frac{2\pi 变量}{周期}))di
(cos(
周期
2π变量
),sin(
周期
2π变量
))
如上所示,将一个时间变量变成一个二维平面圆周上的点。这样就能解决周期性因素。
参考文献:
Top 6 errors novice machine learning engineers make
Use of circular predictors in linear regression