时间特征正弦化

时间特征.net

 

https://blog.csdn.net/haolexiao/article/details/85003454blog

这几天对于时间序列的预测,须要时间这一特征值,月份,星期等等。对于这些时间序列特征须要怎么去刻画和表示嗯?ci

 

one-hot方法io

一个直观想到的方法就是one-hot法,可是仔细考虑一下,one-hot真的适合表示时间序列吗?class

one-hot适用于的特征应该是分类特征,并且不一样类别之间的距离是没有差异的,好比红黄蓝三种颜色,汉字等等用one-hot表示是很好的。可是对于时间序列,5点和6点跟18点之间的距离明显是不一样的,因此用one-hot来度量的话,会损失很是多的信息。变量

数字表示方法

那么第二种能想到的方法就是用数字去表示,好比1表明1点,4表明4点等等,可是面临的一个问题就是23点明明和0点距离很近,可是用这种方法会致使23点和0点距离太远,形成一些偏差。error

形成上述偏差的因素在于时间序列有周期性,好比一天的24小时,一周的7天等等,那么咱们将其作一个转换,将其转换成周期变量便可dict

变量周期变量周期(cos(\frac{2\pi 变量}{周期}), sin(\frac{2\pi 变量}{周期}))di

(cos( 

周期

2π变量

​ 

 ),sin( 

周期

2π变量

​ 

 ))

 

如上所示,将一个时间变量变成一个二维平面圆周上的点。这样就能解决周期性因素。

 

参考文献:

 

Top 6 errors novice machine learning engineers make

Use of circular predictors in linear regression

相关文章
相关标签/搜索