流量预测中的数据分布问题

我们知道机器学习领域中,投入模型的数据具有一个好的数学分布(主要是高斯分布)无论是对于数据的清洗预处理还是对于模型的学习都有着非常大的作用。 但是现实问题中的数据一般不是高斯分布的,所以怎样将偏态分布的数据转换为正态分布的数据就很值得研究了。 今天就结合我最近遇到的一个问题讲一下log1p函数及其变形。 问题 最近在做流量预测的时候,整理完训练集的数据发现长这样: 也可以理解,毕竟不管是网页流量还
相关文章
相关标签/搜索