天猫双十一成交额是如何预测的

哈喽你们好,我是可乐
ide

双十二立刻就要来了,不由让人回想起双十一,今年你剁手了吗
spa

2020年淘宝双十一成交额4982亿,要知道2019年是2684亿,猛地一瞅,好家伙,图片3d

但总量愈来愈大的同时增加率却逐年下降呀,且今年的统计口径和历年都不同(后面会说统计口径的问题)。
orm

图片
其实早在2019年双十一前,网友们就开始讨论双十一数据造假的问题了,有网友对历年数据进行拟合而且成功预测19年的成交额,结果都高度吻合。
image.png
今天咱们主要是借着双十一成交额这个数据来聊一聊 时间序列分析的问题

时间序列,顾名思义,就是数据随时间变化blog

时间序列进行预测的关键,是肯定已有时间序列的变化模式,并假定这种模式会延续到将来图片

名词解释

时间序列:数据随时间变化的形式get

经济数据大多呈时间序列的形式,如历年淘宝双十一成交额数据分析

一个时间序列的变化一般能够由如下4种成分组成:it

  • 趋势:时间序列呈现的某种持续上升/降低的变化。趋势能够是线性的,也能够是非线性的。class

想要肯定一个时间序列是否包含趋势成分,可对数据进行回归分析,获得拟合的趋势线,并进行显著性检验,经过检验,则说明线性趋势显著

  • 季节性:时间序列在一年中出现的周期性波动就是季节性。

想要肯定一个时间序列是否包含季节性的成分,须要至少两年的数据,

  • 周期性:时间序列中呈现的围绕长期趋势的波浪或振荡式变更,周期性一般由经济环境的变化引发。

  • 随机性:除了趋势、季节性、周期性变更之外的某种随机的变更

作时间序列分析最关键的就是一个假设,假设如今的这种变化趋势会延续到将来

下面介绍几种时间序列预测的方法

平滑预测法

只含有随机成分,不存在趋势或季节性成分的可用该方法,平滑预测法包含简单平均法、移动平均法、指数平滑法,经过平滑就能够消除随机波动

简单平均法

以必定观察期的数据求得平均数,并以所求平均数为基础,预测将来时期的预测值。简易平均法是最简单的定量预测方法

以下图用简单平均法预测2020年淘宝双十一交易额

由于近期的数值远比远期的数值更有做用,所以这样预测的结果是不够准确的。image.png

移动平均法

移动平均法就是利用近期的数据来预测将来的方法,也能够细分红两种方法,简单移动平均法和加权移动平均法。

简单移动平均法是将最近期的数据平均后最为下一期的预测值

图片
能够用Excel来作
进入路径:数据——数据分析——移动平均
输入:输入数据源
间隔:指定使用几组数据来得出平均值,即公式中的n,移动个数。
输出:肯定输出区域以及图表

仍是双十一数据,能够取间隔为3和2时分别计算一下看看。

图片

须要注意的是:

  • 移动平均的项数不宜过大

  • 加大移动平均法的期数(即加大n值)会使平滑波动效果更好,但会使预测值对数据实际变更更不敏感

  • 移动平均法要由大量的过去数据的记录


关于用Excel进行时间序列分析的问题,以前我也写过一篇文章:

图片

Excel预测工做表


指数平滑法

指数平滑法是对观察值进行加权从而进行预测的一种方法,经过对不一样时间的观察值所赋予的权数不等,从而加大了近期观察值的权数,使预测值可以迅速反映市场实际的变化。

图片
Excel里也有指数平滑的方法
路径:数据——数据分析——指数平滑,注意这里填的是阻尼系数
图片

趋势序列预测

当序列存在明显的趋势时,就再也不适用上述方法了,应用趋势序列预测的方法。

线性趋势

呈现出增加/降低的线性变化趋势,有点回归分析那味儿了,能够用Excel里的趋势线来预测,选择线性趋势,勾上显示公式和R平方,代入线性公式,获得2020预测值。

图片

非线性趋势

其实这个淘宝双十一的数据咱们很明显地看出来它是呈指数递增的,那就在趋势线里选择指数,获得指数曲线的预测方程,代入公式预测2020年数据,能够看到偏差仍是挺大的。

图片
能够用二项式来预测,能够看到R方为0.9996,说明拟合效果不错,预测值和实际值的偏差并不大(怪不得你们总以为人家造假呢),比线性和指数都要好,把公式代入获得2020年预测值为3280, 阿里官方的统计口径是11.1日至11月11日0.30分累积3723亿,最终的成交金额为4982亿

这里有个统计口径的问题,以前几年的数据都是当天的成交额,而2020年则变成了11月1日~11日的累积成交额,再结合增加率看看,说明什么呢?你们心知肚明就行了哈。

图片行吧,那就以今年的4982亿来预测下2021年双十一成交额,那确定也是累计成交额,仍是用二项式来拟合,(拍脑壳)想出一个数字: 5217
就,拭目以待吧


明天见!

相关文章
相关标签/搜索