R语言编程代写中的prophet预测时间序列数据模型

 原文连接:http://tecdat.cn/?p=7335

 

本文 将针对R进行的几回建模练习的结果,以魁北克数据为依据,分为13年的训练和1年的测试。prophet与基本线性模型(lm),通常加性模型(gam)和随机森林(randomForest)进行了比较。微信

首先,设置一些选项,加载一些库,并更改工做目录。dom


读取魁北克的出生文件,创建一个data.table 。建立培训和测试data.tables-使用前13年的每日数据进行培训,并使用第14年进行测试。函数


定义两个小函数来计算 均方根偏差(rmse)和平均绝对百分比偏差(mape),以评估预测模型的性能。越低越好。post


如今开始拟合基本的lm线性模型。第一个回归整很多天期(ds)的三次样条上的日出生(y)以捕获趋势。根据训练和测试数据计算rmse和mape。 性能


接下来运行一个星期几的每日出生率模型,以捕获一周内的季节性。在性能指标上,该模型彷佛比第一个模型好,这代表一周中天天都有重要的季节性。测试


第三个模型基于月建立一个因子来处理每个月的季节。这种季节性彷佛不像一周中的一天那么强烈。大数据


最后,运行一个包含上述全部三个变量的lm模型。请注意,预测的均方根较低的rmse和mape。ui

 

 

如今,使用gam程序包运行相似的3变量通用加性模型。绝不奇怪,训练和测试的均方根值和mape与最终的lm模型至关。url

 

 

使用类似的趋势和季节性属性拟合randomForest ML模型。请注意,火车和测试性能之间的差别较大,代表火车数据过拟合。spa

 

 

最后将数据划分为训练并进行测试以适合先知并拟合其模型

 

在这一点上,让咱们看一下上面安装的各类lm模型的预测-第一个趋势,而后是星期几,最后是一个月。

 


 


 


接下来,绘制 模型的组成部分,看起来与上图很是类似- 使用的是一年中的日期而不是月份。



最后,使用测试数据比较3属性lm模型,gam模型,先知模型和随机森林模型。在每一个面板中,灰色表示实际值,而颜色表示模型预测。lm,gam和先知的表现类似,而随机森林滞后。

 


利用这些特定的数据,先知,lm和gam模型的测试预测很是类似,而且优于randomForest。 

若是您有任何疑问,请在下面发表评论。   

大数据部落 -中国专业的第三方数据服务提供商,提供定制化的一站式数据挖掘和统计分析咨询服务

统计分析和数据挖掘咨询服务:y0.cn/teradat(咨询服务请联系官网客服

点击这里给我发消息QQ:3025393450

 

​QQ交流群:186388004 

【服务场景】  

科研项目; 公司项目外包;线上线下一对一培训;数据爬虫采集;学术研究;报告撰写;市场调查。

【大数据部落】提供定制化的一站式数据挖掘和统计分析咨询

欢迎选修咱们的R语言数据分析挖掘必知必会课程!

 

 
欢迎关注 微信公众号,了解更多数据干货资讯!
 
相关文章
相关标签/搜索