公司分派了一个活,预测景区将来的一段时间销量,目的...html
一据说作预测,很兴奋,当时真的没有太考虑目的!老大也很高兴,说让我作一个景区将来天天的销量数据,供其余项目无限使用!机器学习
对本身说:“第一次作预测,先向外看当作熟的经验,不要瞎琢磨”学习
美团的技术博客:http://tech.meituan.com/mt-mlinaction-how-to-ml.htmlspa
机器学习:http://my.oschina.net/airship/blog/387006?fromerr=3CBkR8Jd.net
各类准备以后,以为景区预测须要使用:线性回归和时间序列。3d
最近7天、最近30天、去年同期销售额、各类预测数据与真实数据的差距(方差),最终产出了初版结果,准确率30%htm
经历打击以后,发现本身有些偏离轨道,回到初始需求,按照产品给的模型一步一步开发。下面是模型图:blog
看不清也没有关系,预测的结果很不理想,由于很复杂&计算成本高,惟一佩服本身的是居然开发出来了,准确率:50%ip
经历了上面的轮番打击,本身日夜加班三周居然没有出结果,很沮丧,准确率若是不到50%预测就没有意义了!不如不预测,为何预测的还不如不预测的感知的准确?开发
因而盯着屏幕,看趋势,发现每周的数据很相近,总结规律:周+节假日,时间平移便可。因而总结中国的节假日,近期平移上周的数据,远期平移去年的数据,结果平均准确率:80% 泪奔了!
总结:不必上来就时间序列、线性回归、搞机器学习啥的,不如看看趋势图,虽然看起来很low,可简单&实用!
惟一值得分享的是节假日的数据表,很费时间,不过特定场合很实用: