根据小结1,用复赛数据对艺人分类为高播放量
(前23名)
艺人和低播放量艺人:
以08均值最高的艺人1b322374de83520bf45aa8928e18e70a为研究对象
选择七、8月画出时序图,除了7月初(7月7日)前,以后基本是平稳的。
按每周7天计算每个月平均播放量以下,能够发现这个分布规律与工做节假日规律相关
根据以前金陵书生提供的听歌年龄分布,大概在25到31岁所占比重最大,这类人大部分是上班族,所以每日听歌习惯就是和上班习惯挂钩,符合以下上班族规律:
周1,2好好工做精神饱满
周三、4疲劳成极写不进去
周5快要节假再恢复精神工做一点
周六、7逛街玩耍休息Hi起来
根据上图,因为大部分人听歌是用来放松的,也就是说最疲劳的时候(周三)最须要放松,此时听歌人数剧增,而周六、7节假日相对放松活动选择不少,听歌人数反而很少。这个就是上个小结观察出来的每日用户人数的周期规律。而至于人均点播量规律,这个周期性不强,主要在因而否是粉丝用户。由此能够按照工做日和节假日来区分,很明显七、8月每月都是节假日要比工做日低一些:
接下来,画出3月到8月每月的工做日和节假日对比图,能够发现每月工做日之间节假日的差值是不一样的,好比3月的工做日和节假日基本持平,四、五、6月基本一致,七、8月基本一致,这是为何?
分析:
画出它从3到8月时序图以下,发现3月上升,四、五、6月基本平稳,6月末陡升,七、8月在新略升高的地方平稳,整体趋势在七、8月后有升高一个小台阶。按照常理节假日老是比工做日高,可是当某个月(3月)是攀升阶段(点播量上升),则
节假日
的播放量可能会大于等于
工做日,而当某个月(四、7月)出现剧增现象且数值还不算很大,此时单个剧增并无影响工做日大于节假日。
- 正例:用排名第3的艺人2dc8d3a917b12e65d4695e2277dd4943对应的图表验证以上分析,分别画出时序图和每个月工做日、节假日平均播放量:
从图中看出每一个
工做日的播放量都小于节假日,其中5月最明显,而6月工做日节假日基本一致
分析时序图发现,三、4月在攀升,5月有陡升,且值很是大,6月开始降低,降到月末,7月缓慢升,8月缓慢升。由于每月基本都在攀升,所以节假日大于工做日,
而6月有降低工做日节假日基本一致了。
- 反例: 用排名第23的艺人9ff7ca7b2c9e53902ac956da5cb5bcda对应的图表验证以上分析,分别画出时序图和每个月工做日、节假日平均播放量:
从图中看出每一个工做日的播放量都小于节假日,其中4月最明显,而6月工做日节假日基本一致
从时序图看出三、4月在攀升,且4月出现陡升值,可是月末下降,5月攀升,六、七、8各自平稳
再看它的月按周统计播放量:发现反常尤为是在七、8月平稳时依然是周日最高,这有多是歌手的音乐适合周末听,好比旅行听的豪放一点的歌。考虑从新对歌手按工做日和节假日比例进行分类。
出现反例,此时有必要从新考虑对艺人分类,分类方式按照工做日和节假日规律进行:在算法平台使用k均值聚类对100个艺人6个月工做日、节假日均值以及比例数据(表:ly_weeks_percent)进行分类,结果以下,基本是对半分类。其中聚类1index=0;聚类2index=1.
这个第二类就是明显的值聚在了一块儿!(53个数据)
聚类后并无用上。