Follow me!百万奖金由你拿 | 精准资助数据探索(一)

以前已经有大神发过一个《智慧中国杯百万大奖赛解读》系列的文章,好多小白初学者表示文章好高大上,他们感受有点懵,记不住那么多的原语。那么有没有更加简便的方法呢,不须要记一堆原语,也不须要记各类各样的格式。算法

你们别着急,OpenFEA早就为菜鸟们考虑好了。OpenFEA的可视化分析模块,就采用可视化的图表操做方式,将原语操做简化为点击几下按钮便可完成数据的分析处理,让菜鸟迅速变成老鸟再也不是梦想。.net

下面让咱们跟随高人的脚步,向百万奖金发起冲击吧。Follow me!!!blog

1、数据介绍get

OpenFEA已经将上述数据存放到了OpenFEA在线试用环境的match/fund目录下,具体在www.openfea.cn下载专区里有介绍。数据分析

2、助学金数据分析it

关于大赛的介绍这里就很少说了,能够参看以前大神的文章智慧中国杯算法赛解读 | 精准资助数据探索(一),咱们直接上干货。可视化

一、加载助学金数据下载

由于原始数据没有列名,因此加参数with (header=-1)为各列自动填写列名。方法

二、修改字段名im

分别用id和money表示学生编号和资助金额(下图以id为例)。

三、分组统计

按照money字段进行分组统计,查看助学金共有几个档次。

四、绘制饼图

可视化展示助学金的分组状况。

3、一卡通数据

一、加载一卡通数据

二、修改字段名

分别用id、pos、address、catalog、time、cost、have表示学生编号、pos消费、消费地点、消费时间、消费金额、余额(下图以id为例)。

三、分组统计

按照id字段进行分组,而后按照cost字段进行最大值、最小值、平均值、中位数的计算。

四、再次进行分组统计

按照id字段进行分组,而后按照have字段进行最大值、最小值、平均值、中位数的计算。

五、关联表

将card_cost表和card_have表用index字段关联起来。

六、查看card_money表的简要统计信息

消费总额最高的是3万多,中位数是8903,单笔最大的消费是4407元,中位数是300,有人单笔最低是93元,看来此同窗属于土豪行列,出现的负数多是退款或误扣等,这个要结合业务知识去判断了,也能够做为噪音处理一下。

卡里保有金额的最大是4399元,中位数是316元,还比较符合对学生的印象。

相关文章
相关标签/搜索