数据分析小案例(三):调查问卷(python)

数据分析小案例,python实现第二弹~~
python

第一弹戳这里:数据分析小案例(一):商业街抽奖(python)微信

第二弹戳这里:数据分析小案例(二):面包是否是变轻了(python)机器学习


  • 案件回顾学习

传统吉祥物仍是萌系美少女url

  1. 商业街想设计一个吉祥物作宣传
    spa

  2. 对商业街店主和顾客发放调查问卷
    .net

  3. 调查问卷的问题中有对吉祥物的偏好调查。也有对商业街的魅力调查,选项包括:活动,促销,商品齐全和服务态度好。(问题:店主和顾客对这些问题的回答是否有区别?从调查问卷中能够得到怎样的运营建议?)设计

  • 数据导入与列联表3d

将数据存储为csv格式,导入python。而且计算顾客和店主对商业街魅力的支持状况,生成列联表code

import pandas as pd

#导入数据

survey = pd.read_csv('survey.csv', encoding = 'utf-8')

#计算顾客和店主对商业街魅力的支持状况

su1 = pd.DataFrame({'顾客':survey[survey.立场=='顾客'].回答6.value_counts()})

su2 = pd.DataFrame({'店主':survey[survey.立场=='店主'].回答6.value_counts()})

#合并数据框,生成列联表

survey2 = pd.concat([su1,su2],axis=1)

survey2


为了使观察更直观,下面绘制关于列联表的堆积柱状图

import matplotlib.pyplot as plt

from pylab import *  

mpl.rcParams['font.sans-serif'] = ['SimHei']  

survey2.T.plot(kind='bar', stacked=True, color=['black','gold','red','green'], grid=False)

plt.show()

从图中可直观看出,店主们比较重视商品是否齐全,顾客们更关注的是实惠。店主们对活动方面花了很多心思,但顾客们兴趣不大,反而更注重店家的服务态度。而且,35名顾客对商业街对服务表示满意,而店主中选择服务态度好的人数只有9名,必定程度上说明店主对本身的服务态度缺少自信。

虽然能够从图中分析出一些结论,但为了客观的说明顾客与店主的意见是否存在显著误差,要进行独立性检验。


  • 独立性检验(卡方检验)

  1. 零假设    店主与顾客的回答是独立的,即无显著不一样

  2. 备择假设    店主与顾客的回答意见受各自立场影响,即意见不一样

  3. 几率不足显著性水平(5%)    否认零假设,即顾客与店主的意见是否存在显著误差

  4. 几率等于或超过显著性水平(5%)    保留零假设,即顾客与店主的意见不受各自立场影响

from scipy.stats import chi2_contingency

chi2_contingency(survey2)

 
  

结果为:

(55.488971138570164, 5.3999746517395078e-12, 3, array([[ 25.36945813,  24.63054187],        [ 30.44334975,  29.55665025],        [ 22.32512315,  21.67487685],        [ 24.86206897,  24.13793103]]))

其中,第一个值表明卡方值,第二个值表明pvalue,即几率,第三个值表明自由度。这里几率值几乎等于零,显然不足5%,所以,店主与顾客对商业街的期待有所不一样


接下来分析顾客和店主对吉祥物的选择上是否有分歧。

su11 = pd.DataFrame({'顾客':survey[survey.立场=='顾客'].回答7.value_counts()})

su22 = pd.DataFrame({'店主':survey[survey.立场=='店主'].回答7.value_counts()})

survey3 = pd.concat([su11.T,su22.T],axis=0)

survey3

明显,顾客和店主的意见有分歧。没填答案的顾客太多,且几乎全部店主都选择了萌系美少女,选传统吉祥物的只有3人,数据分析中,存在不足5的频数,要尽可能避免使用卡方检验。顾客回答两边基本同样多,且不少人没有填答案,证实顾客对这个不感兴趣。结合回答6的分析,顾客更期待的是促销。所以,与其设计吉祥物,不如搞一些打折促销的活动


  • 几个小概念

独立性检验:分析列联表2个属性之间是否存在关联性的方法。首先提出零假设,“两个属性相互独立”,即不具备关联性。若是几率不足5%,则抛弃零假设,选取备择假设,即“2个属性不相互独立”。若是几率大于等于5%,保留零假设。


后台回复“面包”,可得到本例中数据


机器学习养成记

搜索添加微信公众号:chenchenwings

长按图片,识别二维码,关注咱们。

如需转载,请在开篇显著位置注明做者和出处,并在文末放置机器学习养成记二维码和添加原文连接。


快来关注咱们吧!

本文分享自微信公众号 - 机器学习养成记(chenchenwings)。
若有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一块儿分享。

相关文章
相关标签/搜索