先作《统计学学习指导书》python
总结经验:统计学第六版能够分为三部分。第一部分是1到3章介绍了统计学两个分类之类描述统计数据,而5678章讲述了推断统计,其他张节介绍了数据统计的综合应用的一些方法,如单双因素法,等。。。到时候详述学习
关于1-4节主要讲述的内容:首先介绍了什么是统计学,统计学主要分为两部分描述统计和推断统计,介绍了数据的类型分类数据、顺序数据、数值数据、界面数据,时序数据,观测数据,实验数据等;此外介绍了一下相关量,变量,整体,样本,参数,统计量等与统计学息息相关的名词spa
而后讲述了统计学总要的数据如何搜集,首先要抽样肯定样本单元,具体的抽样有几率抽样和非几率抽样两类,经过简单抽样,分层抽样等一系列抽样方式后,进行数据搜集。数据搜集也有许多不一样的方式,注意数据搜集过程的偏差合理控制非抽样偏差,和抽样偏差提升搜集数据的精确度excel
数据搜集到了须要进行数据的处理加工,先进行预处理找出不符和要求的数据,而后对数据进行筛选排序,作个透视图看看数据的总体情况。而后对数据进行品质分析做图,实现数据的可视化处理。对不一样类型的数据使用不一样的数据视图进行表示,分类数据,顺序数据,数值数据依次提升了数据的层次,高层次的数据表示不适用底层次的。具体分类数据能够用条形图,帕累托图,饼图,环状图来表示,属性数据是累积频数分布图表示,数值数值能够用直方图,茎叶图,箱线图表示。直方图更直观适用与大批量数据,茎叶图适用于小批量数据,雷达图,气泡图散点图适用与多变量分析对象
对数据进行了可视化处理能宏观整体把握数据的状态分布,但咱们更须要详细的参数来具体刻画出数据的状态,这时就能够用数据的归纳性度量对数据进行描述。描述主要的三个方面:数据的集中程度,数据的离散程度,数据的形状偏度和峰度。集中度方面对于分类数据使用众数对数据进行描述,顺序数据能够用中位数,分位数,四分位数进行描述统计,数值类型的数据可使用平均数进行描述,注意数据类型的层次依次递增全部低层次的描述方式都适用于高层次的奥。在离散程度方面,咱们使用异众比来描述分类数据,有四分位差描述顺序数据,用极值,方差,经验值,切比雪夫不等式来描述数据的离散波动状况,对于不一样对象的离散数据描述使用离散系数进行描述。对于偏度分析0表示对称,大于1小于负1表示中度偏锋,越接近0越好,对于峰度是相对正态分布而言的,大于0尖峰,小于0扁平分布。排序
对象统计描述这部分是对数据进行预处理的关键,实现对数据的一个可视化的处理和整体描述,为之后的数据规律的观察,关系的拟合,假设检验奠基了基础,数据的统计描述是数据处理的关键一步,可使用python,matlab,excel、spass(本人大致会这些)等软件进行一下处理。基础
如发现错误欢迎留言指正,我也初学者,但愿弄清楚统计学中的逻辑思路。变量