一、数据分析总的来讲是:认清问题,解决问题正则表达式
二、实验,(星巴克咖啡店),实验控制组数据库
三、最优化策略;橡皮鸭和橡皮鱼优化
四、数据图形化;重要的散点图blog
五、假设检验,podphone手机明天或下个月会发布么?最可能何时发布。为每一个猜测加权,比较。ci
六、贝叶斯统计:蜥蜴流感数据分析
七、主观几率,石油投资,利用贝叶斯公式修正主管几率class
八、启发法,快省树决策树。变量
九、直方图,引入R语言软件
十、回归语法
经过预想加薪和实际加薪,算出回归方程,预测加薪,散点图大法再出。
只要能看出两个变量之间具备密切的关系,只要回归线有意义,你就能够充满信心地让软件计算各个系数。
十一、偏差
机会偏差=实际结果与模型预测结果之间的误差,又称为残差。
用均方根偏差(残差标准差)定量表示残差分布。
对于先后残差标准差差距较大能够将数据分为两段分析,分段不宜过多,不然无预测性。
R语言语句:
mylm <- lm(a~b,data) #回归表达式,~左边是因变量,右边是解释变量。详见R语言语法 summary(mylm)$coefficients #系数相关矩阵 summary(mylm)$sigma #残差标准差
十二、数据库
1三、整理数据,正则表达式