《深刻浅出数据分析》

一、数据分析总的来讲是:认清问题,解决问题正则表达式

       

二、实验,(星巴克咖啡店),实验控制组数据库

三、最优化策略;橡皮鸭和橡皮鱼优化

四、数据图形化;重要的散点图blog

五、假设检验,podphone手机明天或下个月会发布么?最可能何时发布。为每一个猜测加权,比较。ci

六、贝叶斯统计:蜥蜴流感数据分析

七、主观几率,石油投资,利用贝叶斯公式修正主管几率class

八、启发法,快省树决策树。变量

九、直方图,引入R语言软件

十、回归语法

  • 经过预想加薪和实际加薪,算出回归方程,预测加薪,散点图大法再出。

  • 只要能看出两个变量之间具备密切的关系,只要回归线有意义,你就能够充满信心地让软件计算各个系数。

十一、偏差

  • 机会偏差=实际结果与模型预测结果之间的误差,又称为残差。

  • 用均方根偏差(残差标准差)定量表示残差分布。

  • 对于先后残差标准差差距较大能够将数据分为两段分析,分段不宜过多,不然无预测性。

  • R语言语句:

    mylm <- lm(a~b,data) #回归表达式,~左边是因变量,右边是解释变量。详见R语言语法
    summary(mylm)$coefficients #系数相关矩阵
    summary(mylm)$sigma #残差标准差

十二、数据库

1三、整理数据,正则表达式

相关文章
相关标签/搜索