回归分析相关函数:html
- help(lm):查看lm函数的帮助信息
- lm(y~x):预测y和x的线性关系,lm的使用很灵活,具体能够参考帮助文档。lm(y~1+x)/lm(y~x)均表示y=a+bx有截距形式的线性模型,lm(y~x-1)/lm(y~x+0)/lm(y~0+x)表明的是算出来的模型要过原点
- summary(lm(y~x)):查看lm函数预测出来的线性模型y~x的相关信息,提取模型汇总资料
- coef(z):返回模型的系数
- formula(lm(y~x+1)):提取模型的公式
- deviance(z):计算残差平方和,也就是方差
- residuals(z):显示每一项样本的残差
- plot(z):绘制模型图,要把R命令窗口最大化才能看到图形,按enter查看下一个图形,要所有看完全部图形,不然无法回到命令行
- print(z):简单打印模型信息
- anova(z):计算方差分析表
- predict(z,data.frame(x=3)):经过模型z预测数据3的值
回归分析注意点:函数
- 回归问题擅长于内推插值,而不擅长于外推概括,在使用回归模型作预测时要注意x适用的取值范围。好比说身高,若是不在x的取值范围内,就不能预测了。
- 哑变量/虚拟变量:哑变量 虚拟变量 线性回归
回归分析的简单步骤:命令行
#创建数据:身高-体重
x=c(171,175,159,155,152,158,154,164,168,166,159,164)
y=c(57,64,41,38,35,44,41,51,57,49,47,46)
#创建线性模型
z=lm(y~x)
#提取模型公式
formula(z)
#绘制模型
plot(z)
遗留问题: 逐步回归,step方法等,在ML02e.mp4有涉及到code
回归分析预测法orm