多重共线性

  • 多重共线性
当回归模型中两个或者两个以上的自变量彼此相关时,则称为回归模型中存在多重共线性
会致使模型参数的置信区间过大,使单个系数解释起来困难

  • vif() 
能够使用VIF(Variance Inflation Factor,方差膨胀因子)进行检测。VIF的平方根表示变量回归参数的置信区间能膨胀为与模型无关的预测变量的程度(所以而得名)。car包中的vif()函数提供VIF值,通常原则下    > 2代表存在 多重共线性问题
代码以下
> library(car)
> vif(fit)
Population Illiteracy     Income      Frost   #若是值大于10,则通常存在严重的多重共线性问题
  1.245282   2.165848   1.345822   2.082547 
> sqrt(vif(fit)) > 2 # problem?
Population Illiteracy     Income      Frost   #结果代表不存在多重共线性问题
     FALSE      FALSE      FALSE      FALSE

相关文章
相关标签/搜索