R语言中的偏最小二乘PLS回归算法

时间 2020-05-22

标签语言最小二乘 pls 回归算法繁體版

原文原文链接

偏最小二乘回归：

我将围绕结构方程建模（SEM）技术进行一些咨询，以解决独特的业务问题。咱们试图识别客户对各类产品的偏好，传统的回归是不够的，由于数据集的高度份量以及变量的多重共线性。PLS是处理这些有问题的数据集的强大而有效的方法。code

主成分回归是咱们将要探索的一种选择，但在进行背景研究时，我发现PLS多是更好的选择。咱们将看看PLS回归和PLS路径分析。我不相信传统的扫描电镜在这一点上是有价值的，由于咱们没有良好的感受或理论来对潜在的结构作出假设。此外，因为数据集中的变量数量众多，咱们正在将SEM技术扩展到极限。Haenlein，M＆Kaplan，A.，2004年，“初步指南偏最小二乘分析”，Understanding Statistics，3（4），283-297中能够找到关于这个限制的有趣讨论。component

[1]“diesel”“turbo”“two.doors”“hatchback”“wheel.base”

[6]“length”“width”“height”“curb.weight”“eng.size”

[ 11]“马力”“峰值.rpm”“价格”“符号”“city.mpg”

[16]“ highway.mpg ”

这些数据有16个变量和30个观测值。它包含在plsdepot包中。blog

关于PLS回归的一个有趣的事情是你能够有多个响应变量，plsdepot能够适应这种类型的分析。在这种状况下，我只想分析一个Y变量，那就是价格。教程

该包的一个怪癖是你须要将预测变量和响应分开，即将响应变量列放在数据帧的末尾。要作到这一点，我只是运行这个优雅的代码，我找到了某处...ci

＃把变量价格（第13列）放在最后

pls1 $ x.scores X分数（T份量）

$ x.loads X-loadings

$ y.scores Y-scores（U-components）

$ y.loads Y-loadings

$ cor.xyt得分相关性

$ raw.wgs原始权重

$ mod.wgs修改权重

$ std.coefs标准系数

$ reg.coefs常规系数

$ R2 R平方

$ R2Xy解释Xy的方差T

$ y.pred y-预测

$ resid 残差

$ T2 T2经济系数

Q2第二季度交叉验证这个包中有不少，我强烈建议阅读优秀的教程来了解更多信息。rem

>＃相关图; 注意什么与价格高度相关get

plot每一个观测预测与实际

咱们将不得不继续查看不一样数量的组件以肯定最佳模型，并从实际角度查看潜在变量是否有意义。产品