以前我写过一篇文章群体遗传分析分层校订,该选用多少个PCA?,里面提到能够经过EIGENSTRAT软件肯定显著的主成分,后续就能够将显著的主成分加入协变量中。c#
这篇文章主要是讲如何经过EIGENSTRAT软件肯定显著的主成分。ui
下载地址:https://data.broadinstitute.org/alkesgroup/EIGENSOFT/EIG-6.1.4.tar.gzcode
wget https://data.broadinstitute.org/alkesgroup/EIGENSOFT/EIG-6.1.4.tar.gz
blog
tar zxvf EIG-6.1.4.tar.gz
ci
能够用plink计算PCA,也能够用EIGENSTRAT。get
PLINK计算PCA比较简便,我的比较推荐PLINK。it
以前已经介绍过怎么用PLINK计算PCA了,这里就再也不赘述。io
下面讲一下怎么用EIGENSTRAT肯定多少个PCA被归入协变量中。table
用EIGENSTRAT计算获得后缀为.eval
的文件后,使用以下命令:class
/bin/twstats -t twtable -i pca.eval -o eigenvaltw.out
用PLINK计算的PCA获得后缀为.eigenval
的文件后,使用以下命令:
/bin/twstats -t twtable -i pca.eigenval -o eigenvaltw.out
假定生成的eigenvaltw.out以下:
这张图里前三个PCA的P值小于0.05,说明作关联分析的时候要把前三个PCA加入协变量中。