GWAS群体分层 (Population stratification):利用plink对基因型进行PCA

1、为何要作祖先成分的PCA?bash

GWAS研究时常常碰到群体分层的现象,即该群体的祖先来源多样性,咱们知道的,不一样群体SNP频率不同,致使后面作关联分析的时候可能出现假阳性位点(不必定是显著信号位点与该表型有关,多是与群体SNP频率差别有关),所以咱们须要在关联分析前对该群体作PCA分析,随后将PCA结果做为协变量加入关联分析中。spa

 

2、怎么作PCA?blog

简单一个“--pca”参数便可class

plink --bfile myfile --pca 10 --out myfile_pca #这里只取前10个PCA结果,若是想取其余数值,请自行设置

  

跑完之后,会生成三个文件,分别是myfile_pca.eigenval,myfile_pca.eigenvec,myfile_pca.log。变量

其中,myfile_pca.eigenvec即为咱们所需的PCA文件,大概长得以下:file

FID_1 IID_1 0.00126761 0.00331304 -0.0105174 0.000679466 -0.0179362 0.00672081 0.000979499 -0.00752795 0.00626333 -0.00849531di

FID_1 IID_2 -0.000272769 -0.00328075 -0.00380584 -0.00787082 0.00896386 -0.00325664 0.00241414 0.00612508 -0.000788917 -0.00188887文件

 

3、生成的PCA结果怎么用?co

这个至关简单,直接把这堆数值加入covar文件中,只有控制了这些祖先成分的变量,才能最大限度的找到真实的信号。background

相关文章
相关标签/搜索