一行命令学会全基因组关联分析(GWAS)的meta分析

为何须要作meta分析

群体分层是GWAS研究中一个比较常见的假阳性来源.html

也就是说,若是数据存在群体分层,却不加以控制,那么很容易获得一堆假阳性位点。命令行

当群体出现分层时,常规手段就是将分层的群体独立分析,最后再作meta分析。code

1.如何判断群体是否分层

先用plink计算PCA,具体方法详见连接:GWAS群体分层 (Population stratification):利用plink对基因型进行PCA

随后画出PC1和PC2在不一样群体的散点图,观察群体之间是否明显分开,若是明显分开,说明群体分层了,须要独立作关联分析,最后再作meta分析

2.如何作meta分析

这里推荐metal软件作meta分析,理由是简单、易上手。htm

2.1 下载metal

进入下载连接blog

metal 提供了三个版本的,分别是Linux,macOS, Windows系统;请自行选择。three

这里提供Linux系统的命令:文档

wget http://csg.sph.umich.edu/abecasis/metal/download/Linux-metal.tar.gzget

2.2 解压metal

解压用到的命令以下:io

tar -zxvf Linux-metal.tar.gz软件

2.3 meta分析前的数据准备

假定须要进行meta分析的文档分别为DGI_three_regions.txtmagic_SARDINIA.tbl

DGI_three_regions.txt 的内容以下:

VCxxyj.jpg

magic_SARDINIA.tbl 的内容以下:

VCxzOs.jpg

那么在meta分析前须要准备一个metal.txt文档,metal.txt文档的内容以下:

VCzpmn.jpg

解释一下,这个txt文档是什么意思。

这一部分指的是MARKER对应的是DGI_three_regions.txt文档的SNP列名;

WEIGHT对应的是DGI_three_regions.txt文档的SNP列名;

其余的以此类推;

第二个文件的准备方法也是同样的。

2.4 meta分析

很简单的一个命令行就搞定了

metal metal.txt

2.5 结果解读

meta分析后会生成两个文件,分别是 METAANALYSIS1.TBL 和 METAANALYSIS1.TBL.info

METAANALYSIS1.TBL 是meta分析的结果文档;

内容以下:

VCz9wq.jpg

P-value 即为meta后的关联分析P值;

METAANALYSIS1.TBL.info 是meta分析的说明文档,好比 Marker 指的是什么。

其内容以下:

VCzFYT.jpg

相关文章
相关标签/搜索