单核苷酸多态性,英文single nucleotide polymorphism,缩写为SNP,读音为Snip。SNP主要是指在基因组水平上引发的单个碱基的变异,其在群体中的发生频率不小于1%,包括单碱基的转换、颠换以及单碱基的插入和缺失等。算法
突变(mutation)和多态性(polymorphism)的主要区别在于:微信
1)突变在群体中的发生频率小于1%,而多态性的发生频率在大于1%;ide
2)突变一般对生生物体是有害的,而多态性一般都是无害的。工具
那么基于基因组测序数据,包括全基因组测(WGS)、全外显子测序(WES)或靶向测序(targeted sequencing),鉴定基因组变异的标准流程是什么样的呢?(更多精彩请关注微信公众号:AIPuFuBio)性能
具体以下图所示:orm
因此基于测序数据进行基因组变异检测的第一步就是数据匹配,即把测序数据匹配到参考基因组上。匹配测序数据的软件很是多,下图列举了一些典型的匹配软件。具体以下所示:blog
由上表可知,Bowtie(目前有Bowtie2)、BWA和SOAP(目前有SOAP2)都是整体性能很好的短序列匹配软件。图片
那么基因组变异的检测软件哪些呢?基于测序数据的变异检测软件也很是多,下图列举了一些典型的软件。具体以下所示:ip
因为GATK拥有很是好的综合性能,目前GATK是已成为最流行的SNV/SNP检测软件。ci
GATK的具体算法原理可参考原文章:
McKenna et al. The Genome Analysis Toolkit: A MapReduce framework for analyzing next-generation DNA sequencing data, Genome Research, 2010
而GATK软件的具体使用可参考官网:
https://software.broadinstitute.org/gatk/best-practices/
(更多精彩,可见大型免费综合生物信息学资源和工具平台AIPuFu:www.aipufu.com,关注微信公众号:AIPuFuBio)
但愿今天的内容对你们有用,会持续更新经典内容,欢迎留言~~