RVAS(rare variant association study)知识

多基因罕见疾病常用到RVAS(rare variant association study),这里对学习的内容做一个整理。不断补充。

RVAS是个什么鬼?居然将替代GWAS

摘自周在威老师的微信公众号 基因检测与解读
1,GWAS方法通过基因芯片技术系统地评估常见遗传变异(通常是SNP,在人群中的频率MAF大于5%)对疾病的影响,到目前为止,已经有2000多个SNP发现与疾病相关。
2,只能解释小部分的遗传因素。
3,总体来说GWAS发现的这些位点对复杂疾病只有中等程度的影响,要想将这些GWAS发现转化为疾病功能解释或临床应用还有很长的路要走,简单来说就是这些位点与疾病只有关联性,没有因果关系,要想通过关联关系推导至因果关系还很难。
4,分析低频位点(0.5%<MAF<5%)与罕见位点(MAF<0.5%)也许能够解释更多的遗传因素。
5,从进化角度来说这些罕见位点导致的遗传病将会被筛选掉,但是最近有一些研究已经发现低频位点与罕见位点在常见疾病发病过程中发挥重要作用。

常见疾病罕见位点关联分析的实验平台有哪些?

摘自微信公众号 基因检测与解读
常见疾病罕见位点关联分析(RVAS)是指针对常见疾病如先天性心脏病、高血压、糖尿病、肿瘤等(而非单基因遗传病),寻找罕见的遗传基因位点与疾病的相关性,这些罕见的基因位点一般是在基因的编码区或启动子区,具有一定的生物学意义,如错义突变、无义突变、stop loss突变、插入或缺失引起的移码突变及启动子区调节转录的变异,与之相对的GWAS位点没有以上限制,还有一个重要的区别是RVAS是基于功能单元(目前主要是基因,以后有可能是小的信号通路)分析一组位点与疾病的关联,而GWAS是基于单个位点评估关联性。
1,高深度WGS
30X以上
2,低深度WGS
4-6X,其中千人基因组计划就是用低深度的WGS,缺点是很难准确地检测每个个体的基因型,但是对于一次几千样本分析,这个小缺点是可以接受的,如果只是几百个样本不建议使用该方法。
3,WES
4,Panel
靶向测序(Panel),因为之前通过GWAS已经发现了一些具有显著性差异的位点,那么在这些位点附近靶向捕获测序进行罕见位点关联分析不失为一种高性价比的方法。缺点是只能对已知的位点区域进行分析,很可能得到完全阴性的结果。
5,gene chip
虽然说目前主流的基因芯片是针对多态性SNP进行检测,但是最近Illumina 和Affymetrix都推出了外显子芯片,该芯片的位点设计基于12000个人的全外显子测序(主要是欧洲人,对于亚洲不太适用),包括约25万个非同义突变、1万2千个剪切位点突变及7000个改变终止密码子突变。与WES相比,基因芯片只能检测已知的罕见突变,据估计每个人都会有100个以内的的新突变,所以基因芯片会漏掉一些突变。芯片优势就是便宜。

正常对照可以使用千人基因组数据中亚洲人公开的全外显子数据,您只需要测患者就可以了。

RVAS的分析流程与软件介绍

摘自微信公众号 基因检测与解读

Created with Raphaël 2.2.0 分析规划与平台 (需要对样本选择与数量、实验平台、测序质量、统计算法、结果优先选择及样本重复有详细的考虑) 突变检测与质量控制 (有很多指标可以评估突变的质量,包括测序深度、转换/颠换比率、新的变异的数量、杂合/纯合比例、变异的quality、比对quality、链偏倚(strand bias)) 生物信息学功能预测 (结果可能是有害或无害,在RVAS分析中可以整合这些信息) 实验重复 (找到关联的基因后,后续的实验重复需要看关联的显著性,发现的基因与表型存在已知的显著相关,可以不用重复。)

算法及软件:
在这里插入图片描述