variant和gene expression是生物信息中两个很是重要的核心站点(根据中心法则,还有表观、3D genome、isoform、蛋白),这也是两个最能被准确测量的维度,在Post-GWAS,它们两的关系是咱们研究的重点。html
显然variant主要分为两类:express
这两大类的分析方法大相径庭,coding主要直接影响了mRNA和蛋白;而noncoding,咱们主要认知都是在调控上。orm
先看看文献(搜 coding variant and gene expression ):htm
The Post-GWAS Era: From Association to Functionci
Modified penetrance of coding variants by cis-regulatory variation contributes to disease riskget
The influence of genetic variation on gene expressionit
The impact of rare variation on gene expression across tissuesio
这篇能够重点看,2014年的,才发现本身如今作的别人早就作过相似的了。function
Analysis of Stop-Gain and Frameshift Variants in Human Innate Immunity Genes form
如何给coding mutation打分,评估其对疾病以及severity的影响。
如何找到众多基因中的core gene set?
当心假设,大胆求证。
这和经典名言刚好相反,由于我以为这世界能够的假设太多了,彷佛均可以,但其实大部分的都是错误的。
当心假设,意味着咱们只基于最可靠的事实来做出假设,基于不可靠事实的假设是无心义的,也就不存在任何求证的方法。
大胆求证,就是收集各类数据,全方位的来论证,数据会有偏,但数据不会说谎。
这些coding mutations是很是靠谱的,咱们的pre-ENCC的DEG也是比较靠谱的,咱们的大厦的根基就是这两个站点。
有了这两个站点,如何把它们联系到一块儿呢? 这中间的可能性有无数种。
coding mutation各式各样,在network中的地位和重要性也不同,对基因表达的影响也不同,想用单一的规则把variant和gene expression联系到一块儿彷佛是不可能的。
立刻深刻探索~