查询、下载GWAS目录数据的R包(gwasrapidd)

目前GWAS方向发了不少文献,可是并无一个很完善的R包对这些文献的数据进行汇总。html

接下来推荐的这个是最新发表的GWAS数据汇总R包​。看了一下功能齐全,可是数据不是收录的很齐全​。
下面具体讲一下。​git

在R上安装

install.packages("remotes")github

remotes::install_github("ramiromagno/gwasrapidd")api

查询是否有发表关于自身免疫性疾病的文章

library(gwasrapidd)测试

my_studies <- get_studies(efo_trait = 'autoimmune disease')code

查询发表自身免疫性疾病文章的数量

n(my_studies)htm

获取发表自身免疫性疾病的文章ID

my_studies@studies$study_idblog

查询发表自身免疫性疾病的文章标题

my_studies@publications$title
mgHYEd.pngci

查看发表自身免疫性疾病文章在pubmed的界面信息

open_in_pubmed(my_studies@publications$pubmed_id)开发

获取发表身高文献的SNP关联信息

my_associations <- get_associations(study_id = my_studies@studies$study_id)

查询P值小于1e-6的位点

dplyr::filter(my_associations@associations, pvalue < 1e-6) %>% # Filter by p-value
tidyr::drop_na(pvalue) %>%
dplyr::pull(association_id) -> association_ids # Extract column association_id

提取显著信号位点信息

my_associations2 <- my_associations[association_ids]

显示显著信号位点的个数

n(my_associations2)

显示显著信号位点的RS ID, risk allele, 频率

my_associations2@risk_alleles[c('variant_id', 'risk_allele', 'risk_frequency')] %>%

print(n = Inf)

获取含有rs12752552位点的文献

s2 <- get_studies(variant_id = 'rs12752552')

测试了一下,优势是减去了不少信息检索的工做,缺点是这个包刚开发不久,信息还不够齐全

更多详细信息请看gwasrapidd

参考文献:Magno R, Maia A T. gwasrapidd: an R package to query, download and wrangle GWAS Catalog data[J]. bioRxiv, 2019: 643940.

相关文章
相关标签/搜索