能够根据多个样品突变的allele frequency 和 copy number,推断出有该突变的细胞克隆所占的比例(cellular prevalence)在不一样样品间的变化。好比:
每一个cluster包括一些突变,它们在各个样品中克隆比例有着一致的变化html
从官网下载Conda
有两个选择,一个是带有python 2.7的Miniconda ,带有python 3.6的Miniconda3 ,经本人电脑测试Miniconda3使用pyclone会出现问题,所以建议安装带python2.7的Miniconda
直接bash下载的文件安装
Miniconda2-latest-Linux-x86_64.sh
按照操做,第一步输入yes赞成协议,而后能够选择安装路径,默认本地家目录,同时相应的python也会自动安装到目录python
按照官网说明安装pyclone
conda install pyclone -c aroth85
成功运行以下算法
[ywliao@WS02 utilities]$ PyClone usage: PyClone [-h] [--version] {setup_analysis,run_analysis,run_analysis_pipeline,build_mutations_file,plot_clusters,plot_loci,build_table} ... PyClone: error: too few arguments
进入test/examples文件夹bootstrap
PyClone run_analysis_pipeline --in_files SRR385938.tsv SRR385939.tsv SRR385940.tsv SRR385941.tsv --working_dir pyclone_analysis
在pyclone_analysis文件下会生成以下文件夹或文件bash
config.yaml #指定用于PyClone分析的设置文件 plots/ #包括生成的所有图 tables/ #包括生成的所有表格 trace/ #包括MCMC抽样算法的原始痕迹 yaml/ #存放yaml突变文件的文件夹,用于PyClone分析
tab分隔存在header的文件,包括如下几列app
若是你没有minor copy number 和 major copy number,那么minor copy number设为0而major copy number设置为预测的总的拷贝数。
除了上述的列,其它列会自动忽略
使用PyClone run_analysis_pipeline -h
查看帮助python2.7
若是pyclone的可视化没法知足你的须要,好比说你须要绘制进化树,可使用supra hex;能够参考http://suprahex.r-forge.r-project.org/demo-PyClone.html
这里提供一个将pyclone中的loci.tsv结果文件转换成supr hex能直接处理的矩阵的R函数函数
library(data.table) library(supraHex) Loci_tsv_To_Input <- function(dt){ dc <- dcast(dt, formula = mutation_id ~ sample_id, value.var = "cellular_prevalence") dt_out <- dc[,-1] rownames(dt_out) <- dc[,1] return(as.matrix(dt_out)) } dt <- fread("~/project/PE/Clone/tsv/Guoyuqin/tables/loci.tsv") data <- Loci_tsv_To_Input(dt) #build and visualise the bootstrapped tree tree_bs <- visTreeBootstrap(t(data))
pyclone usage:https://bitbucket.org/aroth85/pyclone/wiki/Usage
pyclone文献:https://www.nature.com/articles/nmeth.2883
suprahex处理pyclone结果:http://suprahex.r-forge.r-project.org/demo-PyClone.html测试