一款表达谱数据分析的神器--CCLE--转载

如今作生物和医学的,不少均可能会和各类组学数据打交道。其中表达谱数据老是最经常使用的,也是比较好测的。即便在工做中不去测序,也能够利用已有的数据库去作一些数据挖掘,找一找不一样表型(好比癌症)对应的marker或者调控的通路。这里跟你们推荐一款分析表达谱数据的神器GENE-E,亲测比较好用,知足经常使用需求,能够作各类热图,聚类,箱图,类似分析和标记筛选等等,并且很是小巧。html

 

 

 

进入软件以后,界面以下,这里显示的就是基因表达的热图(heatmap),其中蓝色表示被低调控,红色表示被高调。横向是不一样的细胞系,纵向是不一样的基因和探针名。java

 

 

数据操做数据库

第一次进入程序能够利用它自带的测试数据来上手,以下图,打开File->OpenExample Data-> CCLE,而后须要几分钟来下载数据,别忘记连网。CCLEBoard Institute维护的一个癌症细胞系的数据库,目前有近千个cell line,有兴趣的也能够去官网看看。测试

 

 

 

 

 

等几分钟load完数据以后了就能够挑选感兴趣的数据进行分析了。好比能够在圆圈处敲入skin ovary,即挑选和皮肤癌以及卵巢癌有关的细胞系(此时带有关键词的列名已经被橙色高亮)。而后点击黑色箭头处的图标,既能够选中这些列。spa

 

 

 

而后点击图中图标,创建新的热图(heatmap)。htm


 

 

类似分析blog

对两种癌症的数据就能够进行进一步分析。好比咱们能够分析不一样细胞系间的类似性,以下图Tools->Similarity Matrix,点击ok便可。get

 

 

 

 

获得类似性以下图(这里为了计算更快,只取了其中部分数据),其中矩阵中的(i,j)位置对应细胞系i和细胞系j之间的类似性,红色表示类似度高。矩阵上方和右方的色条表示的是卵巢癌(深蓝)或皮肤癌(浅蓝)的细胞系。咱们能够发现一个位置来源的癌细胞都相互之间很像。it

 

 

聚类分析数据挖掘

另外咱们也能够作聚类分析,以下图,点击图标后输入参数。这里须要选择对列(Column)仍是行(Row)聚类。这里咱们在两个方向均可以聚类。

 

 

 

 

聚类结果以下图,这里也选择了一部分(事实上只聚类了显示的这一部分。。)。跟刚才的热图的区别就是把行和列从新进行了排列,让更类似的临近在一块儿,能够方便看出被差别调控的基因或者相关模块。能够看到有一些基因在皮肤癌中高表达,在卵巢癌中低表达。这些基因就是潜在的皮肤癌的marker,至于如何利用这个软件作marker分析,咱们下次再说吧。

 

 

 

软件的下载地址在这里

须要安装java,须要机构邮箱来进行注册。若是没有机构邮箱,至少认识一个有的童鞋吧。

相关文章
相关标签/搜索