生物信息学练习2- Biom-format

The Biological Observation Matrix (BIOM) format http://biom-format.org/python

biom-format有两种方式安装:工具

1. python pkg:spa

pip install numpyorm

因为最新版的biom-format还不支持python3,因此须要切换到python2对象

sudo update-alternatives --config pythonip

而后安装开发

pip install biom-formatget

为了处理BIOM 2.0+的文件,须要安装这个:it

pip install h5pypip

2. R pkg:

百度,找安装包,安装好依赖便可。

版本:

版本1.0基于JSON格式开发。

版本2.02.1基于HDF格式开发。(HDF格式专门存储大规模、多对象的科学研究数据)

开发目的:

1. 存储和操做大规模的稀疏的生物数据列联表(列联表是观测数据按两个或更多属性(定性变量)分类时所列出的频数表,其实就是一般的统计表格);

2. 将核心元数据(contingency table data and sample/observation metadata)封装到单个文件中;

3. 便于在不一样工具见交流(如 QIIME/MG-RAST/VAMPS)。

支持 BIOM格式的软件:

QIIMEMG-RASTPICRUStMothurphyloseqMEGANVAMPSmetagenomeSeq

PhinchRDP Classifier

OTU table:

两种都支持,但>=85%的是0再用sparse更合适。

dense


sparse

 

 

 

 

***************************************************************************************************************************************
操做


Parse a table from an open file object:

from biom import parse_table

with open('path/to/table.biom') as f:

table = parse_table(f)

Parse a table from a path:

from biom import load_table

table = load_table('path/to/table.biom')

相关文章
相关标签/搜索