Iqtree2:新模型高效构建系统发育树

系统发育推断(phylogenetic inference)的算法五花八门,从最简单的UPGMA法,到邻接法(neighbor joining)、最大简约法(maximum parsimony),再到复杂的的最大似然法(maximum likelihood)与贝叶斯推断法(Bayesian inference),每种方法都有很多可选择的实现工具。这些方法无一例外都遵循一个规律:越精确则速度越慢。而随着分析的数据愈来愈庞大,对于用户来讲,须要寻找一个尽量快速并且错误率能够容忍的算法是十分必要的。css

贝叶斯法能够准确地推断时间树,但速度最慢;而邻接法与最大简约法在处理有较大分歧的序列时容易出现长枝吸引(long branchattractionLBA)现象,所以目前来讲最大似然法仍是最经常使用的方法。目前实现最大似然法建树的工具备MEGAPhyMLRaxML等,然而这些软件参数设置十分复杂,尤为是核苷酸与氨基酸替代矩阵的选择每每对结果的准确性有着很大的影响,而普通用户每每难以选择。并且,这些工具的分析速度也较慢。
近几年悄然兴起一个新的系统发育推断工具Iqtree http://www.iqtree.org/ ),其简化了参数设置,能够帮助用户选择最佳的进化模型,并且在速度上有很大提高。

最新版的是Iqtree2,其安装方法以下所示:web

tar -zxvf iqtree-2.0.6-Linux.tar.gzcd iqtree-2.0.6-Linux

解压后iqtree执行文件就在bin/目录下,其使用方法以下所示:
iqtree [-s ALIGNMENT] [-p PARTITION] [-m MODEL] [-t TREE] ...-s:序列比对文件(支持多个文件逗号隔开,或者包含比对文件的文件夹),可选PHYLIP、FASTA、NEXUS、CLUSTAL、MSF--seqtype:序列类型,可选BIN、DNA、AA、NT2AA、CODON、MORPH默认为自动检测-o:外类群列表,不一样物种之间逗号隔开--prefix:结果文件名前缀--seed:随机数种子,主要出于调试目的--mem:最大可以使用内存,单位为G、M或百分数%--redo:忽略检查重写输出文件,默认为off,也即从上次意外中断处开始-T:程序运行使用的核数,可设置具体数字或者AUTO(推荐),默认为1--threads-max:最大可以使用的核数,默认为全部核--fast:快速模式,相似FastTree-b:非参数bootstrap次数,大于等于100-B:超快速bootstrap次数,大于等于1000--bnni:使用NNI优化超快速bootstrap的树,搭配-B使用--alrt:SH近似似然比检验重复次数-m:模型选择,设置MF自动选择最佳模型但不建树;设置MFP自动检测最佳模型并建树。此外还能够设置具体的模型,或者多个可选模型,例如-m LG,WAG--ancestral:基于经验贝叶斯的祖先状态重建
接下来看这个工具如何使用。首先从最简单的建树开始:
iqtree -s example.phy -T AUTO

假如设置自动选择最佳模型并建树:算法

iqtree -s example.phy -m MFP -T AUTO

选择最佳模型并只输出模型选择结果:bootstrap

iqtree -s example.phy -m MF -T AUTO

Iqtree会测试多达546个蛋白模型并给出最佳模型,结果以下所示:微信

使用bootstrap自助法计算节点支持率(相似于RaxML):编辑器

iqtree -s example.phy -m MFP -b 100 -T AUTO

使用SH近似似然比检验计算节点支持率:工具

iqtree -s example.phy -m MFP --alrt 100 -T AUTO

同时使用两种方法计算节点支持率:测试

iqtree -s example.phy -m MFP --alrt 100 -b 100 -T AUTO

使用超快速bootstrap自助法计算节点支持率:优化

iqtree -s example.phy -m MFP -B 1000 --bnni -T AUTO
使用上述设置构建500个基因组的120个串联蛋白树须要两天左右。超快自助法ultrafast bootstrap1000次比普通自助法100次要快10倍左右,是该软件的特有算法,因此通常使用Iqtree的超快自助法建树。
END

本文分享自微信公众号 - 微生态与微进化(MicroEcoEvo)。
若有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一块儿分享。spa

相关文章
相关标签/搜索