上文NC:全球范围内子囊菌是最优点的真菌类群web
利用SINTAX进行序列鉴定。本文对此方法进行说明。算法
SINTAX于2016年发表于bioRxiv,做者是创造了Usearch的大神。因此看做者订价值,直接无条件的信任就行了~数据库


SINTAX采用k-mer算法,来鉴定与参考数据库最佳匹配的序列,并采用bootstrap方法验证准确性。和基于朴素贝叶斯方法(Naive Bayesian Classifier)的RDP相比,SINTAX效果至关或更优,且不须要训练数据集。bootstrap
目前已有的方法都有很高的过分分类错误率(over-classification errors),即新的分类单元被错误地预测为已知的菌属。微信


目前普遍使用的序列分类学鉴定工具备RDP,QIIME,mothur等。他们用的都是RDP的方法,可是所使用的的数据库不一样。app
RDP用本身的训练集作参考数据库,QIIME用Greengenes的子数据库GGQ为参考数据库,以97%为阈值进行聚类。mothur以SILVA的子数据库SILVAM做为参考数据库。编辑器

SINTAX算法就不写了,估计也没有人想看。直接说结果,做者拿SINTAX v1.0, RDP v2.12, QIIME v1.9.1, mothur v1.36.1进行了对比。工具
SINTAX 和RDP在V4水平表现至关,可是因为SINTAX过分分类错误率更低,其在全长16S和ITS上错误率更低,效果更优。ITS门水平上的灵敏度SINTAX (98.3%) 显著高于RDP (81.8%)。flex
在16S全长水平上,RDP的过分分类错误率可达40%。这代表40%的新物种可能都被错误的注释成了已有的物种。url


一个环境工程专业却作生信分析的深井冰博士,深受拖延症的困扰。想给本身一点压力,争取可以不按期分享学到的生信小技能,亦或看文献过程当中的一些笔记与小收获,记录生活中的杂七杂八。
目前能力有限,尚不能创造知识,只是知识的搬运工。
欢迎你们扫描下方二维码关注个人公众号,如有问题也可直接加个人微信:水岸风堤(lii32703)。请备注姓名及单位,不然自动忽略。
欢迎分享,转载请联系我。
本文分享自微信公众号 - Listenlii()。
若有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一块儿分享。