BWT算法在生物信息学中的应用(一)-算法的基本原理

BWT算法可以将原文本转换成相似文本,并且可以用其他技术进行压缩。 具体分为如下几个步骤: 编码: 1.循环移位 2.排序 3.输出最后一列,作为变换后的序列。 解码: 利用第一列和最后一列的关系,来还原出原始序列。 下面,以一段核酸序列作为例子,进行讲解,具体例子如下: 1. 假设原始序列如下图,我们在最后加入一个$表示结束位置。 2.进行循环移位,结果如下 3.进行排序,结果如下 4.最终,红
相关文章
相关标签/搜索