Sam文件第二列含义

sam 文件第二列flag含义:app

1 : 表明这个序列采用的是PE双端测序ip

2: 表明这个序列和参考序列彻底匹配,没有错配和插入缺失io

4: 表明这个序列没有mapping到参考序列上cli

8: 表明这个序列的另外一端序列没有比对到参考序列上,好比这条序列是R1,它对应的R2端序列没有比对到参考序列上map

16:表明这个序列比对到参考序列的负链上di

32 :表明这个序列对应的另外一端序列比对到参考序列的负链上文件

64 : 表明这个序列是R1端序列, read1;ping

128 : 表明这个序列是R2端序列,read2;let

256: 表明这个序列不是主要的比对,一条序列可能比对到参考序列的多个位置,只有一个是首要的比对位置,其余都是次要的tag

73 = 64+8+1 (R1匹配上,R2没有匹配上)

153 = 128+16+8+1(R2比对到负连接,R1没有匹配上)

97 = 64+32+1 (R2比对到负链,R1不是彻底匹配)

99 = 64+32+2+1 (R2比对到负链,R1彻底匹配)

147 = 128+16+2+1 (R2彻底匹配到负链)

145 = 128+16+1 (R2比对到负链,R1不是彻底匹配)

83 = 64+16+2+1 (R1彻底匹配到负链)

163 = 128+32+2+1(R2彻底匹配,R1比对到负链)

 

M alignment match (can be a sequence match or mismatch) insertion to the reference
D deletion from the reference
N skipped region from the reference

S soft clipping (clipped sequences present in SEQ)
H hard clipping (clipped sequences NOT present in SEQ)

P padding (silent deletion from padded reference) sequence match
 

 

还有一些可选的tag,格式为tag:type:value   例如:NH:1 表明的是read alignment的个数,表示这个read只mapping到基因组一次

相关文章
相关标签/搜索