sam 文件第二列flag含义:app
1 : 表明这个序列采用的是PE双端测序ip
2: 表明这个序列和参考序列彻底匹配,没有错配和插入缺失io
4: 表明这个序列没有mapping到参考序列上cli
8: 表明这个序列的另外一端序列没有比对到参考序列上,好比这条序列是R1,它对应的R2端序列没有比对到参考序列上map
16:表明这个序列比对到参考序列的负链上di
32 :表明这个序列对应的另外一端序列比对到参考序列的负链上文件
64 : 表明这个序列是R1端序列, read1;ping
128 : 表明这个序列是R2端序列,read2;let
256: 表明这个序列不是主要的比对,一条序列可能比对到参考序列的多个位置,只有一个是首要的比对位置,其余都是次要的tag
73 = 64+8+1 (R1匹配上,R2没有匹配上)
153 = 128+16+8+1(R2比对到负连接,R1没有匹配上)
97 = 64+32+1 (R2比对到负链,R1不是彻底匹配)
99 = 64+32+2+1 (R2比对到负链,R1彻底匹配)
147 = 128+16+2+1 (R2彻底匹配到负链)
145 = 128+16+1 (R2比对到负链,R1不是彻底匹配)
83 = 64+16+2+1 (R1彻底匹配到负链)
163 = 128+32+2+1(R2彻底匹配,R1比对到负链)
M alignment match (can be a sequence match or mismatch) insertion to the reference
D deletion from the reference
N skipped region from the reference
S soft clipping (clipped sequences present in SEQ)
H hard clipping (clipped sequences NOT present in SEQ)
P padding (silent deletion from padded reference) sequence match
还有一些可选的tag,格式为tag:type:value 例如:NH:1 表明的是read alignment的个数,表示这个read只mapping到基因组一次