这是一个尝试性的文章,能不能解决我要解决的问题,并不清楚。ide
===本文利用NCBI的blast界面,实现将短序列比对上reference基因组,并实现变异位点可视化。===补言===网站
比对经常使用的是NCBI网站,打开NCBI。(百度 谷歌直接搜索NCBI, 如今中国也在搭建和完善国家生物信息中心,一个是位于深圳的国家基因库,由BGI代运营,一个是北京的国家生物信息中心,由BIG开发和运营)。3d
核苷酸序列比对选默认的blast就好,其余的比对模块能够自行查看,有必要的状况下公众号再讲。blog
搜索本身想要比对的物种(reference)。开发
serch (点击搜索)ast
好了,database已经为咱们选定的物种基因组(可自行选择版本),若是没有基因组的话,可能须要本身上传或者是其余的办法(本处未作尝试)。可视化
输入须要查找的序列,或者文件。百度
格式为fasta格式,以下(关于序列的格式文件说明,能够参见鄙人公众号):搜索
>ID1im
ATCG
>ID2
ATCG
...
类似度通常用默认的,我的习惯在新的页面打开,而后点blast。
我给的是双子叶植物的一段序列,不负众望,没有搜到任何信息。
==============================================================================
下面我想找一段同物种的基因:
管它三七二十几(这里省略了约三个步骤),终究找了一段序列,贴进去看看效果:
而后结果:
没错,就是这段,点开果真是100%的类似度。
如今我突变3个位点,再比对一次。
能够看到类似度变低了:右侧pre.ident 为99.75%(前一分钟是100%)。
三个位点发生了差别。
能够看到被人为突变的位置是没法对齐的,可是没有颜色标记不是很好看。
继续,打开右边的可视化页面:
可视化信息以下:
点击红色的query(没错,这就是刚刚输入的sequence,如今被重命名为Query_8543),能够看到咱们以前人为作的三个突变位点,以下(红线所示):
放大mismatch的位点,能够看到详细的碱基信息:
以上,
abysw