序列类似性比较与同源性分析

首先应该注意区分序列类似性与序列同源性的关系,序列类似不必定同源,可是断定同源性关系的时候有些算法(Maximum likelihood除外)要考虑到序列类似性。序列类似性是将待研究序列与DNA或蛋白质序列库进行比较,用于肯定该序列的生物属性,也就是找出与此序列类似的已知序列是什么,完成这一工做只须要用到两两序列比较算法,经常使用的程序包有BLAST,FASTA等。同源性分析是将待研究序列加入到一组与之同源,可是来自不一样物种的序列中进行多序列比对,以肯定该序列与其它序列间的同源性大小。多序列比较算法经常使用的程序包有CLUSTAL等。html

一、  序列比对,从数据库中寻找类似序列: 首先打开NCBI的BLAST网站:https://blast.ncbi.nlm.nih.gov/Blast.cgi ,选择protein blast,而后将待比对序列粘贴进去,进行BLAST(一些参数的设置收藏夹或百度)。等待必定时间后将会出现与所选数据库的比对结果,按照打分高低将top100(能够设置成其余数值)的序列显示出来,而后能够将该100条序列下载下来。存成test.fasta文件。这个文件就是在mega中进行多序列比对建树所用的文件。算法

二、  多序列比对:打开mega,ALIGN-BUILDALIGNMENT-Create a new alignment-protein-open-retrieve sequences from file-no -test.fasta(或者直接拖动进去,或者双击打开test.fasta),而后点击Alignment——Align by ClustalW——OK——OK。而后比对成功,选择Data——Export Alignment——MEGA format保存文件为test.meg,能够关闭Align会话框。数据库

三、  构建进化树:打开test.meg。点击PHYLOGENY——选择最上面的ML方法,参数能够选择默认参数。就出现了进化树。固然一些参数最好仍是用到,好比说可信度验证的次数设置最好要大于等于500次。网站

四、  进化树的美化与理解orm

http://www.360doc.com/content/14/0617/22/17553313_387599563.shtmlhtm

https://www.sohu.com/a/196872269_675868get

相关文章
相关标签/搜索