群体遗传学

使用mafft进行多序列比对

2022-04-07  本文已影响0人  花生学生信

多序列比对(多序列联配,Multiple sequence alignment, MSA)是指把多条(3 条或以上)有系统进化关系的蛋白质分子的氨基酸序列或核酸序列进行比对,尽可能地把相同的碱基或氨基酸残基排在同一列上。这样做的意义是,对齐的碱基或氨基酸残基在进化上是同源的,即来自共同祖先(common ancestor)。

多序列比对的软件有很多,最常用的多的序列比对软件是 clustalw 。 有文献报道:比对速度(Muscle>MAFFT>ClustalW>T-Coffee),比对准确性(MAFFT>Muscle>T-Coffee>ClustalW)。因此,推荐使用 MAFFT 软件进行多序列比对。

使用了之前注释的水稻基因组数据,将其转换成蛋白质文件,

gffread H7L1.EVM.all.gff -g /public/home/fengting/task/222anno/21/data/H7L1.arrow.polish.fasta -y tr_cds.fa

使用conda安装mafft,输入mafft,显示版本信息


按照软件要求输入信息,


成功运行

上一篇下一篇

猜你喜欢

热点阅读