生信分析26:对LTR-RTs构建进化树
2023-11-15 本文已影响0人
我与生信
本次推送是文献分享26的对应内容。 我与生信,公众号:我与生信文献分享26:优质牧草羊草的基因组演化与育种
Fig 1
Fig 2
Fig 3
在本文中,作者提取了完整的LTR-RTs序列,然后基于RT结构域构建了LTR-RTs的系统发生树(Fig 1-3),发现Copia和Gypsy是两个独立的超家族,Gypsy有六个主要分支,Copia有八个分支。Gypsy的成员较多(27,661个成员),而Copia的成员较少(10,644个成员),这与Gypsy经历了两次爆发,而Copia只经历了一次爆发一致。
今天的推送介绍对LTR-RTs的建树流程。
01 LTR注释并提取完整的LTR序列
Fig 4
转座子注释可参考生信分析22:完整的转座子注释流程。 我与生信,公众号:我与生信生信分析22:完整的转座子注释流程
在最后的注释结果genome.fa.mod.EDTA.final文件夹下,由于该分析需要使用完整的LTR-RTs序列,所以先要获得完整LTR-RTs的ID,可以从genome.fa.mod.EDTA.intact.gff3文件获取(Fig 4)。
02 LTR再进一步分类
Fig 5
Fig 6
由于之前的注释结果只说明了是Copia还是Gypsy,没有进一步的分类,所以第二步可以用TEsorter软件进行进一步的分类(Fig 5),输出结果为Fig6。
03 提取RT结构域
Fig 7
Fig 8
LRR-RTs最核心的结构就是编码逆转录酶的RT结构域 (reverse transcriptase domain, Fig 7),由于其更保守,所以常用来用作构建进化树。通过Fig8 的命令可以提取RT的序列信息。
04 多序列比对后建树
Fig 9
多序列比对后建树(Fig 9),最后导出树文件可以用ITOL或evolview美化。
参考链接https://genek.cn/ 侵删