LTR插入时间

生信分析26:对LTR-RTs构建进化树

2023-11-15  本文已影响0人  我与生信
本次推送是文献分享26的对应内容。 我与生信,公众号:我与生信文献分享26:优质牧草羊草的基因组演化与育种

Fig 1

Fig 2

Fig 3

在本文中,作者提取了完整的LTR-RTs序列,然后基于RT结构域构建了LTR-RTs的系统发生树(Fig 1-3),发现Copia和Gypsy是两个独立的超家族,Gypsy有六个主要分支,Copia有八个分支。Gypsy的成员较多(27,661个成员),而Copia的成员较少(10,644个成员),这与Gypsy经历了两次爆发,而Copia只经历了一次爆发一致。

今天的推送介绍对LTR-RTs的建树流程。

01 LTR注释并提取完整的LTR序列 

Fig 4

转座子注释可参考生信分析22:完整的转座子注释流程。 我与生信,公众号:我与生信生信分析22:完整的转座子注释流程

在最后的注释结果genome.fa.mod.EDTA.final文件夹下,由于该分析需要使用完整的LTR-RTs序列,所以先要获得完整LTR-RTs的ID,可以从genome.fa.mod.EDTA.intact.gff3文件获取(Fig 4)。

02  LTR再进一步分类

Fig 5

Fig 6

由于之前的注释结果只说明了是Copia还是Gypsy,没有进一步的分类,所以第二步可以用TEsorter软件进行进一步的分类(Fig 5),输出结果为Fig6。

03  提取RT结构域

Fig 7

Fig 8

LRR-RTs最核心的结构就是编码逆转录酶的RT结构域 (reverse transcriptase domain, Fig 7),由于其更保守,所以常用来用作构建进化树。通过Fig8 的命令可以提取RT的序列信息。

04 多序列比对后建树

Fig 9

多序列比对后建树(Fig 9),最后导出树文件可以用ITOL或evolview美化。

参考链接https://genek.cn/  侵删

上一篇下一篇

猜你喜欢

热点阅读