基因家族分析

技巧 | 基因家族功能域可视化

2021-03-20  本文已影响0人  biogeeker

在基因家族分析中,关于功能域可视化是一个相对比较简单的流程式方法。能够较好地了解不同物种间同一个家族结构域的保守和差异情况。单纯进行可视化的方法可以使用 TBtools,这个操作易上手,使用非常方便。

这里感谢作者的付出!TBtools 最新版本下载地址,在此也可以参考软件的详细使用方法。

  1. 我们先根据 gene id 提取 fasta 序列
图 1 - 根据 id 提取 gene fasta 序列

输入 gene id 和参考基因集即可提取。

  1. 下载最新版 TBtools,安装插件 Plugin_Batch SMART
图 2 - 安装插件 Batch SMART
  1. 可视化你的功能域结果

输入你要可视化的 fasta 序列和输出文件,可以参考图 2。输出结果包含两个文件:原有输出文件 smart_result.txtsmart_result.txt.info 文件。第一个文件信息比较简略,第二个包含多个数据库比对结果和 E-value 等信息。结果完成后,会自动出图。结果如下:

图 3 - 自动出图

如果想要重新生成结构域位置图,可以参考如下方法:

图 4 - 功能域可视化

将简版输出文件拖入,结果如下:

图 5 - 自定义作图
  1. 可以使用 Evolview 对进化树修饰美化(类似的网站有:iTOLs

使用 Evolview 对进化树添加蛋白结构域位置,格式如下:

# 基因ID\t基因长度\t第一个结构域起始,结束,结构域名称\t第二个结构域
id1 171 42,162,AAA
id2 738 46,168,BBB  343,462,CCC

这个在线网站由中科院开发,入手相对简单,功能也很丰富,最重要的是文档简单明了。Github 上不去的话,文档介绍可以看这里 · Evolview2 。我这里,摘取一张来自网站上的示例进化树图:

图 6 - 来自 Evolview

--- / End / ---

PS:欢迎关注我的同名公众号【biogeeker】

上一篇下一篇

猜你喜欢

热点阅读