教程 | 使用 CPGAVAS2 进行叶绿体基因组注释
2021-07-24 本文已影响0人
生信石头
写在前面
前述,介绍了使用 GetOrganelle 软件进行植物叶绿体基因组组装。测试了下软件,130个样品,直接成环的有76个。手动调整了参数,除了 10 个左右的样品外,其他样品都成环了。至于如何解决不成环的.... 怀疑还是要手拼,回头折腾一下再来记录。
既然绝大多数叶绿体基因组都组装出来了,那么下一步肯定是基因结构注释。我们往往关注的并不是基因组序列本身有什么变化,而是编码基因有什么变化,因为后者,常常直接对应了具体生物学功能。
大概搜索了下,做叶绿体基因组注释的软件有不少,似乎用得挺多的是一个 PGA 的软件。然而....在安装上一直遇到问题,git clone
一直失败。或许即使安装上了,也不清楚是否可以解决所有依赖。时间紧迫,索性找了一个网页版软件,CPGAVAS2。
CPGAVAS2 的使用
直接 Bing 搜索,或者输入网址,即可查看
http://www.herbalgenomics.org/cpgavas/
![](https://img.haomeiwen.com/i10518391/4bb19e07928274cc.png)
具体网站,可以看到,相对简洁(或者说,确实看起来网页有点简单,值得再美化)。
![](https://img.haomeiwen.com/i10518391/d0448078bace9694.png)
当然,这不影响我们使用。
![](https://img.haomeiwen.com/i10518391/83eda113bc6fcb77.png)
按照页面要求,填入参数
![](https://img.haomeiwen.com/i10518391/d6aef309949fa03f.png)
进入注释页面
![](https://img.haomeiwen.com/i10518391/ffcc78860cad7892.png)
需要注意的是,似乎这个网页工具不会自动刷新,需要自己操作。另外似乎我也收不到邮件。好在不需要20分钟,我感觉20秒就注释完了(翻车,昨晚是很快,现在不行了)。
自己复制链接和ID,进入页面,提交ID
![](https://img.haomeiwen.com/i10518391/60cf1230722c4ecb.png)
提交之后发现似乎还是 Running,那就等 20 min 再回来提交一次。
![](https://img.haomeiwen.com/i10518391/2ba343d508c5da44.png)
可以一次性下载所有结果
![](https://img.haomeiwen.com/i10518391/6eeb1645a2fa06f5.png)
查看所有注释结果
![](https://img.haomeiwen.com/i10518391/faab7382d081f2d6.png)
其中
.gff
文件为 gff3 格式注释信息,而.gbf
则为genBank格式。![](https://img.haomeiwen.com/i10518391/68a65bc3b1bdaa06.png)
写在最后
网页工具,可能最大的好处就是....几乎不存在配置问题。当然不好的地方,以前也提过几次,此处不再赘述。
CPGAVAS2 这个网站服务器还是很不错。就功能性来说,已经可以了。如果说还可以继续优化,或许是在网页和可视化上。当然整体上我们可以看出来,基本是一个静态网站,搞点动态的,则相信会有更好的用户体验。
Anyway,解决了我的问题,那么必然是好工具嘛。