【目录】PANDA姐的微生物比较基因组实战
最近发现好多小伙伴都开始加入紧跟着生信技能树的脚步开始学习生信,现在入门的下伙伴比三年前的我幸运多了。因为Jimmy创建的生信技能树发布了许多一步一步入门的教程,并且在学习方法上,在熊的带领下,我们用上了许多高效学习工具,再在生信技能树的影响力下越来越多的小伙伴受益。现在在互联网上搜索不光光能检索到Jimmy、铁汉等大神的帖子了,还能看到许多新面孔,而且做的非常好,我看到生信星球的有些帖子还会自己去制作示意图,很用心。曾别人说过一句话,你PPT上的图片最好都是自己一个元素一个元素去绘制,这样你才能懂得背后的原理,去讲报告的时候也能讲得清说得明白。
阅读文献
-
下载文献《Comparative Genomics of Degradative Novosphingobium Strains With Special Reference to Microcystin-Degrading Novosphingobium sp. THN1》https://www.frontiersin.org/articles/10.3389/fmicb.2018.02238/full ,查看主要分析内容和图表,我们可以看到图表就跟分析内容是对应的。
-
TABLE 1
img -
FIGURE1
img -
TABLE2
img -
FIGURE2
img -
FIGURE3
img -
FIGURE4
img -
TABLE3
img -
FIGURE5
img
-
软件安装
以下软件均是本实战中要用到的软件:
- ncbi-genome-download
- blast套件
- OrthoMCL
- MEGA
- JSpecies
- Clustal
- Gblock
- PHYLIP
- cvtree
- ISFinder
- IslandViewer
- CRISPRFinder
- eggNOG-mapper
下载数据
可以借用ncbi-genome-download
软件来帮助数据下载:
- 从https://github.com/shenmengyuan/Novo_comparison/tree/master/Datasets上下载22株细菌的基因组和蛋白序列数据
- 从NCBI上下载以上22株细菌的gff/CDS/rna文件(*_genomic.gff.gz/*_cds_from_genomic.fna.gz/*_rna_from_genomic.fna.gz)
识别同源蛋白
使用OrthoMCL
软件对22株细菌的蛋白序列进行聚类,进行统计分析,得到的核心同源基因用于核心基因进化树的构建。
进化分析
这里主要采用了三种方法进行构建进化树:
- 使用
MEGA
构建16S rRNA基因进化树 - 使用
Clustal
分别对核心进行比对再使用Gblock
修剪后,将所有比对完整的核心序列拼接到一起,最后使用MEGA
构建核心基因进化树 - 使用
JSpecies
计算ANI值,用R绘制热图进行可视化 - 使用
cvtree
和PHYLIP
直接使用22株细菌的基因组构建全基因组进化树,并且写抽样程序计算bootstrap值
插入序列、基因组岛、CRISPR片段分析
对基因组的元件进行鉴定分析:
- 使用
ISFinder
识别插入序列 - 使用
IslandViewer
识别基因组岛 - 使用
CRISPRFinder
识别CRISPR片段
功能代谢分析与比较
- COG
使用eggNOG-mapper
对22株细菌进行COG注释后,编写代码进行统计每个COG类的基因数,并用R绘制热图 - KEGG
使用BlastKOALA
和eggNOG-mapper
的kegg注释结果,统计比较分析,借助KEGG Mapper
工具进行可视化,使用AI绘制22株细菌共有的代谢通路图
比较微囊藻毒素降解基因簇
筛选处微囊毒素降解基因簇使用blastN进行对每个基因进行比对后,使用AI绘制基因簇对比图
github项目上传
一般文章发表需要将可重复的代码和使用的数据进行共享,学会将自己的项目上传至github
微信公众号如果实在有需要请给我发邮件:mengyuanshen@126.com;
也可以关注我的公众号:沈梦圆(PandaBiotrainee)