【生信】基因家族分析·学习组学大讲堂的笔记
2020-05-04 本文已影响0人
虫虫工工队
本文所选文章:
1、基因识别与鉴定
基因家族分析流程 马铃薯Hsp20基因示例S1:下载基因组蛋白质序列
S2:搜索结构域
- Hmmer搜索PF00011,找到58个
- 从NCBI上下载是Hsp20基因的序列构成数据库,blastp搜索,找到52个
- 基因组可能原有注释,搜索注释找到35个
S3:去重、筛选
- 提交到在线的NCBI CDD去确认所搜索到的含有Hsp20结构域
- 也可以提交到SMART上做确认
- 确定搜索到的Hsp20的蛋白分子量属于该范围内
- 最终确认是48个
2、基因结构分析
- 制成如图所示的基因信息表,包含以下内容:
(1)对基因进行重命名(编号);(2)基因ID;(3)所在染色体位置;(4)ORF的长度;(5)外显子个数;(6)氨基酸序列长度;(7)蛋白质大小;(8)蛋白质等电点 -
其中(7)(8)是在ExPASy上预测得的
截取这48个被识别鉴定的基因的信息表
3、基因蛋白序列Motif分析
基因蛋白序列Motif分析- motif的寻找往往有一定生物学意义,因为这些重复出现的序列也许有特定的功能,如蛋白结合位点等。
- 在这篇文章中,找到有10个motif
4、基因结构以及进化树展示
- 多序列比对后构建进化树
- 蓝色是utr区(非翻译区),黄色是外显子,横线是内含子
5、构建多物种进化树
构建多物种进化树-
蛋白序列的全长进行构建物种进化树
多物种进化树构建结果 - 构建多物种进化树的作用:查看这些马铃薯Hsp20基因所属的分类,原理是基于“属于同一分类的基因序列会相似”
查看Hsp20基因在染色体上的分布信息
基因串联重复原理- range of alignment:比对上的区域
- 比对率>70%:range of alignment占全长基因>70%。
- 比对相似性>70%:即比对上的除以range of alignment>70%。除mismatch和gap以外的就是比对上的。
-
两个基因在染色体上的位置<100kb
分析结果图
Hsp20基因的顺式作用元件分析
顺式作用元件分析- 分析基因的上游区(虽然说是旁侧序列,但一般是分析上游区)能影响基因表达的序列
-
将promoters区截取下来提交到在线网站PlantCARE上分析
分析结果图 - Hsp20基因与抗性相关,故本文只筛选了跟抗性相关的顺式作用元件进行分析,否则提交分析后的结果可能会得到密密麻麻的顺式作用元件
Hsp20基因的表达模式验证
胁迫处理qPCR验证
胁迫处理qPCR验证qPCR验证结果图
- 横坐标为基因(48个基因),纵坐标为表达量
不同组织中转录组的表达量
- 这篇文章中转录组的数据是从马铃薯数据库中下载下来使用的
- 下载不同组织中转录组的数据
- 马铃薯数据库:PGSC