分子生物学

Where are the Genes in the Genom

2020-03-19  本文已影响0人  Han_zh

基因组注释(Genome annotation)

基因组注释是利用生物信息学方法和工具,对基因组所有基因的生物学功能进行高通量注释Ground Level Annotation,是当前功能基因组学研究的一个热点。基因组注释的研究内容包括基因识别和基因功能注释两个方面。——百度百科

基因组注释流程


1.排除重复序列
★ 高度重复的卫星DNA,中度重复的rRNA和tRNA基因以及各种转座子
2.预测编码蛋白质的基因(Protein-coding gene)
★ 预测开发阅读框(Open reading frame,ORF)
★ 预测内含子(Intron)、外显子(Exon)的位置和数目
★ 预测基因的调控元件 — 启动子,增强子所在的位置等
3.预测非编码RNA基因(Non-coding RNA)
★ 非编码RNA是指转录但不编码蛋白质的RNA,在RNA水平上行驶各自的生物学功能。其中包括rRNAtRNAmicroRNA等多种已知功能的RNA。
4.预测顺式调控元件(间隔区)
★ENCODE计划(DNA顺式调控元件的百科全书计划)—Motivation and Significance
—ENCODE计划的主要研究内容是利用不同但高通量组学方法鉴定基因组序列中的功能性调控元件,尤其是位于基因非编码区的那些元件。
启动子/转录因子的结合位点TF/染色质结构/不同的组蛋白修饰
确定这些调控原件的位置以及他们的功能对理解基因的转录调控以及理解基因组遗传变异有重要的意义。
最终来注释整个基因组的调控元件


图片来自Bing搜索

Ref:
MOOC— 生物信息学

上一篇下一篇

猜你喜欢

热点阅读