结构变异小教程收藏生信相关

生物基础知识-CDS、ORF、启动子、终止子、转录因子、UTR

2020-02-08  本文已影响0人  刘小泽

刘小泽写于2020.2.8
大概回顾一下基础知识

一:ORF与CDS

ORF:open reading frame(开放阅读框)

它是理论上的蛋白编码区,一般是先在DNA序列中寻找起始密码子(AUG)对应的序列ATG,然后按每3个碱基一组向后延伸,一直到出现终止密码子(UAG、UGA、UAA)对应的序列

注意:起始密码子和启动子不是一回事!

CDS:coding sequences (编码区)

它就是与蛋白序列一一对应的DNA序列,并且序列中间不存在其他与蛋白无关的序列,和真实情况最接近

举个例子:

例如这个序列:AACGCATGCAGC

如果用预测的方法得到ORF,它会先找到ATG;然后会以中间的字母T为核心,推测三种可能:

还因为DNA双链,所以总共有32=6种不同密码子组合方式*

补充

https://www.biostars.org/p/47022/

CDS 与 UTR:

A typical CDS starts with ATG and ends with a stop codon, it doesn't have any introns, 5'- and 3'-UTR

CDS与ORF:

CDS can be a subset of an open reading frame (ORF).

二:启动子&起始密码子;终止子&终止密码子**

实际上二者之间没有任何关联

启动子 promoter

强启动子(strong promoter):对RNA聚合酶有很高亲和力的启动子,可以指导合成大量的mRNA

起始密码子 start codon

指定信使RNA(mRNA)上开始合成蛋白质的密码子,也是第一个被核糖体翻译的mRNA上的密码子,位于编码区内,紧邻5′非翻译区。较为常见的起始密码子是AUG

终止子 terminator

终止密码子 stop codon

终止肽链合成的信使核糖核酸(mRNA)的三联体碱基序列,UAA、UAG和UGA,它们不编码氨基酸

三:转录因子 及结合位点

转录因子(transcription factor)

更详细的转录因子介绍:https://cloud.tencent.com/developer/article/1376739

TF结合位点 transcription factor binding site,TFBS

转录因子调节基因表达时,与基因模板链结合的区域。一般应该分布在基因前端【但:人21和22号染色体上,只有22%的转录因子结合位点分布在蛋白编码基因的5'端】

四:UTR (Untranslated Regions)

非翻译区,是信使RNA(mRNA)分子两端的非编码片段

最后补充几张图

关于表达调控

BIOL2060: Regulation of Gene Expression


欢迎关注我们的公众号~_~  
我们是两个农转生信的小硕,打造生信星球,想让它成为一个不拽术语、通俗易懂的生信知识平台。需要帮助或提出意见请后台留言或发送邮件到jieandze1314@gmail.com

Welcome to our bioinfoplanet!
上一篇 下一篇

猜你喜欢

热点阅读