名词讲解:转座子(TE)、LTR、假基因
转座子参考
转座子数据库 Trep Dfam
转座子(transposable element)TEs:也称为跳跃基因,是细胞中能改变自身位置的一段DNA 序列。
转座子分为两类:I型转座子(Retrotransposon)和II型转座子(DNA transposons)
I型转座子:以DNA为模板,转录为mRNA,mRNA再反转录为cDNA,在整合酶的作用下插入基因组的新位置。
I型转座子分为
- 具有长末端重复序列(LTR)的逆转录转座子,编码逆转录酶,类似于逆转录病毒HIV1
- 逆转录子,长散布的核元件(LINEs,LINE-1s或L1s),编码逆转录酶但缺乏LTRs,并被RNA聚合酶II转录
- 短散布的核元件(SINE)不编码逆转录酶,并被RNA聚合酶III转录
II型转座子:II型转座子转座的机制被称为“剪切-粘贴”。转座酶把TE从基因组原来的位置剪切下来,又粘贴到基因组其他的区域。剪切下来形成的缺口,会被DNA修复。
I型和II型转座子按照能否自主移动,都分为自主性和非自主型。自主型是,TEs只要自身就能在基因组上跳跃,非自主型TE需要另外一个TE带着它才能跳跃。非自主型不能独立跳跃,是因为缺少转座酶(对于II类)或逆转录酶(对于I类)。
Ac/Ds系统中,Ac是自主型,Ds是非自主型。没有Ac,Ds自己不能发挥作用。
LTR分为5‘-LTR和3’-LTR。LTR侧翼序列被部分转录成RNA中间体,然后反转录成具有完整LTR的互补DNA(cDNA)并最终转录成dsDNA(双链DNA)。然后LTR通过LTR特异性整合到宿主染色体的另一个区域介导DNA的整合。
Helitrons 转座子是近年来发现的一种新型 DNA 转座子,Helitrons 转座子具有典型的 5'TC 以及 3'CTRR(R为A或G)末端,并在3'末端上游约 15~20bp 处有一个茎环结构,是转座子的终止信号。Helitrons 转座子转座后,通常插入 AT-rich 区域的 AT 靶位点。与I型转座子和II型转座子不同,Helitrons 通过滚环(rolling circle)的方式进行转座。并且,在滚环复制的转座过程中经常捕获和携带基因片段,可导致基因拷贝数的变化,也会在一定程度上促进基因组的进化。
来源于REXdb的分类详情如下:
--mobile_element
¦--Class_I
¦ ¦--SINE
¦ ¦--LTR
¦ ¦ ¦--Ty1
¦ ¦ ¦ °--copia
¦ ¦ ¦ ¦--Ale
¦ ¦ ¦ ¦--Alesia
¦ ¦ ¦ ¦--Angela
¦ ¦ ¦ ¦--Bianca
¦ ¦ ¦ ¦--Bryco
¦ ¦ ¦ ¦--Lyco
¦ ¦ ¦ ¦--Gymco-III
¦ ¦ ¦ ¦--Gymco-I
¦ ¦ ¦ ¦--Gymco-II
¦ ¦ ¦ ¦--Ikeros
¦ ¦ ¦ ¦--Ivana
¦ ¦ ¦ ¦--Gymco-IV
¦ ¦ ¦ ¦--Osser
¦ ¦ ¦ ¦--SIRE
¦ ¦ ¦ ¦--TAR
¦ ¦ ¦ ¦--Tork
¦ ¦ ¦ °--Ty1-outgroup
¦ ¦ °--Ty3
¦ ¦ °--gypsy
¦ ¦ ¦--non-chromovirus
¦ ¦ ¦ ¦--non-chromo-outgroup
¦ ¦ ¦ ¦--Phygy
¦ ¦ ¦ ¦--Selgy
¦ ¦ ¦ °--OTA
¦ ¦ ¦ ¦--Athila
¦ ¦ ¦ °--Tat
¦ ¦ ¦ ¦--TatI
¦ ¦ ¦ ¦--TatII
¦ ¦ ¦ ¦--TatIII
¦ ¦ ¦ ¦--Ogre
¦ ¦ ¦ °--Retand
¦ ¦ °--chromovirus
¦ ¦ ¦--Chlamyvir
¦ ¦ ¦--Tcn1
¦ ¦ ¦--chromo-outgroup
¦ ¦ ¦--CRM
¦ ¦ ¦--Galadriel
¦ ¦ ¦--Tekay
¦ ¦ ¦--Reina
¦ ¦ °--chromo-unclass
¦ ¦--pararetrovirus
¦ ¦--DIRS
¦ ¦--Penelope
¦ °--LINE
°--Class_II
¦--Subclass_1
¦ °--TIR
¦ ¦--MITE
¦ ¦--EnSpm
¦ ¦ °--CACTA
¦ ¦--hAT
¦ ¦--Kolobok
¦ ¦--Merlin
¦ ¦--MuDR
¦ ¦ °--Mutator
¦ ¦--Novosib
¦ ¦--P
¦ ¦--PIF
¦ ¦ °--Harbinger
¦ ¦--PiggyBac
¦ ¦--Sola1
¦ ¦--Sola2
¦ °--Tc1
¦ °--Mariner
°--Subclass_2
°--Helitron
最初TE是从玉米中鉴定出的Ac/Ds,控制籽粒颜色的转座子,芭芭拉•麦克林托克因此获1983年诺奖。玉米基因组中有85%的TE.
"If you know you are on the right track, if you have this inner knowledge, then nobody can turn you off ... no matter what they say.” --芭芭拉•麦克林托克
转座子会引起的突变:
- 将自身插入功能基因的转座子或逆转座子可以使该基因失活。这便是假基因的来源。
- DNA转座子离开基因后,产生的缺口可能无法正确修复
- 同一序列(例如Alu序列)的多个副本可能会妨碍有丝分裂和减数分裂过程中精确的染色体配对,从而导致不平等的交叉,这是染色体复制的主要原因之一。
- TE使用多种不同的机制在其宿主基因组中引起遗传不稳定和疾病。
许多TE含有启动子来驱动自己的转座酶转录。这些启动子可引起连锁基因的异常表达,从而导致疾病或突变表型。
个人感觉:转座子在基因编辑领域有重大研究前景,特别是基因治疗。
转座子的分类示意图:
image.png
其中LTR-RTs是Long terminal repeat-retrotransposons,长末端反转录转座子,属于上面的I类转座子。LTR-RTs进一步细分,植物中LTR-RTs包括Ty1- COPIA反转录转座子和Ty3-gypsy。动物中除了前面两个,还有BEL/pao family。
LTR-RTs全面深入解读
假基因详情
假基因( pseudogene):功能基因的缺陷拷贝,它在序列结构上与功能基因非常相似,但已丧失了正常的蛋白质编码功能. 假基因主要分为(重复假基因)duplicated pseudogene和processed pseudogene or retropseudogene(加工假基因或转座假基因)。
重复假基因:DNA复制或染色体不均等交换过程中基因编码去发生突变(碱基替换、插入、缺失),属于正常基因以为序列变化,无法转录,所以成为假基因。
转座子假基因:mRNA反转录成cDNA插入整合到基因组上,由于插入位点不合适或序列变化而失去正常功能。
假基因的数量与选择压力和转座子的活性有关,选择压力越大,转座子活性高,反转录成的转座假基因越多。所以一般情况下,假基因的Ka/Ks比较高。假基因的功能主要是在RNA水平上,类似于ncRNA。