蛋白质融合标签
1. 简介
蛋白标签(Protein tag)技术是指利用基因克隆手段,将具有特定功能的多肽,蛋白质结构域,甚至完整蛋白质与目标蛋白融合在一起,以实现目标蛋白的表达纯化,检测和示踪等应用的技术。蛋白标签融合已经成为蛋白质研究中最常用的技术之一,下面小编就为大家盘一盘这些常用标签的特点及应用。
2. 功能及分类
蛋白标签根据其功能,大致可以分为检测标签、表达纯化标签和示踪标签三类。
2.1 检测
蛋白质的检测方法包括质谱、酶活检测、免疫分析等,其中应用最为广泛的是免疫分析,常用的方法有:WB(Western Blot)、ELISA(Enzyme Linked Immunosorbent Assay)、IP(Immunoprecipitation)等。免疫分析需要将目标蛋白作为抗原,注射动物,然后从免疫血清中分离抗体,根据抗原-抗体间的免疫反应进行特异性检测。这种方法最大的缺陷就是每更换一个目标蛋白就要制备一个对应的抗体,操作繁琐,成本昂贵。融合标签的使用,使蛋白质免疫分析走向通用化和便利化。我们将特定的标签与目标蛋白融合后,两者是共同表达的,通过检测融合标签,可以得到目标蛋白的表达情况。经过长期的研究,目前已经开发出一些比较成熟的检测标签,下面就挑几个来介绍一下:
1) HA
HA标签,属于小标签,共9个氨基酸,标签序列YPYDVPDYA,源于流感病毒的红细胞凝集素表面抗原决定簇,对目标蛋白的空间结构影响小, 可融合到N端或者C端,可购买商业化的Anti-HA抗体检测。HA标签常用于蛋白质印迹,免疫荧光和免疫沉淀实验,偶尔用于ELISA和ChIP分析。
2) His
His标签,也是小标签,多指6个组氨酸多肽,该标签对目标蛋白的空间结构影响极小, 可融合到N端或者C端,一般无需切除也不会对目标蛋白功能产生影响,可购买商业化的Anti-His抗体检测。His标签常用于蛋白质印迹实验。
3) c-Myc
Myc标签,包含人类原癌基因Myc的10个氨基酸区段,序列为EQKLISEEDL,可融合到目标蛋白N端或者C端。由于可获得高特异性抗Myc单克隆抗体,因此在Western印迹,免疫荧光和免疫沉淀实验中被广泛使用,但是很少用于蛋白质纯化。目前,市场上已有很多可供选择的商业化c-Myc抗体。
4) Flag, 3×Flag
FLAG标签,是目标蛋白中一种比较流行的短肽标签,序列为DYKDDDDK,可以与蛋白质的C端或N端融合。由于其包含肠激酶的识别位点(DDDDK),可方便去除,因此比较适合融合在目标蛋白N端。Flag标签与同类标签相比,更具亲水性,因此通常不会变性或使与其连接的蛋白质失活,常用于真核表达系统中目标蛋白的检测。目前已经开发出性能更好的3×Flag 标签,共22个氨基酸,分子量2.7KDa。3×Flag标签序列不是唯一的,有文献直接用3个Flag的串联重复,这不利于标签的去除,常用的序列为序列为DYKDHDGDYKDHDIDYKDDDDK。3×Flag可免疫原性和与抗体的亲和性得到极大增强,适用于真核生物低水平表达的蛋白的检测和纯化。目前,市场上已有很多可供选择的商业化Flag及 3×Flag抗体。
5) S
S标签,是一段来源于胰腺核糖核酸酶 A(RNase A)N 末端的短肽,氨基酸序列为KETAAAKFERQHMDS。 通常将 S-tag 构建到目标蛋白的 N 末端或 C 末端上,可以使用商业化的 S-tag 抗体进行免疫检测。此外,S-tag与S-蛋白质(同样来自于RNase A)之间有强烈相互作用,因此S-tag可用于蛋白质纯化,但由于洗脱条件较苛刻,为了获得有功能的蛋白质推荐用蛋白酶切割标签,然后洗脱目标蛋白。
6) T7
T7标签,一种源自T7噬菌体衣壳蛋白的表位标签,序列为MASMTGGQQMG,可融合到目标蛋白质的N或C末端,可购买商业化的Anti-T7抗体检测。T7标签常用于蛋白质印迹实验。
7) V5
V5标签,是猿猴病毒5(SV5)副粘病毒P和V蛋白上存在的小表位(Pk)短肽,序列为RNA聚合酶α亚基的95-108位氨基酸残基GKPIPNPLLGLDST,可被融合到目标蛋白的N或C末端。在文献报道中,大多将V5融合到目标蛋白C端,常用于哺乳动物和昆虫细胞表达系统蛋白质印迹,免疫荧光和免疫沉淀检测。
2.2 表达与纯化
蛋白质纯化的方法有很多,离子交换、疏水层析、分子筛和亲和层析,其中纯化效果最好的无疑是亲和层析,它利用基质与蛋白标签间的特异性结合,以极高的得率和纯度获得目标蛋白。下面就挑几个常用的纯化标签来介绍一下。
1) His
His标签,大多是指六个组氨酸组成的融合标签,即His6,可融合在目的蛋白的C末端或N末端。His标签在蛋白质纯化领域可谓是“最靓的仔”,1987年,Hochuli等首次提出利用组氨酸标签纯化蛋白质,至今His标签在蛋白质纯化领域仍有最广泛的应用。组氨酸残基侧链与固定的镍离子有强烈的吸引力,可用于固定化金属螯合层析(IMAC)。标签的分子量小,只有约0.84KD,一般不影响目标蛋白的功能,此外His标签也可用于免疫检测,而融合His标签的蛋白免疫原性较低,可将纯化的蛋白直接注射动物进行免疫并制备抗体。
2) GST
GST(谷胱甘肽巯基转移酶)标签,是蛋白质纯化最常用的标签之一,GST是大标签,它是一个完整的蛋白质,分子量约26KD。GST一方面具有高度可溶性,能够增加目标蛋白的可溶性;另一方面它可以在大肠杆菌中大量表达,提高目标蛋白的表达量。因此被广泛应用于各种融合蛋白的表达,可以在大肠杆菌和酵母菌等宿主细胞中表达。GST标签融合蛋白可直接从细菌裂解液中利用含有还原型谷胱甘肽琼脂糖凝胶的亲和树脂进行纯化,用10mM 还原型谷胱甘肽洗脱,可得到高浓度、高纯度融合蛋白。不过由于GST标签较大,通常需要将该标签切除,因此GST一般融合在靶标的N端。对于目标蛋白为活性酶的情况,如果经过活性验证确认GST对酶的活性没有影响,也可以保留标签。目前,也有很多商业化的GST抗体可用于对目的蛋白进行用特异性检测。
3) MBP
MBP(麦芽糖结合蛋白)标签,是蛋白质纯化最常用的标签之一,也是大标签,分子量大小在40kDa以上,由大肠杆菌K12的malE基因编码。MBP可增加目标蛋白在细菌中的溶解性,尤其是真核蛋白,也可以增加融合蛋白表达量。MBP可以和交联淀粉亲和树脂结合,结合的融合蛋白可用10-20mM麦芽糖在温和条件下洗脱,得到高纯度、高浓度目标蛋白。MBP的特点与使用方法与GST十分相似,也有专门的商品化抗体进行检测。需要注意的是,MBP序列有两种形式,一种N端含有信号肽,适用于毒性蛋白的表达纯化,一般融合在N端;一种不含信号肽序列,可融合在N端或C端,多融合在N端。
4) CBD
CBD标签,一般是指来源于枯草杆菌的几丁质结合结构域,分子量约5kDa,该标签由NEB公司推出,结合其IMPACT(Intein Mediated Purification with an Affinity Chitin-binding Tag)系统,用于(毒性)目标蛋白的表达与纯化。在IMPACT系统中,CBD和一个来源于酵母的intein蛋白质组成一个双效的融合标签。Intein是一个蛋白质剪接元件,类似于基因组中的内含子,intein在较低的温度和还原条件下发生自身介导的N端裂解,可以释放出与之相连的目的蛋白。也就是说融合表达产物在挂上亲和层析柱后只需要在低温(4℃)条件下用含DTT,或者巯基乙醇,或者半胱氨酸的溶液洗脱,即可将目的蛋白洗脱,而将融合标签留在纯化柱上,而还原剂的小分子可以非常简单的去除。后来NEB推出了IMPACT-CN系统(即融合标签可以选择在目的蛋白的C端或者N端)和更加灵活便利的IMPACT—TWIN系统,感兴趣的可以自己去了解下。
(我使用过该系统,但效果并不像宣传的那么理想,原因有两个:1)因为要使用DTT作为切割剂,不适合含有内部二硫键蛋白质的纯化 2)融合基因在体内体外均存在较大的自剪切风险,在纯化毒性较大的蛋白质时,很难得到目标蛋白。)
5) Strep-tag
Strep标签,一般指Strep-tag II,是长度8个氨基酸的短肽,序列为WSHPQFEK,可以融合在目标蛋白N端或C端。Strep标签融合蛋白与链霉菌抗生物素蛋白柱上的基质特异性结合,D-生物素或其衍生物可作为洗脱剂,从而实现融合蛋白的特异性纯化。由于,抗体柱十分昂贵,Strep标签在蛋白纯化中并不常用。
6) Halo-Tag
Halo标签,是一种细菌脱卤素酶的遗传修饰衍生物,可与多种合成的Halo-Tag配基有效地共价结合,分子量为33KDa,可融合在重组蛋白的N端或C 端,并在原核和真核系统中表达。
7) SNAP-tag
SNAP-标签,是一种人的O6-甲基鸟嘌呤-DNA甲基转移酶的突变体,长度为182个氨基酸,分子量约19 kDa,可与任何目标蛋白质融合,并进一步用合适的配体(例如荧光染料)进行特异性和共价标记。将纯化的或未纯化的SNAP-Tag融合蛋白与表面固定了苯甲基鸟嘌呤的基质混合,蛋白即可特异与底物作用,形成共价键,融合蛋白间接被固定在了基质表面上,可以达到更方便快捷地研究蛋白功能或纯化蛋白的目的。SNAP-Tag是新一代的蛋白标签技术,不仅专一性极高而且稳定,最大的优点是适用于多种环境下的蛋白质检测与纯化,如活细胞内、溶液中、或固态相(如SDS-PAGE gels)等。
8) SUMO
SUMO标签,是一种小分子泛素样修饰蛋白(Small ubiquitin-like modifier),在一级结构上与泛素只有18%的同源性,但两者的三级结构及其生物学功能却十分相似。研究发现,SUMO可以作为融合标签,不但可以提高融合蛋白的表达量,且具有抗蛋白酶水解以及促进目标蛋白正确折叠,提高重组蛋白可溶性等功能。此外,使用SUMO蛋白水解酶,能识别完整的SUMO标签,并高效的把SUMO从融合蛋白上切割下来。该标签主要用于改善目标蛋白的表达,并非常用的纯化标签,要用于纯化可采用双标签。
9) NusA、TrxA、DsbA
NusA标签是一种反转录终止因子,能增加融合蛋白的溶解度和表达;TrxA标签是硫氧还蛋白,几乎存在于所有生物中,它即可能会增加融合蛋白的溶解度,方便地纯化细菌粗周质提取物,也有助于外源基因形成二硫键;DsbA标签是蛋白质二硫键异构酶,能够增加目标蛋白溶解度,有助于形成二硫键。
这三种标签,主要用于改善目标蛋白的表达,本身不用于纯化,必须与另一个亲和标签联用方可实现蛋白质纯化。而且这三种标签均具有细胞周质定位作用,因此一般融合在目标蛋白N端。这三个都属于大标签,可能会影响融合蛋白的性质,一般来说纯化后需要去除。
2.3 示踪
示踪标签主要是指利用标签本身的荧光或者催化底物发射荧光或者可见光,来检测目标蛋白在生物体内定位、转移、互作的情况。示踪标签一般分子量较大,需要在标签与目标蛋白之间加Linker序列,避免两个蛋白相互影响各自的功能。示踪标签可与检测标签联用,用于目标蛋白的检测分析,也可与纯化标签联用用于后继纯化。
1) GFP、EGFP、YFP
GFP(Green fluorescent protein,绿色荧光蛋白)标签含有 238 个氨基酸,分子量约为 26.9 KDa,在维多利亚多管发光水母中发现的,在紫外线的照射下会发出绿色的荧光的蛋白,与靶蛋白融合后不会显著地影响天然蛋白质的组装和功能。EGFP 标签是增强型绿色荧光蛋白,与 GFP 相比,具有更高的折叠效率(由于正确折叠的蛋白质比例更高而增加的荧光),荧光强度更强、荧光性质更稳定。YFP(Yellow Fluorescent Protein ,YFP)标签,可以看做绿色荧光蛋白的一种突变体,其荧光向红色光谱偏移。这些标签与目标蛋白融合后,可以通过激光共聚焦显微镜,观察融合蛋白在生物体内的情况,常用于亚细胞定位、荧光共定位分析、在体荧光成像等实验。示踪标签可以加在目标蛋白的N端或C端,这个要视具体的情况而定,比如细胞定位示踪,如果定位序列位于目标蛋白N端,标签就要加在C端;如果定位序列位于C端,标签就要加在N;如果定位序列位于中间,可以加在N端或C端。
2) 萤光素酶
萤光素酶(Luciferase,Luc)常作为“报告蛋白”被用于分子生物学研究中,常见的有萤火虫荧光素酶、海肾荧光素酶和Guassia荧光素酶,他们可以催化荧光素底物发射荧光,作为示踪标签常用于活体成像、药物分析等领域。携带荧光素酶标签(Luc)的质粒转染入细胞后,导入研究动物如大小鼠体内,之后注入荧光素底物,通过生物发光成像技术(BLI)来检测光强度变化,从而实时监测疾病发展状态或药物的治疗功效等。也可以利用ATP对此反应体系的影响,根据生物发光强度的变化来指示能量或生命体征。
3) Gus
Gus标签,是细菌β-葡萄糖苷酸酶(β-glucuronidase),能催化许多β-葡萄糖苷酯类物质的水解。该酶可将X-Gluc水解生成蓝色物质,初始产物并不带颜色,为无色的吲哚衍生物,后经氧化二聚作用形成5,5’-二溴-4,4’-二氯靛蓝染料,此靛蓝染料使具有GUS活性的部位或位点呈现蓝色,可用肉眼或在显微镜下观察到。因为绝大多数植物细胞内不存在内源的GUS活性,因此gus基因广泛用作转基因植物的报告基因。用作融合标签时,gus标签可放在目标蛋白的N端或C端,所产生的融合蛋白一般仍具有GUS活性,这对研究外源基因表达的具体细胞部位提供了方便条件。
2.4 只有检测标签可用于蛋白检测吗?
当然不是,几乎任何标签都可以作为检测标签。不过上面这些标签应用比较广泛,检测灵敏度较高,对应抗体、试剂等也比较成熟,是最为常用的检测标签,在加检测标签时,可以作为首选。
2.5 检测标签只能用于蛋白检测而不能用于纯化吗?
当然也不是,检测标签、纯化标签、示踪标签,在功能上没有绝对的界限,所有的检测标签也可以用于纯化,只不过需要先制备对应的抗体固定到纯化基质上,比如S标签需要S蛋白固定到纯化树脂上,这就需要购买专门的纯化柱料,十分昂贵。当然也可以采取通用的做法,比如通过protein A吸附抗体,再利用抗体吸附融合的目标蛋白,但是这样做纯化效率可能不太高,吸附能力也有限,而且成本较高(protein A柱料的价格是Ni-NTA柱料的5-10倍),虽然这种方法可以得到极高的纯度,但并没有被普遍采用。
3. N端还是C端?
标签选好了,那到底是该加在N端还是C端呢?在较多的报道中,标签一般加在目标蛋白的C端,因为蛋白质折叠是从N端开始的,加在N端有被目标蛋白包埋的风险。但是,目前没有统一的标准,要具体情况具体分析,最好参阅相关文献。
3.1 检测标签
一般检测标签都是小标签,对目标蛋白的功能与结构影响不大,N端C端皆可。需要注意的是采用双标签的情况,如果是两个小标签,那就一边一个,一般不建议串联两个不同的标签,比如一个3×Flag检测标签,一个His纯化标签,那就应该把3×Flag放在N端,His放在C端,因为纯化之后大概率需要切除3×Flag,如果两者交换位置就无法实现这样的目的。
3.2 His标签
His标签是应用最广泛的标签,既可以用于纯化也可以用于检测,而且大多数情况不需要切除,加在N端存在提前终止翻译和无法终止翻译的可能,产生的副产物不利于分离纯化;加C端时存在次级翻译起始的可能,产生的副产物也不利于分离纯化,双端His有利于目标蛋白的准确检测与纯化,但可能影响酶的活性。
3.3 纯化标签 + 检测标签
纯化标签分子量较大,多数情况下要被切除,因此一般放在目标蛋白N端,检测标签放在C端,如过必需将大的纯化标签放在C端,检测标签可放在目标蛋白N端或者融合蛋白C端。但检测标签不能放在目标蛋白与纯化标签之间。
3.4 示踪标签 + 检测标签
对于GFP标签,大多用于目标蛋白的细胞定位,应此标签的位置就由定位序列位置决定,定位序列在C端,GFP就应该放在N端,检测标签应该放在GFP的N端;反之,GFP应放在C端,检测标签放在GFP的C端。
4. 需要切除标签吗?
当融合标签对目标蛋白的功能与结构没有影响时,不需要切除融合标签,这不是只针对小标签,大标签如GST、MBP等也是如此,NEB公司纯化的一些核酸工具酶就是融合了MBP标签的,我曾融合表达了MBP-APOBEC3A,MBP并不影响APOBEC3A的C→T活性,基因编辑技术中的AE和CE点编辑系统,就是基于Cas蛋白与APOBEC蛋白各自的功能实现的。两者分子大小相差极大但功能互不影响,就是因为各自的功能结构域折叠比较稳定,且无蛋白质间相互作用。如果融合标签与目标蛋白也满足这种关系,基本是不用去除标签的,不过这种影响是不可预料的,可以参考相关文献或者做预实验确定。
常用的去除蛋白标签的蛋白酶,及其识别序列如下表。
参考资料:
[1] Protein tag[维基百科], https://en.wikipedia.org/wiki/Protein_tag
[2] Kimple M E, Brill A L, Pasker R L. Overview of affinity tags for protein purification[J]. Current protocols in protein science, 2013, 73(1): 9.9. 1-9.9. 23.
[3] Marintcheva, B. Viral Tools for Protein Expression and Purification. Harnessing the Power of Viruses, 2018, 103–131.
[4] Terpe, K. Overview of tag protein fusions: From molecular and biochemical fundamentals to commercial systems. Appl. Microbiol. Biotechnol., 2002, 60: 523–33.
[5] Nilsson, J. et al. (1997) Affinity fusion strategies for detection, purification, and immobilization of recombinant proteins. Protein Expr. Purif., 1997, 11: 1–16.
[6] Malhotra A. Tagging for protein expression[M]//Methods in enzymology. Academic Press, 2009, 463: 239-258.