Science:微生物单细胞转录组测序(split-pool b
文献下载链接:Microbial single-cell RNA sequencing by split-pool barcoding
Supplementary materials:Microbial single-cell RNA sequencing by split-pool barcoding
发表期刊:《Science》
影响因子:63.714
时间:2020年
0. 背景介绍(microSPLiT-seq)
SPLiT-seq不需要细胞隔离,它兼容广泛的细胞形状和大小(参考下图 overview of SPLiT-seq),作者在前人的基础上做了改良,最终推出microSPLiT步骤如下:
- step1:样本细胞固定
- step2:细胞壁裂解和细胞透化
- step3:细菌mRNA通过PAP酶添加polyA尾巴
- step4:细胞被随机分配到96孔板(一个孔中可以有多个细胞),mRNA在细胞内通过逆转录酶(外加有条形码的多聚T序列和随机六聚体引物)转化为cDNA,每个well条形码不同,在此完成第一轮条形码标记
- step5:step4中不同孔的细胞被混合在一起,随机分配到新的96孔板,重复细胞内逆转录的步骤,在step4基础上延伸一段新的条形码序列到cDNA
- step6:以上这种 split-ligation-pool 的操作重复(共计3次,确保每个cell获得一个独特的条形码组合)
- step7:所有的细胞回收,裂解,添加测序接头构建NGS文库
1. microSPLiT-seq方法探索
1.1 实验设计
作者曾直接将SPLiT-seq的方法用于微生物单细胞转录组测序,但是捕获mRNA序列的数量极低,因此后续将从以下4个环节出发,探索microSPLiT-seq的最佳实践方案。
实验材料:大肠杆菌和鼠李糖乳杆菌
表1. microSPLiT-seq优化方案设计
随机六聚体引物: 是含有6个碱基的随机序列引物。5’末端带有磷酸基,3’末端为羟基末端。
-- 结构:5’-P-d(NNNNNN)-3’ ; N = G, A, T or C
-- 特点:具有高敏感性和较低的特异性
-- 应用场景:当特定mRNA含有使反转录酶终止的序列而难合成全长时;当目标mRNA没有polyA尾巴时
1.2 实验结论
最终microSPLiT与SPLiT对比的优化之处如下,:
(1)去除细胞壁:lysozyme
(2)细胞膜透化:温和洗涤剂Tween-20
(3)mRNA多聚腺苷化:大肠杆菌多聚(A)聚合酶I(PAP)
(4)去除核糖体RNA:5′-phosphate dependent exonuclease(能够消化具有5'-磷酸末端的RNA,不消化具有5'-三磷酸,5'-帽或5'-羟基的RNA); 核糖体RNA特异性探针+RNase H酶(降解RNA/DNA杂交链中的RNA链)
(5)作者发现RT的步骤容易导致细胞结块,因此在这一步骤之后进行轻度超声处理获得单细胞悬液是必要的。
(1)Lysozyme (5mg\ml) 对革兰氏阴性菌(大肠杆菌)和革兰氏阳性菌(枯草芽孢杆菌)都有较好的破壁效果 (图1A&B)
(2)通过PAP进行mRNA多聚腺苷化可以显著提高细菌的mRNA捕获效率(图1A&B)
(3)优化的组合方式已经验证对革兰氏阳性(枯草芽孢杆菌)和革兰氏阴性(大肠杆菌)有效(图1C&D)
图A与图B的处理组注释:
- P1: 0.5%Triton-X100 + Lysozyme (5mg\ml)
- P2: 0.5%Triton-X100 for E. coli;0.5%Triton-X100 + Lysozyme (20mg\ml) for B. subtilis
- HS:热休克样本
- PAP:大肠杆菌多聚(A)聚合酶I(PAP)处理
以下3个处理均使用P1的方法透化:- RNAseH:核糖体RNA特异性探针+RNase H酶(降解RNA/DNA杂交链中的RNA链,即核糖体RNA)
- SSIV:使用反转录酶SuperScript IV reverse transcriptase (ThermoFisher)
- Smartscribe:使用反转录酶SMARTScribe reverse transcriptase (Takara Bio)
2. MicroSPLiT生成高质量的单细胞RNA-seq数据
2.1 实验设计
实验材料:大肠杆菌MW1255;枯草芽孢杆菌PY79
取样时间点:OD600=0.5
实验处理:对每种培养物的一半进行短暂的47°C热休克
实验操作:对两种细菌混合进行了microSPLiT实验,使用第一个barcode作为样本标识符
实验操作
2.2 实验结论
(1)总计获得2682个单细菌文库,99.2%的单细胞数据匹配到单一物种(图1D)
(2)核糖体RNA污染严重:枯草芽孢杆菌(90%),大肠杆菌(95.9%)(图2A)
(3)gene检出量偏低:枯草芽孢杆菌(230/cell),大肠杆菌(138/cell)(图2B)
(4)随机六聚体引物对mRNA,rRNA的捕获贡献更大(图2C)
(5)microSPLiT可以做到细胞分群,并且每个热休克cluster都有经典热休克基因特异性高表达(图3)
(6)大肠杆菌中有一个亚群(cluster 5)特异性高表达冷休克基因,可能由甲醛固定前的冷冻离心造成(图3)
图2. MicroSPLiT生成RNA数据汇总;图A. 枯草芽孢杆菌和大肠杆菌各种RNA的检出比例;图B. 枯草芽孢杆菌和大肠杆菌的基因,mRNA,rRNA,tRNA,ncRNA检出量统计图;图C. polyT与随机六聚体引物扩增得到不同种类RNA的统计图通过去除multiply aligned reads,可过滤掉绝大部分核糖体RNA序列
图3. microSPLiT的单细胞转录组数据分群;图A. 根据处理条件对亚群划分;图B. 无监督聚类分群;图C. 不同cluster高表达基因热图;图D. cluster1,cluster3,cluster5高表达基因散点图:横坐标表示高表达倍数,纵坐标表示gene在该cluster高表达的显著性
3. 枯草芽孢杆菌在富培养基中生长时的动态转录图谱
3.1 实验设计
实验材料:枯草芽孢杆菌PY79(富培养基LB培养)
取样时间:从OD600为0.5(早期指数阶段)到6.0(早期稳定阶段),总计取样10次(其中4次取样设置有重复,如图4A)
实验操作:使用第一个barcode作为不同取样点的样本标识符,对所有的细菌混合进行了microSPLiT实验
3.2 实验结论
3.2.1 microSPLiT揭示了广泛的细胞通路的异质性
(1)总计产生25,214个细胞,无监督聚类分为14个亚群,其中绝大多数只对应一种OD样本(图4B)
(2)cluster 9: 来自OD600在2-3.2的细胞,差异表达肌醇代谢途径基因(图4B&C)
(3)cluster 13: 来自5个不同OD600吸光度的细胞,有与缺陷的PBSX原噬菌体相关的独特基因表达(图4B&C)
sigma因子(原核RNA聚合酶特异性的主要调控因子,直接影响不同环境条件下的转录变化),对于sigma因子调控的基因,作者将其表达水平平均化得到如下(4)-(7)结论(图4D):
(4)管家σA活跃在生长阶段的早期
(5)细胞外功能(ECF)sigma因子调控在生长阶段中可以区分为明显的两组(cluster0-5;cluster6-13)
(6)与应激反应相关的σB随着细菌生长退出指数阶段上升,然后又在停滞阶段下降
(7)孢子形成相关σ因子在生长曲线晚期更活跃(但是此类调控因子活跃的细胞比例偏低)
(8)碳利用、胁迫反应、金属吸收、发育决策等调控机制相关的转录因子活性在不同cluster中存在异质性(图4E)
图4.microSPLiT揭示了广泛的细胞通路的异质性; 图A. 2个实验的采样光密度点覆盖在本次实验的生长曲线上:绿色的点表示存在样本重复;图B. 枯草芽孢杆菌的无监督聚类分群图;图C. 枯草芽孢杆菌在LB培养基的10个采样点在各cluster中的分布;图E. sigma因子在各cluster的调控差异:横轴表示不同的gene,纵轴表示不同cluster,气泡的颜色表示该活性因子调控的基因平均表达水平,气泡的大小表示至少有一个(对应sigma因子调控的)基因表达的细胞占比;图D. 不同转录活性因子在各cluster中的调控差异
3.2.2 中心碳代谢的变化和替代碳利用途径的短暂激活
鉴于作者在转录调控因子分析中观察到碳利用调控的变化,便转向对每个聚类中富集的碳代谢基因进行了更全面的分析。
在每个OD样本中,这些通路的细胞比例不同,并且似乎遵循一个时间顺序
(1)早期ODs对应的cluster(cluster 0-4)中,观察到参与糖酵解的基因的峰值表达,如ptsG和ldh、pdhA、ackA(图5A&B)
(2)在光密度值为1.7时,细胞经历了从糖酵解到糖异生的显著转变,cluster7和cluster8激活了多个糖异生途径(图5B&C)
(3)同时发现了一种不同的丙酮酸生产和利用模式:伴随着乙酰蛋白的代谢和其他营养通量进入三羧酸循环(图5A-C)
(4)观察到不同碳源的吸收和利用途径表达:首选的碳来源被耗尽时,替代碳利用途径CcpA的主要抑制因子变得不活跃,允许细胞分解多种碳水化合物(图5A-C)
(5)通路的激活和抑制在不同OD(光密度)样本中细胞的比例不同,并遵循着时间顺序呈现规律性(图5A-C)
图5.中心碳代谢的变化和替代碳利用途径的短暂激活;图A. 碳代谢基因在不同cluster中的差异表达热图;图B. 不同OD取样点定位到相应碳利用途径;图C. 高表达gene的feature_plot图
3.2.3 中间生长阶段肌醇分解代谢途径的异质性激活
肌醇存在于土壤中,而枯草芽孢杆菌可以以肌醇为唯一碳源而生存。虽然本次实验使用的LB培养基不含有肌醇,但在一个小的亚群cluster9中观察到肌醇利用途径的异质性激活。有3个操纵子参与肌醇的利用:iolT,iolRS, iolA。在没有诱导剂的条件下,IolR抑制了所有三个操纵子的转录。
推断其中的肌醇来源于培养基中的酵母提取物,因为酵母能够产生肌醇作为其必要的膜成分。
(1)通路抑制基因 iolR在cluster9内外都高表达(图6 SA),荧光报告基因显示3种操纵子(iolT,iolRS, iolA)在cluster9显著富集(图6 A)
(2)在LB中生长的对数阶段和早期固定阶段的细胞亚群中,肌醇代谢途径中的基因转录(iolT,iolRS, iolA)以异质方式被激活(图6B-D)
3.2.4 枯草芽孢杆菌面对不利生存条件的行为异质性
背景内容:细菌普遍产生多肽和小分子抗菌素用来抵抗其他生物的生存威胁,枯草芽孢杆菌也会产生抗菌素。在活跃的生长过程中,枯草芽孢杆菌可以在形态学上表现为丝状无柄细胞或更小的运动细胞。但是,随着细胞密度的增加,枯草芽孢杆菌种群可以分化为产生活性素和产生细胞外基质的细菌。
(1)不同的ODs均有部分细胞表达一些广谱抗菌素,同时在最后3个ODs中观察到杀孢因子(SKF)和孢子延迟蛋白(SDP)显著上升(图7A)
(2)表达运动基因的细胞比例在在OD600=6时显著下降,同时 surfactin (srfA-D)检出率接近100%(图7B)
(3)参与未折叠蛋白反应的基因,如ClpP相关蛋白酶、McsA和McsB激酶和伴侣蛋白(groEL、ES)在OD600=1.7达到峰值,这与细胞从糖酵解转向糖异生的时间相同(图7C)
(4)作者还分析了与金属摄取相关的基因的表达,如铁载体杆菌蛋白(dhbA)与相关转运体(feuA)和锰转运体(mntA-D)(图7D)
图7. 枯草芽孢杆菌面对不利生存条件的行为异质性;图A.抗菌素表达动态;图B.运动基因表达动态;图C.参与未折叠蛋白反应的基因表达动态;图D.金属元素摄取相关基因的表达动态
3.2.5 MicroSPLiT量化了枯草芽孢杆菌中一种罕见的应激反应
PBSX原件来源于一种非传染性噬菌体,诱导后导致噬菌体样颗粒释放(其中包含13kb随机片段染色体DNA)。原噬菌体基因的表达是由DNA损伤诱导的,已知在指数生长过程中在一小部分细胞中被激活。(图8B)
(1)发现了一个处于噬菌体诱导状态的细胞亚群:cluster13(36个细胞,或占总细胞的0.142%,代表ODs在0.5-2.8之间(图8A)
(2)捕获了主要噬菌体相关操纵子的表达:cluster13中差异表达的大多数基因代表已知的PBSX噬菌体基因,作者基于此鉴定了11个在PBSX原噬菌体簇中表达的已知或假定功能的宿主基因,其中5个基因已经被证明仅在枯草芽孢杆菌的PBSX携带菌株中被诱导(图8C)
图8. MicroSPLiT量化了枯草芽孢杆菌中一种罕见的应激反应;图A. 在t-SNE图上显示了PBSX原噬菌体簇(36个细胞);图B. PBSX原噬菌体诱导研究;图C.在PBSX原噬菌体簇中富集的基因的标准化平均表达,包括原噬菌体和宿主基因
3.2.6 MicroSPLiT捕获了一种罕见的随机诱导的发育状态
在胁迫或营养限制下,一小部分(2-5%)枯草芽孢杆菌细胞经历随机瞬时分化为自然能力状态,其特征是能够摄取细胞外DNA并将其整合到染色体中。(图9A)这种情况通常在有营养限制的情况下发生,因此作者分别对最后两个ODs(分别为5.3 和 6)进行了亚聚类。
(1)获得一个表达明显的感受态状态或K-state的cluster,包含62个细胞,OD值为5.3和6的细胞占4.6%(图9B)
(2)捕获已知高表达的gene如comGA和sucCD之外,作者还发现一些DNA摄取机制相关基因,响应调节器(rapH),处理内化的ssDNA所必需的基因,以及其他DNA加工相关基因都在competent cluster中显著高表达(图9C)
4. 结论汇总
4.1 方法优势
(1)实现细菌聚类分群:生长在富营养培养液中的枯草芽孢杆菌在不同OD值取样,通过MicroSPLiT可以发现不同的细胞亚群(表现出不同的代谢、应激反应或发育途径的基因表达)
(2)挖掘通路特异性激活的细菌类群:在枯草芽孢杆菌生长曲线后期(later OD points)发现一小部分细胞中肌醇分解代谢途径短暂性激活
(3)发现罕见细菌亚群:可以检测到0.142%的罕见细菌亚群,表明microSPLiT有能力揭示生理相关的罕见细菌细胞状态,这是bulk RNA-seq和低通量单细胞测序方法难以实现的
(4)检出罕见的随机诱导的发育状态:检出存在HGT事件的细菌,并评估其被随机诱导的发育状态
(5)tRNA, microRNA, lncRNA检出
4.2 方法劣势
(1)复杂的自然微生物群落需要优化使用:需要根据待处理样本特性,调整microSPLiT的 “细胞壁裂解”、“细胞膜透化”、“mRNA富集”的步骤
(2)mRNA捕获效率存在偏好性: 停滞期细菌的 UMI counts总是低于对数增长期
(3)rRNA污染严重:转录组文库中rRNA占比超过90%
(4)基因检出率偏低:枯草芽孢杆菌(230 genes/cell),大肠杆菌(138 genes/cell)