酵母单细胞转录组测序:揭示霉酚酸和鸟嘌呤对mRNA表达水平的影响

2022-04-18  本文已影响0人  熊猫人和熊猫猫

文献下载链接: A yeast-optimized single-cell transcriptomics platform elucidates how mycophenolic acid and guanine alter global mRNA levels
发表期刊:《Communications Biology》
影响因子:6.5
时间:2021年

1. 酵母单细胞测序原理

实验原理图
实验方法

2. 方案设计

方案背景:
MPA(霉酚酸)是一种延长寿命的化合物,可以减少de novo-GMP的合成,具体的生化途径已知如下,IMP-->XMP-->GMP-->GDP
(1)IMP-->XMP:IMP脱氢酶(IMD)催化肌苷5‘-磷酸(IMP)生成5’-磷酸黄嘌呤(XMP)
(2)XMP-->GMP:GMP合成酶(Gua1)催化5’-磷酸黄嘌呤(XMP)生成GMP。
(3)GMP-->GDP:鸟苷酸激酶(Guk1)催化GMP转化为GDP。
尽管了解 MPA 通过抑制 IMP脱氢酶(IMD) 来减少 GMP 合成,但它如何影响GMP/GDP/GTP合成下游的单细胞转录组尚不清楚
在作者之前的研究中,就已经发现:霉酚酸(MPA)通过抑制GMP合成延长酵母的寿命,而这一效应可以被外源性补充的 鸟嘌呤 抑制。

设置1个对照组和3个实验组,酵母细胞在以下条件均培养18h

Illumina HiSeq2500:PE100测序

3. 结果分析

3.1 数据质控

3.1.1 双细胞率分析

作者使用以下5种算法计算双细胞率:DoubletFinder, Scrublet, DoubletDecon,scds, solo。
这些方法首先基于原始数据集,引入人工双胞模型,然后构建一个分类器来区分单胞和双胞。接着,这些方法为来自原始数据集的每个barcode提供了一个排序或分数,最终通过定义阈值来识别双胞。

DoubletDecon预测得到的双胞率高达53%(作者认为它有假阳性),而其他4种算法双胞率较低(~2–7%)

PCA点图:黑色表示双胞;灰色表示单胞
保守的双胞:被≥2种算法预测到的双胞
总计检出844个细胞(1个对照组+3个实验组),其中保守的双胞数量只有12个(双胞率2%)
作者认为这种方法的双胞率足够低,因为在哺乳动物的drop-seq实验中:50 cells/ul : 双胞率~ 5%; 100 cells/ul : 双胞率~ 11.3%
图B upset plot:用来查找被多个算法预测到的双胞数量。水平条形图(蓝色)表示在相应的工具中预测的双胞的数量。交集的大小表示在相应工具中预测的相同双胞的数量,对于由多个工具找到的双胞(称为保守的双胞),相应的条形图用黄色突出显示 图C PCA图:将图B中获得的“保守的双胞”在该图中以黄色的点展示
3.1.2 测序reads、转录本和基因计数的特征

有效reads占比:49.3% ~ 65.7%
捕获细胞数量: 85 ~ 268
平均转录本数量/cell: 840.19 ~ 1335.62
平均gene数量/cell: 443 ~ 578
酵母检出gene占比/sample:38.6% (M), 46.5% (G),55.7% (D), and 62.2% (MG)(酵母基因组总计6275个gene)
作者分析了过滤后的测序reads,以获得其GC含量和reads长度的条件特异性分布。

3.2 数据挖掘

3.2.1 等基因酵母群体显示出不同的转录组亚结构

作者将4个样本的数据合并(使用Seurat v3的merge 函数),同时将4个样本的矩阵数据标准化。通过降维分析可视化作图如下,可以看到不同组之间存在不同的转录特征。


4个样本(Dn=233,Gn=258,Mn=85,MGn=268细胞)的UMAP图
4个样本对应的差异基因表达的热图:颜色代表细胞在对应基因的标准化表达水平(黄色:表达水平高)

为了获得与数据对应的最佳定量聚类结果,作者进行单细胞共识聚类(SC3)得到如下图


单细胞共识聚类(SC3)方法:在4个样本的合并数据中识别出4个聚类

正如预期的那样,由于观察到的低群体异质性,几乎所有经过MPA处理的细胞都被映射到一个单一的SC3簇(SC3_4 3)。另一方面,大多数用DMSO或鸟嘌呤处理过的细胞被映射到3个或4个SC3簇中。


桑基图:4个样本映射到SC3的4个cluster (cluster 1n=331,cluster 2n=193,cluster 3n=164,cluster 4n=156细胞)。

为了定量评估与每种处理条件相关的亚群,作者分别对每个处理组特异性基因表达矩阵进行了SC3聚类分析。

DMSO:k=2可以合理地分辨出包含177和56个细胞的2个亚簇
鸟嘌呤:合理地分辨出包含135和123个细胞的2个亚簇
MPA:由于明显缺乏异质性,SC3无法将群体分解为多个亚簇
鸟嘌呤+MPA:k=3可以合理地分辨出包含166、77、25个细胞细胞的3个亚簇

根据对四种处理条件的分析得到的SC3聚类结果对细胞进行重新标记,可以看到不同绘图方案下的8个不同的亚聚类


三维PCA图:8个子簇的分布(D.1 n = 177,D.2n=56,G.1n=135,G.2n=123,M.1n=85,MG.1n=166,MG.2n=77,MG.3=n25细胞)。

将合并后的4个样本的数据进行SC3聚类分析(k=8),我们发现很大一部分细胞可以一致地映射到各样本的单个亚簇


桑基图:说明每个处理组中细分到的亚群,可以映射到8个SC3群
3.2.2 识别不同治疗条件和集群之间的差异表达基因

鉴定差异表达基因的方法:Wilcoxon检验(表达细胞占比>50%;平均对数变化绝对值>0.5)
以下热图可以很好地表示各样本不同cluster中的差异表达基因。

SC3鉴定的8个亚群对应的差异基因表达的热图:颜色代表细胞在对应基因的标准化表达水平(黄色:表达水平高)

作者同时以气泡图的形式展示4种不同聚类的差异表达基因


气泡图:SC3用k=4鉴定的聚类的一组差异表达基因。点的大小表示样本中表达相应基因的细胞百分比(直径越大,细胞占比越高),颜色表示样本中所有细胞中对应基因的标准化表达水平(颜色越深,基因表达越高)

挑选排名前4的差异表达基因作图如下:


箱线图显示SC3簇1中前4的差异表达基因 箱线图显示SC3簇2中前4的差异表达基因 箱线图显示SC3簇3中前4的差异表达基因 箱线图显示SC3簇4中前4的差异表达基因
3.2.3 在mpa处理的细胞中,选定的差异表达基因和生物学过程的分析
上一篇 下一篇

猜你喜欢

热点阅读