单细胞测序scRNA-seq技术学习笔记(一)——概述
- 仅作学习交流用途,严禁用于商业用途
单细胞测序(scRNA-seq)的介绍
scRNA-seq:
单细胞测序是指在单个细胞水平上进行测序。
单细胞转录组测序( single cell RNA Seq scRNA seq )是指对于单个细胞水平上将 mRNA 反转录扩增后进行高通量测序的技术。
Bulk RNA-seq:
测量一个大的细胞群体中每一个基因的平均表达水平,对比较转录组学(例如比较 不同物种的相同组织) 是有帮助的,但对于研究异质性系统(例如,复杂的组织如脑)还是不够的,对于基因表达的本质研究不够深入
作用
- 珍惜样本,起始材料少
- 同一样本中的不同细胞存在差异性
单细胞测序通过在单个细胞水平上进行测序,解决了用组织样本无法获得不同细胞间的异质性信息或样本量太少无法进行常规测序的难题,为科学家研究单个细胞的行为、机制等提供了新的方向。
单细胞RNA seq 能够独立地提供每个细胞的 RNA 表达谱,并鉴定异质细胞群中的稀有细胞。尽管肿瘤异质性可归因于累积突变,但即使是遗传上相同的细胞在相同环境下也可能表现出基因和蛋白表达水平的差异,单细胞 RNA seq就能够发现这些稀有个体。
三个必备的技术基础
- 单细胞分离技术
- 高质量的扩增技术
- 高通量低成本的测序技术
发展现状与趋势
NCBI论文发表情况高通量测序技术带来的机遇
随着高通量测序技术的发展,单细胞测序成为了可能
测定的细胞量也由最初的102 涨到了106 并且还在递增,向着高通量的方向发展。现在有许多处理单细胞测序的流程,比如13年的SAMRT-seq2,12年的CELL-seq,15年的Drop-seq。有一些做单细胞的平台,包括Fluidigm C1、Wafergen ICELL8、10X Genomics Chromium。
随着高通量测序技术的发展,单细胞测序成为了可能
单细胞RNA测序往高通量低成本方向发展
单细胞RNA-seq的应用领域
- 干细胞研究
- 肿瘤研究
- 细胞图谱
- 神经系统
高通量单细胞RNA-seq平台
- Fluidigm-C1
- ICELL8 CellSelect
- Illumina & Bio-Rad
- BD Rhapsody
- 10x Genomics
常见单细胞测序平台的比较
常见单细胞测序平台的比较单细胞测序的流程:
单细胞基因组测序主要包括四个步骤:
单细胞基因组测序的四个步骤 单细胞测序的测序流程
与普通的mRNA转录组相比,取材要求更高了
信息分析流程
- 黄色部分对于高通量数据的处理都是差不多的流程;
- 橙色的部分需要整合多个转录组分析流程以及显著性分析,来解决单细胞测序的技术误差;
- 最后是下游表达量、通路、互作网络等生物类别的分析,需要使用针对单细胞研发的方法
可以借助许多工具:
- Falco [云端处理流程]
- SCONE(Single-Cell Overview of Normalized Expression)—一个质控和标准化的包
- Seurat-- QC以及后续分析探索数据
- ASAP(Automated Single-cell Analysis Pipeline) —交互式网页分析
面临挑战:
单细胞转录组与群体转录组的最大不同之一就是:测序文库是建立在单独一个细胞上的,并非一群细胞。
单细胞目前面临的挑战主要是:扩增量目前最多是一百万个细胞;有可能一个基因在一个细胞中能检测到中等表达量,但是在另一个细胞中却检测不到,这种现象叫做"gene dropouts"。下一步需要增加转录本捕获效率,减少扩增误差
分析方法与发展:
- CEL-seq (Hashimshony, 2012)
- CEL-seq2(Hashimshony, 2016)
- Drop-seq(Macosko, 2015)
- InDrop-seq (Klein, 2015)
- MARS-seq(Jaitin, 2014)
- SCRB-seq(Soumillon, 2014)
- Seq-well (Gierahn, 2017)
- Smart-seq (Picelli, 2014)
- Smart-seq2 (Picelli, 2014):
- SMARTer
- STRT-seq (Islam, 2013)
方法主要分为两大部分:定量与捕获。
两种定量类型:
- 全长:对每个转录本都试图获得一致的read覆盖度
- 基于标签(tag):只捕获5‘或者3’端的RNA
定量方法的选择也影响了后续分析的方法选择。理论上,全长的方法应该得到转录本的平均覆盖度,但是实际上,覆盖度经常是有偏差的。基于标签的方法能够利用特异性分子标记(Unique Molecular Identifiers, UMIs)提高定量准确度,但是呢,这种限制了转录组一端的方法又降低了转录本的可拼接性,让以后的isoform识别变得困难。
捕获:
捕获的技术决定了细胞如何被筛选、获取怎样的测序外的补充信息、数据产量
三种最常用的方法:
-
基于微孔 microwell-
可以使用细胞移液器或激光捕获分离细胞,并将他们放置于微液流孔中。
优势:- 可以与荧光触发细胞分离技术(FACS)结合,实现基于表面标记的细胞选择。对于想要分离特定细胞群的研究很有效;
- 可以对细胞进行拍照,帮助确定孔中是否存在损伤的或者重复的细胞。
缺点,通量低,对每个细胞进行操作需要很大的工作量。
-
微液流 microfluidic-(如Fluidigm's C1)
Fluidigm's C1
优点:
相对微孔,它的通量更高
缺点:- 只有10%的细胞能被捕获到,加入处理的细胞类型比较稀少,那么能被芯片捕获的就更少了,数据产出是不够的。
- 另外芯片相对较贵,但是试剂的价格在降低,日后可能总的价格也会下降。
-
微滴 droplet-
微滴技术
将单个细胞包裹在µl级别的液滴中,液滴被搭载到建库所用的酶上,每个微滴包含一个独特的条码(barcode),由那个被包装好的细胞产生的所有reads都被贴上了该条码,也是为了之后对于不同细胞reads的分辨。
优点:
一般微滴技术的通量最大,查资料得知一秒能包装7万个以上的液滴,并且建库费用合适--0.05美元/细胞。
缺点:
但是高额测序费用又成了他的短板,鉴定出的一般只有一千多个差异转录本,覆盖度还是比较低的
如何根据实验选择测序平台?
关于捕获,比如:如果想要分析组织中的成分,那么微滴技术可以提供数量可观的细胞;如果研究的细胞种群比较稀少,并且有已知的标记,那么最好用FACS,测少量细胞即可;
关于定量,比如:如果想要研究不同的转录本,由于标签是有限的,不可能全部标记完这些转录本,那么全长的转录本定量就更合适;UMIs只能用于使用标签的方法,在基因水平做定量更有优势。
2017年Ziegenhain所在的Enard团队和Svensson所在的Teichmann团队都比较了不同的方法组合:
- Ziegenhain使用同样的小鼠胚胎干细胞(mouse embryonic stem cells,mESCs)分析了5种不同的方法,控制细胞数量、测序深度一致,比较了方法的检测灵敏度、噪声水平以及各个方法的费用。结果显示了检测到基因的数目(给定一个检测阈值),结果显示drop-seq检测到的基因数目比Smart-seq2低了两倍。因此,方法的选择对于实验结果很重要!
Enard团队- Svensson使用的是已知浓度的合成的转录本(加入了spike-in)来检测不同方法的准确度和敏感度
Teichmann团队
参考阅读
- 单细胞测序教程
- 单细胞测序的知识
- Analysis of single cell RNA-seq datal
- 单细胞转录组测序原理,你能看懂多少?
- 行业研究:单细胞测序行业研究
- 单细胞测序的重要性及应用方向
- 单细胞多组学技术之深入解析
- 一篇Science告诉你单细胞测序的文章思路!
- 单细胞测序综述
- 单细胞测序技术(single cell sequencing)
- 行业研究:单细胞测序行业研究
- 华大智造课程《单细胞转录组测序核心技术解析》——梁可 2018.09.28