1 生物信息学科研 博士

文献阅读第三天

2018-07-14  本文已影响97人  刘小泽

刘小泽于18.7.14学习单细胞测序--scRNA-seq

选取的材料是剑桥大学的一门课程,最近更新时间是18-5-29,课程地址

写在前面:

scRNA-seq有什么特别之处吗?为何最近这么火,单单2018年就在各大期刊上发表了快600篇文章!

scRNA-seq趋势

它是什么?

对成千上万的单个细胞进行各式各样的二代测序,并且还尽量不搞混地获得单个细胞的遗传信息。它早在5年前就已经被Science杂志赋予了年度“奥斯卡”—年度技术奖。
目前二代测序百花齐放,DNA-seq、RNA-seq、BS-seq(甲基化组)、Chip-seq、ATAC-seq(利用转座酶获取染色质开放区域,研究与这段区域与一些调控蛋白的结合—这个特性叫染色质的可接近性,这个研究可以在DNA水平上了解转录调控)【要了解Chip-seq、ATAC-seq、DNase-seq的区别,可以参考:https://doi.org/10.1038/nrg3788

目前测序大多还是在分子水平解决问题,主要有这几个方面:

  1. DNA/RNA序列:排列顺序,各序列碱基丰度;
  2. DNA表观遗传:甲基化、羟甲基化、组蛋白修饰;
  3. RNA表观遗传:如2017年Nature发表的m6A修饰;【https://doi.org/10.1038/nature23450
  4. 染色质结构:3C、4C、HiC;
  5. 其他比如DNA损伤、蛋白间互作

scRNA-seq就是想更进一步从细胞水平去解释这些问题

为什么用它?

我们现在测序怎么测的?无论芯片还是NGS都是从大于10万细胞中抽取一大堆的DNA或者RNA。又是怎么分析的?是不是分析了一系列的均值、方差?但是,“世界上不存在两片相同的树叶”,细胞更是如此,细胞的多样性远超我们想象。比如我们体内的肝脏组织,具有大量各异的细胞类型,其中的每一种都来自不同的分化,行使不同的功能。

怎么用它?

基本的流程是:单细胞分离、提取、建库--> 全基因组/全转录组扩增 --> 测序分析

首先看一下如何分离提取?

第一种:

其实我们首先想到的就是:把单个细胞筛出来,独立构建文库

想想这种方法,单个进行操作,有没有很像早期的Sanger测序,虽然比较准,但是通量上不去,成本降不下来。要分析的细胞这么多,一个一个建库,时间成本也是个问题。一般的实验室能撑下来几十个细胞已经算高投入了,但是,一个组织中数万个细胞,癌症样本中数量更是多,单单这几十个能说明问题么?因此来了第二种方法。

第二种:利用barcode(标签)识别单细胞,就是为每个细胞加一小段特异的DNA序列,测序的时候,将携带一样标签的细胞算作同一个。这样一次测序可得到上千个细胞信息。

对于RNA测序的单细胞来说,只需要在逆转录前在poly T引物的5‘端加入;
对于DNA测序的单细胞来说,可以使用带有barcode的Tn5 高效转座酶(transposon) 对DNA进行随机插入【这个转座酶就相当于一个小间谍,当转座子从染色体的一个位置蹦到另一个位置上,Tn5就揣着着barcode尾随,并把barcode植入基因组DNA,这一步叫做tagmentation】虽然只用Tn5相比较第一种方法进步了不少,但总感觉和NGS的高通量级别不在一个层次上,因此又加了一步,组合索引(combinatorial indexing),即:两步反应,两次标签

combinatorial indexing 建库与标记细胞

这些方法的根本都离不开split-pool , 微珠、微孔、微液滴的物理技术的支撑

微流控技术(Microfluidics)这种技术就是不同于普通的96孔板的pool方法,它和微孔矩阵类似,每个微孔可以放入一个bead,每个稀释的细胞悬液在孔板上就能接触到bead,来引入barcode【doi.org/10.1016/j.cell.2018.02.001】这个技术是浙大郭国骥教授18年首发于cell

上一篇下一篇

猜你喜欢

热点阅读