Hemberg-lab单细胞转录组数据分析

Hemberg-lab单细胞转录组数据分析(一)

2019-04-22  本文已影响0人  生信宝典

别人的电子书,你的电子书,都在bookdown一文中推荐过这一篇教程(https://hemberg-lab.github.io/scRNA.seq.course),从2016年一直更新到2018年,是入门单细胞分析的十分适合的文档。为了进一步促进学习,生信宝典申请并组织翻译这篇教程,将在公众号陆续推出。最后会有整合版以网页和PDF格式发布于易生信平台。

关于课程

采用高通量测序技术获取单细胞水平的全转录组数据又称scRNA-seq已应用越来越广泛。scRNA-seq的优势是其同时具有单细胞水平的分辨率和基因组范围的检测能力,可以解决其他方法如bulk RNA-seq或单细胞RT-qPCR解决不了的问题。然而,分析单细胞数据需要新的方法,以前用于bulk RNA-seq的一些计算方法的理论假设也不再适用。

在这个课程,我们讨论scRNA-seq可以解决的问题,以及可用的计算和统计学方法。原版课程是剑桥大学生物信息培训中心授课所用, 但文字版教材适用于任何对scRNA-seq分析感兴趣的人。课程每年两次,材料在开课前更新。

计算工具的数量增加很快,我们尽力更新至最新技术。这个课程的一个主要限制是我们倾向于使用在R里面实现并且速度相对快的工具 (其他语言实现的工具也通用,关键是理解原理)。另外,我们倾向于使用自己或朋友、同事开发的工具。(译者注:无可厚非,一是更了解,二是更容易获取帮助。我们也更倾向于使用自己的绘图工具ImageGP。)

视频

视频课录制于2017年11月,那时课程章节更少一些。视频在Youtube上,https://www.youtube.com/embed/56n77bpjiKo?list=PLEyKDyF1qdOYAhwU71qlrOXYsYHtyIu8n

GitHub

https://github.com/hemberg-lab/scRNA.seq.course

Docker 镜像 (RStudio)

课程可以通过安装了所有依赖包的RStudio的Docker镜像重现。

确保你的电脑已安装了Docker,如果没有,请参照Docker基础。运行下面命令启动Docker镜像:

docker run -d -p 8787:8787 quay.io/hemberg-group/scrna-seq-course-rstudio

这条命令会下载docker镜像 (看网速快慢,需要一些时间)。下载完成后,会启动Rstudio服务器版 (里面包含了依赖的程序包和数据)。

接下来就可以在基因组浏览器访问localhost:8787,使用用户名和密码rstudio:rstudio登录网页版Rstudio (R语言学习 - 入门环境Rstudio)。

更多关于运行RStudio docker镜像的选项见https://hub.docker.com/r/rocker/rstudio-stable/.

译者注:如果您参加过我们的易生信课程,这些操作都应该比较熟悉了。需要注意的是:1. 确认8787端口有无被占用,尤其是自己在服务器运行过Rstudio server时。2. 如果服务器有外网IP,可以在任何电脑的浏览器输入IP:8787访问。

译者注:如果不习惯Docker,或没有管理员权限,自己在Windows下安装依赖包也不费事。

手动安装

如果不使用Docker镜像,需要克隆或下载course GitHub repository并且在下载后的文件夹中启动R session。并且需要安装课程的docker文件: Dockerfile1 和 Dockerfile2中列出的所有包.

许可

所有课程材料遵循 GPL-3协议. 任何人都可以阅读这份材料来学习scRNA-seq数据分析. 如果应用于教学,除了提供合适的引用外,还请联系我们 (英文版:Vladimir Kiselev (vladimir.yu.kiselev@gmail.com),中文版 易生信 train@ehbio.com。)。

课程基础

课程适用于有Linux/UnixR基础的朋友 (蓝字可点击)。

另外,我们也假设您对常规转录组的比对和分析,以及常用的计算工具比较熟悉 (39个转录组分析工具,120种组合评估(转录组分析工具哪家强-导读版))。

否则,我们推荐先参加Introduction to RNA-seq and ChIP-seq data analysis 或 Analysis of high-throughput sequencing data with Bioconductor,然后再参加这个课程。

译者注:生物信息程序基础和常规转录组分析的中文版视频课程见:易生信原创课程 (如果是微信公众号,后台回复 培训获取)。

联系我们

如果您有任何 评论, 问题建议 请跟我们联系。(英文版:Vladimir Kiselev (vladimir.yu.kiselev@gmail.com),中文版 易生信 train@ehbio.com。)。

单细胞RNA-seq简介

混合RNA-seq

scRNA-seq

工作流程

image

总体而言,scRNA-seq的实验方案和bulk RNA-seq的相似。我们将在下一节一起讨论一些最通用的方法。

计算分析

本课程内容是scRNA-seq实验中得到的数据进行计算分析。总体流程如下图所示,前面三步(黄色)对于任何高通量测序数据是通用的,紧随其后的四步(橙色)是要将传统RNA-Seq分析中已有的方法和新开发的方法结合起来解决scRNA-seq的技术差异问题,最后的部分(蓝色)是使用专门为scRNA-seq开发的方法来进行生物分析解读。

image

scRNA-seq分析的综述有几篇,包括 Computational and Analytical Challenges in Single-Cell Transcriptomics.” Nat Rev Genet 16 (3) 。

目前还有其他平台可以执行上述流程图中的一步或多步操作:

image image image

挑战

Bulk RNA-seq和scRNA-seq的主要差别是每个测序文库代表一个单细胞还是一群细胞。比较不同细胞(不同测序文库)的结果需要格外注意。文库之间差异的主要来源是:

取自于单独一个细胞的低转录本总量是这两个文库差异的一个主要原因。提高转录本捕获效率和降低扩增偏好可以降低差异,是目前活跃的研究方向。从后续课程学习中也可以看 到,合适的标准化和校正方法也可以抵消一部分文库构建引入的噪音。

上一篇下一篇

猜你喜欢

热点阅读