生信分析流程生物信息学与算法

第17周-单细胞转录组揭示乳腺癌病人异质性

2018-11-19  本文已影响121人  小梦游仙境

单细胞转录组揭示乳腺癌病人异质性

单细胞转录组在癌症研究领域应用价值很大,包括:

招募的乳腺癌患者基本情况

虽然只有11个病人的数据,但是涵盖了4种乳腺癌的分类;

因为提取的单细胞并没有进行FACS筛选,所以包括以下;

单细胞转录组数据

用的是microfluidic chips捕获单细胞,建库是SMARTer Ultra Low RNA Kit
去除低质量细胞:

去除低质量基因

最后剩下 515单细胞和17,779基因!

单细胞转录组数据在 :GSE75688 可以下载,里面也包括了bulk的转录组数据。

Bulk tumor transcriptomes showed significant correlations with the average of single cell transcriptomes.

外显子数据

外显子测序用的是 SureSelect XT Human All Exon V5 kit,illumina测序仪的PE100,走的是标准肿瘤外显子流程,找somatic mutation用的是mutect软件,CNV分析用的是Control-FREEC ,肿瘤约100X,正常对照组织约50X。

外显子数据在 SRP067248 可以下载,共24个测序文件。

肿瘤外显子数据分析结果都放在附件,应该是作者认为不是本文的亮点,就是有哪些突变信息描述一下,然后提到一下TNBC的拷贝数变化剧烈这个现象。

CNV对细胞进行分类

总共的 515单细胞根据CNV模式可以分成

这里的CNV分析算法相比broad提出的算法改进了,采取了GTex数据库的breast组织的表达信息做过滤。183 mammary tissue data from GTEx portal (http://www.gtexportal.org/). 如下图:

image

区分成功了肿瘤细胞与否,就能对每个病人的不同细胞类型进行比较,比如分组计算表达相关系数,结果如下;

image

同一个病人的肿瘤细胞及其非肿瘤细胞的区别变化范围很大,说明了其异质性。

很明显,对恶性细胞来做主成分分析后聚类发现每个病人都聚成自己独立的类,而对非肿瘤细胞来说,会根据细胞类型来聚类,不同的个体这样的影响因素很小,如下图:

image

功能分析

检查了包括:

这些重要的功能通路。

计算一下signature scores

这里使用的是 ESTIMATE 算法:

这些计算都是为了说明同一个病人体内取到的单细胞的确应该分类,而且不同的类别差别很大,如下图:

image

两个重要的R包:

(文章转自jimmy的2018年阅读文献笔记)

生信基础知识大全系列:生信基础知识100讲
史上最强的生信自学环境准备课来啦!! 7次改版,11节课程,14K的讲稿,30个夜晚打磨,100页PPT的课程。
如果需要组装自己的服务器;代办生物信息学服务器
如果需要帮忙下载海外数据(GEO/TCGA/GTEx等等),点我?
如果需要线下辅导及培训,看招学徒
如果需要个人电脑:个人计算机推荐
如果需要置办生物信息学书籍,看:生信人必备书单
如果需要实习岗位:实习职位发布
如果需要售后:点我
如果需要入门资料大全:点我

上一篇下一篇

猜你喜欢

热点阅读