第17周-单细胞转录组揭示乳腺癌病人异质性
单细胞转录组揭示乳腺癌病人异质性
单细胞转录组在癌症研究领域应用价值很大,包括:
- Non-invasive monitoring of circulating tumour cells
- estimation of tumour heterogeneity
- early detection of small numbers of recurrent tumours
- sensitive monitoring of rare cell populations
招募的乳腺癌患者基本情况
虽然只有11个病人的数据,但是涵盖了4种乳腺癌的分类;
- ER-positive (BC01 and BC02; luminal A)
- ER/HER2-positive (BC03; luminal B)
- HER2-positive (BC04, BC05 and BC06; HER2)
- triple- negative (BC07–BC11; TNBC) invasive ductal carcinoma
因为提取的单细胞并没有进行FACS筛选,所以包括以下;
- 癌症细胞
- 非癌细胞
- fibroblasts
- adipocytes
- endothelial cells
- diverse immune cells
单细胞转录组数据
用的是microfluidic chips捕获单细胞,建库是SMARTer Ultra Low RNA Kit
去除低质量细胞:
- (1) number of total reads;
- (2) mapping rate;
- (3) number of detected genes;
- (4) portion of intergenic region.
去除低质量基因
- First, TPM values < 1 were considered unreliable and substituted with zero.
- Second, TPM values were log2-transformed after adding a value of one.
- Third, genes expressed in < 10% of all tumour groups were removed.
最后剩下 515单细胞和17,779基因!
单细胞转录组数据在 :GSE75688 可以下载,里面也包括了bulk的转录组数据。
Bulk tumor transcriptomes showed significant correlations with the average of single cell transcriptomes.
外显子数据
外显子测序用的是 SureSelect XT Human All Exon V5 kit,illumina测序仪的PE100,走的是标准肿瘤外显子流程,找somatic mutation用的是mutect软件,CNV分析用的是Control-FREEC ,肿瘤约100X,正常对照组织约50X。
外显子数据在 SRP067248 可以下载,共24个测序文件。
肿瘤外显子数据分析结果都放在附件,应该是作者认为不是本文的亮点,就是有哪些突变信息描述一下,然后提到一下TNBC的拷贝数变化剧烈这个现象。
CNV对细胞进行分类
总共的 515单细胞根据CNV模式可以分成
- 317 epithelial breast cancer cells
- 175 tumour-associated immune cells
- 23 non-carcinoma stromal cells
这里的CNV分析算法相比broad提出的算法改进了,采取了GTex数据库的breast组织的表达信息做过滤。183 mammary tissue data from GTEx portal (http://www.gtexportal.org/). 如下图:
image区分成功了肿瘤细胞与否,就能对每个病人的不同细胞类型进行比较,比如分组计算表达相关系数,结果如下;
image同一个病人的肿瘤细胞及其非肿瘤细胞的区别变化范围很大,说明了其异质性。
很明显,对恶性细胞来做主成分分析后聚类发现每个病人都聚成自己独立的类,而对非肿瘤细胞来说,会根据细胞类型来聚类,不同的个体这样的影响因素很小,如下图:
image功能分析
检查了包括:
- epithelial–mesenchymal transition (EMT)
- stemness
- angiogenesis
- proliferation
- recurrence
这些重要的功能通路。
计算一下signature scores
这里使用的是 ESTIMATE 算法:
- Tumour score
- Stromal score
- immune signature
这些计算都是为了说明同一个病人体内取到的单细胞的确应该分类,而且不同的类别差别很大,如下图:
image两个重要的R包:
- GSVA software in the R package
- Molecular subtypes of tumours were predicted using the R package genefu.
- ER module score
- HER2 module score
(文章转自jimmy的2018年阅读文献笔记)
生信基础知识大全系列:生信基础知识100讲
史上最强的生信自学环境准备课来啦!! 7次改版,11节课程,14K的讲稿,30个夜晚打磨,100页PPT的课程。
如果需要组装自己的服务器;代办生物信息学服务器
如果需要帮忙下载海外数据(GEO/TCGA/GTEx等等),点我?
如果需要线下辅导及培训,看招学徒
如果需要个人电脑:个人计算机推荐
如果需要置办生物信息学书籍,看:生信人必备书单
如果需要实习岗位:实习职位发布
如果需要售后:点我
如果需要入门资料大全:点我