以一篇文章为例,总结单细胞文章分析框架
作者:ahworld
链接:以《致癌物或病毒介导的HNSCC免疫图谱》为例总结单细胞文章分析框架
来源:微信公众号-seqyuan
著作权归作者所有,任何形式的转载都请联系作者。
上一篇我们分享的《一文了解单细胞基因调控网络(GRN)》中有提过:
scRNA-seq数据的表达矩阵之后大多数后续分析的重点是: 确定组织或癌症中细胞亚群的类型或状态,或研究动态变化过程,例如细胞分化、细胞周期或刺激反应。
用于解决上述问题的计算方法主要包括以下两方面:
- 使用聚类算法将细胞分为不同的细胞类型或状态
- 通过轨迹推断方法沿伪时间轴对细胞进行排序
除了以上两点之外还可以通过分析配体(表面或分泌的)和受体表达来探究推测细胞外在相互作用--细胞通讯
纵然大多文章的亚群聚类分析选择了R包Seurat,发育轨迹推断分析选择了Monocle2,但是我们在《单细胞轨迹分析知多少--拟时间分析比较》这篇文章中也介绍过Monocle2并非做轨迹分析的万金油。要发高分文章有一个不错的选择是:一个吸引人的生物学问题+自己开发的软件算法得到新的发现
。
Cillo A R, Kürten C H L, Tabib T, et al. Immune Landscape of Viral-and Carcinogen-Driven Head and Neck Cancer[J]. Immunity, 2020.
例如2020年发表在Immunity上的这篇文章,在文章DISCUSSION
的第一段结尾写的这样:
在这项研究中,我们使用了
新的生物信息学工具和方法
对HNSCC致癌物介导的(HPV-)或病毒介导的(HPV +)致癌作用的TME患者中所有CD45+免疫细胞进行了深入分析。 一般而言,我们的实验和分析方法可用于分析样本组之间细胞组成和转录状态不同的任何异质细胞群体。
瞧瞧,是不是有内味儿了,高分文章的标配。
上面提到的新的生物信息学工具和方法
就是以下几个:
- DRAGON:用于scRNA-seq数据的聚类
- singleseqgset:用于基因集富集分析,分群之后可以用它结合marker基因做亚群的功能鉴定等
- celltalker:从scRNAseq数据预测配体和受体相互作用
除此之外,文章中用于轨迹推断的方法是不同于一般算法的Diffusion map
,这种算法对于大数据集的项目的处理相较于Monocle2要好太多。
Diffusion map算法做轨迹推断分析在2016年发表的destiny和DPT两篇文章有原理介绍,后续我会做一个使用教程。linux下非root账号通过singularity运行dyno的坑还没有填上 ┗( T﹏T )┛
既然说到了celltalker
,我们就以这篇文章为例看一看scRNA-seq数据分析框架
样品情况
文章分析框架:这块本想做文字介绍,发现做成鱼骨头可能更清晰一些,具体的分析内容就看后文的文章详细解读章节吧。有了这个图在看文章时便会时刻清楚文中分析内容在整体框架中的的定位,不犯迷糊。
文章分析框架
想看的更清楚可以从以下网址下载
百度云: https://pan.baidu.com/s/1ZttS8Ezx_ruLswWURpkTyw
密码: hj3c
文章全篇围绕病毒和变异引起的HNSCC,这一发生在相似解剖位置的两种不同癌症病因的免疫状况差异展开。具体的解析请看后面的文章详细解读。
文章1点细节需要改正:
- Figure S2B,中间图的ylabel应该为FItSNE_2