R_语言

生信分析 单细胞lncRNA分析,有它就够!

2020-12-30  本文已影响0人  概普生信

今天,小编给大家介绍一个基于单细胞测序数据分析lncRNAs表达、分类和功能的数据库:ColorCells (http://rna.sysu.edu.cn/colorcells/),发表于Briefings in Bioinformatics (IF=8.99)。小编首先详细介绍该数据库的内容以及使用方法,最后再简述一下构建过程。生信人阅览更多精彩文章

ColorCells的功能如图1所示,主要有五部分

1、识别细胞特异性lncRNA

2、衡量细胞间的关联关系

3、识别不同类型的基因

4、比较不同的细胞簇以及分别利用mRNA

5、lncRNA对细胞进行分类

图1. ColorCells的主要功能

接下来,我们通过实例来了解一下。图2为数据库主页,构建ColorCells用到了167913个公开的scRNA-Seq数据,包含Human, Mouse, Zebrafish, Fruit fly和Yeast五个物种。点击绿色按钮就会跳转到相应的功能模块。

图2. ColorCells主页

vcompare和display

点击compare之后,可以通过’浏览’上传行代表基因ID或基因symbol,列为细胞的表达矩阵,文件格式要求csv,而且小于10MB,所以有必要的话可以选择压缩一下。高级选项一栏可以选择组织类型(人类、小鼠等),也可以选择基因格式、对细胞或基因进行过滤等。

图3. 上传文件

ColorCells分别通过PCA和tSNE对数据进行降维处理,然后计算任两个样本间的SNN距离和Pearson相关系数,Louvain算法用来识别细胞亚群。小编以数据库给的example为例解释一下结果:不同的类通过不同的颜色进行标注,每个点代表一个细胞样本,轻触可以查看ID,聚类结果有2D和3D两种形式,既可以查看全部基因的聚类结果,也可以比较分别以lncRNA和mRNA进行聚类的结果(图4),图片都是可以下载的。

图4. 聚类结果展示

此外,通过点击左上角的各个链接,我们还可以查看ColorCells给出的其他结果(图5):

Similar Studies: 预测的与每个类最相似的研究;

Marker Genes: 使用一对多法寻找每个簇中的高变异基因,可以查询感兴趣的基因,Top Variable Genes展示这些基因对样本的聚类图;

Cell-Cell Correlation: 细胞样本间的Pearson和SNN相关性分析结果;

Gene Functions: 计算lncRNA和mRNA的共表达相关系数,通过对mRNAs的GO富集分析,预测相关lncRNA的功能。

图5. 其他可查看的结果

vTissueMap

该模块向我们展示了人类(包括男性和女性)和小鼠各自所包含的不同单细胞测序类型。

图6. 不同组织的数据类型

vcell type labels、cell-cell similarity、function

Cell cluster types模块通过marker基因的富集分析来预测细胞簇的类型,结果可以多种格式导出。聚类的结果同样用PCA和tSNE两种方式展示,我们还可以通过cell-cell correlation查看分别用Pearson和SNN计算的细胞间相关性,通过Gene function查看利用marker基因做的功能富集分析,lncRNA的功能利用同簇中与之共表达的编码基因来预测。此外,结果中还展示了每个簇中上调的marker基因。

图7. 其他功能模块

图8是ColorCells的整个构建过程,作者首先从GEO, SRA, EMBL, DDBJ下载了原始的单细胞测序数据,然后对数据进行筛选、预处理、比对、过滤等,得到标准化的基因表达数据。然后,利用GENCODE和Ensembl的注释信息对每个数据集的基因进行注释,关于lncRNA的命名,作者用到了GeneCards和LNCipedia。接下来,根据基因的表达均值和标准差,筛选除了高变异基因作为特征基因用于PCA分析,同时还用了t-SNE处理数据。为了将细胞聚类,作者基于欧式距离计算了每个样本的k近邻,通过SNNs构建细胞-细胞图,然后使用Lovain或Leiden等方法识别亚群,最后使用一对多策略寻找每个簇的marker基因。为进一步了解每个细胞类型中lncRNAs的功能,作者计算了marker基因间的Spearman相关系数,筛选出了显著共表达的mRNA-lncRNA对,然后通过对mRNA集的GO分析预测相应lncRNAs的功能。

图8. ColorCells的构建流程

想要更详细构建过程的小伙伴可以去查看原文哦,附上链接:https://pubmed.ncbi.nlm.nih.gov/33313674/ (PMID:33313674 )。

今天的分享结束了,Have a nice day!

更多生信人原创文章请收藏链接https://biosxr.gaptools.cn/#/

上一篇下一篇

猜你喜欢

热点阅读