SC2disease:单细胞转录组数据库新生前来报道~
背景介绍
单细胞RNA测序(scRNA-seq)技术是以单个细胞分辨率研究复杂生物的转录组,这种形式能够为科学家研究细胞在表达模式上的异质性,特别是疾病细胞的异质性。scRNA-seq的快速发展为探索疾病微环境中的细胞亚群提供了新的思路,有利于研究疾病的发生、发展、耐药性和免疫逃逸。scRNA-seq技术已被广泛应用于病例对照研究中差异表达基因的识别以及细胞亚群之间差异的识别。
单细胞测序的研究和数据不少,但能够提供不同疾病中基因表达特异性的数据库,放眼全球还是很少的。这今天要介绍的数据库就是用来分析疾病当中的细胞和正常细胞哪些基因有差异的。
SC2disease
http://easybioai.com/sc2disease/
SC2disease是一个人工收集的数据库,能为研究者提供各种疾病的各种细胞类型准确的基因表达谱资源。是由西北工业大学计算机学院的彭佳杰教授课题组开发建立,于2020年10月3号发表在国际著名杂志《Nucleic Acids Research》(IF=11.501)。
彭老师的简介:彭佳杰博士,现任西北工业大学副教授,博士生导师。哈尔滨工业大学计算机科学与技术专业博士,哈佛大学博士后,美国国家能源部-密西根州立大学植物研究实验室(PRL)联合培养博士。主要从事数据挖掘、人工智能、生物信息学、大数据算法学以及海量知识工程等方向的研究。担任中国计算机学会生物信息专业组委员;Biological ontologies and knowledge bases workshop 主席;《BMC Bioinformatics》《Frontiers in Genetics》《Journal of Biomedical Semantics》杂志客座编委;《Plos One》学术编辑;IJCAI、 BIBM、ECAI、GIW、InCoB、KEOD等国际会议program committee;担任TPAMI、Bioinformatics、Plos Genetics、BMC Bioinformatics、TCBB、Plos One、Frontier in Computer Science等国际知名期刊审稿人。
网站通过回顾2020年3月之前使用scRNA-seq研究人类样本疾病的文献,并开发了SC2disease数据库,通过疾病、组织和细胞类型整理数据。SC2disease包含946481条数据,对应341种细胞类型、29种组织和25种疾病。SC2disease数据库中的每个条目都包含不同细胞类型、组织和疾病相关健康状况之间差异表达基因的比较。
SC2disease可以做什么?
浏览感兴趣的基因的表达;
搜索细胞类型标记;
寻找多种疾病的生物标志物;
比较处于疾病和非疾病状态的各种类型细胞的表达谱。
进入正题:如何正确使用SC2disease
01
疾病数据andBrowse
首页跳入视线的是人体疾病类目图。
点进去后可以看到网站提供的疾病基因、差异
可以看到,肿瘤和非肿瘤疾病共22种疾病都包括在内,双向箭头则可以根据该条目进行排序,Gene这列里的基因可跳转到NCBI网站,查看基因信息。Variable Name这列里则包含不同的类型,有logFC,也有mean,表示他们差异分析的结果单位。点击Detail则可以展示该基因和研究的如下相关信息:
在Browse模块里,大家可以根据自己所研究的疾病在Diseases或者CellType里找找相应的栏目,点击“+”键即可展开栏目。具体展现内容和主页里疾病类型链接所呈现是一样的,因此放在上面一同讲解。
02
Search
用户可以输入疾病名称,基因名称或细胞类型来访问样本数据中的关联。
下图显示了检索疾病名称的过程。
03
Analysis
用户可以根据左侧Disease和Gene两种类型的按钮。“Display”按钮用于显示数据表。“Visualize”按钮用于数据可视化。这次以SOX4基因为例。
Search,呈现基因在单细胞中的log2FC和GWAS中的Pvalue。
Display,展示GWAS结果显著的基因以及在疾病的不同细胞里的信息表格。
Visualize,用户可通过点击“Select disease”的下拉选项来选择疾病。
点开可以看到如下图所示的结果:
04
Download
大家可以下载该网站的所有结果数据。
最后,网站还支持用户提交个人的单细胞测序信息,共建共享,很棒。
总的来说,SC2disease主要有三个优点:第一个基于scRNA序列的人类疾病相关细胞类型特异性基因数据库,第二,重新分析基因表达矩阵,使不同疾病间的细胞类型特异性基因具有可比性。第三,提供GWAS和scRNA-seq的结果。虽然是生信数据库的“新生”,上线时间比较短,但也不缺乏“干货”唷。