ARCHS4是目前最大的基因表达数据库
ARCHS4是目前最大的基因表达数据库
RNA-seq是全基因组转录本定量的领先技术,已被广泛应用与科学研究中。因此,RNA-seq数据也呈现爆发式增长,大数据的挖掘和利用显得尤为重要,但目前公共可用的RNA-seq数据都是原始数据形式,极大地阻碍了对这些数据进行全局性、综合性分析。
因此美国的科学家Alexander Lachmann等开发了一个ARCHS4(all RNA-seq and ChIP-seq sample and signature search)网页资源,并于2018年4月10日发表在Nature communications杂志上。
他们将Gene Expression Omnibus (GEO)、Sequence Read Archive(SRA)数据库中大多数已发表的人和小鼠的RNA-seq原始数据,转化成了基因和转录本水平,共有187946个样本数据,其中包含103083个小鼠样本和84863个人样本的数据。
为用户提供通过基于web的用户界面直接访问数据的功能,同时实现可扩展和经济有效的原始数据处理方案。用户可以通过ARCHS4网页查询工具实现数据的直观探索、交互式可视化,基因(Gene)页面提供细胞系和组织中平均表达水平、每个基因的top共表达基因,以及结合已有知识和共表达预测的生物学功能和蛋白互作关系(PPI)。用户无需注册,即可从该网页下载关注样品的所有基因或者转录本的表达水平数据。该网站还贴心地将样品按照物种、细胞系和组织类型进行了详细划分。
更多该网站的功能等待大家去探索,ARCHS4网站的链接:https://amp.pharm.mssm.edu/archs4/index.html
参考文献
Alexander Lachmann, Denis Torre, Alexandra B. Keenan, et al. Massive mining of publicly available RNA-seq data from human and mouse[J].* NAT COMMUN*. (2018) 9:1366