生信生信数据库

中国核酸数据库GSA数据提交指南

2020-10-12  本文已影响0人  生信编程日常

注册并登录生物数据递交系统(BIG Sub, https://bigd.big.ac.cn/gsub/

GSA的数据模型

为确保与国际同类数据库系统的兼容性,GSA遵循INSDC联盟的数据标准,GSA元数据类别主要包括项目信息(BioProject,归档于生物项目数据库)、样本信息(BioSample,归档于生物样本数据库)、实验信息(Experiment)、以及测序反应(Run)信息。项目信息是用来描述所开展研究的目的、涉及物种、数据类型、研究思路等信息;样本信息是指本研究涉及的生物样本描述,如样本类型、样本属性等;实验信息包括实验目的、文库构建方式、测序类型等信息;测序反应信息包括测序文件和对应的校验信息。各类数据之间采用线性、一对多的模式进行关联,从而形成“金字塔”式的信息组织与管理模式(图1)。


主要分为三个部分

1.创建项目(BioProject);
2.创建样本(BioSample);
3.创建GSA数据集;

1. 创建项目(BioProject)

如果您之前没有创建项目(BioProject)请进入 BioProject 数据库完成创建:
BioProject的构建分为五个步骤。

2. 创建样本(BioSample)

详细说明文件:https://bigd.big.ac.cn/gsub/document/BioSample-BioSample_Submission_Guide_2.2.cn.pdf

如果您之前没有创建样本(BioSample)请进入 BioSample 数据库完成创建:

3. 构建GSA数据集

完成 GSA数据集中Experiment和Run的元数据信息录入——实现与BioProject、BioSample和数据文件的相互关联。通过FTP完成数据文件上传。

ascp -P 33001 -i /your/path/key/aspsub_rsa -QT -l100m -k1 -d /your/data/path/fastqs aspsub@submit.big.ac.cn:uploads/z0000@gmail.com_f9ff019d

参考:
http://blog.sciencenet.cn/blog-3334560-1218399.html
https://bigd.big.ac.cn/gsa/documents

上一篇下一篇

猜你喜欢

热点阅读