如何上传测序数据至NCBI?

2020-07-15  本文已影响0人  husy_

文章发表一般要求将测序数据上传至NCBI的SRA(Sequence Read Archive)数据库。上传到NCBI 的数据可归纳为两大类:测序原始数据和分析数据。原始数据(Raw data)指测序下机的最初文件,未经任何处理和分析。

1. 注册NCBI帐号

https://www.ncbi.nlm.nih.gov/account/,点击“ Register for a NCBI account”,进入到注册页面,如实填写信息。(尽量使用项目提交人的信息进行注册)

2. 创建BioProject

https://submit.ncbi.nlm.nih.gov/subs/bioproject/,在界面上选择 new submission ,依次填写SUBMITTER、PROJECT TYPE、TARGET、GENERAL INFO等信息,后面的BIOSAMPLE和PUBLICATIONS两个界面可以不写相关信息,都直接点Continue,进入OVERVIEW界面。如果有问题可返回修改,没问题的话即可点击submit提交。
创建成功后,再次进入该网址,会出现BioProject编号,以PRJNA开头,可放在文章中。(注册人的邮箱会收到相关邮件)

BioProject.png 注意:

3、创建BioSample

https://submit.ncbi.nlm.nih.gov/subs/biosample/,在界面选择 new submission。大致提交过程如下截图所示,最终提交完成后,每个样本会有一个样本编号,以SAMN开头,用于后面提交原始数据。

BioSample.png 注意: ATTRIBUTES.png

4. 提交原始数据至SRA

https://www.ncbi.nlm.nih.gov/Traces/sra_sub/sub.cgi,选择 NCBI PDA入口,填写个人信息后,点击 create new submission >> New submission。

SRA.png 注意:
~/.aspera/connect/bin/ascp -i aspera.openssh -QT -l100m -k1 -d reads.path subasp@upload.ncbi.nlm.nih.gov:uploads/husy_163.com_1f3LOev0

数据上传比较慢,等数据都上传完成后,再点击“Select preload folder”,即可出现上传好的原始数据,点击“Use selected folder”,继续即可。
注意:数据上传完成之后,NCBI还需要一段时间对数据进行processing,若页面提示"error"(比如提示数据文件格式有问题),只能发邮件联系sra@ncbi.nlm.nih.gov,数据上传成功会出现"processed"标志,每个样本会对应获得一个SRR编号。SRA处理邮件的效率还是很高的。

上一篇 下一篇

猜你喜欢

热点阅读