生信分析流程

Day 4_1 NCBI下载RNA-seq数据

2018-12-11  本文已影响10人  陈宇乔

第0步:为了加快下载速度需要配置aspera网址

下载页面
wget -c https://download.asperasoft.com/download/sw/connect/3.8.1/ibm-aspera-connect-3.8.1.161274-linux-g2.12-64.tar.gz

tar zxvf ibm-aspera-connect-3.8.1.161274-linux-g2.12-64.tar.gz
bash ibm-aspera-connect-3.8.1.161274-linux-64.sh
cd # 去根目录
ls -a # 如果看到.aspera文件夹,代表安装成功
# 永久添加环境变量
echo 'export PATH=~/.aspera/connect/bin:$PATH' >> ~/.bashrc
# 最好写绝对路径:echo 'export PATH=/home/qmcui/.aspera/connect/bin:$PATH' >> ~/.bashrc
source ~/.bashrc
# 查看帮助文档
ascp --help

安装成功标志:


echo $PATH 下载时出现fasp表示安装成功

第一步:找到并下载下载SRR_Acc_List

NCBI SRA数据库地址
GEO数据库地址
Step0:直接在GEO搜索ESCC RNA-seq,点击SRA Run Selector

step0:直接在GEO数据库中搜索ESCC RNA-seq即可

step1:找到SRP号(project)不能是SRR号(单个样本)


step1:找到SRP号
必须是SRP号,不能使SRR号 step2
step3:下载SRR_Acc_List

第二步下载数据

激活rna环境后 使用prefetch下载数据:

######可以使用循环下载
cat SRR_Acc_List.txt | while read id; do (prefetch ${id});done 
激活rna环境后 使用prefetch下载数据

下载时可以查看硬盘大小

df -h
df -sh ./ ###查看当前文件夹大小 disk free human-readable
free -h ###应该是内存吧
查看硬盘大小
上一篇下一篇

猜你喜欢

热点阅读