Day 4_1 NCBI下载RNA-seq数据
2018-12-11 本文已影响10人
陈宇乔
第0步:为了加快下载速度需要配置aspera网址
下载页面wget -c https://download.asperasoft.com/download/sw/connect/3.8.1/ibm-aspera-connect-3.8.1.161274-linux-g2.12-64.tar.gz
tar zxvf ibm-aspera-connect-3.8.1.161274-linux-g2.12-64.tar.gz
bash ibm-aspera-connect-3.8.1.161274-linux-64.sh
cd # 去根目录
ls -a # 如果看到.aspera文件夹,代表安装成功
# 永久添加环境变量
echo 'export PATH=~/.aspera/connect/bin:$PATH' >> ~/.bashrc
# 最好写绝对路径:echo 'export PATH=/home/qmcui/.aspera/connect/bin:$PATH' >> ~/.bashrc
source ~/.bashrc
# 查看帮助文档
ascp --help
安装成功标志:
echo $PATH 下载时出现fasp表示安装成功
第一步:找到并下载下载SRR_Acc_List
NCBI SRA数据库地址
GEO数据库地址
Step0:直接在GEO搜索ESCC RNA-seq,点击SRA Run Selector
step1:找到SRP号(project)不能是SRR号(单个样本)
step1:找到SRP号
必须是SRP号,不能使SRR号 step2
step3:下载SRR_Acc_List
第二步下载数据
激活rna环境后 使用prefetch下载数据:
######可以使用循环下载
cat SRR_Acc_List.txt | while read id; do (prefetch ${id});done
激活rna环境后 使用prefetch下载数据
下载时可以查看硬盘大小
df -h
df -sh ./ ###查看当前文件夹大小 disk free human-readable
free -h ###应该是内存吧
查看硬盘大小