转录组数据分析

下载转录组数据的方法

2020-05-08  本文已影响0人  爱吃柠檬的草莓酱

在阅读文献时,会得到一些转录组的数据。那么我们如何下载这些转录组数据呢?以SRR1039510为例

一般转录组分析都会在服务器上进行,所以在下载之前,需要配置好环境,下载好相关软件(以后会详细的列出来)

#####方法一:使用prefetch 下载。 

prefetch SRR1039510

####此方法非常慢,经常失败

#####方法二:wget + link 

####link 可以在SRA Explorer 网站中找到 (https://sra-explorer.info/)

wget ftp://ftp.sra.ebi.ac.uk/vol1/srr/SRR103/000/SRR1039510

#####也非常慢可能需要一个小时

#####方法三: 使用ascp 命令下载 (速度快)

#####安装Aspera包:

conda install -c hcc aspera-cli

#####在SRA Explorer网站中找到下载命令并运行 (在Aspera commands for downloading FastQ files下)

#!/usr/bin/env bash

ascp -QT -l 300m -P33001 -i $HOME/.aspera/connect/etc/asperaweb_id_dsa.openssh era-fasp@fasp.sra.ebi.ac.uk:vol1/fastq/SRR103/000/SRR1039510/SRR1039510_1.fastq.gz . && mv SRR1039510_1.fastq.gz SRR1039510_GSM1275864_N61311_Alb_Homo_sapiens_RNA-Seq_1.fastq.gz

ascp -QT -l 300m -P33001 -i $HOME/.aspera/connect/etc/asperaweb_id_dsa.openssh era-fasp@fasp.sra.ebi.ac.uk:vol1/fastq/SRR103/000/SRR1039510/SRR1039510_2.fastq.gz . && mv SRR1039510_2.fastq.gz SRR1039510_GSM1275864_N61311_Alb_Homo_sapiens_RNA-Seq_2.fastq.gz

######方法四: 直接下载

#####进入网站:https://www.ebi.ac.uk/ena/browser/home,找到基因并进行下载(可选fastq文件或sra文件)

一般我们在下载sra文件后,都需要使用fastq-dump命令将其转化为fastq文件,所以在下载过程中如果有fastq文件,可以直接下载fastq文件。

上一篇 下一篇

猜你喜欢

热点阅读