转录组分析 1下载文件

2021-01-07  本文已影响0人  八段锦1134

常识

1、关于命令的后台运行

& : 指在后台运行。
nohup : 不挂断的运行。就是指,用nohup运行命令可以使命令永久的执行下去,和用户终端没有关系,例如我们断开SSH连接,关闭xshell都不会影响他的运行。
jobs可以查看现在正在后台运行的命令。

2、在将下载下来的sra文件转换为fastq文件时

要注意有些fastq-dump版本支持的是--split-e,有些fastq-dump版本支持的是--split-3,可以用--help来查看fastq-dump版本里用的是哪种。比如 本来该是--split-e,却输入了--split-3,如下

fastq-dump --gzip --split-3 -O 输出的文件夹路径 XXX.sra

就会报错:unrecognized option: '--split-3'
然后转换之后的文件是XXX.fastq.gz,可以使用zless命令查看


图片.png

可以看到数据格式是4行表示一段序列,每一行都有自己的意义。

Q&A:

1 输出reads_1.fq文件中的所有序列(即第二行):
less reads_1.fq |sed -n '2~4p'

3、数据过滤

数据过滤的作用:
1 去除含接头的reads
2 去除含有N的比例大于5%的reads
3 去除低质量值(比如以Q20为标准)
一般我们的样品送测序公司后,返回有2套数据:rawdata(过滤前)和cleandata(过滤后)。

上一篇 下一篇

猜你喜欢

热点阅读