转录组分析——二、数据完整性检验

2021-03-26  本文已影响0人  A西方不亮东方亮

一、md5值检验

md5值检验需要用到的东西
1、一个txt文件(第一列为md5值,第二列为sra文件名,两列中间有两个空格,固定格式)
2、下载好的sra文件
3、txt文件和sra文件放在同一目录下

#以4、5、6三行为例
cat 'file.tsv' | awk 'NR>3&&NR<7 {print$11"  "$4}'>md5.txt
# 检验md5值完整性,md5sum函数加-c参数
md5sum -c md5.txt 
# md5检验过程较慢,可以挂后台,结果重定向到check
md5sum -c md5.txt>check &

二、如何生成md5值

命令还是md5sum,没有参数就是生成,生成的文本符合md5值检验格式(两列,第一列为md5值,第二列为sra文件名)
不加其他命令,直接打印在屏幕上,可以重定向至一个新的文件

# 生成单个文件的md5值
md5sum SRR1039510 
# 生成多个SRR开头文件的md5值,并输出到文件md5.txt,并挂载在后台
md5sum SRR*>md5.txt &

md5值如果写路径名,生成的md5结果第二列也有路径名,所以不建议写路径名,在工作目录下处理!!!!!

上一篇 下一篇

猜你喜欢

热点阅读