微生物16S/宏基因组/代谢组

Qiime2小bug

2019-12-13  本文已影响0人  苏可_7fe6

这些小bug折磨了我两天时间才解决,决定以后跑流程要洗心革面,从原始数据就得仔仔细细欣赏,每一个参数尽量搞懂,能用google搜错的一定不用百度。
每逢demux summarize报错信息是酱紫的,没看懂,就各种试错。

image.png
最后发现问题是从NCBI下载的原始数据fastq有bug,每个文件最后都多了一个空行,心痛。
gunzip SRR6651857.fastq.gz #解压
wc -l SRR6651857.fastq #发现都是157009行这种奇数
#后期qzv中显示sequence counts是该数除以4
tail SRR6651857.fastq #发现空行
sed '157009d' SRR6651857.fastq>dSRR6651857.fastq #将最后一个空行删除并重新输出
gzip dSRR6651857.fastq #重新封印

重新做人版Qiime2流程

0.启动

根据版本自行启动

source /share/disk5/lianm/basic_tool/anaconda3/bin/activate qiime2-2019.7
source activate qiime2-2019.10

0.1.是否有barcode

补充

1.原始数据的导入(区分双端、单端)

(1)单端
合并后导入有至少三种方式,一般下机数据选择manifest版,但是整这个manifest文件可能会被报错气死。

qiime tools import --type 'SampleData[JoinedSequencesWithQuality]' --input-path manifest --output-path single-end-demux.qza --input-format SingleEndFastqManifestPhred33V2
(1)--type常见类型#qiime tools import --show-importable-types
SampleData[JoinedSequencesWithQuality]
SampleData[PairedEndSequencesWithQuality]
SampleData[SequencesWithQuality]
SampleData[Sequences]
(2)--input-format常见类型,末尾有木有V2我真不知道 # qiime tools import --show-importable-format
SingleEndFastqManifestPhred33V2
SingleEndFastqManifestPhred64V2
PairEndFastqManifestPhred33V2
PairEndFastqManifestPhred33V2

重点是manifest文件,官方说明是tab分隔,特定语法,但我仍是一直报错,显示case sensitive 和case insensitive的一堆,以后大批量生成应该代码直接\t分隔
!版本1


image.png
qiime tools import --type 'SampleData[JoinedSequencesWithQuality]' --input-path /share/disk5/zhuqh/4_hospital/manifest --output-path /share/disk5/zhuqh/4_hospital/single-end-demux.qza --input-format SingleEndFastqManifestPhred33V2
qiime tools import --type 'SampleData[SequencesWithQuality]' --input-path /mnt/data/kex/hospital/manifest --output-path /mnt/data/kex/hospital/single-end-demux.qza --input-format SingleEndFastqManifestPhred33V2
#单端具体用哪个

(2)双端
用到再补充

1.Dada2质控(区分双端、单端)

上一篇下一篇

猜你喜欢

热点阅读