pysam使用及出现的问题

2020-08-18  本文已影响0人  byejya

从问题开始

1.问题

实际是无头文件的过 官方文档

                应放位置:

AlignmentFile跟的参数

报错改变:

非执行错误:不能迭代没头文件的sam

问题还是头文件。尝试:

samtools view

解决,但是是将sam转为bam才能行的,而且用samtools view 看转出的bam并不带header,或许bam不需要header也能用来迭代,但sam不行?

总之,bam体积小,有samtools时查看也并没有不方便,之后的程序可以改进为使用bam文件。

问题并未解决。关于header的问题:

如何在取出的序列的文件里加上header?

只是暂时,只是暂时用bam规避了这个问题。现在跳过他分析结果

rname 和rnext type查看类型,其实也没必要。

结果是很多rname !=rnext的需要过滤。加上即可

虽然-T但并没在bam中看到header

查看使用结果:

3(最新过滤的)比2(未过滤rname的)要小很多

鉴于.sam 和._2sam没什么用了,现在已经删除。

但是总的还不完整。缺点在1. 两条一样类型的,如下面的这个,都是HMH

一端多匹配但是这两条全是补充序列,并非↓ 这种

提示:还得多看取出的序列,会出现没考虑到的问题

缺点2:现在还只是对单端多匹配在优化,并没有顾及其他类型。

总结:1.转为bam再操作优势明显,避开考虑header的问题,其次所占存储空间小,最后并不影响操作,且取出的东西也不是二进制形式(待验证)【已验证】,原文件是bam,取出的序列却并非二进制格式。

结果 代码

            2.two_pair.sam 漏做了,需要补上。[已补]

上一篇下一篇

猜你喜欢

热点阅读