取在intron内的sequence

2020-09-23  本文已影响0人  byejya

已经取出在intron的序列,并对在intron的序列取了meta序列

问题:1.meta序列似乎比较少

            2.再细致一点

下一步:改igv使得更清晰

3

使用脚本:

seq_in_intron.py

3 5 3 3

仍需排除一些特殊情况:

1.这两个是同一条。

5 4 5

正好错开一位的,也需要拼接。

但突然想到

2

这种并非在3'ss 5'ss 的,可能是intron拼接导致的。或许不该拼接。

3

这样比较对?放大看:

2 3

比较正确。

2.落单的序列

3

5086,400位置不是intron。但有可能是intron的问题,所以,需要把落单的序列取出来重新验证。

3.(横向的两个是一组。)断点不一致,但起止位置一致。好结果

7 3

4.重叠。两个都是10762

4

下一步:去单,去重叠。

                找配对

                把其他文件全跑了

             

正确情况:

2

两个蓝的,start end一致,中间长度不一致。

因此,找到的另一条对应序列应该在intron中间。

问题:1.intron该不该合。

2.跨exon的是否能找到。

思路流程:

取特征序列 > 取在intron的特征序列>取对应部分> 改igv作图观察

目的:得到切实可靠的bpreads

取meta部分:

4

用法:

f=max.sam

fi=onr_pair

for i in fi:

    mate = f.mate(i)

w 3

两条只看一条就行,因为是重复取的,没有去重。

3

结果上看是比较可靠的。

2 2

还是intron拼接太长的问题

3 3 4
上一篇 下一篇

猜你喜欢

热点阅读