甲基化数据分析

群体DNA甲基化分析1——基因组各个组分相关统计

2020-11-14  本文已影响0人  只看不写_nathan

写于20201114
这部分,我是进行了基因组各个组分的一些统计。详细内容如下:

-------------------------------------------------------------------------------------

1.DMR和NSR在基因组中各个组分的占比
获取基因间区序列,需要先获取gene.bed和TE.bed,然后用bedtools complement 进行找到互补区域
bedtools complement -i gene.bed -g genome.bed
但是注意的是,这个互补区域中每条染色体的第一个位置为0,这样会对后面bedtools 操作造成报错。

获取TE、exon、intron和intergenic的bed后,用bedtools的intersect进行取交集,反映出覆盖了多少组分。
bedtools intersect -a exon.bed -b DOM.fin.bed -wb |awk '{print $4"\t"$5"\t"$6}' |less > temp.bed最开始我没想到,会有重复的行,所以造成间区和TE的区域特别多,后来我想到这个问题,所以需要添加bedtools sort -i temp.bed > temp.s.bedbedtools merge -i temp.s.bed |awk '{sum+=($3-$2)}END{print sum}'|less
这样得到DMR和DSR的组分信息。

上一篇 下一篇

猜你喜欢

热点阅读