生物信息分析

ENCODE-Blacklist:基因组也有“黑名单”了

2022-02-15  本文已影响0人  笺牒九州的怪咖

黑名单:顾名思义,就是有问题的区域!具体怎么定义,包含哪些信息呢?咱来详细唠一唠:

The ENCODE Blacklist: Identification of Problematic Regions of the Genome (https://www.nature.com/articles/s41598-019-45839-z) 这篇文章中,定义了基因组中的blacklist区域,即反常的或者无论在二代测序的哪个实验中都是高信号的区域。排除掉这些区域对我们进一步分析功能基因组数据可以提供质量保证。

文章中提供了一个blacklist区域和正常区域的比较:


image.png

example

在blacklist区域信号非常高,要达到background的 6400×左右。

现在有ce10, ce11, dm3, dm6, hg19, hg38和mm10的blacklist region,可以在以下网站下载: https://github.com/Boyle-Lab/Blacklist/https://www.encodeproject.org/annotations/ENCSR636HFF/

上一篇下一篇

猜你喜欢

热点阅读