ATAC-seq 质控

2020-05-29  本文已影响0人  大吉岭猹

1. 写在前面

2. replicates

3. 总 reads 数

4. 比对率

5. IDR 计算重复情况

6. 文库复杂度

7. peak 数量

8. nucleosome free region (NFR)

9. 插入片段长度统计(单核小体峰)

cd align/
samtools view WT.last.bam|cut -f9>wt_insert_length.txt
a=read.table("wt_insert_length.txt")
hist(abs(a[,1])))

10. 计算 FRiP 值

cd callpeaks/
ls *narrowPeak|while read id;
do
echo $id
bed=../bed/$(basename $id "_peaks.narrowPeak").bed
ls -lh $bed
# a中哪些在b中
ReadsinPeaks=$(bedtools intersect -a $bed -b $id|wc -l|awk '{print $1}')
totalReads=$(wc -l $bed|awk '{print $1}')
echo $ReadsinPeaks $totalReads
echo 'FRiP:' $(bc <<< "scale=2;100*$ReadsinPeaks/$totalReads")'%'
done

11. TSS 富集程度

友情宣传

上一篇下一篇

猜你喜欢

热点阅读