一起生信啦啦啦生物信息学

把ensembl的gtf和fasta改成chr

2018-10-21  本文已影响5人  苏牧传媒

fasta:

samtools faidx GRCh38.fa

samtools faidx GRCh38.fa 1 > chr1.fa ...

cat chr* > GRCh38.fa (前面三步主要是去除其他不需要染色体)

sed 's/>/>chr/g' GRCh38.fa > GRCh38_chr.fa

samtools faidx GRCh38.fa

samtools faidx GRCh38_chr.fa

GTF:

sed -i '/^#/d' GRCh38.gtf (去除#的注释信息)

sed -i '/^MT/d' GRCh38.gtf (去除MT染色体)

sed -i '/^KI/d' GRCh38.gtf (去除其他乱七八糟)...

awk '{print "chr"$0}' GRCh38.gtf > GRCh38_chr.gtf

awk '{print $1}' GRCh38.gtf | sort | uniq

awk '{print $1}' GRCh38_chr.gtf | sort | uniq

GFF同上

上一篇 下一篇

猜你喜欢

热点阅读