基因组组装基因组

生信 | 基因组组装实战(六):基因组质量、一致性、保守性、LA

2021-06-17  本文已影响0人  生信卷王

写在前面

1.基因组组装指标评估

#Download git repository 
git clone https://github.com/mh11/gnx-tools.git
cd gnx-tools
mkdir bin 
javac -d bin/ src/uk/ac/ebi/gnx/* 
# 没装ant,请安装,链接:https://downloads.apache.org/ant/binaries/
# wget https://downloads.apache.org/ant/binaries/apache-ant-1.10.10-bin.tar.gz
# tar -zvxf apache-ant-1.10.10-bin.tar.gz
# ant程序 在/apache-ant-1.10.10/bin里面
ant -f package.xml
#使用方法
java -jar gnx.jar 基因组名
java -jar /gnx-tools/gnx-tools-master/gnx.jar -nx 25,50,75 contigs.fasta
#-nx 50表示统计N50

2.序列一致性评估

conda install -c bioconda samtools -y
conda install -c bioconda minimap2 -y
Genome=$PATH/genome.fasta
SubreadsFa=$PATH/*bam.fasta
minimap2 -ax map-pb ${genome} ${SubreadsFa} -t 10 > aln.sam
samtool view -bS aln.sam > aln.bam
samtools sort aln.bam -o minimap.merged.bam --output-fmt BAM
samtools flagstat minimap.merged.bam > minimap.merged.bam.flagstat
samtools depth -aa minimap.merged.bam > depth.info

3.保守性基因评估

#需要构建conda的python3环境
conda install -c conda-forge -c bioconda busco=5.3.2 -y
mkdir -p ~/database/BUSCO/ 
cd ~/database/BUSCO/
# 下载,增加--no-check-certificate,否则可能下载不了
wget -c --no-check-certificate https://busco-data.ezlab.org/v4/data/lineages/embryophyta_odb10.2020-09-10.tar.gz
# 解压文件
tar -xzvf embryophyta_odb10.2020-09-10.tar.gz
cp config.ini_default config.ini
busco -i [组装的文件.fasta] -l [数据库文件夹] -o [输出文件名] -m [评估模式] [其他一些选项]
参数说明

4.其他评估方法

准确性评估 完整性评估 长末端重复序列评估基因组完整度
上一篇下一篇

猜你喜欢

热点阅读