cd-hit基因集去冗余
2022-04-06 本文已影响0人
胡童远
主页:
http://weizhong-lab.ucsd.edu/cd-hit/

下载二进制版本:
https://github.com/weizhongli/cdhit/releases
使用:
route="/your_route/Result/script/cd-hit-v4.6.7-2017-0501"
$route/cd-hit -i 01_contig/all_contigs_gene.fna \
-o 02_geneset/gene_set -c 0.9 -n 5 -M 50000 –d 0 -T 8
## 参数
-i input filename in fasta format
-o output filename
-c sequence identity threshold, default 0.9
-d 0表示使用 fasta 标题中第一个空格前的字段作为序列名字
-M memory limit (in MB) for the program, default 800; 0 for unlimitted;
-T number of threads, default 1; with 0, all CPUs will be used
-n word_length, default 5, see user's guide for choosing it
更多:
CD-hit安装及使用