走进转录组基因家族

cd-hit基因集去冗余

2022-04-06  本文已影响0人  胡童远

主页:
http://weizhong-lab.ucsd.edu/cd-hit/

下载二进制版本:
https://github.com/weizhongli/cdhit/releases

使用:

route="/your_route/Result/script/cd-hit-v4.6.7-2017-0501"
$route/cd-hit -i 01_contig/all_contigs_gene.fna \
-o 02_geneset/gene_set -c 0.9 -n 5 -M 50000 –d 0 -T 8

## 参数
-i   input filename in fasta format
-o   output filename
-c   sequence identity threshold, default 0.9
-d   0表示使用 fasta 标题中第一个空格前的字段作为序列名字
-M   memory limit (in MB) for the program, default 800; 0 for unlimitted;
-T   number of threads, default 1; with 0, all CPUs will be used
-n   word_length, default 5, see user's guide for choosing it

更多:
CD-hit安装及使用

上一篇 下一篇

猜你喜欢

热点阅读