转录组入门专题转录组生信猿

转录组组装软件Trinity的介绍

2018-05-26  本文已影响74人  飞翔的仔仔

Trinity作为一款经典的转录组组装软件,在众多的转录组组装软件中认可度应该是最高的,而且版本一直在更新,现在已经出到了v2.6版。此文主要用于记录阅读Trinity源码过程中的一些理解,阅读的Trinity源码版本是v2.4

Trinity的源码涉及到的各种不同的编程语言,例如perl、c++、java等。同时也使用了几款不同的生物信息分析软件,例如jellyfish、bowtie2、samtools等。到目前为止,Trinity除了可以进行转录组组装之外还打包了一些其他的软件用于组装之后的下游分析,如RSEM用于计算表达量、利用R包edgeR进行差异表达分析、利用transcoder进行CDS预测。

Trinity官网介绍是分为三个步骤:InchwormChralysisButterfly

图片.png

拼接得到的转录本序列信息以FASTA格式储存,如下所示:

>c13_g1_i1 len=263 path=[369:0-108 477:109-148 65:149-262]
TGAAGAGGGAGGAGGCGAATTGGGTTTGGCGTGGCTGCTGTTAAGGGGCTGCAAGAGGTG
GAAAGGAGGACAGAGAAGATGGAAAGATGGAGACAAGGACTGATCTGGGTGGTAGCAACA
GTACCTGGAAGTGGGTGTTTGGAGAAAGGGCGAAAGATGTGGTCTCTGGGAATGGCGATG
GAATGGGCAGCAGCAGCAGCAGGAGTCCAGGACAGGTAGTAGCAGTGGCGGAAATTATAC
CTGGGATAAGGCCCAGATCTCTG

Trinity --seqType fq --max_memory 100G --CPU 50 --min_kmer_cov 3 --left   FCHK2FVCCXY_L3_WHDAVllgEAAARAAPEI-96_1.fq.gz,FCHK2FVCCXY_L3_WHDAVllgEAABRAAPEI-97_1.fq.gz,FCHK2FVCCXY_L3_WHDAVllgEAABRAAPEI-97_1.fq.gz  --right FCHK2FVCCXY_L3_WHDAVllgEAAARAAPEI-96_2.fq.gz,FCHK2FVCCXY_L3_WHDAVllgEAABRAAPEI-97_2.fq.gz,FCHK2FVCCXY_L3_WHDAVllgEAACRAAPEI-98_2.fq.gz --output gongtong_trinity_out  --group_pairs_distance 230 --no_version_check  --verbose --min_contig_length 250 --min_glue 3 --no_distributed_trinity_exec

~/bio/trinityrnaseq-Trinity-v2.4.0/trinity-plugins/parafly/bin/ParaFly -c recursive_trinity.cmds -CPU 50 -v

上一篇 下一篇

猜你喜欢

热点阅读