生信分析工具包

GFOLD

2020-03-27  本文已影响0人  Thinkando

GFOLD:广义倍数变化


image.png

有重复的转录组数据,用的比较多的是DEseq2(负二项分布),edgeR(负二项分布), edgeR(二项分布)。
没有重复转录组数据,普遍推荐使用统计大学的GFOLD。

mRNA-seq的一大应用就是基因表达定量和筛选差异表达基因,使用常用工具edgeR、DESeq、baySeq、Cufflinks分析,最好有生物学重复,而最新的hisat2 + stringtie + ballgown套装则要求必须有重复。这里给大家介绍一个对重复无要求、简单好用、效果也好的软件:GFOLD。

  1. 差异表达基因数量:GFOLD与benchmark有更多的交集。
image
  1. 敏感性:GFOLD略高一筹。
image

Acurve that is closer to the top left corner of the plot is considered toachieve better specificity。

  1. 使用方法:

第一:用Bowtie将read map到基因组上,产生sam结果文件(如sample1.sam,sample2.sam),命令略;

第二:将sam文件转化为GFOLD输入文件,命令:gfold count -ann hg19_Ref.gtf -tag sample1.sam -o sample1.read_cnt;

第三:计算,命令:gfold diff -s1 sample_1 -s2 sample_2 -suf .read_cnt -sc 0.01 -o sample_1-VS-sample_2.diff;

第四:筛选,GFOLD values等于0,表示该基因不差异;大于0,表示该基因上调;小于0,表示该基因下调。

原文: Feng J, Meyer C A, Wang Q, et al. GFOLD: a generalized fold change for ranking differentially expressed genes from RNA-seq data[J]. Bioinformatics, 2012, 28(21):2782.

上一篇 下一篇

猜你喜欢

热点阅读