使用Gfold进行无重复样本转录组差异表达分析
一.软件下载安装
使用工具 Gfold, 下载链接:
https://zhanglab.tongji.edu.cn/softwares/GFOLD/index.html

tar zxvf gfold.V1.1.4.tar.gz、cd gfold.V1.1.4
make报错后换用conda安装:
conda安装命令
conda
install -c bioconda gfoldcondainstall -c bioconda/label/cf201901 gfold
但是在试用gfold的时候报错了,error while loading shared libraries: libgsl.so.0: cannot open shared object file: No such file or directory。
好烦。。。。
find / -name libgsl.so.*

还有很多libgsl.so.*文件,只截图了部分结果。
问题解决:
参考网友1的办法,该大神有一些小错误,但我在人家基础上进行的学习改进,在此谢过大神。

ln /home/lvqiang/miniconda3/envs/gfold/lib/libgsl.so /home/lvqiang/miniconda3/envs/gfold/lib/libgsl.so.0
然后lib目录下多了一个libgsl.so.0文件

然后再试用一下gfold命令,安装成功:

二.软件使用
1.使用说明可以参照官网上示例。


JOBS:
count: 有时候一个read 可能map到多个基因上,这时这个read就在每个基因上都进行了计数,重复计数了,此外,如果一个基因在多个染色体上或者同一条染色体的不同链上,只有在一个染色体上的同一链的外显子会被归到这个基因上,不在这条染色体和同一链上的会被忽视。
diff:对每个基因,计算GFOLD值和其它统计值。diff接受count结果作为input。有关输入格式的更多信息,请参考count的输出格式。如果你对计数所采用的策略不满意,你可以自己生成基因读取计数。Input中,“GeneSymbol”和“Read Count”很关键。Count结果的第三列(gene length)只会影响RPKM的值,如果缺失这列信息,diff就不会产生RPKM的值。Count结果的第四列对于diff来说没有用处。
2.运行命令行:
/home/lvqiang/miniconda3/envs/gfold/bin/gfold diff -s1 hsv2-12hAS -s2 hsv2-12h-Control -suf .read_cnt -o 12hASVS12Cont.diff
3.输入输出文件要求及结果解读:
参考别人的意见,输入文件共有五列,每一列的命名分别为:GeneSymbol,GeneName,ReadCount,gene exon length,RPKM,第一列和第二列内容可以一样,第5列我没有填写,会在结果中生成。
输入文件命名如下图,以.read_cnt为后缀,命令行参数设置上只写名字就行,否则会报错提示找不到文件,:

计算过程:

结果:会生成两个文件

diff文件记录了差异表达的结果,diff文件中gfold列信息含义:

三.筛选差异表达基因:
gfold列的值是log2 fold change, >0的为上调基因,<0的为下调基因,=0的为没有差异的基因,可进一步通过脚本命令行筛选上调、下调的基因,因为我这次做的病毒基因的表达和上调,基因数目非常少,肉眼看就知道了。
但是要是做动植物分析时,就得需要命令行了,参考大神2的命令行:
#大于0为上调,小于0下调(第3列是gfold值所在列,第4列是E值)
awk '{if($3>0 && $4=1) print $0}' sample1VSsample2.diff OFS='\t' > up_diff.gene
awk '{if($3<0 && $4=1) print $0}' sample1VSsample2.diff OFS='\t' > down_diff.gene
#筛选两倍差异基因,即大于1和小于-1的
awk '{if($3>1 && $4=1) print $0}' sample1VSsample2.diff OFS='\t' > up_diff.gene-2
awk '{if($3<-1 && $4=1) print $0}' sample1VSsample2.diff OFS='\t' > down_diff.gene-2
四.参考:
1.链接:http://events.jianshu.io/p/aebd9510f892
2.链接:https://www.jianshu.com/p/25038fa16717
本文使用 文章同步助手 同步