RNA-seq

11.6 RNA-seq表达rpkm数据操作实践(一)

2018-11-06  本文已影响77人  KK_f2d5

在网上下载了txt文件,是rpkm,但是基因id中的名称搜索不到匹配内容。

试一下用r注释:https://www.jianshu.com/p/ae94178918bc

1、我们先下载r包:

install packages失败可以:

  source("https://bioconductor.org/biocLite.R")

  biocLite("AnnotationHub")   (括号内是安装的包)

library(AnnotationHub) 

ah=AnnotationHub()   可以说是加载得相当慢了。。。。

ah$species[which(ah$species == "Arabidopsis thaliana")]   查看你的物种在不在

   也可以使用:grs <- query(ah, "Arabidopsis thaliana")   query函数

2、用DESeq2处理数据

https://www.jianshu.com/p/3a0e1e3e41d0

得到的结果

测序数据做为countdata使用,要自己提前做一个coldata。全部按照网页教程做,有一步:

conditions<-factor(colnames(mydata))  这样比较方便

整个操作进行了一遍后发现,有很大的问题。

首先deseq2不支持没有重复的数据,其次数据必须是整数,rpkm不是。所以我们白做了,rpkm数据可以直接画图了,但是想要得到p值检验等我们需要倒推到read count才可以。

上一篇下一篇

猜你喜欢

热点阅读