Win10安装R3.6.2、DESeq2

2020-02-28  本文已影响0人  陈光辉_山东花生

由于ubuntu下安装R最新版一直失败,各种尝试均不奏效,只能选择在windows下试一试,结果一路OK。

Windows安装R

下载R的windows版本:
https://mirrors.tuna.tsinghua.edu.cn/CRAN/
下载Rstudio
https://rstudio.com/products/rstudio/download/#download
下一步下一步就ok

现在ubuntu下安装R3.6.2成功了

sudo add-apt-repository 'deb https://cloud.r-project.org/bin/linux/ubuntu bionic-cran35/'
sudo apt update
sudo apt install r-base

安装DESeq2

R有时报错需要选择合适的镜像。建议先安装Rtools 和git

install.packages("BiocManager")
BiocManager::install(version = "3.10")
Sys.setenv(R_INSTALL_STAGED = FALSE) #这一句对于3.6.2非常重要缺少此命令,R3.6版本安装deseq2存在权限不足的情况!
BiocManager::install("DESeq2")

library("DESeq2")

下面的文件为Samplelist.csv内容

sampleid    genotype    time
SRR3784916  Resistant   0hr
SRR3784934  Resistant   0hr
SRR3785115  Resistant   0hr
SRR3785116  Resistant   24 hr
SRR3785165  Resistant   24 hr
SRR3785169  Resistant   24 hr
SRR3785170  Resistant   48 hr
SRR3785181  Resistant   48 hr
SRR3785250  Resistant   48 hr
SRR3785258  Susceptible     0hr
SRR3784995  Susceptible     0hr
SRR3785000  Susceptible     0hr
SRR3785010  Susceptible     24 hr
SRR3785023  Susceptible     24 hr
SRR3785024  Susceptible     24 hr
SRR3785063  Susceptible     48 hr
SRR3785089  Susceptible     48 hr
SRR3785093  Susceptible     48 hr

在Rstudio中

1、 将基因或转录本的count matrix和lable载入:

#首先将R的工作目录设置成stringtie处理结束之后的目录:
#列出当前工作目录
> getwd()

#变更新的工作目录
> setwd("D:/tamato")

> countData <- as.matrix(read.csv("gene_count_matrix.csv", row.names="gene_id"))

#gene_count_matrix.csv由python脚本 prepDE.py生产

> colData <- read.csv(PHENO_DATA, sep="\t", row.names=1)

# PHENO_DATA 要改成自己生成的文件,我自己的文件名为:Samplelist.csv,所以第二行命令改为:
> colData <- read.csv("Samplelist.csv", sep="\t", row.names=1)


2、检查两个文件匹配情况:

> all(rownames(colData) %in% colnames(countData))
[1] TRUE
> countData <- countData[, rownames(colData)]
> all(rownames(colData) == colnames(countData))
[1] TRUE

# 输出【TRUE】表明counts矩阵表头和samplist可以对应起来。


3、从count matrix和lable创建 DESeqDataSet 数据集

> dds <- DESeqDataSetFromMatrix(countData = countData, colData = colData, design = ~ CHOOSE_FEATURE)

#注意 “~” 后的CHOOSE_FEATURE 应该换成自己所关注的特征,我所关注的特征为“genotype”,则命令为:

> dds <- DESeqDataSetFromMatrix(countData = countData, colData = colData, design = ~ genotype)  

4、运行DEseq2处理数据集,生成结果的表并写入文件

> dds <- DESeq(dds)
> res <- results(dds)

#4.8 根据p-value进行排序
> (resOrdered <- res[order(res$padj), ])

#将排序的结果写入文件

write.csv(resOrdered,file = "DE_results.csv")

上一篇下一篇

猜你喜欢

热点阅读