生不了啦

2018-12-13 ---作业-知识点总结

2018-12-14  本文已影响6人  悦时光_

1,名词解释(是什么的问题)

2,技能总结 (怎么做的问题)

3,常用命令复习:

colnames(a)='probe_id'
# 设置镜像
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") 
# 这个应该也是设置镜像的

options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")) BiocManager::install("hgu133a.db",ask = F,update = F) # 安装
## 注意比较 merge 和match 的用法区别,输入的是表格还是 向量
tmp1=merge(ids,a,by='probe_id')
tmp2=ids[match(a$probe_id,ids$probe_id),]
# 这样的数据类型都可以这样子取,取出SYMBOL 和芯片探针的ID;
 ids=toTable(hgu95av2SYMBOL)
# 可以调出分组信息; ~ 后边应该默认会做成因子;
boxplot(exprSet['1974_s_at',] ~ pd$Disease)

4,后期需要整理的资料:

从上面可以看到%in%这个操作符只返回逻辑向量TRUE 或者FALSE,而且返回值应该与%in%这个操作符前面的向量程度相等。也就是说它相当于遍历了C里面的一个个元素,判断它们是否在B中出现过,然后返回是或者否即可。
而match(C,B)的结果就很不一样了,它的返回结果同样与前面的向量等长,但是它并非返回逻辑向量,而是遍历了C里面的一个个元素,判断它们是否在B中出现过,如果出现就返回在B中的索引号,如果没有出现,就返回NA。

5,存在的问题
1,

这个图怎样看p值?
2,忘记如何 找到BRCA1基因在TCGA数据库的乳腺癌数据集(Breast Invasive Carcinoma (TCGA, PanCancer Atlas))的表达情况

提示:使用http://www.cbioportal.org/index.do 定位数据集:http://www.cbioportal.org/datasets

3, 如何找到,找到TP53基因在TCGA数据库的乳腺癌数据集的表达量分组看其是否影响生存

提示使用:http://www.oncolnc.org/

4, 好多次使用R进行安装的时候出现下边的问题的时候该怎么处理;


要更新R包

好多报错都跟数据格式有关系;先检查!

上一篇 下一篇

猜你喜欢

热点阅读