GEO 1-4-123

2021-10-21  本文已影响0人  小胡同学ime

长脚本管理方式

  1. 分成多个脚本,每个脚本最后保存Rdata,下一个脚本开头清空再加载。
  2. if(F){...}, 则{}里的脚本被跳过,if(T){...},则{}里的脚本被执行,凡是带有{}的代码,均可以被折叠

GEO来了

图表介绍

1. 热图:
2. 散点图 / 箱线图:

输入数据是数值型向量和一个字符串向量(有重复值,且取值有限)
纵坐标(值)——横坐标(群体)

image
3. 火山图

单个基因在两组之间的表达量差异

4. PCA图

主成分分析:组内重复/组间差异

*表达矩阵:行是一个基因在所有样本中的表达量,一列是一个样本所有基因为表达量


image.png

GEO背景知识+分析思路介绍

实验设计
实验目的:通过基因表达量数据的差异分析和富集分析来解释生物学现象
三个缩写

基因表达芯片:探针的表达量反应基因的表达量

image
分析思路
image.png
R语言实现
下载用函数实现:GEOquery::getGEO
  1. 将数据下载到本地
  2. 以对象的形式读入R(eSet)

注意检查数据的完整性

limma包用于芯片差异分析

芯片数据差异分析:limma包
转录组数据差异分析:limma(voom)、edgeR、Deseq2

上一篇下一篇

猜你喜欢

热点阅读