学习:StatQuest-设计矩阵
2020-01-20 本文已影响0人
小潤澤
前言
上一讲我们介绍了在检验中如何合并模型:
image.png
那么这一次我们来讨论下设计矩阵
设计矩阵
还是这个例子:
image.png
左边的情况说明,我们想计算两个组的均值,进行模型整合以后是这样的,设计矩阵要么是control组的均值,要么是mutant组的均值(8个点相当于算8次)
右边是另外一种表示方式,计算mutant组与control组均值的差 再加上control组的均值
那么它的设计矩阵是这样的
image.png
我们换一个视角,来看看线性回归的设计矩阵:
这是个一元线性回归
image.png
第一列代表是否引入斜率,第二列是数据点对应的X轴坐标值
示例
假设,我们有两组数据绿色为mutant,红色为control,描述的是小鼠体重和其尺寸的线性相关
image.png
如果把数据整合(不区分组),那么只会得到一条回归直线,我们就没有办法查看分组信息
image.png
我们理想中是这样的,分组处理,做模型的整合,这样就不用写那么多方程了
image.png
这时,我们引入设计矩阵即可
image.png
我们注意到,方程形式是
y = control intercept + mutant offset + slope
解释下:
-
control intercept是指control组的回归方程截距
-
mutant offset是指mutant组回归方程的截距与control组回归方程的截距的差
-
slope:直线斜率
我们来看设计矩阵
image.png
image.png
这两张图比较生动
第一列是是否有control组的斜率,显然都有,故全是1
第二列:判断是否要引入mutant offset是指mutant组回归方程的截距与control组回归方程的截距的差,结果只有后四列要
第三列是每个数据点对应的X轴坐标值
依次引入计算即可
构造F统计量进行检验
image.png
在做方差分析的时候,也可以利用这个分组
image.png