2020-10-20确定线性回归标准差与水平值的关系

2020-10-20  本文已影响0人  孤独的坚果儿

01直接假定函数关系

直接说线性回归中的水平值之间都有不同的的实验室内之间的标准差s_{r} 与实验室间的标准差s_{R} ,为确定不同水平值m与s之间的关系,通常假定s与m有一定的函数关系。

一般存在有三种函数关系,如图所示。一般来说m的影响很小,因为斜率一般很小。s的影响大。但是每个水平值都存在s值,那么哪个比例更大些,哪个比例更小些,才能使用上述的三种函数关系,计算截距与斜率的值呢?

02谁的权大呢--加权迭代

现在的比例,我们说成为权重。不同水平值m,谁的s精度高,即值小的情况下,谁对最小二乘法的迭代加权就越重。假设W_{j} =1/\bar{s_{j} } ,其中s_{j} 为j的预测值下的标准差。当s越小,其加权系数W就越大。可以理解为当s足够小的时候,加权系数趋近于1,其标准差为最小二乘法估计的无偏倚的标准差。

如何使用加权迭代计算截距与斜率呢?我们需要使用5个统计量了。

03 使用5个统计量

这是需要计算的5个统计量,用于计算截距与斜率。

其中q为j的总次数,m为不同水平值,s为不同水平值下的s;其中在计算T4,T5时,其s_{j} 是一样的。而且sj却不会受到迭代次数的影响,均为原始的s_{j} 值。

04计算线性回归下的a,b值

我们假设了s=bm,那么

实际情况下,当m趋紧于0的情况下,各实验室内或实验室之间的标准差趋紧于0的可能性就会很低,因为我们每次测量均有偏倚,具备测量误差。所以我们一般不假设这种函数关系。

具备截距的函数关系s=a+bm

假设

将s定为s_{0j} 的初始值。

使用5个统计量,得出a,b值

通过上述的计算,可迭代一次,函数关系式为

通过第二次迭代,W_{1j} =1/\bar{s_{1j} }

进行第二次迭代,即会得到下面的关系式:

试验证明,当继续迭代后,其a,b值的变化很小,可以不进行迭代,而从W_{0j} W_{1j} 的变化就很明显,一般来说s_{2j} 就为最终的结果。

上一篇 下一篇

猜你喜欢

热点阅读