简友广场想法散文

数学建模系列笔记2:回归和时间序列

2022-02-24  本文已影响0人  Cache_wood

数学建模

@[toc]

3-1-1 一元线性回归

E(y|X=x) = f(x)\\ \varepsilon = y -f(x)\\ 关系式 \quad y = f(x)+\epsilon

一般,假设 \varepsilon \sim N(0,\sigma^2)

f(x) = \alpha + \beta x

y = \alpha + \beta x + \varepsilon ,\varepsilon \sim N(0,\sigma^2)为一元正态线性回归模型

回归分析要解决的主要问题:

  1. 参数估计
  2. 假设检验
  3. 预测

Q = \sum_{i=1}^n (y_i-\hat{y}_i)^2 = \sum_{i=1}^n [y_i - (\alpha + \beta x_i)]^2 最小\\ 令 \quad \frac{\partial Q}{\partial \alpha} = 0,\frac{\partial Q}{\partial \beta} = 0\\ 得\quad \hat{\alpha} = \bar{y} - \hat{\beta}\bar{x}\\ \hat{\beta} = \frac{l_{xy}}{l_{xx}}\\ l_{xx} = \sum_{i=1}^n (x_i - \bar{x})^2,l_{xy} = \sum_{i=1}^n (x_i-\bar{x})(y_i - \bar{y})

平方和分解式
总平方和 \quad SST = \sum_{i=1}^n (y_i - \bar{y})^2\\ 回归平方和\quad SSR = \sum_{i=1}^n (\hat{y}_i - \bar{y})^2\\ 残差平方和\quad SSE = \sum_{i=1}^n (y_i - \hat{y}_i)^2\\ SST = SSR+SSE
假设检验

  1. 判定系数法

皮尔逊相关系数 \quad R = \frac{l_{xy}}{\sqrt{l_{xx}l_{yy}}}\\ 判定系数\quad R^2 = 1-\frac{SSE}{SST}\\

  1. F检验法

原假设 \quad H_0:\beta = 0\\ F = \frac{SSR/1}{SSE/(n-2)} \sim F(1,n-2)\\ F> F_{\alpha}(1,n-2)时,则拒绝原假设H_0

  1. t检验法

原假设 \quad H_0:\beta = 0\\ t = \frac{\hat{\beta}}{\sqrt{\frac{SSE}{(n-2)}/l_{xx}}}\sim t(n-2)\\ 当 |t|> t_{\alpha /2}(n-2)时,则拒绝原假设 H_0

3-1-2 多元线性回归

\begin{pmatrix} y_1 \\ y_2 \\ …\\ y_n \end{pmatrix} = \begin{pmatrix} 1&x_{11} & x_{12} &…& x_{1k} \\ 1&x_{21} & x_{22} &…& x_{2k} \\ …&…&…&\quad &…&\\ 1&x_{31} & x_{32} &…& x_{nk} \end{pmatrix} \begin{pmatrix} \beta_0 \\ \beta_1 \\ \beta_2 \\ …\\ \beta_k \end{pmatrix} + \begin{pmatrix} \varepsilon_1 \\ \varepsilon_2 \\ …\\ \varepsilon_n \end{pmatrix}

Y= X\beta + \varepsilon

假设检验

  1. 判定系数法

调整后R^2 :\bar{R}_{Adj}^2 = 1- \frac{SSE/(n-k-1)}{SST/(n-1)} = 1-\frac{n-1}{n-k-1}(1-R^2)

  1. F检验法

检验所有自变量与y之间的线性关系是否显著

原假设H_0:\beta_1 = \beta_2 = … = \beta_k = 0
F = \frac{SSR/k}{SSE/(n-k-1)}\sim F(k,n-k-1)\\ 当F>F_{\alpha}(k,n-k-1)时,则拒绝原假设H_0

  1. t检验

检验每个自变量与y之间的线性关系是否显著

原假设H_0:\beta_i = 0 (i=1,2,…,k)
t_i = \frac{\hat{\beta}_i}{\hat{\sigma}\sqrt{c_{ii}}}\sim t(n-k-1)
|t|>t_{\alpha/2}(n-k-1)时,则拒绝原假设H_0

  1. 预测

当x_0 = (x_{01},x_{02},…x_{0k})时,y_0的点预测\\ \hat{y}_0 = \hat{\beta}_0 + \hat{\beta}_1 x_{01} +… + \hat{\beta}_k x_{0k}\\ 当x_0 = (x_{01},x_{02},…x_{0k})时,y_0的置信度为1-\alpha 预测区间\\ (\hat{y}_0 + t_{\alpha/2(n-k-1)}MSE \sqrt{1+x_0' (X^TX)^{-1}x_0})

使用逐步回归法进行自变量系数检验

3-1-3 非线性回归

非线性回归转化为线性回归

3-2-1 时间序列的平稳性

  1. 平稳时间序列

    • 随机变量族的统计特征完全由他们的联合分布函数或联合密度函数决定

    • 时间序列概率分布族的定义
      F_{t_1,t_2,…,t_m} (x_1,x_2,…,x_m)\\ m \in (1,2,…,m), t_1,t_2,…,t_m \in T

    特征统计量
    均值 \mu_t = EX_t = \int_{-\infty}^{\infty}xdF_t(x) = \int_{-\infty}^{\infty}xp(x)dx\\ 方差 \sigma_t = DX_t = E(X_t - \mu_t)^2 = \int_{-\infty}^{\infty}(x-\mu_t)^2dF_t(x)\\ 自协方差 \gamma(t,s) = E(X_t - \mu_t)(X_s - \mu_s)\\ 自相关系数 \rho(t,s) = \frac{\gamma(t,s)}{\sqrt{DX_t ·DX_s}}

3-2-2 时间序列的白噪声检验

EX_t = \mu ,\forall t \in T\\ \gamma(t,s) = \left\{ \begin{array}{rcl} \sigma^2,t=s \\ 0,t\ne s \end{array} ,\forall t,s\in T\right.

DX_t = \gamma(0) = \sigma^2

根据Markov定理,只有方差齐性假定成立时,用最小二乘法得到的未知参数估计值才是准确的,有效的

总结

  1. 消除趋势后平稳且是白噪声序列,建立的模型是ARIMA(p,d,q).其中,d是指差分的阶数。
  2. 消除周期后平稳且是白噪声序列,建立的模型是ARIMA(p,(d,D),q). 其中,D是指D步差分。
  3. 消除周期后的模型有简单季节模型和乘积季节模型。
上一篇 下一篇

猜你喜欢

热点阅读