【学习】统计基础

2019-08-23  本文已影响0人  X_Ran_0a11

一、 抽样估计理论

https://wenku.baidu.com/view/4e2bfbea710abb68a98271fe910ef12d2af9a911.html

image.png

估计准确与否的标准:
(1)无偏性:


image.png

(2)有效性


image.png
(3)相合性
image.png

二、点估计

2.1 矩估计

矩估计:利用样本的k阶矩作为总体的k阶矩的估计量,再建立含待估计参数的方程,最后求解。
总体的k阶矩就是E(X)、E(X平方)、E(X三方)等等,利用样本的k阶矩就是求样本的均值、样本平方的均值、样本三方的均值等等(所以可以知道,在样本很多的时候,两者误差会很小);
待估计参数一般可以用k阶矩的组合形式求解出来,比如正态分布的μ是等于E(X)的,所以可以据此建立方程用E(X)求解μ:


image.png

PS,方差的无偏估计是n自由度,标准差的无偏估计是n-1维度。

2.2 极大似然估计

极大似然估计方法:根据实际发生的结果来估计参数的最大可能值。
根据实际结果及其对应的概率分布(离散型和连续型)构造似然函数(其实就是发生这个结果的实际概率),相乘代表概率互相独立→对L求导并令其为零,求得极大似然值。


image.png

极大似然和矩估计的关系在于:

三、区间估计

区间估计首先只适用于连续概率函数的情况,其次区间估计必定有对应置信度的概念。


image.png

求解的问题是:

首先转化下思路,假设这是标准正态分布(非标准转化成标准),那么抽取一批样本,平均重量在0±x1的概率为a,在0±x2的概率为b,x1和x2均为正,如果x1<x2,那么a<b对吧,a和b就是置信度概念,极端情况就是说平均重量在0±∞的概率为100%,这个时候置信度就是100%。

再继续转化思路,针对上面的实际问题,如果已知μ,而抽样的样本均值为μ+x3,我们是可以求得最后样本均值落在μ±x3的概率的,如果x3比较小,那么概率就比较小(因为允许他落入的趋于很小),这个时候小概率事件都发生了,我们就认为根据样本均值看来,他是符合这个正态分布的。如果x3很大,达到允许落在μ±x3的概率超过95%,那他实际偏离μ值已经很远了,我们认为,给了你一个95%的置信度区间你都没有落进去,则很大概率是因为你本来就不符合这个分布,所以就认为你不满足我的正太分布要求。(这就是假设检验的内容)

3.1 各种情况下的求解

https://www.bilibili.com/video/av62439939?from=search&seid=6809068784014832945

3.2 假设检验

假设检验就是给定一个很小的显著性水平𝛼(额,跟前面正态分布参数里面的阿尔法不是一个值哈),相应的置信度就是1-𝛼,设定H0和H1,H0所对应的的就是满足该显著性水平下的一个估计区间(接受域)。如果落入H0的接受域,则符合条件。

显著性水平的定义:当原假设为真并且以等式形式出现时犯第一类错误的概率称为检验的显著性水平,用𝛼表示。
通俗解释就是,当结论是对的,但是验证却表明结论是错误的概率,所以是一个小概率事件,可以认为他在绝大多数情况下根本不会发生。这才是我们判断的基础,因为我们认为小概率时间不会发生,所以如果发生了,我们就认为结论不正确。

image.png
3.3 其它问题

上面提到的都是双侧校验问题,比如3.2中的问题,是否可以认为该批考生的平均成绩为70分,就是双侧校验问题。如果问题改成了,是否可以认为该批考生平均成绩小于70分,就变成了单侧校验问题。

ps:常用的分布有正态分布、t分布、卡方分布(就是正态的平方)

四、单因素方差分析

https://www.bilibili.com/video/av51847689?from=search&seid=14047279950588608805

image.png
image.png

单因素方差分析就是考察针对同一个变量有很多组的情况下,各个组有没有显著性的不同(google app那个案例是考察不同类型的app的size有无不同)。
步骤:

整体理论很简单,直接看这一张总图就知道了:


image.png
上一篇下一篇

猜你喜欢

热点阅读