统计学基础
-
集中趋势
均值——算术平均数,描述平均水平
中位数——按大小排列后位于正中间的数,描述中等水平
众数——出现最多的数,描述一般水平 -
离散程度
极差——最大值-最小值,描述数据范围的大小
方差——在统计学上,更多使用方差来描述数据的离散程度
简化为平方的均值减去均值的平方
标准差——方差的开方,为了保持单位的一致性 -
直方图
频数直方图
频率直方图——频率=频数/组距,组距就是分组的极差 -
箱线图
-
茎叶图
-
线图
-
柱形图
-
饼图
-
试验——对某种自然现象作一次观察或进行一次科学试验
-
样本空间——对于随机试验E,E的所有可能结果组成的集合称为E的样本空间,记为S
-
随机事件——试验E的样本空间S的某个子集为E的随机事件,简称事件,一般用大写字母A,B,C……表示
-
事件运算定律
德摩根律——
交换律——A ∪ B = B ∪ A;A ∩ B = B ∩ A
结合律——A ∪ (B ∪ C) = (A ∪ B) ∪ C;A ∩ (B ∩ C) = (A ∩ B) ∩ C
分配律——A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C)
-
古典概型(等可能概型)
-
排列——与顺序有关
从n个不同的元素中取出m个元素,并按照一定的顺序排成一列,则共有
种排列方法。
用具体的例子来理解上面的定义:4种颜色按不同颜色,进行排列,有多少种排列方法,如果是6种颜色呢。从6种颜色中取出4种进行排列呢。
解:A(4,4)=4x(4-1)x(4-2)x(4-3)x(4-4+1)=4x1x2x3x1=24。
A(6,6)=6x5x4x3x2x1=720。
A(6,4)=6!/(6-4)!=(6x5x4x3x2x1)/2=360。 -
组合——与顺序无关
从n个不同的元素中取出m个元素,则共有
种取法。
用例子来理解定义:从4种颜色中,取出2种颜色,能形成多少种组合。
解:C(4,2)=A(4,2)/2!={[4x(4-1)x(4-2)x(4-3)x(4-4+1)]/[2x(2-1)x(2-2+1)]}/[2x(2-1)x(2-2+1)]=[(4x3x2x1)/2]/2=6 -
C-代表-Combination--组合数
A-代表-Arrangement--排列数(在旧教材为P-permutation--排列)
N-代表-元素的总个数
M-代表-参与选择的元素个数
!-代表-阶乘
0!=1 -
几何概型
- 条件概率——已知某个事件A发生的条件下,另一个事件B发生的概率称为条件概率,记为P(B|A)
- 乘法定理——P(AB)=P(B|A)P(A),其中P(A)>0
推广到P(ABC)=P(C|AB)P(B|A)P(A)=P(A|BC)P(B|C)P(C) - 全概率公式——A = AB1 ∪ AB2 ∪AB3,B1、B2、B3为互斥事件,
P(A)=P(AB1)+P(AB2)+...+P(ABn)=P(A|B1)P(B1) + P(A|B2)P(B2) + ... + P(A|Bn)P(Bn) - 划分
设S为试验E的样本空间,B1、B2......Bn为E的一组事件,若
(1)BiBj = ∅,i ≠ j,i,j = 1,2,......,n
(2)B1 ∪ B2 ∪......∪Bn = S
则称B1,B2......Bn是样本空间S的一个划分 - 贝叶斯公式
-
相互独立事件——两个事件没有一点关系,姚明感冒,马云出国
-
互斥事件——只有一个事件发生或者两个都不发生,中国队夺冠,美国队夺冠
-
对立事件——抛硬币正面还是反面