分布
2019-06-15 本文已影响0人
鲸鱼酱375
数据分布形态
一组或一系列数字,落在坐标图里的形态特征。比如:正态分布。
1.正态分布 Normal distribution
1.1 定义

又名高斯分布 Gaussian distribution
若随机变量X服从一个数学期望为μ,标准方差为σ^2的高斯分布
1.2 正态分布的特征
- 正态分布有两个参数,即均数μ和标准差σ,可记作N(μ,σ2):均数μ决定正态曲线的中心位置;标准差σ决定正态曲线的陡峭或扁平程度。σ越小,曲线越陡峭;σ越大,曲线越扁平。
- u变换:为了便于描述和应用,常将正态变量作数据转换。μ是正态分布的位置参数,描述正态分布的集中趋势位置。正态分布以X=μ为对称轴,左右完全对称。正态分布的均数、中位数、众数相同,均等于μ。
- σ描述正态分布资料数据分布的离散程度,σ越大,数据分布越分散,σ越小,数据分布越集中。也称为是正态分布的形状参数,σ越大,曲线越扁平,反之,σ越小,曲线越瘦高。
- 3σ原则:P(μ-σ<X≤μ+σ)=68.3%P(μ-2σ<X≤μ+2σ)=95.4%P(μ-3σ<X≤μ+3σ)=99.7%
2.卡方分布
卡方分布是从正态分布中衍生出的一种分布。其定义是若干个随机变量的平方和也服从一种分布,即卡方分布。
卡方分布:常用于拟合优度检验

3.t分布
t分布: 多用于比例的估计和检验,用于方差分析,协方差分布和回归分析

4.f分布

5.区别:
卡方分布:常用于拟合优度检验
t分布: 多用于比例的估计和检验,用于方差分析,协方差分布和回归分析
t分布: 在信息不足的情况下,只能用t分布,比如在整体方差不知道的情况下,对总体均值的估计和检验常用t统计量
6.伯努利分布 两点分布
伯努利分布是二元分布 - 它只需要两个值(0 或 1),概率为p
可以求期望 E(x) 方差D(x)

7.Gamma 分布
Gamma 分布是由两个参数定义的连续概率分布。
给定不同的参数,伽玛分布可能看起来非常不同。探索不同的参数。
指数分布在技术上是 Gamma 分布的一个特例,但也在 scipy 中单独实现为expon。
8.Beta 分布
Beta 分布是在区间[0,1]上定义的分布,由两个形状参数定义


9.泊松分布
在给定已知平均速率(和独立出现)的情况下,泊松分布建模了固定时间间隔的事件。


10.二项分布

11.均匀分布

12.指数分布



但有可能与实际不符,那就加个参数
13. sigmoid函数


reference:
https://blog.csdn.net/back_to_dream/article/details/51361431
https://blog.csdn.net/renwudao24/article/details/44463489
截图来自YouTube