可汗学院-统计学
【1】 均值 中位数 平均数
均数mean:算数平均数 所有数字总和的平均值
统计学意义:衡量集中趋势
中位数median:排序后的中间数字(偶数中间两数的平均值)
统计学意义:考虑集中趋势的另一种做法
众数mode:出现最多的数字
【2】 极差 中程数
极差range:这些数字翻开的有多远 最大减最小
统计学意义:描述数字的紧密程度
中程数midrange:最大最小数的平均值
统计学意义:考虑集中趋势
【 3】 象形统计图
统计图标注单位
【4】条形图
注意每组数据(不同类别)自身的前后数据变化趋势
【5】线形图
二维空间内的趋势
【6】饼图
一览以及可以看出哪些占比最多(最少需要数字)
【7】误导人的线形图
线形图对比,坐标系要统一,否则趋势会误导
或者直接在一张图上
统一:刻度距离、原点数字
【8】茎叶图
统计学意义:一眼可以看出是十位和个位的的分布情况
【9】箱线图
四分位数的表现,中位数,(去除中位数后)再中位数
【10】箱线图2
又名盒须图
统计学意义:数据的分布情况,中位数多少,最常见和密集程度,形成四分区间
【11】统计 集中趋势
三大类:描述统计学(descriptive):无需展示所有数据,使用指标性数字代表所有数据
推论统计学(inferential):数据对事物总体做推论,讨论样本和总体的关系
集中趋势(central tendency):一般用mean\median\mode
算数平均数容易受离群数影响偏移
此时中位数、众数更适合表达集中趋势
【12】统计:样本和总体
sample population
μ=populaion mean=总体平均值
上-下x=sample mean=样本均值
Σ=sum=求和
【13】总体方差
N
μ = Σxi
I=1
n
上-下x = Σxi
I=1
离中趋势 dispersion=
方差=σ2= Σ(数值-均值)的平方/个数
远大越分散
【13】统计:样本方差
σ2=variance=总体方差
s2=sample variance =样本方差
【14】标准差
样本方差是用来估计总体方差的 为了提供无偏估计,结果类似除以n-1(用S2平方表示)不用于σ2
standard debiation =标准差=![](https://img.haomeiwen.com/i1373220/2604b0cdccdabf3c.png)
【15】标准差
标准差是方差的开根号,主要是为了保持单位和数据一致 米而非米平方
【16】统计:诸方差公式=几个方差公式的转换
【17】随机变量介绍
不同于一般变量
概率分布和
离散随机变量(可以枚举)、连续随机变量(无限结果)