统计学学习

统计学学习笔记——day3

2022-04-06  本文已影响0人  monkey_study
随机对照研究RCT定量数据统计策略

成组两样本t检验

  1. 独立性(independence):由研究者根据数据类型判断,各组观察值之间互相独立,互不影响
  2. 正态性(normality):各个样本均来自正态总体,通过算法(K-S/S-W法)结合图形检验,详参上节内容——统计学学习笔记——day2 - 简书 (jianshu.com)
  3. 方差齐性(homoscedascity):各个样本所在总体方差相等——数据变异程度类似,方差齐性统计量F值以及P值,P>0.05,接受H0,方差齐,采用t.test;反之,方差不齐,采用校正t.test。

成组两样本t检验假设检验过程

  1. 建立假设,确定检验水准
    H0:μ1=μ2,两组样本某指标总体均数相同
    H1:μ1!=μ2,两组样本某指标总体均数不等
    检验水准一般为α=0.05,即设定小概率事件,当P值小于0.05时,结果被认为具有统计学意义
  2. 计算检验统计量t值
  3. 确定P值,做出推断结论
    根据t值,计算Pvalue(此处假设计算所得P=0.0001),按照α=0.05水准,拒绝H0,接受H1,差异具有统计学意义,可认为两组样本某指标总体均数受到自变量影响不同。反之,P>0.05,拒绝H1,不拒绝H0,样本均值无差异,或差异没有统计学意义。

规范的统计描述

平均值±标准差
差值——效应值,相对对照组的效应。
95%置信区间:总体上两组差值95%可能所处的位置。
临床数据中,生存时间——数据分布类型:偏态数据
个人体会:拿到数据后,判断数据类型(定性/定量),如果定量,判断数据分布(正态/偏态)

实验性研究定量数据统计策略

两样本非参数秩和检验

参数检验和非参数检验
参数检验:以特定的总体分布(如正态分布)为前提,对其总体参数做假设检验。 比如:t检验,z检验以及F检验
非参数检验:对总体分布不作要求,又名任意分布检验,直接对总体分布做检验假设。重要方法:秩和检验

类似于因子。 因子(factor):又称为类别变量,指名义型变量或有序型变量。
名义型变量:没有顺序之分的类别变量,例如Ⅰ型、Ⅱ型糖尿病。
有序型变量:表示一种顺序关系
,但不是数量关系。例如人们描述病情好坏(poor,improved,excellent)。emmmm,秩次更像有序型变量,规定了次序order。

秩和(rank sum)——秩次之和

  1. 确定Pvalue,做出推断结论。
    根据得到的z值,与小概率事件得界值比较(α=0.05时,界值为1.96),如果z小于界值,则P>0.05,接受H0,拒绝H1;反之,则拒绝H0,接受H1。

统计描述

文字:对照组样本某指标中位数为000(上四分位数,下四分位数)单位,空白对照组样本某指标中位数为000(上四分位数,下四分位数)单位,两组总体某指标分布是否存在统计学差异(z=000,P</>000)

此处000 表示数字

表格内容涉及:中位数、中位数差值(95%置信区间)、四分位数,检验统计量Z值,Pvalue

秩和检验适用性高,但检验效能略低于参数检验。

正态分布使用t检验;

近似正态分布

详细查看https://mp.weixin.qq.com/s/rZo93k6znbC3ZdbIEp_eAA

严重偏态用秩和检验

补充:P值与置信区间

样本均数差值代表效应;
95%置信区间含义:总体均数有95%可能落在这个区间(通俗理解) 真实定义:由样本统计量所构造的总体参数的估计区间为置信区间。
当95%置信区间包含0时,说明总体均数可能为0,即H0可能成立,这也意味着,我们不能拒绝H0,此时P一般是>0.05。

计算置信区间学习链接:https://mp.weixin.qq.com/s/uCvIedN2bDSgyjISx0Jacg

上一篇下一篇

猜你喜欢

热点阅读