177：为什么需要人口统计学资料和基线资料？table编写

2022-12-14 本文已影响0人林芷文的日常碎碎念

几乎所有的临床试验都会收集人口学的信息，比如出生日期，年龄，性别等，下面是一张通用的人口统计学Form。

有些还会在人口统计学Form收集身高体重等信息，这个一般放在VS domain。

今天我们来讲讲为什么要收集这些信息以及对应的TFL怎么编写。

收集这些人口统计学的信息，是因为它们可能与研究主题相关，并可用于统计分析的分层。比如糖尿病/高血压试验，年龄和性别都是一些比较关键的研究因素，常用于亚组分析，或在推断分析中用作协变量（怎么感觉这两句是一个意思）。

根据收集来的人口学信息，可能就会根据这些信息进行分组或者分亚组。然后这些数据可能在安全性分析和疗效性分析都起作用，因为两者都可以根据人口统计学特征进行分层。

然后收集的一些既往病史/既往用药等其他既往信息也是同样的道理，都可能对试验有影响。

大多数临床数据到TFL阶段，大多数就是分为3大部分（也就是shell的结构）：

一：受试者信息总结表

二：疗效性分析表

三：安全性分析表

接下来我们讲讲如何写人口学的表格，一般shell长这样

大家写这种类型的table，就是将shell分成一个一个section，比如求年龄定量统计量是Section1，求性别定性统计量是Section2，求民族定性统计量是Section3......

我们写程序的时候就按照这个逻辑去处理，具体看程序，我用我自己创建的RAW.DM数据集

当筛选出我们所需要的观测之后，就可以求频数频率那些了，实现的方法可以通过proc freq或者proc sql(当然还有其他方法)

有时候不同的统计师可能会有不一样的shell格式，有的可能还会要求求小n，这个简单，你就理解成只需要按照组别分类就可以了，比如性别，如果求小n，筛选sex^=""的观测，直接tables trtpn就可以，之后转置一下就是小n的值。然后下面的具体男女分类那么tables trtpn*sex,加上sex就可以了。