SDTM变量角色（ROLE）初级

2021-02-03 本文已影响0人生物统计与SAS研究员

一、变量角色划分

1）SDTM的变量分为如下几类：

标识符 (Identifier)变量：例如，用来标识研究本身、参与研究的受试者、域名以及记录序号等

主题 (Topic)变量：指明观测记录的主要目的（例如，某一实验室检测的名称）

时间 (Timing)变量：描述观测记录的时间（例如，开始时间和结束时间）

修饰语 (Qualifier)变量：包括用来进一步描述结果的说明性文字或者数值，或观测记录的更多特征（例如，单位或描述性形容词）

规则 (Rule)变量：在试验设计模型里，表达一种算法或可执行的方法，来定义其开始或结束，分流或循环等条件

2）其中修饰语变量可以分为：

分组修饰语 (Grouping Qualifiers) ：对同一域中的数据分组。例如：--CAT 和 –SCAT

结果修饰语 (Result Qualifiers) ：在发现类数据集中，用来描述与主题变量相关的特定的结果。它们回答了主题变量（Topic Variable）所要表达的问题。例如：ORRES，--STRESC和 –STRESN

同义词修饰语 (Synonym Qualifiers) ：指定了观测记录中某一特定变量的其他可用名称。例如：--MODIFY和--DECOD是主题变量--TRT或--TERM的同义词修饰语，--TEST和--LOINC则是–TESTCD的同义词修饰语

记录修饰语 (Record Qualifiers) ：从记录水平（而不是变量水平）定义某一观测的附加属性。例如：--REASND，--AESLIFE以及不良事件域（AE）中所有其他严重不良事件（SAE）的标识变量；人口统计学域（DM）中的AGE，SEX和RACE变量；发现类域中的--BLFL，- -POS，--LOC，--SPEC和–NAM

变量修饰语 (Variable Qualifiers):用来进一步修饰和描述某一观测的特定变量，只能结合它所修饰的变量使用才有意义。例如：--ORRESU，--ORNRHI和--ORNRLO都是--ORRES的变量修饰语； --DOSU是–DOSE的变量修饰语。例如，对“受试者101在研究的第六天开始出现轻度恶心症状”这一观测记录，其主题变量值是不良事件术语“恶心”。标识符变量则是该受试者编号“101”。时间变量值是该不良事件出现时研究已开始的天数，“开始于研究第6天”。该事件严重程度可视为记录修饰语的示例，其值为“轻度”，其他时间和修饰变量可视情况加入，以提供必要的细节来对观测记录进行充分的描述。

二、标识符 (Identifier)变量

标识符变量如 STUDYID，DOMAIN，USUBJID 各个域当中都是通用的且是req的，换句话说任何域（除了试验设计类）都包含这三个变量，且不能为空。需要注意的是类似于-LNKID，-LNKGRP，-GRPID 都是标识符变量，而同样是用于分类的-CAT，-SCAT则是修饰语。因为标识符变量的主要意义在于跨域的连接，故而标识符变量实际上首先是以连接键的身份存在的。

三、主题 (Topic)变量

主题变量就目前的版本来看，每个数据集只有一个。且主题变量一定是req的，换句话说主题变量是必须存在的，且不能为空。

不同类型的主题变量命名有区别，对于特殊目的域来说需要分开讨论：

DM：SUBJID

SE：ETCD

SV：VISITNUM

SM：MIDS

CO：COVAL

对于干预类数据集来说，主题变量为-TRT。

对于事件类数据集来说，主题变量为-TERM。

对于发现类数据集来说，主题变量为-TESTCD。

这里需要提到的是，就 3.3 版IG来说，所有的同义词修饰语 (Synonym Qualifiers)都是用来修饰主题变量的。当然这是有例外的：

第一是 ISCAT，在 3.3 版IG中他是同义词修饰语，可毫无疑问这个变量不是修饰主题变量。然而-CAT这种变量，在其他所有的域当中都属于分组修饰语(Grouping Qualifiers) ，所以怀疑这是编辑错误。

第二是同义词修饰语 ARM ，他是修饰 ARMCD 的。ARMCD 在DM中是一个记录修饰语，而非主题变量。但实际上在TA当中 ARMCD 是主题变量。这种情况还有很多，但我觉得这种例外不应该作为“例外”来看待。

在我看来真正的例外其实只有一个，就是DM里的 INVNAM 他是用来修饰 INVID （记录修饰语）的。

四、时间 (Timing)变量

时间变量共有大概几类，总结起来是下面几个系列

1、DTC系列：—DTC，—STDTC，—ENDTC

2、DY系列：—DY，—STDY，—ENDY，—DUR

3、—TPTREF，—RFTDTC

4、TPT系列：—TPT，—TPTNUM，—ELTM，—STTPT，—ENTPT

5、RFTPT系列：—ENRTPT，—STRTPT，—TPTREF

6、RF系列：—ENRF，—STRF

7、VISIT系列：VISIT，VISITNUM，VISITDY

8、ELEMENT系列：EPOCH，TAETORD

五、修饰语 (Qualifier)变量

修饰语是用来“修饰”的，换句话说他必须有修饰的对象。针对5种修饰语的修饰对象，可以分为三个级别，多观测级，观测级，变量级：

1、修饰若干观测的修饰语（多观测级）：

指的是 分组修饰语 (Grouping Qualifiers) ，这类变量描述的是若干观测的共同属性，从而达到分类的目的。有时候可以把同属性的类别分成多个数据集。

2、修饰单个观测的修饰语（观测级）：

指的是 记录修饰语 (Record Qualifiers) ，这类变量描述的是单个观测的属性。

3、专门修饰主题变量的修饰语（变量级）：

指的是 结果修饰语 (Result Qualifiers) 还有 同义词修饰语 (Synonym Qualifiers) ，结果修饰语如其定义是为了回应发现类主题变量的问题，同义词修饰语在第三部分讲主题变量时已经解释过了，这里不再赘述。

4、修饰一般变量的修饰语（变量级）

指的是 变量修饰语 (Variable Qualifiers) ，变量修饰语可以修饰某个变量，包括记录修饰语，结果修饰语。需要注意的是，变量修饰语也修饰主题变量，例如：-PRESP ，用于描述主题变量是否可以从CRF上获取（换句话说这些信息是否为事先确定的）。另外在AE中描述编码的变量就是变量修饰语，该变量可能修饰的是主题变量 -TERM，不过也可能是修饰 -TERM 的其他“同义词修饰语”。

六、规则 (Rule)变量

略

七、变量顺序

一般来说各类变量在每个域当中的排序为：

1、标识符

2、主题（同义词修饰语，结果修饰语，变量修饰语跟在后面）

3、分组修饰语

4、记录修饰语（变量修饰语跟在后面）

5、时间

SDTM变量角色（ROLE）进阶之时间变量

SDTM变量角色（ROLE）进阶之修饰语