SDTM变量角色(ROLE)初级

2021-02-03  本文已影响0人  生物统计与SAS研究员

一、变量角色划分

1)SDTM的变量分为如下几类:

标识符 (Identifier)变量:例如,用来标识研究本身、参与研究的受试者、域名以及记录序号等

主题 (Topic)变量:指明观测记录的主要目的(例如,某一实验室检测的名称)

时间 (Timing)变量:描述观测记录的时间(例如,开始时间和结束时间)

修饰语 (Qualifier)变量:包括用来进一步描述结果的说明性文字或者数值,或观测记录的更多特征(例如,单位或描述性形容词)

规则 (Rule)变量:在试验设计模型里,表达一种算法或可执行的方法,来定义其开始或结束,分流或循环等条件

2)其中修饰语变量可以分为:

分组修饰语 (Grouping Qualifiers) :对同一域中的数据分组。例如:--CAT 和 –SCAT

结果修饰语 (Result Qualifiers) :在发现类数据集中,用来描述与主题变量相关的特定的结果。它们回答了主题变量(Topic Variable)所要表达的问题。例如:ORRES,--STRESC和 –STRESN

同义词修饰语 (Synonym Qualifiers) :指定了观测记录中某一特定变量的其他可用名称。例如:--MODIFY和--DECOD是主题变量--TRT或--TERM的同义词修饰语,--TEST和--LOINC则是–TESTCD的同义词修饰语

记录修饰语 (Record Qualifiers) :从记录水平(而不是变量水平)定义某一观测的附加属性。例如:--REASND,--AESLIFE以及不良事件域(AE)中所有其他严重不良事件(SAE)的标识变量;人口统计学域(DM)中的AGE,SEX和RACE变量;发现类域中的--BLFL,- -POS,--LOC,--SPEC和–NAM

变量修饰语 (Variable Qualifiers):用来进一步修饰和描述某一观测的特定变量,只能结合它所修饰的变量使用才有意义。例如:--ORRESU,--ORNRHI和--ORNRLO都是--ORRES的变量修饰语; --DOSU是–DOSE的变量修饰语。 例如,对“受试者101在研究的第六天开始出现轻度恶心症状”这一观测记录,其主题变量值是不良事件术语“恶心”。标识符变量则是该受试者编号“101”。时间变量值是该不良事件出现时研究已开始的天数,“开始于研究第6天”。该事件严重程度可视为记录修饰语的示例,其值为“轻度”,其他时间和修饰变量可视情况加入,以提供必要的细节来对观测记录进行充分的描述。

二、标识符 (Identifier)变量

标识符变量如 STUDYID,DOMAIN,USUBJID 各个域当中都是通用的且是req的,换句话说任何域(除了试验设计类)都包含这三个变量,且不能为空。需要注意的是类似于-LNKID,-LNKGRP,-GRPID 都是标识符变量,而同样是用于分类的-CAT,-SCAT则是修饰语。因为标识符变量的主要意义在于跨域的连接,故而标识符变量实际上首先是以连接键的身份存在的。

三、主题 (Topic)变量

主题变量就目前的版本来看,每个数据集只有一个。且主题变量一定是req的,换句话说主题变量是必须存在的,且不能为空

不同类型的主题变量命名有区别,对于特殊目的域来说需要分开讨论:

  DM:SUBJID

  SE:ETCD

  SV:VISITNUM

  SM:MIDS

  CO:COVAL

  对于干预类数据集来说,主题变量为-TRT。

  对于事件类数据集来说,主题变量为-TERM。

  对于发现类数据集来说,主题变量为-TESTCD。

这里需要提到的是,就 3.3 版IG来说,所有的同义词修饰语 (Synonym Qualifiers)都是用来修饰主题变量的。当然这是有例外的

第一是 ISCAT,在 3.3 版IG中他是同义词修饰语,可毫无疑问这个变量不是修饰主题变量。然而-CAT这种变量,在其他所有的域当中都属于分组修饰语(Grouping Qualifiers) ,所以怀疑这是编辑错误。

第二是同义词修饰语  ARM ,他是修饰 ARMCD 的。ARMCD 在DM中是一个记录修饰语,而非主题变量。但实际上在TA当中 ARMCD 是主题变量。这种情况还有很多,但我觉得这种例外不应该作为“例外”来看待。

在我看来真正的例外其实只有一个,就是DM里的 INVNAM 他是用来修饰 INVID (记录修饰语)的。

四、时间 (Timing)变量

时间变量共有大概几类,总结起来是下面几个系列

1、DTC系列:—DTC,—STDTC,—ENDTC

2、DY系列:—DY,—STDY,—ENDY,—DUR

3、—TPTREF,—RFTDTC

4、TPT系列:—TPT,—TPTNUM,—ELTM,—STTPT,—ENTPT

5、RFTPT系列:—ENRTPT,—STRTPT,—TPTREF

6、RF系列:—ENRF,—STRF

7、VISIT系列:VISIT,VISITNUM,VISITDY

8、ELEMENT系列:EPOCH,TAETORD

五、修饰语 (Qualifier)变量

修饰语是用来“修饰”的,换句话说他必须有修饰的对象。针对5种修饰语的修饰对象,可以分为三个级别,多观测级,观测级,变量级:

1、修饰若干观测的修饰语(多观测级):

        指的是 分组修饰语 (Grouping Qualifiers) ,这类变量描述的是若干观测的共同属性,从而达到分类的目的。有时候可以把同属性的类别分成多个数据集。

2、修饰单个观测的修饰语(观测级):

        指的是 记录修饰语 (Record Qualifiers)  ,这类变量描述的是单个观测的属性。

3、专门修饰主题变量的修饰语(变量级):

        指的是 结果修饰语 (Result Qualifiers) 还有 同义词修饰语 (Synonym Qualifiers)  ,结果修饰语如其定义是为了回应发现类主题变量的问题,同义词修饰语在第三部分讲主题变量时已经解释过了,这里不再赘述。

4、修饰一般变量的修饰语(变量级)

        指的是 变量修饰语 (Variable Qualifiers) ,变量修饰语可以修饰某个变量,包括记录修饰语,结果修饰语。需要注意的是,变量修饰语也修饰主题变量,例如:-PRESP ,用于描述主题变量是否可以从CRF上获取(换句话说这些信息是否为事先确定的)。另外在AE中描述编码的变量就是变量修饰语,该变量可能修饰的是主题变量 -TERM,不过也可能是修饰 -TERM 的其他“同义词修饰语”。

六、规则 (Rule)变量

七、变量顺序

一般来说各类变量在每个域当中的排序为:

  1、标识符

  2、主题 (同义词修饰语,结果修饰语,变量修饰语跟在后面)

  3、分组修饰语

  4、记录修饰语(变量修饰语跟在后面)

  5、时间

SDTM变量角色(ROLE)进阶之时间变量

SDTM变量角色(ROLE)进阶之修饰语

上一篇下一篇

猜你喜欢

热点阅读