同天与标准镜检对肺结核诊断准确性的对比:一片系统性综述和meta
总结
背景:痰涂片镜检肺结核高负担国家使用最广泛的检测手段。提高其准确性也可以达到the Millennium Development Goals所确定的病例检测目标。但是很多病人并不能为标准痰液镜检留取足够的数量或返回治疗的次数不能达到一些临床回访规定所需。为了给WHO专家组提供政策建议,我们对1天痰液留取和2天痰液留取的精简准确性进行了评估。
方法:我们做了一个系统综述以及搜索相关文章进行meta分析,对已经经培养诊断的肺结核患者做前载或同天痰与标准留痰涂片镜检的准确度进行比对。我们所搜了Medline, Embase, Biosis, and Web of Science从2005年1月1日至2012年2月14日发表的相关文章。两个审核人对文章和每个研究点抽取的数据进行筛选。当四个以上研究被利用时,我们将使用汇总估算和随机效应meta分析方法对敏感性和特异性进行检测(95%CI)。
发现:我们从五篇文章中筛选出8个相关研究,共纳入低收入国家的7771名疑似结核病人。与标准的两天留取两个痰液进行萋苨式染色镜检方法相比,同天留取两个痰与其有较相同的敏感性和特异性(敏感性,同天64%,95%CI 60-69 vs标准63%,60-69;特异性,同天98%,97-99vs标准98%,97-99).我们发现了相似的结果,在荧光染色镜检的一些研究中,在进行三个痰镜检的研究中,无论他们是否和两个痰涂片方案相比或是彼此相比。
结果:同天痰液镜检和标准痰液留取镜检有相同的准确性。获取数据的结核方案需要执行改变,以对卫生系统进行优化补充并理解他的功能。
前言
痰液镜检是肺结核使用最广泛的方法,提高其效力的战略能够结核高增加国家的结核确诊率和疗效。直到2007年,WHO扔推荐疑似肺结核病人需要两天内送检三个痰液标本,一个及时痰,一个晨痰,还有一个是第二天的随机痰。在那时,就有报道,第三个痰仅增加了累计阳性率的2-5%,WHO开始推荐高质量实验室仅进行两个痰标本的检测。这个政策是为了减少实验室工作负担和价值耗损,并增加痰液镜检的时间,但是却并没有解决痰液镜检的另一个劣势:病人需要再次往返卫生中心。交通,食宿和丢失的工资的负担,对结核病人的家庭收入的影响接近50%,这种负担使得病人及其家庭更加贫穷,致使完整的痰液检测,数据收集或开始治疗之前,就会有诊断过程中约13-95%比例的病人流失。
前载镜检是一个新的策略,评估一个病人在第一天就获取两个或以上的痰标本的方法。痰液收集和结果报告都可以在一天之内完成,这个策略被命名为同天镜检。在2009年,WHO专家组就总结了证据支持同天痰涂片镜检提供给结核策略和技术咨询组,接下来就是新政策的出台。我们展示了这个过程的发现,从科学文献中更新了额外的证据。
方法
搜索策略和筛选标准
我们的研究依据实验诊断的meta分析和系统综述的标准指南和方法。我们制定了三个综述问题对比肺结核诊断三个策略的准确性:第一,前载对比标准两个痰镜检;第二,前载比对标准三个痰镜检;第三,前载两个痰比对前载三个痰镜检。我们在三个亚组中评估这些问题:第一,病人留痰直接进行痰涂片和萋苨式染色,然后使用简便的光学显微镜进行评估;第二,病人留痰直接进行痰涂片和金胺O染色,然后使用二极管荧光显微镜进行检测;第三,HIV病人使用萋苨和荧光镜检。
我们搜索了Medline, Embase, Biosis, and Web of Science从2005年1月1日至2012年2月14日首次进行的所有语言的研究(看附件搜索的题目)。此外,我们综述的研究包括了一个之前的系统综述是关于一系类的抗酸杆菌检测的文献,手动搜索了合格文章的参考文献和相关综述,以及联系研究者去确认一些未发表或正在进行的研究。
我们纳入了所有关于对比前载镜检和标准镜检用于肺结核诊断的研究,一个或以上的痰没有进行浓集直接进行涂片检测。我们仅纳入每个病人的一个或以上的使用了固体或者液体结核培养作为参考标准的研究。两个实验员分别筛选这些收集的文章作为参考,综述那些预先确认的全文文章;关于研究选择的分歧以协商一致方式解决。
我们定义来自一个国家的数据集是一个研究,然后从多国评估中心分别抽取各个国家的数据。我们定义收集痰标本和两到三个痰涂片镜检的一个方法为一个诊断策略。我们定义标准镜检策略是一个痰被收集和检测在第一天,其他的痰被收集和检测在第二天(例如 ,现场痰-晨痰或者现场痰-晨痰-现场痰的收集计划)。我们定义前载战略是两个痰被检测在病人到达的第一天,同天战略类似于前载战略,它的检测策略是仅检测病人到达当天的两个痰。
数据抽取
两个研究员抽取数据,并通过协商解决分歧。我们评估研究质量使用质量评估工具为诊断精确度研究-一个评估方法为诊断研究(附件)-评估是否研究点是否参与外部质量控制计划为涂片镜检。 我们展示了研究符合或报告质量标准图表的部分。附表有额外的数据抽取和质量评估准则的详情。
统计分析
我们计算了有结核培养作为标准的诊断策略的敏感性和特异性。为达到最小的预期异质性,我们制定了一个在某个亚组内做数据分析的策略:萋苨式染色镜检研究,荧光显微镜镜检组,包含30个以上感染HIV病人的萋苨式染色和荧光镜检研究。对每个综述问题和亚组,我们使用森林图评估异质性,使用95%CI评估纳入操作特点,使用χ² and I²进行数据统计分析。当四个以上研究被利用时,我们利用分层汇总纳入操作特性或随机效应meta分析的方法产生的汇总估算和差异性对数据的敏感性和特异性进行表达(95%CI)。我们绘制了哲学估值和95%CI在ROC空间内。
我们假定不超过10%的敏感性差异和不超过2%的特异性差异作为两个战略有相似的诊断精准性的统计指标。我们使用GRADE(推荐的评定,发展和评估指南的分级方法)汇总我们的结果。
结果
我们搜索出了3691篇文章,其中258篇被认为有潜在的相关性。图1.全文综述除外,我们的分析纳入了五篇文章,从明确的临床分组中划分的八个研究中获取数据。我们确认了一个正在进行的研究,它没有被纳入,因为没有完整的上传公布数据。
表1显示研究设计和设置的特性。所有的研究都是在结核流行国家进行,纳入具有代表性的人群(成人门诊病人是2-3周以上的咳凑患者,表2)。八个研究中的五个报道指导病人如何留取高质量的痰标本。六个研究使用了罗氏或小川固体培养基,一个研究使用结核生长提示管MGIT液体培养,一个研究同是使用了液体和固体培养。
研究中的萋苨式染色镜检亚组具有高的方法学质量,所有涉及研究都有质量评估(附表)。而荧光镜检组(在四个研究中非随机选择)和HIV组(在四个研究中半选择性和便利取样;稀少的数据)的研究质量则较低。
八个研究比对了同天和标准战略对进行萋苨式染色的两个痰。图2和附件中的显示在两个研究中,敏感性评价是不一致的,但是特异性评价是一致的。汇总分析显示同天和标准战略的敏感性相同;特异性是完全相同的(表3)。这些汇总点的绘制图和他们紧凑分布在ROC里面的95%CI确认了这些结果(附件)。敏感性和特异性没有不同在标准和同天战略中,敏感性差异((p=0·71, I²=0·0%)和特异性差异
(p=0·88,I²=0·0%)在这些研究中也是一致的(图2)。一个报道单样本的实验被排除,他的汇总分析没有变化(敏感性差异2.0%[-0.4---4.4%];特异性差异0.0%[-0.3---0.4]).表3表4汇总了这些结果以及亚组的分析结果。
仅仅有一篇文章,是一个随机对照试验,分别从埃塞俄比亚,尼泊尔,尼日利亚,也门纳入了6627名受试者,它报道了两个诊断策略随访率丢失的差异。病人分配到同天组去递交第二个痰标本失败的可能是被分配到标准组的一半,但是两组的随访率都很高(97.6%同天 vs 94.2%标准组;差异是3.4%[95%CI 2.3-4.6];p<0.001).
七个研究比对了萋苨式染色的前载和标准战略,当有三个痰液被收集的时候。敏感性不一致,但特异性评估是一致的。汇总分析显示同天和标准战略有相同的敏感性,特异性也一样(表3)。在表3中显示前载和标准方案特异性和敏感性没有差异,这些差异在研究中也是一致的,敏感性(p=0·77, I²=0·0%) 和特异性 (p=0·96, I²=0·0%; 附件).有一个研究报道了随访丢失的数据,被分配到前载方案的病人没有更多的第三个标本的提交率相比于标准方案的病人。 (94·1% 前载
vs 92·8% 标准;差异为
1·2% [95% CI –0·4 to 2·8])。
七个研究对比了萋苨式染色三个痰液和两个痰液的前载方案,他们的敏感性和特异性与和之前报道的一样(附件)。汇总敏感性和特异性差异显示,三痰前载方案没有比两痰的有更高的敏感性(3·3% [95% CI –0·1 to 6·6])或 特异性(–0·1%[–0·5 to 0·3]) (表4)。虽然敏感性差异不同(p=0·12, I²=41%),但是特异性差异是一致的 (p=0·98, I²=0·0%)。
两篇文章中有五个研究对比了荧光镜检前载方法和标准方案。汇总评估显示研究之间的敏感性和特异性有异质性(附件),但是敏感性差异 (p=0·60, I²=0·0%) 或特异性差异(p=0·74, I²=0·0%;附件). 方面没有异质性的。两个痰的LED FM战略,标准和前载方案的敏感性是相同的(表3)。除了在ROC空间中95%CI有重叠区域,这些汇总点和他们的分布宽度都支持这些结果(附件)。两个痰的LED FM战略,标准和前载方案的特异性是相同的(表3)。三个痰的收集方案也是一样的结果,敏感性和特异性没有差异(表3)。三个痰和两个痰的前载方案之间的敏感性和特异性没有统计学差异(表4,附件)。
有两篇文章评估了合并HIV病人的使用萋苨式染色和荧光染色的前载方案和标准方案。在其中一篇文章中,纳入589名肺结核合并HIV阳性病人,一个研究是位于埃塞俄比亚,另一个是位于尼泊尔,使用萋苨式染色的同天方案的敏感性要好与标准的两痰方案 (67% 同天vs 49%标准; 差异 –18% [95% CI
–35 to 0]) ,但是特异性相似(95% vs 97%; 差异2% [–1 to 5]),两个研究的三痰方案也有相同的结果,一个研究中LED FM的三痰和两痰方案结果也相同。第二篇文章是来源于乌干达的包含321名HIV患者的报道,同天的单痰,两痰涂片镜检和标准两痰,两痰萋苨式染色有相同的敏感性(49%同天vs 51% 标准,差异 2% [–3 to 5%]) 和特异性 (97% vs 99%;差异 2% [–1 to 4])。同天单痰和标准方案也有非常相同的结果---敏感性(57% vs 60%; 差异 3% [–2 to 8]) ,特异性(97% vs 97%; 差异 0 [–1 to 1])。
我们对萋苨式染色和荧光染色的亚组分析出的所有结果所提供的证据质量的评估为中等。由于配对研究测试结果(例如真阳性,假阳性,假阴性和真阴性)是被使用作为病人相关结果的替代(例如,开始治疗或丢失的病人的数量;附件),我们扣除了配对研究的间接性的一分,和由于随机研究的异质性和不精确性的一分。我们扣除了配对研究的间接性以及随机研究中的异质性和不精确性的一些分数后,我们评估LED FM的研究质量为中等。 由于研究设计的整体优势,我们没有在随机研究中扣除患者非随机抽样的额外分数。感染HIV病人组的结果质量被评估为低,由于便利的抽样和稀疏的数据一个额外的分数被扣除。
讨论
我们的系统综述包含的八个直接萋苨式染色镜检的八个研究,共纳入7771名病人,其中的前载和标准镜检方案有相同的精确性无论是两痰还是三痰涂片方略。此外,敏感性差异所有评估是精确的,而且要比预期指定的重要的差异值要更小。这些结果证明痰涂片镜检是一个结核病例的发现技术的关键限制之一,即重复的临床拜访的需求可以被淘汰而不会有诊断精确性的丢失。如果有更广泛的补充,那就是同天镜检能够提供重要的利益给一些群体,包括结核病人(减少的费用和更早的诊断)和被怀疑但不是结核的病人(减少费用和更早的排除),以及结核流程(更是少的疑似结核病人的拜访和进入研究中更少的痰涂片阳性病人的丢失)。
我们也提供了一些额外的同天镜检的重要问题补充。首先,我们认为前载方案中两痰和三痰之间没有有意义的敏感性差异。第二,对于LED FM前载方案和标准方案的敏感性一样,无论是两痰还是三痰。最后,对于感染HIV的结核病人,前载方案和标准方案的就萋苨式染色(两痰的三个研究和三痰的两个研究)和LED FM(两痰的两个研究和三痰的一个研究)的诊断精确性而言看起来似乎也是相同的;但是,因为数据稀少,如果能够在更多研究点纳入更多感染HIV结核病人的更多的高质量研究到我们的综述中,那我们就能够提供更加精确更加有可推广的证据。
在2009年,我们的文章数据发现被WHO专家小组通过评估,并接下来被STAG-TB,一个独立的综述结核政策纲领和支持材料的组织,评估通过了我们的文章发现。在2010年,WHO制定了一个新的政策指示,那些已经成功补充执行当前WHO两痰诊断方案政策的国家,可以考虑更改为同天诊断方案,尤其是在一些地方哪里的病人可能已经默认了诊断流程。那些依旧使用三痰诊断方案的国家应该考虑跨越式的改变进入同天诊断方案,一旦WHO推荐的外部镜检质控评估系统到位,并且良好质量的镜检结果已经被记录在案。考虑到国家层面的计划性,系统性,可操作性的影响,同天诊断方案是一个很有必要的补充。
我们的系统评价有几个优势,包括一个标准化的方案,该方案符合已公布的系统评价和荟萃分析指南。我们获得了同等意义的结果,通过使用一些方法进行数据分析(标准随机效应meta分析,广义估计方程模型和HSROC分析),所有的研究的整体的方法学质量也是高的。
虽然我们没有系统性的搜集这些研究所报告的相关的一些结果,但是我们的综合搜索方案,包括联系所有初次研究的作者,使我们可以验证这些研究,并且我们目前已经对病人相关的和流程相关的数据已经进行了数据抽取。但遗憾的是,我们确认仅有一篇描述病人相关结果的报道,病人在前载方案中被评估诊断中丢失的可能性是标准方案的一半。虽然随机对照试验中病人的绝对丢失率很小,但是标准方案的中常规数据集的丢失率很高。虽然我们没有确认任何结果报告或开始治疗的时间,但是WHO同天诊断政策委员会推荐,痰涂片检查结果需要在病人病人离开医疗机构前给出,并允许同天治疗开始在涂片阳性之中。同天报告也许也对涂片阴性的患者有重要的利益,通过减少一个额外的痰液收集的经济负担。从常规数据集中收集的数据需要记录医疗系统的改变,要求去成功的将方案放入实际练习中,并明白他的意义,通过对比同天镜检开始前后,对疑似感染肺结核病人的开始治疗时间的影响,花费的影响,和病人的满意度的变化。对这项病人相关和医疗系统相关的利益的表述将会加强同天精简方案的影响力。
一些观察者已经提高了对同天镜检方案对减少结核病人院内传播的关注,因为病人有更多的时间在医疗机构,在提交第二个痰和等待第一个结果的过程中。WHO关于结核感染控制的指南推荐对疑似结核病人应该管理提速以尽可能的减少他们在医疗设备上花费的时间,未来的研究应该评估方案去获得这样或这样的方法包括一个痰的收集进行两次涂片检查,有咳凑或其他结核临床症状的病人标本在到达医疗机构之后被立即收集,这样临床医生就可以在评估病人的过程中使用结果。前一项战略尤其值得进一步评估,因为在方案环境中实施可能比相隔1小时收集两个样本实施起来更简单。附属的方案包括给疑似结核病人提供口罩以及也可以将它们与其他门诊患者分开,以补偿当天所需的额外同天镜检诊等待时间。最后,如果如果同天镜检能确保所有的涂阳病人能够立即接受治疗,在社区中减少结核病传播的益处可能超过患者在诊所等待额外1小时所引起的医院传播风险。
最后,在除了显微镜检查之外进行痰培养的高收入环境中,对同天收集评估中,取消晨痰培养的影响未知的。晨痰培养的增量(9%)与其他报道第二个标本培养(15%)相似,但还需要直接比较不同标本采集策略如何影响痰培养的准确性和有效性。
。