大队列CT胰腺癌PANDA 模型 医生结合AI后,病灶检测灵敏度

2025-08-06  本文已影响0人  生信探索
image.png

胰腺癌(PDAC)因早期难发现、预后极差被称为“癌王”,多数患者确诊时已处于晚期,错失手术机会。近期,《Nature Medicine》发表的一项研究显示,中国团队研发的AI模型PANDA可通过非增强CT精准检测胰腺癌,为大规模筛查提供了新工具。


image.png

作者提供了在线网站:panda.medofmind.com 演示模型在几个样本上的效果

image.png

一、数据来源:覆盖多场景、多中心,兼顾多样性与可靠性

为确保模型的泛化能力,研究团队构建了多维度数据集:

二、数据处理

非增强CT中,胰腺癌与正常组织的灰度差异极小,直接标注病灶几乎不可能。研究团队通过跨模态信息迁移破解这一难题,具体步骤如下:

  1. 双模态数据对齐
    为3208名训练集患者同时采集非增强CT和增强CT(同一检查时段),利用刚性配准算法(基于解剖标志点,如脊柱、血管)将两组图像精准对齐,确保像素级空间对应。

  2. 专家标注迁移
    由5名胰腺影像专家在增强CT上手动标注:1.胰腺整体区域;2.病灶边界(含胰腺癌及7类良性病变);3.病灶类型(病理确诊)。通过配准矩阵,将这些标注“映射”到非增强CT上,生成非增强CT的伪标注(标注精度通过Dice系数验证,≥0.85)。

  3. 半监督胰腺分割优化
    仅靠迁移标注仍不足,团队引入半监督学习:用1000例公开数据集(如TCIA)的胰腺标注初始化模型,再用3208例训练集的伪标注进行微调,最终胰腺分割Dice系数达0.91,为后续病灶检测提供精准“感兴趣区域”。

  4. 场景适配增强
    针对胸部CT可能仅部分扫描胰腺的问题,设计动态裁剪增强:随机裁剪非增强CT的胰腺区域(裁剪比例30%-70%),模拟胸部CT的“不全扫描”场景,迫使模型学习胰管扩张等间接征象。

    image.png

三、PANDA模型构建

胰腺癌检测的核心难题在于:非增强CT中病灶特征模糊,且需兼顾高灵敏度(不漏诊)与高特异性(少误诊)。PANDA模型的构建围绕这一痛点,通过“数据处理-多阶段建模-临床适配”三层设计

阶段1:胰腺定位(nnU-Net)【从CT种找到胰腺位置】

采用低分辨率nnU-Net (https://github.com/MIC-DKFZ/nnUNet) (3D U-Net 变体),输入为全腹CT(512×512×30层),输出胰腺的三维分割掩码。以标注的胰腺区域为真值,用Dice损失优化(聚焦边缘像素),同时加入“解剖约束”(胰腺与脊柱、十二指肠的相对位置),避免分割偏移。

阶段2:是否有病灶(多任务CNN)

以全分辨率nnU-Net 为 backbone,含双分支:

阶段3:病灶鉴别诊断(记忆Transformer)

对检测到的病灶,进一步分类为胰腺癌(PDAC)或7类良性病变(如IPMN、慢性胰腺炎等),辅助临床决策。

四、进一步优化模型:PANDA Plus

现实场景中,CT设备、患者人群差异大,且存在“未见过”的病变(如急性胰腺炎)。团队通过多种增量学习实现模型进化:

  1. 硬示例挖掘
    从16420例真实世界数据(RW1)中筛选出76例假阳性(如peri-胰腺病变)和28例假阴性(如<10mm囊肿),作为“难例集”。

  2. 增量微调
    冻结PANDA主干网络,仅微调分类头和记忆tokens,用“知识蒸馏损失”(约束新模型与原模型输出差异)避免遗忘旧知识,同时学习新病变特征(如急性胰腺炎的“胰腺肿大”)。

  3. 特异性跃升
    PANDA Plus在4110例RW2数据中,特异性从99.0%提升至99.9%(每1000例仅1例假阳性),且新增对急性胰腺炎的检测灵敏度达90.0%。

五、模型结果:精度超专家,覆盖多场景,临床价值显著

内部与外部验证的核心性能

模型在多中心数据中表现稳定,对早期 / 微小病灶检测能力优异。

image.png

与放射科医生的对比及 AI 辅助效果

PANDA 性能超越人工,且能显著提升医生诊断能力。

模型可利用胸部 CT(非专门扫描胰腺)实现胰腺癌筛查,拓展应用场景

image.png

模型在实际临床流程中安全有效,假阳性极低

上一篇 下一篇

猜你喜欢

热点阅读