多卡训练推理时报错AttributeError: 'MMDist

2025-11-04  本文已影响0人  JIAWEIJIAWEI

AttributeError: 'MMDistributedDataParallel' object has no attribute '_use_replicated_tensor_module'

在较新的 PyTorch 版本(特别是 1.12+ / 2.x)中,DistributedDataParallel 的内部实现发生了变化,
旧版本 MMCV 的 MMDistributedDataParallel 会去访问一个已经不存在的成员:
快速临时修复(不改环境)

修改下面文件
/root/miniconda3/envs/xxx/lib/python3.10/site-packages/mmcv/parallel/distributed.py
找到这一段(大约 150 行):

self._use_replicated_tensor_module

替换为:

getattr(self, '_use_replicated_tensor_module', False)

或者直接注释引用处,让其默认 False。

上一篇 下一篇

猜你喜欢

热点阅读