pytorch训练经验

2022-11-22 本文已影响0人 nowherespyfly

用fp16训练的时候，得单独把transformer layer改成fp32，不然可能loss不降
checkpoint+ddp的时候，可能会报这个错：

把find_unused_parameters改成False就可以了。

model = build_ddp(
    model,
    cfg.device,
    device_ids=[int(os.environ['LOCAL_RANK'])],
    broadcast_buffers=False,
    find_unused_parameters=False)

热点阅读

早餐里见世界
谏言：全国的扫黑反腐

08-22浅谈对“天津爆炸事故”的看法和感想
07-04元芳你怎么看下一句
07-03陪伴是最长情的告白下一句
01-21你知道fighting是什么意思？告诉你fighting的意思
06-23深度好文：生命的意义不单是幸福
06-20深度好文：人最怕深交后的陌生

pytorch训练经验

猜你喜欢

热点阅读