大数据,机器学习,人工智能机器学习人工智能/模式识别/机器学习精华专题

关于Linux+GPU服务器下GPU显存不足问题

2019-05-07  本文已影响6人  米兰的小码农

1. 问题描述

在基于Linux操作系统环境下的GPU服务器上跑深度学习代码时,我们常常会因为如不正常退出等问题导致资源没被正常回收而出现GPU显存不足的情况,此时再次运行学习代码就会出现如下图所示报错情况。从图片上可以看出我10.91GiB的显存仅剩下362.38MiB,报错提示原因也是ResourceExhaustedError(资源耗尽错误)。

问题描述
Traceback

2. 解决方法

2.1 传统方法

2.2 杀死进程法

sudo fuser /dev/nvidia*
kill -9 PID
sudo fuser /dev/nvidia*

3.备注

上一篇 下一篇

猜你喜欢

热点阅读