Docker 运行GPU 遇到的问题

2023-02-23  本文已影响0人  NazgulSun
奇怪的现象

之前在 Docker 跑pytorch一直没有问题,然后下载了一个paddle 镜像。
由于paddle镜像与我们自己的显卡 3090 不兼容,所以在docker 内部升级了 cuda 驱动。
然后所有的 docker 容器内,gpu 都是non_avaiable了。
在docker 内部执行 nvidia-smi, 能够看到显卡,但是 Cuda version 是N/A

升级的步骤

https://zhuanlan.zhihu.com/p/396292888, 基本上是follow 这里面的步骤。

image.png
然后这里选择了,安装驱动,460版本。
因为不选择这个,无法升级下去。

问题的原因

因为在docker 内部选择了按照驱动driver 460版本。会影响到物理机,而物理机之前的driver 是高于460的比如470 才能使用。
所以这个造成了显卡gpu 无法使用。
最终我们在物理机上升级了显卡驱动解决了问题。

如何避免docker 中更新driver

就是手动自己安装。不用连接里提到的方式

上一篇 下一篇

猜你喜欢

热点阅读