linux&github深度学习科研实验

这样搭建Ubuntu系统GPU环境,看完还不会,你来找我!(收藏

2021-06-01  本文已影响0人  IT小叮当
image

Ubuntu 20.04 LTS 搭建GPU环境

image

胜利是不会向我们走来的,我们必须自己走向胜利。

Victory won't come to us unless we go to it.

image

入门人工智能领域,深度学习也好,强化学习也罢,如果没有算力做支撑,还是早点洗洗睡吧,毕竟梦里啥都有!

因此,对于入门这个领域的本科生、研究生或准备进入工业界的相关群体来说,学会搭建GPU环境是必备的基本功技能之一。下面,我将尽可能详细地说明,甚至重现每一步的结果截图,以便有益于诸君。

进入终端,执行命令

nvidia-smi
image

可以看到,系统此时支持的CUDA版本为11.2

一、安装CUDA

进入CUDA安装的官网

https://developer.nvidia.com/cuda-toolkit-archive

找到匹配的CUDA11.2

image

选择Linux

image

选择x86_64 ----Ubuntu----20.04(根据实际系统版本选择)---deb(local)

image

系统信息查询补充:

系统版本查看

lsb_release -a
image
  Distributor   ID:     Ubuntu             //类别是  Ubuntu  
  Description:Ubuntu  20.04.2 LTS        //20年4月发布的长时间支持版本    // LTS 是  Long  Term Support:长时间支持版本,支持周期长达三年至五年  
  Release           20.04              //发行日期或者发行版本号  
  Codename:focal                    //ubuntu的代号名称

系统内核版本和位数查看

image

其中x86_64就代表是64位的

我们回到主线任务,点击deb(local)后,CUDA官网便会给出对应的下载安装命令。

image

在系统中进入下载文件夹

image

打开终端

image

开始逐条执行命令

1wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/cuda-ubuntu2004.pin2sudo mv cuda-ubuntu2004.pin /etc/apt/preferences.d/cuda-repository-pin-6003wget https://developer.download.nvidia.com/compute/cuda/11.2.2/local_installers/cuda-repo-ubuntu2004-11-2-local_11.2.2-460.32.03-1_amd64.deb4sudo dpkg -i cuda-repo-ubuntu2004-11-2-local_11.2.2-460.32.03-1_amd64.deb5sudo apt-key add /var/cuda-repo-ubuntu2004-11-2-local/7fa2af80.pub6sudo apt-get update7sudo apt-get -y install cuda
image image

执行到第3条命令时,需要下载cuda本地deb安装包 ,时间会稍长些

image

可能会出现“段错误(核心已转储)”

image

我们执行命令,查看目前资源限制的设定。

ulimit -a 

可以看到堆栈的大小为8192k 大约8M多,我们将其存储空间调大

image

执行命令,将其调整为100M

ulimit -s  102400
image

调整后,将下载不完整的安装包删除

image

删除后,再次运行下载安装包下载命令

image

发现仍然会出现此错误

image

忽视此错误,继续安装,发现报错

image

于是继续删除下载不完整的文件

image

执行命令

ulimit -c unlimited

再次进行下载

image

发现,weget已经可以下载到100成功解决“段错误(核心已转储)”问题

image

继续执行安装命令

image

发现公钥没有被安装,根据提示安装公钥,执行命令

sudo apt-key add /var/cuda-repo-ubuntu2004-11-2-local/7fa2af80.pub
image

继续执行安装命令

image

执行下一步更新apt-get源

image

执行安装cuda

image

安装完成

image

查看cuda信息

nvcc -V
image

根据提示信息,安装nvidia-cuda-toolkit工具套装

sudo apt install nvidia-cuda-toolkit
image

输入y继续执行

image

安装时间较长

image

装好后继续执行命令查看cuda

image

说明cuda安装成功!

二、安装cudnn

进入cuDNN官网

https://developer.nvidia.com/cudnn
image

点击下载cuDNN (需要登录,未注册的需要先注册)

image

输入邮箱

image

输入密码或注册成功后,进入下载页面,记得勾选“I Agree... 同意协议选项”

image

选择对应CUDA 11.X的 cuDNN

image

找到Ubuntu对应的3个deb安装包,全部下载

image

下载成功后

image

先执行命令,利用正则查看文件 模糊查询lib开头的(为了复制文件名)

ls |grep lib
image

开始安装

1sudo dpkg -i libcudnn8_8.2.0.53-1+cuda11.3_amd64.deb2sudo dpkg -i libcudnn8-dev_8.2.0.53-1+cuda11.3_amd64.deb3sudo dpkg -i libcudnn8-samples_8.2.0.53-1+cuda11.3_amd64.deb

安装runtime版

image

安装dev开发版

image

安装样例代码

image

测试cuDNN是否安装成功

cuDNN的样例代码位置在/usr/src/cudnn_samples_v8(注意这里的v8指版本8,不同的cuda可能对应不同的版本,有的是v7) ,我们可以通过编译mnistCUDNN sample进行验证

执行命令,复制样例到自己新建的lab文件夹

(1)先确定lab文件夹路径

1cd ~2ls3cd lab4pwd
image

(2)开始复制并测试

1cp -r /usr/src/cudnn_samples_v8/ /home/yhl/lab
image
1cd /home/yhl/lab/cudnn_samples_v8/mnistCUDNN
image

进行编译

1make clean && make

出现错误“FreeImage.h”

image

安装libfreeimage3库即可解决“FreeImage.h”没有被发现的错误。

1sudo apt-get install libfreeimage3 libfreeimage-dev
image

安装完成

image

再次进行编译

1make clean && make
image

测试运行

1./mnistCUDNN
image

出现Test passed ! 表示cuDNN已经安装成功并且能够正常使用。

image image

如果你在操作过程中遇到了什么问题,或有什么想法和建议(希望大家多提想法和建议,一起交流,一起进步****~),在留言区留下你的足迹吧,看到后便会及时回复大家哦~

上一篇下一篇

猜你喜欢

热点阅读