这样搭建Ubuntu系统GPU环境,看完还不会,你来找我!(收藏
Ubuntu 20.04 LTS 搭建GPU环境
image胜利是不会向我们走来的,我们必须自己走向胜利。
Victory won't come to us unless we go to it.
image入门人工智能领域,深度学习也好,强化学习也罢,如果没有算力做支撑,还是早点洗洗睡吧,毕竟梦里啥都有!
因此,对于入门这个领域的本科生、研究生或准备进入工业界的相关群体来说,学会搭建GPU环境是必备的基本功技能之一。下面,我将尽可能详细地说明,甚至重现每一步的结果截图,以便有益于诸君。
进入终端,执行命令
nvidia-smi
image
可以看到,系统此时支持的CUDA版本为11.2
一、安装CUDA
进入CUDA安装的官网
https://developer.nvidia.com/cuda-toolkit-archive
找到匹配的CUDA11.2
image选择Linux
image选择x86_64 ----Ubuntu----20.04(根据实际系统版本选择)---deb(local)
image系统信息查询补充:
系统版本查看
lsb_release -a
image
Distributor ID: Ubuntu //类别是 Ubuntu
Description:Ubuntu 20.04.2 LTS //20年4月发布的长时间支持版本 // LTS 是 Long Term Support:长时间支持版本,支持周期长达三年至五年
Release 20.04 //发行日期或者发行版本号
Codename:focal //ubuntu的代号名称
系统内核版本和位数查看
image其中x86_64就代表是64位的
我们回到主线任务,点击deb(local)后,CUDA官网便会给出对应的下载安装命令。
image在系统中进入下载文件夹
image打开终端
image开始逐条执行命令
1wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/cuda-ubuntu2004.pin2sudo mv cuda-ubuntu2004.pin /etc/apt/preferences.d/cuda-repository-pin-6003wget https://developer.download.nvidia.com/compute/cuda/11.2.2/local_installers/cuda-repo-ubuntu2004-11-2-local_11.2.2-460.32.03-1_amd64.deb4sudo dpkg -i cuda-repo-ubuntu2004-11-2-local_11.2.2-460.32.03-1_amd64.deb5sudo apt-key add /var/cuda-repo-ubuntu2004-11-2-local/7fa2af80.pub6sudo apt-get update7sudo apt-get -y install cuda
image
image
执行到第3条命令时,需要下载cuda本地deb安装包 ,时间会稍长些
image可能会出现“段错误(核心已转储)”
image我们执行命令,查看目前资源限制的设定。
ulimit -a
可以看到堆栈的大小为8192k 大约8M多,我们将其存储空间调大
image执行命令,将其调整为100M
ulimit -s 102400
image
调整后,将下载不完整的安装包删除
image删除后,再次运行下载安装包下载命令
image发现仍然会出现此错误
image忽视此错误,继续安装,发现报错
image于是继续删除下载不完整的文件
image执行命令
ulimit -c unlimited
再次进行下载
image发现,weget已经可以下载到100成功解决“段错误(核心已转储)”问题
image继续执行安装命令
image发现公钥没有被安装,根据提示安装公钥,执行命令
sudo apt-key add /var/cuda-repo-ubuntu2004-11-2-local/7fa2af80.pub
image
继续执行安装命令
image执行下一步更新apt-get源
image执行安装cuda
image安装完成
image查看cuda信息
nvcc -V
image
根据提示信息,安装nvidia-cuda-toolkit工具套装
sudo apt install nvidia-cuda-toolkit
image
输入y继续执行
image安装时间较长
image装好后继续执行命令查看cuda
image说明cuda安装成功!
二、安装cudnn
进入cuDNN官网
https://developer.nvidia.com/cudnn
image
点击下载cuDNN (需要登录,未注册的需要先注册)
image输入邮箱
image输入密码或注册成功后,进入下载页面,记得勾选“I Agree... 同意协议选项”
image选择对应CUDA 11.X的 cuDNN
image找到Ubuntu对应的3个deb安装包,全部下载
image下载成功后
image先执行命令,利用正则查看文件 模糊查询lib开头的(为了复制文件名)
ls |grep lib
image
开始安装
1sudo dpkg -i libcudnn8_8.2.0.53-1+cuda11.3_amd64.deb2sudo dpkg -i libcudnn8-dev_8.2.0.53-1+cuda11.3_amd64.deb3sudo dpkg -i libcudnn8-samples_8.2.0.53-1+cuda11.3_amd64.deb
安装runtime版
image安装dev开发版
image安装样例代码
image测试cuDNN是否安装成功
cuDNN的样例代码位置在/usr/src/cudnn_samples_v8(注意这里的v8指版本8,不同的cuda可能对应不同的版本,有的是v7) ,我们可以通过编译mnistCUDNN sample进行验证
执行命令,复制样例到自己新建的lab文件夹
(1)先确定lab文件夹路径
1cd ~2ls3cd lab4pwd
image
(2)开始复制并测试
1cp -r /usr/src/cudnn_samples_v8/ /home/yhl/lab
image
1cd /home/yhl/lab/cudnn_samples_v8/mnistCUDNN
image
进行编译
1make clean && make
出现错误“FreeImage.h”
image安装libfreeimage3库即可解决“FreeImage.h”没有被发现的错误。
1sudo apt-get install libfreeimage3 libfreeimage-dev
image
安装完成
image再次进行编译
1make clean && make
image
测试运行
1./mnistCUDNN
image
出现Test passed ! 表示cuDNN已经安装成功并且能够正常使用。
image image如果你在操作过程中遇到了什么问题,或有什么想法和建议(希望大家多提想法和建议,一起交流,一起进步****~),在留言区留下你的足迹吧,看到后便会及时回复大家哦~