darknet的编译和YOLO在不同编译条件的运行速度对比
这篇文章有什么内容
- darknet的编译(使用CPU,无opencv)
- YOLO的运行
- opencv的安装
- darknet的编译(使用CPU,有opencv)
- nvidia driver的安装
- cuda的安装
- darknet的编译(使用GPU,有opencv)
- cudnn的安装
- darknet的编译(使用GPU,外加cudnn,有opencv)
- 不同的编译条件的速度对比
我眼中的darknet和YOLO
darknet是一个使用C/C++语言编写的很精简的神经网络框架,可以结合opencv,cuda,cudnn使用,来进行功能的的扩展或者硬件的加速。
同时一些近年来比较火的一些结构,比如YOLO(You only look once)结构,源码是搭建在darknet上的,如果想要学习YOLO,直接使用darknet是一个很便捷的方法。
我使用的设备
我使用的系统是ubuntu18.04,笔记本上携带的CPU是Intel® Core™ i5-5200U CPU @ 2.20GHz × 4,GPU是GEFORCE 920M,所以GPU性能不是很高,但是相对与CPU还是有很大的提升的,之后会有对比。
我还是强烈推荐使用linux系统进行这个编译,windows很能很难将需要的库安装到系统上
正文开始
表示对前辈的尊敬,贴上darknet官方地址
1. darknet的编译(使用CPU,无opencv)
按照darknet网站提供的安装方式,详见这里,在终端下使用命令
git clone https://github.com/pjreddie/darknet.git
cd darknet
make
最后会生成一个darknet可执行文件,之后会用到,还有两个lib库,这个暂时用不到。为了之后用于对比,所以这个darknet可运行文件需要和重命名一下
mv darknet darknet_pure
2. YOLO的运行
按照YOLO网页给的运行命令,
./darknet_pure detect cfg/yolov3.cfg yolov3.weights data/dog.jpg
首先你需要有yolov3.weights文件,可以使用
wget https://pjreddie.com/media/files/yolov3.weights
命令下载,也可以在这个YOLO网页中直接点击下载,如图
但是这里有一个问题,你的CPU/GPU是否有足够的计算力去运行,或者内存显存是否够用呢,所以笔者这里并没有使用yolov3.weights,因为之后使用GPU的时候显存是不够,我使用的是yolov3-tiny.weights,命令修改为
./darknet_pure detect cfg/yolov3-tiny.cfg yolov3-tiny.weight data/dog.jpg
输出结果是
Loading weights from yolov3-tiny.weight...Done!
data/dog.jpg: Predicted in 1.206042 seconds.
dog: 57%
car: 52%
truck: 56%
car: 62%
bicycle: 59%
因为没有opencv的原因,所以程序是将结果储存在图片中了,使用查看命令
xdg-open predictions.jpg
结果我们应该是一样的吧
3. opencv的安装
为了程序运行中可以直接查看,我们需要opencv,安装方式是
sudo apt-get install libopencv-dev
4. darknet的编译(使用CPU,有opencv)
我们需要修改以下Makefile文件
OPENCV=1
将第三行修改成这个样子,然后使用make编译,编译成功后依然修改一个名字
make
mv darknet darknet_opencv
然后运行看看运行情况
./darknet_opencv detect cfg/yolov3-tiny.cfg yolov3-tiny.weight data/dog.jpg
我的结果
Loading weights from yolov3-tiny.weight...Done!
data/dog.jpg: Predicted in 1.230927 seconds.
dog: 56%
car: 52%
truck: 56%
car: 62%
bicycle: 58%
识别的结果也会直接显示
5. nvidia driver的安装
详见这里,安装方法简单来说
sudo ubuntu-drivers autoinstall
然后应该重启一下就好了
6. cuda的安装
cuda的安装,很多人直接就能花费一篇文章进行安装,什么这个run文件,那个环境变量,我发现可以直接使用ubuntu的apt工具安装,简单,简单
sudo apt install nvidia-cuda-toolkit
然后使用nvcc命令测试
nvcc -V
我的结果是这个样子
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2017 NVIDIA Corporation
Built on Fri_Nov__3_21:07:56_CDT_2017
Cuda compilation tools, release 9.1, V9.1.85
7. darknet的编译(使用GPU,有opencv)
依然是修改Makefile文件,将第一行修改成这个样子
GPU=1
然后编译,修改名字
make
mv darknet darknet_opencv_gpu
然后运行看看运行情况
./darknet_opencv_gpu detect cfg/yolov3-tiny.cfg yolov3-tiny.weight data/dog.jpg
这是我的结果
Loading weights from yolov3-tiny.weight...Done!
data/dog.jpg: Predicted in 0.382318 seconds.
dog: 56%
car: 52%
truck: 56%
car: 62%
bicycle: 58%
可以观察到时间大大减少了,/滑稽
8. cudnn的安装
去官网登陆现在cudnn,这里注意,你下载的cudnn一定要对应cuda版本号,之前使用nvcc -V查看过的,所以一定注意。我安装的是这个两个文件(安装的时候需要注意两个文件的安装顺序)
9. darknet的编译(使用GPU,外加cudnn,有opencv)
依然是修改Makefile文件,这个就不多说了,然后编译,修改名字,运行
make
mv darknet darknet_opencv_gpu_cudnn
./darknet_opencv_gpu_cudnn detect cfg/yolov3-tiny.cfg yolov3-tiny.weight data/dog.jpg
结果
Loading weights from yolov3-tiny.weight...Done!
data/dog.jpg: Predicted in 0.072806 seconds.
dog: 56%
car: 52%
truck: 56%
car: 62%
bicycle: 58%
速度有时一个提升
10. 不同的编译条件的速度对比
(简书居然不支持表格,额)
使用CPU,无opencv:1.206042 seconds.
使用CPU,有opencv:1.230927 seconds.
使用GPU,有opencv:0.382318 seconds.
使用GPU,外加cudnn,有opencv:0.072806 seconds.
很明显,cuda外加cudnn的速度优势。
完结
希望大家可以相互分享,共同进步