Cupy的用处概述

2019-10-24  本文已影响0人  胜负55开

前提:传统的数组和矩阵都是通过numpy来设定,然后numpy来调用cpu计算!
cupy的作用:数组和矩阵都是通过cupy来设定,然后cupy来调用gpu并行计算!

区别与联系:

cupy的优势:专门进行大型、高维数组/矩阵的快速计算(非常非常快)!
要想实现数组/矩阵的快速运算,要注意3点:

下面用一个很简单的例子即可体现上面的内容:循环矩阵相加

import cupy as cp
import numpy as np
import time

# 高维矩阵/数组:
gpu = cp.ones( (1024,512,4,4) )
cpu = np.ones( (1024,512,4,4) )

# 纯numpy的cpu测试:
ctime1 = time.time()
for c in range(1024):
    cpu = np.add(cpu,cpu)   # 这里用np.add()和直接用 + 一样!内核都是cpu来算
ctime2 = time.time()
ctotal = ctime2 - ctime1
print('纯cpu计算时间:', ctotal)

# 纯cupy的gpu测试:
gtime1 = time.time()
for g in range(1024):
    gpu = cp.add(gpu,gpu)   # 自带的加法函数
gtime2 = time.time()
gtotal = gtime2 - gtime1
print('纯gpu计算时间:', gtotal)

# gpu和cpu混合编程:
ggtime1 = time.time()
for g in range(1024):
    gpu = gpu + gpu         # 手工加法:+ 默认回到cpu计算!!!
ggtime2 = time.time()
ggtotal = ggtime2 - ggtime1
print('混合的计算时间:', ggtotal)

三组循环矩阵相加的耗时结果:

纯cpu计算时间: 43.857738733291626
纯gpu计算时间: 0.02496480941772461
混合的计算时间: 1.4730699062347412

彼此差距非常明显!上文中需要注意的2、3点非常非常重要!
由本例也可看出,cupy的gpu并行计算潜力有多大!
本例的计算量还是太小,一个GTX-1050的笔记本显卡,都根本还没发挥其功力!如果将cupy应用到服务器上、应用到深度学习之中,潜力非常大!

本文集会持续更新cupy的相关操作,并实时将其与对应的numpy使用进行对比。
numpy教程网站
cupy教程网站

上一篇 下一篇

猜你喜欢

热点阅读