数据科学/机器学习/人工智能程序员我爱编程

NumPy 高级索引和数组概念

2017-05-28  本文已影响108人  布客飞龙

NumPy 高级索引和数组概念

调整图像尺寸

# 这个代码用于调整图像尺寸
# 来源:NumPy Cookbook 2e Ch2.3

import scipy.misc 
import matplotlib.pyplot as plt 
import numpy as np

# 将 Lena 图像加载到数组中
lena = scipy.misc.lena()

# 图像宽高
LENA_X = 512 
LENA_Y = 512

# 检查图像的宽高
np.testing.assert_equal((LENA_Y, LENA_X), lena.shape)

# 设置调整系数,水平 3,竖直 2
yfactor = 2 
xfactor = 3

# 调整图像尺寸,水平(沿轴 1)拉伸 3 倍,竖直(沿轴 0 )拉伸两倍
resized = lena.repeat(yfactor, axis=0)
              .repeat(xfactor, axis=1)

# 检查调整后数组
np.testing.assert_equal((yfactor * LENA_Y, xfactor * LENA_Y), resized.shape)

# 绘制原图像(两行一列的第一个位置)
plt.subplot(211) 
plt.title("Lena") 
plt.axis("off") 
plt.imshow(lena)

# 绘制调整后图像(两行一列的第二个位置)
plt.subplot(212) 
plt.title("Resized") 
plt.axis("off") 
plt.imshow(resized) 
plt.show()

创建视图及副本

# 来源:NumPy Cookbook 2e Ch2.4

import scipy.misc 
import matplotlib.pyplot as plt

# 加载 Lena 图像
lena = scipy.misc.lena() 

# copy 创建副本,Python 对象复制,内部内存复制
acopy = lena.copy() 

# view 创建视图,Python 对象复制,内部内存共享
aview = lena.view()

# 绘制 Lena 图像(左上角)
plt.subplot(221) 
plt.imshow(lena)

# 绘制副本(右上角) 
plt.subplot(222) 
plt.imshow(acopy)

# 绘制视图(左下角)
plt.subplot(223) 
plt.imshow(aview)

# 将副本所有元素清零
# 由于数组的数据保存在内部内存中
# 副本不受影响,视图(以及引用)会跟着变化
aview.flat = 0 

# 绘制修改后的视图(右下角)
plt.subplot(224) 
plt.imshow(aview)

翻转图像

# 来源:NumPy Cookbook 2e Ch2.5

import scipy.misc 
import matplotlib.pyplot as plt

# 加载 Lena 图像
lena = scipy.misc.lena()

# 绘制 Lena 图像(左上角)
plt.subplot(221) 
plt.title('Original') 
plt.axis('off') 
plt.imshow(lena)

# 绘制翻转后的图像(右上角)
# Python 的 [::-1] 用于翻转序列
# 这里翻转了第二个维度,也就是水平翻转
plt.subplot(222) 
plt.title('Flipped') 
plt.axis('off') 
plt.imshow(lena[:,::-1])


# 绘制切片后的图像(左下角)
# 取图像的左半部分和上半部分
plt.subplot(223)
plt.title('Sliced') 
plt.axis('off') plt.imshow(lena[:lena.shape[0]/2,:lena.shape[1]/2])

# 添加掩码,将偶数元素变为 0 
# 布尔数组可用作索引 
mask = lena % 2 == 0 
masked_lena = lena.copy() 
masked_lena[mask] = 0 

# 绘制添加掩码后的图像(右下角)
plt.subplot(224) 
plt.title('Masked') 
plt.axis('off') 
plt.imshow(masked_lena)
plt.show()

花式索引

# 这个代码通过将数组对角线上的元素设为 0 ,来展示花式索引
# 花式索引就是使用数组作为索引来索引另一个数组
# 来源:NumPy Cookbook 2e Ch2.6

import scipy.misc 
import matplotlib.pyplot as plt

# 加载 Lena 图像
# Load the Lena array 
lena = scipy.misc.lena() 

# 取图片的宽和高
height = lena.shape[0] 
width = lena.shape[1]

# 使用花式索引将对角线上的元素设为 0
# x 为 0 ~ width - 1 的数组
# y 为 0 ~ height - 1 的数组
lena[range(height), range(width)] = 0

# 将副对角线上元素也设为 0
# x 为 width - 1 ~ 0 的数组
# y 为 0 ~ height - 1 的数组
lena[range(height), range(width - 1, -1, -1)] = 0

# 画出带对角线的 Lena 图像
plt.imshow(lena) 
plt.show()

将位置列表用于索引

# 这个代码的目的就是把 Lena 图像弄花
# 来源:NumPy Cookbook 2e Ch2.7

import scipy.misc 
import matplotlib.pyplot as plt 
import numpy as np

# 加载 Lena 图像 
lena = scipy.misc.lena() 

# 取图像宽高
height = lena.shape[0] 
width = lena.shape[1]

def shuffle_indices(size):   
    '''   
    生成 0 ~ size - 1 的数组并打乱   
    '''
    arr = np.arange(size)   
    np.random.shuffle(arr)
    return arr

# 生成 x 随机索引和 y 随机索引
xindices = shuffle_indices(width) 
np.testing.assert_equal(len(xindices), width) 
yindices = shuffle_indices(height) np.testing.assert_equal(len(yindices), height)


# 画出打乱后的图像
# ix_ 函数将 yindices 转置,xindices 不变
# 结果是一个 height x 1 的数组和一个 1 x  width 的数组
# 用于索引时,都会扩展为 height x width 的数组
plt.imshow(lena[np.ix_(yindices, xindices)]) 
plt.show()

布尔索引

# 来源:NumPy Cookbook 2e Ch2.8

import scipy.misc 
import matplotlib.pyplot as plt 
import numpy as np

# 加载 Lena 图像
lena = scipy.misc.lena()

# 取大小为 size 的数组
# 4 的倍数的下标为 True,其余为 False
def get_indices(size):   
    arr = np.arange(size)   
    return arr % 4 == 0

# 绘制 Lena
# 对角线上每四个元素将一个元素清零 
lena1 = lena.copy() 
yindices = get_indices(lena.shape[0]) 
xindices = get_indices(lena.shape[1]) 
lena1[yindices, xindices] = 0 
plt.subplot(211) 
plt.imshow(lena1)

lena2 = lena.copy() 
# 最大值 1/4 ~ 3/4 之间的元素清零
# 这里用到了数组广播
lena2[(lena > lena.max()/4) & (lena < 3 * lena.max()/4)] = 0 
plt.subplot(212) 
plt.imshow(lena2)
plt.show()

分离数独的九宫格

# 来源:NumPy Cookbook 2e Ch2.9

import numpy as np

# 数独是个 9x9 的二维数组
# 包含 9 个 3x3 的九宫格
sudoku = np.array([   
    [2, 8, 7, 1, 6, 5, 9, 4, 3],
    [9, 5, 4, 7, 3, 2, 1, 6, 8],
    [6, 1, 3, 8, 4, 9, 7, 5, 2],
    [8, 7, 9, 6, 5, 1, 2, 3, 4],
    [4, 2, 1, 3, 9, 8, 6, 7, 5],
    [3, 6, 5, 4, 2, 7, 8, 9, 1],
    [1, 9, 8, 5, 7, 3, 4, 2, 6],
    [5, 4, 2, 9, 1, 6, 3, 8, 7],
    [7, 3, 6, 2, 8, 4, 5, 1, 9]
])

# 要将其变成 3x3x3x3 的四维数组
# 但不能直接 reshape,因为这样会把一行变成一个九宫格
shape = (3, 3, 3, 3)

# 大行之间隔 27 个元素,大列之间隔 3 个元素
# 小行之间隔 9 个元素,小列之间隔 1 个元素
strides = sudoku.itemsize * np.array([27, 3, 9, 1])

squares = np.lib.stride_tricks.as_strided(sudoku, shape=shape, strides=strides) 
print(squares)

'''
[[[[2 8 7]    [9 5 4]    [6 1 3]]
  [[1 6 5]    [7 3 2]    [8 4 9]]
  [[9 4 3]    [1 6 8]    [7 5 2]]]

 [[[8 7 9]    [4 2 1]    [3 6 5]]
  [[6 5 1]    [3 9 8]    [4 2 7]]
  [[2 3 4]    [6 7 5]    [8 9 1]]]

 [[[1 9 8]    [5 4 2]    [7 3 6]]
  [[5 7 3]    [9 1 6]    [2 8 4]]
  [[4 2 6]    [3 8 7]    [5 1 9]]]]
'''

数组广播

# 来源:NumPy Cookbook 2e Ch2.10

import scipy.io.wavfile 
import matplotlib.pyplot as plt 
import urllib2 
import numpy as np

# 下载音频文件
response = urllib2.urlopen('http://www.thesoundarchive.com/austinpowers/smashingbaby.wav') 
print(response.info())

# 将文件写到磁盘
WAV_FILE = 'smashingbaby.wav' 
filehandle = open(WAV_FILE, 'w') 
filehandle.write(response.read()) 
filehandle.close() 

# 使用 SciPy 读取音频文件
sample_rate, data = scipy.io.wavfile.read(WAV_FILE)
print("Data type", data.dtype, "Shape", data.shape)
# ('Data type', dtype('uint8'), 'Shape', (43584L,))

# 绘制原始音频文件(上方)
# y 值是数据,x 值是数据的下标
plt.subplot(2, 1, 1) 
plt.title("Original") 
plt.plot(data)

# 使音频更安静
# 数组广播的意思是,两个数组进行运算时
# 较小尺寸的数组会扩展自身,与较大数组对齐
# 如果数组与标量运算,那么将标量与数组的每个元素运算
# 所以这里数组的每个元素都 x 0.2
# 具体规则请见官方文档
newdata = data * 0.2 
newdata = newdata.astype(np.uint8) 
print("Data type", newdata.dtype, "Shape", newdata.shape)
# ('Data type', dtype('uint8'), 'Shape', (43584L,))

# 保存更安静的音频
scipy.io.wavfile.write("quiet.wav", sample_rate, newdata)
    
# 绘制更安静的音频文件(下方)
plt.subplot(2, 1, 2) 
plt.title("Quiet") 
plt.plot(newdata)
plt.show()
上一篇下一篇

猜你喜欢

热点阅读