OpenCV+Python 频域分析

2018-07-08 本文已影响149人音符纸飞机

参考：

opencv-python官方文档
《刚萨雷斯数字图像处理（MATLAB版）》

图像处理中的傅里叶变换

二维离散傅里叶变换化公式：

$F(u,v)=\sum_{x=0}^{M-1}\sum_{y=0}^{N-1}f(x,y)e^{-j2\pi(\frac{ux}{M}+\frac{vy}{N})}$

离散傅里叶逆变换公式：

$f(x,y)=\frac{1}{MN}\sum_{u=0}^{M-1}\sum_{v=0}^{N-1}F(u,v)e^{j2\pi(\frac{ux}{M}+\frac{vy}{N})}$

公式告诉我们，频域中的点和时域中的点不是一一对应关系。指数项可以扩展成正弦项和余弦项的形式。时域的坐标是x,y，频域中的坐标是u,v，是正弦和余弦的频率。
$F(0,0)$ 称为傅里叶变换的直流分量，根据公式它的值等于 $f(x,y)$ 所有值得总和，或者是 $f(x,y)$ 平均值的MN倍。
$F(u,v)$ 是复数矩阵，所以在直观分析的时候，通常显示 $F(u,v)$ 的幅度。（频谱图）
$\left | F(u,v) \right |=[R^{2}(u,v)+I^{2}(u,v)]^{1/2}$
知识点：
1. 傅里叶频谱关于原点对称：
  $\left | F(u,v)\right|=\left|F(-u,-v)\right|$
2. 傅里叶频谱具有周期性：
  $F(u,v)=F(u+M,v)=F(u,v+N)=F(u+M,v+N)$
3. 傅里叶逆变换也具有周期性：（即傅里叶逆变换得到的图像也是周期无穷的）
  $f(x,y)=f(x+M,y)=f(x,y+N)=f(x+M,y+N)$
4. Numpy和OpenCV中实现的DFT只计算一个周期。
5. $F(0,0)$ 位置在图像的左上角，表示的是图像灰度的均值。如果想让直流分量在输出图像的重心,那么需要将结果沿着两个方向平移分别平移N/2和M/2。平移后的频谱，越靠近中心，所对应的频率越低。

频域亮点与时域的关系直观表现

numpy中的傅里叶变换

import cv2
import numpy as np
from matplotlib import pyplot as plt

# shape: 360*360
img = cv2.imread("laugh.jpg", cv2.IMREAD_GRAYSCALE)
# 返回的是复数 dtype.complex128
fft = np.fft.fft2(img)
# 平移
fftshift = np.fft.fftshift(fft)
# 频谱 dtype.float64 magnitude_spectrum[180,180] = 329.2611
magnitude_spectrum = 20 * np.log(np.abs(fftshift))
# 如果想用cv2.imshow()显示
# magnitude_spectrum_uint8 = np.uint8(255 * (magnitude_spectrum / np.max(magnitude_spectrum)))
# cv2.imshow("magnitude_spectrum_uint8", magnitude_spectrum_uint8)
rows, cols = img.shape
crow, ccol = rows / 2, cols / 2
# 频谱中心区域添加60×60的蒙板，相当于过滤了低频部分
fftshift[int(crow - 30):int(crow + 30), int(ccol - 30):int(ccol + 30)] = 0
magnitude_spectrum_filter = 20 * np.log(np.abs(fftshift))
# 中心平移回到左上角
f_ishift = np.fft.ifftshift(fftshift)
# 使用FFT逆变换，结果是复数
img_back = np.fft.ifft2(f_ishift)
img_back = np.abs(img_back)
# img_back_uint8 = np.uint8(255 * (img_back / np.max(img_back)))
# cv2.imshow("img_back_uint8", img_back_uint8)
plt.subplot(221)
plt.imshow(img, cmap='gray')
plt.title('laugh.jpg')
# 省略x,y坐标
plt.xticks([]), plt.yticks([])
plt.subplot(222), plt.imshow(magnitude_spectrum, cmap='gray')
plt.title('magnitude_spectrum'), plt.xticks([]), plt.yticks([])
plt.subplot(223), plt.imshow(magnitude_spectrum_filter, cmap='gray')
plt.title('High Pass Filter'), plt.xticks([]), plt.yticks([])
plt.subplot(224), plt.imshow(img_back, cmap='gray')
plt.title('High Pass Result'), plt.xticks([]), plt.yticks([])
plt.show()

效果图

注：频谱做了对数操作，所以高通滤波器的中央区域变成了白色

OpenCV中的傅里叶变换

img = cv2.imread('laugh.jpg', cv2.IMREAD_GRAYSCALE)
dft = cv2.dft(np.float32(img), flags=cv2.DFT_COMPLEX_OUTPUT)
# 平移还是要靠numpy
dft_shift = np.fft.fftshift(dft)
magnitude_spectrum = 20 * np.log(cv2.magnitude(dft_shift[:, :, 0], dft_shift[:, :, 1]))
# float32
print(dft.dtype)

rows, cols = img.shape
crow, ccol = int(rows / 2), int(cols / 2)

# 创建蒙板
mask = np.ones((rows, cols, 2), np.uint8)
mask[crow - 30:crow + 30, ccol - 30:ccol + 30] = 0

fshift = dft_shift * mask
f_ishift = np.fft.ifftshift(fshift)
# 此时img_bak为复数
img_back = cv2.idft(f_ishift)
img_back = cv2.magnitude(img_back[:, :, 0], img_back[:, :, 1])

效果与numpy中的傅里叶变换相同

OpenCV傅里叶变换的性能优化

数组的size（img.size）是2的指数时，性能最佳。是2,3,5的倍数时，性能也不错。OpenCV中提供了一个方法来获得性能最佳的行列式，多出的部分补0

img = cv2.imread('laugh.jpg', cv2.IMREAD_GRAYSCALE)
rows, cols = img.shape
nrows = cv2.getOptimalDFTSize(rows)
ncols = cv2.getOptimalDFTSize(cols)
nimg = np.zeros((nrows, ncols))
nimg[:rows, :cols] = img

时域的卷积等于频域相乘，提高计算速度

但是对图像的像素有要求，必须是2的幂，才有加速效果

OpenCV+Python 频域分析

参考：

图像处理中的傅里叶变换

numpy中的傅里叶变换

OpenCV中的傅里叶变换

OpenCV傅里叶变换的性能优化

猜你喜欢

热点阅读