09 Hog_SVM小狮子识别（监督学习）

2020-03-31 本文已影响0人犬夜叉写作业

1、准备训练的样本（正负样本，负样本一定不能出现正样本，反之亦然）
2、对样本进行hog+svm的训练
3、使用一张图片进行测试 test

样本特点：

pos 正样本，包含所检测的目标（图片大小64 * 128）
neg 负样本，不包含所检测的目标（图片大小64 * 128）

样本的获取：（一个好的样本要远胜过一个好的神经网络，样本容量很大，达到百万或千万张）

一、网络： 1、公司（1张图1元） 2、爬虫自己爬取
二、公司内部：1、多年积累 2、红外图像，自己积累
三、自己收集：达到万类很能自己收集，做demo的时候，可通过视频截取简化过程（比如录制100s 的视频，假设每秒30帧，则100 * 30 = 3000张样本）

正样本的特点：尽可能多样（环境多样，干扰多样）

视频分解为图片
图片等比缩放
图片裁剪到一样大小

样本准备： pos 820 neg 1931 （一般正负样本的比例在1:2 与1:3之间）

名字要按照一定规律命名，方便遍历提取

步骤：
1、设置参数-----包括：winSize（窗体大小），blockSize（block大小），blockStride（block的步长），cellSize（cell大小），nBin（bin的个数）
2、创建一个hog
3、创建svm，设置各种参数
4、计算一下hog（computer hog）
5、给计算的hog一个label标签
6、开始训练
7、开始预测，绘图显示

# 训练
# 1 参数 2hog 3 svm 4 computer hog 5 label 6 train 7 pred 8 draw
import cv2
import numpy as np
import matplotlib.pyplot as plt
# 1 par
PosNum = 820    #正样本个数
NegNum = 1931   #负样本个数
winSize = (64,128)      #窗体大小
blockSize = (16,16)# 105 个 block  （设置block大小）
blockStride = (8,8)#4 cell  （设置block的步长为8*8）
cellSize = (8,8)       #cell的大小
nBin = 9#9 bin 3780     #bin的个数设置为9

# 2 hog create hog 1 win 2 block 3 blockStride 4 cell 5 bin
#创建block
hog = cv2.HOGDescriptor(winSize,blockSize,blockStride,cellSize,nBin)
# 3 svm分类器的创建
svm = cv2.ml.SVM_create()
# 4 computer hog
featureNum = int(((128-16)/8+1)*((64-16)/8+1)*4*9) #3780，定义特征维度，当前block个数(128-16)/8+1)，窗体大小(64-16)/8+1)
featureArray = np.zeros(((PosNum+NegNum),featureNum),np.float32) #定义数组存储特征，行为正负样本个数，列为特征个数
labelArray = np.zeros(((PosNum+NegNum),1),np.int32)
# svm 监督学习 样本 标签 svm -》image hog  
for i in range(0,PosNum):    #遍历图片
    fileName = 'pos\\'+str(i+1)+'.jpg'  #在mac系统下要将\\改为/
    img = cv2.imread(fileName)     #加载进彩色图片
    hist = hog.compute(img,(8,8))# 3780   #计算hog特征
    for j in range(0,featureNum):       #装载到二维数组中
        featureArray[i,j] = hist[j]
    # featureArray hog [1,:] hog1 [2,:]hog2 
    labelArray[i,0] = 1    #正样本标签设置为1
    # 正样本 label 1
    
for i in range(0,NegNum):   #处理负样本
    fileName = 'neg\\'+str(i+1)+'.jpg'
    img = cv2.imread(fileName)
    hist = hog.compute(img,(8,8))# 3780
    for j in range(0,featureNum):
        featureArray[i+PosNum,j] = hist[j]
    labelArray[i+PosNum,0] = -1
# 负样本 label -1

#设置svm的属性
svm.setType(cv2.ml.SVM_C_SVC)   #ml表示machine learning，添加类型
svm.setKernel(cv2.ml.SVM_LINEAR)    #设线性置内核
svm.setC(0.01)

# 6 train 
ret = svm.train(featureArray,cv2.ml.ROW_SAMPLE,labelArray)
# 7 myHog ：《-myDetect
# myDetect-《resultArray  rho
# myHog-》detectMultiScale

#首先要创建一个myHog对象，则要创建myDetect
#myDetect为数组，数据来源于resultArray（通过公式计算） 和rho（通过svm训练得到的）
#通过myHog直接调用detectMultiScale方法来完成预测

# 7 检测  核心：create Hog -> myDetect—> array-> 
# resultArray-> resultArray = -1*alphaArray*supportVArray
# rho-> svm-〉svm.train

alpha = np.zeros((1),np.float32)
rho = svm.getDecisionFunction(0,alpha)
print(rho)
print(alpha)
alphaArray = np.zeros((1,1),np.float32)
supportVArray = np.zeros((1,featureNum),np.float32)   #如果来自己重新训练样本，只要把这部分重新计算一下
resultArray = np.zeros((1,featureNum),np.float32)
alphaArray[0,0] = alpha  #因为是1行1列，所以采用[0,0]来访问
resultArray = -1*alphaArray*supportVArray

# detect，核心是创建myHog，以下为创建过程
myDetect = np.zeros((3781),np.float32)
for i in range(0,3780):
    myDetect[i] = resultArray[0,i]  #resultArray是3780维的 
myDetect[3780] = rho[0] # rho svm （判决） 1行1列，1维的  
#myDetect是数组，3781维，其中3780来自resultArra，最后一维来自rho

myHog = cv2.HOGDescriptor()    #构建hog
myHog.setSVMDetector(myDetect)   #设置属性

# load 
imageSrc = cv2.imread('Test2.jpg',1)   #读取待检测的图片，读取为彩色图
# (8,8) win 
objs = myHog.detectMultiScale(imageSrc,0,(8,8),(32,32),1.05,2)  #开始检测，（32,32）窗体大小，1.05表示缩放
# xy wh ，objs是三维的， 以下参数放在这个三维参数的最后一维
x = int(objs[0][0][0])
y = int(objs[0][0][1])
w = int(objs[0][0][2])  #宽
h = int(objs[0][0][3])  #高
# 绘制展示
cv2.rectangle(imageSrc,(x,y),(x+w,y+h),(255,0,0),2)  #线条宽度2
cv2.imshow('dst',imageSrc)
cv2.waitKey(0)

09 Hog_SVM小狮子识别（监督学习）

猜你喜欢

热点阅读