09 Hog_SVM小狮子识别(监督学习)

2020-03-31  本文已影响0人  犬夜叉写作业

1、准备训练的样本(正负样本,负样本一定不能出现正样本,反之亦然)
2、对样本进行hog+svm的训练
3、使用一张图片进行测试 test

样本特点 :

pos 正样本,包含所检测的目标 (图片大小64 * 128)
neg 负样本,不包含所检测的目标 (图片大小64 * 128)

样本的获取:(一个好的样本要远胜过一个好的神经网络,样本容量很大,达到百万或千万张)

一、网络: 1、公司(1张图1元) 2、爬虫自己爬取
二、公司内部:1、多年积累 2、红外图像,自己积累
三、自己收集: 达到万类很能自己收集,做demo的时候,可通过视频截取简化过程(比如录制100s 的视频,假设每秒30帧,则100 * 30 = 3000张样本)

正样本的特点: 尽可能多样 (环境多样,干扰多样)

视频分解为图片
图片等比缩放
图片裁剪到一样大小

样本准备: pos 820 neg 1931 (一般正负样本的比例在1:2 与1:3之间)

名字要按照一定规律命名,方便遍历提取

步骤:
1、设置参数-----包括:winSize(窗体大小),blockSize(block大小),blockStride(block的步长),cellSize(cell大小),nBin(bin的个数)
2、创建一个hog
3、创建svm,设置各种参数
4、计算一下hog(computer hog)
5、给计算的hog一个label标签
6、开始训练
7、开始预测,绘图显示

# 训练
# 1 参数 2hog 3 svm 4 computer hog 5 label 6 train 7 pred 8 draw
import cv2
import numpy as np
import matplotlib.pyplot as plt
# 1 par
PosNum = 820    #正样本个数
NegNum = 1931   #负样本个数
winSize = (64,128)      #窗体大小
blockSize = (16,16)# 105 个 block  (设置block大小)
blockStride = (8,8)#4 cell  (设置block的步长为8*8)
cellSize = (8,8)       #cell的大小
nBin = 9#9 bin 3780     #bin的个数设置为9

# 2 hog create hog 1 win 2 block 3 blockStride 4 cell 5 bin
#创建block
hog = cv2.HOGDescriptor(winSize,blockSize,blockStride,cellSize,nBin)
# 3 svm分类器的创建
svm = cv2.ml.SVM_create()
# 4 computer hog
featureNum = int(((128-16)/8+1)*((64-16)/8+1)*4*9) #3780,定义特征维度,当前block个数(128-16)/8+1),窗体大小(64-16)/8+1)
featureArray = np.zeros(((PosNum+NegNum),featureNum),np.float32) #定义数组存储特征,行为正负样本个数,列为特征个数
labelArray = np.zeros(((PosNum+NegNum),1),np.int32)
# svm 监督学习 样本 标签 svm -》image hog  
for i in range(0,PosNum):    #遍历图片
    fileName = 'pos\\'+str(i+1)+'.jpg'  #在mac系统下要将\\改为/
    img = cv2.imread(fileName)     #加载进彩色图片
    hist = hog.compute(img,(8,8))# 3780   #计算hog特征
    for j in range(0,featureNum):       #装载到二维数组中
        featureArray[i,j] = hist[j]
    # featureArray hog [1,:] hog1 [2,:]hog2 
    labelArray[i,0] = 1    #正样本标签设置为1
    # 正样本 label 1
    
for i in range(0,NegNum):   #处理负样本
    fileName = 'neg\\'+str(i+1)+'.jpg'
    img = cv2.imread(fileName)
    hist = hog.compute(img,(8,8))# 3780
    for j in range(0,featureNum):
        featureArray[i+PosNum,j] = hist[j]
    labelArray[i+PosNum,0] = -1
# 负样本 label -1

#设置svm的属性
svm.setType(cv2.ml.SVM_C_SVC)   #ml表示machine learning,添加类型
svm.setKernel(cv2.ml.SVM_LINEAR)    #设线性置内核
svm.setC(0.01)

# 6 train 
ret = svm.train(featureArray,cv2.ml.ROW_SAMPLE,labelArray)
# 7 myHog :《-myDetect
# myDetect-《resultArray  rho
# myHog-》detectMultiScale

#首先要创建一个myHog对象,则要创建myDetect
#myDetect为数组,数据来源于resultArray(通过公式计算) 和rho(通过svm训练得到的)
#通过myHog直接调用detectMultiScale方法来完成预测

# 7 检测  核心:create Hog -> myDetect—> array-> 
# resultArray-> resultArray = -1*alphaArray*supportVArray
# rho-> svm-〉svm.train

alpha = np.zeros((1),np.float32)
rho = svm.getDecisionFunction(0,alpha)
print(rho)
print(alpha)
alphaArray = np.zeros((1,1),np.float32)
supportVArray = np.zeros((1,featureNum),np.float32)   #如果来自己重新训练样本,只要把这部分重新计算一下
resultArray = np.zeros((1,featureNum),np.float32)
alphaArray[0,0] = alpha  #因为是1行1列,所以采用[0,0]来访问
resultArray = -1*alphaArray*supportVArray

# detect,核心是创建myHog,以下为创建过程
myDetect = np.zeros((3781),np.float32)
for i in range(0,3780):
    myDetect[i] = resultArray[0,i]  #resultArray是3780维的 
myDetect[3780] = rho[0] # rho svm (判决) 1行1列,1维的  
#myDetect是数组,3781维,其中3780来自resultArra,最后一维来自rho

myHog = cv2.HOGDescriptor()    #构建hog
myHog.setSVMDetector(myDetect)   #设置属性

# load 
imageSrc = cv2.imread('Test2.jpg',1)   #读取待检测的图片,读取为彩色图
# (8,8) win 
objs = myHog.detectMultiScale(imageSrc,0,(8,8),(32,32),1.05,2)  #开始检测,(32,32)窗体大小,1.05表示缩放
# xy wh ,objs是三维的, 以下参数放在这个三维参数的最后一维
x = int(objs[0][0][0])
y = int(objs[0][0][1])
w = int(objs[0][0][2])  #宽
h = int(objs[0][0][3])  #高
# 绘制展示
cv2.rectangle(imageSrc,(x,y),(x+w,y+h),(255,0,0),2)  #线条宽度2
cv2.imshow('dst',imageSrc)
cv2.waitKey(0)


上一篇下一篇

猜你喜欢

热点阅读