09 Hog_SVM小狮子识别(监督学习)
2020-03-31 本文已影响0人
犬夜叉写作业
1、准备训练的样本(正负样本,负样本一定不能出现正样本,反之亦然)
2、对样本进行hog+svm的训练
3、使用一张图片进行测试 test
样本特点 :
pos 正样本,包含所检测的目标 (图片大小64 * 128)
neg 负样本,不包含所检测的目标 (图片大小64 * 128)
样本的获取:(一个好的样本要远胜过一个好的神经网络,样本容量很大,达到百万或千万张)
一、网络: 1、公司(1张图1元) 2、爬虫自己爬取
二、公司内部:1、多年积累 2、红外图像,自己积累
三、自己收集: 达到万类很能自己收集,做demo的时候,可通过视频截取简化过程(比如录制100s 的视频,假设每秒30帧,则100 * 30 = 3000张样本)
正样本的特点: 尽可能多样 (环境多样,干扰多样)
视频分解为图片
图片等比缩放
图片裁剪到一样大小
样本准备: pos 820 neg 1931 (一般正负样本的比例在1:2 与1:3之间)
名字要按照一定规律命名,方便遍历提取
步骤:
1、设置参数-----包括:winSize(窗体大小),blockSize(block大小),blockStride(block的步长),cellSize(cell大小),nBin(bin的个数)
2、创建一个hog
3、创建svm,设置各种参数
4、计算一下hog(computer hog)
5、给计算的hog一个label标签
6、开始训练
7、开始预测,绘图显示
# 训练
# 1 参数 2hog 3 svm 4 computer hog 5 label 6 train 7 pred 8 draw
import cv2
import numpy as np
import matplotlib.pyplot as plt
# 1 par
PosNum = 820 #正样本个数
NegNum = 1931 #负样本个数
winSize = (64,128) #窗体大小
blockSize = (16,16)# 105 个 block (设置block大小)
blockStride = (8,8)#4 cell (设置block的步长为8*8)
cellSize = (8,8) #cell的大小
nBin = 9#9 bin 3780 #bin的个数设置为9
# 2 hog create hog 1 win 2 block 3 blockStride 4 cell 5 bin
#创建block
hog = cv2.HOGDescriptor(winSize,blockSize,blockStride,cellSize,nBin)
# 3 svm分类器的创建
svm = cv2.ml.SVM_create()
# 4 computer hog
featureNum = int(((128-16)/8+1)*((64-16)/8+1)*4*9) #3780,定义特征维度,当前block个数(128-16)/8+1),窗体大小(64-16)/8+1)
featureArray = np.zeros(((PosNum+NegNum),featureNum),np.float32) #定义数组存储特征,行为正负样本个数,列为特征个数
labelArray = np.zeros(((PosNum+NegNum),1),np.int32)
# svm 监督学习 样本 标签 svm -》image hog
for i in range(0,PosNum): #遍历图片
fileName = 'pos\\'+str(i+1)+'.jpg' #在mac系统下要将\\改为/
img = cv2.imread(fileName) #加载进彩色图片
hist = hog.compute(img,(8,8))# 3780 #计算hog特征
for j in range(0,featureNum): #装载到二维数组中
featureArray[i,j] = hist[j]
# featureArray hog [1,:] hog1 [2,:]hog2
labelArray[i,0] = 1 #正样本标签设置为1
# 正样本 label 1
for i in range(0,NegNum): #处理负样本
fileName = 'neg\\'+str(i+1)+'.jpg'
img = cv2.imread(fileName)
hist = hog.compute(img,(8,8))# 3780
for j in range(0,featureNum):
featureArray[i+PosNum,j] = hist[j]
labelArray[i+PosNum,0] = -1
# 负样本 label -1
#设置svm的属性
svm.setType(cv2.ml.SVM_C_SVC) #ml表示machine learning,添加类型
svm.setKernel(cv2.ml.SVM_LINEAR) #设线性置内核
svm.setC(0.01)
# 6 train
ret = svm.train(featureArray,cv2.ml.ROW_SAMPLE,labelArray)
# 7 myHog :《-myDetect
# myDetect-《resultArray rho
# myHog-》detectMultiScale
#首先要创建一个myHog对象,则要创建myDetect
#myDetect为数组,数据来源于resultArray(通过公式计算) 和rho(通过svm训练得到的)
#通过myHog直接调用detectMultiScale方法来完成预测
# 7 检测 核心:create Hog -> myDetect—> array->
# resultArray-> resultArray = -1*alphaArray*supportVArray
# rho-> svm-〉svm.train
alpha = np.zeros((1),np.float32)
rho = svm.getDecisionFunction(0,alpha)
print(rho)
print(alpha)
alphaArray = np.zeros((1,1),np.float32)
supportVArray = np.zeros((1,featureNum),np.float32) #如果来自己重新训练样本,只要把这部分重新计算一下
resultArray = np.zeros((1,featureNum),np.float32)
alphaArray[0,0] = alpha #因为是1行1列,所以采用[0,0]来访问
resultArray = -1*alphaArray*supportVArray
# detect,核心是创建myHog,以下为创建过程
myDetect = np.zeros((3781),np.float32)
for i in range(0,3780):
myDetect[i] = resultArray[0,i] #resultArray是3780维的
myDetect[3780] = rho[0] # rho svm (判决) 1行1列,1维的
#myDetect是数组,3781维,其中3780来自resultArra,最后一维来自rho
myHog = cv2.HOGDescriptor() #构建hog
myHog.setSVMDetector(myDetect) #设置属性
# load
imageSrc = cv2.imread('Test2.jpg',1) #读取待检测的图片,读取为彩色图
# (8,8) win
objs = myHog.detectMultiScale(imageSrc,0,(8,8),(32,32),1.05,2) #开始检测,(32,32)窗体大小,1.05表示缩放
# xy wh ,objs是三维的, 以下参数放在这个三维参数的最后一维
x = int(objs[0][0][0])
y = int(objs[0][0][1])
w = int(objs[0][0][2]) #宽
h = int(objs[0][0][3]) #高
# 绘制展示
cv2.rectangle(imageSrc,(x,y),(x+w,y+h),(255,0,0),2) #线条宽度2
cv2.imshow('dst',imageSrc)
cv2.waitKey(0)