用opencv实现手写数字识别（SVM，HOG）

2020-02-12 本文已影响0人 mooin

首先感谢这两篇博客，代码写的很详细：基于opencv的手写数字识别（MFC,HOG,SVM） - 小菜鸟_yang - 博客园和OpenCV Hog+SVM 学习_秋风细雨的专栏-CSDN博客。数据集在第二个博客中，但是是外网，不方便的话也可以在最后的百度网盘中下载。但是这两篇用的opencv的版本太老旧了，所以自己重新写了一个opencv4.1的，供大家参考。有关HOG的理论参考这篇博客：https://www.learnopencv.com/histogram-of-oriented-gradients/，这个网站是个私人博客网站，个人感觉非常好，内容很多。

首先说一下数据集怎么读入：因为我是在ubuntu上运行opencv，所以没有用批处理，用python将所有图片的路径和标签写入一个txt中。

import os
filter=[".bmp"]
f = open('/Users/shikunming/Desktop/SVM/result.txt', 'a')
res = os.walk("/Users/shikunming/Desktop/SVM/image")
#result = []
for maindir, subdir, file_name_list in res:
    for filename in file_name_list:
        num = filename.split('_',1)
        apath = os.path.join(maindir, filename)  # 合并成一个完整路径
        ext = os.path.splitext(apath)[1]  # 获取文件后缀 [0]获取的是除了文件名以外的内容

        if ext in filter:
            f.write(apath+'\n')
            f.write(num[0]+'\n')

因为图片的标签就包含在图片名中，所以图片的标签就直接用split()分割出来了。
接下来的代码是图片的读取、hog特征计算、svm的训练。

#include <iostream>
#include <opencv2/opencv.hpp>
#include <fstream>
#include <opencv2/ml.hpp>
using namespace std;
using namespace cv;
using namespace cv::ml;
int main(){
vector<string> img_path;//输入文件名变量
    vector<int> img_catg;
    int nLine = 0;
    string buf;
    ifstream svm_data( "/root/桌面/SVM/result.txt" );//训练样本图片的路径都写在这个txt文件中，使用bat批处理文件可以得到这个txt文件
    unsigned long n;
    while( svm_data )  //将训练样本文件依次读取进来
    {
        if( getline( svm_data, buf ) )
        {
            nLine ++;
            if( nLine % 2 == 0 )//注：奇数行是图片全路径，偶数行是标签 这个if就是把string类型的标签转为整型
            {
                img_catg.push_back( atoi( buf.c_str() ) );//atoi将字符串转换成整型，标志(0,1，2，...，9)，注意这里至少要有两个类别，否则会出错
            }
            else
            {
                img_path.push_back( buf );//图像路径
                cout<<buf<<endl;
            }
        }
    }
    svm_data.close();//关闭文件
    vector<Mat> data_mat, res_mat;
    for( string::size_type i = 0; i != img_path.size(); i++ )
    {
        Mat img = imread(img_path[i].c_str());
        cout<<"laoding with\t"<<img_path[i]<<endl;
        cout<<"...[load done]"<<endl;
        if(img.empty())
            cout<<"error!!!"<<endl;
        HOGDescriptor hog;
        hog.winSize = Size(28,28);
        hog.blockSize = Size(14,14);
        hog.blockStride = Size(7,7);
        hog.cellSize = Size(7,7);
        hog.nbins = 9;
        vector<float> descriptor;
        hog.compute(img,descriptor,Size(8,8),Size(0,0));
        data_mat.push_back(Mat(descriptor).clone());
        cout<<"hog descriptor of this image has done!"<<endl;
    }
    size_t sample_count = data_mat.size();
    cout<<"...[done](sample count:"<<sample_count<<")"<<endl;
    Mat trainData;
    //convert data_mat to train_data, which the function SVM::train can read.
    const int rows = (int)data_mat.size();
    const int cols = (int)std::max( data_mat[0].cols, data_mat[0].rows );
    Mat tmp( 1, cols, CV_32FC1 ); //< used for transposition if needed
    trainData = Mat( rows, cols, CV_32FC1 );
    for( size_t i = 0 ; i < data_mat.size(); ++i )
    {
        CV_Assert( data_mat[i].cols == 1 || data_mat[i].rows == 1 );//检查运行情况 若表达式为false 则返回一个错误信息
        if( data_mat[i].cols == 1 )
        {
            transpose( data_mat[i], tmp );
            tmp.copyTo( trainData.row( (int)i ) );
        }
        else if( data_mat[i].rows == 1 )
        {
            data_mat[i].copyTo( trainData.row( (int)i ) );
        }
    }
    cout<<"training..."<<endl;
    Ptr <SVM> svm = SVM::create();//新建一个SVM
    svm->setType(SVM::C_SVC);
    svm->setKernel(SVM::RBF);
    svm->setDegree(10);
    svm->setTermCriteria(TermCriteria(TermCriteria::MAX_ITER+TermCriteria::EPS,1000,FLT_EPSILON));
    svm->train( trainData, ROW_SAMPLE,img_catg );//训练数据
    //保存训练好的分类器
    svm->save( "/root/桌面/SVM/HOG_SVM_DATA.xml" );
    cout<<"HOG_SVM_DATA.xml is saved !!! \n exit program"<<endl;
    return 0;
}

至此svm已经训练完成，参数已经保存。我在训练时并没有将所有的图片都参与训练，保留的一部分作为测试数据。我的测试代码如下：

#include <iostream>
#include <opencv2/opencv.hpp>
#include <fstream>
#include <opencv2/ml.hpp>
using namespace std;
using namespace cv;
using namespace cv::ml;
int main(){
 Ptr<SVM> classifier = SVM::load("/root/桌面/SVM/HOG_SVM_DATA.xml");
    HOGDescriptor *hog = new HOGDescriptor(Size(28,28),Size(14,14),Size(7,7),Size(7,7),9);
    Mat test_img = imread("/root/桌面/IMG_3329.jpg");
    resize(test_img,test_img,Size(28,28),0,0,INTER_CUBIC);
    cvtColor(test_img,test_img,COLOR_BGR2GRAY);
    threshold(test_img,test_img,100,255,THRESH_BINARY_INV);
    //上面是对待测试数据进行处理
    //测试用的图片要与训练用的图片像素个数相同，在这里都是28*28
    //imshow("img",test_img);
    //waitKey(0);
    vector<float> descriptors;
    hog->compute(test_img,descriptors,Size(1,1),Size(0,0));
    cv::Mat SVMtrainMat = cv::Mat(1, descriptors.size(), CV_32FC1);
    int n = 0;
    for (vector<float>::iterator iter = descriptors.begin(); iter != descriptors.end(); iter++) {
        SVMtrainMat.at<float>(0, n) = *iter;
        n++;
    }
    SVMtrainMat.convertTo(SVMtrainMat, CV_32FC1);
    int a = (int)classifier->predict(SVMtrainMat);
    cout<<a<<endl;
}

网盘链接:https://pan.baidu.com/s/1eTrC9UybVdvRJYWHlMpmLA 密码:6z48
欢迎留言交流！！

用opencv实现手写数字识别（SVM，HOG）

猜你喜欢

热点阅读