【火炉炼AI】机器学习016-如何知道SVM模型输出类别的置信度

2018-08-20 本文已影响0人科技老丁哥

【火炉炼AI】机器学习016-如何知道SVM模型输出类别的置信度

(本文所使用的Python库和版本号: Python 3.5, Numpy 1.14, scikit-learn 0.19, matplotlib 2.2 )

一般的，对于未知样本，我们通过模型预测出来属于某种类别，往往会给出是这种类别的概率。

比如通过AI模型识别某一种图片是“狗”的概率是95.8%，是”猫“的概率是4.2%，那用SVM能不能得到类似的属于某种类别的概率值了？

1. 准备数据集

本部分代码和上一篇文章（【火炉炼AI】机器学习014-用SVM构建非线性分类模型）几乎一样，故此不再赘述。

2. 计算新样本的置信度

此处，我们自己构建了非线性SVM分类模型，并使用该模型对新样本数据进行类别的分类。如下代码

# 计算某个新样本的置信度
new_samples=np.array([[2,1.5],
                      [8,9],
                      [4.8,5.2],
                      [4,4],
                      [2.5,7],
                      [7.6,2],
                      [5.4,5.9]])
classifier3=SVC(kernel='rbf',probability=True) # 比上面的分类器增加了 probability=True参数
classifier3.fit(train_X,train_y)

# 使用训练好的SVM分类器classifier3对新样本进行预测，并给出置信度
for sample in new_samples:
    print('sample: {}, probs: {}'.format(sample,classifier3.predict_proba([sample])[0]))

-------------------------------------输---------出--------------------------------

sample: [2. 1.5], probs: [0.08066588 0.91933412]
sample: [8. 9.], probs: [0.08311977 0.91688023]
sample: [4.8 5.2], probs: [0.14367183 0.85632817]
sample: [4. 4.], probs: [0.06178594 0.93821406]
sample: [2.5 7. ], probs: [0.21050117 0.78949883]
sample: [7.6 2. ], probs: [0.07548128 0.92451872]
sample: [5.4 5.9], probs: [0.45817727 0.54182273]

--------------------------------------------完-------------------------------------

将该新样本数据点绘制到2D分布图中，可以得到如下结果。

使用rbf类型的SVM分类器得到的分类效果

########################小**********结###############################

1. 从中可以看出，如果要输出每一个类别的不同概率，需要设置参数probability=True，同时，需要用classifier.predict_proba()函数来获取类别概率值。

2. 模型输出的样本类别的概率，就是该样本属于这个类别的置信度。

#################################################################

注：本部分代码已经全部上传到（我的github）上，欢迎下载。

参考资料:

1, Python机器学习经典实例，Prateek Joshi著，陶俊杰，陈小莉译

【火炉炼AI】机器学习016-如何知道SVM模型输出类别的置信度