机器学习红红火火恍恍惚惚

2 SVM(支持向量机法)vs 线性回归+ROC曲线

2019-04-05  本文已影响296人  陈宇乔

step1 线性回归ROC与AUC的实现

rm(list = ls())
# BiocManager::install('ROCR')
library(ROCR)
# 载入AER包,使用包中的Affairs数据集
# BiocManager::install('AER')
library(AER)
data(Affairs,package="AER")
# 将'affaris'特征进行因子化处理,作为新增加的一列'ynaffairs'
Affairs$ynaffair[Affairs$affairs > 0] <- 1
Affairs$ynaffair[Affairs$affairs== 0] <- 0
Affairs$ynaffair <-factor(Affairs$ynaffair,levels=c(0,1),labels=c("No","Yes"))
# 构建Logistics模型
myfit <- glm(ynaffair ~ gender + age + yearsmarried + children + religiousness + education + occupation + rating, data=Affairs,family=binomial())
pre <- predict(myfit,type='response')
pred <- prediction(pre,Affairs$ynaffair)
# 计算AUC值
performance(pred,'auc')@y.values
perf <- performance(pred,'tpr','fpr')
plot(perf)

这是计算affair的一个数据集


结果
summary(myfit) ### 得到拟合公式
拟合公式

step2 绘图强大的一个包——pROC

虽然ROCR包可以满足我们的需要,但在功能上还是有些单一,绘制的图也比较粗糙。因此接下来我们学习R中更为强大的一个包——pROC,该包不仅作图美观,还可以在同一幅图上绘制多条ROC曲线,方便我们比较两个分类器的性能优劣。

# BiocManager::install('pROC')
library(pROC)

# 同样使用上一节中的myfit模型
pre <- predict(myfit,type='response')
modelroc <- roc(Affairs$ynaffair,pre)
modelroc

# 可视化展示,同时给出AUC的面积与最优的临界点
plot(modelroc, print.auc=TRUE, auc.polygon=TRUE, grid=c(0.1, 0.2), grid.col=c("green", "red"), max.auc.polygon=TRUE, auc.polygon.col="skyblue", print.thres=TRUE)
结果2

step3 支持向量机法SVM

svm命令的R包 下载

svm命令的R包
# 以下为之前的logistics模型
pre_1 <- predict(myfit,type='response')
modelroc_1 <- roc(Affairs$ynaffair,pre_1)


# 使用支持向量机算法对同样的数据进行预测

library(e1071) ###### 这个包里面有svm
svm_model <- svm(ynaffair ~ gender + age + yearsmarried + children + religiousness + education + occupation + rating, data=Affairs)
# 提取模型预测值并进行格式处理
pred_2 <- as.factor(svm_model$decision.values)
pred_2 <- as.ordered(pred_2)
modelroc_2 <- roc(Affairs$ynaffair,pred_2)
modelroc_2


# 可视化展示,使用add=TRUE将第二个模型添加到图形中
plot.roc(modelroc_2, add=TRUE, col="green",print.thres=TRUE) 
plot(modelroc_1, print.auc=TRUE, auc.polygon=TRUE, grid=c(0.1, 0.2), grid.col=c("green", "red"), max.auc.polygon=TRUE, auc.polygon.col="skyblue", print.thres=TRUE,col='blue')
plot.roc(modelroc_2, add=TRUE, col="green",print.thres=TRUE) 
最终的结果

SVM深度分析:区分training group和test group请参考文章

一文学会SVM——生信技能树

上一篇 下一篇

猜你喜欢

热点阅读