机器学习

ML:鸢飞戾天,鱼跃于渊

2019-09-26  本文已影响0人  凡有言说

新方法层出不穷,象牙塔里的人匆匆慌慌。大数据、机器学习、人工智能带来了很多焦虑,或在这洪流中夹持向前,或在代码支配下打着溜号的小九九。和不快乐”对抗“的最好办法就是想方设法让自己开心。让我们一起开始机器学习的故事,将重心先放在对内隐逻辑的理解,毕竟咱们大部分是文科生。

平日我们多听过机器学习主要作用是在预测,顺着这“我有个朋友说过...”的日常情节,先引入ROC曲线的概念。ROC是用来评估模型预测的准确度,可能数据集A适合选模型甲,而B适合用模型乙。有了ROC曲线,一如《大雅》云“鸢飞戾天,鱼跃于渊”,模型们各得其所。

*单个模型的ROC
sysuse auto, clear

logit foreign price weight length 

predict p

roctab foreign p, graph summary
image.png

这里是看Area under ROC curve(ROC曲线下的面积值),一般认为:在0.5-0.7之间,模型价值较低;在0.7-0.9之间,模型价值中等;在0.9以上模型价值较高。

*多个模型ROC比较
sysuse auto, clear

logit foreign price weight

predict p1

logit foreign price length

predict p2

roccomp foreign p1 p2, graph summary
image.png 公众号.png
上一篇 下一篇

猜你喜欢

热点阅读