ML:鸢飞戾天,鱼跃于渊
2019-09-26 本文已影响0人
凡有言说
新方法层出不穷,象牙塔里的人匆匆慌慌。大数据、机器学习、人工智能带来了很多焦虑,或在这洪流中夹持向前,或在代码支配下打着溜号的小九九。和不快乐”对抗“的最好办法就是想方设法让自己开心。让我们一起开始机器学习的故事,将重心先放在对内隐逻辑的理解,毕竟咱们大部分是文科生。
平日我们多听过机器学习主要作用是在预测,顺着这“我有个朋友说过...”的日常情节,先引入ROC曲线的概念。ROC是用来评估模型预测的准确度,可能数据集A适合选模型甲,而B适合用模型乙。有了ROC曲线,一如《大雅》云“鸢飞戾天,鱼跃于渊”,模型们各得其所。
*单个模型的ROC
sysuse auto, clear
logit foreign price weight length
predict p
roctab foreign p, graph summary
image.png
这里是看Area under ROC curve(ROC曲线下的面积值),一般认为:在0.5-0.7之间,模型价值较低;在0.7-0.9之间,模型价值中等;在0.9以上模型价值较高。
*多个模型ROC比较
sysuse auto, clear
logit foreign price weight
predict p1
logit foreign price length
predict p2
roccomp foreign p1 p2, graph summary
image.png
公众号.png