ML:君子不器
2019-09-26 本文已影响0人
凡有言说
新方法层出不穷,象牙塔里的人匆匆慌慌。大数据、机器学习、人工智能带来了很多焦虑,或在这洪流中夹持向前,或在代码支配下打着溜号的小九九。和不快乐”对抗“的最好办法就是想方设法让自己开心。让我们一起开始机器学习的故事,将重心先放在对内隐逻辑的理解,毕竟咱们大部分是文科生。
《系辞》:“形而上者谓之道,形而下者谓之器。”
从两分法到K折法,虽然次数多了,给机器添麻烦了,但降低了偶然因素影响,使所得均方误更有可信性。
关于两分法,可以用生成奇偶数方法实现
gen d = mod(_n+1,2) == 1 //mod() 取余数
然后用奇(偶)数类数据(训练集)得模型,做预测,最后求预测误差即可。这里,重点关注测试集的预测误差。
对于K折法,直接调用命令。crossfold
是外部命令,需要安装。
ssc install crossfold
crossfold regress y x1 x2 x3 x4 //假设有四个自变量
crossfold
默认将样本随机分成5份,每次使用其中4份分析,用其获得的模型测试未进入分析的数据,获得均方根误差