kaggle学习 - 缺失值处理

2018-11-15  本文已影响0人  Rooooooooong

如何检测补缺失值的效果?
补完以后看“补的数据”和“原生数据”的分布是否有差异。这里有两种合适的可视化方法,散点图、密度图和条状图。

散点图

散点图

密度图

密度图

条状图

条状图

可以发现补的效果还可以,但是下图就出现了意外。


可能的原因是m选取的过大,m是拟合的轮数。这里具体什么作用我也不是很清楚,存个疑。以后具体查看mice包及相关论文。
tempData1 <- mice(df3,m=50,seed = 12345)
modelFit1 <- with(tempData1,lm(CPI~Unemployment))

参考
Imputing Missing Data with R

上一篇下一篇

猜你喜欢

热点阅读