kaggle学习 - 缺失值处理
2018-11-15 本文已影响0人
Rooooooooong
如何检测补缺失值的效果?
补完以后看“补的数据”和“原生数据”的分布是否有差异。这里有两种合适的可视化方法,散点图、密度图和条状图。
散点图散点图
密度图密度图
条状图条状图
可以发现补的效果还可以,但是下图就出现了意外。
可能的原因是m选取的过大,m是拟合的轮数。这里具体什么作用我也不是很清楚,存个疑。以后具体查看mice包及相关论文。
tempData1 <- mice(df3,m=50,seed = 12345)
modelFit1 <- with(tempData1,lm(CPI~Unemployment))