R语言-06.1缺失值处理
2018-11-26 本文已影响0人
周一ing
- 删除NA
#如果第一列存在缺失值,则删除这一行
bdata<-alldata[complete.cases(alldata[,1]),]
- 用某个值填充
1.NA处理成0
a[is.na(a[,11]), 11:18] <- 0 #若11列是NA值,将11到18列都处理成0
2.用平均值填充
for(i in 13:18){
ave <- round(mean(a[,i],na.rm = TRUE),1) #na.rm = TRUE表示忽略缺失值计算平均数
a[is.na(a[,i]), i] <- ave
}
NA与NAN
- NA代表当数据不可得到或者丢失
- NAN代表非数值,比如0/0
- is.na(x)对于NA和NAN检验都是TRUE,is.nan(x)则只对NAN的元素显示TRUE