生物信息学与算法数据科学与R语言

构建模拟实验比较相关性和互信息

2018-06-28  本文已影响0人  PriscillaBai

今天师兄给我讲了模拟实验,分享给大家

构建网络时,有两种方法,相关性和互信息,那么这两种方法孰优孰劣呢?

已知相关性是线性的,互信息非线性的,那么我们构建模拟实验时,要综合考虑这两种数据类型。并且,互信息只能应用于整数,正态分布四舍五入后容易聚集到一起,影响效果,所以我们选择均匀分布。

1. 生成从100个0:1000的均匀分布数据,并取整数
x1<-runif(100,0,1000)
x1<-round(x1,digits = 0)
2. 生成线性和非线性方程
a=3
b=3
y1<-a*x1
y2<-b*x1^2
3. 给方程加残差扰动
k<-1000
m<-runif(100,0,k)
y1<-y1+m
y2<-y2+m
4.分别求相关性和互信息
cor(x1,round(y1))
cor(x1,round(y2))
mutinformation(x1,round(y1))
mutinformation(x1,round(y2))
5. 不断增加K的值(K即残差的标准差),也就是增大扰动程度。观察相关性和互信息的变化
上一篇 下一篇

猜你喜欢

热点阅读