解密大数据

正态分布作业一

2017-03-17  本文已影响0人  昆明石头

具体的代码及运行过程如下:

数据分析如下:

1)智商得分位于100~110区间内的人数最多,超过25%;2)智商得分主要集中在80~120之间,接近90%;3)以智商得分为均值和标准差的正态分布密度函数与数据有比较好的吻合。

由上次作业可知,直方图的分组数据对图形有非常大的影响,线增加分组数量,观察数据的变化情况。

分组数为15时,图形如下:

分组数为20时,图形如下:

数据分析:

1)从图形来看,显然概率密度函数与直方图吻合的并不好;2)同一组数据,从可视化的图形上却呈现出两种不同的结果(一组吻合良好,另两组吻合不太好),说明怎样的数据特征才能采用正态分布进行拟合,是一个值得思考的问题;3)即便概率密度函数与直方图吻合良好,概率密度函数也是一种近似的拟合,与真实值存在一定的差别,我们需要将这种差别控制在一定范围内。

上一篇 下一篇

猜你喜欢

热点阅读