04 赤裸裸的统计学-相关性与相关系数
2022-06-22 本文已影响0人
长清kathy
-
网飞向我推荐的电影与我喜欢的其他影片类似,其他网友与我对某些电影的打分类似,因此向我推荐他们高度评价的电影而我还没有看过的;
-
正相关性:如果一个变量的改变引起另一个变量朝着相同的方向变化,那么我们说这两个变量存在正相关性;
-
负相关性:如果一个变量的改变引起另一个变量朝着相反的方向变化,那么我们说这两个变量存在负相关性。
相关系数
相关性作为一个统计工具的魅力在于将两个变量的关联精炼成一个描述性数据:相关系数。
-
优势:
1、数学表达式清晰可见[-1,1],1完全正相关,-1完全负相关,0不相关。
2、相关系数不受变量单位的限制。
将大量芜杂无序、单位不统一的复杂数据加工成一个简洁、优雅的描述性数据。 -
计算过程:
1、将每个学生的身高转换为标准值:(身高-平均身高)/标准差。
2、将每个学生的体重转换为标准值:(体重-平均体重)/标准差。
3、将每个学生的体重标准值和身高标准值相乘,你会发现,当一个学生的身高和体重都偏离平均值值较远时,乘积的绝对值也较大。
4、将第三步求得的乘积相加,再除以统计对象的数量。 -
相关系数并不等于因果关系。
-
既然你那么爱看我喜欢的电影,厌恶我不喜欢的电影,那么你觉得乔治.布鲁克的电影怎么样?