几个概念
总体:所要考察对象的全部个体。
样本:从总体中所抽取的一部分个体。
总体皮尔逊person相关系数
直观理解协方差: 如果X、 Y变化方向相同,即当X大于(小于)其均值时, Y也大于(小于)其均值,在这两种情况下,乘积为正。如果X、 Y的变化方向一直保持相同,则协方差为正;同理,如果X、 Y变化方向一直相反,则协方差为负;如果X、 Y变化方向之间相互无规律,即分子中有的项为正,有的项为负,那么累加后正负抵消。
注:协方差的大小和两个变量的量纲有关,因此不适合比较。
皮尔逊相关系数也可以看成是剔除了两个变量量纲影响,即将x和y标准化后的协方差。
样本皮尔逊person相关系数
相关性可视化
注:这里的相关系数只是用来衡量两个变量线性相关的指标;也就是说,你必须先确认这两个变量是线性相关的,然后这个相关系数才能告诉你他俩相关程度如何。