皮尔森相关系数代码
皮尔森相关系数(Pearson Correlation Coefficient)是一种度量两个连续变量之间线性相关性的统计方法。该系数是由 Karl Pearson 在1900年提出的,故名 Pearsons r。该系数衡量的是两个变量之间的线性相关性强度和方向,取值范围为-1到1之间。值越接近1,表明两个变量之间存在强的正相关关系;值越接近-1,表明两个变量之间存在强的负相关关系;值越接近0,表明两个变量之间不存在显著的相关关系。
Pearson 相关系数代码实现了该系数的计算,通过 Python 语言编写,使用了 multiply 函数计算两个列表的元素乘积之和,cal_pearson 函数计算 Pearson 相关系数。该代码使用 x 和 y 两个列表作为输入,计算出 Pearson 相关系数,并输出结果。
代码实现了以下几个步骤:
1.计算 x 和 y 两个列表的元素之和:sum_x 和 sum_y。
2.计算 x 和 y 两个列表的元素乘积之和:sum_xy。
3.计算 x 和 y 两个列表的平方和:sum_x2 和 sum_y2。
4.计算 Pearson 相关系数的分子和分母:molecular 和 denominator。
5.计算 Pearson 相关系数:r = molecular / denominator。
代码中还使用了 list comprehension 语法来计算列表的平方和,提高了代码的可读性和效率。
在主函数中,使用了两个示例列表 x 和 y,计算出 Pearson 相关系数,并输出结果。
需要注意的是,Pearson 相关系数只适用于连续变量之间的相关性分析,对于分类变量或有序变量,需要使用其他相关系数,如 Spearman Rank Correlation Coefficient 或 Kendall Rank Correlation Coefficient。
Pearson 相关系数代码实现了一个基本的相关性分析工具,对于数据分析和科学研究等领域具有重要的应用价值。