皮尔逊相关系数怎么计算?

总体皮尔逊(Pearson)相关系数

如果两组数据\(X:\left\{ X_1,X_2,\cdots ,X_n \right\} \)和\(Y:\left\{ Y_1,Y_2,\cdots ,Y_n \right\} \)是总体数据

第一步:计算总体均值

$$
E\left( X \right) =\frac{\sum_{i=1}^n{X_i}}{n},E\left( Y \right) =\frac{\sum_{i=1}^n{Y_i}}{n}
$$

第二步:计算总体协方差

$$
Cov\left( X,Y \right) =\frac{\sum_{i=1}^n{\left( X_i-E\left( X \right) \right) \left( Y_i-E\left( Y \right) \right)}}{n}
$$

如何理解协方差?

如果X、Y变化方向相同,即当X大于(小于)其均值时,Y也大于(小于)其均值,在这两种情况下,乘积为正。如果X、Y的变化方向一直保持相同,则协方差为正;同理,如果X、Y变化方向一直相反,则协方差为负;如果X、Y变化方向之间相互无规律,即分子中有的项为正,有的项为负,那么累加后正负抵消。

注意:协方差的大小和两个变量的量纲有关,因此不适合做比较。

第三步:计算总体的标准差

$$
\sigma _X=\sqrt{\frac{\sum_{i=1}^n{\left( X_i-E\left( X \right) \right) ^2}}{n}}
$$
$$
\sigma _Y=\sqrt{\frac{\sum_{i=1}^n{\left( Y_i-E\left( Y \right) \right) ^2}}{n}}
$$

第四步:计算总体皮尔逊相关系数

$$
\rho _{XY}=\frac{Cov\left( X,Y \right)}{\sigma _X\sigma _Y}=\frac{\sum_{i=1}^n{\frac{\left( X_i-E\left( X \right) \right)}{\sigma _X}\frac{\left( Y_i-E\left( Y \right) \right)}{\sigma _Y}}}{n}
$$

样本皮尔逊(Pearson)相关系数

如果两组数据\(X:\left\{ X_1,X_2,\cdots ,X_n \right\} \)和\(Y:\left\{ Y_1,Y_2,\cdots ,Y_n \right\} \)是总体数据

第一步:计算样本均值

$$
\bar{X} =\frac{\sum_{i=1}^n{X_i}}{n},\bar{Y} =\frac{\sum_{i=1}^n{Y_i}}{n}
$$

第二步:计算样本协方差

$$
Cov\left( X,Y \right) =\frac{\sum_{i=1}^n{\left( X_i-\bar{X} \right) \left( Y_i-\bar{Y} \right)}}{n-1}
$$

第三步:计算总体的标准差

$$
S_X=\sqrt{\frac{\sum_{i=1}^n{\left( X_i-\bar{X} \right) ^2}}{n-1}}\text{,}S _Y=\sqrt{\frac{\sum_{i=1}^n{\left( Y_i-\bar{Y} \right) ^2}}{n-1}}
$$

第四步:计算总体皮尔逊相关系数

$$
\rho _{XY}=\frac{Cov\left( X,Y \right)}{S _XS _Y}=\frac{\sum_{i=1}^n{\frac{\left( X_i-\bar{X} \right)}{S _X}\frac{\left( Y_i-\bar{Y} \right)}{S _Y}}}{n-1}
$$

matlab计算皮尔逊相关系数公式

在matlab中导入需要分析的数据后直接调用函数corrcoef即可实现皮尔逊相关系数的计算

皮尔逊相关系数怎么计算?

spss计算皮尔逊相关系数

在spss中同样导入数据后即可计算皮尔逊相关系数的计算

皮尔逊相关系数怎么计算?

皮尔逊系数的取值范围

相关性
无相关性 -0.09 ~ 0.0 0.0 ~ 0.09
弱相关性 -0.3 ~ -0.1 0.1 ~ 0.3
中相关性 -0.5 ~ -0.3 0.3 ~ 0.5
强相关性 -1.0 ~ -0.5 0.5 ~ 1.0

上表所定的标准从某种意义上说是武断的和不严格的。对相关系数的解释是依赖于具体的应用背景和目的的

比起相关系数的大小,我们往往更关注的是显著性。(假设检验)

总结

(1)如果两个变量本身就是线性的关系,那么皮尔逊相关系数绝对值大的就是相关性强,小的就是相关性弱
(2)在不确定两个变量是什么关系的情况下,即使算出皮尔逊相关系数,发现很大,也不能说明那两个变量线性相关,甚至不能说他们相关,我们一定要画出散点图来看才行;这里我们使用spss绘制相关散点图判断其相关性

皮尔逊相关系数怎么计算?

发表评论 取消回复
表情 图片 链接 代码

分享