【相关系数r的计算公式怎么算】在统计学中,相关系数r是衡量两个变量之间线性关系强度和方向的一个重要指标。它可以帮助我们了解一个变量的变化是否与另一个变量的变化有关联。本文将总结相关系数r的计算公式,并通过表格形式清晰展示其计算步骤。
一、相关系数r的基本概念
相关系数r(Pearson相关系数)的取值范围在-1到1之间:
- r = 1:表示完全正相关
- r = -1:表示完全负相关
- r = 0:表示无线性相关
r值越接近1或-1,说明两个变量之间的线性关系越强;越接近0,则关系越弱。
二、相关系数r的计算公式
相关系数r的计算公式如下:
$$
r = \frac{n\sum xy - (\sum x)(\sum y)}{\sqrt{[n\sum x^2 - (\sum x)^2][n\sum y^2 - (\sum y)^2]}}
$$
其中:
- $ n $:数据对的数量
- $ x $ 和 $ y $:两个变量的观测值
- $ \sum xy $:x与y乘积之和
- $ \sum x $ 和 $ \sum y $:x和y的总和
- $ \sum x^2 $ 和 $ \sum y^2 $:x和y平方后的总和
三、计算步骤总结(表格形式)
步骤 | 计算内容 | 公式/说明 |
1 | 计算x的总和 | $ \sum x $ |
2 | 计算y的总和 | $ \sum y $ |
3 | 计算x与y的乘积之和 | $ \sum xy $ |
4 | 计算x的平方和 | $ \sum x^2 $ |
5 | 计算y的平方和 | $ \sum y^2 $ |
6 | 计算分子部分 | $ n\sum xy - (\sum x)(\sum y) $ |
7 | 计算分母部分 | $ \sqrt{[n\sum x^2 - (\sum x)^2][n\sum y^2 - (\sum y)^2]} $ |
8 | 计算相关系数r | $ r = \frac{\text{分子}}{\text{分母}} $ |
四、示例说明(简化版)
假设有以下数据:
x | y |
1 | 2 |
2 | 4 |
3 | 6 |
根据上述步骤计算:
- $ \sum x = 6 $, $ \sum y = 12 $
- $ \sum xy = 1×2 + 2×4 + 3×6 = 2 + 8 + 18 = 28 $
- $ \sum x^2 = 1 + 4 + 9 = 14 $
- $ \sum y^2 = 4 + 16 + 36 = 56 $
- $ n = 3 $
代入公式:
$$
r = \frac{3×28 - 6×12}{\sqrt{[3×14 - 6^2][3×56 - 12^2]}} = \frac{84 - 72}{\sqrt{(42 - 36)(168 - 144)}} = \frac{12}{\sqrt{6×24}} = \frac{12}{\sqrt{144}} = \frac{12}{12} = 1
$$
这表明x和y之间存在完全正相关关系。
五、注意事项
- 相关系数r仅反映线性关系,不适用于非线性关系。
- 数据应为连续型变量,且分布近似正态。
- 若数据中存在异常值,可能会影响r的准确性。
通过以上总结和表格展示,可以更直观地理解相关系数r的计算方法。掌握这一工具有助于我们在数据分析中更好地判断变量之间的关联程度。