协方差(Covariance)是用来衡量两个随机变量之间线性关系强度的统计量。协方差的计算公式如下:
$$Cov(X,Y)=E[(X−E(X))(Y−E(Y))]$$
其中,E表示期望(均值),X和Y分别为两个随机变量,E(X)和E(Y)分别为它们的期望值。
在实际应用中,我们通常使用样本协方差(Sample Covariance)来估计总体协方差,计算公式如下:
$$Cov(X, Y) = \frac{1}{n-1} \sum_{i=1}^{n} (x_i - \overline{x}) (y_i - \overline{y})$$
$E$表示期望,$X$和$Y$分别为两个随机变量,$\overline{x}$和$\overline{y}$分别为它们的样本均值,$n$为样本数量,$x_i$和$y_i$分别为第$i$个样本点的取值。
需要注意的是,协方差的值既可以是正数,也可以是负数。当X和Y呈正相关(即X变大时,Y也随之变大)时,协方差为正数;当X和Y呈负相关(即X变大时,Y随之变小)时,协方差为负数;当X和Y之间没有线性关系时,协方差为0。