相关系数是衡量两个随机变量线性相关程度的一个数字特征。虽然协方差给出了两个随机变量是否线性相关的信息,但是它只是一个绝对的量,不能给出不同分布的两组向量的相关程度的描述。这就是相关系数的作用,它能衡量两个随机变量线性相依的大小。
1,相关系数:\[\rho_{XY}=\frac{\text{Cov}(X,Y)}{\sqrt{D(X)}\cdot\sqrt{D(Y)}}=\frac{E(XY)-E(X)E(Y)}{\sqrt{D(X)}\cdot\sqrt{D(Y)}}\]
2,\(\rho_{XY}=1\):\(X,Y\) 完全线性相关,\(Y=aX+b\);
\(\rho_{XY}=-1\):\(X,Y\) 完全线性相关,\(Y=-aX+b\);
\(\rho_{XY}=0\):\(X,Y\) 不相关(没有线性关系)。
例1,设 \(X,Y\) 相互独立且服从同一参数为 \(\lambda\) 的泊松分布,求 \(U=2X+Y, V=2X-Y\) 的相关系数。
解:\begin{align*}\text{Cov}(U,V)&=\text{Cov}(2X+Y,2X-Y)\\ &=\text{Cov}(2X,2X)-\text{Cov}(2X,Y)+\text{Cov}(Y,2X)-\text{Cov}(Y,Y)\\ &=4\text{Cov}(X,X)-2\text{Cov}(X,Y)+2\text{Cov}(Y,X)-\text{Cov}(Y,Y)\\ &=4D(X)-D(Y)\\ &=3\lambda\end{align*}
又因为 \(X,Y\) 独立
\[D(U)=D(2X+Y)=4D(X)+D(Y)=5\lambda\]
\[D(V)=D(2X-Y)=4D(X)+D(Y)=5\lambda\]
所以
\[\rho_{UV}=\frac{\text{Cov}(U,V)}{\sqrt{D(U)}\cdot\sqrt{D(V)}}=\frac{3\lambda}{5\lambda}=\frac{3}{5}\]
例2,设二维随机变量 \((X,Y)\) 的联合概率密度为 \[f(x,y)=\begin{cases}3x,&0<y<x<1\\ 0,&\text{其它}\end{cases}\]求 \(\rho_{XY}\)。
解:\begin{align*}E(XY)&=\int_{-\infty}^{\infty}xyf(x,y)dydx=\int_0^1\int_0^x3x^2ydydx\\ &=\int_0^1\frac{3x^2y^2}{2}\Big|_0^xdx=\int_0^1\frac{3x^4}{2}dx\\ &=\frac{3x^5}{10}\Big|_0^1=\frac{3}{10}\end{align*}
\begin{align*}E(X)&=\int_{-\infty}^{\infty}xf(x,y)dydx=\int_0^1\int_0^x3x^2dydx\\ &=\int_0^13x^2y\Big|_0^xdx=\int_0^13x^3dx\\ &=\frac{3x^4}{4}\Big|_0^1=\frac{3}{4}\end{align*}
\begin{align*}E(X^2)&=\int_{-\infty}^{\infty}x^2f(x,y)dydx=\int_0^1\int_0^x3x^3dydx\\ &=\int_0^13x^3y\Big|_0^xdx=\int_0^13x^4dx\\ &=\frac{3x^5}{5}\Big|_0^1=\frac{3}{5}\end{align*}
\begin{align*}E(Y)&=\int_{-\infty}^{\infty}yf(x,y)dxdy=\int_0^1\int_y^13xydxdy\\ &=\int_0^1\frac{3yx^2}{2}\Big|_y^1dy=\int_0^1\frac{3y}{2}(1-y^2)dy\\ &=\frac{3y^2}{4}-\frac{3y^4}{8}\Big|_0^1=\frac{3}{8}\end{align*}
\begin{align*}E(Y^2)&=\int_{-\infty}^{\infty}y^2f(x,y)dxdy=\int_0^1\int_y^13xy^2dxdy\\ &=\int_0^1\frac{3y^2x^2}{2}\Big|_y^1dy=\int_0^1\frac{3y^2}{2}(1-y^2)dy\\ &=\frac{y^3}{2}-\frac{3y^5}{10}\Big|_0^1=\frac{1}{5}\end{align*}
所以可得
\begin{array}{l}D(X)=E(X^2)-(E(X))^2=\frac{3}{5}-\frac{9}{16}=\frac{3}{80}\\ D(Y)=E(Y^2)-(E(Y))^2=\frac{1}{5}-\frac{9}{64}=\frac{19}{320}\\ \text{Cov}(X,Y)=E(XY)-E(X)E(Y)=\frac{3}{10}-\frac{3}{4}\cdot\frac{3}{8}=\frac{3}{160}\end{array}
所以相关系数为
\begin{align*}\rho_{XY}&=\frac{\text{Cov}(X,Y)}{\sqrt{D(X)}\cdot\sqrt{D(Y)}}\\ &=\frac{3/160}{\sqrt{3/80}\cdot\sqrt{19/320}}=\sqrt{\frac{6}{38}}\end{align*}