正态分布

正态分布是最重要的一种连续型随机分布。因为所有的随机变量都是以正态分布为极限(这就是我们之后要讲到的中心极限定理)。对于正态分布的计算,我们使用的是正态分布表,我们将一般的正态分布化成标准正态分布来计算。

1,正态分布:若随机变量 \(X\) 的概率密度为

\[f(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}}, -\infty<x<\infty\]

就称 \(X\) 为服从参数 \((\mu,\sigma^2)\) 的正态分布,记为 \(X\sim N(\mu,\sigma^2)\)。

2,标准正态分布:若 \(\mu=0, \sigma=1\),称 \(X\) 服从标准正态分布,记为 \(X\sim N(0,1)\),这时候,

\[f(x)=\frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}}, -\infty<x<\infty\]

3,若 \(X\sim N(\mu,\sigma^2)\),证明 \(\displaystyle\int_{-\infty}^{\infty}\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}}dx=1\)。

证明:我们作变换 \(\displaystyle u=\frac{x-\mu}{\sigma}\),那么 \(du=\frac{1}{\sigma}dx\),所以

\[\int_{-\infty}^{\infty}\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}}dx=\int_{-\infty}^{\infty}\frac{1}{\sqrt{2\pi}}e^{-\frac{u^2}{2}}du\]

这个被积函数找不到原函数,所以我们考虑

\begin{align*}\left(\int_{-\infty}^{\infty}e^{-\frac{u^2}{2}}du\right)^2&=\int_{-\infty}^{\infty}e^{-\frac{u^2}{2}}du\int_{-\infty}^{\infty}e^{-\frac{v^2}{2}}dv\\ & =\int_{-\infty}^{\infty}\int_{-\infty}^{\infty}e^{-\frac{u^2+v^2}{2}}dvdu\\ &=\int_0^{2\pi}\int_0^{\infty}e^{\frac{r^2}{2}}rdrd\theta\\ &=\int_0^{2\pi}-e^{\frac{r^2}{2}}\Big|_0^{\infty}d\theta=\int_0^{2\pi}d\theta\\ &=\theta\Big|_0^{2\pi}=2\pi\end{align*}

所以 \[\int_{-\infty}^{\infty}e^{-\frac{u^2}{2}}du=\sqrt{2\pi} \]从而可以得到

\[\int_{-\infty}^{\infty}\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}}dx=1\]

5,一般正态分布的计算:从刚才我们的证明可以得到,如果 \(X\sim N(\mu,\sigma^2)\),则 \(Z=\frac{X-\mu}{\sigma}\sim N(0,1)\),也就是标准正态分布。

因为一般正态分布的计算太复杂,于是就有了标准正态分布表,服从标准正态分布的随机变量可以从表中查到对应的函数值。对于一般的正态分布,我们总是用上面的变换化成标准正态分布,然后通过标准正态分布表来查找具体的数值。

6,标准正态分布的分布函数为 \[\Phi(x)=\int_{-\infty}^x\frac{1}{\sqrt{2\pi}}e^{-\frac{t^2}{2}}dt\]

注意到 \(\Phi(-x)=1-\Phi(x)\),这个性质我们经常要用到。

例1,设 \(X\sim N(3,9)\),求(1)\(P(2<x<5)\);(2)\(P(X>0)\);(3)\(P(|X-3|>6)\)。

解:我们知道 \(\mu=3, \sigma^2=9,\sigma=3\),所以

(1)\begin{align*}P(2<x<5)&=P\left(\frac{2-3}{3}<\frac{x-3}{3}<\frac{5-3}{3}\right)\\ &=P(-\frac{1}{3}<\frac{x-3}{3}<\frac{2}{3})\\ &=\Phi(\frac{2}{3})-\Phi(-\frac{1}{3})=\Phi(\frac{2}{3})+\Phi(\frac{1}{3})-1\\ &=\Phi(0.67)+\Phi(0.33)-1\end{align*}

查表,得 \(\Phi(0.67)=0.7486, \Phi(0.33)=0.6293\),所以

\[P(2<x<5)=\Phi(0.67)+\Phi(0.33)-1=0.3779\]

(2)\begin{align*}P(X>0)&=P\left(\frac{X-3}{3}>\frac{0-3}{3}\right)\\ &=P\left(\frac{X-3}{3}>-1\right)=1-P\left(\frac{X-3}{3}\le-1\right)\\ &=1-\Phi(-1)=\Phi(1)=0.8413\end{align*}

最后一步是查表所得。

(3)\begin{align*}P(|X-3|>6)&=P\left(X-3>6\right)+P\left(X-3<-6\right)\\ &=P\left(\frac{X-3}{3}<\frac{-6}{3}\right)+P\left(\frac{X-3}{3}>\frac{6}{3}\right)\\ &=P\left(\frac{X-3}{3}<-2\right)+P\left(\frac{X-3}{3}>2\right)\\ &=\Phi(-2)+1-P\left(\frac{X-3}{3}\le 2\right)\\ &=1-\Phi(2)+1-\Phi(2)=2=2\Phi(2)\\ &=2-2\cdot 0.9772=0.0456\end{align*}