泊松分布

泊松分布也是非常常见的一种离散型随机变量,它同时也可以用来逼近二项式分布或者作为二项分布的近似计算。当试验次数很多,而每次成功的概率很小的时候,我们可以用泊松分布来近似计算二项式分布。

1,泊松分布:\[P(X=k)=\frac{\lambda^ke^{-\lambda}}{k!},\quad k=0,1,2,\cdots\]

泊松分布通常简记为 \(X\sim P(\lambda)\)。

例1,设一本书中每页印刷的错误数服从参数为 \(\lambda=\frac{1}{2}\) 的泊松分布,今任取一页,求该页中至少有一处错误的概率。

解:设 \(X\) 为每一页的错误数,则

\begin{align*}P(X\ge 1)&=1-P(X=0)\\ &=1-\frac{\left(\frac{1}{2}\right)^0e^{-\frac{1}{2}}}{0!}\\&=1-e^{-\frac{1}{2}}\end{align*}

泊松分布经常用来作为二项式分布的近似计算。如果 \(p \) 很小,而 \(n\) 很大,那么二项式分布可由泊松分布来近似。我们有如下的定理。

2,定理(用泊松分布来近似二项分布):设 \(\lambda>0\) 是一个常数,\(n\) 是任意正整数,设 \(np_n=\lambda\),则对任一固定的正整数 \(k), 有

\[\lim_{n\to\infty}C_n^kp_n^k(1-p_n)^{n-k}=\frac{\lambda^ke^{-\lambda}}{k!}\]

证明:\begin{align*}C_n^kp_n^k(1-p_n)^{n-k}&=\frac{n!}{k!(n-k)!}\left(\frac{\lambda}{n}\right)^k\left(1-\frac{\lambda}{n}\right)^{n-k}\\ &=\frac{n(n-1)\cdots(n-k+1)}{k!}\left(\frac{\lambda}{n}\right)^k\left(1-\frac{\lambda}{n}\right)^n\left(1-\frac{\lambda}{n}\right)^{-k}\\ &=\frac{\lambda^k}{k!}\frac{n(n-1)\cdots(n-k+1)}{n^n}\left(1-\frac{\lambda}{n}\right)^n\left(1-\frac{\lambda}{n}\right)^{-k}\\ &\frac{\lambda^k}{k!}\cdot 1\cdot(1-\frac{1}{n})\cdots(1-\frac{k-1}{n})\left(1-\frac{\lambda}{n}\right)^n\left(1-\frac{\lambda}{n}\right)^{-k}\end{align*}

当 \(n\to\infty\) 时,\[1\cdot(1-\frac{1}{n})\cdots(1-\frac{k-1}{n})\to 1,\quad \left(1-\frac{\lambda}{n}\right)^n\to e^{-\lambda},\quad \left(1-\frac{\lambda}{n}\right)^{-k}\to 1 \]

所以 \[\lim_{n\to\infty}C_n^kp_n^k(1-p_n)^{n-k}=\frac{\lambda^ke^{-\lambda}}{k!}\]

例2,假设某个机械厂里某种零件失效的概率为 \(0.001\),取 \(100\) 件这样的零件,问最多有一件失效的概率。

解:显然,各个零件之间是独立的。这个问题可以看成是 \(100\) 重的伯努利试验。而这里 \(p=0.001\) 很小,而 \(n=100\) 相对来说比较大,所以可以用泊松分布来近似计算。\(\lambda=np=100\cdot0.001=0.1\)

\begin{align*}P(X\le1)&=P(X=0)+P(X=1)\\ &=\frac{0.1^0e^{-0.1}}{0!}+\frac{0.1e^{-0.1}}{1!}\\ &=e^{-0.1}+0.1e^{-0.1}=1.1e^{-0.1}\\&\approx 0.99532\end{align*}

而如果采用二项式分布计算

\begin{align*}P(X\le1)&=P(X=0)+P(X=1)\\ &=0.999^{100}+C_{100}^10.999^{99}0.001\\ &=1.099\cdot 0.999^{99}\\ &\approx 0.99536\end{align*}

我们看到,近似程度非常高。