区间估计的概念和方法

我们给出区间估计的定义以及在一般情况下，区间估计的步骤与方法。

1，区间估计：就是估计未知参数大概的取值范围。

2，置信区间：设 \(\hat{\theta_1}\) 和 \(\hat{\theta_2}\) 是两个统计量，\(0<\alpha<1\) 固定，若

\[P\{\hat{\theta_1}\le\theta\le \hat{\theta_2}\}\ge 1-\alpha\]

则称区间 \([\hat{\theta_1},\hat{\theta_2}]\) 为 \(\theta\) 的置信水平为 \(1-\alpha\) 的置信区间。一般要求\(\hat{\theta_1},\hat{\theta_2}\) 满足上式的等号。但对于离散型随机变量，有时候给定 \(\alpha\)，不一定正好能找到 \(\hat{\theta_1},\hat{\theta_2}\) 满足上面的等式，这时候我们尽量找到 \(\hat{\theta_1},\hat{\theta_2}\)，使得 \(P\{\hat{\theta_1}\le\theta\le \hat{\theta_2}\}\) 尽量接近 \(1-\alpha\)。

这里：

\([\hat{\theta_1},\hat{\theta_2}]\)：置信区间

\(1-\alpha\)：置信水平

\(\hat{\theta_1}\)：置信下限，\(\hat{\theta_2}\)：置信上限

3，单侧置信区间：

（1）\(P\{\theta\le \hat{\theta}\}\ge 1-\alpha\)：上侧置信区间；

（2）\(P\{\theta\ge \hat{\theta}\}\ge 1-\alpha\)：上侧置信区间；

我们用一个例子来说明区间估计的具体方法与步骤。

例1，设 \(x_1,x_2,\cdots,x_n\) 为来自于总体 \(N(\mu,\sigma^2)\) 的一组样本， \(\sigma^2\) 已知，求 \(\mu\) 的置信水平为 \(95\%\) 的置信区间。

解：我们知道 \(\mu\) 的一个无偏估计为 \(\bar{x}\)，而且 \(\bar{x}\sim N(\mu,\frac{\sigma^2}{n})\)，标准化后，

\[\frac{\bar{x}-\mu}{\sigma/\sqrt{n}}\sim N(0,1)\]

这个结论在之前的正态总体的抽样分布那一部分也叙述过。由这个结论，我们寻求 \(a,b\) ，使得

\[P\left\{a\le \frac{\bar{x}-\mu}{\sigma/\sqrt{n}}\le b\right\}=95\%\]

从这里解出 \(\mu\)，就是 \(\mu\) 的置信区间。

这里是双侧置信区间，我们一般要求随机变量落在两端之外的概率相等，也就是

\[P\left\{\frac{\bar{x}-\mu}{\sigma/\sqrt{n}}> b\right\}=2.5\%,\quad P\left\{\frac{\bar{x}-\mu}{\sigma/\sqrt{n}}< a\right\}=2.5\%\]

也就是说

\[P\left\{\frac{\bar{x}-\mu}{\sigma/\sqrt{n}}\le b\right\}=97.5\%,\quad P\left\{\frac{\bar{x}-\mu}{\sigma/\sqrt{n}}< a\right\}=2.5\%\]

因为正态分布是对称的，我们知道 \(a=-b\)，查标准正态分布表得

\[P\left\{\frac{\bar{x}-\mu}{\sigma/\sqrt{n}}\le 1.96\right\}=97.5\%\]

所以

\[P\left\{-1.96\le \frac{\bar{x}-\mu}{\sigma/\sqrt{n}}\le 1.96\right\}=95\%\]

从不等式 \(\displaystyle -1.96\le \frac{\bar{x}-\mu}{\sigma/\sqrt{n}}\le 1.96\) 解出 \(\mu\)，

\[\bar{x}-1.96\cdot \frac{\sigma}{\sqrt{n}}\le \mu\le \bar{x}+1.96\cdot \frac{\sigma}{\sqrt{n}}\]

就是 \(\mu\) 的置信水平为 \(95\%\) 的置信区间，即\(\mu\) 的置信水平为 \(95\%\) 的置信区间为

\[\left[\bar{x}-\frac{1.96\cdot\sigma}{\sqrt{n}},\bar{x}+\frac{1.96\cdot\sigma}{\sqrt{n}}\right]\]

4，区间估计的基本方法：总结上面的例子可以知道区间估计的基本方法是：

（1）取一个只与未知参数 \(\theta\) 及样本有关的函数（统计分布）\(G(\theta;x_1,\cdots,x_n)\)，称为枢轴量；

（2）取常数 \(a,b\)，使得 \(P\{a\le G\le b\}=1-\alpha\)；

（3）从不等式 \(a\le G\le b\) 中解出 \(\theta_1\le \theta\le \theta_2\)，区间 \([\theta_1,\theta_2]\) 就是 \(\theta\) 的置信水平为 \(1-\alpha\) 的置信区间。