Chapter 8 假设检验¶

约 3701 个字 1 张图片预计阅读时间 19 分钟

统计推断的另一类重要问题是假设检验问题。它包括

[参数检验] 已知总体分布的形式，需对其中的未知参数给出假设检验
[非参数检验]总体的分布形式完全未知的情况下，对总体的分布或数字特征进行假设检验

假设¶

原假设(零假设) \(H_0\) ，备择假设(对立假设) \(H_1\) 关于总体参数 \(\theta\) 的假设：

\[H_0:\theta \ge \theta_0 , H_1:\theta < \theta_0 \text{(左边检验)}\]

\[H_0:\theta \le \theta_0 , H_1:\theta > \theta_0 \text{(右边检验)}\]

\[H_0:\theta = \theta_0 , H_1:\theta \ne \theta_0 \text{(双边检验)}\]

检验统计量和拒绝域¶

如果统计量 \(T = T(X_1, \cdots, X_n)\) 的取值大小和原假设 \(H_0\) 是否成立有密切练习，可将之称为对应假设问题的 检验统计量。

对应于拒绝原假设 \(H_0\) 时，样本值的范围成为 拒绝域，记为 \(W\) ，其补集 \(\overline{W}\) 称为 接受域。

两类错误¶

由于样本的随机性，任一检验规则在应用时，都有可能发生错误的判断。

	原假设为真	原假设为假
根据样本拒绝原假设	第一类错误	正确决策
根据样本接受原假设	正确决策	第二类错误

第一类错误： 拒绝真实的原假设(弃真)
第二类错误： 接受错误的原假设(取伪)

犯第一类错误的概率

\[\alpha = P\{\text{拒绝} H_0 | H_0 \text{为真}\} = P_{H_0}\{\text{拒绝}\}H_0\]

犯第二类错误的概率

\[\beta = P\{\text{接受} H_0 | H_0 \text{为假}\} = P_{H_1}\{\text{接受}\}H_0\]

例如设某种清漆的9个样品，其干燥时间（以小时计）分别为： 6.0 5.7 5.5 6.5 7.0 5.8 5.2 6.1 5.0 根据以往经验，干燥时间的总体服从正态分布 N(6.0, 0.36)，现根据样本检验均值是否与以往有显著差异？ (样本均值为6.4)

此时犯第一类错误的概率

\(\alpha(C) = P\{\text{拒绝} H_0 | H_0 \text{为真}\} = P\{|\overline{X}-6.0| \ge C | \mu = 6.0\}\)

\(= P\{\frac{|\overline{X}-6.0|}{\sqrt{\frac{\sigma^2}{n}}} \ge \frac{C}{\sqrt{\frac{\sigma^2}{n}}} | \mu = 6.0\}\)

由于当 \(H_0\) 成立时，即 \(\mu = 6.0\) ， \(\frac{\overline{X}-6.0}{\sqrt{\frac{\sigma^2}{n}}} \sim N(0, 1)\) ，所以

\(\alpha(C) = 2 - 2\Phi(\frac{C}{\sqrt{\frac{\sigma^2}{n}}})\)

关于 C 是单调减函数

此时犯第二类错误的概率

\(\beta(C) = P\{\text{接受} H_0 | H_0 \text{为假}\} = P\{|\overline{X}-6.0| < C | \mu \ne 6.0\}\)

\(= P\{\frac{6.0-C-\mu}{\sqrt{\frac{\sigma^2}{n}}} \le \frac{\overline{X}-\mu}{\sqrt{\frac{\sigma^2}{n}}} \le \frac{6.0+C-\mu}{\sqrt{\frac{\sigma^2}{n}}} | \mu \ne 6.0\}\)

\(= \Phi\{\frac{6.0+C-\mu}{\sqrt{\frac{\sigma^2}{n}}}\} - \Phi\{\frac{6.0-C-\mu}{\sqrt{\frac{\sigma^2}{n}}}\},\mu \ne 6.0\)

关于 C 是单调增函数

所以，犯两类错误的概率相互制约！

Neyman-Pearson 原则¶

首先控制犯第一类错误的概率不超过某个常数 \(\alpha \in (0,1)\) ,再寻找检验，使得犯第二类错误的概率尽可能小。

其中的常数 \(\alpha\) 称为显著水平。

常取 \(\alpha = 0.01,0.05,0.10\) 等。

继续上面的例题

当 \(H_0\) 成立时:

\[Z = \frac{\overline{X}-6.0}{\sqrt{\frac{0.6^2}{9}}} \sim N(0,1)\]

\[\Rightarrow P(\frac{|\overline{X}-6.0|}{0.6/3} \ge z_{\alpha/2}) = \alpha\]

\[\Rightarrow \text{拒绝条件为:} \frac{|\overline{X} - 6.0|}{0.2} \ge z_{\alpha / 2}\]

若取 \(\alpha = 0.05\) ,则拒绝域为 \(\{|\overline{X} - 6| \ge 0.392|\}\)

\(\because \overline{x} = 6.4,|\overline{x}-6|=0.4 > 0.392\)

即 \(\overline{x}\) 落在拒绝域内， \(\overline{x}\) 与 \(\mu = 6\) 的差异显著，因此拒绝原假设，认为干燥时间的均值与以往有显著差异。

犯第1类错误的概率 \(\alpha(0.392)=0.05\)

犯第2类错误的概率 \(\beta(0.392) = P\{\text{接受}H_0|H_0\text{是假的}\} = P\{|\overline{X}-6.0|<0.392 | \mu \neq 6.0\}\)

\(= P\{5.608 < \overline{X} < 6.392| \mu \neq 6.0\} = \Phi\{\frac{6.392-\mu}{0.2}\} - \Phi\{\frac{5.608-\mu}{0.2}\},\mu \neq 6.0\)

例当 \(\mu = 5.4\) 时，

\(\beta = \Phi\{\frac{6.392-5.4}{0.2}\} - \Phi\{\frac{5.608-5.4}{0.2}\} \approx 0.15\)

P_ 值与统计显著性¶

P_ 值: 当原假设成立时，检验统计量取比观察到的结果更为极端的数值的概率.

例1中P_ 值的计算

P_ = \(P_{H_0}(|\overline{X}-6.0| \ge 0.4) = P_{H_0}(|\frac{\overline{X}-6.0}{0.2}| \ge 2) = 2 - 2\Phi(2) = 0.046 < 0.05\)

\(|\overline{X}-6.0| > 0.4\) 是小概率事件.作出拒绝原假设的判断.

P_ 值与显著水平 \(\alpha\) 的关系:

若 P_ \(\le \alpha\) ,则拒绝原假设，此时称检验结果在水平 \(\alpha\) 下是统计显著的.

若 P_ \(> \alpha\) ,则接受原假设，此时称检验结果在水平 \(\alpha\) 下是统计不显著.

处理假设检验问题的基本步骤¶

(1) 根据实际问题提出原假设和备择假设；

(2) 提出检验统计量和拒绝域的形式；

(3) 在给定的显著水平 \(\alpha\) 下，根据 Neyman-Pearson 原则求出拒绝域的临界值。

(4) 根据实际样本观测值作出判断。

(3') 计算检验统计量的观测值与 P_ 值；

(4') 根据给定的显著水平 \(\alpha\) ,作出判断.

[注：] \(H_0\) 与 \(H_1\) 地位不等

由于控制犯第1类错误，因此错误拒绝 \(H_0\) 是小概率事件,也就是说 \(H_0\) 不会轻易被拒绝掉。因此如果落在拒绝域，则说明已有了显著的差异，从而拒绝 \(H_0\)

\(H_0\) 选取: 不能轻易拒绝的，后果严重的，或维持现状的

如: \(H_0\) : 新技术未提高效益 \(\leftrightarrow H_1\) : 新技术提高效益

单个正态总体参数的假设检验¶

设样本 \(X_1,X_2,\dots,X_n\) 来自正态总体 \(N(\mu,\sigma^2)\) , \(\overline{X}\) 和 \(S^2\) 分别为样本均值和方差，显著性水平为 \(\alpha\)

有关均值 \(\mu\) 的检验

\(\sigma^2\) 已知时——Z检验

双边假设问题 \(H_0 : \mu = \mu_0,H_1 : \mu \neq \mu_0\)

取检验统计量为 \(Z = \frac{\overline{X} - \mu_0}{\sigma / \sqrt{n}}\)

在 \(H_0\) 为真时， \(Z \sim N(0,1)\)

根据 Neyman-Pearson 原则，检验的拒绝域为 \(W = \{|z| = |\frac{\overline{x}-\mu_0}{\sigma / \sqrt{n}}| \ge z_{\alpha / 2}\}\)

P_ 值的计算 对给定的样本观察值 \(x_1,\dots,x_n\) ,记检验统计量 Z 的取值为 \(z_0 = \frac{\overline{x} - \mu_0}{\sigma / \sqrt{n}}\) 则有

P_ \(= P_{H_0} \{ |Z| \ge |z_0| \} = 2(1 - \Phi (|z_0|))\)

当 P_ 小于显著水平 \(\alpha\) 时，拒绝原假设，否则，接受原假设.

右边检验 \(H_0 : \mu \le \mu_0,H_1 : \mu > \mu_0\)

检验统计量为 \(\overline{X}\) , 检验拒绝域的形式为 \(\overline{X} - \mu_0 \ge k\)

当 \(\mu \in H_0\) ,即 \(\mu \le \mu_0\) 时

\(\because \overline{X} \sim N(\mu,\frac{\sigma^2}{n})\)

\(\therefore \text{犯第一类错误概率为} P_{\mu}\{\overline{X} - \mu_0 \ge k\} = 1 - \Phi(\frac{k+\mu_0 - \mu}{\sigma / \sqrt{n}}) = \Phi(\frac{\mu - \mu_0 - k}{\sigma / \sqrt{n}}) \text{是} \mu \text{的增函数}\)

\(\therefore \text{当} \mu = \mu_0 \text{时,犯第一类错误概率最大.}\)

故只要 \(\Phi(\frac{-k}{\sigma / \sqrt{n}}) = \alpha\) ,即 \(\frac{-k}{\sigma / \sqrt{n}} = -z_{\alpha}\) 便可

因此，拒绝域为： \(\{z = \frac{\overline{x} - \mu_0}{\sigma / \sqrt{n}} \ge z_{\alpha} \}\)

P_ 值的计算 P_ = \(\mathop{sup}\limits_{\mu \le \mu_0} P_{H_0} \{Z \ge z_0 \} = P\{Z \ge z_0 | \mu = \mu_0 \} = 1 - \Phi (z_0)\)

结论¶

1 \(\sigma^2\) 已知检验 \(\mu\) (Z 检验法)¶

\(z_0 = \frac{\overline{x} - \mu_0}{\sigma / \sqrt{n}}\) ,当 \(\mu = \mu_0\) 时， \(Z = \frac{\overline{X} - \mu_0}{\sigma / \sqrt{n}} \sim N(0,1)\)

(1) \(H_0 : \mu = \mu_0 \leftrightarrow H_1 : \mu \ne \mu_0\)

拒绝域 : \(|Z| \ge z_{\alpha / 2}\)

P_ = \(P_{\mu_0} \{|Z| \ge |z_0| \} = 2(1 - \Phi(|z_0|))\)

(2) \(H_0 : \mu \le \mu_0 \leftrightarrow H_1 : \mu > \mu_0\)

拒绝域 : \(Z \ge z_{\alpha}\)

P_ = \(P_{\mu_0} \{Z \ge z_0 \} = 1 - \Phi(z_0)\)

(3) \(H_0 : \mu \ge \mu_0 , H_1 : \mu < \mu_0\)

拒绝域 : \(Z \le -z_{\alpha}\)

P_ = \(P_{\mu_0} \{Z \le z_0 \} = \Phi(z_0)\)

2 \(\sigma^2\) 未知检验 \(\mu\) (t 检验法)¶

\(t_0 = \frac{\overline{x} - \mu_0}{s / \sqrt{n}}\) ,当 \(\mu = \mu_0\) 时， \(t = \frac{\overline{X} - \mu_0}{s / \sqrt{n}} \sim t(n-1)\)

(1) \(H_0 : \mu = \mu_0 \leftrightarrow H_1 : \mu \ne \mu_0\)

拒绝域 : \(|t| \ge t_{\alpha / 2}(n-1)\)

P_ = \(P_{\mu_0} \{|t| \ge |t_0| \} = 2P(t(n-1) \ge |t_0|)\)

(2) \(H_0 : \mu \le \mu_0 \leftrightarrow H_1 : \mu > \mu_0\)

拒绝域 : \(t \ge t_{\alpha}(n-1)\)

P_ = \(P_{\mu_0} \{t \ge t_0 \} = P(t(n-1) \ge t_0)\)

(3) \(H_0 : \mu \ge \mu_0 , H_1 : \mu < \mu_0\)

拒绝域 : \(t \le -t_{\alpha}(n-1)\)

P_ = \(P_{\mu_0} \{t \le t_0 \} = P(t(n-1) \le t_0)\)

3 \(\mu\) 未知检验 \(\sigma^2\) (\(\chi^2\) 检验法)¶

当 \(\sigma^2 = \sigma_0^2\) 时， \(\chi^2 = \frac{(n-1)s^2}{\sigma_0^2} \sim \chi^2(n-1)\)

(1) \(H_0 : \sigma^2 = \sigma_0^2 \leftrightarrow H_1 : \sigma^2 \ne \sigma_0^2\)

拒绝域 : \(\chi^2 \le \chi^2_{1-\alpha / 2}(n-1) \text{ 或 } \chi^2 \ge \chi^2_{\alpha / 2}(n-1)\)

(2) \(H_0 : \sigma^2 \le \sigma_0^2 \leftrightarrow H_1 : \sigma^2 > \sigma_0^2\)

拒绝域 : \(\chi^2 \ge \chi^2_{\alpha}(n-1)\)

(3) \(H_0 : \sigma^2 \ge \sigma_0^2 \leftrightarrow H_1 : \sigma^2 < \sigma_0^2\)

拒绝域 : \(\chi^2 \le \chi^2_{1-\alpha}(n-1)\)

P_ 值计算：

设 \(p = P_{\sigma_0^2} \{\frac{(n-1)S^2}{\sigma_0^2} \le \frac{(n-1)s^2}{\sigma_0^2} \} = P\{\chi^2(n-1) \le \chi^2_0 \}\)

其中，对样本观察值 \(x_1, x_2, \cdots, x_n\)，\(s^2 = \frac{1}{n-1}\sum\limits_{i=1}^n (x_i - \overline{x})^2\) , \(\chi_0^2 = \frac{(n-1)s^2}{\sigma_0^2}\)

对于双边检验

拒绝域 : \(\frac{(n-1)S^2}{\sigma_0^2} \ge \chi^2_{\alpha / 2}(n-1) \text{ 或 } \frac{(n-1)S^2}{\sigma_0^2} \le \chi^2_{1-\alpha / 2}(n-1)\)

P_ = 2min(p,1-p)

当 P_ \(\le \alpha\) , 拒绝原假设，当 P_ \(> \alpha\) , 接受原假设
类似的，对于左边检验

\(H_0 : \sigma^2 \ge \sigma_0^2 , H_1 : \sigma^2 < \sigma_0^2\)

拒绝域 : \(\frac{(n-1)S^2}{\sigma_0^2} \le \chi^2_{1-\alpha}(n-1)\)

P_ = p = \(\mathop{sup} P_{H_0} \{\frac{(n-1)S^2}{\sigma_0^2} \le \frac{(n-1)s^2}{\sigma_0^2} \} = P\{\chi^2(n-1) \le \chi^2_0 \}\)

当 P_ \(\le \alpha\) , 拒绝原假设，当 P_ \(> \alpha\) , 接受原假设
类似的，对于右边检验

\(H_0 : \sigma^2 \le \sigma_0^2 , H_1 : \sigma^2 > \sigma_0^2\)

拒绝域 : \(\frac{(n-1)S^2}{\sigma_0^2} \ge \chi^2_{\alpha}(n-1)\)

P_ = 1-p = \(\mathop{sup} P_{H_0} \{\frac{(n-1)S^2}{\sigma_0^2} \ge \frac{(n-1)s^2}{\sigma_0^2} \} = P\{\chi^2(n-1) \ge \chi^2_0 \}\)

当 P_ \(\le \alpha\) , 拒绝原假设，当 P_ \(> \alpha\) , 接受原假设

Question

某种元件的寿命 X（以小时记）服从正态分布 \(N(\mu, \sigma^2)\) ，其中 \(\mu\) 和 \(\sigma^2\) 均未知。现测得16只元件的寿命如下：

159 280 101 212 224 379 179 264

222 362 168 250 149 260 485 170

问是否有理由认为元件的平均寿命大于225（小时）？（取显著性水平为0.05）

Answer

按题意需检验

\(H_0 : \mu \le \mu_0 = 225 , H_1 : \mu > \mu_0 = 225\)

拒绝域为 : \(T = \frac{\overline{X} - \mu_0}{S/\sqrt{n}} > t_{\alpha}(n-1)\)

\(n = 16 , t_{0.05}(15) = 1.7531. \overline{x} = 241.5,s = 98.7259\)

计算得 : \(t_0 = \frac{\overline{x} - \mu_0}{s/\sqrt{n}} = 0.6685 < 1.7531\)

没有落在拒绝域内，故不能拒绝原假设，认为元件的平均寿命不大于225小时。

P_ = \(P_{H_0} \{T > t_0 \} = P\{t(15) > 0.6685 \} \approx 0.257 > 0.05\)

因此接受原假设，即认为元件的平均寿命不大于 225 小时。

判断结果与前面一致。

Question

要求某种元件的平均使用寿命不得低于 1000 小时，生产者从一批这种元件中随机抽取 25 件，测得其平均寿命为950小时，标准差为 100 小时。已知这批元件的寿命服从正态分布。试在显著性水平 0.05 下确定这批元件是否合格？

Answer

按题意需检验

\(H_0 : \mu \ge \mu_0 = 1000 , H_1 : \mu < \mu_0 = 1000\)

拒绝域为 : \(t = \frac{\overline{X} - \mu_0}{S/\sqrt{n}} < -t_{\alpha}(n-1)\)

\(n = 25 , t_{0.05}(24) = -1.7109, \overline{x} = 950 , s = 100\)

计算得 : \(t = \frac{\overline{X} - \mu_0}{S/\sqrt{n}} = -2.5 < -1.7109\)

t落在拒绝域内，故拒绝原假设，认为这批元件的平均寿命小于1000小时，不合格。

P_ = \(P_{H_0} \{T < t_0 \} = P\{t(24) < -2.5 \} \approx 0.000866 < 0.05\)

因此拒绝原假设，判断结果与前面一致。

Question

一个园艺科学家正在培养一个新品种的苹果这种苹果除了口感好和颜色鲜艳以外另一个重要特征是单个重量差异不大（对照品种的方差 \(\sigma^2 = 7\) ）.为了评估新苹果她随机挑选了 25 个测试重量 (单位：克) 其样本方差为 \(S^2 = 4.25\) 在 \(\alpha = 0.05\) 下检验新品种是否比对照品种方差小？

Answer

\(H_0 : \sigma^2 \ge 7 , H_1 : \sigma^2 < 7\)

查表得 \(\chi^2_{0.95}(24) = 13.848\)

计算得 \(\frac{(25-1)\times 4.25}{7} = 14.57 > 13.848\)

不拒绝原假设，即认为新品种的方差并不比对照组的小。

P_ = \(P\{\chi^2(24) \le 14.57 \} = 0.06729 > 0.05\) 作出同样判断

Question

为了试验两种不同谷物种子的优劣，选取了十块土质不同的土地，并将每块土地分为面积相同的两部分，分别种植这两种种子。设在每块土地的两部分人工管理等条件完全一样。下面给出各块土地上的产量。

土地	1	2	3	4	5	6	7	8	9	10
种子A(xi)	23	35	29	42	39	29	37	34	35	28
种子B(yi)	26	39	35	40	38	24	36	27	41	27
di=xi-yi	-3	-4	-6	2	1	5	1	7	-6	1

问：以这两种种子种植的谷物产量是否有显著的差异（取显著性水平为0.05）?

Answer

检验假设 \(H_0 : \mu_D = 0 , H_1 : \mu_D \ne 0\)

分别将 \(D_1,D_2,\cdots,D_n\) 的样本均值和样本方差记为 \(\overline{D},S^2_D\)

拒绝域：\(\frac{|\overline{D}|}{S_D/\sqrt{n}} \ge t_{\alpha/2}(n-1)\)

\(n = 10\) 查表得 \(t_{0.025}(9) = 2.2622 ,\\overline{d} = -0.2, s_d = 4.442\)

计算得 \(\frac{|\overline{d}|}{s_d/\sqrt{n}} = 0.142 < 2.2622\)

接受原假设 \(H_0\) 认为两种种子的产量没有显著差异。

两个正态总体参数的假设检验¶

两个正态总体 \(N(\mu_1,\sigma_1^2),N(\mu_2,\sigma_2^2)\) 的检验

\(X_1,X_2,\cdots,X_{n_1}\) 来自 \(N(\mu_1,\sigma_1^2)\) ，\(Y_1,Y_2,\cdots,Y_{n_2}\) 来自 \(N(\mu_2,\sigma_2^2)\)

\(\overline{X} ,\overline{Y},S_1^2,S_2^2\) 分别是 \(X_1,X_2,\cdots,X_{n_1}\) ，\(Y_1,Y_2,\cdots,Y_{n_2}\) 的样本均值和样本方差.显著性水平为 \(\alpha\)

结论¶

1 \(\sigma_1^2,\sigma_2^2\) 已知检验 \(\mu_1-\mu_2\) Z 检验法）¶

当 \(\mu_1 - \mu_2 = \delta\) 时， \(Z = \frac{(\overline{X}-\overline{Y})-\delta}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}} \sim N(0,1)\)

(1) \(H_0 : \mu_1 - \mu_2 = \delta\)

拒绝域 : \(|Z| \ge z_{\alpha/2}\)

(2) \(H_0 : \mu_1 - \mu_2 \le \delta\)

拒绝域 : \(Z \ge z_{\alpha}\)

(3) \(H_0 : \mu_1 - \mu_2 \ge \delta\)

拒绝域 : \(Z \le -z_{\alpha}\)

2 \(\sigma_1^2 = \sigma_2^2\) 未知检验 \(\mu_1-\mu_2\)（t 检验法）¶

当 \(\mu_1 - \mu_2 = \delta\) 时， \(t = \frac{(\overline{X}-\overline{Y})-\delta}{\sqrt{\frac{S_w^2}{n_1}+\frac{S_w^2}{n_2}}} \sim t(n_1+n_2-2)\)

(1) \(H_0 : \mu_1 - \mu_2 = \delta\)

拒绝域 : \(|t| \ge t_{\alpha/2}(n_1+n_2-2)\)

(2) \(H_0 : \mu_1 - \mu_2 \le \delta\)

拒绝域 : \(t \ge t_{\alpha}(n_1+n_2-2)\)

(3) \(H_0 : \mu_1 - \mu_2 \ge \delta\)

拒绝域 : \(t \le -t_{\alpha}(n_1+n_2-2)\)

3 \(\mu_1,\mu_2\) 未知检验 \(\frac{\sigma_1^2}{\sigma_2^2}\)（F 检验法）¶

当 \(\sigma_1^2 = \sigma_2^2\) 时， \(F = \frac{S_1^2}{S_2^2} \sim F(n_1-1,n_2-1)\)

(1) \(H_0 : \sigma_1^2 = \sigma_2^2 \leftrightarrow H_1 : \sigma_1^2 \neq \sigma_2^2\)

拒绝域 : \(F \le F_{1 - \alpha/2}(n_1-1,n_2-1)\) 或 \(F \ge F_{\alpha/2}(n_1-1,n_2-1)\)

(2) \(H_0 : \sigma_1^2 \le \sigma_2^2 \leftrightarrow H_1 : \sigma_1^2 > \sigma_2^2\)

拒绝域 : \(F \ge F_{\alpha}(n_1-1,n_2-1)\)

(3) \(H_0 : \sigma_1^2 \ge \sigma_2^2 \leftrightarrow H_1 : \sigma_1^2 < \sigma_2^2\)

拒绝域 : \(F \le F_{1 - \alpha}(n_1-1,n_2-1)\)

Question

某厂使用两种不同的原料A,B生产同一类型产品。各在一周的产品中取样分析。取用原料A生产的样品 220 件，测得平均重量为 2.46 （公斤），样本标准差 s=0.57（公斤）。取用原料 B 生产的样品 205 件，测得平均重量为 2.55 （公斤），样本标准差为 0.48 （公斤）。设两样本独立，来自两个方差相同的独立正态总体。问在水平 0.05 下能否认为用原料 B 的产品平均重量较用原料 A 的为大。

Answer

检验假设 \(H_0 : \mu_1 \ge \mu_2 , H_1 : \mu_1 < \mu_2\)

拒绝域为 : \(\frac{\overline{X} - \overline{Y}}{\sqrt{\frac{s_w^2}{n_1} + \frac{s_w^2}{n_2}}} < -t_{\alpha}(n_1+n_2-2)\)

\(n_1 = 220, n_2 = 205, \overline{x} = 2.46, \overline{y} = 2.55, s_2 = 0.48\)

\(t_{0.05}(423) \approx z_{0.05} = 1.645,s_w = 0.535,\sqrt{\frac{1}{n_1} + \frac{1}{n_2}} = 0.097\)

计算得 : \(\frac{\overline{X} - \overline{Y}}{\sqrt{\frac{s_w^2}{n_1} + \frac{s_w^2}{n_2}}} = -1.733 < -1.645\)

从而拒绝原假设.

Question

两台机床生产同一个型号的滚珠，从甲机床生产的滚珠中抽取 8 个，从乙机床生产的滚珠中抽取 9 个，测得这些滚珠的直径(毫米)如下:

甲机床 15.0 14.8 15.2 15.4 14.9 15.1 15.2 14.8

乙机床 15.2 15.0 14.8 15.1 14.6 14.8 15.1 14.5 15.0

设两机床生产的滚珠直径分别为 \(X\) , \(Y\) ,且 \(X \sim N(\mu_1,\sigma_1^2),Y \sim N(\mu_2,\sigma_2^2)\)

(1) 检验假设 \(H_0 : \sigma_1^2 = \sigma_2^2 , H_1 : \sigma_1^2 \ne \sigma_2^2 (\alpha = 0.1)\)

(2) 检验假设 \(H_0 : \mu_1 \le \mu_2 , H_1 : \mu_1 > \mu_2 (\alpha = 0.1)\)

(3) 检验假设 \(H_0 : \mu_1 = \mu_2 , H_1 : \mu_1 \ne \mu_2 (\alpha = 0.1)\)

Answer

当 \(\mu_1,\mu_2\) 未知时,检验 \(H_0 : \sigma_1^2 = \sigma_2^2 , H_1 : \sigma_1^2 \ne \sigma_2^2\) 的拒绝域为 : \(\frac{S_1^2}{S_2^2} \le F_{1-\alpha/2}(n_1-1,n_2-1)\) 或 \(\frac{S_1^2}{S_2^2} \ge F_{\alpha/2}(n_1-1,n_2-1)\)

查表得 \(F_{0.05}(7,8) = 3.50,F_{0.95}(7,8) = \frac{1}{F_{0.05}(8,7)} = 0.268\)

\(n_1 = 8, n_2 = 9, \overline{x} = 15.05, \overline{y} = 14.9,S_1^2 = 0.0457, S_2^2 = 0.0575\)

计算得 : \(0.268 < \frac{S_1^2}{S_2^2} = 0.795 < 3.50\)

不拒绝原假设，故认为方差没有显著差异。

令 \(p = P(F(7,8) \le 0.795) = 0.3875\)

P_ = 2min(p,1-p) = 0.775 > 0.05 接受原假设

\(H_0 : \mu_1 \le \mu_2 , H_1 : \mu_1 > \mu_2\)的拒绝域为 : \(\frac{\overline{X}-\overline{Y}}{\sqrt{\frac{S_w^2}{n_1}+\frac{S_w^2}{n_2}}} > t_{\alpha}(n_1+n_2-2)\)

\(t_{0.1}(15) = 1.3406,S_w = 0.228, \sqrt{\frac{1}{n_1}+\frac{1}{n_2}} = 0.486\)

计算得 : \(\frac{\overline{X}-\overline{Y}}{\sqrt{\frac{S_w^2}{n_1}+\frac{S_w^2}{n_2}}} = 1.354 > 1.3406\) 从而拒绝原假设

P_ = \(P\{t(15) \ge 1.354\} = 0.098 < 0.1\)

\(H_0 : \mu_1 = \mu_2 , H_1 : \mu_1 \ne \mu_2\)的拒绝域为 : \(|\frac{\overline{X}-\overline{Y}}{\sqrt{\frac{S_w^2}{n_1}+\frac{S_w^2}{n_2}}}| \ge t_{\alpha/2}(n_1+n_2-2)\)

计算得 : \(|\frac{\overline{X}-\overline{Y}}{\sqrt{\frac{S_w^2}{n_1}+\frac{S_w^2}{n_2}}}| = 1.354 < t_{0.05}(15) = 1.7531\) 从而接受原假设

P_ = \(2P\{t(15) \ge 1.354\} = 0.196 > 0.1\)

假设检验与区间估计¶

作区间估计时，对参数没有先验的认识，但确定参数是固定不变的，只是未知，所以区间估计的目的是：根据样本对参数进行估计；

作假设检验时，对参数有一个先验的认识（例如 \(\mu=\mu_0\) ），但由于某种情形的出现（如工艺改良等），猜测真实参数值可能发生了变化，所以假设检验的目的是：根据样本确认参数是否真的发生了改变。

但置信区间与假设检验的拒绝域之间又有密切的关系。

考虑单个正态总体方差已知时有关均值的统计推断.

设 \(X_1,X_2,\cdots,X_n\) 是来自总体 \(N(\mu,\sigma^2)\) 的样本，\(\sigma^2\) 已知，\(\mu\) 的置信水平为 \(1-\alpha\) 的置信区间为：

\[\overline{X} - \frac{\sigma}{\sqrt{n}}z_{\alpha/2} < \mu < \overline{X} + \frac{\sigma}{\sqrt{n}}z_{\alpha/2}\]

假设检验问题 \(H_0 : \mu = \mu_0 , H_1 : \mu \ne \mu_0\) 显著性水平为 \(\alpha\) 的检验拒绝域为： \(W = \{\frac{|\overline{X}-\mu_0|}{\sigma/\sqrt{n}} \ge z_{\alpha/2}\}\)

接受域为 : \(\overline{W} = \{\frac{|\overline{X}-\mu_0|}{\sigma/\sqrt{n}} < z_{\alpha/2}\} = \{\overline{X} - \frac{\sigma}{\sqrt{n}}z_{\alpha/2} < \mu_0 < \overline{X} + \frac{\sigma}{\sqrt{n}}z_{\alpha/2}\}\)

Note

将接受域中的 \(\mu_0\) 改写成 \(\mu\) 时，所得结果正好是参数 \(\mu\) 的置信水平为 \(1-\alpha\) 的置信区间。

一般地，若检验假设问题 \(H_0 : \theta = \theta_0 , H_1 : \theta \ne \theta_0\) 的显著水平为 \(\alpha\) 的接受域能等价地写成 \(\hat{\theta_L} < \theta_0 < \hat{\theta_U}\) 那么 \((\hat{\theta_L},\hat{\theta_U})\) 就是参数 \(\theta\) 的置信水平为 \(1-\alpha\) 的置信区间。

反之，若 \((\hat{\theta_L},\hat{\theta_U})\) 是 \(\theta\) 的置信水平为 \(1-\alpha\) 的置信区间，则当 \(\theta_0 \in (\hat{\theta_L},\hat{\theta_U})\) 时，接受双边检验 \(H_0 : \theta = \theta_0 , H_1 : \theta \ne \theta_0\) 中的原假设 \(H_0\) ，且检验的拒绝域为 \(\theta_0 \le \hat{\theta_L}\) 或 \(\theta_0 \ge \hat{\theta_U}\) 。

单侧置信限与单边假设检验的关系¶

(1) 若 \(\hat{\theta_L}\) 是 \(\theta\) 的置信水平为 \(1 - \alpha\) 的单侧置信下限，则当 \(\theta_0 \ge \hat{\theta_L}\) 时，接受右边检验 \(H_0 : \theta \le \theta_0 , H_1 : \theta > \theta_0\) 中的原假设 \(H_0\) ,反之，拒绝原假设 \(H_0\) 。

(2) 若 \(\hat{\theta_U}\) 是 \(\theta\) 的置信水平为 \(1 - \alpha\) 的单侧置信上限，则当 \(\theta_0 \le \hat{\theta_U}\) 时，接受左边检验 \(H_0 : \theta \ge \theta_0 , H_1 : \theta < \theta_0\) 中的原假设 \(H_0\) ,反之，拒绝原假设 \(H_0\) 。

正态总体均值、方差的置信区间与假设检验

拟合优度检验¶

前面介绍的各种检验都是在总体服从正态分布前提下，对参数进行假设检验的。实际中可能遇到这样的情形，总体服从何种理论分布并不知道，要求我们直接对总体分布提出一个假设。

基本原理和步骤¶

在 \(H_0\) 下，将总体 X 取值的全体分成 k 个两两不相交的子集 \(A_1,\dots,A_k\)
以 \(n_i(i=1,\dots,k)\) 记样本观察值 \(x_1,\dots,x_n\) 中落在 \(A_i\) 的个数(实际频数).
当 \(H_0\) 为真且 \(F_0(x)\) 完全已知时，计算事件 \(A_i\) 发生的概率 \(P_i = P_{F_0}(A_i),i=1,\dots,k\)

当 \(F_0(x)\) 含有 \(r\) 个未知参数时，先利用极大似然法估计 \(r\) 个未知参数，然后求得 \(p_i\) 的估计 \(\hat{p_i}\) ，此时称 \(np_i(\text{或}n\hat{p_i})\) 为理论频数.

统计量

\[\chi^2 = \sum\limits_{i=1}^k\frac{(n_i - np_i)^2}{np_i} = \sum\limits_{i=1}^k\frac{n_i^2}{np_i}-n\]

\[(\text{或} \chi^2 = \sum\limits_{i=1}^k\frac{(n_i-n\hat{p_i})^2}{n\hat{p_i}} = \sum\limits_{i=1}^k\frac{n_i^2}{n\hat{p_i}}-n)\]

反映了实际频数与理论频数的综合偏差，当 \(H_0\) 成立时， \(\chi^2\) 的取值偏小，因此检验的拒绝域形式为 : \(\chi^2 \ge c\)

定理¶

若 \(n\) 充分大，则当 \(H_0\) 为真时，统计量 \(\chi^2\) 近似服从 \(\chi^2(k-r-1)\) 分布，其中 \(k\) 为分类数， \(r\) 为 \(F_0(x)\) 中含有的未知参数个数.

即在显著水平 \(\alpha\) 下拒绝域为

\[\chi^2 = \sum\limits_{i=1}^k\frac{n_i^2}{np_i} - n \ge \chi_{\alpha}^2(k-1) \text{没有参数需要估计}\]

\[\chi^2 = \sum\limits_{i=1}^k\frac{n_i^2}{n\hat{p_i}} - n \ge \chi_{\alpha}^2(k-r-1) \text{有r个参数要估计}\]

注： \(\chi^2\) 拟合检验使用时必须注意 \(n\) 要足够大， \(np_i(\text{或} n\hat{p_i})\) 不能太小。根据实践，要求 \(n \ge 50\) ， \(np_i(\text{或} n\hat{p_i}) \ge 5\) ，否则应适当合并相邻的类以满足要求.

Question

一淘宝店主搜集了一年中每天的订单数 \(X\) ，除去春节期间及双十一前后外，按 330 天计，具体数据如下:

订单数 X	0	1	2	3	4	5	6	7
天数	3	6	21	46	48	61	52	42

订单数 X	8	9	10	11	12	13	16
天数	27	11	6	4	1	1	1

通常认为每天的订单数服从泊松分布，以上的数据是否支持这个结论？

Answer

\(H_0: X \sim P(\lambda)\) \(\lambda\) 为未知参数，总订单数为 1749

所以平均每天订单数 \(\hat{\lambda} = \overline{X} = \frac{1749}{330} = 5.3\)

订单数大于 10 的进行合并，对订单数为 \(i(i=0,1,\dots,10,11+)\) 的概率值进行估计：

\[\hat{p_i} = \frac{\hat{\lambda}^i e^{-\hat{\lambda}}}{i!},i=0,1,\dots,10\]

\[\hat{p_{11}} = \sum\limits_{j=11}^\infty \frac{\hat{\lambda}^j e^{-\hat{\lambda}}}{j!} = 1 - \sum\limits_{i=0}^{10} \hat{p_i}\]

理论频数 : \(n_i = np_i,i = 0,1,\dots,10,11,n\hat{p_0} = 1.65 < 5\)

将 \(x = 0\) 与 \(x = 1\) 合并，最后共有 11 类，具体结果为

订单数 X	0	1	2	3	4	5
概率估计	0.005	0.026	0.070	0.124	0.164	0.174
理论频数	1.65	8.73	23.13	40.87	54.16	57.41

订单数 X	6	7	8	9	10	\(\ge\) 11
概率估计	0.154	0.116	0.077	0.045	0.024	0.021
理论频数	50.71	38.39	25.44	14.98	7.94	6.60

检验统计量的值为 \(\chi^2 = \sum\limits_{i=1}^{k} \frac{(n_i)^2}{n\hat{p_i}} -n = \sum\limits_{i=1}^{11} \frac{(n_i)^2}{n\hat{p_i}} -330 = 3.97\)

即在显著性水平 \(\alpha = 0.05\) 下临界值 \(chi_{\alpha}^2(k-r-1) = \chi_{0.05}^2(11-1-1) = 16.92\)

于是， \(3.92 < 16.92\) ，不拒绝原假设。

P_ = \(P(\chi^2(9) \ge 3.97) = 0.913\)

Chapter 8 假设检验¶

假设¶

检验统计量和拒绝域¶

两类错误¶

Neyman-Pearson 原则¶

P_ 值与统计显著性¶

处理假设检验问题的基本步骤¶

单个正态总体参数的假设检验¶

结论¶

1 \(\sigma^2\) 已知检验 \(\mu\) (Z 检验法)¶

2 \(\sigma^2\) 未知检验 \(\mu\) (t 检验法)¶

3 \(\mu\) 未知检验 \(\sigma^2\) (\(\chi^2\) 检验法)¶

两个正态总体参数的假设检验¶

结论¶

1 \(\sigma_1^2,\sigma_2^2\) 已知检验 \(\mu_1-\mu_2\) Z 检验法）¶

2 \(\sigma_1^2 = \sigma_2^2\) 未知检验 \(\mu_1-\mu_2\)（t 检验法）¶

3 \(\mu_1,\mu_2\) 未知检验 \(\frac{\sigma_1^2}{\sigma_2^2}\)（F 检验法）¶

假设检验与区间估计¶

单侧置信限与单边假设检验的关系¶

拟合优度检验¶

基本原理和步骤¶

定理¶

评论