跳转至

Chapter 1 概率论的基本概念

约 2838 个字 20 张图片 预计阅读时间 14 分钟

样本空间与随机事件

随机试验的特点

  1. 可以在相同条件下重复进行
  2. 事先知道可能出现的结果
  3. 进行试验前并不知道哪个试验结果会发生

样本空间

定义:随机试验 E 的所有结果构成的集合称为 E 的样本空间,记为 S,称 S 中的元素 e 为样本点。


随机事件

称 S 的子集 A 为 E 的随机事件 A,简称事件 A。当且仅当 A 所包含的一个样本点发生称事件 A 发生。

随机事件有以下特征:

  1. 事件 A 是相应的样本空间 S 的一个子集,其关系可用维恩(Venn)图来表示
  2. 事件 A 发生当且仅当 A 中的某一个样本点出现
  3. 事件 A 的表示可用集合,也可用语言来表示

基本事件:由一个样本点组成的单点集。

必然事件:每次试验 S 总是发生。

不可能事件:记Φ为空集,不包含任何样本点,则每次试验Φ都不发生。


事件的相互关系

img

包含 | 和事件 | 积事件 | 逆事件 | 差事件


事件的运算

\[A \cup B = \{x | x \in A 或 x \in B\}\]
\[A \cap B = A \cdot B = AB = \{ x| x \in A 且 x \in B\}\]
  • \(\mathop{\cup}\limits_{i=1}^{n} A_i: A_1,A_2,\dots,A_n\)至少有一个发生

  • \(\mathop{\cap}\limits_{i=1}^{n}A_i:A_1,A_2,\dots,A_n\)同时发生

\(AB = \Phi\)时,称事件A与B是互不相容的,或互斥的。

A的逆事件记作\(\overline{A}\),\(\begin{cases} A\cup \overline{A} &= S \\ A \overline{A} &= \emptyset \end{cases}\),若\(\begin{cases} A\cup B &= S \\ A B &= \emptyset \end{cases}\),称AB互逆。

\[A \overline{B} = A - B = \{ x | x \in A 且 x \notin B\}\]
  • 交换律:A∪B = B∪A, A ∩ B = B ∩ A;
  • 结合律:A∪(B∪C) = (A∪B)∪C, A(BC) = (AB)C;
  • 分配律:A(B∪C) = (AB)∪(AC), (AB)∪C = (A∪C)(B∪C);
  • 对偶律 / 德摩根定律(De Morgan's law):
\[\overline{\mathop{\cup}\limits_{j=1}^n A_j} = \mathop{\cap}\limits_{j=1}^n \overline{A_j}\]
\[\overline{\mathop{\cap}\limits_{j=1}^nA_{j}} = \mathop{\cup}\limits_{j=1}^n\overline{A_j}\]

频率与概率

频率

定义:

\[f_n(A) = \frac{n_A}{n};\]

称为A在这n次试验中发生的频率

其中\(n_A\)​——A发生的次数(频数);n——总试验次数。

频率的性质:

  1. \[ 0 \le f_n(A) \le 1\]
  2. \[f_n(S) = 1\]
  3. \(A_1,A_2,\dots,A_n\)两两互不相容,则\(f_n(\mathop{\cup}\limits_{i=1}^k A_i) = \sum\limits_{i=1}^k f_n(A_i)\)
  4. \(f_n(A)\)随n的增大渐趋稳定,记稳定值为p

概率

若样本空间 S中的任一事件 A,定义概率 P(A) 满足以下三条公理:

  1. 非负性 P(A)≥0;
  2. 规范性 / 正则性 P(S)=1;
  3. 可列可加性:对于 S 中不相容的事件 \(A_i\),有\(P(\mathop{\cup}\limits_{i=1}^{\infty} A_i) = \sum\limits_{i=1}^{\infty} P(A_i)\)

由此得到如下几条概率的性质

  1. 对于有限个两两不相容的事件的和事件,有 \(P(\mathop{\cup}\limits_{i=1}^{n} A_i) = \sum\limits_{i=1}^{n} P(A_i)\)
  2. \(P(A)=1−P(\overline{A})\); 特别的,可以得到 \(P(\Phi) = 0\);
  3. 当 A⊃B 时,P(A−B)=P(A)−P(B) 且 P(A) \(\ge\) P(B);
  4. 概率的加法公式:P(A∪B) = P(A)+P(B)−P(AB) ; 推广即容斥原理;
  5. 加法公式的推论:P(A∪B) \(\le\) P(A)+P(B);

独立与互斥

要注意,独立和互斥是两种不同的性质,它们并不直接相关。

独立是指 \(P(AB) = P(A) \times P(B)\)

而互斥是指 \(A \cap B = \varnothing\) , 或者说 \(P(AB) = 0\) , \(P(A + B) = P(A) + P(B)\)

Question

甲乙丙3人去参加某个集会的概率均为0.4,其中至少有两人参加的概率为0.3,都参加的概率为0.05,求3人中至少有一人参加的概率。

Answer

img img img


等可能概型

如果随机事件满足:

  1. S 中样本点数有限;
  2. \(∀i,j∈{1,2,...,n},P(e_i)=P(e_j)\),即等可能;

则该试验问题为等可能概型古典概型) 有如下性质:若总事件个数为 N,A 为 n 个基本事件的和事件,则 \(P(A) = \frac{n}{N}\)

Question

(配对问题⭐(更一般地)
一个小班有n个同学,编号为1, 2, …, n 号,中秋节前每人准备一件礼物,相应编号为1,2, … ,n。将所有礼物集中放在一起,然后每个同学随机取一件,求没有人拿到自己礼物的概率。

Answer

img img img


条件概率

定义

\[P(B|A) = \frac{P(AB)}{P(A)}, P(A) \ne 0\]

性质

  1. \(P(\cdot|A)\) 是概率
  2. 非负性:\(P(B|A) \ge 0\)
  3. 规范性:\(P(S|A) = 1\)
  4. 可列可加性: \(A_1,A_2,\dots,A_k,\dots\) 两两互斥 \(\rightarrow P(\mathop{\cup}\limits_{i=1}^{\infty}A_i|A) = \sum\limits_{i=1}^{\infty}P(A_i|A)\)
  5. \(P(\cdot | A)\) 具有概率的所有性质
Question

天气很好,小王想带家人去千岛湖玩,又想到天目山玩.他有一枚硬币,但不知道这枚硬币出现正面的概率.利用这枚硬币设计一个试验帮他做决定,使得最后他去千岛湖和去天目山的概率相等.

Answer

img

Question

某单位想从8名业务员中等概率地选取一名去外地出差一年.现有一枚均匀硬币.利用这枚硬币设计一个试验帮这个单位做决定.

Answer

img


乘法公式

\(P(AB) = P(A) \cdot P(B | A) = P(B) \cdot P(A| B)\)

\(P(ABC) = P(A) \cdot P(B | A) \cdot P(C | AB)\)

\[P(A_1A_2\dots A_n ) = P(A_1)P(A_2 | A_1)P(A_3 |A_1A_2 ) \dots P(A_n | A_1 \dots A_{n-1})\]
Question

一盒中有5个红球,4个白球,采用不放回抽样,每次取一个,取4次。

(1)已知前两次中至少有一次取到红球,求前两次中恰有一次取到红球的概率;

(2)已知第4次取到红球,求第1,2次也取到红球的概率。

Answer

img


全概率公式&Bayes公式

划分 : 称 \(B_1,B_2,\dots,B_n\) 是样本空间 \(S\) 的一个划分,若

  1. 不漏 \(\mathop{\cup}\limits_{i=1}^{n}B_i = S\)
  2. 不重 \(B_iB_j = \varnothing, i \ne j\)

\(B_1,B_2,\dots,B_n\)\(S\) 的一个划分且 \(P(B_i) > 0, i = 1,2,\dots,n\) ,则有全概率公式

\[P(A)=\sum\limits_{j=1}^nP(B_j) \cdot P(A|B_j)\]

\(P(A) > 0\)Bayes 公式

\[P(B_i|A) = \frac{P(B_i)P(A|B_i)}{\sum\limits_{j=1}^{n}P(B_j)P(A|B_j)}\]

此时,称 \(P(B_i)\) 为先验概率,\(P(B_i|A)\) 称为后验概率。

Question

根据以往的临床记录,某种诊断癌症的试验具有5%的假阳性及5%的假阴性:即设A={试验反应是阳性},C={被诊断患有癌症}则有:\(P(A |C) = 5%, P(A | C ) = 5 %\) .已知某一群体\(P(C)=0.005\),问这种方法能否用于普查?

Answer

img img img


独立性

设 A,B 为两个随机事件,若有 \(P(AB)=P(A) \times P(B)\),则 A,B 相互独立(independent)

\[\mathop{\Leftrightarrow}\limits^{P(A) > 0} P(B|A) = P(B)\]
\[\mathop{\Leftrightarrow}\limits^{P(\overline{A}) > 0} P(B|\overline{A}) = P(B)\]

直观含义:A发生与否都不会改变B发生的概率

当出现两个以上的随机事件时,如三个随机事件 A,B,C 当:

\[P(AB)=P(A)*P(B),P(AC)=P(A)*P(C),P(BC)=P(B)*P(C)\]

都成立,则称事件 A,B,C 两两独立

如果同时还满足:\(P(ABC)=P(A)P(B)P(C)\) 则称事件 A,B,C相互独立

  • 注意: \(\text{相互独立} \rightarrow \text{两两独立}\) ,但是, \(\text{两两独立} \nrightarrow \text{相互独立}\)

更普遍的:

定义 \(\{A_i\}\) 相互独立 当且仅当

\[\forall i_j, P(\prod\limits_{j=1}^k A_{i_j}) = \prod\limits_{j=1}^k P(A_{i_j}),2 \le k \le n\]

独立试验:指任一次子试验出现的结果都不影响其他各子试验出现的结果;例如观察十期彩票的开奖结果,是独立试验。

重复试验:如果各子试验是在相同条件下进行的。

Question

一袋中有编号为1,2,3,4共4个球,采用有放回抽样,每次取一球,共取2次,记录号码之和,这样独立重复进行试验,求“和等于3”出现在“和等于5”之前的概率。

Answer

img img img

Question

设某地每天发生雾霾的概率为0.2.在雾霾天气,该地各居民独立地以概率0.2戴口罩,在没有雾霾的时候各居民独立地以概率0.01戴口罩.某天

(1)在该地任选一居民,求他戴口罩的概率;

(2)若选n人,求他们都戴口罩的概率;

(3)若选n人发现他们都戴口罩,求这一天发生雾霾的概率.(这里n为正整数.)

Answer

img img img img


球盒问题整理

以下问题的前提为 \(n\ge m\)

  1. \(n\) 个相同的球放入 \(m\) 个相同的盒子,且盒子不为空。也即将 \(n\) 分解为 \(m\) 个数的和的不同数目。

  2. \(n\) 个相同的球放入 \(m\) 个相同的盒子,且盒子可以为空。也即将 \(n\) 分解为 \(m,m-1,\dots,1\) 个数的和所有种数之和。

  3. \(n\) 个相同的球放入 \(m\) 个不同的盒子,且盒子不为空。也即 \(C_{n-1}^{m-1}\)

    • 隔板法,也即 \(n-1\) 个空放入 \(m-1\) 个隔板。
  4. \(n\) 个相同的球放入 \(m\) 个不同的盒子,且盒子可以为空。也即 \(C_{m+n-1}^{m-1}\)

    • 也是隔板法,但需要稍微变形。问题等价于 \(n+m\) 个相同的球放入 \(m\) 个不同的盒子,且盒子不为空。

$$ n_1 + n_2 + \dots + n_m = n$$

$$ n_1 , n_2 , \dots, n_m \ge 0$$

$$ (n_1+1)+(n_2+1)+\dots+(n_m+1)=m+n$$

此时每一项 \((n_1+1),(n_2+1),\dots,(n_m+1) \ge 1\) ,即可以使用隔板法。(这种分析方法还是比较实用的,建议掌握)

  1. \(n\) 个不同的球放入 \(m\) 个相同的盒子,且盒子不为空。

    1. 先列出分成不同堆的情况。也即将 \(n\) 分解为 \(m\) 个数的分类情况。此时再用组合数计算。注意,有几组均分就需要各除以几的阶乘。例如8个球放进3个盒子时一种情况为 \(1-1-6\) , 此时的情况数目为 \(\frac{C_8^1 \cdot C_7^1 \cdot C_6^6}{A_2^2}\)

    2. 这是典型的第二类斯特灵数,运用动态规划的思想。

      \(f[n][m]\) 为标准答案。

      \(f[n][m] =f[n-1][m-1] + m \times f[n-1][m]\)

      也就是考虑第 \(n\) 个数,第 \(n\) 个数单独占据一个盒子或第 \(n\) 个数和之前的数共占一个盒子。

  2. \(n\) 个不同的球放入 \(m\) 个相同的盒子,且盒子可以为空。

    1. 先列出分成不同堆的情况。也即将 \(n\) 分解为 \(m,m-1,\dots,1\) 个数的和所有种数之和。此时同样需要注意有几组均分就需要各除以几的阶乘。

    2. 同样运用动态规划的思想。

      \(g[n][m]\) 为标准答案。

      \(g[n][m] = \sum\limits_{i=0}^m g[n][i]\)

      也即考虑使用了多少个盒子。

  3. \(n\) 个不同的球放入 \(m\) 个不同的盒子,且盒子不为空。也即 \(n\) 个不同的球放入 \(m\) 个相同的盒子,且盒子不为空的情况 \(\times m!\)

  4. \(n\) 个不同的球放入 \(m\) 个不同的盒子,且盒子可以为空。也即 \(m^n\)


评论