Chapter 1 概率论的基本概念¶
约 2838 个字 20 张图片 预计阅读时间 14 分钟
样本空间与随机事件¶
随机试验的特点¶
- 可以在相同条件下重复进行
- 事先知道可能出现的结果
- 进行试验前并不知道哪个试验结果会发生
样本空间¶
定义:随机试验 E 的所有结果构成的集合称为 E 的样本空间,记为 S,称 S 中的元素 e 为样本点。
随机事件¶
称 S 的子集 A 为 E 的随机事件 A,简称事件 A。当且仅当 A 所包含的一个样本点发生称事件 A 发生。
随机事件有以下特征:
- 事件 A 是相应的样本空间 S 的一个子集,其关系可用维恩(Venn)图来表示
- 事件 A 发生当且仅当 A 中的某一个样本点出现
- 事件 A 的表示可用集合,也可用语言来表示
基本事件:由一个样本点组成的单点集。
必然事件:每次试验 S 总是发生。
不可能事件:记Φ为空集,不包含任何样本点,则每次试验Φ都不发生。
事件的相互关系¶
包含 | 和事件 | 积事件 | 逆事件 | 差事件
事件的运算¶
-
\(\mathop{\cup}\limits_{i=1}^{n} A_i: A_1,A_2,\dots,A_n\)至少有一个发生
-
\(\mathop{\cap}\limits_{i=1}^{n}A_i:A_1,A_2,\dots,A_n\)同时发生
当\(AB = \Phi\)时,称事件A与B是互不相容的,或互斥的。
A的逆事件记作\(\overline{A}\),\(\begin{cases} A\cup \overline{A} &= S \\ A \overline{A} &= \emptyset \end{cases}\),若\(\begin{cases} A\cup B &= S \\ A B &= \emptyset \end{cases}\),称AB互逆。
- 交换律:A∪B = B∪A, A ∩ B = B ∩ A;
- 结合律:A∪(B∪C) = (A∪B)∪C, A(BC) = (AB)C;
- 分配律:A(B∪C) = (AB)∪(AC), (AB)∪C = (A∪C)(B∪C);
- 对偶律 / 德摩根定律(De Morgan's law):
频率与概率¶
频率¶
定义:
称为A在这n次试验中发生的频率。
其中\(n_A\)——A发生的次数(频数);n——总试验次数。
频率的性质:
-
\[ 0 \le f_n(A) \le 1\]
-
\[f_n(S) = 1\]
- 若\(A_1,A_2,\dots,A_n\)两两互不相容,则\(f_n(\mathop{\cup}\limits_{i=1}^k A_i) = \sum\limits_{i=1}^k f_n(A_i)\)
- \(f_n(A)\)随n的增大渐趋稳定,记稳定值为p
概率¶
若样本空间 S中的任一事件 A,定义概率 P(A) 满足以下三条公理:
- 非负性 P(A)≥0;
- 规范性 / 正则性 P(S)=1;
- 可列可加性:对于 S 中不相容的事件 \(A_i\),有\(P(\mathop{\cup}\limits_{i=1}^{\infty} A_i) = \sum\limits_{i=1}^{\infty} P(A_i)\)
由此得到如下几条概率的性质:
- 对于有限个两两不相容的事件的和事件,有 \(P(\mathop{\cup}\limits_{i=1}^{n} A_i) = \sum\limits_{i=1}^{n} P(A_i)\)
- \(P(A)=1−P(\overline{A})\); 特别的,可以得到 \(P(\Phi) = 0\);
- 当 A⊃B 时,P(A−B)=P(A)−P(B) 且 P(A) \(\ge\) P(B);
- 概率的加法公式:P(A∪B) = P(A)+P(B)−P(AB) ; 推广即容斥原理;
- 加法公式的推论:P(A∪B) \(\le\) P(A)+P(B);
独立与互斥
要注意,独立和互斥是两种不同的性质,它们并不直接相关。
独立是指 \(P(AB) = P(A) \times P(B)\)
而互斥是指 \(A \cap B = \varnothing\) , 或者说 \(P(AB) = 0\) , \(P(A + B) = P(A) + P(B)\)
Question
甲乙丙3人去参加某个集会的概率均为0.4,其中至少有两人参加的概率为0.3,都参加的概率为0.05,求3人中至少有一人参加的概率。
等可能概型¶
如果随机事件满足:
- S 中样本点数有限;
- \(∀i,j∈{1,2,...,n},P(e_i)=P(e_j)\),即等可能;
则该试验问题为等可能概型(古典概型) 有如下性质:若总事件个数为 N,A 为 n 个基本事件的和事件,则 \(P(A) = \frac{n}{N}\)
Question
条件概率¶
定义¶
性质¶
- \(P(\cdot|A)\) 是概率
- 非负性:\(P(B|A) \ge 0\)
- 规范性:\(P(S|A) = 1\)
- 可列可加性: \(A_1,A_2,\dots,A_k,\dots\) 两两互斥 \(\rightarrow P(\mathop{\cup}\limits_{i=1}^{\infty}A_i|A) = \sum\limits_{i=1}^{\infty}P(A_i|A)\)
- \(P(\cdot | A)\) 具有概率的所有性质
Question
天气很好,小王想带家人去千岛湖玩,又想到天目山玩.他有一枚硬币,但不知道这枚硬币出现正面的概率.利用这枚硬币设计一个试验帮他做决定,使得最后他去千岛湖和去天目山的概率相等.
Question
某单位想从8名业务员中等概率地选取一名去外地出差一年.现有一枚均匀硬币.利用这枚硬币设计一个试验帮这个单位做决定.
乘法公式¶
\(P(AB) = P(A) \cdot P(B | A) = P(B) \cdot P(A| B)\)
\(P(ABC) = P(A) \cdot P(B | A) \cdot P(C | AB)\)
Question
一盒中有5个红球,4个白球,采用不放回抽样,每次取一个,取4次。
(1)已知前两次中至少有一次取到红球,求前两次中恰有一次取到红球的概率;
(2)已知第4次取到红球,求第1,2次也取到红球的概率。
全概率公式&Bayes公式¶
划分 : 称 \(B_1,B_2,\dots,B_n\) 是样本空间 \(S\) 的一个划分,若
- 不漏 \(\mathop{\cup}\limits_{i=1}^{n}B_i = S\)
- 不重 \(B_iB_j = \varnothing, i \ne j\)
设 \(B_1,B_2,\dots,B_n\) 为 \(S\) 的一个划分且 \(P(B_i) > 0, i = 1,2,\dots,n\) ,则有全概率公式:
对 \(P(A) > 0\) 有 Bayes 公式 :
此时,称 \(P(B_i)\) 为先验概率,\(P(B_i|A)\) 称为后验概率。
Question
根据以往的临床记录,某种诊断癌症的试验具有5%的假阳性及5%的假阴性:即设A={试验反应是阳性},C={被诊断患有癌症}则有:\(P(A |C) = 5%, P(A | C ) = 5 %\) .已知某一群体\(P(C)=0.005\),问这种方法能否用于普查?
独立性¶
设 A,B 为两个随机事件,若有 \(P(AB)=P(A) \times P(B)\),则 A,B 相互独立(independent)
直观含义:A发生与否都不会改变B发生的概率
当出现两个以上的随机事件时,如三个随机事件 A,B,C 当:
都成立,则称事件 A,B,C 两两独立;
如果同时还满足:\(P(ABC)=P(A)P(B)P(C)\) 则称事件 A,B,C相互独立。
- 注意: \(\text{相互独立} \rightarrow \text{两两独立}\) ,但是, \(\text{两两独立} \nrightarrow \text{相互独立}\)
更普遍的:
定义 \(\{A_i\}\) 相互独立 当且仅当
独立试验:指任一次子试验出现的结果都不影响其他各子试验出现的结果;例如观察十期彩票的开奖结果,是独立试验。
重复试验:如果各子试验是在相同条件下进行的。
Question
一袋中有编号为1,2,3,4共4个球,采用有放回抽样,每次取一球,共取2次,记录号码之和,这样独立重复进行试验,求“和等于3”出现在“和等于5”之前的概率。
Question
(1)在该地任选一居民,求他戴口罩的概率;
(2)若选n人,求他们都戴口罩的概率;
(3)若选n人发现他们都戴口罩,求这一天发生雾霾的概率.(这里n为正整数.)
球盒问题整理¶
以下问题的前提为 \(n\ge m\)
-
\(n\) 个相同的球放入 \(m\) 个相同的盒子,且盒子不为空。也即将 \(n\) 分解为 \(m\) 个数的和的不同数目。
-
\(n\) 个相同的球放入 \(m\) 个相同的盒子,且盒子可以为空。也即将 \(n\) 分解为 \(m,m-1,\dots,1\) 个数的和所有种数之和。
-
\(n\) 个相同的球放入 \(m\) 个不同的盒子,且盒子不为空。也即 \(C_{n-1}^{m-1}\) 。
- 隔板法,也即 \(n-1\) 个空放入 \(m-1\) 个隔板。
-
\(n\) 个相同的球放入 \(m\) 个不同的盒子,且盒子可以为空。也即 \(C_{m+n-1}^{m-1}\) 。
- 也是隔板法,但需要稍微变形。问题等价于 \(n+m\) 个相同的球放入 \(m\) 个不同的盒子,且盒子不为空。
$$ n_1 + n_2 + \dots + n_m = n$$
$$ n_1 , n_2 , \dots, n_m \ge 0$$
$$ (n_1+1)+(n_2+1)+\dots+(n_m+1)=m+n$$
此时每一项 \((n_1+1),(n_2+1),\dots,(n_m+1) \ge 1\) ,即可以使用隔板法。(这种分析方法还是比较实用的,建议掌握)
-
\(n\) 个不同的球放入 \(m\) 个相同的盒子,且盒子不为空。
-
先列出分成不同堆的情况。也即将 \(n\) 分解为 \(m\) 个数的分类情况。此时再用组合数计算。注意,有几组均分就需要各除以几的阶乘。例如8个球放进3个盒子时一种情况为 \(1-1-6\) , 此时的情况数目为 \(\frac{C_8^1 \cdot C_7^1 \cdot C_6^6}{A_2^2}\) 。
-
这是典型的第二类斯特灵数,运用动态规划的思想。
设 \(f[n][m]\) 为标准答案。
\(f[n][m] =f[n-1][m-1] + m \times f[n-1][m]\)
也就是考虑第 \(n\) 个数,第 \(n\) 个数单独占据一个盒子或第 \(n\) 个数和之前的数共占一个盒子。
-
-
\(n\) 个不同的球放入 \(m\) 个相同的盒子,且盒子可以为空。
-
先列出分成不同堆的情况。也即将 \(n\) 分解为 \(m,m-1,\dots,1\) 个数的和所有种数之和。此时同样需要注意有几组均分就需要各除以几的阶乘。
-
同样运用动态规划的思想。
设 \(g[n][m]\) 为标准答案。
\(g[n][m] = \sum\limits_{i=0}^m g[n][i]\)
也即考虑使用了多少个盒子。
-
-
\(n\) 个不同的球放入 \(m\) 个不同的盒子,且盒子不为空。也即 \(n\) 个不同的球放入 \(m\) 个相同的盒子,且盒子不为空的情况 \(\times m!\) 。
-
\(n\) 个不同的球放入 \(m\) 个不同的盒子,且盒子可以为空。也即 \(m^n\) 。