再谈概率期望(一)
clx201022
·
·
算法·理论
绪言
本文为笔者学习概率期望搜集资料有所感悟后所写的文章,如有勘误欢迎指正。
前置知识:小学二年级[^bidao]就会学的集合。
概率期望(一)
随机事件
对于一个随机现象,对每一个不能再细分的结果为样本点,所有样本点的集合为样本空间 \Omega。一个随机事件 A[^jian] 为 \Omega 的一个子集,若干个样本点的集合。
一个随机事件 A 发生当且仅当随机现象的结果 \omega 满足 \omega\in A。
以抛骰子的点数举例。此时,\Omega= \{1,2,3,4,5,6\},则骰子点数小于等于 2 的随机事件 A=\{1,2\}。
事件域
事件域 F 即为所有可能事件的的集合,其必须包含 \varnothing 且对于补运算、可数并封闭。可以证明,在这种情况下,F 对于可数交也是封闭的。
形式化定义为:
定义
定义事件 A 的概率为
P(A)=\frac{|A|}{|\Omega|}
其中 |A| 表示对于该集合大小的度量。[^du]
对于任意随机事件 A,B\subset \Omega,有
- 单调性:若 A\subset B,则有 P(A)\le P(B)。
- 容斥原理:P(A+B)=P(A)+P(B)-P(AB),其中 A+B 表示 A\cup B,AB 表示 A\cap B。
本文暂时只讨论古典概型,因此,略过有关概率空间和公理化定义的内容,具体读者可自行查看。
条件概率
若已知事件 A 发生,在此条件下事件 B 发生的概率称为条件概率,记作 P(B|A)。
条件概率的公式为
P(B|A)=\frac{P(AB)}{P(A)}
此公式有意义当且仅当 P(A)>0,因此,讨论条件概率 P(B|A) 时,我们默认 P(A)>0。
由此,可以推出两个公式:
推广出去,对于 A_1,A_2\dots A_n,称其独立当且仅当
P(\bigcap_{i=1}^{n} A_i)=\prod_{i=1}^{n}P(A_i)
上文为参照 OI Wiki 内容所写。
但笔者认为,这样定义独立性会存在一定的问题,即两两独立的事件不一定合起来独立,如 OI Wiki 中的反例所言。
考虑将其抽象。令 \Omega=\{1,2,3,4\},A=\{1,4\},B=\{2,4\},C=\{3,4\}。此时,计算结果与原文相同。
修改使 \Omega\gets \{1,2,3,4,5\},A\gets \{1,4,5\}。
此时,P(A)=\frac{3}{5},P(B)=P(C)=\frac{2}{5},P(AB)=P(AC)=P(BC)=P(ABC)=\frac{1}{5}。
由此可以看出,原文所举的反例只是一种数值上的巧合。要让两两独立能推出全部独立,只需修改独立的定义为事件集合两两不交即可。
但坏消息是:现实中只能通过反复实验得到概率的数值,因此这种独立定义不无其道理。
Bayes 公式
P(A|B)
&=\frac{P(A)P(B|A)}{P(B)}\\
&=\frac{P(A)P(B|A)}{P(A)P(B|A)+P(\overline{A})P(B|\overline{A})}
\end{aligned}
这里只给出贝叶斯公式的简化形式,其完整形式可由全概率公式推出。
这个公式的形式化证明十分简单(读者甚至可以在一分钟内自行完成),但其中蕴含的思想却并不好理解。
为了解释这个公式的意义,需要一些理(kou)解(hu)。
先验概率与后验概率
P(A|B)=\frac{P(B|A)}{P(B)}P(A)
若将 P(A) 称为先验概率,P(A|B) 称为后验概率,则此公式是一个能将先验概率和后验概率间相互转化的工具。
或者从集合的意义理解
$$\begin{aligned}
\frac{P(B|A)}{P(B)}&=\frac{\frac{|A\cap B|}{|A|}}{\frac{|B|}{\Omega}}\\
&=\frac{|A\cap B||\Omega|}{|A||B|}
\end{aligned}$$
这就相当于“提取”出 $A$ 和 $B$ 中那些相同的部分,并以此计算先验概率与后验概率之间的关系。比如 $A\cap B=\varnothing$,此时即说明事件 $A,B$ 互斥,那么后验概率 $P(A|B)=0$。
### 从一个例子出发
从特殊到一般,再从一般到特殊。如果抽象的论述无法理解,那就找一个具体的例子。
想象有 $1000$ 名 OIer,其中有 $1\%$ 得了 P 话病。他们都接受了模拟赛检查,其中 $9$ 个 P 话病人得到了正确的阳性结果,剩下 $1$ 个则是假阴性。剩下的人里面,有 $89$ 个假阳性,$901$ 个正确的阴性结果。
我经过了检测,结果为阳性,求得了 P 话病的概率 $P(A)$。
根据具体数据,容易算出阳性里面真病人的占比为 $\frac{9}{9+89}=\frac{9}{98}$,因为概率均等,所以 $P(A)=\frac{9}{98}$,约为 $\frac{1}{11}$。
阳性的组成部分,可以分为两个,分别是检出的**真阳性**和**假阳性**,前者在病人的占比为**灵敏度**,后者在非病人的占比为**假阳性率**。
在本次测验中,**灵敏度**为 $90\%$,**假阳性率**约为 $91\%$。这就引出一个悖论:为什么准确度这么高,阳性里真病人的概率却这么低?
这是因为,检测不是作为阳性的概率,而是**更新**了阳性的概率;或者说,使**先验概率**转化为了**后验概率**。
用**真阳性**在病人中的占比除以**总阳性**在所有人中的占比,即可得到所有阳性中有多少的**真阳性**。
而这个占比的占比,其实就是贝叶斯公式中的 $\frac{P(B|A)}{P(B)}$,也就是通常所说的**贝叶斯因子**,其说明了应该如何将**先验概率**转化为**后验概率**。
## 后记
就先讲到这里,期望和实际做题的部分等更新吧。
如果仍有疑惑,可以翻阅下方所列的参考文献。
~~点赞收藏加关注,一键三连不迷路。~~
## 参考文献
1. [胡渊鸣,《浅析信息学竞赛中概率论的基础与应用》,《国家集训队2013论文集》](https://chxulong.oss-cn-shenzhen.aliyuncs.com/%E5%9B%BD%E5%AE%B6%E9%9B%86%E8%AE%AD%E9%98%9F%E8%AE%BA%E6%96%87/%E5%9B%BD%E5%AE%B6%E9%9B%86%E8%AE%AD%E9%98%9F2013%E8%AE%BA%E6%96%87%E9%9B%86/2013%20%E5%B9%B4%E4%BF%A1%E6%81%AF%E5%AD%A6%E5%A5%A5%E6%9E%97%E5%8C%B9%E5%85%8B%E4%B8%AD%E5%9B%BD%E5%9B%BD%E5%AE%B6%E9%98%9F%E5%80%99%E9%80%89%E9%98%9F%E5%91%98%E8%AE%BA%E6%96%87%E9%9B%86.pdf)[^2013]
2. [Grant Sanderson,Bayes theorem, and making probability intuitive](https://www.bilibili.com/video/BV1R7411a76r)[^3b1b]
3. [Grant Sanderson,Bayes theorem, The medical test paradox: Can redesigning Bayes rule help?](https://www.bilibili.com/video/BV1Ei4y1F72M)[^yi]
4. [OI Wiki,
概率论](https://oi-wiki.org/math/probability/basic-conception/)
5. [长河劫,【数学史】初等概率论的起源](https://www.bilibili.com/video/BV1tnYCzeEGE)
本文遵循 [CC BY-SA 4.0](https://creativecommons.org/licenses/by-sa/4.0/deed.zh-hans) 协议[^cc]。
[^3b1b]:原链接在[这里](https://youtu.be/HZGCoVF3YvM),但我上不了油管 QAQ。
[^cc]:我也不知道这是什么,总之挺高级的就写这里了。
[^2013]:没有空格是因为原标题如此。
[^jian]:随机事件通常用大写字母表示。
[^du]:对于有限集,其为集合的元素个数;对于无限集则为一个特定的函数。这涉及到部分[测度论](https://baike.baidu.com/item/%E6%B5%8B%E5%BA%A6%E8%AE%BA/918407)的内容,暂时不做讨论 ~~(其实是因为我也不会)~~。
[^bidao]:毕导小学。
[^huafen]:对于 $A_1,A_2\dots A_n$,若其满足 $\forall x\ne y,A_x\cap A_y=\varnothing$ 且 $\bigcup^{n}_{i=1}A_i=U$,则称其为 $U$ 的一个划分。
[^bansui]:不能简单说成是因果关系,因为不知道两者是谁造成谁又或者有一个相同的原因。
[^yi]:[同上](https://youtu.be/lG4VkPoG3ko)。