C01-C04
主讲人: @Yuan
日期: 2025-09-21
录制文件:https://meeting.tencent.com/crm/l5g8dWL5ac
Password:KJSG
-
-
C01 初始之旅
-
- Q: ^^某人有两个孩子,其中至少有一个是男孩,那么另一个孩子也是男孩的概率是多少?^^
- 贝叶斯主义定义
- 承认所有模型、理论都只是“信念”或“虚构”,“所有模型都是错的”。
- 利用实际数据,调整我们对不同模型的“置信度”。
- 调整置信度的方式,必须严格遵循贝叶斯公式。
- 核心角色:
- 纯粹贝叶斯主义者:一个理想化的、能完美进行贝叶斯计算的智能体。
- 实用贝叶斯主义者:考虑到现实计算能力的限制,是前者的一个近似版本。
- CONL
- 所有模型都是错的,(概率本质上是主观的,但贝叶斯主义≠相对主义,∵ 可以分辨更有用的模型 → ) 但有些模型很有用
- 概率是置信度:贝叶斯主义将概率理解为一种“主观的置信度”,而不是客观世界里某种东西发生的“频率”。这使得我们可以为任何不确定的事情(比如“恐龙灭绝是因为撞击”)赋予概率
- 从“是什么”到“信多少”:思考模式的转变,从问“这个理论是不是真的?”转变为问“根据现有证据,我应该对这个理论有多大的信心?”
- 我最后发现判定模型的用处更有趣,尤其是它对预言能力的判定,其真实性则无所谓。
- 不只是数学、而是一种认识论和知识论哲学
-
C02 小孩谜题
- 直觉陷阱
- 继续小孩谜题
- 蒙蒂·霍尔问题:参赛者在三扇门后选车,主持人打开一扇有羊的门后,是否更换选择?
- A(car) B C

- 萨莉·克拉克案 (检察官谬误):一个母亲的两个婴儿先后夭折,母亲是否有罪?
- 在给定无罪的情况下,出现证据的概率:$$ \mathbb{P}(\text{证据}|\text{无罪}) $$
- 在给定证据的情况下,无罪的概率:$$ \mathbb{P}(\text{无罪}|\text{证据}) $$
- 务必区分 P(证据∣无罪) 和 $$ \mathbb{P}(无罪 | 证据) $$。前者可能很小(即无罪情况下出现该证据的概率很低),但后者可能很大(即出现该证据时,嫌疑人依然很可能是无罪的)。
- 贝叶斯公式
- $$ \mathbb{P}(H|E) = \frac{\mathbb{P}(E|H)\mathbb{P}(H)}{\mathbb{P}(E)} $$
- P[H] (先验概率):在看到新证据(E)前,你对假说(H)的置信度 。
- P[E∣H] (似然度/思想实验项):如果你的假说(H)为真,看到这个证据(E)的可能性有多大 。
- P[E] (边缘概率/配分函数):看到这个证据(E)的总概率,是贝叶斯公式中最难计算的部分 。
- P[H∣E] (后验概率):看到证据(E)后,你对假说(H)更新后的置信度。
- $$ \mathbb{P}(H|E) = \frac{\mathbb{P}(E|H)\mathbb{P}(H)}{\mathbb{P}(E)} $$
- 全概率公式 (条件概率的加权和)
- $$ \mathbb{P}(A) = \sum_{i=1}^{n} \mathbb{P}(A|B_i)\mathbb{P}(B_i) $$
- 一个“大结果”的总概率,等于所有可能导致这个结果的“小情况”的概率之和。每个“小情况”的概率,又等于这种情况发生的概率,乘以这种情况发生后,“大结果”跟着发生的概率。
- $$ \mathbb{P}(A) = \sum_{i=1}^{n} \mathbb{P}(A|B_i)\mathbb{P}(B_i) $$
- 融合公式(将全概率公式带入贝叶斯公式)
- $$ \mathbb{P}(B_j|A) = \frac{\mathbb{P}(A|B_j)\mathbb{P}(B_j)}{\sum_{i=1}^{n} \mathbb{P}(A|B_i)\mathbb{P}(B_i)} $$
- 我们已经看到了一个“结果”,现在想反过来推断这个结果是由哪个“原因”造成的可能性更大。就像侦探看到了案发现场,要反推凶手是谁。
- $$ \mathbb{P}(B_j|A) = \frac{\mathbb{P}(A|B_j)\mathbb{P}(B_j)}{\sum_{i=1}^{n} \mathbb{P}(A|B_i)\mathbb{P}(B_i)} $$
- Practice
- 埃博拉病毒检测,90%阳性准确率,0.01%感染率,感染概率?
- 一个阳性结果不代表你真的得病了,因为误诊率和极低的基础患病率
- 情景:谁偷吃了饼干 家里有两个孩子,哥哥和妹妹。厨房有一罐饼干。根据平时的观察:
- 哥哥:比较贪吃,一天内他会去偷吃饼干的概率是80%。
- 妹妹:比较乖,一天内她会去偷吃饼干的概率是20%。
- 假设他们俩的行为是独立的,不会互相影响。
- 有一天你回到家,发现饼干少了一块(这是结果/证据)。问题:这块饼干是哥哥偷吃的概率有多大?
- 情景:有瑕疵的零件 一个工厂有两条生产线,A线和B线,都在生产同一种零件。
- A线:是老生产线,负责生产工厂60%的零件,其次品率(生产出有瑕疵零件的概率)为5%。
- B线:是新生产线,负责生产工厂40%的零件,技术更好,次品率为1%。
- 现在,你从仓库里随机拿了一个零件,发现它是有瑕疵的(这是结果/证据)。问题:这个瑕疵零件来自A生产线的概率有多大?
- 埃博拉病毒检测,90%阳性准确率,0.01%感染率,感染概率?
- CONL
- 警惕直觉:在处理概率问题时,直觉往往是靠不住的。列出所有可能性是避免错误的一个好方法。
- 基础概率是关键:“先验概率”极其重要。一个事件的基础发生率(比如某种疾病的患病率)极低时,即使有看似强力的证据,也需要非常谨慎。
- 贝叶斯是反直觉的
- 直觉陷阱
-
C03 从逻辑上来说……
- Q: 假设有人对你说:“如果一张扑克牌的正面是Q,那么它的背面就是蓝色的。” 检验该假设需要翻转哪些牌?
- 经典逻辑 (0/1,布尔变量,二选一,贝叶斯逻辑的特殊形式)
- 归纳与演绎
- [[亚里士多德]]三段论
- 所有人都会死;
- 苏格拉底是人。
- ∴ 苏格拉底会死。
- 命题逻辑
- 肯定前件 $$ ((A \rightarrow B) \text{且} A) \rightarrow B $$
- 否定后件 $$ ((A \rightarrow B) \text{且} \neg B) \rightarrow \neg A $$
- 逆否命题 $$ (A \rightarrow B) \rightarrow (\neg B \rightarrow \neg A) $$
- 谓词逻辑
- 所有偶数的后继者是奇数: $$ \forall n((\text{n是偶数}) \rightarrow (\text{n+1是奇数})) $$
- 对于所有n,都存在一个比它大的m: $$ \forall n \exists m (m > n) $$
- 带余除法 $$ \forall n \forall p \exists q \exists r ((n = pq + r) \text{ 且 } 0 \le r < p) $$
- 核心规则:蕴涵 (A → B) 与逆否命题 (¬B → ¬A) 等价 。
- 问题:违反直觉的悖论
- 沃森选择任务:人们不擅长使用逆否命题 。
- 乌鸦悖论:观察红苹果证实了乌鸦是黑的 。
- 直觉主义 V.S. 柏拉图主义
- 贝叶斯逻辑 (Spectrum)
- 核心思想:用0到1的概率值代替绝对的“真/假”,量化不确定性
- 优势:解决悖论
- 乌鸦悖论:承认红苹果是证据,但其“证据强度”极其微弱 。
- 逆否命题:解释了为何一个命题与其逆否命题在现实中的“可信度”感觉上并不等价 。
- CONL
- 逻辑的层次:传统逻辑处理的是“确定性”的世界,而贝叶斯逻辑处理的是“不确定性”的世界
- 证据有强弱:这是贝叶斯逻辑的核心洞见。不是所有的证据都生而平等。一个证据能否显著改变你的看法,取决于它的“强度”
- 重新理解蕴涵:在贝叶斯世界里,“如果A那么B”更多地被理解为“知道A发生后,我对B发生的置信度变得非常高(接近1)”
- 推理方式只有一种,那就是贝叶斯公式
- 更准确地说,整个归纳推理系统都只是贝叶斯公式的特例,而人们常用的归纳推理则不过是贝叶斯公式的一种错误近似。
- 演绎只能在真基础上推出必然真,为定义域范围真的收敛函数(肯定默认前提式/布尔变量/重言式)
- 归纳是模型经验类比(潜规则替换式)
- 学习是一支舞蹈:对一个理论的置信度不是一路高歌猛进,而是会随着各种证据上下浮动。经典逻辑的“证伪”思想无法描绘这种动态过程,但贝叶斯可以
- Q: 假设有人对你说:“如果一张扑克牌的正面是Q,那么它的背面就是蓝色的。” 检验该假设需要翻转哪些牌?
-
C04 必须泛化!正确地泛化!
- 归纳推理的问题
- 苏格兰黑绵羊
- 对传统科学哲学的批判:
- 波普尔的可证伪性原则:不完全符合科学研究的实际情况 (随机性与统计误差)。
- 案例:
- 天文学家发现天王星轨道异常时,并没有去“证伪”牛顿定律,而是假设存在一颗新行星(海王星),并最终被证实
- 爱因斯坦在没有实验验证前,就因其理论的简洁性和解释力(解决了水星轨道问题)而对广义相对论深信不疑
- 频率主义与P值:尝试解决or解释统计误差,依然有问题(主观性)
- 皮尔逊 & P值:$$ P\text{值} = \mathbb{P}[\text{数据比d更差}|T] $$
- P值操控:研究者可以通过重复实验或不断收集数据,直到P值小于阈值(如5%),从而发表一个本不成立的“显著”结果(书中以“绿色糖豆引发青春痘”的漫画为例) 。
- 可重复性危机:P值的滥用导致了大量已发表的科学研究是错误的,引发了科学界的“可重复性危机” 。
- 贝叶斯主义的解决方案——“智慧方程”
- 完整形态:$$ \mathbb{P}(T|D) = \frac{\mathbb{P}(D|T)\mathbb{P}(T)}{\mathbb{P}(D|T)\mathbb{P}(T) + \sum_{A}\mathbb{P}(D|A)\mathbb{P}(A)} $$
- 核心思想:一个理论是否值得相信,不仅取决于它自身能否解释数据(分子),更重要的是,它要比所有其他竞争理论加起来解释得更好(分母)
- 解释科学实践:这解释了为什么科学家不轻易推翻牛顿定律。因为在当时,“存在一颗未知行星”(一个替代理论A)来解释天王星轨道的异常,比“牛顿定律是错的”这个选项更有说服力(即先验概率P[A]更高)
- 渐进式学习:贝叶斯公式天然支持“渐进学习”,即用旧数据计算出的“后验概率”可以作为下一次看到新数据时的“先验概率”,这让知识的更新成为一个持续的过程
- $$ \mathbb{P}[T|ND \text{且} D] = \frac{\mathbb{P}[ND|T \text{且} D]\mathbb{P}[T|D]}{\mathbb{P}[ND|T \text{且} D]\mathbb{P}[T|D] + \sum_{A}\mathbb{P}[ND|A \text{且} D]\mathbb{P}[A|D]} $$
- CONL
- 科学不是证伪,而是比较:贝叶斯主义认为,科学进步不是一个不断推翻旧理论的过程,而是一个不断在多个竞争理论之间调整置信度的过程。我们永远选择那个当前置信度最高的理论。
- 解释力很重要,但先验概率同样重要:一个理论(比如“外星人干的”)也许能解释一些奇怪的数据,但如果它的先验概率极低(即本身非常离奇),那么它的总置信度依然会很低。这体现了奥卡姆剃刀原则(更简单的理论有更高的先验概率),我们会在后面章节看到。
- P值的陷阱:P值只告诉你,“如果你看到这个数据(或更极端数据)的概率很大,则假设原理论为真”。或者说,它讨论的是“如果原理论不为真,则看不到这个数据的可能性有多小”;它完全没有告诉你,“原理论为真的概率有多大”。混淆这两者是导致大量科学谬误的根源。
- 智慧方程的核心:把对一个理论的评估,从“它自己与数据的关系”转变为“它与所有竞争者在数据面前的综合表现”。这是一种全局和动态的视角。
- 归纳推理的问题
-
-
