C01-C04

主讲人: @Yuan
日期: 2025-09-21
录制文件：https://meeting.tencent.com/crm/l5g8dWL5ac
Password：KJSG

- C01 初始之旅
  - - Q: ^^某人有两个孩子，其中至少有一个是男孩，那么另一个孩子也是男孩的概率是多少？^^
    - 贝叶斯主义定义
      1. 承认所有模型、理论都只是“信念”或“虚构”，“所有模型都是错的”。
      2. 利用实际数据，调整我们对不同模型的“置信度”。
      3. 调整置信度的方式，必须严格遵循贝叶斯公式。
    - 核心角色：
      - 纯粹贝叶斯主义者：一个理想化的、能完美进行贝叶斯计算的智能体。
      - 实用贝叶斯主义者：考虑到现实计算能力的限制，是前者的一个近似版本。
    - CONL
      - 所有模型都是错的，(概率本质上是主观的，但贝叶斯主义≠相对主义，∵ 可以分辨更有用的模型 → ) 但有些模型很有用
      - 概率是置信度：贝叶斯主义将概率理解为一种“主观的置信度”，而不是客观世界里某种东西发生的“频率”。这使得我们可以为任何不确定的事情（比如“恐龙灭绝是因为撞击”）赋予概率
      - 从“是什么”到“信多少”：思考模式的转变，从问“这个理论是不是真的？”转变为问“根据现有证据，我应该对这个理论有多大的信心？”
        
        我最后发现判定模型的用处更有趣，尤其是它对预言能力的判定，其真实性则无所谓。
      - 不只是数学、而是一种认识论和知识论哲学
  - C02 小孩谜题
    - 直觉陷阱
      1. 继续小孩谜题
      2. 蒙蒂·霍尔问题：参赛者在三扇门后选车，主持人打开一扇有羊的门后，是否更换选择？
        
        A(car) B C
      3. 萨莉·克拉克案 (检察官谬误)：一个母亲的两个婴儿先后夭折，母亲是否有罪？
        
        在给定无罪的情况下，出现证据的概率：$$ \mathbb{P}(\text{证据}|\text{无罪}) $$
        
        在给定证据的情况下，无罪的概率：$$ \mathbb{P}(\text{无罪}|\text{证据}) $$
        
        务必区分 P(证据∣无罪) 和 $$ \mathbb{P}(无罪 | 证据) $$。前者可能很小（即无罪情况下出现该证据的概率很低），但后者可能很大（即出现该证据时，嫌疑人依然很可能是无罪的）。
    - 贝叶斯公式
      - $$ \mathbb{P}(H|E) = \frac{\mathbb{P}(E|H)\mathbb{P}(H)}{\mathbb{P}(E)} $$
        
        P[H] (先验概率)：在看到新证据(E)前，你对假说(H)的置信度。
        
        P[E∣H] (似然度/思想实验项)：如果你的假说(H)为真，看到这个证据(E)的可能性有多大。
        
        P[E] (边缘概率/配分函数)：看到这个证据(E)的总概率，是贝叶斯公式中最难计算的部分。
        
        P[H∣E] (后验概率)：看到证据(E)后，你对假说(H)更新后的置信度。
    - 全概率公式 (条件概率的加权和)
      - $$ \mathbb{P}(A) = \sum_{i=1}^{n} \mathbb{P}(A|B_i)\mathbb{P}(B_i) $$
        
        一个“大结果”的总概率，等于所有可能导致这个结果的“小情况”的概率之和。每个“小情况”的概率，又等于这种情况发生的概率，乘以这种情况发生后，“大结果”跟着发生的概率。
    - 融合公式(将全概率公式带入贝叶斯公式)
      - $$ \mathbb{P}(B_j|A) = \frac{\mathbb{P}(A|B_j)\mathbb{P}(B_j)}{\sum_{i=1}^{n} \mathbb{P}(A|B_i)\mathbb{P}(B_i)} $$
        
        我们已经看到了一个“结果”，现在想反过来推断这个结果是由哪个“原因”造成的可能性更大。就像侦探看到了案发现场，要反推凶手是谁。
    - Practice
      - 埃博拉病毒检测，90%阳性准确率，0.01%感染率，感染概率？
        
        一个阳性结果不代表你真的得病了，因为误诊率和极低的基础患病率
      - 情景：谁偷吃了饼干 家里有两个孩子，哥哥和妹妹。厨房有一罐饼干。根据平时的观察：
        
        哥哥：比较贪吃，一天内他会去偷吃饼干的概率是80%。
        
        妹妹：比较乖，一天内她会去偷吃饼干的概率是20%。
        
        假设他们俩的行为是独立的，不会互相影响。
        
        有一天你回到家，发现饼干少了一块（这是结果/证据）。问题：这块饼干是哥哥偷吃的概率有多大？
      - 情景：有瑕疵的零件 一个工厂有两条生产线，A线和B线，都在生产同一种零件。
        
        A线：是老生产线，负责生产工厂60%的零件，其次品率（生产出有瑕疵零件的概率）为5%。
        
        B线：是新生产线，负责生产工厂40%的零件，技术更好，次品率为1%。
        
        现在，你从仓库里随机拿了一个零件，发现它是有瑕疵的（这是结果/证据）。问题：这个瑕疵零件来自A生产线的概率有多大？
    - CONL
      - 警惕直觉：在处理概率问题时，直觉往往是靠不住的。列出所有可能性是避免错误的一个好方法。
      - 基础概率是关键：“先验概率”极其重要。一个事件的基础发生率（比如某种疾病的患病率）极低时，即使有看似强力的证据，也需要非常谨慎。
      - 贝叶斯是反直觉的
  - C03 从逻辑上来说……
    - Q: 假设有人对你说：“如果一张扑克牌的正面是Q，那么它的背面就是蓝色的。” 检验该假设需要翻转哪些牌？
    - 经典逻辑 (0/1，布尔变量，二选一，贝叶斯逻辑的特殊形式)
      - 归纳与演绎
      - [[亚里士多德]]三段论
        
        所有人都会死；
        
        苏格拉底是人。
        
        ∴ 苏格拉底会死。
      - 命题逻辑
        
        肯定前件 $$ ((A \rightarrow B) \text{且} A) \rightarrow B $$
        
        否定后件 $$ ((A \rightarrow B) \text{且} \neg B) \rightarrow \neg A $$
        
        逆否命题 $$ (A \rightarrow B) \rightarrow (\neg B \rightarrow \neg A) $$
      - 谓词逻辑
        
        所有偶数的后继者是奇数： $$ \forall n((\text{n是偶数}) \rightarrow (\text{n+1是奇数})) $$
        
        对于所有n，都存在一个比它大的m： $$ \forall n \exists m (m > n) $$
        
        带余除法 $$ \forall n \forall p \exists q \exists r ((n = pq + r) \text{ 且 } 0 \le r < p) $$
      - 核心规则：蕴涵 (A → B) 与逆否命题 (¬B → ¬A) 等价。
      - 问题：违反直觉的悖论
        
        沃森选择任务：人们不擅长使用逆否命题。
        
        乌鸦悖论：观察红苹果证实了乌鸦是黑的。
    - 直觉主义 V.S. 柏拉图主义
    - 贝叶斯逻辑 (Spectrum)
      - 核心思想：用0到1的概率值代替绝对的“真/假”，量化不确定性
      - 优势：解决悖论
        
        乌鸦悖论：承认红苹果是证据，但其“证据强度”极其微弱。
        
        逆否命题：解释了为何一个命题与其逆否命题在现实中的“可信度”感觉上并不等价。
    - CONL
      - 逻辑的层次：传统逻辑处理的是“确定性”的世界，而贝叶斯逻辑处理的是“不确定性”的世界
      - 证据有强弱：这是贝叶斯逻辑的核心洞见。不是所有的证据都生而平等。一个证据能否显著改变你的看法，取决于它的“强度”
      - 重新理解蕴涵：在贝叶斯世界里，“如果A那么B”更多地被理解为“知道A发生后，我对B发生的置信度变得非常高（接近1）”
      - 推理方式只有一种，那就是贝叶斯公式
        
        更准确地说，整个归纳推理系统都只是贝叶斯公式的特例，而人们常用的归纳推理则不过是贝叶斯公式的一种错误近似。
        
        演绎只能在真基础上推出必然真,为定义域范围真的收敛函数(肯定默认前提式/布尔变量/重言式)
        
        归纳是模型经验类比(潜规则替换式)
      - 学习是一支舞蹈：对一个理论的置信度不是一路高歌猛进，而是会随着各种证据上下浮动。经典逻辑的“证伪”思想无法描绘这种动态过程，但贝叶斯可以
  - C04 必须泛化！正确地泛化！
    - 归纳推理的问题
      - 苏格兰黑绵羊
    - 对传统科学哲学的批判：
      - 波普尔的可证伪性原则：不完全符合科学研究的实际情况 (随机性与统计误差)。
      - 案例：
        
        天文学家发现天王星轨道异常时，并没有去“证伪”牛顿定律，而是假设存在一颗新行星（海王星），并最终被证实
        
        爱因斯坦在没有实验验证前，就因其理论的简洁性和解释力（解决了水星轨道问题）而对广义相对论深信不疑
      - 频率主义与P值：尝试解决or解释统计误差，依然有问题(主观性)
        
        皮尔逊 & P值：$$ P\text{值} = \mathbb{P}[\text{数据比d更差}|T] $$
        
        P值操控：研究者可以通过重复实验或不断收集数据，直到P值小于阈值（如5%），从而发表一个本不成立的“显著”结果（书中以“绿色糖豆引发青春痘”的漫画为例）。
        
        可重复性危机：P值的滥用导致了大量已发表的科学研究是错误的，引发了科学界的“可重复性危机” 。
    - 贝叶斯主义的解决方案——“智慧方程”
      - 完整形态：$$ \mathbb{P}(T|D) = \frac{\mathbb{P}(D|T)\mathbb{P}(T)}{\mathbb{P}(D|T)\mathbb{P}(T) + \sum_{A}\mathbb{P}(D|A)\mathbb{P}(A)} $$
      - 核心思想：一个理论是否值得相信，不仅取决于它自身能否解释数据（分子），更重要的是，它要比所有其他竞争理论加起来解释得更好（分母）
      - 解释科学实践：这解释了为什么科学家不轻易推翻牛顿定律。因为在当时，“存在一颗未知行星”（一个替代理论A）来解释天王星轨道的异常，比“牛顿定律是错的”这个选项更有说服力（即先验概率P[A]更高）
    - 渐进式学习：贝叶斯公式天然支持“渐进学习”，即用旧数据计算出的“后验概率”可以作为下一次看到新数据时的“先验概率”，这让知识的更新成为一个持续的过程
      - $$ \mathbb{P}[T|ND \text{且} D] = \frac{\mathbb{P}[ND|T \text{且} D]\mathbb{P}[T|D]}{\mathbb{P}[ND|T \text{且} D]\mathbb{P}[T|D] + \sum_{A}\mathbb{P}[ND|A \text{且} D]\mathbb{P}[A|D]} $$
    - CONL
      - 科学不是证伪，而是比较：贝叶斯主义认为，科学进步不是一个不断推翻旧理论的过程，而是一个不断在多个竞争理论之间调整置信度的过程。我们永远选择那个当前置信度最高的理论。
      - 解释力很重要，但先验概率同样重要：一个理论（比如“外星人干的”）也许能解释一些奇怪的数据，但如果它的先验概率极低（即本身非常离奇），那么它的总置信度依然会很低。这体现了奥卡姆剃刀原则（更简单的理论有更高的先验概率），我们会在后面章节看到。
      - P值的陷阱：P值只告诉你，“如果你看到这个数据（或更极端数据）的概率很大，则假设原理论为真”。或者说，它讨论的是“如果原理论不为真，则看不到这个数据的可能性有多小”；它完全没有告诉你，“原理论为真的概率有多大”。混淆这两者是导致大量科学谬误的根源。
      - 智慧方程的核心：把对一个理论的评估，从“它自己与数据的关系”转变为“它与所有竞争者在数据面前的综合表现”。这是一种全局和动态的视角。

C01-C04

C01 初始之旅

C02 小孩谜题

C03 从逻辑上来说……

C04 必须泛化！正确地泛化！