跳转到主要内容

C01-C04

主讲人: @Yuan
日期: 2025-09-21
录制文件:https://meeting.tencent.com/crm/l5g8dWL5ac
Password:KJSG

    • C01 初始之旅

        • Q: ^^某人有两个孩子,其中至少有一个是男孩,那么另一个孩子也是男孩的概率是多少?^^
        • 贝叶斯主义定义
          1. 承认所有模型、理论都只是“信念”或“虚构”,“所有模型都是错的”。
          2. 利用实际数据,调整我们对不同模型的“置信度”。
          3. 调整置信度的方式,必须严格遵循贝叶斯公式。
        • 核心角色:
          • 纯粹贝叶斯主义者:一个理想化的、能完美进行贝叶斯计算的智能体。
          • 实用贝叶斯主义者:考虑到现实计算能力的限制,是前者的一个近似版本。
        • CONL
          • 所有模型都是错的,(概率本质上是主观的,但贝叶斯主义≠相对主义,∵ 可以分辨更有用的模型 → ) 但有些模型很有用
          • 概率是置信度:贝叶斯主义将概率理解为一种“主观的置信度”,而不是客观世界里某种东西发生的“频率”。这使得我们可以为任何不确定的事情(比如“恐龙灭绝是因为撞击”)赋予概率
          • 从“是什么”到“信多少”:思考模式的转变,从问“这个理论是不是真的?”转变为问“根据现有证据,我应该对这个理论有多大的信心?”
            • 我最后发现判定模型的用处更有趣,尤其是它对预言能力的判定,其真实性则无所谓。
          • 不只是数学、而是一种认识论和知识论哲学
      • C02 小孩谜题

        • 直觉陷阱
          1. 继续小孩谜题
          2. 蒙蒂·霍尔问题:参赛者在三扇门后选车,主持人打开一扇有羊的门后,是否更换选择?
            • A(car) B C
          3. 萨莉·克拉克案 (检察官谬误):一个母亲的两个婴儿先后夭折,母亲是否有罪?
            • 在给定无罪的情况下,出现证据的概率:$$ \mathbb{P}(\text{证据}|\text{无罪}) $$
            • 在给定证据的情况下,无罪的概率:$$ \mathbb{P}(\text{无罪}|\text{证据}) $$
            • 务必区分 P(证据∣无罪) 和 $$ \mathbb{P}(无罪 | 证据) $$。前者可能很小(即无罪情况下出现该证据的概率很低),但后者可能很大(即出现该证据时,嫌疑人依然很可能是无罪的)。
        • 贝叶斯公式
          • $$ \mathbb{P}(H|E) = \frac{\mathbb{P}(E|H)\mathbb{P}(H)}{\mathbb{P}(E)} $$
            • P[H] (先验概率):在看到新证据(E)前,你对假说(H)的置信度 。
            • P[E∣H] (似然度/思想实验项):如果你的假说(H)为真,看到这个证据(E)的可能性有多大 。
            • P[E] (边缘概率/配分函数):看到这个证据(E)的总概率,是贝叶斯公式中最难计算的部分 。
            • P[H∣E] (后验概率):看到证据(E)后,你对假说(H)更新后的置信度。
        • 全概率公式 (条件概率的加权和)
          • $$ \mathbb{P}(A) = \sum_{i=1}^{n} \mathbb{P}(A|B_i)\mathbb{P}(B_i) $$
            • 一个“大结果”的总概率,等于所有可能导致这个结果的“小情况”的概率之和。每个“小情况”的概率,又等于这种情况发生的概率,乘以这种情况发生后,“大结果”跟着发生的概率。
        • 融合公式(将全概率公式带入贝叶斯公式)
          • $$ \mathbb{P}(B_j|A) = \frac{\mathbb{P}(A|B_j)\mathbb{P}(B_j)}{\sum_{i=1}^{n} \mathbb{P}(A|B_i)\mathbb{P}(B_i)} $$
            • 我们已经看到了一个“结果”,现在想反过来推断这个结果是由哪个“原因”造成的可能性更大。就像侦探看到了案发现场,要反推凶手是谁。
        • Practice
          • 埃博拉病毒检测,90%阳性准确率,0.01%感染率,感染概率?
            • 一个阳性结果不代表你真的得病了,因为误诊率和极低的基础患病率
          • 情景:谁偷吃了饼干 家里有两个孩子,哥哥和妹妹。厨房有一罐饼干。根据平时的观察:
            • 哥哥:比较贪吃,一天内他会去偷吃饼干的概率是80%。
            • 妹妹:比较乖,一天内她会去偷吃饼干的概率是20%。
            • 假设他们俩的行为是独立的,不会互相影响。
            • 有一天你回到家,发现饼干少了一块(这是结果/证据)问题:这块饼干是哥哥偷吃的概率有多大?
          • 情景:有瑕疵的零件 一个工厂有两条生产线,A线和B线,都在生产同一种零件。
            • A线:是老生产线,负责生产工厂60%的零件,其次品率(生产出有瑕疵零件的概率)为5%。
            • B线:是新生产线,负责生产工厂40%的零件,技术更好,次品率为1%。
            • 现在,你从仓库里随机拿了一个零件,发现它是有瑕疵的(这是结果/证据)问题:这个瑕疵零件来自A生产线的概率有多大?
        • CONL
          • 警惕直觉:在处理概率问题时,直觉往往是靠不住的。列出所有可能性是避免错误的一个好方法。
          • 基础概率是关键:“先验概率”极其重要。一个事件的基础发生率(比如某种疾病的患病率)极低时,即使有看似强力的证据,也需要非常谨慎。
          • 贝叶斯是反直觉的
      • C03 从逻辑上来说……

        • Q: 假设有人对你说:​“如果一张扑克牌的正面是Q,那么它的背面就是蓝色的。​” 检验该假设需要翻转哪些牌?
        • 经典逻辑 (0/1,布尔变量,二选一,贝叶斯逻辑的特殊形式)
          • 归纳与演绎
          • [[亚里士多德]]三段论
            • 所有人都会死;
            • 苏格拉底是人。
            • ∴ 苏格拉底会死。
          • 命题逻辑
            • 肯定前件 $$ ((A \rightarrow B) \text{且} A) \rightarrow B $$
            • 否定后件 $$ ((A \rightarrow B) \text{且} \neg B) \rightarrow \neg A $$
            • 逆否命题 $$ (A \rightarrow B) \rightarrow (\neg B \rightarrow \neg A) $$
          • 谓词逻辑
            • 所有偶数的后继者是奇数: $$ \forall n((\text{n是偶数}) \rightarrow (\text{n+1是奇数})) $$
            • 对于所有n,都存在一个比它大的m: $$ \forall n \exists m (m > n) $$
            • 带余除法 $$ \forall n \forall p \exists q \exists r ((n = pq + r) \text{ 且 } 0 \le r < p) $$
          • 核心规则:蕴涵 (A → B) 与逆否命题 (¬B → ¬A) 等价 。
          • 问题:违反直觉的悖论
            • 沃森选择任务:人们不擅长使用逆否命题 。
            • 乌鸦悖论:观察红苹果证实了乌鸦是黑的 。
        • 直觉主义 V.S. 柏拉图主义
        • 贝叶斯逻辑 (Spectrum)
          • 核心思想:用0到1的概率值代替绝对的“真/假”,量化不确定性
          • 优势:解决悖论
            • 乌鸦悖论:承认红苹果是证据,但其“证据强度”极其微弱 。
            • 逆否命题:解释了为何一个命题与其逆否命题在现实中的“可信度”感觉上并不等价 。
        • CONL
          • 逻辑的层次:传统逻辑处理的是“确定性”的世界,而贝叶斯逻辑处理的是“不确定性”的世界
          • 证据有强弱:这是贝叶斯逻辑的核心洞见。不是所有的证据都生而平等。一个证据能否显著改变你的看法,取决于它的“强度”
          • 重新理解蕴涵:在贝叶斯世界里,“如果A那么B”更多地被理解为“知道A发生后,我对B发生的置信度变得非常高(接近1)”
          • 推理方式只有一种,那就是贝叶斯公式
            • 更准确地说,整个归纳推理系统都只是贝叶斯公式的特例,而人们常用的归纳推理则不过是贝叶斯公式的一种错误近似。
            • 演绎只能在真基础上推出必然真,为定义域范围真的收敛函数(肯定默认前提式/布尔变量/重言式)
            • 归纳是模型经验类比(潜规则替换式)
          • 学习是一支舞蹈:对一个理论的置信度不是一路高歌猛进,而是会随着各种证据上下浮动。经典逻辑的“证伪”思想无法描绘这种动态过程,但贝叶斯可以
      • C04 必须泛化!正确地泛化!

        • 归纳推理的问题
          • 苏格兰黑绵羊
        • 对传统科学哲学的批判
          • 波普尔的可证伪性原则:不完全符合科学研究的实际情况 (随机性与统计误差)。
          • 案例
            • 天文学家发现天王星轨道异常时,并没有去“证伪”牛顿定律,而是假设存在一颗新行星(海王星),并最终被证实
            • 爱因斯坦在没有实验验证前,就因其理论的简洁性和解释力(解决了水星轨道问题)而对广义相对论深信不疑
          • 频率主义与P值:尝试解决or解释统计误差,依然有问题(主观性)
            • 皮尔逊 & P值:$$ P\text{值} = \mathbb{P}[\text{数据比d更差}|T] $$
            • P值操控:研究者可以通过重复实验或不断收集数据,直到P值小于阈值(如5%),从而发表一个本不成立的“显著”结果(书中以“绿色糖豆引发青春痘”的漫画为例) 。
            • 可重复性危机:P值的滥用导致了大量已发表的科学研究是错误的,引发了科学界的“可重复性危机” 。
        • 贝叶斯主义的解决方案——“智慧方程”
          • 完整形态:$$ \mathbb{P}(T|D) = \frac{\mathbb{P}(D|T)\mathbb{P}(T)}{\mathbb{P}(D|T)\mathbb{P}(T) + \sum_{A}\mathbb{P}(D|A)\mathbb{P}(A)} $$
          • 核心思想:一个理论是否值得相信,不仅取决于它自身能否解释数据(分子),更重要的是,它要比所有其他竞争理论加起来解释得更好(分母)
          • 解释科学实践:这解释了为什么科学家不轻易推翻牛顿定律。因为在当时,“存在一颗未知行星”(一个替代理论A)来解释天王星轨道的异常,比“牛顿定律是错的”这个选项更有说服力(即先验概率P[A]更高)
        • 渐进式学习:贝叶斯公式天然支持“渐进学习”,即用旧数据计算出的“后验概率”可以作为下一次看到新数据时的“先验概率”,这让知识的更新成为一个持续的过程
          • $$ \mathbb{P}[T|ND \text{且} D] = \frac{\mathbb{P}[ND|T \text{且} D]\mathbb{P}[T|D]}{\mathbb{P}[ND|T \text{且} D]\mathbb{P}[T|D] + \sum_{A}\mathbb{P}[ND|A \text{且} D]\mathbb{P}[A|D]} $$
        • CONL
          • 科学不是证伪,而是比较:贝叶斯主义认为,科学进步不是一个不断推翻旧理论的过程,而是一个不断在多个竞争理论之间调整置信度的过程。我们永远选择那个当前置信度最高的理论。
          • 解释力很重要,但先验概率同样重要:一个理论(比如“外星人干的”)也许能解释一些奇怪的数据,但如果它的先验概率极低(即本身非常离奇),那么它的总置信度依然会很低。这体现了奥卡姆剃刀原则(更简单的理论有更高的先验概率),我们会在后面章节看到。
          • P值的陷阱:P值只告诉你,“如果你看到这个数据(或更极端数据)的概率很大,则假设原理论为真”。或者说,它讨论的是“如果原理论不为真,则看不到这个数据的可能性有多小”;它完全没有告诉你,“原理论为真的概率有多大”。混淆这两者是导致大量科学谬误的根源。
          • 智慧方程的核心:把对一个理论的评估,从“它自己与数据的关系”转变为“它与所有竞争者在数据面前的综合表现”。这是一种全局和动态的视角。