跳转到主要内容

C05-C08

领读人:@小明
日期:2025-10-05
录制文件:https://meeting.tencent.com/crm/N1bQ7Zkz8b

C5. 荣耀归于偏见

琳达问题

琳达 31 岁,独身,为⼈诚恳且充满智慧。她学习过哲学。她在还是⼤学⽣的时候很关⼼歧视与社会正义
的问题,也曾参加反核游⾏。下⾯哪⼀个陈述更有可能是正确的?
01. 琳达是银⾏办事员。
02. 琳达是银⾏办事员,并且活跃在⼥权运动中。

纯粹频率主义VS贝叶斯主义

纯粹频率主义者:P(题干) | P(02) 概率更高

贝叶斯主义者: P(题干) | P(01) > P(题干) | P(02)  不能推导出 P(02) | P(题干) > P(01) | P(题干)

贝叶斯主义的论证

image.png

image.png

image.png

P(1)的先验包含偏见的成分,不同的人可能对P(1)产生不同的假设,从而影响概率判断

另一个极端的例子,太阳消失

想象⼀下你在法国巴黎,你⼿下的实习⽣在美国夏威夷。在午夜前⼀刻,他掷了两枚骰⼦。如果两枚都掷
出 6,他就会跟你说太阳消失了;否则,他就会告诉你太阳实际上是否消失了。午夜到了,实习⽣打来电
话,告诉你太阳消失了。你会得出什么结论?

P(太阳消失 |  太阳消失 ) =  P( 太阳消失 | 太阳消失) * P(太阳消失) / P(太阳消失)

任何数据都不应该被单独分析,若非置身在宏伟建筑之中则毫无意义。

贝叶斯主义者对一切均有偏见

任何涉及未知的概率问题,在贝叶斯主义者这里都是:P(X | history)

⻉叶斯主义对于任何事情都强制要求进⾏(概率性)预测的计算 。⻉叶斯主义者总
有某种偏⻅ ,不能说出“我不知道”。概率
必然有某个准确值,⽽这个准确值基本不可能恰好是
1/2。对于⻉叶斯主义来说,深埋这种偏⻅是⾮常不理性的⾏为

偏见的好处:

  • 过往的经验都会影响当前问题的概率
  • 回答“我不知道”就是屈服于懒惰
  • 偏见是为了验证
  • 关乎趣味:发现自己预测正确是愉快的事

错误的偏⻅

  • 过分的推广,以平均的概率代替个体的概率(偏见里群体的组成):BMI>多少就一定不健康,对个体而言,需要综合考虑其他指标
  • 为了更新置信度⽽进⾏的观察结果之中的偏差:有成就的人都是年长的男人

偏见的存在是因为没有足够的语境和检验;本质上偏见是不符合贝叶斯主义的

偏⻅与道德

C6. ⻉叶斯主义的“先知”

起源 

想象⼀下两位玩家各⾃赌上 10 欧元,进⾏⼀盘抛 11 次均匀硬币然后⽐较正反⾯出现次数的胜
负。押注在次数较多(即出现 6 次或以上)那⼀边的玩家就能把赌上的全部 20 欧元收⼊囊中。假设在
赌局因事中断时,⽐分是 4 - 0,那么应该如何公平地划分赌⾦?

帕斯卡和费⻢研究的赌金分配问题:

构建了⼀套关于概率的演绎逻辑。这让他们奠定了概率论的基础,还引⼊了数学期望和⼆项分布等概念。

棣莫弗:中⼼极限定理

贝叶斯

已知结果的情况下,如何推导出原因的概率

贝叶斯希望通过这个公式找到世界的第一推动力(第一因),自己的公式迟迟没有发表,他本人并不是贝叶斯主义者

拉普拉斯,⻉叶斯主义之⽗

拉普拉斯在研究太阳系稳定性的问题时,遇到的困难是手上没有足够精确的观测数据。

他知道此前数个世纪天⽂学家的观察结果,⽽且需要从中推断错误的原因——天体在天空中真正的位置。在意识到这个问题的结构之后,即使他当时似乎还没有听到有关⻉叶斯的发现的⻛声,拉普拉斯还是正⾯进攻了这个逆概率问题。1774 年,拉普拉斯发表了《论事件原因存在的概率》(Mémoire sur la probabilité des causes par les événements)。他在论⽂中结合了棣莫弗之前的⼯作、拉格朗⽇创造的分析⼯具以及他本⼈的才华,以最⼴泛、最壮丽的⽅式确⽴了⻉叶斯公式。
假设罐中⽩⾊纸条的⽐例是未知的,拉普拉斯
从罐中随机抽取了⼀张纸条 1,那张纸条是⽩⾊的。我们可以对罐中⽩⾊纸条的⽐例有什么想法?如何解
释抽取的纸条是⽩⾊的?抽出⼀张⽩⾊纸条的原因是什么?
拉普拉斯得出了这样的结论:⽩⾊纸条的后验⽐例仍然是⼀个在 0 和 1 之间的随机数。但如果要预测从罐中抽出的下⼀张纸条的颜⾊,那么他会向⽩⾊这个可能性赋予 2/3 的概率。
在更⼀般的情况下,如果之前已经抽取出 P 张⽩纸条和 q 张⿊纸条的话,对于下⼀张从罐中抽出的纸条,拉普拉斯会向“它是⽩⾊的”这个可能性赋予的概率 (p + 1) / (p + q +2)。

⻉叶斯主义拯救盟军

图灵利用贝叶斯的置信度方法,大大加快了二战期间密码破译的速度

C7. 所罗⻔诺夫妖

图灵机(算法):如果有无穷的存储,所有计算都可以通过图灵机来完成

所罗⻔诺夫复杂度:运⾏时能⽣成给定数列的最短源代码的⻓度。—— 类比,数列中的过拟合,参数量足够多,定语足够多,在已知信息上的拟合就越多;

对于所罗⻔诺夫来说,⼀个理论就是⼀个算法,给定某个有限 0 - 1 序列,就能计算出它的概率。

要把所罗门诺夫的算法加入贝叶斯框架里,首先要将所有的序列出现的概率归一化:设置为 1 / (Cn*2 ^n)

实际的困难在于:

数列的长度是无穷的,无法枚举所有的替代理论;在图灵理论中,所罗门诺夫是不可计算的;

C8. 保守秘密

密码学之所以能成立,是由编码⽅式的海量可能性以及任何破译者都需要尝试其中⼤部分可能性的假设来保证的。

替换密码:用一个字母替换英语中的另一个字母,这里存在指数级别的可能性,所以很难通过列举每种情况来破译

贝叶斯破译替换密码:在英语中,字⺟ E、T、A、O 和 I ⽐其他字⺟出现得更频繁。因此,密信中出现得最多的字⺟有可能就是由字⺟ E 替换⽽来的,⽽出现得第⼆频繁的字⺟可能替换的就是 T,以此类推。但还不⽌于此!英语中的单词⾮常固定,因此能组成单词的字⺟组合少之⼜少。这样的话,⼀旦我们解码出“T*E”,要确定缺失的字⺟“*”是什么,我们就会猜“*”很可能是 H、I 或者 O。更厉害的是,如果这是某个句⼦的第⼀个单词,我们可以⾮常肯定它就是 H。

如何设计问卷,知道军队里士兵吸食大麻的情况?

  1. 将答案随机化:士兵掷硬币决定是否诚实回答吸食大麻,正面朝上就做出肯定回答,否则诚实作答;回答吸食大麻的士兵,吸食大麻的概率仍然远高于未参加的;改进:反面朝上时,士兵投掷第二次硬币进行作答;这样每个士兵诚实作答的概率相等

差分隐私:如果被分析的个体的后验概率与未被分析的个体总是差不多,那么我们就说它是差分隐私

拉普拉斯型机制:给结果增加一个噪声,如果这个噪声大于个体带来的扰动,这个结果就是满足差分隐私的

其他隐私保留的方式:禁止信息的聚合,让每个人成为自己信息的唯一保管者