C19~C22
SEED共读共在读书会210期《贝叶斯的博弈》C19-C22
领读:@Yuan
日期: 2025-12-28 21:02:18
录制文件:https://meeting.tencent.com/crm/N8Azja7z2f
密码:JCLG
-
C19 贝叶斯大脑 (大脑也是贝叶斯式的)
- 没有事实,只有诠释 —— 尼采
- ^^**核心论点:我们大脑运转的底层逻辑就是基于贝叶斯推断的,只是我们的自我意识不自知**^^
- 进化论视角:如果贝叶斯是最优学习方式,自然选择必然会选择它。
- 认知科学:大脑进行的贝叶斯推断其实是对感官接收到的信息进行的无意识处理
- 婴儿的学习也是基于贝叶斯推断的
- 空间概念认知
- 语言回路
- 天生具备的技能是有限的,但我们会在古老的贝叶斯直觉上循环利用那些古老的系统来构建新的技能(如阅读、数学)
-
视觉感知中的贝叶斯推断(为什么有视觉错觉?)
- 地形图错觉(山峰还是山谷?)

- 先验偏见:光源通常来自上方(太阳/电灯)
- 推断:大脑利用隐藏变量(光源位置)解释观察到的阴影
- 原理:视皮层拥有出色的无意识能力,我们的大脑似乎会立刻利用隐藏变量来理解观察到的变量,这个过程与之前提到的贝叶斯网络和玻尔兹曼机非常相似
- P(山峰∣阴影)=P(阴影)P(阴影∣山峰)⋅P(山峰)
- 这就是贝叶斯推断的核心逻辑:
- $$P(\text{山峰}|\text{阴影}) = \frac{P(\text{阴影}|\text{山峰}) \cdot P(\text{山峰})}{P(\text{阴影})}$$
- 其中,$P(\text{山峰})$ 就是先验概率——在没有看到具体阴影之前,大脑对"这里是山峰"的默认信念。而这个先验,被"光从上方来"这个假设深深影响。
- 几何与透视错觉
- 例子:两条笔(垂直⊥)、透视平面上的人像大小、棋盘阴影错觉
- 解释:大脑自动代入透视规则和光照模型,修正感知结果。
- 例子:两条笔(垂直⊥)、透视平面上的人像大小、棋盘阴影错觉
- 运动感知(菱形移动实验)
- 高对比度:准确判断运动方向。
- 低对比度:感知偏差(倾向向右下方移动)。
- 贝叶斯解释:低对比度引入不确定性,大脑在不确定性下依据先验概率做出“最优”但错误的预测
- 视频中像素亮度的改变是怎么被翻译为视频中物体的运动的呢?
- 我们的大脑皮层首先能够做到的就是检测出图像中的线条。这样的话,当菱形移动时,大脑明显会看到菱形的边在移动。但菱形的每条边都是倾斜的,所以,当菱形从左往右移动时,菱形的边却似乎在往另一个方向移动。实际上,所有移动中的线段都像是在以垂直于直线的方向往右边移动。对于无限长的直线来说,这样的移动其实无法与任何往右的平移区分。
- 大脑会结合菱形所有边可能的运动,并且假设菱形本身只沿一个方向移动
- 这种额外的不确定性会导致贝叶斯式计算产生差异。当不确定性足够大的时候,贝叶斯推断得出的结论就会更倾向菱形往右下方移动这个假设,也就是说这种移动方式是最大的后验估计
- 真是难以置信!大脑的错误预测可以解释为大脑的贝叶斯计算中因引入对比度下降带来的额外不确定性而得到的结果!这种预测是错误的,但这种错误有它的理由,因为这就是贝叶斯大脑在面对不确定性时最好的处理方法!
- 视频中像素亮度的改变是怎么被翻译为视频中物体的运动的呢?
- 地形图错觉(山峰还是山谷?)
- 贝叶斯抽样
- 机制:大脑不只计算单一最优解,而是对概率分布进行抽样(类似MCMC)
- 但大脑更倾向于顺次思考
- 一次只能看到一种解释,在不同解释间跳跃

- 与其像纯粹贝叶斯主义者那样同时利用多个互不相容的理论来得出结论,大脑更倾向于顺次思考,首先考虑非常可信的模型,如果还有时间的话,然后再考虑其他可信模型。
- 一次只能看到一种解释,在不同解释间跳跃
- 众包智慧:由于大脑进行概率抽样,对自己提问两次取平均(尤其间隔一段时间),往往比单次回答更准确
- Bayesian sampling in visual perception.Proceedings of the National Academy of Sciences.R.Moreno-Bote,D.Knill,and A.Pouget (2011)
- 被试采用某种解释的时间比例就是被试对于这一解释的贝叶斯置信度。贝叶斯大脑进行的抽样似乎恰好遵循概率法则
- [[BOOK/A Thousand Brains]]
- Measuring the crowd within:Probabilistic representations within individuals.Psychological Science.E.Vul and H.Pashler (2008)
- Bayesian sampling in visual perception.Proceedings of the National Academy of Sciences.R.Moreno-Bote,D.Knill,and A.Pouget (2011)
- 归纳问题
- How to grow a mind:Statistics,structure,and abstraction.Science.J.Tenenbaum,C.Kemp,T.Griffiths and N.Goodman(2011)
- 概念学习(Tufa实验)
- 现象:仅需极少样本(3个例子)即可掌握新概念。
- 原理:层次贝叶斯计算(Hierarchical Bayesian)。
- 假设事物呈树状结构。
- 寻找包含样本且离根节点最远的节点(最大似然)
- 归纳问题的一个简单但有说服力的解释,就是从先验上假设所有事物组成的集合构成了树的结构,那么MAP模型就是似然度最大的模型,也就是使得特南鲍姆的3个例子属于“tufa”的概率最大的定义。通过非常简单的计算就能看出,那就是包含所有例子但又最远离树根的那个结点
- 学习如何学习(Meta-learningg)
- 对树结构的必要性的学习,以及对事物分类的树结构的学习,似乎都是层次贝叶斯计算的推论。也就是说,大脑似乎进行的是层次贝叶斯计算。
- 层次贝叶斯主义的做法可以被视为一种学习“如何学习”的方法。
- 层次学习让我们能够忽略那些无关紧要的变量,专注于那些重要的变量。
- 层次贝叶斯方法能够迅速确定用什么方式才能将有关世界的模型正确地组织起来
- 一旦发现了这些模型的正确结构,学习过程就能大大加速,因为之后的学习可以在恰当的受限模型中进行。
- 更明确的例子,那就是LDA
- Learning a theory of causality.Psychological review.N.Goodman,T.Ullman and J.Tenenbaum (2011)
- 抽象的恩赐
- 层次模型能迅速确定一般性原则(如因果律、分类结构),加速具体知识的学习。
- 他们考虑了多个一般性的模型,其中每一个模型都可以分为不同的特殊因果模型,而这些模型又可以细分为不同的特殊情况
- 所罗门诺夫归纳法
- 层次贝叶斯学习一开始在所有层次上都很缓慢,但在研究几百到数千个抽样之后,整个层次结构最终会将贝叶斯置信度放在正确的一般性理论之中
- 令人感兴趣的是,对正确的一般性理论的学习要比更低层次的学习快得多。这个观察结果的推论之一,就是直接从正确的一般性理论开始学习,基本上不会节省多少
- 同感费解,找了原文,机器也这样翻译。最后给gpt看了,它表示解释可能是:所以这个推论的核心逻辑是:虽然"正确的一般性理论"一旦被掌握会让学习效率提升,但这种掌握是建立在大量样本和低层次学习的基础之上的。试图跳过这一过程,直接从高层次理论入手,可能因为理解难度太大而无法带来时间上的节省
- 学习模型中一般性原则的速度其实相对较快,它们无须预先处理好的学习模型
- 层次贝叶斯方法似乎完全能够从大量理论的一般结构之中分辨出最能对经验数据做出适当解释的结构
- 层次模型能迅速确定一般性原则(如因果律、分类结构),加速具体知识的学习。
- 婴儿认知与语言习得(婴儿都是天才)
- 婴儿并非白板,生来具有概率直觉(小球实验)
- Intuitive statistics by 8-month-old infants.Proceedings of the National Academy of Sciences.F.Xu and V.Garcia (2008)
- 8个月大的婴儿似乎已经能够从直觉上把握拉普拉斯的贝叶斯式计算
- 语言学习
- Statistical learning by 8-month-old infants.Science.J.Saffran,R.Aslin and E.Newport (1996)
- 强烈依赖于对语言中被称为“音位”的基本语音单位的统计性质的考察
- 统计音节规律(马尔可夫链)来切分单词。
- 句法结构习得(名词vs动词)
- 令人震惊的是,婴幼儿似乎除了能够辨别这些统计规律以外,甚至还能够确定有可能作为单词分界的音节划分方式,这大概是通过贝叶斯推断做到的
- 要从口语中学习单词的话,似乎必须进行某种贝叶斯计算
- 互斥性偏见:通过“不是A就是B”的逻辑习得新词汇(如“镀铬的碗”)
- 学习计数
- 递归算法
- 只能通过统计学习的小孩子能够辨别并选择这个抽象的递归算法
- 德阿纳指出,这种思考并利用递归算法的能力可能就是人类与动物的大脑之间的根本性差异。
- 递归算法
- 心智理论
- 心智理论,也就是思考其他人正在思考什么的能力,以及利用对他人的思考建立的模型来建立预测或者学习新概念的能力
- 婴儿能推断他人意图和样本偏差(蓝球/黄球取样实验)
- 先天 vs 后天
- 贝叶斯大脑调和了乔姆斯基(先天结构)与斯金纳(经验学习)
- 结论:先天提供抽象的层次贝叶斯结构,后天通过数据填充模型
- 婴儿并非白板,生来具有概率直觉(小球实验)
-
C20 一切都是虚构 (虚构想象、有用就好)
- ∴ 智慧可以简单地归结为确定哪些虚构叙事是有用的
- 怀疑一切和相信一切是两种同等方便的办法,因为两者都无须思考。—— 庞加莱
- 第一个原则就是不要骗自己——你自己就是最好骗的那个人。 ——费曼
-
质疑现实的本质
- 柏拉图洞穴与黑客帝国:我们感知的只是“影子”或神经电信号
-
更进一步:反实在主义
- 科学模型(如原子、时空)是有效的叙事,而非绝对真理。
- 一切事物都只能是某种虚构,或者说,所有事物都只是无限个随机算法的模拟,而我们其实就是在这些随机算法上下赌注
- 合格的贝叶斯主义者必然会否定这样的假设:必然存在某种与人们的想象相符的现实,一个超越了柏拉图洞穴的宇宙,或者说“母体”以外的物质世界
-
虚构举例
-
生命:难以定义的虚构
- 传统生物学视角(基于物质构成)
- 将生命限制在生物中常见的分子范围内。
- 是否存在脱氧核糖核酸(DNA)和核糖核酸(RNA)。
- 局限性:定义的边界模糊,例如病毒是否算作生命仍存在争议。
- 物理化学视角(卡尔·弗里斯顿的理论)
- 弗里斯顿(Karl Friston)将生命等同于生物典型的物理化学性质,提出了一套基于热力学和贝叶斯推断的定义框架。
- 核心概念:马尔可夫覆盖 (Markov Blanket)
- 定义:一种将内部结构与外部环境分隔开来的稳定物质结构。
- 典型案例:细菌的细胞膜。
- 运行机制:预测与计算
- 维持结构的关键:内部结构必须能够预期来自外部的扰动,并确定能否从中获取可资利用的自由能(Free Energy)
- 调整自己以适应环境(让内部状态与外部环境尽可能一致) = 调整参数以逼近真实分布,寻求近似解
- 当细胞感觉到外部冷了(数据输入):它的内部模型预测是“温暖的”。这就产生了巨大的“预测误差”(自由能高)。
- 细胞开始调整内部结构:它改变化学浓度,或者让离子通道打开(这就是在“捏橡皮泥”)。
- 结果:细胞内部产生热量,或者移动到暖和的地方。现在,内部状态(预测)和外部感受(数据)一致了。
- 调整自己以适应环境(让内部状态与外部环境尽可能一致) = 调整参数以逼近真实分布,寻求近似解
- 计算本质:这种自然过程的运转,本质上是内部结构在对贝叶斯公式进行某种近似计算(即“变分贝叶斯方法”)
- 变分贝叶斯(Variational Bayes)
- 用一个简单的、可计算的模型,去无限逼近那个复杂的、不可计算的真实真相。
- KL散度最小时的近似解。
- 变分贝叶斯(Variational Bayes)
- 维持结构的关键:内部结构必须能够预期来自外部的扰动,并确定能否从中获取可资利用的自由能(Free Energy)
- 生命的本质定义
- 结构定义:生命是被稳定薄膜(马尔可夫覆盖)与外界分隔开来的有限环境中的结构。
- 热力学定义:生命是在熵值极大的海洋中,被马尔可夫覆盖分隔开来的熵值极低的阱 (Low-entropy well)。
- 核心概念:马尔可夫覆盖 (Markov Blanket)
- 弗里斯顿(Karl Friston)将生命等同于生物典型的物理化学性质,提出了一套基于热力学和贝叶斯推断的定义框架。
- 传统生物学视角(基于物质构成)
-
债务与货币: 经济的虚构
- 债务是核心
- 被视为人类历史上最伟大的创新(《[[BOOK/债:第一个5000年]]》)。
- 经济和技术进步的真正引擎,推动了跨时间的资源配置。
- 货币是表现
- 旨在记录和追踪债务的虚构叙事。
- 为了让债务顺利运作,社会需要一个系统来保证任何两个个体在任何时刻都能对“互相欠下的债务”达成一致并记忆下来。这个系统就是货币体系
- 本质:
- 神话属性:如同宗教传说或神话一样,货币的价值完全依赖于集体信任(《[[BOOK/Sapiens人类简史]]》)。
- 模型属性:虽然债务本身是一个“错误的模型”(它不是物理实体),但它极度有用,无论是对个人生活还是社会运转。
- 债务是核心
-
社会契约:政治的虚构
- 构成要素:国家(The State)、人权(Human Rights)、自由(Freedom)。
- 本质:这些概念在自然界中并不存在,它们均属于“有用的虚构”。
- 作用:通过共同相信这些故事,人类得以突破邓巴数(Dunbar's number)的限制,进行大规模的协作。
-
个体意识的解构:“自我”的幻象
- 大卫·[[休谟]]的洞见(贝叶斯主义先驱):
- “人”并非一个恒定的实体,而是一束或一组以难以想象的迅捷速度前后相继的感知集合 (Bundle of perceptions)。
- 蒂博·吉罗:
- “我”(The Self)本身也是一个虚构的叙事。
- 尽管是一种幻象,但这个虚构叙事对于整合感知、形成记忆和规划未来是有用且必要的。
- 大卫·[[休谟]]的洞见(贝叶斯主义先驱):
-
-
目的论 & 因果论
- 目的论
- 以结果解释现象(自由意志是目的论的特殊情况)
- 尽管被视为非科学,但广泛存在于物理和生物学中
- 物理学:最小作用量原理(量子场论核心)、热力学第二定律(趋向平衡)、肥皂泡(最小化表面能)、电子轨道(能量最低)
- BUT
- 经典物理:在确定性世界中,选择由大脑电化学反应预先决定
- 量子物理:即使引入随机性(哥本哈根诠释),选择也仅是“反应+随机”的结果
- 量子场论:作为最优秀的物理理论,其方程中没有“自由意志”的位置
- BUT
- 生物学:基因的意图或策略(如[[BOOK/The Selfish Gene自私的基因]] by [[Richard Dowkins道金斯]])
- 物理学:最小作用量原理(量子场论核心)、热力学第二定律(趋向平衡)、肥皂泡(最小化表面能)、电子轨道(能量最低)
- 因果律的局限
- 结果不能先于原因(模型特征为贝叶斯网络)
- 非因果模型的存在:
- 马尔可夫随机场:无方向的依赖关系
- 广义相对论:时空是整体存在的(块状宇宙),时间只是路径函数,不存在“一秒接着下一秒”的演化,因此因果律并非基础概念。
- 矛盾调和:
- 路径一:数学等价性(还原论视角)
- 原理:在特定假设下,目的论方程与因果论方程数学等价。
- 变分分析:最小作用量(目的论) $$\Leftrightarrow$$ 欧拉-拉格朗日微分方程(因果论)。
- 控制论:动态规划(目的论) $$\Leftrightarrow$$ 哈密尔顿-雅可比-贝尔曼方程(因果论)。
- 现状:虽然可以互相转换,但在许多情况下(如博弈论),目的论视角更自然
- The New Big Fish Called Mean-Field Game Theory.Science4All.L.N.Hoang(2014)
- 原理:在特定假设下,目的论方程与因果论方程数学等价。
- 路径二:贝叶斯模型融合(整体论视角)
- 模型森林:纯粹贝叶斯主义者允许互不相容的模型共存
- 智慧:接受互不相容但有效的多个模型(模型森林)比单一模型的“树”更睿智。
- 预测:预测结果是不同模型预测的结合。
- 理论的真实性与有用性:
- 主体间性:不同大脑中相似的神经元模式(如对“红色”的感知)暗示了某种独立于模型的真实性。
- 有用性定义:如果一个非预测性理论(如牛顿定律、进化论)被大量预测性模型重复使用,它就是有用的。(理论边界:可信范围 (Scope of Credibility)
- ∴ 不存在单一的完美理论,普适模型由大量互不相容但适用范围重叠的理论结合而成
- 模型森林:纯粹贝叶斯主义者允许互不相容的模型共存
- 路径一:数学等价性(还原论视角)
- 终极推论:现实、计算与虚构:宇宙可被视为某种计算,但由于逻辑深度和复杂度,寻找终极“源代码”是不切实际的。
- 计算的极限(图灵-丘奇论题):
- 假设:宇宙中任何事物都不能完成图灵机无法完成的计算。
- 推论:任何图灵完备的机器都包含了宇宙的所有规律。
- 真理的不可知(莱斯定理Rice's theorem与所罗门诺夫复杂度)
- 不可判定:莱斯定理证明,对代码(宇宙规律)进行系统分析是不可判定的。
- 欺骗机制:如果宇宙代码的所罗门诺夫复杂度 > 观察者拥有的信息量,宇宙可以“欺骗”观察者。
- 结果:即使拥有无限算力,也无法确认任何绝对真理。
- 结论:^^一切皆虚构^^
- 既然无法触达绝对真理,所谓的现实和理论本质上都是虚构。
- 智慧不在于发现真理,而在于确定哪些虚构叙事是“有用”的。
- 计算的极限(图灵-丘奇论题):
- 目的论
-
(工具主义的)虚构主义 (非实在论) 的价值
- 科学的意义:寻找可靠且适用的模型,而非绝对真理
- 对抗过度自信:视理论为工具而非信仰
- 情绪管理:减少对“真理”的情感依附,降低教条主义
- 学习的连续性:知识是渐进更新置信度的过程。
-
认知机制:大脑作为模拟器进行预测
- 我们对世界的理解(猫、气候变暖、宇宙史)完全依赖于感官信息(视觉、听觉、触觉等)。
- 大脑被马尔可夫覆盖封闭,通过感官数据重建外部世界模型大脑,从而进行预测 (Friston/Hinton)
- 现实的本质:主观构造与“有用”的虚构
- 模型的目标
- 大脑构建“外部世界模型”并非为了追求真理,而是为了解释当下的感官感受,并以最合适的方式影响未来的感知。
- 思想的封闭性
- 思想是被封闭在马尔可夫覆盖内部的构造,因此本质上是主观的。
- 重要的是我们在覆盖上获取了什么数据,而非覆盖之外实际上是什么。
- 对“客观现实”的存疑
- “外部世界客观存在”只是一个假说(类似于《黑客帝国》中的模拟世界)。
- 纯粹贝叶斯主义者不会盲目相信这一假说,因为由于感官数据的阻隔,我们无法验证它
- 模型的目标
-
生命的数字化隐喻:读取比特流
- 猫存在于二进制代码中吗?
- 现象:我们感知到的“猫”,本质上是大脑将感官探测到的数据(比特)关联起来形成的某种概念。
- 极端推论:生命 = 大脑读取海量比特流(数据文件)的过程。
- 虚构叙事的生成
- 读取这个庞大的数据文件,引导大脑发明了那些我们认为“真实”的叙事(如物体、历史、宇宙)。
- 逻辑深度 (Logical Depth):为什么我们相信宇宙有漫长的物理历史?因为这是解释当前观察结果(数据)最合适、最经济的方式(即想象宇宙是从一个简单状态经过漫长计算演化而来的)。
- 猫存在于二进制代码中吗?
-
终极本体论:所罗门诺夫妖的非实在论
- 什么才是真正“存在”的?
- 对于所罗门诺夫妖(理想的归纳推理者)来说,数据文件本身只是产物。
- 真正基础存在的只有:
- 算法 (Algorithms):生成数据的规则。
- 随机性 (Randomness):算法依赖的无法描述的随机源。
- 存在的层级
- 算法的叠加:所罗门诺夫妖相信的是各种算法和随机性的叠加结果。
- 现实的地位:我们眼中的“现实世界”(虚构叙事),只是这些算法运行时的中间步骤。
- 结论:这些中间步骤也可以说是“存在”的,但其存在的层级不如生成它们的算法基础。
- 简单说:
- “外部世界”是一个巨大的数据文件(0和1)。
- 我们是读取该文件的算法。
- 存在之物:唯一真实存在的可能是产生这些虚构叙事的随机算法
- 什么才是真正“存在”的?
- ∴ 智慧可以简单地归结为确定哪些虚构叙事是有用的
-
C21 信念的起源 (贝叶斯在精神与文化上的作用)
- 要严密地理解伦理,必须先理解数学。——[[苏格拉底]]
- 解决这个问题(在人工智能中编入道德)是一个值得投入下一代最伟大的数学人才去解决的研究挑战。——尼克·博斯特罗姆
- 科学中最激动人心的不是“我发现了!”,而是“这有点怪啊……”。——[[阿西莫夫]]
-
1. 科学直觉的演变
- 发散级数案例:数学界对违反直觉的概念(如 $$\sum n = -1/12$$、虚数、无穷小)从排斥到接受的过程
- 数学结论的违反直觉性:不存在任何线性、正则及稳定的求和法能对所有正整数之和给出有限结果,但特定条件下的级数(非重心型线性递推式+收敛级数)能以唯一方式求和。
- 普朗克原理:新真理的胜利往往伴随着旧一代的逝去。
- 发散级数案例:数学界对违反直觉的概念(如 $$\sum n = -1/12$$、虚数、无穷小)从排斥到接受的过程
-
2. 信念的非理性来源
- 环境塑造:
- 军校经历(被灌输等级与服从)
- 亚洲旅行(锚定效应、文化背景对死刑/道德观的影响)
- 大城
- 权威与从众
- 米尔格拉姆实验(电击):67%的人盲从权威
- 旁观者效应:统计数据无法改变个人行为预测(认为自己是例外)
- 动机性推理 (Motivated Reasoning) - 大脑倾向于过度解读观察到的随机相关性
- 先有直觉,后有推理(律师与客户的关系,屁股决定脑袋)
- 卡内曼的项目估时错误(专家也无法避免过度自信)
- 迷信的产生(斯金纳的鸽子):对随机性的过度解读,对直觉的“事后合理化”
- “手感”错觉:篮球中所谓的“手感”其实遵循纯粹随机分布。长串相同的随机结果(如连续投中)在独立随机变量中出现的概率比直觉认为的要高得多。
- 环境塑造:
-
3. 信念的宏观演化与传播
- 思想的达尔文主义
- 模因竞争
- 不同的信念无休止地竞争人类宿主的心灵。
- 幸存者偏差:流传至今的信念(如特定的宗教或传统)不一定是最可靠或最真的,而是最能适应生存竞争的。
- 群体选择:宗教/意识形态作为社会粘合剂
- 生存压力:人类个体无法独自生存,小部落易被吞并,因此必须在大型文明中群居。
- 结构需求:大型文明需要社会层级,而宗教为这种层级提供了合理化解释,维护了社会秩序。
- 结论:没有宗教(或类似社会粘合剂)的群体可能因无法维持大规模协作而灭绝(火种未传下来)。
- 宗教的衰退与市场经济
- 新机制:市场经济带来的精细分工,让个人私利与社会利益趋于一致(亚当·斯密)。
- 去中心化:在没有核心机构(如宗教权威)协调时,精细分工反而获益更多,因为个体更了解自身能力。工业革命后的文明因此推翻了旧有的宗教社会秩序。
- 模因竞争
- 思想的达尔文主义
-
4. 贝叶斯视角下的信念与学习
- 过滤气泡(信息茧房)与群体极化:
- 我们只消费认同的信息。群体讨论导致观点更极端
- 实用贝叶斯解释:
- 效用优先:相信群体相信的东西是“有用”的,因为共有模型能迅速预测群体行为。
- 有神论的置信度:对于实用贝叶斯主义者,如果身处有神论团体,“上帝存在”是一个有用的模型(赋予高置信度),尽管他知道“所有模型都是错的”
- 主观性与适应性
- 主观的必然:每个人的数据来源不同(环境不同),导致贝叶斯推断必然主观
- 婴儿语言学习:婴儿迅速适应母语,通过混淆对预测无用的声音差异来提高处理效率(代价是成年后难以区分外语特定音素)
- 依赖模型的实在论:可以接受神祇的“现实性”,前提是该神祇存在于特定的模型中。
- 过滤气泡(信息茧房)与群体极化:
-
5. 先天偏见与认知局限
- 非白板说:大脑预设了偏见(Bias)
- 生理基础:大脑生来就有偏见(预先存在的信号处理机制),用于处理感官信号以适应环境。
- 单样本学习 (One-shot Learning):正是这种先天偏见让我们能从极少样本中快速学习。
- 基因影响:基因倾向影响政治信念(同卵双胞胎即使分开抚养,政治观点也比收养兄弟姐妹更相似)。
- 知识的获取与认知的谦卑:
- 我们心中高置信度的模型,其适用范围往往比预想的要狭窄得多
- 贝叶斯式的觉醒:理解自己“不知道什么”以及“为什么不知道”,是通往真理(或更有用的模型)的必经之路
- 非白板说:大脑预设了偏见(Bias)
- CONL.
- 我们的信念并非纯粹理性的产物,而是进化压力(群体选择)、心理机制(直觉合理化)、先天偏见(基因与脑结构)以及环境数据(实用贝叶斯适应)共同作用的结果。承认“所有模型都是错的但有些是有用的”,并理解自身认知的局限性,是贝叶斯主义者的核心智慧。
-
C22 超越贝叶斯主义 (贝叶斯在道德上有用么?→ 无贝叶斯不成道德)
-
贝叶斯与道德
- 贝叶斯不是道德哲学:它是一种组织知识的工具,不规定善恶
- 贝叶斯视角:道德也是有用的虚构
- 每个人都拥有自己的道德观,而且同一社会群体中的每个个体通常都有相似的道德观
-
道德的起源
- 演化论视角:自然选择得到的道德
- 道德并非神授,而是基因存活策略的产物。
- 利他主义的解释:
- 亲属选择:保护携带相同基因的亲属。
- 同伴选择:互惠利他。
- 群体选择:群体的生存竞争。
- 尼采的道德谱系
- 贵族道德:“好”的反义词是“差”(想变好但做不到)。
- 平民道德:“好”的反义词是“坏”(可以变好但不希望这样做)。
- 群体认同:个体先对所在群体产生认同,然后为了为辩护群体理念屈从于非理性,并事后合理化自身立场
- 利他主义的解释:
- 道德直觉是为了基因延续,而非现代社会的“真理”
- 道德并非神授,而是基因存活策略的产物。
- 心理学视角:无意识的道德直觉
- 我们的道德判断深受无意识机制的操控,而非纯粹理性的产物。
- 认知流畅度:大脑厌恶思考,倾向于喜欢熟悉、容易理解的东西(如易读的字体),从而产生“好”的错觉。
- 证实偏差 (Confirmation Bias):直觉先行,理性殿后。理性往往沦为直觉的律师,专门寻找论据支持既定立场,否定反面证据。
- 策略建议:维护立场时,尝试寻找感情色彩相反的同义词(甚至贬义词)来自省。
- 启动效应 (Priming Effect):环境刺激在无意识中引导道德判断(虽然其在社交情景的长期效力仍有争议)。
- 强化学习 (Carrot and Stick)
- 道德习得类似机器学习,通过社会的“胡萝卜加大棒”训练而成。 这也是地理/社会地位相近者道德观点相似的原因。 隐忧:我们的道德直觉适应的是史前时代,且仅服务于基因存活,在现代社会可能已不再适用(甚至是有害的)

- 道德习得类似机器学习,通过社会的“胡萝卜加大棒”训练而成。 这也是地理/社会地位相近者道德观点相似的原因。 隐忧:我们的道德直觉适应的是史前时代,且仅服务于基因存活,在现代社会可能已不再适用(甚至是有害的)
- 我们的道德判断深受无意识机制的操控,而非纯粹理性的产物。
- 演化论视角:自然选择得到的道德
-
集体道德的困境:聚合的不可能性
- 投票与偏好的悖论
- 社会不存在一种自然的方法能完美地将个体偏好聚合成群体偏好。
- 理论困境:孔多塞悖论 (Condorcet Paradox) 与 阿罗不可能性定理 (Arrow's Impossibility Theorem)。
- 现实困境:集体决策往往是少数人的决定或权力的博弈,而非智慧的结晶。
- James Scott:“真正的民主始于听见那些从未被记录的声音。”
- 社会不存在一种自然的方法能完美地将个体偏好聚合成群体偏好。
- 个体偏好的一致性崩塌
- 阿莱悖论 (Allais Paradox):人类偏好违背了理性决策公理(冯·诺伊曼–莫根施特恩公理)。
- 道德循环与荷兰赌:如果道德偏好是循环的(A>B, B>C, C>A),庄家可以通过“荷兰赌”让你耗尽资源却回到原点。这证明了我们直觉上的道德往往是前后不一且低效的。
- ^^无意识的道德缺陷^^
- 受广告(曝光效应)、认知流畅度、第一印象(面孔100毫秒判断)影响
- 丹·卡亨实验:数学能力强的人在涉及政治立场时(枪支管制),推理能力反而服务于偏见。
- 投票与偏好的悖论
-
道德规范的探讨
- 义务论 (Deontology) - 康德 / 宗教诫条
- 特点:定言令式,普适规则(如“不可撒谎”)
- 贝叶斯批判:
- 过于死板,总有例外(凶手找孩子,为了救人而撒谎)
- 要保证某项道德原则总是正确的,我们似乎必须预见所有可能发生的事件
- 定义不完全(依赖语言定义,易被歪曲)
- 无法量化:无法处理优劣选项的权衡。
- 不可预测:要保证原则总是正确,需要预见所有可能性,这超出了人类认知。
- 过于死板,总有例外(凶手找孩子,为了救人而撒谎)
- 结果论 (Consequentialism) / 效用主义(Utilitarianism)
- 特点:最大化多数人的幸福
- 挑战:
- 什么是“幸福”?知识是目的吗?(Veritasium实验:追求被否定才能发现真理)。
- 预测未来的困难(需要极强的认识论基础)
- 必须知道什么会让人感到幸福,还有要怎么做才能达到这一目的
- 必须首先预言可以想象的各种行动会产生的后果
- 预设谬误:预设他人与自己有相同的偏好(这是错误的)
- 阿罗不可能性定理:无法完美聚合个人偏好
- 目标谬误:如果将“得出正确结论”作为唯一目标,会导致风险规避和停滞(真正的研究者和数学家是在不断犯错中前进的)
- ^^无处安放^^
- 你看到这个原则的局限性了吗?它预先假设了其他人都与你有着相同的偏好
- 道德资本(Moral Capital)
- 布伦南认为,所有个体都积极参与政治生活的社会并不是理想的社会;所有个体都花时间做自己热衷的事情,那才是理想的社会
- 效用主义者最终对待这两种人的方式会相当不同,而对待这些人的方式也可能不同于效用主义者本身希望被对待的方式
- 议事的科学
- 在最近几十年中,人们提出了不同的替代选举机制,它们拥有更好的数学性质,比如多数判断选举(majority judgment)和随机孔多塞投票(randomized Condorcet voting)。
- 了解情况也有代价,但投出有根有据的一票几乎不会获得什么好处。
- 社会的道德目标似乎并不能从公民的道德直觉中推演出来,而如果出发点是这些公民对自身渴望的叙述的话,那就更不可能了。我们的集体道德直觉似乎既反复无常又缺少根据,既易于被操纵又前后不一,而且也不适应现代生活。
- 阿莱的实验就指出我们的偏好违背了冯·诺伊曼–莫根施特恩公理[插图]。几乎可以确定我们的道德也是如此。更具体地说,这意味着我们有可能认为情况[插图]在道德上比情况[插图]更好,情况[插图]在道德上比情况[插图]更好,而情况[插图]又比情况[插图]更好。但这样的话,所谓的“荷兰赌论证”(Dutch book)就证明了庄家可以让你花点小钱,将赌注先从[插图]移到[插图],然后从[插图]移到[插图],之后又从[插图]回到[插图]。最终你花了钱,情况却没有改变,只是白白浪费了时间、精力和金钱。
- 他们就应该是贝叶斯主义者
- 义务论 (Deontology) - 康德 / 宗教诫条
-
贝叶斯结果论 (Bayesian Consequentialism)
- 核心主张:无贝叶斯不成道德。
- 如果关注结果,就必须有能力预测结果(贝叶斯是预测工具)。
- 实践原则:
- 利用先验偏见:在不了解他人时,基于一般概率行事(避免冒犯)。
- 考虑不确定性:计算期望效用(Expected Utility)。
- 决策公式:$$E[\text{score}] = \sum P(\text{result} | \text{action}) \times \text{score}(\text{result})$$
- 谦逊与学习:
- 承认无知,向专业人士学习。
- 避免“直觉先行”,对抗过度自信。
- 结论:道德决策本质上是统计决策。要成为更好的道德主体,必须先衡量自身的无知,并修正贝叶斯置信度。
- 核心主张:无贝叶斯不成道德。
-
CONL. 无贝叶斯不成道德
- 对抗自信过度:为了达到更高的道德水准,首要任务是与“自信过度”做斗争。我们对日常事物的理解往往充满错觉。
- 冯·诺伊曼:“如果有人不相信数学是简单的,那是因为他没有意识到人生有多复杂。”
- 在道德问题上,我们要尽量避免得出(绝对的)结论,而是不断更新我们的置信度
- ING {{word-count}}
- 大多数人的道德?
- 著名的孔多塞悖论与阿罗不可能性定理也会指出,不存在任何自然的方法可以从个体的偏好顺序得出整个群体的偏好
- 在过去数千年的时间里,人类群体中产生的集体决策基本上是少数几个人做出的决定,或者某些花费很长时间才达成的共识,而这些共识往往由颇具威望的人主导,而付出代价的就是那些更内敛的人。
- 集体决策本质上是权力与声音的博弈,而非智慧的结晶。这种决策暴力在数字时代以更隐蔽的方式延续。政治学家詹姆斯·斯科特(James Scott)在《弱者的武器》中启示我们:"真正的民主始于听见那些从未被记录的声音。"
- 选举仍然具有某些数学性质
- 议事的科学
- 在最近几十年中,人们提出了不同的替代选举机制,它们拥有更好的数学性质,比如多数判断选举(majority judgment)和随机孔多塞投票(randomized Condorcet voting)。
- 了解情况也有代价,但投出有根有据的一票几乎不会获得什么好处。
- 社会的道德目标似乎并不能从公民的道德直觉中推演出来,而如果出发点是这些公民对自身渴望的叙述的话,那就更不可能了。我们的集体道德直觉似乎既反复无常又缺少根据,既易于被操纵又前后不一,而且也不适应现代生活。
- 阿莱的实验就指出我们的偏好违背了冯·诺伊曼–莫根施特恩公理[插图]。几乎可以确定我们的道德也是如此。更具体地说,这意味着我们有可能认为情况[插图]在道德上比情况[插图]更好,情况[插图]在道德上比情况[插图]更好,而情况[插图]又比情况[插图]更好。但这样的话,所谓的“荷兰赌论证”(Dutch book)就证明了庄家可以让你花点小钱,将赌注先从[插图]移到[插图],然后从[插图]移到[插图],之后又从[插图]回到[插图]。最终你花了钱,情况却没有改变,只是白白浪费了时间、精力和金钱。
- 阿罗不可能性定理
- 道德义务论
- 规范伦理学的两种主要思路就是义务论和结果论。义务论就是对权利和义务的预先规定,而结果论则不考虑具体的行为,道德评判的唯一根据就是结果
- 康德认为,定言令式最基本的性质就是普适性。
- 反对:
- 无论义务论的原则是什么,其中似乎总有例外
- 在更一般的情况下,我们很难预见某项义务原则是否总是
- 妥当要保证某项道德原则总是正确的,我们似乎必须预见所有可能发生的事件
- 道德义务论似乎过于死板[插图]。
- 它的定义必定不完全
- 人们歪曲义务原则中词语的定义。
- 没有区分优劣不同的选项。
- 无论义务论的原则是什么,其中似乎总有例外
- 结果论者与义务论者恰好相反,他们不接受任何定言令式,重要的只有结果。当且仅当某个行动能导向合适的结果时,它才合乎道德。只要结果的确可取,那就说明手段正当
- 知识是合理的目的?
- 理的目的吗?
- 目标是什么?就是进行预测吗?我们可不可以认为尝试得出正确结论就是合理的目的?答案绝对是否定的
- 答案绝对是否定的。即使是在KL散度这种精细的意义上,尝试得出正确结论也有局限性。这是因为,要得到正确的结论,只需要停留在容易预测的问题上。我们唯一需要做的就是只考虑那些我们已经非常了解的事物,这也是我们自然会去做的事情,我们会将自己困在熟悉的日常之中——有时候甚至主张这种日常就是现实。所以对于总希望得到正确结论的人来说,好奇心是个糟糕的策略。如果工程师不知道自己在做什么,那就最好停手。相反,研究者在职业生涯中常常犯错。没有人比数学家更经常犯错,他们整天都在草稿纸上涂涂改改。如果研究者知道自己在做什么,那就最好停手。
- 更糟糕的是,为了达到总是得出正确结论的幻觉,我们的大脑以及其中的大量认知偏差总是会否定所有自身犯错的情况,而将那些自身正确的情况奉为圭臬。最麻烦的是,这种做法可能是有意而为的,也可能是出于无意的。这就是著名的证实偏差(confirmation bias)
- 效用主义
- 最主流的结果论道德哲学断言,我们需要达到的目标就是最多数人最大的幸福。这就是所谓的效用主义(utilitarianism,又译“功利主义”)。
- 它们都需要出色的知识哲学作为基础
- 就必须知道什么会让人感到幸福,还有要怎么做才能达到这一目的。
- 必须首先预言可以想象的各种行动会产生的后果
- 我们常常低估所谓道德资本(moralcapital)[插图]的价值
- 布伦南认为,所有个体都积极参与政治生活的社会并不是理想的社会;所有个体都花时间做自己热衷的事情,那才是理想的社会
- 你看到这个原则的局限性了吗?它预先假设了其他人都与你有着相同的偏好
- 效用主义者最终对待这两种人的方式会相当不同,而对待这些人的方式也可能不同于效用主义者本身希望被对待的方式
- 那么他们就应该是贝叶斯主义者
- 贝叶斯结果论者
- 贝叶斯效用主义者应该利用自身的偏见。如果要以最有利于其他人幸福的方式行动的话,那么这些偏见必不可少。
- 贝叶斯效用主义者应当时常考虑对方的想法与喜好
- 贝叶斯效用主义者也不会忽略对方很有可能更清楚自身偏好的事实,这也就解释了为什么贝叶斯效用主义者通常更倾向于让对方自由选择,让对方做自己喜欢的事情。
- 所有贝叶斯主义者都会不断尝试量化自身的无知程度,也同样会尝试估计对方的无知程度
- 如果贝叶斯结果主义者不完全理解那些更有能力的人提出的论证,却相信这些人所知甚多而且怀抱善意的话,那么他们就会尝试让这些人代替自己和所知更少的人进行决策[插图]。
- 贝叶斯谦逊主义:知情让权与批判性参与的平衡。这
- 一行为准则构建了一种新型伦理立场--当信息不对
- 称与善意假设同时成立时,知情让权(epistemic
- deference)成为道德义务,但保留批判性参与的权
- 利。这一框架既非盲目服从,也非固执己见,而是认
- 知分工的优化策略。如同计算机科学家唐纳德·克努
- 特(Donald Knuth)所言:"科学是能自我纠正的信
- 念系统--但前提是我们保留纠正者的纠正权。"在
- 这个信息爆炸的时代,或许真正的智慧不在于知道多
- 少答案,而在于清楚何时该提出问题,何时该保持沉
- 默,以及何时该将话筒递给更合适的人--同时永远
- 握着切断电源的开关。
- 贝叶斯结果论者一直都在考虑不确定性
- 采取能够最大化道德分数期望值[插图]的行动就是一项道德义务
- 在同构的意义上,这是唯一能够符合冯·诺伊曼–莫根施特恩公理的道德观点,因此不会受阿莱悖论的影响
- 贝叶斯结果论这个框架同样能让我们处理那些发生意外的可能性很小,但后果却极其严重的问题
- 与其投身于永无休止的辩论之中,贝叶斯结果论者更愿意优先进行这一概率的估计——还有确定这一估计的不确定性,以及为了降低估计的不确定性所需要的行动,和降低不确定性需要付出的代价。
- 必须先衡量自身无知的程度
- 为了达到更高的道德水准,我们似乎应该将与自信过度的斗争放在首要位置。
- 第一,利用先验偏见。
- 在不了解他人时,基于一般概率行事。比如,在葬礼上不讲笑话,因为大多数人在葬礼上不欢迎笑话。
- 第二,考虑不确定性。
- 不只看预期结果,还要考虑结果的不确定性。一个行动如果有很小的概率导致灾难,即使预期收益很高,也可能不值得做。
- 决策公式:
- $$E[\text{score}] = \sum P(\text{result} | \text{action}) \times \text{score}(\text{result})$$
- 第三,承认无知,向专家学习。
- 如果别人比你更了解某个领域,而且你相信他们是善意的,那就让他们来决策。
- 第四,避免"直觉先行",对抗过度自信。
- 作者提供了一个实用技巧:在维护自己立场时,尝试用感情色彩相反的同义词来描述。比如,如果你支持"民主",试着用"民粹"来描述同样的现象,看看你的论证是否还成立。
- 大多数人的道德?
-
