C09~C12
领读人: 小明
日期: 2025-10-19 21:02:04
录制文件:https://meeting.tencent.com/crm/2VmJbDBx46
密码:LYRT
博弈已成定局
心计实验:
每个人输入自己的志愿,心计系统计算罚分,给予总体罚分最小的分配
|
惩罚权重 |
A(a,b,c) |
B(b,a,c) |
C(a,c,b) |
|
a |
1 |
4 |
1 |
|
b |
4 |
1 |
9 |
|
c |
9 |
9 |
4 |
学生策略:在第二、第三志愿填写热门专业,以确保分配到第一志愿;
这套机制在鼓励撒谎
撒谎有什么影响?在博弈游戏中,撒谎和欺骗影响个人收益;
“独占”-- “平分”游戏
|
独占 |
平分 |
|
|
独占 |
0,0 |
10000, 0 |
|
平分 |
0, 10000 |
5000,5000 |
每个人的收益:
对A:
选择平分: P(A觉得B平分) * P(A平分) * 5000
选择独占: P(A觉得B平分) * P(A独占) * 10000
对B:
选择平分: P(B觉得A平分) * P(B平分) * 5000
选择独占: P(B觉得A平分) * P(B独占) * 10000
如何改善?
引入信号量(命令),两个人的策略都按照信号量进行;
引入概率,改变均衡局势,明确先验概率
第二高价拍卖机制:
拍卖能不能让真正需要这个物品的人获得?
第一高价的问题: 只要有一方哄抬价格,需要的人就要被迫抬价
第二高价:单独一方哄抬价格没有收益,系统不会以这个价格成交
P(x | history) = P(history | x) * p(x) / p(history)
贝叶斯VS达尔文:
- ⻉叶斯公式表明,如果你知道某个⼈要说什么,那么你听他说话也学不到什么。
单个科学家的意见是不可信的,但科学家群体会产生类似演化的效应,让正确概率最高的理论生存下来

在互联网土壤上,fitness与情绪化相关
思考:反过来,通过生存的物体,可以推断fitness函数的趋势
奥卡姆剃刀
一些神奇的理论:
母体理论:大部分智慧文明喜欢母体,有足够多的智慧文明,所以选取一个文明,他处在母体里的概率无限趋近1
上星期四理论:一切都在上星期四刚刚创造出来
奥卡姆剃刀: 如无必要,勿增实体
过度拟合:如果事后解释的数⽬⽐数据增⻓得还快,那么⽆论数据是什么,我们都能找到办法解释它们。典型场景:事后的球评预测
过度诠释:Spurious Correlation
简单性的例子:关于运动的产生:1. 真空中所有物体下落速度相同 2. 运动是相对的 3. F=ma,是速度的来源。
复杂的例子:气象模型,AlphaGO模型;一个问题天然具有所罗门诺夫复杂度
如何解决过拟合(信息茧房)?
- 扩大数据, 100倍VC维度
- 交叉验证
- 正则化

logP[T]可以视为正则化项,它也是一种偏见,来源于剃刀原则,越复杂的项,可能性越低
sigma (P(T)) = 1
N,a0,a1,a2,...,an --> P(a0) + P(a1) + .. P(an) = 1
P(ax) = 1 / (2^N)

