跳转到主要内容

C09~C12

领读人: 小明
日期: 2025-10-19 21:02:04
录制文件:https://meeting.tencent.com/crm/2VmJbDBx46
密码:LYRT

 

博弈已成定局

心计实验:

每个人输入自己的志愿,心计系统计算罚分,给予总体罚分最小的分配

惩罚权重

A(a,b,c)

B(b,a,c)

C(a,c,b)

a

1

4

1

b

4

1

9

c

9

9

4

学生策略:在第二、第三志愿填写热门专业,以确保分配到第一志愿;

这套机制在鼓励撒谎

撒谎有什么影响?在博弈游戏中,撒谎和欺骗影响个人收益;

“独占”-- “平分”游戏

独占

平分

独占

0,0

10000, 0

平分

0, 10000

5000,5000

每个人的收益:

对A:

选择平分: P(A觉得B平分) * P(A平分) * 5000

选择独占: P(A觉得B平分) * P(A独占) * 10000

对B:

选择平分: P(B觉得A平分) * P(B平分) * 5000

选择独占: P(B觉得A平分) * P(B独占) * 10000

如何改善?

引入信号量(命令),两个人的策略都按照信号量进行;

引入概率,改变均衡局势,明确先验概率

第二高价拍卖机制:

拍卖能不能让真正需要这个物品的人获得?

第一高价的问题: 只要有一方哄抬价格,需要的人就要被迫抬价

第二高价:单独一方哄抬价格没有收益,系统不会以这个价格成交

P(x | history) = P(history | x) * p(x) / p(history)

贝叶斯VS达尔文:

  • ⻉叶斯公式表明,如果你知道某个⼈要说什么,那么你听他说话也学不到什么。

单个科学家的意见是不可信的,但科学家群体会产生类似演化的效应,让正确概率最高的理论生存下来

image.png

在互联网土壤上,fitness与情绪化相关

思考:反过来,通过生存的物体,可以推断fitness函数的趋势

奥卡姆剃刀

一些神奇的理论:

母体理论:大部分智慧文明喜欢母体,有足够多的智慧文明,所以选取一个文明,他处在母体里的概率无限趋近1

上星期四理论:一切都在上星期四刚刚创造出来

奥卡姆剃刀: 如无必要,勿增实体

过度拟合:如果事后解释的数⽬⽐数据增⻓得还快,那么⽆论数据是什么,我们都能找到办法解释它们。典型场景:事后的球评预测

过度诠释:Spurious Correlation

简单性的例子:关于运动的产生:1. 真空中所有物体下落速度相同 2. 运动是相对的 3. F=ma,是速度的来源。

复杂的例子:气象模型,AlphaGO模型;一个问题天然具有所罗门诺夫复杂度

如何解决过拟合(信息茧房)?

  1. 扩大数据, 100倍VC维度
  2. 交叉验证
  3. 正则化

image.png

logP[T]可以视为正则化项,它也是一种偏见,来源于剃刀原则,越复杂的项,可能性越低

sigma (P(T)) = 1

N,a0,a1,a2,...,an --> P(a0) + P(a1) + .. P(an) = 1

P(ax) = 1 / (2^N)