Monte Carlo simulation| 蒙特卡洛模拟

引言

翻译自 《The New Turing Omnimbus》Chapter 4 Paragraph 1

为了了解组成现代世界的许多系统,我们越来越多转向计算机模拟。系统,无论是非人为的或者人工的,总是有许多部分有着复杂的行为,使得唯一可行的的模拟这种行为的方法为假设它是随机的. 显而易见的是,咱们可以利用更简单的,符合统计学定律的部分替代这些系统中复杂的部分。

举个例子,如果我们想要模拟一场两边实力平均的排球比赛,我们可以通过抛硬币的方法来建立一个简单的模型:如果一个队伍正在发球,抛硬币的结果属于是不利于他们的那一面,则另一个队伍加一分且轮到他们发球;否则,这个发球队伍加一分并且继续发球。这个抛硬币的过程让我们想起了一个简单的打赌方式 ——蒙特卡洛

A lil bit of history[^1]

故事从一个波兰犹太裔数学家 斯塔尼斯拉夫·烏拉姆(Stanislaw Ulam) 开始讲起。有一次他生病,身体不适时,一个人喜欢宅在家里玩纸牌接龙游戏(solitaire)。作为一个数学家,他一个自然的想法就是思考有没有办法计算出他赢得一盘游戏的概率,利用组合数学以及概率。虽然他是一个伟大的数学家,但他最后失败了,这个组合情况实在是太复杂了。后来他想到一个比较简单担又不太简单的办法:不断一次又一次的玩这个游戏 最终通过 $\frac{\text{胜利次数}}{总场次}$ 的方法来计算除这个概率,只要是总场次够多,这个概率就会越来越接近真实概率。

问题出现了:他的实力是在不怎么样,使得他玩到想出这个想法的时候其实一局都没赢过。这样来看的话,如果想要足够准确 他可能要天天玩这个纸牌游戏 持续好几年😢 他很快想出了个解决办法:“寻求电脑的帮助呀”! 虽然他本身不是个懂电脑的人(在那个世界上只有几台计算机的时代),他和冯诺依曼认识呀!那个被称为计算机科学的叔叔的大人物(图灵被称为计算机之父,巴贝奇被称为计算机之爷爷)。冯诺依曼说,我可以帮你这个忙!我用ENIAC几个小时就可以模拟完了!(现在的电脑可能几微秒就跑完了)

自此 蒙特卡洛模拟 就此诞生 他们在后续研究氢弹的时候甚至还用到了 这足以证明这它的作用并不仅限于卡牌

赌徒谬误 VS. 趋均数回归[^1]

又是抛硬币:这个经典的例子足以区分这两个经常让人混淆的概念。

让我们先重申一些抛硬币的特性(可能大部分人都知道了)

  • 抛出正反面的概率都是$\frac{1}{2}$ ; $P(正)=P(反)=\frac{1}{2}=0.5$
  • 每一次抛硬币这个事件都是互相独立的(independent events)

想要理解赌徒谬论,自然而然的 让我们从一个赌徒的角度看世界!

这个游戏非常简单,就是抛硬币然后猜是正面还是反面;猜对了的人会均分所有猜错了的人的赌注。现在非常神奇的事情发生了,这个硬币已经连续十次抛到正面了!一堆赌徒们听到消息蜂拥而至,他们心想太好了太好了我终于要猜对下一次了,然后他们猜第十一次为反面。他们为什么这么猜呢?原因有两个:

  1. 运气守恒定律!这就和我今天倒霉了所以明天运气会更好一样的道理
  2. 连续十一次是正面的概率是 $\frac{1}{2}^{11}=\frac{1}{2048}$ ! 所以这么小的概率 我一定要选反面

那他们是正确的吗?其实不是的: 因为抛硬币的第二个特性 – 每次抛硬币的事件都是互相独立的。所以说下一次抛到正面的概率是1/2,抛到反面的概率也是1/2. 那(连续十一次是正面的概率是 $\frac{1}{2}^{11}=\frac{1}{2048}$ )难道是错的吗?其实也没错。但是我们所经历的 并不是P(连续11次正面)这个概率 而是 P(连续十次正面,那么第十一次是正面) 这个概率。前者为$\frac{1}{2048}$,后者为 $\frac{1}{2}$.

这就是赌徒谬论:也就是为什么有那么多人沉迷赌博的原因之一:他们做出了虚假的判断,并相信有运气守恒 : 只要再来一局我一定能赢

诶那难道世界上没有运气守恒这个东西了吗? 其实是有的,而那就是趋均数回归

趋均数回归的故事,还是和之前一样,非常神奇的事情发生了!硬币连续十次抛到正面了!但是现在猜的并不是第十一次,而是在抛硬币第11-20次这十次中,会有多少个正面。

用人话来讲 去均属回归是这样的一个定理:如果一个离谱的事情发生了 下一个事情大概率不会有这么离谱 会更趋向于这件事情的平均(在这个例子的情况下是5)

回归到抛硬币的例子里,在抛第1-10个硬币这件事情上,全都是正面 – 这比较离谱。趋均数回归告诉我们,在抛第11-20个硬币的时候,大概率不会有十个全是正面这种情况了。可能是九个,八个,七个这么离谱的情况,但大概率会比之前不离谱一点 会离5更近一点。

那很多人可能会搞糊涂 很奇怪呀 为什么你说赌徒谬论告诉我们没有运气守恒 趋均数回归告诉我们有运气守恒了。我只能说他俩对运气守恒的定义不太一样。如果是赌徒谬论 它所讲的运气守恒 在接下来这十个硬币的情况下 判断出来的是什么呢:因为我前面全是正面 那我后面肯定大部分都是反面!因为要守恒嘛 按理说正面和反面要一样多的 所以他们的判断可能说 接下来有八个反面 或者接下来有七个反面。而趋均数回归告诉我们的是:接下来的正面数量我觉得会离5更近一点 相比于之前的这么离谱的正面数量=10的情况。它没有说我接下来会有少于五个正面,只是说接下来的正面数量会比起之前的正面数量来 离平均更近一点。

[^1]: MIT 6.0002 Introduction to Computational Thinking and Data Science, Fall 2016; https://www.youtube.com/watch?v=OgO1gpXSUzU