三门问题:直觉究竟去了哪里?_风闻
返朴-返朴官方账号-关注返朴(ID:fanpu2019),阅读更多!2021-01-05 18:17
导语:三门问题,也被称为蒙提霍尔问题,是一道著名的概率问题:一个游戏节目中共三扇门,一扇门后有汽车,另两门后只有山羊,你选择了一扇门但不打开,这时主持人会在另两门中打开一个后面是山羊的门,现在你换不换自己刚才选择的门?30年前这一问题被美国一知名杂志刊登后引发了热议,因为直觉告诉我们换不换都是一样的,但答题人选择换。数学爱好者、专业人士纷纷加入讨论,进行了一场旷日持久的论战,还发展出了诸多变种。现在让我们来回顾一下这道经典问题,来看看直觉到底哪出错了,信息又是如何影响结果的。
撰文 | 张和持
问题背景
在美国的一档节目Let’s Make a Deal 中,主持人蒙提·霍尔设置了一项小游戏:
在你的面前有三扇门,其中一扇背后藏有一辆价值不菲的汽车;剩下的两扇背后则分别是两头山羊。你现在有机会选择一扇门,选好之后先不要打开,这时主持人会在另外两扇门中,开启一扇山羊门。现在你有两个选择,是应该维持原来的选择,还是转而选择另一扇没有开启的门?
这看起来似乎是一个没有深度的问题。可供选择的两扇门之间没有什么不同。不管选哪个,概率都应当是相同的才对。果真如此吗?
实际上这个问题有很古老的历史,可以追溯到法国数学家伯兰特(Joseph Bertand)的盒子悖论,后来著名的数学科普大师马丁·加德纳(Martin Gardner)也提出过与三门问题相似的囚徒问题。1975年美国统计学家塞尔文(Steve Selvin)根据电视节目改编提出了这一问题,投给了《美国统计学家》,这也是蒙提霍尔问题名称的由来。而真正引发讨论是到了1990年,一位读者向当时美国知名杂志《游行》(Parade)的专栏“交给玛丽莲”提出了关于这一问题的询问。
玛丽莲·莎凡特(Marilyn vos Savant)曾被吉尼斯世界纪录认定为世界上智商最高的人,后来成为这家杂志社的专栏作者专门回答各类问题。她给出的回答是:应该换门,而且换门后,开出汽车的概率将变为原来的两倍。
玛丽莲的吉尼斯记录颇受争议,她给出的这个答案也同样。人们纷纷向她写信,质疑她的结论。一时间,社会各界都在谈论这诡异的概率。来信表示反对的占了92%,其中有将近1000人拿过博士学位;65%来自大学,特别是数学等院系的信,都反对她的答案。蒙提·霍尔问题,或称三门问题,一下子成为了关注的焦点。90年代的十年间,40多种学术刊物发表了关于这一问题超过75篇论文。
反对并不是毫无根据。关于问题和答案的表述不甚严谨,表面上看,我们也看不出换不换门究竟有什么决定性的区别。玛丽莲为了说服反对者,专程组织了几次实验,其结果都证实了她的结论。
流言终结者节目
其实我们不一定非得大张旗鼓地搞些花里胡哨的东西,用电脑也能模拟,得出的答案没有不同。
那么这样看来,玛丽莲的答案是对的了。现在的问题是,我们应该如何解释这样的结果?是我们的直觉究竟出了问题吗?接下来我们并不打算解释谁的观点为什么对,谁的观点又为什么错;我们细细来看问题的前因后果,把所有条件和结论整理清楚。
简单直观的图示解答
最不动脑的方法是把所有可能列出来,如下图所示,当玩家选择1号门的情况下所有的可能性。
但这并不代表我们真正理解了问题所在。为了解答疑惑,我们先一步一步理清思路。首先,三门问题与两扇门二选一究竟有何不同?或者说,我们刚刚开始选定的这扇门究竟产生了什么样的影响?
回到一开始的疑问:我们一开始的选择对结果产生了什么影响?
用条件概率来直接计算
用贝叶斯公式来追本溯源
虽然问题就解决了,但还是不知道我们最开始错误的直觉来自哪里。我们来思考一下主持人“提供信息”的问题。一切的改变,都是因为主持人提供给我们的信息:主持人很明显是知道门背后都是些什么,才打开山羊门的。那要是主持人根本就不知道汽车在哪里,只是随手选择了一扇门,而这扇门恰好是山羊门的话,主持人岂不是就不能提供任何信息了?
这种由果溯因的思路一般称为贝叶斯推断。这种方法最早的特例是托马斯·贝叶斯证明的,后来拉普拉斯将其推广,并应用于天体力学、医疗统计学等方面面。在面对未知的自然界时,我们无法知晓其背后的法则,但能观察到现象,比如天体力学中,就是可观测天体的大小、数量与过去的轨迹;医疗统计学中,则是患者的症状、化验结果、CT数据等,有了这些数据,我们就可以猜测,是否存在一个我们尚未观测到的天体,或是患者是否得了某种病。猜测自然有可能是错的,现在我们有了贝叶斯推断,就能反过来计算我们所作假设成立的概率。
这一方法近几十年来更多应用于机器学习领域,或者更窄的概念:统计学习。任何包含了模式识别的算法,基本上都能用上贝叶斯推断,包括人脸识别,自动驾驶,他们会用到更加复杂的概念:当事先不存在假设时,就需要人为设定一项先验分布。不过总的来说,思想与最经典的贝叶斯公式一脉相承。如今,以此为基础的统计学仍在飞速发展。