【科研】统计与谎言(2020/01/10)_风闻
王孟源-哈佛大学物理学博士-事实与逻辑-2020-01-13 08:37
我在《美国崛起时代的治理哲学》一文中提到,美国从19世纪后半开始,随著报纸、电报和电话的先后普及,公共论坛上的杂讯声量也大幅提升,控制大衆媒体的富豪毫无顾忌地扭曲事实、党同伐异。看不过去而出面针砭讥讽这个现象的,也包括了名作家马克吐温;他在1907年出版的《Chapters from My Autobiography》中,写下了这个句子:“There are three kinds of lies: lies, damned lies, and statistics.”“ 谎言分为三个等级:谎言,该死的谎言和统计数据。”
马克吐温自称是引用19世纪英国首相Benjamin Disraeli的名言,不过后人查无实据。这种僞托或误引(Apocryphal Quote)在互联网普及之前很常见(参见前文《真理只在大砲的射程之内》)。然而不论那句话原本是谁説的,我们可以确定在一百多年前,利用统计数字来撒谎,已经是个非常普遍的伎俩。
统计特别适合被用来撒谎有几个原因:首先群衆会被专业的表象迷惑;其次用一个数字来总结背后複杂的考虑,先天上就方便让非专业人员接受;与此同时,又遮蔽了许多计算上的选择,给予总结者很大的主观操弄空间。所以统计在撒谎上的应用,其实是僞造数字来过度简化论证过程的一个特例;即使不用统计,也可以达成同样的目的。
例如王贻芳所长就非常喜欢利用数字来造假。他在大对撞机计划报告中(参见https://www.yuanben.io/article/2HBDRN3NWDG0Y8TH7NR22HAF76UNFFCZDUO83IW69K3R2JFLDV),声称前半的CEPC只需要360亿人民币,加上后半的SPPC之后,全部费用在1400亿人民币以下。我在《回答王贻芳所长》一文中已经详细解释过,所有可以客观评估的事实证据,都指出建造费用应该至少在1000亿美元这个数量级,这还不包括建成之后运行几十年所需的预算;后者一般和前者大致相当。
2019年底,科普作家醋醋的一篇文章(《杨振宁的最后一战》,参见https://www.huxiu.com/article/329808.html )又引发了大衆对大对撞机这个话题的关注和讨论。其间,专业知识和经验处于世界顶尖级别(尤其是明显高于王所长)的赵午教授撰文(参见https://zhuanlan.zhihu.com/p/97982982 )指出王所长的预算并不包括预研新技术所需要的“大量人力和经费”。接著,许许多多来自建筑和投资行业的专家也质疑,光是CEPC的徵地和土建费用就必然显著高于360亿。其实预算数字中真正最可疑的是要引进欧美仪器所需的庞大费用被严重低估,却因爲太过含糊而无从讨论起,更别提检验了。然而这仍然不影响高能所的公关卒子继续在媒体上坚持总预算“只有”1000亿人民币,可见这种数字烟幕的威力之大。
我在前文《常见的狡辩术》之中,并没有列举这个伎俩,这是因爲它基本上是用数字来撒谎,属于强辩而不是狡辩的范畴。醋醋的文章中提到王所长在强推大对撞机计划的过程中,与超弦阵营过从甚密,有明显而公开的协作;高能所的文字打手们也是睁著眼睛説瞎话,矢口否认,这同样属于直接撒谎,不算是狡辩。
当然,如果能加上几个层次的统计处理,那麽对错误数据的遮蔽效应就会更强。例如我在《台湾能源供应的未来》一文中讨论过的,西方对甲烷排放所做的统计,就非常可疑:NASA的卫星可以探测到美国本土有一大堆未知来源的甲烷(参见https://www.jpl.nasa.gov/news/news.php?feature=7535 ),一些白左市镇因此而开始禁用天然气(参见https://www.nytimes.com/2020/01/05/us/bellingham-natural-gas-ban.html ),然而在欧洲人所做的统计资料库(叫做EDGAR,Emission Database for Global Atmospheric Research,全球大气研究排放数据库,这是全世界都引用的权威统计,参见https://data.worldbank.org/indicator/EN.ATM.METH.KT.CE )之中,却基本看不到对应的数字。
这里我详细讨论一个细节:天然气管綫在铺装或维修之后,必须进行清理;在美国理论上应该使用氮气,但是实际上工人贪图方便,经常用手边现成的高压天然气来吹除杂物,每搞一次就会排放近100万立方英尺的甲烷到大气之中。这不但会大幅促进温室效应(甲烷比二氧化碳强84倍),而且有爆炸的危险,USCSB(United States Chemical Safety and Hazard Investigation Board,美国化学品安全与危害调查委员会;只能写事故报告,没有惩罚肇事方或修订法规的权力)屡劝不止(参见https://www.youtube.com/watch?v=rjxBtwl8-Tc )。这种违规行爲,连美国的工业安全主管单位(OSHA,Occupational Safety and Health Administration,职业安全与健康管理局)都眼不见爲净,怎麽可能被欧洲人包括进有关气候变化的甲烷排放统计里面呢?
另一个用统计来撒谎的例子,是我在《自由撒谎的美国政府和媒体》一文中讨论过的,美国每年被警察枪杀的人数。几十年来,FBI(Federal Bureau of Investigation,联邦调查局)的UCR(Uniform Crime Reporting Program,统一犯罪报告程序)每年都会公佈一个统计结果,一般是300多人次,所以这也一直是全世界都引用的数字。但是FBI忘了提醒大家一个细节,也就是这个UCR报告不是强制性的,而是由地方警察局自行决定是否参与,事实上只有不到1/4的警察单位上报统计资料,但是这一点并不广爲人知。
到了2014年,因爲一连有好几个警察随意杀人的事件,引起了公衆的注意,终于有媒体试图自行做独立的统计。其中最知名的是《华盛顿邮报》,他们在2015年每天扫描地方小报的新闻,最后纍积到990人次。这其实已经是警察知道媒体在盯著看之后的结果,而且只是个下限,因爲必然有遗漏。有统计专家估计了必要的修正,得到1240人次的结论(参见https://en.wikipedia.org/wiki/Police_use_of_deadly_force_in_the_United_States )。考虑人口的差别,这相当于每年警察在台湾自行决定要枪毙90人,香港28人(美国人囉嗦香港警察的执法手段时,这是最直接了当的反驳),大陆5256人。
其实我之所以会想要讨论用统计来撒谎这个话题,是在上周忽然想到美国在过去几十年,富豪集团牢牢地掌握了政治、经济和宣传的权力,使得中产阶级的生活水准停滞不前(参见前文《大停滞的真原因》),那麽美国的工业意外事故发生率可能也会如同工人的收入水平一样,不再有进步。先进国家和开发中国家的一大差别,就在于对人员安全性的重视和投资程度要高得多,那麽照理来説,随著时间的流逝和GDP的增长,致命工业事故发生的比率也应该逐年降低才对。
我先找了德国的资料(参见https://www.eurofound.europa.eu/publications/article/2016/germany-number-of-occupational-accidents-at-all-time-low ),发现2004年有949起致命事故,到2014年,降到了639起(总就业人口是3990万,所以比值是每十万人1.6;我没有找到德国蓝领佔总就业的比率,假设是40%,那麽致命工伤率是每十万人4.0,约为美国的1/3;见下文),大约比十年以前减少了1/3。这是很大的降幅,就算人口和就业有些波动,也不会影响定性的结论。
然后我去看美国的资料,发现从来没有人认真研究过这个议题,好不容易找到BLS(Bureau of Labor Statistics,劳工统计局)的CFOI资料库(Census of Fatal Occupational Injuries, 致命职业伤害普查;参见https://docs.google.com/spreadsheets/d/e/2PACX-1vS1gpN11EW3qkgY5EithtPdfTnSG2H7xpKR4JlYHiMpxLJdkW6NYOsLhlViQ0KB4Z1S-X6P9WYR5tRh/pubhtml ),里面的统计方法却有一个明显的错误。简单来説,从2008年(在该年统计方法有变化,前后的数据不能相提并论)到2018年,年度工业事故死亡人数分别是4423和4493,反而增加了。不过劳工统计局认爲在这段时间,就业人口从1.47亿增加到1.57亿,所以结论是工伤致死率从每十万人3.3件降到3.1件,10年下来大约减少了6%。
但是要算工伤致死率,不应该用就业总人口为分母。这是因爲99%以上的工伤发生在蓝领工作上;坐办公室时的死亡一般并不列为职业意外致命事件。所以我们必须只考虑蓝领工人;而在过去几十年,美国的製造业不断外移(这一点和德国有很大的不同,参见下图,红綫是美国,灰綫是德国),所以蓝领工作佔总就业人口的百分比一直在下降。从上图中的蓝綫可以读出,2008年美国就业岗位中蓝领的比率是23.2%,亦即3400万人,到了2018年降到20.7%,对应著3240万人。这样修正过的工伤致死率,在2008年是每十万人13.0,2018年则是13.9,实际上是上升了7%。
事实上,在以上的分析中,除了把总就业人口改爲蓝领工人的数目之外,我还必须做出好几个额外的决定,包括用谁的数据、选择哪个起始年份、终点年份、用工人还是工时、用蓝领还是製造业、用总事故死亡数(BLS表格中的“Total Deaths”)还是净死亡数(“Preventable Deaths”)等等。每个不同的选择都会给出不太一样的答案;我尽力诚实、称职地挑出最合理的选项,但是如果换成其他人就不能保证他愿意或能够做到这一点。换句话说,在统计分析的过程本身,就充满了做主观扭曲的诱惑,所以正确的结论其实是很罕见的。