事实如此浪漫

英国大选民调为何如此错误?一个统计神秘

工作人员在马萨诸塞州伍斯特的一个投票站清点选票。 SuperStock通过Getty Images

l上周四,英国保守党在选举中大获全胜,震惊全国。保守党在议会中轻松赢得了多数席位,使他们能够在没有联盟伙伴的情况下治理国家。这一结果与选举前的民调(平均)形成了鲜明对比。预测有死热保守党和其长期竞争对手工党之间的差距预计将分别获得33.6%的选票。这个巨大的错误引起了英国民意调查专家的极大不满行业组织正在进行官方审查的失败。

那么到底哪里出了问题呢?几乎一周过去了,似乎还没有人提出一个令人信服的答案,尽管一系列可能的解释出现了,有些是相关的,有些是相互排斥的。在这个时代,统计分析在政治、金融、体育甚至文化等各个领域变得越来越重要,尝试找出我们模型的弱点以及如何改进它们是很重要的。

以下是一些主要的潜在解释:

晚决定者选择了保守党

选举专家说,在竞选即将结束时做出决定的人数量之多令人吃惊,在民意调查中很难捕捉到他们的意见。伦敦经济学院的政治学家迈克尔·布鲁特说,告诉自然的Davide Castelvecchi

民意调查的预测和结果之间存在明显的差距,但我并不感到惊讶。我们的研究发现,在一次又一次的选举中,多达30%的选民在选举后一周内做出决定,而多达15%的选民在选举当天做出决定。有些人要么事先不知道,要么在展位上改变主意。

通常情况下,这些人会相互抵消。一些原以为会投保守党的人最终投了工党,反之亦然。昨天似乎发生的是,在一个方向上改变主意的人比在另一个方向上改变主意的人多。

ComRes的政治民调负责人汤姆·姆卢津斯基说,CNN的苏珊娜·库里琳娜说道

实际上,我们当天对4000人做了一次民意调查,大约12 - 13%的人在过去的24小时内做出了决定,在选举的前一天晚上,我们有20%的人说他们可能会改变主意。我们希望每个人都尽早做出决定。”

保守党没有赢得更多的选票,而其他政党却失去了更多的选票

民调公司YouGov总统的彼得·凯尔纳他说,这次选举的政治动态与1992年的选举类似另一次,保守党出人意料地赢得了一场民意调查没有预测到的选举:

这归结于人类的心理。投票和回答投票是不同的练习。这是一种有结果的选择,而不仅仅是一种观点的表达。今年和1992年一样,保守党的形象很弱。人们普遍认为它们脱离现实,属于富人。但是,在边缘地带,可能会有一些人既不看好工党,但仍然认为它将比工党更好地管理经济。他们“害羞的托利党”(在选举中支持保守派的人但不是在民意调查中)不是因为他们不愿意承认自己的选择方一个陌生人,而是因为他们真的愿意支持别人,但面对选票在投票站的隐私,只是不能。

民意测验专家隐瞒了真实数字

Survation的创始人兼首席执行官英国民调公司确实收集了非常准确的民调数据就在选举之前——但因为他们与其他公布的数据相冲突,他们干脆拒绝公布。

这一结果似乎与我们自己和我们的同行所做的所有民调都“脱节”了——民调评论员称之为“异常”——我“退缩”了,没有公布这些数据——我肯定我会永远后悔的。

内特·西尔弗是FiveThirtyEight的创始人和主编,他说,他相信自己以前见过隐藏异常值的问题当时,民调公司拉斯穆森(Rasmussen)删除了一份似乎与其他民调机构的报告不一致的民调结果。

在我们看来,一个非常合理的解释是,这本身不是一个错误,更像是一个“羊群”的例子。像拉斯穆森报告(Rasmussen Reports)这样在方法上走捷径的民意调查只触及了一小部分选民,导致原始数据很差。然而,正如我们所描述的,以及其他研究人员所发现的,这些民意调查往往产生更准确的结果,当有其他更强大的方法标准调查相同的种族时。从本质上讲,廉价的民意调查可能是在复制或“排挤”他们的邻居。这可以采取委托罪的形式:操纵投票模型和人口加权等假设,以匹配更强大的公司的结果。或者,这可能是一种疏忽之罪:压制与共识不同的民意调查的公布。

轮询存在固有缺陷

民意调查是一项业务(即使是非营利性的),其从业者受到资源的限制。蛮指出了这个问题

我的研究使用了很长的问卷,可能需要15-25分钟来回答。这需要花费大量的时间和金钱。选举民意调查通常需要一分钟回复。

随机抽样(比调查公司使用的配额抽样)要昂贵得多。公司用来降低成本的另一种方式是民意调查。面对面的民意调查(比打电话或做网络调查)要昂贵得多,但你更有可能得到一个随机样本,并得到一个真正的选民代表。很多人在电话里会拒绝回答调查。

事实上是工党的选举民调专家BBC记者克里斯·库克说道该党的私人数据比公开数据要好,这要归功于他们自己耗时更长的民调:

我们的民意调查与报纸民意调查的主要区别在于,我们不首先询问选民的投票意愿,我们首先询问受访者对国家、经济、他们最关心的问题、政党和领导人的看法。我们认为这让他们更接近他们的投票箱心态。

(这种设计)提供了一个更低的“不知道”数字——通常是民意调查水平的一半……当然,这需要更多的问题,所以执行起来更昂贵,特别是对于一个每分钟都要花钱的电话民意调查人员来说。

新的智能机型并没有我们想象的那么聪明

即使民意调查是倾斜的,也有一些统计模型旨在从它们中推断出真相,或者至少推断出它们偏离基础的可能性。内特·西尔弗(Nate Silver)和他在FiveThirtyEight网站上的统计专家同事们因对公开民调进行巧妙调整,预测选举结果而闻名,这些民调帮助他们成功预测了2012年美国总统大选中每个州的结果。这一次,模型表现得不太好。本·劳德代尔(Ben Lauderdale)是伦敦经济学院(London School of Economics)的社会研究员,也是《FiveThirtyEight对英国大选的预测写了

我们确实试图捕捉全国民意调查失败的可能性。我们对历史上的民意调查进行了校准,看看我们可能会对民意调查的平均水平错过全国的选票份额有多糟糕的预期。显然,我们需要非常仔细地研究我们是如何做到的。2015年的民意调查误差略小于1992年,我们的数据中确实有1992年的数据。但也许这并没有带来足够的不确定性,因为有多个政党的复杂性,每个政党都可能高于或低于其民调水平。

轮询远不是一门精确的科学越来越难了

银写道:

在英国和世界其他地方,民意调查似乎越来越糟糕,因为联系具有代表性的选民样本变得越来越困难。这意味着预测者需要考虑更大的误差幅度。

这一点很重要,也是对民意调查普遍解释的一种可喜的纠正,这可能是一个比不准确本身更大的问题。选举前的共识是,这场竞选“势均力敌”,从某种意义上说,这是事实:大多数民调结果都在误差范围之内。

但这种框架由于把重点放在了错误的地方而产生了误导。更有启发性的是,衡量选民意见的不确定性太大,以至于无法对结果做出任何有信心的判断。更简洁的说法应该是,“我们只是不知道。”说竞选“势均力敌”给人的印象是,民意调查非常精确,竞选非常接近;事实是,民调结果并不准确,而且据我们所知,这场竞选可能会产生任何结果,从保守党的大获全胜到工党的大获全胜。民意调查公司确实提到了他们的误差幅度,但是这种不确定性的重要性常常被人们遗忘,因为他们急于提供一个整洁、自信的答案。


阿莫斯Zeeberg是鹦鹉螺“数字编辑器。

6评论-加入讨论