本文系作者原创,授权“美国华人杂谈”独家发布。转载需征求许可,规范署名(公号名/ID/作者),违者必究
说到民调有可能失准,一个经典的例子是“专家吃虫子”:华裔科学家王声宏(Sam Wang)主业是神经科学家,从2004年起开始业余研究总统民调,他在2016年通过自己的模型预测希拉里·克林顿获胜的几率大于90%,并称如果川普赢得超过240张选举人票他就“吃一只虫子”——结果大家都知道了,他在CNN直播中吃了一只蟋蟀。
2016年的大选可能是有史以来最臭名昭著的民调失误,但2020年的情况甚至更糟。在上届大选中,民意调查严重低估了川普的支持率,尽管他们正确地预测了乔·拜登会获胜。美国民意研究协会(American Association for Public Opinion Research)的一项全面事后分析得出的结论是,2020年的民调是几十年来最不准确的,在大选的最后两周,拜登在全国和州一级的优势平均被夸大了3.9个百分点和4.3个百分点。相比之下,2016年的全国民调其实相当准确地预测了希拉里在普选中的领先优势。
随着选举日临近,美国人对民意调查的兴趣和担忧仍在进一步增加。截至8月29日,纽约时报的全国民调平均值显示贺锦丽以49%比46%,领先川普三个百分点。而对全国各民调做平均值计算的538民调显示贺锦丽以47.1%比43.7%,领先川普3.4个百分点。
但2016年会重演吗?上周末,川普的竞选伙伴JD万斯(JD Vance)在电视广播中抱怨“虚假民调”。他的论点是,一些民意调查夸大了贺锦丽对川普的领先优势,“媒体”利用这些民意调查来压制共和党选民的投票率。
万斯的论点本身没有说服力:几周前,这些媒体公布数据,显示拜登的民调有多差劲时,万斯没有指责民调和媒体,怎么一旦形势逆转,他就开始宣扬民调不靠谱了?不过,万斯的说法可能也代表了很多人的顾虑。
那么,从2016年到2024年,民调专家做了哪些调整,来避免自己再一次当众“吃虫子”?最重要的是,经验显示,只要有川普的名字显示在选票上,就有可能导致民调出现较大的偏差,这被称为“川普因素”,那么,今年民调专家是如何应对“川普因素”的?
从2016到2024,民调专家如何应对“川普因素”
根据加州理工学院的一份报告,“只需要1000到1500人的样本规模就足以对美国的民意进行高度准确的估计。”
加州理工学院补充说,民意调查中常用的一种方法是随机抽样,民意调查人员“从电脑生成的固定电话和手机号码列表中随机抽取参与者样本”。这“让每个人都有平等的机会被纳入或不被纳入。”接着,民意调查还依赖于被称为“加权”的统计调整,以确保调查样本在关键特征上与更广泛的人群保持一致。
这些变量原本主要包括了年龄、种族和性别等,但事实证明,这些变量在近期的民调中还不够,这就是所谓“川普因素”起作用的地方。与过去20年的其他选举相比,当川普出现在选票上时,民意调查的准确性一直较低。2016年和2020年川普竞选总统时,选前调查出现了重大失误,尤其是在州一级。但民调在2018年和2022年的中期选举中表现相当不错,他当时没有参选。
民调专家因此在不断调整变量。在川普2016年意外获胜后,民意研究行业得出结论,问题在于:第一,川普的支持者可能不太愿意向民调机构表达他们的支持,这种现象有时被称为“害羞的川粉效应”;第二,教育程度导致的党派偏见,出口民调显示川普在没有大学学历的白人中更受欢迎。
在2020年的周期中,他们专注于纠正这一错误,但后来发现也不太成功。
先来说“害羞的川粉”。一个由民调专家组成的委员会对这个理论进行了五种不同的测试,每种测试都几乎没有找到证据。后来,皮尤研究中心和耶鲁大学的一名研究人员在另一项测试中也几乎没有发现支持这一说法的证据。
在2020年的民意调查中,民调机构纳入了更多没有受过大学教育的白人选民,但结果显示,更多没有受过大学教育的白人选民也更喜欢拜登。说明这个猜测也不准确。
相反,另一种解释更有可能:共和党选民首先就不太可能对民意调查做出回应,这个规律在受过大学以上教育的共和党选民中依然存在。皮尤研究中心称之为“党派不回应偏见”。民意调查在历史上并没有出现过某个党派的选民对民调回应率更高或更低的偏差,这个现象只在川普时代才开始出现,这可能是因为政治两极分化加剧,加上保守派对新闻机构和其他民意调查机构信任度下降。
代表《纽约时报》进行民意调查的锡耶纳学院研究所(Siena College Research Institute)所长唐·列维(Don Levy)对此有同感,他称这种现象为“反建制回应偏见”:一个人越不信任主流机构,包括媒体和民意调查机构,就越有可能投票给川普。
列维告诉《大西洋月刊》,在2020年,锡耶纳的工作人员经常报告说,自己在进行电话民调时被川普的支持者大骂。“有人会说,‘老子就是要投川普——去你的,’”然后不接受完调查就挂断电话。在2020年,这些“不那么害羞的川粉”的回应(或拒绝回应)没有被计算在内。这一次则被纳入了。列维表示,如果在2020年将这些只回答了关键问题的回应计算在内,锡耶纳的错误率将减少近一半。
还剩下另一半的错误率怎么修正?今年也有不少调整。
第一种办法是要把更有可能支持川普的选民纳入数据集。这个想法是,如果倾向共和党的选民对民意调查的回应比例较低,那么接触更多的人有可能抵消这种抽样误差。
这听起来也许是个显而易见的调整,但这对行业来说是一个令人不安的转变。公共民意调查机构在收集或加权样本时,传统上坚持在人口普查中所订立的政治中立类别:年龄、性别、种族等。其理论是,如果你按照人口统计学的路线正确地建立样本,也就是说,如果你把白人和亚裔、福音派和无神论者、男性和女性的数量都选对了,那么就会自然而然地得出一幅准确的美国党派平衡图景。
但从2016年到2020年,经验表明这还不够。所以,现在整个行业开始更加关注政治变量。一些民意调查机构正依靠州级选民档案,在样本中找到民主党和共和党的适当平衡。
第二种办法是增加民调的技术手段。大多数民意调查机构已经从主要通过电话,转而支持使用在线方式,或者是短信、在线和邮件的结合,毕竟已经有越来越多的美国人不再安装或接听固定电话了。目前CNN和福克斯新闻通过电话进行民意调查,而CBS新闻、Politico和美联社使用多种在线技术进行民意调查。这些多元技术意味着,愤怒或者忙碌的选民有可能接受并完成调查。
第三种手段是使用“回顾投票”(recalled vote)。这种方式是询问受访者在2020年投票给谁,并确保受访者的组合与实际结果相匹配。比如,如果一个州有60%的人支持川普,但只有50%的受访者表示他们投票给了川普,那么民调机构要么会再调查更多在2020年投票支持川普的选民,要么会在最后的模型中对这些选民做一定的加权。
这种方法在其他国家早已被用来计算民意调查,但直到最近才在美国得到广泛使用。据538报道,2022年中期选举期间的民意调查属于历史上最准确的结果之一。据《纽约时报》报道,部分原因在于民意调查机构开始“越来越多地根据受访者回忆的上一届选举中投票给谁,以及根据种族和年龄等标准人口统计数据进行调整”。
那么今年的民调有多准确?
在美国民调圈子里,有几个公认的专家:538的创始人内特·席尔沃(Nate Silver,后来他离开了这个机构建立了自己的平台Silver Bulletin”,《纽约时报》的首席政治分析师内特·科恩(Nate Cohn),以及《经济学人》/YouGov民调团队的首席科学家道格拉斯·里弗斯(Douglas Rivers)。
8月科恩在接受《纽约客》的采访中,表示他对2024年的大选民调“谨慎乐观”。最主要的一个原因是,今年至今还没有看到共和党选民回应率过低这个现象。科恩表示,“在2020年,民主党选民比共和党选民更有可能对民意调查做出回应。到目前为止,我们还没有看到同样的模式。对我们的民调做出回应的民主党人和共和党人的比例大致相当。我认为这是一个积极的迹象……这一次,比例相当均等,因此我谨慎乐观地认为,这意味着我们没有深层次的、隐藏的不回应偏见。”
今年和2020年的另一个区别是:没有疫情。一些专家认为,民主党选民更有可能在2020年参加调查,因为他们比共和党人更有可能呆在家里,没有其他事情可做。
目前可以确定的是,选举仍然势均力敌,不过贺锦丽相较拜登,现在处于更有利的地位。GQR Research的民主党民调专家娜塔莉·杰克逊(Natalie Jackson)在X平台上分析说,如果贺锦丽的数字只是因为民主党人心情大好、乐意回答民意调查,那么民主党人在普通国会民意调查中也会显示出类似的上升。但事实并非如此,这表明这种变化是真实的。
从目前到选举仍然存在着大量的变数,一个关键的挑战是,需要确定哪些被调查者会真正投票。
大约有三分之一的合格美国人不在总统选举中投票,但很难基于一份问卷判断谁会弃权,因为人们不能完美地预测他们未来的行为——甚至可能就连你自己,都不能预测在选举日那天,你会不会只是因为票站大排长龙就索性放弃了投票。
在选举日之前,没有人知道选民的情况。无法确定年轻人是否会比往届更积极地参加投票,也无法断言关键的种族或族裔群体是否会这样做。
另一个挑战是,全国民意调查能告诉我们全体公众对总统候选人的看法,但选举结果是由各州的选举团决定的。2000年和2016年的总统选举表明了一个艰难的事实:在美国所有选民中获得最多支持的候选人有时会输掉选举。在这两次选举中,全国普选获胜者(阿尔·戈尔和希拉里·克林顿)在选举人团选举中败给了乔治·W·布什和川普。近年来,分析人士指出,共和党候选人在选举人团选举中的表现比在普选中的表现要好一些,因为无论人口多少,每个州都有三张选举人票,而许多人口较少的州是农村,更倾向于共和党。
回到文章的开始,现在,吃虫子的王声宏撰写着一个叫“Fixing Bugs In Democracy”(修复民主漏洞)的博客,也依然在倡导投票和分析民调。他最近在X平台上指出,太多民调专家专注于技术和模型预测,但民调最重要的是什么?是选民。具体来说,是确保通过志愿服务和捐款,动员每一个选民的力量,通过参与各个州的州议会选举、参议院选举和其他投票,让多数原本不参与投票的选民有能力、有热情参与民主,这将会为每场竞选带来更大的影响。
https://www.nytimes.com/2024/08/20/opinion/harris-biden-trump-vance.html
https://www.theatlantic.com/ideas/archive/2024/08/election-polls-2020-mistakes/679545/
https://theweek.com/politics/2024-election-polls-accuracy