预测拜登压倒性大胜 美国大选民调可信吗?

民主党总统候选人拜登在全国民调上一直领先川普 , 近三个月的新冠疫情与反种族歧视示威冲击之下 , 两人差距扩大超过一倍 。 极少外出露面的拜登 , 此时已领先川普近9.5个百分点 。 根据路透社7月1日引述共和党消息人士报道 , 惯常在推特(Twitter)上批评“假民调”的川普曾私下承认自己落后拜登 , 该共和党人士更称:“他知道自己有麻烦 , 他没有(政治)主张 。 ”上述路透社报道更称 , 向来眼中只有自己选民基本盘的川普 , 正准备向基本盘外的选民招手 。 无独有偶 , 川普1日接受福克斯商业频道(Fox Business Network)访问时 , 称自己会在未来两周就最低工资发表声明 , 又指自己对最低工资的立场与一些共和党人不同 , 似乎是有意打一张稍微“向左走”的经济牌 。 诚然 , “大智”如川普又怎会看不到自己的形势落后于人?根据美国选情网站270toWin的计算(*) , 如果我们将拜登支持度领先川普5个百分点以上州份的选举人票加起来 , 并忽略两人差距少于5个百分点、共有108票的州份 , 拜登已能获得316张选举人票(按同一标准 , 川普只得114票) , 远超胜选所需的270票过半数 , 甚至高于2016年川普对上希拉里的“大胜”票数和差距 。 换句话说 , 即使所有战场州的票数最后都投到川普身上 , 他仍只有惨败于拜登的份儿 。 (另外 , 《金融时报》根据美国综合民调网站RealClearPolitics的数据 , 以与上述同的标准去计算 , 拜登将得318票 , 而川普则有148票 , 与270toWin的结果类似 。 )同时 , 《经济学人》也根据美国经济走向(已因疫情的非人为性质作参数调整)、总统施政满意度、首任总统连任选举等基本因素 , 加上按误差调整的民调走势 , 制作出各元素权重随时间改变的选举结果预测模型 。 根据这个模型 , 拜登有90%机率会胜得选举人票 , 有98%机率会赢得普选票 , 其可能得到的选举人票在243到415票之间——相较之下 , 川普的得票则在123至295票之间——7月1日的模型预估 , 拜登将获347张选举人票 , 而川普则得191张 。 另外 , 270toWin也引用4个专业分析机构、《经济学人》模型、预测市场的数字 , 以及4个美国媒体的资料 , 进行一种半定性研究 。 结果显示 , 除却有86张选举人票的战场州 , 拜登在11月3日的大选能稳夺248票 , 离胜选只差22票 , 而川普则能稳夺204票 , 离胜选尚余66票 。 然而 , 有过2016年民调与模型都指向希拉里大胜 , 而川普却“黑马跑出”的惨痛教训 , 美国选民对民调似乎是“一笑置之” , 心中仍有对“川普奇迹”再次出现的预期 。 根据美国有线新闻网(CNN)5月时的报道 , 当时拜登在民调上已领先川普6个百分点 , 然而有高达55%的美国民众依然相信川普会胜出大选 。 到底在“川普奇迹”的阴影下 , 民调(以及以民调为基础的预测)还可以相信吗?首先 , 由于没有任何民调可访问一个地方的每一个人 , 因此民调的直接结果则不能不加以权重分配 , 以使得民调采得的样本能反映当地人口的特征 。 例如以固网电话进行的民调 , 很可能会使民调样本集中在中年女性之上 , 因此民调得来的结果就要给予其他年龄层和性别更多的权重 , 以反映这些群组在民调当地的人口比例 。 然而 , 要选择什么特征去作权重 , 则是一个争议不止的难题 。 学历高低成民调权重关键第一 , 由于没有人能够为所有人口分类去作权重 , 我们必须选择一些与投票结果相关的特征去作衡量 。 例如 , 如果一个人的工作地区与他的投票倾向几乎没有关系的话 , 民调就不会以工作地区作为特征去作权重分配 。 可是 , 要筛选出有意义的权重特征却非易事——这更造成了2016年选举民调的一大失误 。 当年的全国性民调显示希拉里会胜出普选票大约3% , 最终希拉里的普选票的确比川普多2% , 其准确度其实不低 。 同时 , 美国大选民调对普选票的预估与实际结果误差 , 其实已从1936年的12个百分点 , 跌至2016年的两个百分点左右 , 是史上一大低点 。 其实 , 当年估计失误的主要问题不是出于全国民调 , 而是出于各州民调 。 在2016年大选以前 , 民调机构普遍认为学历高低并不是影响投票倾向的主要因素 , 因此即使学历高低与民调访问回应率有正向关系 , 不少州份的民调机构也没有将学历作为权重分配的一部份 。 这在2012年的选举中影响不大 , 因为当年占人口比例较高的本科毕业人士小规模倾向投票给共和党 , 而占人口比例较低的硕士或以上毕业人士则明显倾向支持民主党 , 两者相减之后 , 即使高学历人士更愿意接受民调访问 , 这现象也不会构成太大影响 。 然而 , 到了2016年的选举 , 学历高低与会否投票支持民主党却成为了明显的正向关系 , 无论是在全美国的层面 , 还是在当年川普胜选的关键州份宾夕法尼亚州(Pennsylvania)、密歇根州(Michigan)、威斯康星州(Wisconsin)亦是如此 。 然而 , 当年选举之前 , 民调机构当然也没有“先见之明” , 在上述三州有将学历高低作权重分配的民调只占总数18%至33%不等 , 而在全国层面 , 有近半民调也没有计算这个因素 。 最后 , 当然是大大失算收场 。 汲取了这个教训 , 本年不少民调机构也将学历采用为权重特征之一 , 相信2016年之误该可解决 。 川普支持者拒绝回应民调 或造成误差不过 , 在如今川普终日大骂(对他不利的)民调“造假”之际 , 川普的支持者也许会更倾向拒绝民调访问 , 民调机构在权重分配问题上似将遇上另一难题:到底“党派认同”应否作为权重分配的人口特征之一?此权重的根本问题在于 , 与年龄、性别、学历等相对固定的人口特征不同 , 党派认同并不能从官方人口普查的数据中得到确切数字 , 因此民调机构若要以党派认同作权重分配的话 , 也只能自行估算 , 或者依赖前次选举的票站调查数据作准 。 对此 , 美国全国民调评议会(NCPP)就批评以党派认同作权重“是个猜测游戏多于好的理论” 。 虽然根据美国民意研究学会(AAPOR)对2016年大选民调的详细研究 , 他们惊讶地发现其实民调即使没有权重分配 , 也没有压抑川普支持者的民意;然而 , 这会否因为川普大骂民调而改变 , 则尚属未知之数——如果共和党人因川普的言论而拒绝回应民调的话 , 党派认同的权重争议也可能会构成民调结果与现实之间的落差 。 选民拿不定主意的难题除了难解的权重问题之外 , 2016年的民调错估 , 还有“选民到最后一刻才作出投票决定”的问题 。 回顾当年 , 到了两党选情炽热的8月底 , 根据当时一项《经济学人》与YouGov的大选民调 , 支持第三党候选人或其他人、不确定投票选择 , 以及可能不投票的受访者占所有受访者高达21% 。 而根据上述美国民意研究学会的报告 , 美国全国有13%选民到选前最后一个星期才作出投票决定 , 此类选民投票给川普的比例比投给希拉里的高出3个百分点 , 而在左右大选的宾夕法尼亚州、密歇根州和威斯康星州 , 这个差距更分别高达17、11和29个百分点 。 两党之间投票意向不明的选民比例如此高 , 当然促成了当年民调预测失准 。 然而 , 如今美国两党分裂成风 , 选民投票意向的确定性就远较2016年为高 。 根据《经济学人》与YouGov在6月28至30日进行的民调 , 表示将投票给其他人、不确定或不投票的受访者比例只得10% , 比上述数字低一倍 。 因此 , 可以预见 , 本年的民调预测的准确度 , 至少在此层面而言 , 会比2016年为高 。 在大选民调较普遍加入学历水平权重、选民投票意向较早确定的情况下 , 本年的美国大选民调原则上应该会比2016年更有参考价值 。 不过 , 这次大选民调的一大变数却是网上民调的冒起 。 网上民调大行其道过去 , 民调通常透过固网或手提电话号码随机抽样进行 , 然而由于人们的回应率比过去大幅下滑——根据皮尤研究中心(Pew Research Center)的数字 , 其在1997年的回应率为36% , 到了2019年底则只余6%——使用电话进行民调的成本越来愈高 。 于是 , 随着互联网的普及 , 网上民调就大行其道 , 目前常被引用的美国选举民调机构 , 诸如YouGov、哈里斯民调(Harris Poll)、莫宁咨询(Morning Consult)也有将民调移至网上 。 根据《纽约时报》5月的一篇文章统计所得 , 本年4月期间美国有半数进行特定州份大选民调的机构皆使用网上民调;相较之下 , 在2018年中期选举最后三周 , 只有10%期间有进行选举民调的机构使用网上民调 。 当然 , 网上民调也是种类繁多、可靠度不一 。 例如皮尤研究中心就会以传统手法随机拣选目标受访者 , 再通知他们回应网上民调问题 , 并为不能作回应网上民调的目标受访者提供“网下”的选项 。 可是 , 不少机构为减省成本 , 则采用“主动选择加入”(opt-in)的网上民调手法 , 再透过背后的各种人口数据 , 以复杂的权重分配方式 , 去用低成本的手段试图做到传统民调反映关乎全体民众现象的目标——YouGov就是此中的表表者 。 然而 , 由于要求受访者“主动选择加入”使民调失去了抽样的随机性 , 此等民调的准确度也未必能有保障 。 皮尤研究中心一项2016年公布的研究就显示 , 网上民调的误差 , 与全国性联邦调查作比较的话 , 可高达6至10个百分点 。 网上民调涌现会否导致本年大选民调再次失准 , 确实值得观察 。 上文分析完大选民调的各种准确性考量后 , 我们也许可以回到原来的问题:到底此刻的大选民调还可以相信吗?答案当然是:可以信 , 但不能尽信 。 说到底 , 民调其实只是以简单的数字去呈现复杂现象的尝试 。 正如我们用一纸大学文凭去代表一个人的知识水平一般 , 没有简单的呈现 , 我们难以有效了解世事 , 然而简单的呈现本身却不能被等同于复杂的现象 。 更重要的是 , 各种民调结果本身其实也是竞选过程中的一大元素 。 今天拜登继续采取“宅男”策略 , 什么都不做任由川普犯错 , 而川普却似乎想积极作出政策转向打破困局 , 其实一部份也是民调结果所致 。 因此 , 选举民调本身其实就是选战之中的其中一个能够左右选情的力量 , 试问一个牌局内的人又怎能确切地反映整个牌局?大选民调的参与价值确有高低之别 , 可是它们只能是选举的一个侧面 , 永远不能观照全局 。


    推荐阅读