预测美国大选,人工智能会比民调更准确吗?
本文最初发表于 venturebeat,由 InfoQ 中文站翻译并分享。
预测美国 2020 年总统大选结果的一些民调似乎并没有实现准确的猜测。
聚合网站 RealClearPolitics 的数据显示,前副总统拜登比现任总统特朗普领先 7 个百分点,而 FiveThirtyEight 的数据显示,拜登在全国平均至少领先 8 个百分点。实际上,这场大选更加激烈。例如,在佛罗里达州,FiveThirtyEight 显示拜登以 2.5 个百分点的领先优势赢得胜利,但特朗普却在迈阿密 - 戴德县获得了意想不到的支持。
民意调查并非一门完美的科学。
2016 年大选前的报告显示,希拉里在全国领先,在威斯康星州、密歇根州和宾夕法尼亚州等州的竞争更为激烈。但特朗普最终获得了赢得大选所需的 270 张选举人票。一份来自美国民意研究协会(American Association for Public Opinion Research)的报告得出结论,称州一级的民调“低估了特朗普在上中西部地区的支持率”,预测人士指出,这些州缺乏高质量的民调数据。
那么,比起主要依靠电话和网上小组调查的传统民调,是否有更准确的方法来预测选举结果呢?
KCore Analytics、Expert.AI 和 Advanced Symbolics 等公司声称,算法能够捕捉到更广泛的选举动态,因为它们利用了诸如 Twitter 和 Facebook 消息等这样的信号。
但是,目前还不清楚在 2020 年大选之后,人工智能是否比民调更准确。
KCore Analytics 从社交媒体的帖子中预测,拜登将在民众投票方面拥有很大的优势,大约为 8、9 个百分点,但在选举人团投票方面的优势微乎其微。
总部位于意大利的 Expert.AI 发现,拜登在社交媒体上的情绪方面排名较高,认为民主党候选人略微领先特朗普(50.2% 对 47.3%)。
相反,Advanced Symbolics 的 Polly 系统,由渥太华大学的科学家开发,其预测结果完全是错误的,该系统的预测结果显示,拜登获得了 372 张选举人团选票,而特朗普则获得 166 张,这要归功于该系统预期拜登在佛罗里达州、得克萨斯州和俄亥俄州获胜,而这些州正是特朗普的票仓。
与民调类似的一点是,由算法驱动的预测中的一些差异也可以归因于方法上的差异。
Expert.AI 利用一个知识图谱来标识命名实体(包括人员、公司和地点),并尝试对它们之间的关系进行建模。该公司表示,其系统将 84 个情感标签附加到来自 Twitter 和其他网络的数十万条帖子上,这使得它能够半自动地清除社交媒体中的“僵尸”账户。
Expert.AI 的算法对标签进行排名,从 1 到 100(反映其强度),并将其乘以每个候选人出现的次数。与此同时,它将情绪分为“积极的”、“消极的”,并利用这一点来创建一个指数,可以比较这两个候选人。
相比之下,KCore Analytics 公司声称他们已经使用了超过 10 亿条经挖掘的推文来指导他们的预测,他们利用端到端的框架来寻找 Twitter 等网络中的影响力人物和标签。数据的选择是基于内容和频率,表面上看是实时的,但排除了机器人,一个名为 AWS-LSTM 的人工智能模型对这些数据进行分析,并进行意见分类,据称正确率高达 89.5%。
至于 Polly,它收集了一个随机的、可控的美国选民样本,通过他们在社交媒体上的帖子和对话进行识别。在 11 月 3 日之前,这一总数为 288659 人。
使用人工智能预测选举结果的一个挑战是,必须训练算法学习与全国预测相吻合的选举人团的不同模型。另一个问题是,它们需要微调自己,以发现对特定少数群体和地区重要问题。群体越小,就越难以找到。
根据 Advanced Symbolics 的说法,Polly 在这方面彻底失败了。这个模型预测,佛罗里达州将把投票给拜登,占该州总票数的 52.6%,但这只是因为系统没有对古巴裔美国人进行单独采样,而古巴裔美国人通常会投票给共和党候选人。相反,Polly 将他们与委内瑞拉裔美国人和墨西哥裔美国人一起归为“西班牙裔”。
Polly 团队本周在一篇博文中承认:“我们需要在下一次选举中加入更多的种族和地区‘因素’。放大错误使它们更容易被发现,通过一个问题一个问题,一个州一个州地找到 Polly 误入歧途的地方。”
模型还难以解释美国的农村地区。
这是因为这些地区使用 Twitter 的潜在选民比例较低,导致模型低估了拜登选民的优势。此外,Twitter 上的特朗普潜在选民更少,因为这个社交网络倾向于自由派。这意味着特朗普支持者的推文在基于社交的选择预测模型中具有更高的权重,但有时候还不够高,就像 Polly 的情况一样。
今年大选日,特朗普获得了超过 6860 万张选票,而 2016 年这一数字为 6280 万张。在像迈哈密 - 戴德县等预期成为“蓝州”的县中,截止 10 月 30 日,共和党人的投票比例略高于民主党人(该县登记的共和党人的比例占 63%,民主党人的比例占 56%)。
KCore Analytics 等公司声称,他们的人工智能模型优于传统民调,因为它们可以扩展到庞大的潜在选民群体,并根据抽样偏差(例如代表性不足的少数族裔)和其他限制因素进行调整,以预测大选结果。他们正确预测了 2016 年英国将投票脱离欧盟,并正确预测了台湾 80% 左右议会选举胜利者,以及接近印度和巴基斯坦的地区选举。
但它们也并非万无一失。
正如《财富》(Fortune)杂志指出的那样,这些模型都没有考虑到法律挑战、失信选民(指选举人团成员不投票给他们承诺支持的候选人),或者可能影响选举结果的其它混合因素。
就拿 Polly 来说,这些方法,与传统民调一样,它似乎也低估了 2020 年选民对特朗普的热情,特别是在黑人和拉丁裔选民,以及LGBTQ(译者注:非异性恋者,即男女同性恋、双性恋、变性人和对自己性别认同感到困惑者)群体中。
哥伦比亚大学统计学和政治学教授 Andrew Gelman 提出了这样的观点:与根据民调平均数得出的猜测相比,根据特定选举年的某些变量调整的民调模型可能更接近实际情况。
“政治学家们已经开发了一些模型,这些模型能够很好地预测基于所谓的‘基本面’的全国投票情况:经济增长、总统支持率和在任情况等关键变量。如果我们采用这些模型中的一种,并根据 2016 年以来各党派的得票率情况(而不是利用最近的民调数据)进行调整,我们将会预测拜登将以微弱优势获胜”,Andrew Gelman 在《连线》(Wired)杂志的一篇专栏文章写道。
作者介绍:
Kyle Wiggers,技术记者,现居美国纽约市,为 VentureBeat 撰写有关人工智能的文章。
原文链接:
评论