

这是一个拥有更多数据的时代,而我们不知道如何处理这些数据。因此,我开始怀疑:谷歌的搜索结果与选举结果是否有良好的关联?
这并非完全是一个无意义的问题。谷歌通过其趋势团队发布了关于美国和国际上的人们正在搜索什么的数据和分析。既然谷歌搜索已经成为人们获取问题答案的默认机制,我们有理由认为,这些搜索可能揭示了一些意图。这毕竟是谷歌的商业模式:如果你搜索“新车”,谷歌假定你想买一辆新车,你打开的每一个页面都会弹出谷歌销售的新车广告。这并不复杂。
由于谷歌擅长分享其数据,所以Trends团队向我提供了竞选活动最后一周和最后一天的搜索结果,这些数据是由参加全国范围内一些有争议的参议院和州长竞选的候选人提供的,这使我能够回答上面第一段中的问题。(事实证明,谷歌甚至很擅长回答二阶问题。)
这个答案吗?不,搜索兴趣和选举结果并没有太多重叠。
注册如何阅读这张图表,这是Philip Bump的每周数据通讯
我们可以从简单地比较每场比赛的实际结果(截至周三下午)和搜索兴趣开始。在下面的图表中,每个候选人(蓝色的民主党人和红色的共和党人)的得票率(从下到上)和他们在11月7日获得的搜索兴趣的百分比(从左到右)的关系被显示出来。
如果搜索兴趣与选举结果完美匹配,那么每个州都将位于对角线上。相反,结果更多的是一片云。这种相关性并没有那么强。
但这让我震惊:也许这是在某种程度上遗漏了已经投票的人?因此,我从亚利桑那州获取了数据,并对数据进行了比较,那里的结果是按投票类型(包括选举日独有的)划分的。相关性更强。例如,11月7日,共和党州长候选人卡莉·莱克(Kari Lake)和她的对手凯蒂·霍布斯(Katie Hobbs)之间73%的搜索结果都是她的焦点。第二天,莱克获得了70%的选票。但在参议院竞选中,这种关联被打破了。
谷歌还为我提供了一个稍微宽一点的观察窗口。如果我们将上周的搜索结果与选举结果进行比较,我们会发现相关性略好,但并不多。(从视觉上看,我们可以看到下面的状态通常更接近对角线。)这仍然不是一个很好的预测指标。
但我们也可以更具体一些。上周谷歌的搜索结果正确预测了我所查看的65场比赛中的45场。(我排除了阿拉斯加州这样的竞选,在那里,选举结果是由排名选择投票决定的。)三分之二的准确率还算不错,但并不算高。
它还包括很多在预测赢家没有用的情况下的爆棚。在实际差距低于10分的比赛中,谷歌的搜索数据在37场比赛中只有21场是对的,约占总数的57%。比掷硬币稍微好一点。
显然,趋势是非常有用的工具。然而,如果你指望他们来告诉你谁将赢得一场势均力敌的选举,你向空中抛一枚25美分的硬币,看看它如何落地,效果差不多。