社交媒体研究人员在X、Meta上追踪虚假信息方面遇到困难-彭博社
Isabella Ward
插图:Jinhwa Jang for Bloomberg Businessweek
社交媒体公司一直在重新评估外部人员如何访问他们的数据,并得出结论应该更难或更昂贵。在过去的一年里,前称为Twitter的X和Reddit都开始收费访问他们曾经免费提供的数据,这是继Meta Platforms Inc.之前的限制之后的又一次变化。这些公司给出了各种理由,包括希望减少机器人、降低服务器成本或保护隐私。但这些变化也影响了另一个功能:追踪虚假信息的研究。
五个研究小组的人士在匿名情况下表示,他们正在违反这些公司的规定来获取他们继续工作所需的数据。他们表示,最近的变化将使追踪平台和不良行为者变得更加困难。研究人员希望这些公司提供更好的数据访问,或者更好地监管他们自己的应用程序。他们表示,这个问题尤为关键,因为数十个国家正在为2024年的选举做准备。
多年来,社交媒体公司一直允许外部开发人员通过称为应用程序编程接口(API)的工具访问他们的系统。这对这些平台来说非常有用,比如开发人员使用Twitter和Reddit的API构建流行工具和替代界面。API访问还促成了一个研究生态系统,用于批量分析社交媒体内容。
授予广泛的API访问权限可能会使公司面临风险。研究人员对在线滥用和虚假信息的传播达成了结论,这并不总是让社交媒体公司看起来很好。然后还有数据本身的潜在误用。Meta花了多年时间处理剑桥分析公司的争议的后果,当时一家政治咨询公司积累了数百万Facebook用户的信息,据称是为了学术目的而收集的,并将其用于定向广告。
2018年,Meta限制了API访问权限,引用隐私问题。 X和Reddit表示,他们今年进行了更改,因为商业实体在使用其API时损害了他们的核心业务。
一位Reddit发言人表示,非商业研究人员和学者每分钟API请求少于100次的API访问权限仍然是免费的。Meta和X没有回应评论请求。
这些决定的影响可能不仅仅是商业性的。“政治话语对民主至关重要,而这种话语大部分发生在社交媒体上。”德克萨斯大学奥斯汀分校新闻与传媒学院助理教授Josephine Lukito说。“如果不能在这些平台上进行研究,公民就无法了解平台可能如何调节政治信息,虚假信息或错误信息如何传播,甚至在2024年选举期间是否有某些观点被压制。”
一些分析师现在无法运行自定义模型来检测仇恨言论或协调活动,比如批量创建的机器人账户。跨多个平台分析信息甚至更加困难,根据弗朗西斯卡·阿尔科斯坦佐,这位数字分析部门主管来自战略对话研究所,这是一家专注于虚假信息和极端主义的智库。
研究人员正在开发创造性的替代方案,比如使用网络爬虫从网页中提取内容,这个过程被称为抓取。一些人创建自己的软件,从社交媒体平台中抓取选择的数据。其他人正在通过构建自己的API来分析X,这是在通过抓取整个服务的镜像站点的基础上进行的。
虽然这些方法可以绕过API的限制和成本,但它们也伴随着风险。2021年,Facebook关闭了纽约大学的广告观察项目,该项目通过未经授权的抓取收集了有关政治广告的数据。7月,X起诉了英国非营利组织反对数字仇恨中心(CCDH),称该组织非法获取了该服务的数据,以打击其不同意的人和组织,打着虚假信息研究的幌子。11月,CCDH提出了驳回诉讼的动议,称其毫无根据,并声称其是通过平台的搜索功能收集信息的。
X 也在试图确定与四个IP地址有关的实体,这些IP地址涉及到广泛的抓取行为,这是该公司提起的单独诉讼,在这起诉讼中,该公司寻求超过100万美元的赔偿。
卡梅伦·希基,公民组织国家公民会议的首席执行官表示,曾经会犹豫不决攻击独立研究人员的科技公司现在在虚假信息的辩论变得政治化后不再受到限制。他说:“现在这项研究的状态具有对抗性、极端党派化的毒性,因此我们对风险的看法大大增加了。”
今年,Meta 和 TikTok 推出了新的学术研究API,尽管目前尚不清楚非隶属于大学的公民社会团体和记者是否能够获得访问权限。参加 Meta 新工具演示的学者表示,当被追问时,该公司并未澄清这一点。在其网站上,TikTok 规定,研究人员必须受雇于美国或欧洲的学术机构。TikTok 的发言人表示,该公司正在努力扩大公民社会研究人员的资格。
在十月的一次会议上,研究人员讨论了跨平台访问问题的其他适应方法,包括通过合作社和捐赠来共享和存档数据。但是,为了共享数据而汇集数据也可能违反API使用条款,因此研究人员正在谨慎行事。
四月份,有700人签署了由独立技术研究联盟发起的一封信,呼吁X恢复免费或低成本的API访问权限。该团体表示,截至11月底,他们尚未收到回复。五月份,Reddit在收到同一团体的类似信函后,承诺与学术界进行谈判。但一位熟悉此事的人士(为避免影响关系请求匿名)表示,自那时以来什么也没有发生。