扎克伯格的人工智能计划依赖于你的Facebook和Instagram数据 - 彭博社
Parmy Olson
马克·扎克伯格上周在参议院司法委员会听证会上宣誓,题为“大型科技公司和在线儿童性剥削危机”。
摄影师:汤姆·威廉姆斯/CQ-Roll Call, Inc.然后就剩下了六位伟大的人?
摄影师:内森·莱恩/彭博社
对许多人来说,Facebook 就是 互联网,其用户数量仍在增长,根据Meta Platforms Inc.的最新财务结果。但马克·扎克伯格并不只是为持续增长而庆祝。他希望利用Facebook和Instagram的数据来创建强大的通用人工智能。听起来很棒,而Meta已经做好了准备,但他数十亿的用户最终可能会以牺牲隐私等代价。
以下是扎克伯格在周四透露的他在人工智能领域的下一步计划:
“我们计划书的下一个关键部分是从我们产品中独特的数据和反馈循环中学习…… 在Facebook和Instagram上,有数千亿的公开共享图像和数百亿的公开视频,我们估计这比Common Crawl数据集还要大,人们在我们的服务中分享了大量的公开文本帖子和评论。”
扎克在这里提到的“Common Crawl”之处 使科技界观察者感到震惊,因为该存档已经非常庞大: 2500亿个网页 跨越17年。它是当今用于训练人工智能系统的最大和最受欢迎的公共互联网存储库之一。当OpenAI于2020年推出其GPT-3语言模型时,接近60%的文本来自Common Crawl。
但是Meta的数据量甚至更大,这意味着理论上它可以构建“更智能”的人工智能。这是因为研究表明,用更多的数据训练人工智能模型往往会使它们更有能力和更准确。这个公式对OpenAI来说效果非常好,多年来它增加了用于创建ChatGPT等模型的数据量。
如果扎克伯格想要制作一个更强大的聊天机器人,他所拥有的数据堆对他来说尤其有价值,因为其中很多数据来自评论串。任何代表人类对话的文本对于训练所谓的对话代理非常重要,这就是为什么OpenAI 大量挖掘互联网论坛Reddit Inc.来构建自己的热门聊天机器人。
每当扎克伯格谈论新的抱负时,人们很容易嘲笑--无论是机器人、加密货币还是元宇宙。他最新的不切实际的愿景尤其宏大:构建“通用智能”,或者说能够达到或超越人类智能的软件系统。但是有了那么多数据,扎克伯格的追求看起来是可行的。问题在于对我们其他人可能会产生什么后果。
奇怪的是,在同一条消息中,扎克伯格说他的人工智能团队已经致力于构建通用智能“超过十年”,他还说Facebook现在才会利用用户的数据来构建模型作为“我们接下来策略的关键部分”。Meta为什么还没有这样做呢?也许是因为使用所有这些数据并不那么简单。首先,这将代表对Facebook的30亿用户和Instagram的15亿用户隐私的又一侵犯。就像OpenAI因为搜集艺术家和作家的受版权保护的数据来训练其模型而受到指责一样,Facebook也将因再次利用人们的数据而面临声誉上的打击。这不仅引发了棘手的伦理问题,而且可能需要严格的数据处理做法和遵守全球数据保护法律,这可能会激怒欧洲监管机构。
另一个问题是数据中存在的偏见和毒性。根据蒙特利尔大学的一项2021年研究,OpenAI不得不处理Common Crawl中包含诸如adultmovietop100.com和adelaide-femaleescorts.webcam等网页的问题。同一研究称,Common Crawl中有4%至6%的网站包含种族歧视言论、仇恨言论或种族上带有阴谋论。
虽然Facebook的内容审查软件在阻止仇恨言论和阴谋论方面已经变得更加完善,但仍然存在不足之处,并且在美国以外的国家往往更糟。Facebook上一些被标记为有毒的内容不再接受人工审核,而是被留在网站上。更糟糕的是:当扎克伯格表示Meta的数据比Common Crawl的数据更庞大时,他很可能将公司的历史存档一起计算在内,其中可能包括扎克伯格在清理网站之前存在的所有夸张的政治内容和假新闻。
所有必须进行谨慎数据处理和检查的工作可能解释了为什么扎克伯格现在才谈论利用他所掌握的数据宝库。如果他不做好这件事,他就有可能再次面临公众对Facebook处理假新闻和有害内容的批评噩梦。
不过,如果有一件事我们对扎克伯格很了解,那就是他像凯撒一样痴迷于胜利和统治。上周,在他面对华盛顿特区的家长约24小时后,这些家长指责他导致他们的孩子自残甚至自杀,他就宣布Meta有史以来最成功的财季,并暗示他将如何利用人们的数据来创建强大的人工智能。
这些事件的接近应该提醒我们:Facebook通往财富的道路伤害了许多人。它建立强大人工智能的道路也可能如此。
更多来自彭博观点:
- 一家复兴的Meta购买继续支出的许可:戴夫·李
- 埃隆,请不要让互联网进入我们的大脑:帕米·奥尔森
- 山姆·奥尔特曼的Open AI领导力过于人性化:蒂姆·奥布莱恩
想要更多彭博观点?OPIN <GO>。或者您可以订阅我们的每日新闻简报。
要直接将约翰·奥瑟斯的新闻简报发送到您的收件箱,请在此处注册。
用一个恰当的类比来说,大科技股票就像埃隆·马斯克的火箭。它们似乎超出了地球的引力范围,现在正在测试物理定律(特斯拉公司除外,它突然受到了重力的影响)。用借鉴科幻小说的语言来说,一些成熟的市场关系正在发生变化。周五,债券收益率因就业报告强劲(稍后详述)而大幅上涨。它们对股市产生了什么影响?科技股有一个很好的一天。请记住,流行的论点是,较高的长期收益率对“长期持有”公司特别有害,比如大型科技集团。它们大部分价值在于未来收益,必须以更高的利率贴现。因此,随着收益率上升,2022年大科技股表现不佳,而随着其得到控制,2023年表现良好。到目前为止,今年收益率上升了,这些股票也上涨了。这张巧妙的图表来自美国银行证券的迈克尔·哈特内特: