移动互联网结束了百度全力投入人工智能 - 彭博社
bloomberg
在2016年12月6日,成千上万的翻译人员涌入中国大陆的办公大楼,仔细研究外文的宣传册、信件和技术手册,费力地将其文本翻译成中文。这场马拉松式的工作每天持续15小时,整整一个月。提供材料的客户以低廉的价格获得了专业级的中文版本。但 百度公司,这家总部位于北京的公司组织了这次大规模翻译,获得了更有潜在价值的东西:数百万对英汉词汇,用于训练其在线翻译引擎。
中国因其仿制品而臭名昭著,无论是奢侈手袋还是网络初创公司。但国家领导层似乎明白,在人工智能方面,廉价的模仿是行不通的——尤其是当其竞争对手包括谷歌、Facebook、IBM和微软时。今年2月,国家发展和改革委员会任命百度——常被称为中国的谷歌——领导一个新的人工智能实验室,这表明北京相信该公司在这一领域有成为国家冠军的潜力。
根据百度联合创始人兼首席执行官李彦宏上个月在实验室启动时的讲话,过去两年半中,百度在研发上花费的超过200亿元人民币(29亿美元)中,大部分用于人工智能。但中国的国家利益并不是他的主要动机:百度的收入增长在去年降至约6%,而在之前三年平均超过30%。搜索广告业务贡献了其在截至12月31日的财政年度中705亿元人民币销售额的绝大部分,但正受到当地竞争对手的冲击。EMarketer Inc.在9月的一份报告中指出,阿里巴巴集团已经超越百度,成为中国数字广告市场的领导者。百度希望人工智能能帮助其在搜索中重新夺回市场份额,并确保在新业务中的成功。
百度在CES上展示了小鱼,一款语音激活的机器人。
来源:百度这很关键,因为这家成立17年的公司的多元化尝试产生了混合的结果。到2017年2月的12个月里,其团购网站“糯米”的每日访客数量下降了59%;根据中国国际资本公司的分析师Natalie Wu的说法,其外卖服务在第三位徘徊。类似Netflix的流媒体视频服务iQiyi.com非常受欢迎,但根据中国复兴证券(香港)有限公司的分析师Ella Ji的估计,今年需要120亿元来保持内容的供应。
这些乏力的努力意味着百度在人工智能方面的推动变得更加重要。“移动互联网时代已经结束,”李在3月10日的采访中说。“我们将积极投资于人工智能,我认为这将使很多人受益,并改变一个又一个行业。”
在1月份,公司任命前微软公司高管Qi Lu为首席运营官,负责围绕深度学习、增强现实和图像识别等技术重塑公司。他与首席科学家Andrew Ng一起工作,后者是一位斯坦福大学的学者,在2014年离开Alphabet Inc.的深度学习团队后加入百度。在Ng的监督下,公司的人工智能团队分散在北京、深圳、上海和加利福尼亚州的Sunnyvale的研究实验室,已经增长到1300人,并预计今年将增加几百名新员工。“中国发明了很多东西,美国也发明了很多东西,”在硅谷工作的Ng说。“通过在两个国家拥有人员,我们可以看到最新的趋势。”
在2014年5月Sunnyvale研究中心开幕的那天,Ng和他的首席助手Adam Coates坐在一块空白的白板前,确定他们的第一个项目。在列出了一系列可能性(和挑战)后,他们决定将语音识别作为一个基础,以便构建一系列其他产品。
到2015年中,50人的团队开发了一款名为Deep Speech的产品,能够解读大部分英语中的话语。该软件不是逐字逐句地分析短语,而是通过大量的语言数据进行解析,然后推断出模式,这一过程被称为深度学习。Ng表示,该系统能够比依赖词汇表和音标字典的传统引擎更准确地转录语音,因为它考虑了一个词的上下文来确定其含义。
然而,有一件事始终让它感到困惑,那就是随着时间的推移,从其他语言中渗入英语词汇的单词和名字。“如果你想说‘播放柴可夫斯基的音乐’,软件会返回像‘播放音乐并尝试咳嗽滑雪’这样的答案,”Coates说,他是Ng从斯坦福大学招募来的。“我们真的把它称为柴可夫斯基问题。”
而不是简单地将“柴可夫斯基”添加到系统的词汇表中,百度的程序员必须帮助Deep Speech自我学习理解这个词。这涉及到输入更多的数据,以帮助系统将事物放在上下文中。
来自北京的百度自然语言处理部门副主任赵世奇回忆说,作为中国哈尔滨工业大学的计算机科学学生,他在进行计算机翻译时只有200万对英汉词汇可供使用;而百度大约有1亿对。然而,根据2016年《科学》杂志的一篇文章,Alphabet的词汇量仍然远远超过500百万,其中 featured 了美国公司的研究科学家Quoc V. Le。
为了缩小差距,百度采取了一种古老的策略:投入大量人力来解决问题。该公司现在全年提供人工翻译服务,并定期举办马拉松活动,例如12月的活动,在活动中为客户提供智能手机和净水器等奖品。收集的数据有助于提升百度翻译引擎的性能,并进一步推动深度语音的发展。
由阳光谷团队创建的软件于2016年7月首次商业亮相,推出了TalkType,一款具有语音转文本功能的键盘应用。此后,该技术被整合到其他产品中,包括在中国名为DuMi的类似Siri的个人助手,以及在其他地方的DuEr。(DuMi是“du”来自百度和“mi”的结合,后者在普通话中意为“秘书”;DuEr听起来像“做者”。)百度在深度语音中融入的机器学习正在帮助其为其他产品赋予智能。例如,它是小鱼在家(“小鱼”)的秘密武器,这是一款语音控制的机器人,类似于亚马逊的Echo,百度在1月份的拉斯维加斯CES展会上展示了该产品。
百度的网络资产组合使其能够访问中国有史以来最大和最详细的消费者数据集之一,这在理论上至少应该使其在为大陆构建AI驱动的产品和服务时占据优势。得益于糯米和外卖,该公司知道中国家庭购买和消费的食品,而全球第二大在线旅行代理商携程网则揭示了他们想要度假的地方。每个月有6.65亿智能手机用户访问其移动门户和应用程序,而3.41亿用户使用百度地图到达目的地。“认为AI是一个产品是个错误——它是产品的基础和推动力,”汇丰控股分析师Chi Tsang说。“想想所有的使用案例。”
新的人工智能产品尚未对百度的底线贡献太多。但该公司在这一领域的新兴专业知识可能帮助其在已存在的细分市场中实现主导地位,并推动其进入新的领域,如云计算和自动驾驶汽车。“在接下来的三到五年内,所有这些领域都有潜力成为另一个百度,”公司总裁张亚勤说,指的是百度602亿美元的市值。“现在是时候做一些投资了。” —在 David Ramli 和 Alex Webb 的协助下
底线: 百度的1300人人工智能团队正在编写软件,以改善从翻译到点餐的所有服务。