终于,一款可以进行听写的手机 - 彭博社
bloomberg
无线电话的主要功能是将人类的语音转换为数字信号,然后再转换回来。那么为什么不利用手机的语音处理能力来解决几乎每个人在使用手机进行电子邮件或其他数据应用时遇到的问题呢?我指的是在拨号键盘上输入文本的困难,而语音识别可以解决这个问题。
制造商们终于开始认真对待这个解决方案。使用语音命令拨打电话和控制其他功能在一些高端手机上已经存在了一段时间。但三星SPH-p207(与Cingular Wireless签订两年合同的价格为80美元)是第一款将语音识别技术应用于文本消息的听写。我发现,一旦我掌握了这个技巧,语音发送消息比敲打文字快得多。
基于之前对语音识别的经验,我准备好感到失望。在1990年代末,语音被宣传为替代PC键盘输入的选择。但软件从未足够好,以至于让大多数人觉得听写比打字更容易——尽管这对有残疾的人或在工作时需要腾出双手的人来说是一个福音。在2001年,领先的语音产品公司Lernout & Hauspie因金融丑闻崩溃后,行业从消费市场撤退,转而专注于更有利可图的细分市场,如自动呼叫中心。
手机一直是语音技术的自然选择,但直到最近,手机缺乏足够的处理能力和内存来使其正常工作。三星手机通过来自VoiceSignal Technologies的软件解决了这个问题,该软件在资源使用上非常经济。
它实现这一点的一种方式是通过适度的目标。大多数听写软件旨在实现两个目标:说话者独立性,意味着它可以在没有针对个人语音习惯进行训练的情况下工作;以及连续性,意味着它理解正常的语音,其中单词往往连在一起。VoiceSignal采取了不同的策略。该手机要求用户花大约五分钟时间来训练软件,这涉及从显示屏上朗读一系列单词。语音识别随后绑定到该个人——但考虑到手机的个人性质,这只是一个小问题。
此外,该软件只尝试一次理解一个单词(在该领域称为离散语音)。这意味着你必须非常清晰地说话,单词之间要有简短但明显的停顿。这需要一点适应,但回报是准确的识别。
要在手机上发送短信,首先按一个按钮将其置于语音命令模式,然后说“发送短信”。当被提示时,你要么说电话号码,要么说通讯录中某人的名字。如果收件人同时有手机号码和电子邮件地址,你会被问到想将消息发送到哪个“号码”。
一旦地址设置完成,你按下手机侧面的一个按钮并在口述时保持按住。当完成后,你可以将光标移动到软件识别错误的任何单词上。按“0”,你可以从可能的替代选项列表中选择,或从拨号盘中输入正确的单词。然后只需按发送。
三星p207是一款全球通用的翻盖手机,支持运行在GSM标准的蜂窝网络。它仅长4英寸,包括一个短小的天线。它具备高端手机所期望的所有功能,包括一个大而明亮的显示屏、一个相机和一个网页浏览器。但语音识别是使其与其他几十款具有类似功能的吸引人手机区分开来的特点。
语音识别在个人电脑上未能找到大众市场,因为它的速度和准确性不如使用键盘和鼠标。我认为同样的技术在手机上会成功,因为那里的替代方案要糟糕得多。关键是找到适合这项工作的正确技术。
有关过去专栏和仅在线的技术产品评论的集合,请点击这里
作者 斯蒂芬·H·威尔德斯特罗姆