加入收藏 | 设为首页 | 会员中心 | 我要投稿 应用网_丽江站长网 (http://www.0888zz.com/)- 科技、建站、数据工具、云上网络、机器学习!
当前位置: 首页 > 综合聚焦 > 移动互联 > 通讯 > 正文

语音接口 我们已站到下一个交互时代的边缘

发布时间:2016-07-04 04:51:50 所属栏目:通讯 来源:网络整理
导读:近日美国《连线》杂志撰文指出,随着计算机处理、语音识别、移动通信、云计算、神经网络等技术的发展日趋成熟,语音接口技术迎来了飞跃,虚拟语音助理业务的发展迎来了变革时期。你或许听过这样一个故事。1979年,年轻的史蒂夫乔布斯造访了位于位于加利福

毕竟在当前,语音接口技术的基础技术——卡普兰所称的“门控技术”已经趋于成熟,成本也可接受。这是关于技术融合的经典:计算机处理、语音识别、移动通信、云计算、神经网络等技术的发展都已经成熟,成本也达到可以接受的水平,可以使得会话用户接口市场化。

更进一步,不仅仅是相关技术的成熟推动了会话用户接口的研发,而客观的市场需求也是推动其发展的重要因素。随着越来越多的无显示设备连入网络,诸如你家中的灯具、烟雾报警器,我们也需要一种可行的方式与设备进行交互,这种交互不需要按钮、菜单或是图标。

undefined

在另一方面,图形用户界面已经接近其自然限制。程序的功能越来越多,在图形用户界面中充斥的菜单和图标选项也越来越复杂。你可以想象一下Photoshop或者是Excel,功能强大,但有着大量的菜单项,或者需要记住各种快捷键的使用方式。即便是裁剪一张照片也要从各色工具栏中找出正确选项。卡普兰指出,“图形用户界面已经到达极限,现在它已经处于超载的边缘。”

这就是即将到来的虚拟语音助理市场,当你被淹没在纷繁复杂的界面窗口、工具栏以及菜单选项时来拯救你,在你和设备之间建立便捷、高效的联系。

也许目前我们与虚拟语音助理的关系尚不紧密,但很快这一状况就会改病啊。今年秋季,随着一批新款智能手机的上市,很快相应的会话用户接口发展也将出现一次飞跃。当你升级到iOS 9、Andriod 6或是Windows 10时,你会发现直接使用内置应用的频率会越来越少,更多的是使用苹果Siri或是谷歌的Google Now以及微软的Cortana。而在不远的将来,数十亿的Facebook用户将可以打开一个聊天窗口,通过智能语音助手调用各项功能。语音接口将不再是辅助的方式,而将成为主流和第一选择。甚至于在某些情况下,它将是用户的唯一选择。譬如在苹果的HomeKit系统中,确保一切设备关闭的唯一可行操作就是对苹果的语音助手说“晚安,Siri”。

这些虚拟语音助理研发的初衷是将复杂简单化。对于现在的用户来讲,频繁的下拉菜单操作过于复杂,调用一个功能需要按步骤操作,流程过于繁琐。相比于此,虚拟语音助手清楚手机内每一个程序以及每一项功能,你可以通过说话来调用这些功能。同时随着时间的推移,这种人工智能将知晓一切。

需要指明的是,语音技术并不会完全取代触控屏,甚至是鼠标和键盘。如果你需要使用台式机,肯定会保留这些人机交互方式。虽然更多时间你可能会问虚拟语音助理如何调用功能,譬如“裁剪工具在哪里?”

但是,对于某些特定群体的人来说,会话用户接口技术的发展将会在很大程度上取代其对图形用户界面的使用。诸如一些年轻人都通过麦克风输入文本而不是通过键盘。语音消息应用Cord创始人以及首席执行官托马斯格诺(Thomas Gayno)指出,“他们只是不打字。”而对于更大一部分人来说,图形用户界面完全不适合其使用。那些视障者、老年人在图形用户界面前都受到了这种障碍的影响。因此,有些人称现代计算机接口为“直觉”并不十分准确。

克里斯·莫里(Chris Maury)对此深有体会。2010年夏季,这位24岁的企业家在攻读博士学位的过程中辍学转而创业。但长时间的熬夜使得其视力逐步下降,一位医生诊断其患上了斯特格氏症,这种病症会使视力逐步退化甚至完全失明。

作为一名技术人士,莫里不得不考虑如何应对无法看到电脑屏幕的状况。但在整个美国,对于2000万视障人士来说,除了屏幕阅读器别无选择。

要使用屏幕阅读器,用户需要通过键盘移动光标,选中需要阅读的屏幕文字,将其转换成一长串的URL,通过机器语言读出来。这种相关的设备高达数千美元,并且需要几十个小时的培训。随着数字环境越来越复杂,屏幕阅读器的使用越来越不方便。莫里表示,“即便是打开一个谷歌搜索也需要很多步骤,这太可怕了。”

undefined

当莫里视力开始退化时,他经常访问Blind Twitter去了解情况。莫里开始明白视障人士迫切需要一种技术。他意识到语音接口对于某些特定用户更为便捷,而几乎在同一时间,相关的语音技术也风行整个硅谷。

因此,莫里开始着手为视障人士开发相关技术。他创办了一家名为Conversant Labs的公司研发语音接口技术。公司推出的第一个产品是一个名为SayShopping的iPhone应用,其可以完全通过语音从Target.com上购买东西。但莫里有更大的想法,公司将于今年年底发布语音接口框架,为iOS的应用开发者提供会话接口。莫里还希望能够开发一款完全基于语音技术的计算机应用环境,同时也可通过头部运动来下达指令。莫里指出,“这些实现都是有可能的,只是需要创建。”

2014年秋季,亚马逊发布来名为Echo的新产品,这款智能控制设备内置了名为Alexa的虚拟语音助理,其广告语是“唤醒话语”。Echo采用了远场语音识别技术,甚至在嘈杂房间也可准确识别话语。此外它还具有监听功能,你可以在家中随时和其对话。

当我开始使用Alexa时,它可以告诉我天气,回答基本的问题,在智能手机上显示购物清单或者是播放音乐,并没有过多特别之处。但是随着时间推移,Alexa更聪明也更完善,它熟悉我的声音、会开玩笑、能同时运行多个计时器。测试版发布七个月后,2015年其公开版最终上线,Alexa的可用性越来越强。我了解了它,而它也在了解我。

这也是关于会话科技的深层次道理:你只有在与语音助理的深入交互中才会发现其功能。同行业的诸多公司都认识到这一点,都在努力使其语音助手达到个性化和适应性的平衡,使他们更加讨人喜欢,易于接受。譬如微软在开发语音助手Cortana时,其名称取材自游戏《光晕(Halo)》中的重要角色。Cortana工程团队主管Mike Calcagno表示,“Cortana代表了机智和坚韧”。的确,在产品早期即便其可靠性低,益处少,也会引起人们注意。

这种方式也有策略方面的考量。在微软、Nuance等公司的研究中,当语音助理无处不在、当它了解你的习惯你的环境、了解你的喜好你的生活时,它就是不可或缺的存在。通过这种人工智能控制所有应用程序和设备的方式自然也就成为必然。

为此,无论是亚马逊、谷歌、微软,还是Nuance或者SoundHound,都在致力于会话平台技术的研发。这些公司清楚,用户会选择最了解他们的语音助理。让我们做好迎接虚拟语音助理的准备。更重要的是,一旦选择了其中之一,你就不会再轻易放手。

(编辑:应用网_丽江站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读