电话的从发明至今已经有上百年的历史了,在这上百年里,人类与电话的交互方式也悄然发生了质的改变。直到手机被发明后标志着智能时代的到来。而智能手机交互方式却变得止步不前,除了触摸还是触摸,就没有点新鲜的吗?我们每天捧着手机刷朋友圈,打农药真的以为我们是在玩智能手机?而不是智能手机玩我们? 快搬小板凳 开始讲课了 在古代,人类没有的传递信息方式靠的就是一张嘴,一双腿。马拉松的故事大家应该都听过,一名雅典士兵靠着一双腿跑回了故乡告诉部队胜利的消息。那个年代人类更多的通讯交互方式是靠自身或是以动物为载体来传达。 140年前电话诞生后,人类通讯才真正意义上有了交互。电话的发展历史就是一篇人类通讯史。电话的出现让人与人之间变得更近,也让世界变得越来越小。而最早的电话运用最广的则是在战争领域。 手摇电话机在战场中运用的最为广泛,前线指挥官在电话上摇两下就可以接到后方指挥官。那时候的电话机属于单线联系,无需拨号但需要人工连线才能帮忙接通。 不过随着改革开放的到来,“楼上楼下,电灯电话”的梦想在千百中国人心中扎根,那些年家里能有个电话已经是富贵的象征。而那时候电话座机与现在其实容貌相差并不多,采用数字键拨号来与电话控制。 1973年美国摩托罗拉发明了第一款推向民用的移动电话,但人与电话之间依然是靠按键的形式进行交互,而知道2007年乔老爷子发布第一款iPhone后,交互方式才彻底被改变。 触摸的交互形式其实并非苹果首创,但苹果在当时将触摸的体验做到最好。那时候大家才发觉到屏幕还能如此一般的触摸简直不可思议,都被那丝滑的流畅和多点触控带来的良好体验所折服。 智能语音不是聊天机器人 纵观整个手机和电话发展史,人类与电话之间的交互不管是摇还是按,再到触摸,都没有离开过我们的双手。如今智能的功能越做越丰富,而在交互逻辑上除了触摸还是触摸,但为了能彻底解放我们的双手,就需要新的一种交互方式,智能语音。 提到智能语音就不得不提到人工智能,有智能语音的加持,所有的智能设备才可以变得真的只能。智能设备首先就是要先从听得懂人话开始。而智能语音可不是单纯的聊天机器人,智能语音是通过及时对话完成交互,实现帮用户搞定问题甚至提出一些合理的建议。说起智能手机语音助手方面就不得不提苹果的Siri和谷歌的Google Now。 苹果Siri Siri成立于2007年,2010年被苹果以2亿美金收购,最初是以文字聊天服务为主,随后通过与全球最大的语音识别厂商Nuance合作,Siri实现了语音识别功能。 每年苹果都会在苹果iOS系统更新上花大力气优化Siri,一句“Hi Siri”就可以完全激活Sir语音助手。其最大的特色,则是人机的互动方面,不仅有十分生动的对话接口,其针对用户询问所给予的回答,也不至于答非所问,有时候更是让人有种心有灵犀的惊喜,例如运用者如果在说出、输入的内容包括了“喝了点”、“家”这些字(甚至不需要符合语法,相当人性化...),Siri 则会判断为喝醉酒、要回家,并自动建议是否要帮忙叫出租车。 Google Now 说完了苹果那必须就要来说说他的对手Google,Google Now是在谷歌I/O大会上随安卓4.1系统同时推出的一款使用,作为一款智能手机语音助手,它会全面了解用户的各种习惯和正在进行的动作,并向用户提供相关信息。 再动手你就OUT了 未来智能手机你得这么控制 相比于Siri作为最早发布的个人智能语音助理产品,Siri必定会遇到强有力的竞争对手,被超越也属正常情况。Google Now优于Siri的一个先天优势在于与Google搜索功能的结合,用户搜索的关键词被记录下来,Google Now智能化读取关键词后为用户提供相关的智能手机语音服务。除了处理速度快之外,Google Now针对用户需要“主动”为用户发出提醒,而不仅仅是回答用户的提问,产品性能更为人性化。 但是作为中国用户,在中文语境下两款的语音体验都不尽如人意,Siri的语音识别率不高,稍微有点方言就听不懂,但是人工智能做的比较好,调戏Siri已经它存在的意义,不过搜索引擎够强大。 网友调戏Siri Google Now语音识别率很高,但Google Now不像Siri那样有人情味,比较呆滞死板,不能调戏。还一个重要的一点,在中国我们压根就用不了谷歌的任何服务,而且就算可以用还需要将智能手机界面设置成英语。 中文语音助手不鸡肋 话说我们中国语言博大精深,一句话可以就可以有多重含义。有时候我们不得不佩服老祖宗,能把这么复杂的语言传承下来实属不易。在语音识别方面谷歌和苹果甚至微软都很难做到准确识别中文,明明识别非常好,可到了中文模式下本是智能的语音助手却变成了智障语音。 在中文语境里做的比较好的不得不提一下讯飞,笔者知道讯飞做智能语音应该还是说因为锤子的坚果Pro上的闪念胶囊,孤陋寡闻的我以前并不是很看好语音输入和语音识别。但在坚果Pro上看到了讯飞语音输入后才彻底改变了我对这一事物的看法。 抛开锤子的闪念胶囊,讯飞可以让中文语音输入做到如此高的准确率实属难得,而讯飞推出的灵犀语音助手也针对中文口音问题进行了识别优化。现在在国内成为了代替Google Now的语音助手。 智能语音是强智能还是弱智能? 弱智能,直接开门见山的给出我的答案。现在来看,智能语音助手还处于很基础的阶段,除了可以满足用户的查看天气预报和定闹钟以外很难想象得到能有别的什么用。英文语境下的智能程度多少要比中文高,其中的原因我分析有两个。 第一是受语言环境所致,上面也阐述到了,中文的语言表述非常复杂,复杂程度可以说就连我们自己有时候都听不明白,一句话可以有好几种表达方式。再加之中国的方言千变万化,就算是普通话还会分南区北区江浙区之分。 第二个原因则是大部分掌握智能语音核心技术的都是国外公司,国外公司不愿意将主要心思放在中国,而我们国内的智能语音研究公司又比较稀缺,使得国内的智能语音运用率偏低。 不过随着人工智能浪潮的来袭,我们会更加的急需智能语音助手的帮助。在智能家居如果连人话都听不懂只是简单靠两三个APP支持那还叫什么智能?在智能汽车中,如果汽车连我要去大栅(shi)栏还是大栅(zha)栏都听不懂还怎么导航? 终极交互方式联想(纯属联想 只为娱乐) 智能语音交互可以说是现在最靠谱的未来畅想,而人类的钻研和进步是永无止境的,此时我们每天用的叫智能手机,那今后随着技术的不断更新,智能手机或许也就不叫手机了。 眼球交互 早在若干年以前,三星就在Note3上搭载过眼球翻页的技术,也算得上是当时一项黑科技的存在,但不知道因为翻页时过于尴尬所以才取消这技术。试想一下如果这项技术在今后可以实现,那么应该会极大程度上避免斗鸡眼的发病率。 全息投影 手腕上可以带上一种全息投影装置,随用随打开,但终究还是靠手指来进行交互操作,所以只能说是在设备上进行了创新。不过倒是对练练左手很有帮助。 意念交互 运用意念来控制设备应该是人类的最终极状态,每个人脑中都可以植入一颗电子芯片,通过思想来控制智能设备。开车时用意念控制车辆的行驶,通话时只需要用意念控制通讯设备拨打电话。到那时人类才算是彻底解放了双手。 写在最后 当智能语音刚刚出现在手机当中时,它只是作为了一款辅助工具来运用,更多的只是完成一些很机械式的工作。但随着智能家居和智能移动设备的智能化,手机将肯定还是会作为一个智能中枢,来起到与智能设备联动的作用。 笔者认为只有智能语音的加强才可以让设备听懂我们需要什么。虽然现在来说智能语音只是扮演一个助手角色,而作为设备联动中枢的智能手机,首先是要先听懂。所以今后智能手机交互的将来,最可能实现的就是让语音助手变成“语音主手”。不知大家有什么意见呢?可以随时留言与笔者沟通。 |
发表评论