北京快3官网【真.懒觉】

北京快3做语音类产品经理注意了(干货)产品

时间:2020-07-16 13:34

  随着移动智能终端和云计算的快速发展,人工智能的浪潮正在悄然颠覆着我们生活的点点滴滴,VUI(Voice User Interface,语音用户界面)作为一个新的领域也在快速发展,并对用户体验提出了更多关于语言学、情感塑造、逻辑搭建等方面的新要求。

  大家想一下VUI技术发展所带来的改变:我躺在沙发上,双手打着游戏,我只需要用声音就可以操控空调、预定一份外卖,并且在一小时左右就能吃上,相信这种体验一定不错!

  那么,在原有GUI(Graphical User Interface,图形用户界面)如此丰富的情况下,为什么要新增加一种交互方式呢?它们两者之间最大的差异就是:输入方式不同。最显著特性就是“解放了双手”,在获取我们关注的信息时,北京快3可以用最自然的语言进行沟通,眼睛和手可以同时处理其他的事情。

  20世纪90年代,诞生了第一个可行的、非特定的(每个人都可以对他说话)的语音识别系统,交互式语音应答(Interactive Voice Response,IVR)系统的出现代表了VUI的第一个重要时期[1]。

  人通过电话线路进行交互并执行任务,如机票预订、银行转帐、业务查询等。相信大家都用12306电话订票订过火车票,我们通过输入数字命令,与系统进行语音交互,它的主要特点如下:

  我们通过输入身份证号等,让系统进行身份与指令识别,系统也会播报各个站点如:1北京、2天津、3山东等长语音让我们选择,回想一下那个过程,我们必须不断地与系统进行交互,如果中间出现错误,只能挂断重来,因此整个交互过程会容易让用户处在谨慎、局促的状态下。

  我们现在所处第二时期的初期,目前很多像siri、Google这类集成了视觉和语音信息的APP,以及Amazon Echo这类纯语音的设计产品,逐步发展并成为主流[1]。随着语音识别技术、AI技术、互联网技术的发展,我们已经可以在手机设备中用语音处理很多事情,但还有很多事情目前无法通过语音完成,需要我们探索。

  以目前TXD团队沉淀的GUI设计原则为检验标准,进行横向切割,纵向对比VUI的优势劣势。

  因此,通过对比我们发现,GUI在清晰、高效、通用方面更具优势,这也恰恰是人们获取信息的关键,能够准确给用户提供帮助,且具有很好的延展性和通用性,相对于“一问一答”点状获取信息的方式,更为高效。VUI则是设计所要追求的一种最自然、最亲切的交互方式,是“带有情感、温度的交互体验”,真正的从用户角度出发。从我个人角度来看,在目前技术发展的阶段,VUI更多是一种辅助,至少短时间内不会完全取代GUI。

  各个场景下,用户的需求会有所不同,因此语音交互设计需要针对特定场景,做功能与语音交互的区别设计。主要的应用场景有:智能家居、车载驾驶、企业应用、医疗和教育,本文就这五种场景下的语音交互产品做简要分析与举例。

  通过上图,列举了主要智能家居类语音助手的产品发布,在今年一季度美国语音助手市场中,Amazon Echo的市场份额达到70.6%,Google Home则占到23.8%,而其他厂商(包括苹果、Lenovo、LG、Harmon Kardon和Mattel)分食剩下的市场份额,为5.6%,可见市场竞争压力。

  在各个场景下,目前手机中所对应的APP应用都十分丰富,我们在日常使用中也经常会遇到需要同时打开多个APP进行比对使用,例如我们想找一家价格实惠、味道不错的饭店,可能需要在口碑、点评等多产品上进行查找。

  试想,如果语音智能匹配技术成熟,我们只需要用语音输入一次需求,系统即可自动推荐与之匹配且符合我们个人喜好的结果,这才是用户体验所追求的自然、快捷、流畅。

  “当语音交互、智能匹配以及个性化推荐成为新一代用户主流的交互方式时,现在以一个个独立的App构筑的服务会面临巨大冲击。

  复合体验在给人们带来便利的同时,也在逐步瓦解单一介质(印刷品、屏幕、声音)带来的感官刺激。

  “语音交互设计仅靠书本上的知识是不够的,在实际项目中,除了要了解需求、目标用户以外,还要了解语音设计所应用的场景、技术水平、设备配置等,从而有的放矢的展开设计。本文结合参与的项目,将语音交互设计的流程、设计关键点以及如何通过设计化解技术限制,和大家进行分享。”

  日常设计工作中,大家都会按照一定的设计流程开展工作,通用的流程一般有:探索调研 分析聚焦 设计策略 测试验证。同样,这个流程可以复用到语音交互设计中,只是设计对象的媒介和我们产出的设计原型发生了改变,但我们发现问题、解决问题的思路应该是类似且可复用的,尤其是在新的设计领域中,不妨借鉴成熟的方法、流程,确保工作顺利开展。具体的设计流程与环节如下图:

  笔者所参与的项目是“公司机房服务的工业机器人” 的语音设计,这类产品的功能比家用设备的更为强大,除了语音外,它支持:行走、人脸识别、任务解析、数据采集等,同时场景也更为复杂。首先机房环境声音嘈杂、环境复杂;它的性质又决定对人员的安全要求极高,需要准确的识别与判断,这些在了解需求阶段是必须明确的环节。

  机器人的主要功能就是辅助参观人员、维修人员、驻场工程师更好的完成机房工作,实现机房业务管理智能化,提高运维管理效率和准确率。那么作为体验设计方,则是通过各场景、各环节的体验设计,让人与机器人、与系统的交互高效、自然、流畅,让智能化的机房日常运维管理更加完善。

  在上一篇文章中对主要的五种场景(智能家居、车载驾驶、企业应用、医疗、教育)分别进行了介绍。不同的场景,意味着用户不同的需求和目的,对语音交互的要求也不相同。下面就针对机房环境进行场景分析与设计难点的介绍。

  恒定噪音:作为机房服务场景的语音机器人,使用环境声音的嘈杂首先会影响语音录入的准确性。语音交互包含三个重要部分:自然语音识别、自然语音理解、自然语音生成,  因此解决设备“听”清楚的问题,关系到后续流程能否顺利展开。这里就需要依靠“设备技术”来解决,通过优化听筒的降噪能力,尽量过滤掉噪音。

  环境复杂:机房中机柜众多,服务器高低不一、设备管线:这给机器人的正常作业带来挑战,尤其是这种对安全性和准确性要求很高的场景。首先,机房包间中的环境光线影响机器人对人脸的识别和机柜数据的读取;其次,机柜中服务器位置高低不同,机器人需要不断调整摄像头的角度,以确保采集到完整信息,也可能存在视野死角导致无法全部读取。这一部分,则需要通过不断的测试与调整,提高机器人自身性能,使其更好的适应现场环境,具有设备、网络线缆的识别能力,减少不必要的“人为”破坏,增加人脸、数据识别的准确性。

  空间局促:在机房中机柜之间的空间不大,过道也比较狭窄,这给机器人行走带来一定影响。第一:行走速度不能过快,由于机器人自重150斤,走路太快会有惯性,有可能出现不小心撞到机柜的情况;第二:很多时候无法和人并行走路,这导致人机互动体验不好,再加上机器人本身走的慢,很有可能出现“人走在前面,遮挡住机器人视线”的问题。为此,在设计语音时,只要机器人感应到有遮挡,便会播报:“我好像被挡住了,请保持前方通畅”,以此来友善的提醒用户,减少这种封闭环境下用户的不适应。

  通过团队的调研,收集到在整个数据中心有5类用户,其中会进入机房与机器人直接发生交互的主要有三类:访客、厂商、数据中心驻场,如图4。图中是这三类用户的工作内容与场景接触点,确认目标用户,便于设计对后续用户调研的聚焦与体验地图的梳理。

  硬件来说,目前的语音产品包括:纯语音(天猫精灵)和语音及界面结合(iphone的siri)两种配置。在设计之初,我们需要了解语音产品的基本硬件配置,这其中也包括麦克风、摄像头、听筒、设备联网程度等,因为,产品的配置会影响我们后期的设计策略与体验。例如问语音产品:“世界十大旅游胜地都是哪些?、中国56个名族都有什么?”,即便语音助手可以准确的告诉我们答案,但无疑是一个沉重的认知与记忆负担,如果配合屏幕来显示,情况会好很多。最好的人机交互形式是混合型的,即GUI+VUI(图像交互+语音交互)如图echo show,如果你所设计的是纯语音产品,那么在设计时则需要考虑更多的引导、容错、提示等。

  本次项目中所涉及的机器人不带显示屏幕,并且语音不联网,这就意味着所有对话都需要提前预设好,设计师需要根据可能出现的情况,将对话内容完善,并且做必要引导,北京快3让用户按照系统期望的流程进行,确保工作顺利、安全的开展。如下图:

  在设计时,对于较长对话,在内容中加入“如果没听清楚,请回复我‘重复一遍’〞的提示,避免用户没有听清而错过信息;同时对于用户的回答,也给予答案提示,“维修结束时请回复我‘维修结束’ 〞通过设计去尽量规避机器人硬件的缺陷,减少“答非所问”的错误发生率和用户回答的发散,提高语音交互流程的顺畅。

  算法方面,则需要通过机器“深度学习”,不断完善语音识别、语音理解及语音合成的水平。目前,语音识别方面还面临很多技术挑战,如:

  多人讲话,设备能否识别其中一条信息;同样多设备时,如何辨别自己的主人在说线)儿童:

  比如人名,同样的音会有多种书写文字“清”“轻”,会影响语音识别的准确性。

  共计访问10位用户,包含各个角色。访问之后,我们对用户访谈的结果进行整理,整理维度有:日常工作描述、工作中的需求与期望、对机器人工作融入的畅想与担心。在此基础上,完成用户角色建模,通过各类角色的工作内容、痛点、情景设定、工作评分这四个主要方向进行描述与呈现,以驻场工程师为例,具体的用户角色卡如下图所示:

  最终根据用户画像和调研中收集的问题进行聚类分析,集中梳理与归类,得到用户诉求,即对机器人应用场景下的机房服务的“服务主张”,围绕

  三个方面。这三个机房服务的体验目标,也是作为后续机器人语音设计所要达到的基本要求。

  与机器人交互的环节涉及到线上、线下,从线上任务的提交到线下与机器人真实交互,再到过程中机器人收集信息的回传,整个闭环链路构成机房机器人服务体验的核心。以其中导览场景为例,介绍整体流程,线上的主要触点:任务申请  任务生成  任务确认  任务存档;线下的主要触点:任务下发  机器人唤醒及用户身份验证  任务执行  任务结束,具体的触点详情及语音流程见下图:

  经过体验地图的梳理与流程规划,去构建合理、有序的流程,在任务执行过程中保证人机交互“

  ”的体验,同时配合技术优化,完善机器人语音交互的丰富度,在语音交互设计中也会利用适当的引导与必要的提示,以更自然的方式消除异常时的尴尬,快速做到工作衔接。3. 设计策略

  这里的角色,是通过应用程序的语音及语言选择,塑造一个符合品牌服务特征,并且具有人格或心理的形象【1】。角色人格包含:

  以“笃定”为例,表达语气的说明和示例,通过语气规范,统一整个语音交互原型的调性。

  在设计时,我们可以用“真实的人物”来定义声音特征与沟通基调,分析、了解真实人物模型的个性特征。例如儿童早教类语音产品,可以以大家熟知的“金龟子”为人格原型进行定义,沟通中模仿她的语气、用词,让儿童感到亲切并符合服务对象的特征喜好。同时,我们需要设定“期望人们如何看待我们的语音产品”,传达怎样的服务理念。

  但这里值得注意的是,现在很多语音助手支持语音选择,如男声、女声、少年等。我们要知道,“

  ,他们的语音交互特征、形式等应该发生相应变化。同样一句很可爱、很活泼的话,小孩说合适,但如果换到“成熟男士”,多少会有些不合时宜。

  语音设计的原型更像是“剧本设计”,需要考虑在哪个场景下,包含什么角色、他们如何对话、如何过度衔接、具体的语言如何等,如下图就是在此次项目中输出的语音设计原型,具体内容涉及到信息隐私,这里就不展开了,但是整个语音交互脚本中,对场景、角色、对话脚本备注图例、脚本正文等都做了明确定义与设计,后面就围绕如何做好交互引导、反馈、异常处理这四个方面进行介绍。

  在设计语音脚本内容时,需要特别考虑VUI与人对话过程的语言衔接、对话内容的顺畅,并且能够自然的完成设想的任务。例如当询问用户信息时,最好给出一些示例,而不是说明。以下两句话大家可以明显感受到体验的差异,对于用户来说,参照示例填写信息,比理解一个通用指令更加容易。

  在GUI界面中,“确认反馈”随处可见,点击一个按钮、进行一个编辑操作,我们会设计不同重要程度的交互反馈;在VUI中,同样有不同程度的“确认反馈”,本文主要将他们分为三种:显性确认、隐形确认、视觉确认。

  设计交付后,功能开发完成,进入语音设备可运行阶段,这时系统具备测试功能。测试调优的方法同样给大家列举两个:一是可以通过开发、设计人员,进行实际人机测试,了解语音功能是否稳定、任务完成率如何、整个体验流程是否自然顺畅;二是可以通过用户观察的方法进行调研,找到符合特征的目标测试用户,利用机房的监控摄像头,观察“自然状态下”的用户如何工作,这样不会干扰用户,更贴近真实的使用情景。

  【1】参考书籍:《语音用户界面设计》 Cathy Pearl (著)王一行(译)