欧易

欧易(OKX)

国内用户最喜爱的合约交易所

火币

火币(HTX )

全球知名的比特币交易所

币安

币安(Binance)

全球用户最多的交易所

如何让天猫精灵对话更自然?我提出了6个优化方法

时间:2023-02-05 18:43:59 | 浏览:337

为了更实际的感受语音交互,前段时间下单了天猫精灵,用了一段时间,除去技术上的限制,觉得它在主要功能上设计还是比较完整的,但是用起来还是不是那么流畅自然,所以试着从PM的角度写下自己一些优化想法。 根据VoiceLab 2016年的调研结果,

为了更实际的感受语音交互,前段时间下单了天猫精灵,用了一段时间,除去技术上的限制,觉得它在主要功能上设计还是比较完整的,但是用起来还是不是那么流畅自然,所以试着从PM的角度写下自己一些优化想法。

根据VoiceLab 2016年的调研结果,近46.7%的用户喜欢用Amazon Echo 和 Google Home的原因是可以用来播放音乐和听书。所以我主要试用了音乐播放这个功能,并结合之前看的 谷歌语音交互设计规范写了这篇文章。(10分钟看懂谷歌语音交互设计规范都讲了些什么)

对话式交互设计分三个阶段:

  1. 解决基础交互问题,让用户能开始对话(1-10轮)

  2. 解决数据和中级交互问题,让用户能持续对话(10+轮)

  3. 解决需求问题,让用户能长期对话(超过一周)

目前天猫精灵已经可以支持用户开始对话了,但是在对话过程中还是不是那么流畅,但其实为什么会觉得对话不流畅呢?我觉得主要原因是对话是双向的,一方的停止都会让对话被终止,

  • 用户停止:由于缺乏恰当的指引和自然的对话方式,有时候用户可能试了几次同样的功能就失去了对话的兴趣(特别是其中还有几次出错情况)。所以天猫精灵需要给到用户指导,和优化自己对话方式,给到用户信心,以便对话继续下去。也就是后面讲的如何让对话更自然流畅。

  • 天猫精灵停止:因为技术的限制,天猫精灵不可能听懂用户说的所有话,目前当识别出错时,天猫精灵会直接的报错,从而结束对话。比如“ 对不起,我没有搜到这首歌“。 但是我们其实可以通过一些对话设计技巧来让对话继续下去,也就是后面讲的的错误情况处理机制

如何让对话更自然流畅(避免用户停止对话)

1、多样化回答及应答词

使用多样应答词:应答词是指 “好的” “ 没问题“, “ Okay“,等等词语,应答能让用户知道系统已经接收识别了来自他们的信息,并让对话流畅自然。看看我们平时和同事朋友的对话中,当别人提出一个请求时,是不是也会很经常用这类词?而缺乏应答词时对话通常会显得比较冷冰冰。

同样的,在我们日常的对话里,一般也不会永远用同一个应答词,我们可能会说“好的“ “嗯嗯” 甚至“?” 来表达确认。 在语音交互里也是这样,所以我们可以在系统内配置多歌应答词表,在回答时随机的提供某个应答词,以提高我们对话的多样性。

高频率对话的多样化: 我们不需要每个回答都准备N种方式,只需要对高频率出现的对话提供多种回答方式就能很大程度提高对话的自然性。 比如在音乐播放的功能里面,最常使用是播放功能,天猫精灵的回复是“ 即将为您播放#歌曲名词#“, 如果这句话能用不同的方式表达,那么用户会更觉得自己是在跟人对话。

2、主动给出功能引导

在GUI下,用户可以直观的看到可操作的功能,但是对话式交互下,用户不知道产品支持哪些功能,有时候用户可能试了几次同样的功能就失去了对话的兴趣。所以天猫精灵需要让用户知道自己可以做哪些操作。

我在首次使用的时候,因为在网易云使用时是“加到我喜欢的歌曲“,所以一直和天猫精灵说的是” 我喜欢这首歌“ 来让它标记,但是天猫精灵不能识别这句话,我很久后看到文字介绍才知道是用 “收藏“ 这个词。

所以,由于表达的多样性,我们需要提前引导,给出具体的例子,来介绍功能和教会用户该如何表达。比如在用户首次使用音乐播放的时候,放完几首歌后,我们可以主动引导用户“ 如果您喜欢这首歌,可以跟我说“ 收藏这首歌曲””

3、准备用户表达的多种可能性

亚马逊的语言设计规范说 “为了确保功能表现的不错,一个基准是每个意图都需要30或更多的对话单元,即使是很简单的意图”

To make sure your skill performs well, a good benchmark is 30or more utterances per intent, even for simpler intents. You don’t need 100% coverage, but more examples are better. Also, plan to continue adding utterances over time to improve skill performance.

同样是上面的收藏歌曲的案例,可能只收录了“ 收藏“ 这个词槽(slot),而没有“喜欢”,但是日常的对话中我们可能更经常的说“ 我喜欢这首歌“,所以我们需要用更口语场景的词汇,而不要单纯的把GUI的词汇移植过来。同时为了保证功能的覆盖面,我们需要去想到更多的可能的词汇, 比如“加星这首歌“ “ 这首歌很好听“ “

4、处理有歧异的对话

这个我们之前也说过,自然语言处理里面最基础的问题就是歧义消解(disambiguation)问题,比如我让天猫精灵放一首 安静(周杰伦的),它会播放 安静的音乐合集 (即歌单)。或者我说 “报警”,它会播放某歌手的《报警》,这些都是对于比较明显会出现歧异的地方没有进行处理。 所以在对话设计的时候,除了正常的对话,也要对那些容易产生误解的对话进行预设。比如在机器无法判断的时候 ,主动提问“ 你是要听安静这首歌吗?”

错误情况处理(避免天猫精灵停止对话)

在对话的时候,我们可能因为技术限制或者用户的原因出现各种错误情况,但是记住“ In Conversation, There Are No Errors“,把出错当成机会,就像和朋友讲话时我们也常常不理解对方的意思呀,所以我们要做的是在出错后给到良好的反馈,而不是主动停止对话。

在谷歌语音交互设计规范里我们讲到两种错误情况

  1. 输入缺失:用户没回应,或系统未获取到用户输入,比如用户突然走远了没回复。

  2. 无法识别:虽然获取到了信息,但是却不能识别解析,比如背景噪音或多个用户一起说话

  3. 输入有误:用户回答了但技术识别有误, 比如用户说的是“陈奕迅” 识别成“ 陈奕慢“

  4. 无法匹配:用户回答了,识别也准确,但是没有对应的功能,比如用户说帮我叫个顺风车

  5. 错误的识别:我们以为识别成功,但是其实误解了用户,用户可能会在下一次对话纠正。

针对这些错误有如下优化方式:

(1)智能联想

我不知道是我没发现还是怎样,目前天猫精灵还不支持缺失联想和错误联想的功能,所以暂时先写上来了。

  • 识别缺失联想:当系统没有完全采集到用户说的话时,可以使用缺失联想,比如只识别到 “莫文蔚的如果没有“,可以通过缺失联想,问” 您是不是想听莫文蔚的 如果没有你“

  • 错误识别联想:我在虾米里试了下 搜索“ 遥远的白“,是可以联想成功的,而且再天猫精灵里也识别出是音乐这个功能,所以当识别出错时,可以通过识别联想,询问说 “您是不是要听陈奕迅的遥远的她“,给予用户使用的信心,也让操作继续下去。

(2)主动提问

试想如果我们日常没听清时,是不是会说,“你刚说陈奕迅的那首歌?”,在设计VUI时也是一样,在无法应对的时候,不用过多的感到抱歉,试着像和朋友说话一样让天猫精灵说 “ 对不起,我没听清,你要听陈奕迅的哪首歌?” “ 能再说下你要听哪首歌吗” 。

  • 无内容的快捷重复提示:“ 您能再说一遍吗”

  • 有内容的快捷重复提示:“ 我没听清,你刚说的哪首歌?”

  • 重复询问: 当问了个问题用户10秒无回应时,可以重复再问一次“您想听什么歌呢”

  • 更改问题:当问了个问题用户无回应时,也可以试着换个说法“ 想听谁的歌?”

  • 回答一个没有明说的请求: “您可以试试让我放个热闹的歌”

  • 积极主动询问:有时用户无回应,可能是不知道怎么回复,可以试着主动给出用户建议,比如在我问是这是谁的歌时,主动询问“你想要收藏这首歌吗吗”。

最后放一个JIBO的 开箱视频,我们可以看到用户和JIBO的对话就是相对比较流畅的,甚至某些额外的情况也能处理,比如JIBO问”你喜不喜欢我的舞蹈“ 女生说“ A little” 的时候,JIBO会说“ 喜欢还是不喜欢呀“,非常可爱。

本文由 @少女璐 原创发布于人人都是产品经理。未经许可,禁止转载。

相关资讯

拥有一台大屏幕的天猫精灵是什么体验?天猫精灵V10开箱体验

我首台智能音箱是天猫精灵X1,2017年那时候天猫结合自己平台优势,一经推出就成为国内占有率领先的智能音箱品牌,优秀的做工和不错的体验,至今依旧在服役,但仅有语音很多时候一些交互和功能仍然比较局限,所以我看上了一台带屏升级款产品。就是这台自

天猫精灵Queen美妆镜体验:天猫精灵,谁是世界上最美的人

化妆对于女生来讲是每天的头等大事,但是很多女性朋友在化妆的时候往往没有足够大的梳妆台进行化妆,即便是有梳妆台也没有充足的光线细致入微的进行化妆。当然,不少小姐姐心里也想拥有白雪公主中那神奇的魔镜,只要对着魔镜说出“魔镜魔镜告诉我,谁是世界上

如何让天猫精灵对话更自然?我提出了6个优化方法

为了更实际的感受语音交互,前段时间下单了天猫精灵,用了一段时间,除去技术上的限制,觉得它在主要功能上设计还是比较完整的,但是用起来还是不是那么流畅自然,所以试着从PM的角度写下自己一些优化想法。 根据VoiceLab 2016年的调研结果,

天猫精灵方糖2体验:一个精灵键,定制专属于你的智能生活

科技在发展,人们的生活质量也在不断提升。可能在十年以前,我们根本没想象过,智能生活居然会那么快到来。科技的不断进步,让我们足不出户也能享受更方便、更舒适的生活。在以往,我们可以通过手机就能获悉社区附近的生活信息,从而享受手机带来的便利性,享

边听歌边按摩,天猫精灵的好助手,倍轻松iDreamX一休精灵轻体验

现在的年轻人用眼可是一个大问题,这里不是说近视、散光什么的,而是指平时大家真的是用眼太多太多了,工作看电脑、下班看手机、看电视、看平板、看笔记本,各种电子屏幕充斥在你的周围,想不看都难,何况这一代人本来就特别喜欢玩手机。仔细想想,真的每天都

天猫精灵App全新升级,推出“精灵家”服务

钱江晚报·小时新闻记者 张云山近日,天猫精灵宣布升级改版App,新增“精灵家”服务版块。“精灵家”是天猫精灵推出的,面向未来的家庭生活方式,可以为用户提供家庭生活全场景的智能服务。精灵家的服务能力覆盖了天猫精灵AI助手,以及内置或可被天猫精

天猫精灵CC体验:不让养猫?那么养只“天猫”如何

如今越来越多的人加入了“吸猫”的队伍当中,但是许多公寓和学校当中是不让养宠物的,于是许多人也只能“云吸猫”了。但是既然公寓不让养真的猫,我们可以考虑养一只“天猫”。那么今天我就来带大家看看这只由阿里推出的天猫精灵CC作为一款智能音箱表现如何

天猫精灵CC10电池版/CCMINI体验:人机交互更自然了,还有视觉识别辅助功能

记者 | 李竞择编辑 | 本月,天猫精灵正式发布了首个全场景人机交互系统“AliGenie5.0”,同时带来了包括天猫精灵CC10电池版、天猫精灵CC MINI在内的三款智能音箱新品。根据天猫精灵事业部总经理库伟的说法,从AliGenie5

小米最懒人工智能“小爱同学”成为戏精,秒杀天猫精灵!

今天小编“狐说乱道”要给大家介绍一款戏精级别的产品,那就是小米AI音箱。一听这个名字,大家就会想马上吐槽我了,不就是一款音箱嘛,你还真是胡说乱道,那你就错了,因为AI其实是artificial intelligence(人工智能)的缩写,所

天猫精灵方糖R测评:可能是性价比最高的智能音箱

智能音箱,被各大互联网巨头认为是下一场智能革命的关键性设备,各家为其注入的心血,不亚于厂商们对于智能手机投入,这是因为智能音箱在未来物联网生活中扮演的角色太过重要。它承载着向普通家庭普及物联网、智慧生活的重任,尤其是在中国这样庞大的人口红利

天猫精灵发布2022生态策略,将加大智能技术输出

会说话的跑步机、有情绪的猫砂盆、能自动递上菜谱的厨电产品......人工智能与物联网的结合赋予了制造业巨大的潜力,改变人们生活的同时也加速了制造产业与智能平台的融合。7月20日,记者在2022天猫精灵生态伙伴大会上了解到,经过三年开放服务,

能帮你陪伴孩子的温情智慧屏:天猫精灵V10上手体验