对话交互应用场景
如果说人类最自然的交互方式是对话,应该大家都没有疑问,那么设计一个对话交互的应用,我们都希望这个应用能受到广泛的欢迎,为了达到这一点,在开始对话交互设计之前,我们就需要了解什么样的对话交互更受用户欢迎?或者将当前业务中那个环节做成可对话交互的应用更容易获得成功?为了这个问题,我从用户视角审视对话业务,给出我们的理解。
为什么要用对话交互
早期的PC和手机主要使用图形界面交互,这种交互方式具有操作高效,信息量大的优势,但对呈现设备有苛刻的要求,必须是可掌控的具有标准屏幕的联网设备。现在随着IOT设备种类越来越多,设备有的并没有屏幕,有的屏幕尺寸也不尽相同,我们发现,要实现跨设备交互的能力,对话交互最合适。同时,对话交互也是一种对人类来说最为自然的交互方式,比起触摸屏交互,对话交互门槛更低,无论老人还是小孩儿,都可以方便的和设备进行交互。
因为以上原因,对话交互成为新的交互趋势,但并非所有的业务都适合使用对话交互实现,接下来我们详细分析一下什么场景适合使用对话交互,什么场景不适合。
什么场景适合
一个场景的定义包含三方面:交互、设备、情境。一个适合对话交互的场景应该至少满足以下方面:
1 交互体验可以设计的足够简单,只需要简单几步就能完成一个任务;
2 选择正确的设备搭载你的能力,并满足用户自然的表达,例如在音箱上放一个播放音乐的对话交互应用,用户自然的面对设备表达希望设备反馈的需求,设备给出很好的回应,这个过程会放大对话交互的优势;
3 在用户所处的情境下,对话交互的效率比其他方式的交互效率更高,继续以音箱为例,如果是蓝牙音箱,我更换歌曲需要拿出手机,选择一个歌曲,但是对话交互会让这个过程效率更高。
我们这里定义的对话交互并不只限于对话,这种交互形式是一种自然的交互形式,因此也要考虑视觉呈现的辅助效果。也就是说这是一个对话交互为主,视觉呈现辅助的自然交互体验。
什么场景不适合
这里主要探讨一下当前对话交互的技术限制和我们的理解误区,首先我们探讨一下语音识别与语义理解技术的限制问题:
1 嘈杂环境的语音识别问题:对话交互中语音识别是非常核心的部分,在非常嘈杂的环境下,语音识别的准确率会大幅降低,用户交互的体验也会大打折扣,因此尽量避免该场景下的产品设计,或者足够多的重视在降噪上;
2 开放域下的语义理解问题:针对对话交互我们可以简单将其分为两种,任务型对话 和 开放域对话,前者完成用户特定需求,后者更偏闲聊,在“闲聊”这个方向当前并没有完全基于语义理解的,很好的技术解决方案,因此无法达到完全顺畅的沟通。
除此之外,我们在做对话交互的时候,很容易将其类比人类之间的自然对话,希望无论用户怎么表达,都应该有正确的反馈,这本身其实是一个误区,这里简单的总结一下几个理解误区:
1 对话能力要足够智能:其实一个对话交互应用只需要可以解决一个特定问题即可,不用智能到可以解决任何问题,实际上也做不到这一点;
2 对话要尽量多的理解用户表达:即便只解决一个特定问题,用户对问题的询问可能多种多样,我们并不需要理解用户所有的表达方式,只需要理解最常用、自然的表达方式,并给予用户一定的引导,保证逻辑上的稳定会更为重要;
3 尽量让用户完全使用语音对话交互:在很多场景下,例如购买商品等,我们可能无法做到所有环节都通过对话交互实现,实际上也并不需要都使用对话交互,可以用视觉呈现辅助用户完成任务。
基于以上的说明,希望大家能够了解一个好的对话交互,并不是要在技术能力上做到最完美,而是在真实场景下解决用户特定问题。