看看别人,再看看自己AI理解与业务应用

对CUI交互个人看法

2019-07-01  本文已影响5人  沉默的羔洋

最近学习语音交互中的多轮对话与槽填充,直观感觉上需要通过多轮对话来解决的需求反而用图形界面的方式解决会更好。特别是在决策场景时用户接收语音时,由于是语音序列信息,无法像GUI那样呈现信息结构化,效率与决策体验是无法接受的。所以个人认为人机交互未来的方式一定是GUI(图形交互)+CUI(对话交互)结合。

这两种交互方式分别对应人类的【说】与【看】,在不同场景各有优劣。CUI在输入场景具有优势,信息的表达非常直接;而GUI在展示场景具有优势,信息表达更结构化,利于用户决策;

以下列出了一些场景陈列CUI可能存在的适用范围

1、非常不适用的场景

目的明确但附带很多决策点时,如订酒店、订机票

多数场景用户都是带着需求过来,但是通过语音交互,由于人类语言的特性,系统无法一次性获取所需要的信息,在CUI中常常用多轮对话填槽、业务接口的方式解决,但是这种交互方式相比较GUI的结构化信息呈现,用户点击进行筛选以及可视化,效率+体验根本不是一个量级,而且遇到需要用户去做选择时,图形界面是唯一可以帮助用户决策的方式(除非语音交互系统已经实现为人类做决策判断)。

其实在生活中,往往人在遇到复杂的问题时,更倾向于在纸上将信息整理然后涂涂画画而不是听着信息空想。

2、指示性命令的场景,辅助GUI界面。
指令场景举例

在很多比较明确的场景,CUI的效率会更快。实际上在GUI的历史上是通过快捷键解决的,但是随着越来越多的功能、快捷键出来,GUI的图形界面会越来越复杂,CUI的完全可以将一些长尾的指令性功能承担起来,减轻GUI的负担,缩短用户的交互流程,提高交互体验。

3、多场景,CUI可作为交互中心将用户行为串起来
多场景

在用户场景不断变化时,不断得在各个应用之间跳转是很累的,所以如果有一个系统层级的语音交互中心作为信息媒介,打破应用之间的壁垒将会提高人机交互效率(我就觉着老罗的TNT想要打破应用壁垒的想法很棒,只不过需要做的东西太大了)

其实在很多场景,都会有切换应用进行黏贴复制这种操作,频繁得来回操作容易发生错误与不变,如果有系统级语音交互,点击即可通过语音进行非当前任务外的指令,业务如果整合得足够好,可以在一个界面做决策而不用来回跳转。

实际上这样的交互实现技术上没啥问题,siri早已经开始做对外接口,开发者只需负责业务流程(但似乎开放的领域不是很多),今年苹果发布会上演示的siri使用场景说明后续的开放度会越来越大,个人比较看好这个方向,只不过真正实现可能需要多方博弈,更好地体验需要更多的业务开放,但是业务方如果开放他们的业务接口可能会失去流量入口沦为服务提供商。另一方面讲,要实现终极目标【对话助理】,这个过程也是必须的。这也可能是大家争相做语音入口的原因,但是脱离业务做入口又造成如今语音产品的薄弱与鸡肋。

总结

总的来说我认为语音交互发展的重点在于链接多场景而不是重建技能中心
当前应更多的解决轻决策场景,重决策交给人与GUI,而不是多轮对话解决用户信息决策。

在系统级交互上苹果和小米这样有完整产业链的公司可能更有潜力,有机会在系统层级做整合,丰富的硬件端更能够在跨场景上培养用户的使用习惯。就比如小米的智能家居(比如电视)在语音上的应用应该不错,毕竟都是偏向指令的交互,这时候配套的音箱才会显得更有用~

上一篇下一篇

猜你喜欢

热点阅读