从人机交互发展的角度看人工智能
科技的发展史,某种意义上来说,也就是人机交互的演变史。每一次的科技革命,都直接带来了人机交互的重大突破。
从1946年世界上第一台计算机ENIAC诞生开始,科技的发展进入的快车道,最开始,仅仅有经过训练的经验丰富的工程师才能够操作“电脑”。而后,随着搭载了鼠标和图形操作界面的苹果电脑Lisa的出现,大大改变了原先代码和指令的交互方式,则使得普通人也能够有能力操作电脑。而接下来,mac os和windows操作系统的发展,越来越重视用户的交互体验,人们学习电脑的成本也在逐渐降低。于是,人们不满足与只在庞大的电脑上进行操作,移动电话从一个单一功能的通讯工具,演变成了另一个“掌上电脑”,iPhone的出现,大大推进了这一进程,并且完全颠覆了人们对于手机的认识。
现在,随着移动互联网和人工智能技术的发展,语音,手势,甚至脑电波,越来越多的交互方式开始出现。我们今天就来讨论讨论人工智能会给今后的人机交互带来哪些变化。
首先我们先看看交互方式的演进中,都有哪些特点和趋势:
1.交互的效率大大提升
在ENIAC时期,你操作电脑执行一个指令,需要敲半天代码;而有了鼠标之后,配合着鼠标,你只需要很少的操作;有了图形界面之后,一切就变得更简单了;到了移动互联网时代,你随时可以从口袋里拿出手机,点击和滑动几下。这样的演变过程中,人机交互的效率得到了大大的提高,减少了人们操作时候的复杂度。
2.用户使用的学习的成本大大降低
在早期电脑时期,只有经过专业训练的人才可以操作电脑;而即使是颠覆性地增加了鼠标和图形化界面的苹果电脑Lisa,也只是面对企业用户和懂技术的极客;随着图像化操作系统的发展,越来越多的普通人经过短期的训练也可以熟练地使用电脑(还记得小学时的电脑课吗);而在移动互联网时代,已经不需要专业的教学,很多人只需要适应几天,就可以熟练掌握手机的所有功能。随着技术的发展以及对用户体验的重视,人们学习使用新产品和新交互形式的成本大大降低了。
3.人们对其的依赖度
这一点其实是结果和表现而不是原因。正因为效率和体验的提升,人们才越来越对新技术和新交互产生了依赖。复古之风在人机交互这一方面是行不通的,现在这个阶段也许非智能手机还存在,但是绝对不会再次成为主流。
那么未来都会有哪些人机交互的方式呢?
1.语音交互
语音交互是现在非常火的一种交互方式,语音交互不只是单一语音识别的过程,其中还包括软硬件各方面的技术支持,包括麦克风阵列技术,语音识别, 语义理解等。
这种交互方式的优点是:(1)几乎不要学习成本,语言是每个人都掌握的技能。(2)非常符合人们的交流习惯,你甚至不用适应它,你做自己就好。
但是这种交互方式的缺点也十分明显:(1)技术还不是特别成熟。从远场拾音,降噪,声纹识别和单音轨提取等技术都还不够成熟,体验并没有达到人们的预期。(2)用户使用的场景有限,无论是从隐私的角度还是从用户习惯的角度,在周围人多的时候,可能没有人愿意用语音交互来发个信息或者点个外卖。(3)反馈方式单一,既然是交互,就要有来有回。但是纯语音的方式反馈的信息量比图像差的太多。
2. 手势(动作)识别
这种交互方式现在更多的是应用于一些体感游戏或者可穿戴设备。包括图像录入或陀螺仪检测两种方式,前者依赖于图像采集设备,后者依赖于可穿戴设备,两者对硬件设备的要求都比较高,因此使用的场景相当受限。
但是应用于游戏领域或者家居生活的部分场景(智能家居)
3.生物识别
生物识别也是现阶段很多“黑科技”的代表,包括已经非常普及的指纹识别认证(指纹解锁,指纹支付),虹膜识别认证(门禁),声纹识别认证(微信登录),人脸识别认证(支付宝,苹果faceID)等。
这些交互方式的目的大多是进行认证,则确定你是你。有点很明显,就是安全性较高,效率较高(远远高过人类的肉眼识别效率)。
但是也有明显的缺点:(1)对硬件设备的要求较高,需要配合硬件的功能来支持。
(2)对环境要求也比较高,稍微差一点的环境下,识别的成功概率降低的比较明显。
4.AR和VR
AR(增强现实)和VR(虚拟现实)这两种技术其实算不上是交互方式,而是很有机会成为两种内容平台。
几年前谷歌就曾经在AR方面努力过,发布了不可一世的Googleglass,但是孤掌难鸣。缺少其他内容和设备的支撑,Googleglass只能作为一个高级的玩具罢了。但是这样的交互形式却让人看到了新的交互方式和内容平台的雏形。而最近苹果发布的ARKit也反映了苹果同样看好这一方向。
AR的最大好处就是所见即所得,这是你获取信息最快的方式,在这个信息大爆炸的社会,往往人们愁的不是没有信息,而是信息冗余,无法关联,AR也许是个不错的解决方案。你在路上看见一辆车,你觉得不错,想看看价格,你不用记下车的型号,然后掏出手机,打开汽车之家APP,搜索这个型号……结合后文的脑机接口,甚至你只要这么一想,你就立马会看见车顶出现车的售价。或者你去相亲,透过AR眼镜,你立马就能知道这个人的所有信息和背景,包括信用程度和有无婚史,这样也许能大大避免“翟欣欣事件”这样的悲剧出现。
VR前两年特别火,近期似乎有点偃旗息鼓的意思。但是在娱乐领域,VR还是大有所为的。VR带来的十足的沉浸感和真实的体验,在这个快餐时代是有很大市场的。你甚至不用出门就可以饱览祖国的大好江山。但是VR的问题还是在于技术限制和内容本身的缺失,技术方面,流畅的AI体验对硬件有很高的要求,且在保证足够清晰度的时候还要考虑不能让用户眩晕。内容方面,优质的VR资源需要很大的人力投入,很多平台的AI资源都不共享。然后在游戏等娱乐领域,VR还是大有可为的。
5.BCI(脑机接口)
很多科幻电影中会出现这样的场景,一个拥有超能力的少年,不用说话,也不用任何动作,可以用意念来控制别的物体。这样的交互方式是我们一直在期待的,可是稍微懂点科学的人都知道,这根本就反科学。然而脑机接口一旦成熟,这样的场景就成了可能。
脑机接口是一门科学,融合了生物,计算机等多领域问题,它如果成熟,将大大改变人类的交互方式,更重要的是它将能够改变很多人的人生,很多的残疾人士,或者行动不便的人士将因此获利。
脑机接口当前的研究分为侵入式和非侵入式,侵入式指的是在人的身体里面需要植入相关的芯片或设备,而非侵入式则指的是不通过任何植入设备,直接采集人类的脑电波等信息。侵入式的准确率和成功率都要高得多,但是有一定的概率引起人体的免疫反应。
而脑机接口的研究还处在比较初级的阶段,虽然当前在协助残疾人方面已经有了一些应用,但是成本太高,效率偏低,还远远未到大规模普及的阶段。
人工智能只是底层技术,而真正影响用户体验的往往是用户交互,新的技术变革往往带来新的交互方式,但是并不是为了新而新,目的是解决用户痛点和提升用户的体验。这几种全新的交互方式也许并不会出现一枝独秀,而是相互协作来改变这个世界。其中也许难免教育市场的痛,这是连iPhone也没能避免的,但是那只是历史长河中的一些礁石罢了……