从人机交互发展的角度看人工智能

2017-09-18 本文已影响129人 228d6c07a4f6

科技的发展史，某种意义上来说，也就是人机交互的演变史。每一次的科技革命，都直接带来了人机交互的重大突破。

从1946年世界上第一台计算机ENIAC诞生开始，科技的发展进入的快车道，最开始，仅仅有经过训练的经验丰富的工程师才能够操作“电脑”。而后，随着搭载了鼠标和图形操作界面的苹果电脑Lisa的出现，大大改变了原先代码和指令的交互方式，则使得普通人也能够有能力操作电脑。而接下来，mac os和windows操作系统的发展，越来越重视用户的交互体验，人们学习电脑的成本也在逐渐降低。于是，人们不满足与只在庞大的电脑上进行操作，移动电话从一个单一功能的通讯工具，演变成了另一个“掌上电脑”，iPhone的出现，大大推进了这一进程，并且完全颠覆了人们对于手机的认识。

现在，随着移动互联网和人工智能技术的发展，语音，手势，甚至脑电波，越来越多的交互方式开始出现。我们今天就来讨论讨论人工智能会给今后的人机交互带来哪些变化。

首先我们先看看交互方式的演进中，都有哪些特点和趋势：

1.交互的效率大大提升

在ENIAC时期，你操作电脑执行一个指令，需要敲半天代码；而有了鼠标之后，配合着鼠标，你只需要很少的操作；有了图形界面之后，一切就变得更简单了；到了移动互联网时代，你随时可以从口袋里拿出手机，点击和滑动几下。这样的演变过程中，人机交互的效率得到了大大的提高，减少了人们操作时候的复杂度。

2.用户使用的学习的成本大大降低

在早期电脑时期，只有经过专业训练的人才可以操作电脑；而即使是颠覆性地增加了鼠标和图形化界面的苹果电脑Lisa，也只是面对企业用户和懂技术的极客；随着图像化操作系统的发展，越来越多的普通人经过短期的训练也可以熟练地使用电脑（还记得小学时的电脑课吗）；而在移动互联网时代，已经不需要专业的教学，很多人只需要适应几天，就可以熟练掌握手机的所有功能。随着技术的发展以及对用户体验的重视，人们学习使用新产品和新交互形式的成本大大降低了。

3.人们对其的依赖度

这一点其实是结果和表现而不是原因。正因为效率和体验的提升，人们才越来越对新技术和新交互产生了依赖。复古之风在人机交互这一方面是行不通的，现在这个阶段也许非智能手机还存在，但是绝对不会再次成为主流。

那么未来都会有哪些人机交互的方式呢？

1.语音交互

语音交互是现在非常火的一种交互方式，语音交互不只是单一语音识别的过程，其中还包括软硬件各方面的技术支持，包括麦克风阵列技术，语音识别，语义理解等。

这种交互方式的优点是：（1）几乎不要学习成本，语言是每个人都掌握的技能。（2）非常符合人们的交流习惯，你甚至不用适应它，你做自己就好。

但是这种交互方式的缺点也十分明显：（1）技术还不是特别成熟。从远场拾音，降噪，声纹识别和单音轨提取等技术都还不够成熟，体验并没有达到人们的预期。（2）用户使用的场景有限，无论是从隐私的角度还是从用户习惯的角度，在周围人多的时候，可能没有人愿意用语音交互来发个信息或者点个外卖。（3）反馈方式单一，既然是交互，就要有来有回。但是纯语音的方式反馈的信息量比图像差的太多。

2. 手势（动作）识别

这种交互方式现在更多的是应用于一些体感游戏或者可穿戴设备。包括图像录入或陀螺仪检测两种方式，前者依赖于图像采集设备，后者依赖于可穿戴设备，两者对硬件设备的要求都比较高，因此使用的场景相当受限。

但是应用于游戏领域或者家居生活的部分场景（智能家居）

3.生物识别

生物识别也是现阶段很多“黑科技”的代表，包括已经非常普及的指纹识别认证（指纹解锁，指纹支付），虹膜识别认证（门禁），声纹识别认证（微信登录），人脸识别认证（支付宝，苹果faceID）等。

这些交互方式的目的大多是进行认证，则确定你是你。有点很明显，就是安全性较高，效率较高（远远高过人类的肉眼识别效率）。

但是也有明显的缺点：（1）对硬件设备的要求较高，需要配合硬件的功能来支持。

（2）对环境要求也比较高，稍微差一点的环境下，识别的成功概率降低的比较明显。

4.AR和VR

AR（增强现实）和VR（虚拟现实）这两种技术其实算不上是交互方式，而是很有机会成为两种内容平台。

几年前谷歌就曾经在AR方面努力过，发布了不可一世的Googleglass，但是孤掌难鸣。缺少其他内容和设备的支撑，Googleglass只能作为一个高级的玩具罢了。但是这样的交互形式却让人看到了新的交互方式和内容平台的雏形。而最近苹果发布的ARKit也反映了苹果同样看好这一方向。

AR的最大好处就是所见即所得，这是你获取信息最快的方式，在这个信息大爆炸的社会，往往人们愁的不是没有信息，而是信息冗余，无法关联，AR也许是个不错的解决方案。你在路上看见一辆车，你觉得不错，想看看价格，你不用记下车的型号，然后掏出手机，打开汽车之家APP，搜索这个型号……结合后文的脑机接口，甚至你只要这么一想，你就立马会看见车顶出现车的售价。或者你去相亲，透过AR眼镜，你立马就能知道这个人的所有信息和背景，包括信用程度和有无婚史，这样也许能大大避免“翟欣欣事件”这样的悲剧出现。

VR前两年特别火，近期似乎有点偃旗息鼓的意思。但是在娱乐领域，VR还是大有所为的。VR带来的十足的沉浸感和真实的体验，在这个快餐时代是有很大市场的。你甚至不用出门就可以饱览祖国的大好江山。但是VR的问题还是在于技术限制和内容本身的缺失，技术方面，流畅的AI体验对硬件有很高的要求，且在保证足够清晰度的时候还要考虑不能让用户眩晕。内容方面，优质的VR资源需要很大的人力投入，很多平台的AI资源都不共享。然后在游戏等娱乐领域，VR还是大有可为的。

5.BCI（脑机接口）

很多科幻电影中会出现这样的场景，一个拥有超能力的少年，不用说话，也不用任何动作，可以用意念来控制别的物体。这样的交互方式是我们一直在期待的，可是稍微懂点科学的人都知道，这根本就反科学。然而脑机接口一旦成熟，这样的场景就成了可能。

脑机接口是一门科学，融合了生物，计算机等多领域问题，它如果成熟，将大大改变人类的交互方式，更重要的是它将能够改变很多人的人生，很多的残疾人士，或者行动不便的人士将因此获利。

脑机接口当前的研究分为侵入式和非侵入式，侵入式指的是在人的身体里面需要植入相关的芯片或设备，而非侵入式则指的是不通过任何植入设备，直接采集人类的脑电波等信息。侵入式的准确率和成功率都要高得多，但是有一定的概率引起人体的免疫反应。

而脑机接口的研究还处在比较初级的阶段，虽然当前在协助残疾人方面已经有了一些应用，但是成本太高，效率偏低，还远远未到大规模普及的阶段。

人工智能只是底层技术，而真正影响用户体验的往往是用户交互，新的技术变革往往带来新的交互方式，但是并不是为了新而新，目的是解决用户痛点和提升用户的体验。这几种全新的交互方式也许并不会出现一枝独秀，而是相互协作来改变这个世界。其中也许难免教育市场的痛，这是连iPhone也没能避免的，但是那只是历史长河中的一些礁石罢了……

从人机交互发展的角度看人工智能

猜你喜欢

热点阅读