王先森日记第47篇:请冷静看待人工智能
“人工智能”是当下的热词。关于人工智能的讨论很多,观点各异。
有人认为当前的人工智能只是“高级自动化”;也有人说人工智能即将超越人类,大面积取代人的工作。
其实,对于人工智能我们应该保持冷静。
今天,我们不妨来分析一下人工智能相对于人类智能来说有什么优势和劣势,从而推断人工智能的有效应用以及下一步的发展方向。
这一轮人工智能的核心:表征学习
人工智能这个词实际上是以人类为中心的。
人类具有智能,我们希望制造出机器能模仿人类的智能,更好地为人类服务。然而人的智能不过是自然界的一种生物信息处理系统,智能仍可以以其他形式存在。
举一个简单的例子,教小狗做算术:
我们给小狗看基本的算式,问小狗一加一等于几,让小狗叫相应的次数以表示答案。开始时,小狗会乱叫。当它偶然一次叫了两下,我们就给它一块肉作为奖励;叫的次数不对时,小狗则得不到奖励。经过多次反复训练,当小狗看到这个一加一的算式后,它就会叫两次。重复这个过程,小狗可以学会简单的算术运算。
以上小狗学习的过程叫做强化学习。通过对正确的行为给予奖励,错误的行为给以惩罚,从而获得正确的行动模式,就是基本的强化学习过程。
人工智能的学习过程和小狗十分相似,给计算机一张图片,上面写着基本的算式,并让计算机给出结果,通过训练,机器会比小狗做得更快更好。
在小狗和人工智能的学习过程中,有一个概念非常重要,就是“表征”。
在学习过程中,小狗会把看到的算式图片转化成一个简化的模式信号,通过强化学习,将这个模式信号映射到结果,简单来讲,就是看到这张图后能识别出其中的关键信息,然后联想到应该叫几声。将图片转化成模式信号的过程叫做“表征”。
在人工智能学习的过程中,表征学习起了很重要的作用。
举个例子:
人工智能在识别一只猫的时候,深度神经网络会通过学习大量的各种各样的猫的样本,然后将各种不同的猫的输入图片简化为基本相同的一个模式信号,这个过程即表征学习。
最后通过强化学习,人工智能识别准确率会逐渐提升,然后就可以成功地识别出一只猫了!
可以说,这一轮人工智能进步的核心就是表征学习。
人工智能神经网络的表征学习可以有效地简化各种复杂的输入信号,从而推动人工智能的不同领域,如图像识别,语音识别的进步。然而神经网络的表征学习需要大量的输入样本,计算量也很大。在表征学习的背后,是大数据和计算能力的支持。
表征学习确实是一个有效的进步,它把人工智能带入公众的视线。AlphaGo在围棋上碾压人类高手,会场上出现了实时语音翻译技术。那这是不是能证明人工智能已经发展到很高的阶段了呢?实际上,人工智能的发展才刚刚开始。
弱人工智能与强人工智能
我们不妨来看看人工智能和人类智能的差距。
同样以数学计算为例:
小朋友不仅将看到的算式简化为模式,更理解算式本身的含义。在算术之上,人可以进一步去学代数方程。这是人类智能的强大之处。在表征学习之上,人类还有一个强大的知识体系。知识体系中累积了人的学习成果,好用的有效的被保存下来,无用的或不利的则被删除。
我们也可以直觉地感受到人脑的计算能力并不强,比如算一下321×123,没有纸笔,很多人算不出来。人脑的逻辑能力也不强,面试时的逻辑推理问题都挺讨厌的。人脑的强项在于感知当前的复杂形势,结合自己的知识体系,推理出合理的行为。表征学习,知识体系和自动推理的有机结合,形成了人类智能。
与人类智能相比,机器学习算术只能将输入的算式图片映射为结果,缺少知识体系的支持。它不理解算式的含义,当然也不可能会把算式应用在别的场合,不能像人类那样,在学会算术的基础上,进行更深的学习。当需要综合调动表征学习,知识体系和推理时,人类很容易完成的事情,对于机器却不可能。
眼下的人工智能,只是在特定领域,反馈目标明确下学习获得的智能,也就是弱人工智能。比如学习算术这个任务。这里的输入样本相对确定,都是数字图片,对学习结果对错的反馈直接,学习的目标单一而明确。有了这些限制条件,机器可以胜任这类学习任务。学围棋比学算术在工程实现上复杂,但学习的任务模式类似。
与弱人工智能相对,能够模仿人类学习的人工智能叫做强人工智能或通用人工智能。强智能是人工智能的目标,有关强智能的研究还处于起步阶段。
当前人工智能在应用上的问题是缺少通用智能的支持。尽管弱人工智能通过大数据训练,在特定任务上可以取得不错的效果,但在与人的交流中,随时都可能需要通用智能的支持。
看一个简单的例子:
Google基本代表了人工智能的最高水平,而这个Google翻译的APP也是2017年5月底发布的。给Google翻译一张Subway的纸巾,该APP通过扫描图像,发现图像中的英文,并给出中文翻译。
Google翻译的表现并不好,只检测出了“eat fresh”,给出的翻译是“吃新鲜”。如果请懂英文的人来翻译,根据情景,可以译为“Subway:吃的就是新鲜”。人做这件事并不费力,而容易忽视其中的具体过程。人首先看到的是一张纸巾,其中的Subway是一个餐饮品牌,而这幅印图起着广告宣传的作用。理解所看到的东西,结合已有的知识,人可以给出一个合理的翻译。这个APP使用了自然场景文字检测技术和自动翻译技术。首先,文字的检测泛化能力不好,Subway略有形变,检测不到。下面的问题是真正的障碍。当这个APP使用了这两项技术,它关心的只是文字检测和翻译,看不到这幅小小图像中的情境,更理解不了其中广告宣传的意图。
这个实时翻译的APP,还能直接将你说的汉语翻译为英文,并朗读出来。笔者也试验了一下这个功能。当我说“我们去吃湘菜还是川菜?”,APP反应的是“我们去吃香菜还是川菜”,然后再翻译为英文,结果必然是不准确的。短短的一句话,里面也包含一个小情境。虽然语音识别算是准确,但缺少知识体系的支持,机器还是难以准确理解人的意思。
可以看出,在缺乏通用智能的支持下,很多人工智能的实际应用差强人意,难以与人有效交流。类似于这类的意图提供人性化接口的服务,会被当做玩具玩一玩,然后被搁置在一旁。
再看一个当前很火热的技术——自动驾驶:
自动车上会配备很多传感器,感应周围的信息,深度神经网络会处理这些信息,自动给出驾驶的方向。这个应用场景与围棋很不同。围棋只有棋盘上黑白子的变化,有明确的输赢目标。而自动车周围环境的变化高度复杂,情况不胜枚举。自动车要实现的目标也很复杂,不仅是到达目的地,还要保障自身安全,保证其他车、路人的安全,还有各种意想不到的情况的处理。
能够完全自动驾驶的汽车需要的是通用智能的支持。
在车流量很大的路口,自动车需要感知复杂的情景,根据已有的经验和知识,自动推理,作出合理的反应。这种技术目前尚未诞生。然而自动驾驶是个有巨大吸引力的技术,各大公司不惜重金投入,也不断有新的研发力量加入。这里技术的渴求也会推动通用智能的发展。
总结
首先可以肯定近些年的人工智能取得了显著的进步,进步的核心是表征学习。人工智能已经借助表征学习,在弱人工智能领域取得一系列突破性的成果,如AlphaGo刷新了人类对围棋的认知。
在某些特定领域,人工智能的表现已超越人类。然而人工智能想要真正迈进人的生活,能与人自然地交流,或多或少需要通用智能的支持。缺少通用智能,很多应用会显得鸡肋。
在这一轮人工智能热潮下,大量的资金和研发力量纷纷涌入,然而项目选择需要谨慎。总的来说,目前的人工智能还是对人的辅助,比较可靠的应用领域包括:
高级自动化,取代重复的手工劳动。
在数据领域发挥作用,发现知识,创造商业价值,辅助重大决策。
在特定领域成为专业人士的助手。
受限场景下的自然人机接口。
娱乐,玩具。
另外一些领域,如自然语言,场景不受限制的图像,完全自动驾驶等,靠谱的应用则需要通用智能的支持。即使是语音控制的家电,缺少通用智能的支持,可能用户体验也会比较差。大公司可以在这些领域投入和研发,推动技术进步,但这类领域目前难以产生用户体验好的应用,不适合创业。
虽然当前人工智能很热,我们仍需冷静看待,要看到人工智能的用武之地,也要看到当前技术能力的界限。准确把握当前的技术,才能产生有效的创新与应用。
本篇文章转载自王喜顺。