AI不可怕，就怕AI会画画——这里有一种你还不知道的‘图’灵测试

2018-02-11 本文已影响375人阿里云云栖号

摘要： 有人说，阿尔法狗，So TM What？还有人说，AI（人工智能）有什么可怕的？它们不过是做一些人类不愿做的脏活、累活和一些可批量重复操作的活计，而对一些带有原创性质的活，比如艺术创作，AI就不灵光了。喂，喂，喂，且慢，且慢，先进来看看这里的图‘灵’测试，再说。

0. 引言

有人说，阿尔法狗，So TM What？

还有人说，AI（人工智能）有什么可怕的？它们不过是做一些人类不愿做的脏活、累活和一些可批量重复操作的活计，而对一些带有原创性质的活，比如艺术创作，AI就不灵光了。

喂，喂，喂，且慢，且慢，先进来看看这里的‘图’ 灵测试，再说。

目前我们所说的人工智能，在很大程度上，偏向于指基于深度神经网络的机器学习（简称深度学习）。深度学习现在非常火，有点甚嚣尘上，它的确也很争气，在诸多领域都有着很多惊人的表现。比如，它们在棋类博弈、计算机视觉、自动驾驶等领域，表现得跟人类一样好，甚至更好。

但是，它能高效处理人类所有类型的知识吗？人们不禁要问。

1. 人类知识的4个象限

有人做过分类，说人类的知识在两个维度上可分成四类（见下图）。即从可统计与否上来看，可分为：是可统计的和不可统计的。从能否推理上看，可分为可证明（可推理）的和不可证明（不可推理）的。

在横向方向上，对于可推理的，我们都可以通过机器学习的方法，最终可以完成这个推理。对于可推理的，且可统计的知识（象限1），早已不在计算机话下。人们正试图找到可举一反三的机器学习方法，向可推理但不可统计的象限进发（象限2）。目前，还有很多传统的机器学习研究者，正力图在这个方向作出一些成就，但在整体上，他们的研究进展，乏善可陈，不温不火。

而在纵向上，凡是可统计的、但不可推理的（即第3象限），都可以通过（大）数据和深度学习的办法，可得到一个比较好的结果。例如，目前的基于深度学习的棋类博弈（阿尔法狗）、计算机视觉（猫狗识别）、自动驾驶等等，其实都是在第3象限，提交了非常惊艳的成绩单。

但是，还有一个第4象限呢？

有哲学家说，我们把计算机能完成的（第1、2、3现象），都“外包”给计算机了，而第4象限还是留给我们人类自己玩吧，因为它不可统计，也不可推理，只能靠我们人类自己的顿悟，来开拓新知的边界，比如说提出新理论，比如说创作新艺术什么的。

可是，就有人不同意这个观点，于是一波人就聚一起，组织一个会议，大家一起来撕撕，辩一辩。有道是“油灯越挑越亮，真理越辩越明”嘛。

2. 一场别样的‘图’灵测试

圆桌会议由谷歌技术大神Mordvintsev主持。他说，大家先来看看这幅画，我们且称之为A吧，大家有谁知道A画属于哪家画派？

会场上窃窃私语：“这不就是梵高的名作《星夜》（The Starry Night）吗？”

“没错！”Mordvintsev接着说，“这就是梵老的后印象主义代表作。”

“那么，请问各位，对于这样的艺术创作，具有可推理性吗？” Mordvintsev问道。

众人答：“没有吧。”

“那么，再问各位，这样的艺术创作，具有可统计性吗？” Mordvintsev接着问道。

众人答：“也没有吧，艺术哪有什么规律可循呢？”。

Mordvintsev又说：“请大家接着看下面一幅画，暂且称之为B吧。”

“且不说，B画价值几何？请问B属于什么画派？”Mordvintsev又问。

众人答：“这画看起来挺瘆人的，人不人，马不马的，此画的作者应该是和梵高属于一类人——后印象主义吧？”

Mordvintsev：“Bingo！答对了！谢谢各位让我们通过‘图’灵测试！”

众人：“你大爷的，这哪跟哪啊？欺负我们不懂什么叫图灵测试吗？”

Mordvintsev一脸坏笑：“各位息怒啊，且听我解释。你们看到是不是都是图啊？这个测试也挺灵吧，所以我们就叫‘图’灵测试。”

众人一片嬉笑与哗然：“吁——”

Mordvintsev接着说：“大家看啊，A是人类画出来的。而B是我们谷歌用电脑画出来的（学名叫Inceptionism，且称为“盗梦主义”吧[1]），而现在，你们并没有明显地区分出来A和B的画风和流派有何不同，我们姑且大致认为，A和B是一个流派吧，而现在作为艺术创作的A，大家都认为它具有不可推理性、不可有可统计性。很自然，B也就具备A的所有特性（A、B不分家嘛），而B是由计算机搞出来的。因此，计算机也具备解决不可推理且不可统计问题（即人类知识的第四象限问题）的能力。

众人：“你丫这坑挖的，解释可有点牵强哦！”

Mordvintsev哈哈大笑：“的确，但至少我们撬开了这扇门的门缝吧”。

众人：“是啊，细思极恐。”

AI不可怕，就怕AI会画画。

（以上会议，纯属虚构，如有雷同，请对号入座）

3. “深度风格”是怎样的一种画风？

如果说Mordvintsev的“盗梦主义”，还处于实验室阶段的话，那么David Aslan正在使用的“深度风格（Deep Style）”[2]，则是一种非常实用的、基于神经网络的艺术画风。

Aslan是一名法国人，作为一位小有成就的用户体验设计师（UX Designer），对艺术创作，特别是计算机艺术创作，他有自己独到的见解。在他看来，“深度风格”并不是一个简单的、类似于如PhotoShop（PS）的图片处理工具，它要比PS智能得多。因为它画出来的画，更具有欺骗性（更像专业画家画的！）。以前，人们总是以为计算机不会取代诸如艺术创作之类的工作，而现在，人们的信心开始动摇了。

有图有真相，下图就是Aslan利用“深度风格”工具绘制的一幅画，可以看出，画面七彩斑斓，画风诡异清新，充满着艺术范。

如果诸如“画风”这类创作艺术范的东西，都能被计算机所“创造”的话，那么，Aslan个人所做的那些键盘敲击、鼠标按压等操作，计算机还能模仿不出来吗？

对于计算机创作艺术，我们不禁感叹：春天都到了，夏天还会远吗？

（下图右上为原图为好莱坞明星Brad Pitt（布拉德·皮特）的肖像，下图输出的就是毕加索风格的画像[3]）

小福利

如果你对这类基于神经网络的绘画艺术感兴趣，不妨找来相关的APP感性地牛刀小试一把，一键就能输出你所期望的画风Stytle！（在GitHub下载neural-style，Linux平台安装）。

本文作者：【方向】

AI不可怕，就怕AI会画画——这里有一种你还不知道的‘图’灵测试

猜你喜欢

热点阅读