数据乐园首页投稿(暂停使用,暂停投稿)互联网科技

AI不可怕,就怕AI会画画——这里有一种你还不知道的‘图’灵测试

2018-02-11  本文已影响375人  阿里云云栖号

摘要: 有人说,阿尔法狗,So TM What?还有人说,AI(人工智能)有什么可怕的?它们不过是做一些人类不愿做的脏活、累活和一些可批量重复操作的活计,而对一些带有原创性质的活,比如艺术创作,AI就不灵光了。喂,喂,喂,且慢,且慢,先进来看看这里的图‘灵’测试,再说。

0. 引言

有人说,阿尔法狗,So TM What?

还有人说,AI(人工智能)有什么可怕的?它们不过是做一些人类不愿做的脏活、累活和一些可批量重复操作的活计,而对一些带有原创性质的活,比如艺术创作,AI就不灵光了。

喂,喂,喂,且慢,且慢,先进来看看这里的‘图’ 灵测试,再说。

目前我们所说的人工智能,在很大程度上,偏向于指基于深度神经网络的机器学习(简称深度学习)。深度学习现在非常火,有点甚嚣尘上,它的确也很争气,在诸多领域都有着很多惊人的表现。比如,它们在棋类博弈、计算机视觉、自动驾驶等领域,表现得跟人类一样好,甚至更好。

但是,它能高效处理人类所有类型的知识吗?人们不禁要问。

1. 人类知识的4个象限

有人做过分类,说人类的知识在两个维度上可分成四类(见下图)。即从可统计与否上来看,可分为:是可统计的和不可统计的。从能否推理上看,可分为可证明(可推理)的和不可证明(不可推理)的。

在横向方向上,对于可推理的,我们都可以通过机器学习的方法,最终可以完成这个推理。对于可推理的,且可统计的知识(象限1),早已不在计算机话下。人们正试图找到可举一反三的机器学习方法,向可推理但不可统计的象限进发(象限2)。目前,还有很多传统的机器学习研究者,正力图在这个方向作出一些成就,但在整体上,他们的研究进展,乏善可陈,不温不火。

而在纵向上,凡是可统计的、但不可推理的(即第3象限),都可以通过(大)数据和深度学习的办法,可得到一个比较好的结果。例如,目前的基于深度学习的棋类博弈(阿尔法狗)、计算机视觉(猫狗识别)、自动驾驶等等,其实都是在第3象限,提交了非常惊艳的成绩单。

但是,还有一个第4象限呢?

有哲学家说,我们把计算机能完成的(第1、2、3现象),都“外包”给计算机了,而第4象限还是留给我们人类自己玩吧,因为它不可统计,也不可推理,只能靠我们人类自己的顿悟,来开拓新知的边界,比如说提出新理论,比如说创作新艺术什么的。

可是,就有人不同意这个观点,于是一波人就聚一起,组织一个会议,大家一起来撕撕,辩一辩。有道是“油灯越挑越亮,真理越辩越明”嘛。

2. 一场别样的‘图’灵测试

圆桌会议由谷歌技术大神Mordvintsev主持。他说,大家先来看看这幅画,我们且称之为A吧,大家有谁知道A画属于哪家画派?

会场上窃窃私语:“这不就是梵高的名作《星夜》(The Starry Night)吗?”

“没错!”Mordvintsev接着说,“这就是梵老的后印象主义代表作。”

“那么,请问各位,对于这样的艺术创作,具有可推理性吗?” Mordvintsev问道。

众人答:“没有吧。”

“那么,再问各位,这样的艺术创作,具有可统计性吗?” Mordvintsev接着问道。

众人答:“也没有吧,艺术哪有什么规律可循呢?”。

Mordvintsev又说:“请大家接着看下面一幅画,暂且称之为B吧。”

“且不说,B画价值几何?请问B属于什么画派?”Mordvintsev又问。

众人答:“这画看起来挺瘆人的,人不人,马不马的,此画的作者应该是和梵高属于一类人——后印象主义吧?”

Mordvintsev:“Bingo!答对了!谢谢各位让我们通过‘图’灵测试!”

众人:“你大爷的,这哪跟哪啊?欺负我们不懂什么叫图灵测试吗?”

Mordvintsev一脸坏笑:“各位息怒啊,且听我解释。你们看到是不是都是图啊?这个测试也挺灵吧,所以我们就叫‘图’灵测试。”

众人一片嬉笑与哗然:“吁——”

Mordvintsev接着说:“大家看啊,A是人类画出来的。而B是我们谷歌用电脑画出来的(学名叫Inceptionism,且称为“盗梦主义”吧[1]),而现在,你们并没有明显地区分出来A和B的画风和流派有何不同,我们姑且大致认为,A和B是一个流派吧,而现在作为艺术创作的A,大家都认为它具有不可推理性、不可有可统计性。很自然,B也就具备A的所有特性(A、B不分家嘛),而B是由计算机搞出来的。因此,计算机也具备解决不可推理且不可统计问题(即人类知识的第四象限问题)的能力。

众人:“你丫这坑挖的,解释可有点牵强哦!”

Mordvintsev哈哈大笑:“的确,但至少我们撬开了这扇门的门缝吧”。

众人:“是啊,细思极恐。”

AI不可怕,就怕AI会画画。

(以上会议,纯属虚构,如有雷同,请对号入座)

3. “深度风格”是怎样的一种画风?

如果说Mordvintsev的“盗梦主义”,还处于实验室阶段的话,那么David Aslan正在使用的“深度风格(Deep Style)”[2],则是一种非常实用的、基于神经网络的艺术画风。

Aslan是一名法国人,作为一位小有成就的用户体验设计师(UX Designer),对艺术创作,特别是计算机艺术创作,他有自己独到的见解。在他看来,“深度风格”并不是一个简单的、类似于如PhotoShop(PS)的图片处理工具,它要比PS智能得多。因为它画出来的画,更具有欺骗性(更像专业画家画的!)。以前,人们总是以为计算机不会取代诸如艺术创作之类的工作,而现在,人们的信心开始动摇了。

有图有真相,下图就是Aslan利用“深度风格”工具绘制的一幅画,可以看出,画面七彩斑斓,画风诡异清新,充满着艺术范。

如果诸如“画风”这类创作艺术范的东西,都能被计算机所“创造”的话,那么,Aslan个人所做的那些键盘敲击、鼠标按压等操作,计算机还能模仿不出来吗?

对于计算机创作艺术,我们不禁感叹:春天都到了,夏天还会远吗?

(下图右上为原图为好莱坞明星Brad Pitt(布拉德·皮特)的肖像,下图输出的就是毕加索风格的画像[3])

小福利

如果你对这类基于神经网络的绘画艺术感兴趣,不妨找来相关的APP感性地牛刀小试一把,一键就能输出你所期望的画风Stytle!(在GitHub下载neural-style,Linux平台安装)。

本文作者:【方向】

上一篇下一篇

猜你喜欢

热点阅读