人工智能

读《智能时代》前两章有感

2020-02-07  本文已影响0人  如书中言

偶得吴军老师的《智能时代》一书,阅读该书前两章,感觉受益匪浅,尤其是通过对第二章“大数据与机器智能”的阅读,才使我对人工智能的历史有了一个大致的了解,现将感想倾诸于下。

一、“数据”概述

虽然我对人工智能的具体情况尚不了解,但大致知道现阶段的人工智能需要以大数据为基础,而《智能时代》第一章即详细介绍了数据的相关问题。

首先,“在计算机出现之前,一般书籍上的文字内容并不被看成数据,”而今天,不止书籍上的文字内容,连我们的活动,我们每天的言谈举止,喜爱偏好等,都已被看成是某种数据。

在人类社会早期,我们通过观察现象,总结数据,再从数据中提取出有用的信息,并在信息的基础上形成知识(知识具有系统性),从而指导我们的行为。我们使用数据的标准流程如下:

而在过去数据的作用之所以不被重视,“这里面有两个原因,首先是由于过去数据量不足,积累大量的数据所需要的时间太长,以至于在较短的时间里它的作用不明显。其次,数据和所想获得的信息之间的联系通常是间接的,它要通过不同数据之间的相关性才能体现出来。”而这种相关性也有待人们的发掘,吴军老师举了王进喜照片与日本投标之间的关联、谷歌用户对某节目的搜索量和该节目收视率之间的关联以及搜索趋势和流感疫情之间的关联等来说明相关性的重要。

而关于第一个原因,“在互联网出现之前,获得大量的具有代表性的数据其实并非一件容易事,在误差允许的范围内做些统计当然没有问题,但只有在很少的情况下能够单纯依靠数据来解决复杂的问题。因此在20世纪90年代之前,整个社会对数据并不是很看重。”

数据的相关性还要透过建立合适的数学模型来更好的加以利用,“要建立数学模型就要解决两个问题,首先是采用什么样的模型,其次是模型的参数是多少。”“……如果一开始模型选得不好,那么以后修修补补就很困难。因此,在过去,无论在理论上还是工程上,大家都把主要的精力放在寻找模型上。”

“有了模型之后,第二步就是要找到模型的参数,以便让模型至少和以前观察到的数据相吻合。这一点在过去的被重视程度远不如找模型。但是今天他又有了一个比较时髦而高深的词——机器学习。”(程按:既输入数据,不断调整模型,这和今天机器学习的方法类似)

“回到数学模型上,其实只要数据量足够,就可以用若干个简单的模型取代一个复杂的模型。这种方法被称为数据驱动方法,因为它是先有大量的数据,而不是预设的模型,然后用很多简单的模型去契合数据(Fit Data)。虽然这种数据驱动方法在数据量不足时找到的一组模型可能和真实的模型存在一定的偏差,但是在误差允许的范围内,单从结果上看和精确的模型是等效的,这在数学上是有根据的。从原理上讲,这类似于前面提到的切比雪夫大数定律。

当然,数据驱动方法要想成功,除了数据量大之外,还要有一个前提,那就是样本必须非常具有代表性,这在任何统计学教科书里的一句话,但是在现实生活中要做到是非常难的。……”

二、大数据和机器智能

“在2000年以后,由于互联网特别是后来移动互联网的出现,数据量不仅剧增,而且开始相互关联,出现了大数据的概念,在2000 年以后,由于互联网特别是后来移动互联网的出现,科学家和工程师们发现,采用大数据的方法能够使计算机的智能水平产生飞跃,这样在很多领域计算机将获得比人类智能更高的智能。可以说我们正在经历一场由大数据带来的技术革命,其最典型的特征就是计算机智能水平的提高,因此我们不妨把这场革命称为智能革命。当计算机的智能水平赶上甚至超过人类时,我们的社会就要发生天翻地覆的变化,这才是大数据的可怕之处。

那么为什么大数据会最终导致这样的结果,大数据和机器智能是什么关系呢?要说清楚这一一点,首先要说明什么是机器智能。”

“1946年,第一台电子计算机ENIAC诞生,这使得人类重新开始考虑机器能否有智能的问题。”

“真正科学地定义什么是机器智能的还是电子计算机的奠基人阿兰·图灵博士。1950年,图灵在《思想》杂志上发表了一篇题为《计算的机器和智能》的论文。在论文中,图灵既没有讲计算机怎样才能获得智能,也没有提出什么解决复杂问题的智能方法,而只是提出了一种验证机器有无智能的判别方法。”既让一个裁判坐在墓前和幕后的“人”交流,幕后是一台机器和一个人,如果裁判无法判断出与自己交流的是人还是机器,那么就说明这台机器拥有了和人同等的智能。

“这种方法被后人称为图灵测试(Turing Test)。计算机科学家们认为,如果计算机实现了下面几件事情中的一件,就可以认为它有图灵所说的那种智能:

1.语音识别

2.机器翻译

3文本的自动摘要或者写作

4.战胜人类的国际象棋冠军

5.自动回答问题

今天,计算机已经做到了上述这几件事情,有些时候还超额完成了任务,比如在下棋方面,不仅战胜了国际象棋的世界冠军,而且还战胜了围棋的世界冠军,后者的难度比前者高出6~8个数量级。当然,人类走到这一步并非一帆风顺,而是先走了十几年的弯路。”

鸟飞派:人工智能1.0

“据记载,1956年的夏天,香农和一群年轻的学者在达特茅斯学院召开了一次头脑风暴式的研讨会。……事实上,这是一次头脑风暴式的讨论会。这10位年轻的学者讨论的是当时计算机科学尚未解决,甚至尚未开展研究的问题,包括人工智能、自然语言处理和神经网络等。人工智能这个说法便是在这次会议上提出的。”

“人工智能这个名词严格地讲在今天有两个定义,第一个是泛指机器智能,也就是任何可以让计算机通过图灵测试的方法,包括我们在本书中要经常讲的数据驱动方法。第二个是狭义上的概念,即20世纪五六十年代特定的研究机器智能的方法。今天,几乎所有书名含有“人工智能”字样的教科书(包括全球销量最大的由斯图亚特·罗素和诺威格编写的《人工智能:一种现代的方法》一书)依然用主要的篇幅介绍那些“好的老式的人工智能”(Good Old

Fashioned)。后来那些利用其他方法产生机器智能的学者为了划清自己和传统方法的界限,特地强调自己不是用人工智能的方法。因此,学术界将机器智能分为传统人工智能的方法和现代其他的方法(比如数据驱动、知识发现或者机器学习)。当然,计算机领域之外的人在谈到人工智能时,常常是泛指任何机器智能,而并不局限于传统的方法。因此为了便于区分,我们在本书中尽可能地使用机器智能表示广义上的概念,而在使用人工智能表达时,通常是指传统的人工智能方法,甚至我们有时会强调为人工智能1.0。

那么传统的人工智能方法是什么呢?简单地讲,就是首先了解人类是如何产生智能的,然后让计算机按照人的思路去做。今天几乎所有的科学家都不坚持“机器要像人一样思考才能获得智能”,但是很多的门外汉在谈到人工智能时依然想象着“机器在像我们那样思考”,这让他们既兴奋又担心。事实上,当我们回到图灵博士描述机器智能的原点时就能发现,机器智能最重要的是能够解决人脑所能解决的问题,而不在于是否需要采用和人一样的方法。

为什么早期科学家们的想法会和今天的门外汉一样天真呢?这个道理很简单,因为这是根据我们的直觉最容易想到的方法,在人类发明的历史上,很多领域早期的尝试都是模仿人或者动物的行为。比如人类在几千年之前就梦想着飞行,于是就开始模仿鸟,在东方和西方都有类似的记录,将鸟的羽毛做成翅膀绑在人的胳膊上往下跳,当然实验的结果都可想而知。后来人们把这样的方法论称作“鸟飞派”,也就是看看鸟是怎样飞的,就能模仿鸟造出飞机,而不需要了解空气动力学。事实上我们知道,怀特兄弟发明飞机靠的是空气动力学而不是仿生学。在这里,我们不要笑话前辈来自直觉的天真想法,这是人类认识的普遍规律。

在人工智能刚被提出来的时候,这个研究课题在全世界都非常热门,大家仿佛觉得用不了多长时间就可以让计算机变得比人聪明了。遗憾的是,经过十几年的研究,科学家们发现人工智能远不是那么回事,除了做出了几个简单的“玩具”,比如让机器人像猴子一样摘香蕉,解决不了什么实际问题。到了20世纪60年代末,计算机科学的其他分支都发展得非常迅速,但是人工智能研究却开展不下去了。因此,美国计算机学界开始反思人工智能的发展。虽然一些人认为机器之所以智能水平有限,是因为它还不够快、容量不够大,但是,也有一些有识之士认为,科学家们走错了路,照着那条路走下去,计算机再快也解决不了智能问题。”

明斯基在《语义信息处理》引用了巴希勒使用过的一个例子: The pen was

in the box和The box was in the pen,来说明目前人工人工智能的局限性。

“这两句话会得到相同的语法分析树,而仅仅根据这两句话本身,甚至通篇文章,是无法判定pen在哪一句话中应该作为围栏,在哪一句话中应该是钢笔的意思。事实上人对这两句话的理解并非来自语法分析和语意本身,而是来自他们的常识或者说关于世界的知识(world knowledge),这个问题是传统的人工智能方法解决不了的。因此,明斯基给出了他的结论:‘目前’(指1968年)的方法无法让计算机真正有类似于人的智能。由于明斯基在计算机科学界具有崇高的声望,他的这篇论文导致美国政府削减了几乎全部人工智能研究的经费,在之后大约20年左右的时间里,全世界人工智能在学术界的研究是处于低谷的。”

另辟蹊径:统计+数据

“到了20世纪70年代,人类开始尝试机器智能的另一条发展道路,即采用数据驱动和超级计算的方法,而这个尝试始于工业界而非大学。

在那个年代,IBM在全世界计算机乃至整个IT产业可以说是处于独孤求败的地位。……这时,IBM考虑的不能再是如何占有更大的市场份额,而是如何让计算机变得更聪明。

1972年,康奈尔大学的教授弗雷德·贾里尼克(Fred Jelinek,1932-2010)到IBM做学术休假,正好这时IBM想开发“聪明的计算机”,贾里尼克就“临时”负责起这个项目。至于什么是聪明的计算机,当时大家的共识是它要么能够听懂人的话,要么能将一种语言翻译成另一种语言,要么能够赢得了国际象棋的世界冠军。贾里尼克根据自己的特长和IBM的条件,选择了第一个任务,即计算机自动识别人的语音。”

贾里尼克认为语音识别是一个智能问题,而是一个通信问题,既人发出语音是一个大脑编码的过程,编码完成,经过传播,传入听者的耳朵,听者接受并理解则是一个解码的过程,而对于语音识别问题也可以按此处理,他“用当时已经颇为成熟的数字通信的各种技术来实现语音识别,而彻底抛开了人工智能的那一套方法(指传统的方法,让计算机模拟人)”

“贾里尼克和他的同事在研究语音识别时,无意中开创了一种采用统计的方法解决智能问题的途径,因为这种方法需要使用大量的数据,因此又被称为数据驱动方法。这种方法最大的好处是,随着数据量的积累,系统会变得越来越好,相比之下过去人工智能的方法很难受益于数据量的提升。”

“在语音识别之后,欧洲和美国的科学家开始考虑能否用数据驱动方法解决其他智能问题。贾里尼克的同事彼得·布朗(Peter Brown)在20世纪80年代,将这种数据驱动方法用于机器翻译。但是由于缺乏数据,最初的翻译结果并不令人满意,虽然一些学者认可这种方法,但是其他学者,尤其是早期从事这项工作的学者认为,解决机器翻译这样智能的问题,光靠基于数据的统计是不够的。从20世纪80年代初到90年代中期大约十多年的时间里,在计算机界大家一直有个争议,那就是数据驱动方法是否适用于各种领域,语音识别是否只是一个特例。简单地讲,当时无论是做语音识别、机器翻译、图像识别,还是自然语言理解的学者,分成了界限很明确的两派,一派坚持采用传统的人工智能方法解决问题,简单来讲就是模仿人,另一派在倡导数据驱动方法。这两派在不同的领域力量不一样,在语音识别和自然语言理解领域,提倡数据驱动的一派比较快地占了上风;而在图像识别和机器翻译方面,在较长时间里,数据驱动这一派处于下风。这里面主要的原因是,在图像识别和机器翻译领域,过去的数据量非常少,而这种数据的积累非常困难。图像识别就不用讲了,在互联网出现之前,没有一个实验室有上百万张图片。在机器翻译领域,所需要的数据除了一般的文本数据,还需要大量的双语(甚至是多语种)对照的数据,而在互联网出现之前,除了《圣经》和少量联合国文件,再也找不到类似的数据了。”但随着互联网的兴起,数据的获取变得容易起来,2005年谷歌公司打败全世界所有机器翻译研究团队所用的方法依然是数据驱动方法,而之所以能赢,则是因为“用了比其他研究所多几千倍甚至上万倍的数据。”

“如今在很多与“智能”有关的研究领域,比如图像识别和自然语言理解,如果所采用的方法无法利用数据最的优势,会被认为是落伍的。

数据驱动方法从20 世纪70年代开始起步,在八九十年代得到缓慢但稳步的发展。进入21世纪后,由于互联网的出现,使得可用的数据量剧增,数据驱动方法的优势越来越明显,最终完成了从量变到质变的飞跃。如今很多需要类似人类智能才能做的事情,计算机已经可以胜任了,这得益于数据量的增加。

全世界各个领域数据不断向外扩展,渐渐形成了另外一个特点,那就是很多数据开始出现交叉,各个维度的数据从点和线渐渐连成了网,或者说,数据之间的关联性极大地增强,在这样的背景下,就出现了大数据。”

“在有大数据之前,计算机并不擅长解决需要人类智能来解决的问题, 但是今天这些问题换个思路就可以解决了,其核心就是变智能问题为数据问题。由此,全世界开始了新的一一轮技术革命智能革命。”

尽管过往数年,计算机能做的事情越来越来,但给人的感觉仍然是“快却不够聪明”,但当我们拥有足够多的数据之后,便可以化智能问题为数据问题,机器不再需要像人一样思考才能解决问题,只要输入足够的数据,配合合适的算法(模型),机器便可以做出最优的判断。深蓝即使战胜了卡斯帕罗,“但在这看似聪明的表象背后,其实是大量的数据、并不算复杂的算法和超强计算能力的结合——深蓝从来没有,也不需要像人一样思考。”

“计算机下棋和回答问题,体现出大数据对机器智能的决定作用。我们在后面会看到很多各种各样的机器人,比如 Google自动驾驶汽车、能够诊断癌症或者为报纸写文章的计算机,它们不需要像科幻电影里的机器人那样长着人形,但是它们都在某个方面具有超过人类的智能。在这些机器人的背后,是数据中心强大的服务器集群,而从方法上讲,它们获得智能的方法不是和我们人一样靠推理,而更多的是利用大数据,从数据中学习获得信息和知识。如今,这一场由大数据引发的改变世界的革命已经悄然发生,我们在后面的几章会更深入地介绍它。这次技术革命的特点是机器的智能化,因此我们称之为智能革命也毫不为过。”

上一篇下一篇

猜你喜欢

热点阅读