@IT·互联网

AI创造的精彩“世界”

2018-05-11  本文已影响65人  驢打滾

第一次工业革命,18世纪60年代——19世纪中期,人类开始进入蒸汽时代。从此以后,人类的动力来源由当初的动物或者人变成了蒸汽机和煤炭,机械代替了手工作坊;

第二次工业革命,19世纪下半叶——20世纪初,人类进入电器时代,同时内燃机出现。电能的规模化使用,极大提高了生产效率;

第三次工业革命,20世纪四五十年代-至今,人类进入计算机时代,同时还出现原子能技术、航天技术、人工合成材料、分子生物学和遗传工程等高新技术。计算机使信息数字化,推动智能化的发展;

第四次工业革命,正在发生,让机器能够模仿人类学习以及其他方面的智能,进行深度思考并且做出决策是第四次工业化革命最重要的事情。

来让我们看看AI给我们带来的精彩的世界。

人工智能的发展史与大事件

1956年8月,在美国汉诺斯小镇宁静的达特茅斯学院中,约翰·麦卡锡(JohnMcCarthy)、马文·闵斯基(Marvin Minsky,人工智能与认知学专家)、克劳德·香农(ClaudeShannon,信息论的创始人)、艾伦·纽厄尔(Allen Newell,计算机科学家)、赫伯特·西蒙(HerbertSimon,诺贝尔经济学奖得主)等科学家正聚在一起,讨论着一个完全不食人间烟火的主题:用机器来模仿人类学习以及其他方面的智能。

会议足足开了两个月的时间,虽然大家没有达成普遍的共识,但是却为会议讨论的内容起了一个名字:人工智能。因此,1956年也就成为了人工智能元年。AI由此诞生,在随后的日子里,AI成为实验室的“幻想对象”。

受限于工业条件和认知程度,人工智能在此后近30年的时间里并没有太大进步。直到上世纪90年代,人工智能才得到了突飞猛进的发展。

1997年,国际象棋程序“深蓝”击败了世界冠军卡斯帕罗夫,人工智能的“脑力”优势现出端倪;

2007年,西洋跳棋程序奇努克正式将跳棋完成破解,最强大的跳棋高手在零失误的情况下,也只能和奇努克打成平局;

2008年,在拉斯维加斯的德州扑克大赛中,人工智能“北极星2”依然在常规时间里轻松击败众人;

2016年谷歌人工智能AlphaGo4:1战胜韩国棋手李世石九段。

人工智能已然做到了颠覆人类认知。

AI发展史与大事件

人工智能的智能水平及算法

AI,机器来模仿人类学习以及其他方面的智能,展现人类的智力。

回到1956年夏天,在当时的会议上,AI先驱的梦想是建造一台复杂的机器(让当时刚出现的计算机驱动),然后让机器呈现出人类智力的特征。

这一概念就是我们所说的“强人工智能Artificial General Intelligence (AGI)”,让机器拥有人类的所有感知,甚至还可以超越人类感知,它可以像人一样思考。

还有一个概念是“弱人工智能Artificial Narrow Intelligence (ANI)”。简单来讲,“弱人工智能”可以像人类一样完成某些具体任务,有可能比人类做得更好,例如,Pinterest服务用AI给图片分类,Facebook用AI识别脸部,阿尔法狗(AlphaGo)只会下围棋。

“弱人工智能”实际使用的案例,这些应用已经体现了一些人类智力的特点。怎样实现的?这些智力来自何处?带着问题我们深入理解,就来到下一个圆圈,它就是机器学习,而如何实现机器学习呢?就是算法。机器学习就是用算法真正解析数据,不断学习,然后对世界中发生的事做出判断和预测。

算法

1、决策树

分类决策树模型是一种描述对实例进行分类的树形结构。决策树由结点和有向边组成。结点有两种类型:内部节点和叶节点,内部节点表示一个特征或属性,叶节点表示一个类。 

分类的时候,从根节点开始,对实例的某一个特征进行测试,根据测试结果,将实例分配到其子结点;此时,每一个子结点对应着该特征的一个取值。如此递归向下移动,直至达到叶结点,最后将实例分配到叶结点的类中。 

举一个通俗的栗子,各位立志于脱单的单身男女在找对象的时候就已经完完全全使用了决策树的思想。假设一位母亲在给女儿介绍对象时,有这么一段对话:

母亲与女儿对话

这个女生的决策过程就是典型的分类决策树。相当于对年龄、外貌、收入和是否公务员等特征将男人分为两个类别:见或者不见。假设这个女生的决策逻辑如下:

决策流程

上图完整表达了这个女孩决定是否见一个约会对象的策略,其中绿色结点(内部结点)表示判断条件,橙色结点(叶结点)表示决策结果,箭头表示在一个判断条件在不同情况下的决策路径,图中红色箭头表示了上面例子中女孩的决策过程。 

决策树的应用用往往都是和某一应用分析目标和场景相关的,比如:金融行业可以用决策树做贷款风险评估,保险行业可以用决策树做险种推广预测,医疗行业可以用决策树生成辅助诊断处置模型等等,当一个决策树的应用分析目标和场景确定,那该应用分析目标和场景所处的行业也就自然成为了决策树的应用领域。

2、贝叶斯

贝叶斯的统计学中有一个基本的工具叫贝叶斯公式,又被称为贝叶斯定理。如果你看到一个人总是做一些好事,则那个人多半会是一个好人。这就是说,当你不能准确知悉一个事物的本质时,你可以依靠与事物特定本质相关的事件出现的多少去判断其本质属性的概率。

用贝叶斯定理过滤垃圾邮件

全球垃圾邮件的高峰出现在2006年,那时候所有邮件中90%都是垃圾,2015年6月份全球垃圾邮件的比例数字首次降低到50%以下。

最初的垃圾邮件过滤是靠静态关键词加一些判断条件来过滤,效果不好,漏网之鱼多,冤枉的也不少。

利用贝叶斯定理过滤邮件,首先选正常邮件和垃圾邮件做训练,两种邮件数量越多之后效果越好,训练的过程就是统计在垃圾邮件中出现过的所有词汇的频次,和正常邮件中出现的所有的词汇的频次。

因为典型的垃圾邮件词汇在垃圾邮件中会以更高的频率出现,所以在做贝叶斯公式计算时,肯定会被识别出来。之后用最高频的15个垃圾词汇做联合概率计算,联合概率的结果超过90%将说明它是垃圾邮件。

用贝叶斯过滤器可以识别很多改写过的垃圾邮件,而且错判率非常低。甚至不要求对初始值有多么精确,精度会在随后计算中逐渐逼近真实情况

3、神经网络

神经网络是一门重要的机器学习技术。它是目前最为火热的研究方向--深度学习的基础。

图1 神经细胞的结构

人类大约有几百亿个脑细胞,每个脑细胞大约有几百条脑神经,每条神经上大约有几百个突触,每个突触有几百到几千个蛋白质,一个脑细胞的作用大约相当于一台大型计算机,一个突触的作用大约相当于计算机的一块芯片。可以很简单地推算出来,人的大脑相当于上千亿块或上万亿块芯片。

神经细胞和人身上任何其他类型细胞十分不同,每个神经细胞都长着一根像电线一样的称为轴突(axon)的东西,它的长度有时伸展到几厘米,用来将信号传递给其他的神经细胞。神经细胞的结构如图1 所示。它由一个细胞体(soma)、一些树突(dendrite) 、和一根可以很长的轴突组成。神经细胞体是一颗星状球形物,里面有一个核(nucleus)。树突由细胞体向各个方向长出,本身可有分支,是用来接收信号的。轴突也有许多的分支。轴突通过分支的末梢(terminal)和其他神经细胞的树突相接触,形成所谓的突触(Synapse), (图中未画出),一个神经细胞通过轴突和突触把产生的信号送到其他的神经细胞。

有趣的事实

曾经有人估算过,如果将一个人的大脑中所有神经细胞的轴突和树突依次连接起来,并拉成一根直线,可从地球连到月亮,再从月亮返回地球。如果把地球上所有人的脑中的神经细胞的轴突和树突连接起来,则可以伸展到离开我们最近的星系!

 神经细胞利用电-化学过程交换信号。输入信号来自另一些神经细胞。这些神经细胞的轴突末梢(也就是终端)和本神经细胞的树突相遇形成突触(synapse),信号就从树突上的突触进入本细胞。信号在大脑中实际怎样传输是一个相当复杂的过程,但就我们而言,重要的是把它看成和现代的计算机一样,利用一系列的0和1来进行操作。就是说,大脑的神经细胞也只有两种状态:兴奋(fire)和不兴奋(即抑制)。发射信号的强度不变,变化的仅仅是频率。神经细胞利用一种我们还不知道的方法,把所有从树突突触上进来的信号进行相加,如果全部信号的总和超过某个阀值,就会激发神经细胞进入兴奋(fire)状态,这时就会有一个电信号通过轴突发送出去给其他神经细胞。如果信号总和没有达到阀值,神经细胞就不会兴奋起来。

正是由于数量巨大的连接,使得大脑具备难以置信的能力。尽管每一个神经细胞仅仅工作于大约100Hz的频率,但因各个神经细胞都以独立处理单元的形式并行工作着,使人类的大脑具有下面这些非常明显的特点:

能实现无监督的学习。 你不会给一个孩子看一万辆车和一万匹马来让他学会识别马和车。在看到了一些例子后他就充分理解了两者的不同。就是它们能够自己进行学习,而不需要导师的监督教导。

Yann LeCun认为无监督学习才是人类和动物智能发展的主要途径。从某种意义上,无监督学习让人们看到了强人工智能的希望。

高度并行性,处理信息的效率极高。 由于人脑是超级巨大的并行运算系统,所有突触以及每个突触上的所有蛋白质,都可以瞬间同时运动,蛋白质之间又只有几纳米距离,电流在这个距离上一秒可运行几千亿次,人脑运算速度的数量级就大得没法形容,大约1后面跟27个零到30个零。要知道,40亿次,才不过是4后面跟9个零而已,差了大约20个数量级。

例如,大脑视觉皮层在处理通过我们的视网膜输入的一幅图象信号时,大约只要100ms的时间就能完成。考虑到你的神经细胞的平均工作频率只有100Hz,100ms的时间就意味每秒只能完成10个计算步骤!想一想通过我们眼睛的数据量有多大,你就可以看到这真是一个难以置信的浩大工程了。 

善于归纳推广。 一种是形式化思维,是人脑演绎能力的表现,具有逻辑的循序的特点:一种是模糊性的思维,是人脑归纳能力的表现,可同时进行综合的整体的思考。大脑和数字计算机不同,它极擅长的事情之一就是模式识别,并能根据已熟悉信息进行归纳推广(generlize)。

例如,我们能够阅读他人所写的手稿上的文字,即使我们以前从来没见过他所写的东西。 

它是有意识的。人脑最独特的是思维意识 ,意识(consciousness)是神经学家和人工智能的研究者广泛而又热烈地在辩论的一个话题。就目前的世界顶级科学家们也无法得知人的思维意识是怎样产生的。可现在的电脑想要做到那种程度要过多长时间还是个未知数。而人脑和电脑最大的差别就在于,人脑的进化速度要比电脑的进化速度快多了。

 因此,一个人工神经网络( Artificial neural network, ANN)简称神经网络(NN) 就是要在当代数字计算机现有规模的约束下,来模拟这种大量的并行性, 并在实现这一工作时,使它能显示许多和人或动物大脑相类似的特性。

在某些领域,AI还是“打败”了人类。深度神经网络已经可以应用在交谈、驾驶汽车,已经能够打败电子游戏和围棋冠军,还能利用其绘制图片,并进行科学发现。

例如,图片的设计和修改。在网站的更新和修改上,人工智能可以做得比人类更快速、更精准。这种基础技术可以给出普通用户对于网站样式的意见,以告诉设计师这个网站设计得好不好。阿里的AI设计应用“鲁班",现更名为“鹿班”,可谓让设计师瑟瑟发抖。

4、深度学习

深度学习的概念源于人工神经网络的研究。有了深度学习,机器学习才有了许多实际的应用,它还拓展了AI的整体范围。 深度学习将任务分拆,使得各种类型的机器辅助变成可能。无人驾驶汽车、更好的预防性治疗、更好的电影推荐要么已经出现,要么即将出现。AI既是现在,也是未来。有了深度学习的帮助,也许到了某一天AI会达到科幻小说描述的水平,这正是我们期待已久的。

AI是一个太庞大、太复杂的系统。AI给了世界,给了人们无限的想象空间和无线的可能。后面将会对AI的应用作一篇详细的论述,让我们继互联网+之后认识一下AI+。

上一篇下一篇

猜你喜欢

热点阅读