最常用的人工智能术语简要说明

2022-09-19  本文已影响0人  蜗牛是不是牛

什么是人工智能

计算机科学的一个子领域。它是机器展示的一种智能,与人类展示的自然智能形成鲜明对比。

它通常用于描述模仿人类与人类思维相关的“认知”功能的机器(或计算机),例如“学习”。

这包括,

实现这一目标的人工智能最流行的子领域是机器学习

什么是机器学习

它是人工智能的一个子集。它是一组允许计算机从数据中“学习”而无需明确编程的算法。它使用统计方法使机器能够使用大量数据进行改进,例如不同猫的注释图片。然后,机器可以通过比较之前看到的东西来确定新的看不见的图像中是否有猫,就像人类一样。

这只是分类的一个例子,我们只说图片中是否有猫。计算机从数据中“学习”以实现开发人员决定的最终目标有很多不同的方式。机器通过使用监督、半监督或无监督的方法从数据中“学习”。这些都属于机器学习的一个子集,称为深度学习

什么是深度学习

也称为深度结构化学习或分层学习。

是人工智能和机器学习的一个子集。深度学习的规范是神经网络比任何其他机器学习子集有更多的层,它是“更深”的。这就是它需要大量训练数据的原因。产生了能够以新方式处理数据的极其强大的学习模型。但这需要大量的时间和精力来训练机器。

它基本上是将许多“神经元”连接在一起,就像大脑一样,为每个特征分配权重。然后它可以从它接收到的任何输入中决定正确的输出,将这些点连接在一起。就像一个侦探,将所有线索联系起来以找到有罪的人。

可以使用监督、半监督、无监督和强化学习来学习这些权重。

什么是监督学习

是机器学习算法学习的众多方式之一。

它学习了一个函数,该函数根据示例输入-输出对将输入映射到输出。

它从由一组训练示例组成的标记训练数据中推断出一个函数。在监督学习中,每个示例都是由一个输入对象(通常是一个向量)和一个期望的输出值(也称为监督信号)组成的对。

这是目前训练机器学习模型最准确的方法。但它需要大量带注释的数据进行训练。这通常很难得到。它主要用于回归和分类问题。

这种方法的问题在于推广到新的、看不见的数据。因此,该模型不仅在其训练中看到的数据上取得了成功。缺乏数据和泛化问题都推动了其他类型学习方法的发展。

就像无监督和半监督学习一样。

什么是无监督学习

是一种自组织学习,有助于在没有预先存在的标签的情况下在数据集中找到以前未知的模式。它也称为自组织,允许对给定输入的概率密度进行建模。

它从由一组训练示例组成的未标记训练数据中推断出一个函数。无监督学习中使用的两种主要方法是主成分分析和聚类分析。

聚类分析用于无监督学习对具有共享属性的数据集进行分组或分割,以推断算法关系。聚类分析不是响应反馈,而是识别数据中的共性,并根据每条新数据中是否存在此类共性做出反应。这种方法有助于检测不适合任一组的异常数据点。

它是使用的主要三类机器学习方法之一,与监督学习、强化学习和半监督学习一起。

什么是半监督学习

是监督学习和非监督学习的混合体。它在训练期间使用标记和未标记的数据。

之所以使用它,是因为在很多方面都很难获得标记数据,但它可以显着提高学习准确性。

由于未标记数据的获取相对便宜,因此向其中添加一小部分昂贵的标记数据总体上很便宜,并且与仅未标记数据相比会产生非常好的结果。

直观地说,学习问题可以看作是一场考试,并且标记数据是教师为课堂解决的样本问题,以帮助解决您无法获得答案的另一组问题,在这种情况下是未标记的数据.

这是考试的好习惯,因为您已经看到了有关如何进行考试的示例并可以进行比较。

什么是强化学习

是机器学习的一个领域,它与软件代理应该如何在环境中采取行动以最大化累积奖励的概念有关。

它与监督学习的不同之处在于不需要显示标记的输入/输出对,也不需要明确纠正次优动作。

相反,重点是采取适当的行动以在特定情况下最大化奖励。因此,强化学习就是按顺序做出决策。

让我们用一个例子来解释它,一个国际象棋游戏。如前所述,我们有一个代理和一个环境。代理是玩家,环境是国际象棋游戏。然后,强化学习将是两者之间的对话,一方面是从代理到环境的动作,来自玩家的移动。另一方面,从环境到代理的状态;搬家的结果。如果移动是坏的,环境也会告诉代理。

在我们的示例中,如果代理获胜,它将知道其行为是好的。然后它将得到积极的奖励,并且代理将倾向于使用相同类型的动作。在这种情况下,强化是积极的,但也可能是消极的,例如惩罚代理人做坏事。

经过多次迭代,agent会越来越自信,并且有很好的效果。Google 的 AlphaZero 就是一个很好的例子。

什么是分类

是监督学习的一个实例。

分类模型试图根据包含类别成员已知的观察的训练数据集来识别新观察属于一组类别中的哪一个。

例如,我们对不同类型的垃圾使用单独的垃圾箱:一个用于纸质垃圾,一个用于塑料垃圾,一个用于干垃圾,一个用于湿垃圾等等。这些废物类型将是我们的类别。

如果你有一杯用塑料制成的旧咖啡,你会把它放在塑料垃圾箱里,因为你知道它具有相同的特性;它是由塑料制成的。您在这里所做的基本上是将废物分类并选择一种;塑料。简而言之,分类是将“类别标签”分配给特定项目的过程。

有多种分类算法,如线性分类器、支持向量机、核估计、决策树等等。

什么是回归

是监督学习的一个实例。

这是一种确定哪些变量对感兴趣的主题有影响的可靠方法。

它用于估计因变量(通常称为“结果变量”)和一个或多个自变量(通常称为“预测变量”、“协变量”或“特征”)之间的关系。

执行回归的过程使您可以自信地确定哪些因素最重要,哪些因素可以忽略,以及这些因素如何相互影响。

回归用于识别变量之间的趋势并从中推断出输出。有多种回归算法,如线性回归、多项式回归、ElasticNet 回归等等。

什么是聚类

是无监督学习的一个实例。

它是以这样一种方式对一组对象进行分组的任务,即同一组(称为集群)中的对象彼此之间比其他组中的对象更相似。

在机器学习中,我们经常将示例分组作为理解机器学习系统中主题(数据集)的第一步。对未标记的示例进行分组称为聚类。

在将类似的示例组合在一起之前,您首先需要找到类似的示例。您可以通过将示例特征数据组合成一个度量来衡量示例之间的相似性,称为相似性度量。

让我们看一个简单的比较示例,假设您在另一个国家的超市里看到一种您以前从未见过的食物。标签不是你的语言,而是介于苹果和梨之间。然后您会假设它是一种水果,并且可能类似于苹果和梨,即使您无法阅读那种未知语言的“水果”标签部分。

你所做的是你做了一个名为“水果”的集群,并将未知的食物归类到它。您使用接近度和形状作为输入变量来推断一个共同的输出,其中苹果和梨将它们与超市中的其他食物区分开来。

简而言之,将未标记的示例分组称为聚类。由于示例未标记,因此聚类依赖于无监督机器学习。如果示例被标记,那么聚类就变成了分类。有多种聚类算法,如 K-means、mean-shift、高斯混合等等。

什么是反向传播

是一种用于训练深度学习模型的监督学习算法。这种学习方法是目前最流行的,因为它可以使用计算时间短的强大计算方法。

在深度学习模型中,我们使用参数来计算每个神经元的使用比例,以获得预期的输出。训练模型意味着教它使用哪些参数来成功获得正确的输出。通过使用反向传播,模型将更改其参数(称为权重)以实现预期输出。它通过计算预期输出与实际输出之间的差异(称为误差)来更改其参数。

反向传播算法很容易理解。首先,我们向模型发送一个示例,例如一张猫的图片。由于模型尚未训练,我们不知道使用哪些权重,不使用哪些权重。我们必须将权重初始化为某个随机值。

但是现在我们得到一个输出“狗”而不是预期的输出“猫”。该模型计算“猫”的结果与我们得到“狗”的结果之间的差异。这是错误。然后,它将这个误差向后传播到模型,更新与误差成比例的所有权重。

这样做之后,另一个例子被输入到模型中,我们再次重复这个过程,直到误差最小化并且模型被训练。一旦错误变得最小,您的模型就可以处理看不见的数据了。

该算法背后的计算非常复杂,需要梯度下降、均方误差等技术。

什么是自然语言处理

也称为 NLP

是语言学、计算机科学和人工智能的一个子领域,涉及计算机与人类(自然)语言之间的交互。

NLP 的最终目标是以有价值的方式阅读、破译、理解和理解人类语言。大多数 NLP 技术依靠机器学习从人类语言中获取意义。NLP 是个人助理、Microsoft Word 等文字处理器、语言翻译应用程序等背后的驱动力。它是人工智能最大的子领域之一,主要是因为你每天都在使用它;使用 Siri、谷歌翻译、微软 word 等。

人类很容易掌握一门语言,自然语言的模糊性和不精确性是机器难以实现 NLP 的原因。

自然语言处理中的这些挑战经常涉及语音识别、自然语言理解和自然语言生成。

什么是神经网络

神经网络是由神经元组成的网络,或者现代意义上的人工神经网络,由人工神经元组成。它使用节点、连接和权重来模拟大脑的神经元,以找到与特定输入相关的输出。神经网络基于称为人工神经元的连接单元或节点的集合,它们对生物大脑中的神经元进行松散的建模。每个连接,就像生物大脑中的突触一样,可以将信号传递给其他神经元。接收信号并对其进行处理的人工神经元可以向与其相连的神经元发送其他信号。这样的系统通过考虑示例来“学习”执行任务,通常无需使用特定于任务的规则进行编程。

什么是计算机视觉

是人工智能的一个子领域,它训练计算机解释和理解视觉世界。它包括获取、处理、分析和理解数字图像的方法。计算机视觉的问题看起来很简单,因为人们很容易解决它,甚至是非常年幼的孩子。

对于计算机来说,这是完全不同的交易。

基于对生物视觉的有限理解和动态且几乎无限变化的物理世界中视觉感知的复杂性,这在很大程度上仍然是一个未解决的问题。

计算机视觉和神经科学的研究紧密相连,以了解我们如何看待以及我们如何知道我们所看到的。简而言之,计算机视觉的目标是理解数字图像的内容。通常,这涉及开发试图重现人类视觉能力的方法。

了解数字图像的内容可能涉及从图像中提取描述,可能是对象、文本描述、三维模型等。这是一个巨大的人工智能子领域,跨行业用于增强消费者体验、降低成本、提高安全性等等。

上一篇下一篇

猜你喜欢

热点阅读