【拥抱AI】人工智能算法——初识机器学习,深度学习
一、机器学习
机器学习(Machine Learning, ML)是一门涉及概率论、统计学、逼近论等领域的交叉学科,是一种实现人工智能的方法,专门研究计算机怎样模拟或实现人类的学习行为。
机器学习之父Tom Mitchell对机器学习的定义为:对于某类任务T和性能度量P,如果一个计算机程序在T上以P衡量的性能随着经验E而不断自我完善,那么我们称这个计算机程序在从经验E学习。
机器学习的产生源于人类对于自身学习过程的理解。人类是基于“已有知识和经验”对新的问 题进行处理和判断的,机器学习则是利用算法使计算机能够像人一样从数据中挖掘出信息。 通过对海量数据进行学习,构建复杂的、甚至无法解释的模型,当新的数据输入时,通过该 模型进行预测。
虽然机器在面对新的领域时往往需要重新学习,但只要具备足够的运算能力和训练数据,机器可以实现不间断学习,从而快速提高认知和推理能力,所以具备在特定领域内超越人类能力的可能性。
按照模型的训练方式,机器学习可分为无监督学习、监督学习和强化学习几个典型。
无监督学习:给定数据,从数据中发现信息。它的输入是没有维度标签的历史数据,要求的输出是聚类后的数据,典型应用场景是用户聚类、新闻聚类。
监督学习:给定数据,预测这些数据的标签。它的输出是带维度标签的历史数据,要求的输出是依据模型所做出的预测,典型应用场景是推荐、预测等问题。
强化学习:给定数据,选择选择动作以最大化长期奖励。它的输入是历史的状态、动作和对应的奖励,要求输出的是当前状态下的最佳动作。与前两类不同的是,强化学习是一个动态学习过程,可能既没有明确目标也没有精确的评价标准,许多控制决策类问题都是强化学习问题。
二、深度学习
深度学习(Deep Learning, DL)是机器学习研究中的一个新领域,2006年由Hinton等人提出。深度学习是一种实现机器学习的技术,源于人工神经网络的研究,通过建立模拟人脑进行分析和学习的神经网络,模仿人脑的机制来解释数据。
深度学习的“深度”之称是由于从“输入层”到“输出层”之间包含了众多隐层。其实质是通过构建具有很多隐层的机器学习模型和海量的训练数据,来学习更有用的特征,从而最终提升分类或预测的准确性。
传统机器学习是分步骤来进行的,每一步的最优解不一定带来结果的最优解;手工选取特征需要极强的专业知识,同时费时费力,很大程度上仍旧依赖经验和运气。而深度学习是从原始特征出发,自动学习高级特征组合,最终直接输出最优解。但其中间的隐层是一个黑箱,我们并不知道机器提取了何种特征。
深度学习对数据的量、数据的特征维度,以及特征在空间中的分布情况等条件都有较高的要求,因此并不能说深度学习绝对优于其他机器学习算法。虽然近年来已经取得了突破性的进展,AI算法能力与真实的人脑仍有巨大的差距。AI发展道阻且长,广大研究者和从业者们仍在不断努力。
在【拥抱AI】这个专题中,我们介绍了人工智能的含义、人工智能的发展史、人工智能的层次和人工智能算法。后续,我们将推出【AI在寿险】的专题,为大家介绍寿险AI发展历程、技术实力和应用成果,敬请期待。
平安人寿人工智能研发团队