大数据,机器学习,人工智能人工智能/模式识别/机器学习精华专题中国人工智能大会

CCAI 2019|李磊:机器学习在C端成功应用要满足三个条件

2019-08-02  本文已影响0人  人工智能前沿讲习

2019年中国人工智能大会(Chinese Congress on Artificial Intelligence 2019,简称“CCAI 2019”)将于在9月21日-22日在青岛胶州召开。字节跳动人工智能实验室(ByteDance AI Lab)总监李磊博士将出席大会,并担任人工智能创新应用论坛共同主席。

李磊曾任百度美国深度学习实验室“少帅科学家”,师从数据挖掘领域权威Christos Faloutsos教授,主要研究领域为深度学习、概率模型与推理、自然语言理解以及时间序列分析。他在国际顶级学术会议发表学术论文50余篇,拥有三项美国发明专利。

这是人工智能蓬勃发展的时代,那么李磊博士如何看待当前行业的发展状态?对于技术落地又有怎样的判断?我们整理了他的相关看法和洞见,一起来了解。

深度学习强在哪?

对于人工智能,李磊认同人工智能权威学者Stuart Russell 和Perter Norvig在其《人工智能-一种现代方法》一书中给出的两个定义。

一种叫类人工智能,一切方面都以人为参照,即让机器人像人一样具备学习能力和行动能力,可以思考和决策,可以解决问题。

另一种叫理性智能,它的目标不是将机器人与人类比,而是将计算看作自然现象,研究计算在智能领域能达到什么样的合理水平,以及如何开展工作。

李磊指出,人工智能的研究领域非常广泛,近年来渐渐为公众所熟知的机器学习只是其中之一。在一些具体问题上,人工智能已经达到甚至超越了人类的水平,比如人机对弈、图像识别甚至是机器人写稿。

李磊表示,人工智能的基础在于如何表示知识和推理。机器学习有各种不同的知识表示框架,而深度学习是其中的一种知识表示和运算推理的方法。深度神经网络,是由许多可做非线性运算的小单元连接起来,形成一个可以做复杂判断的模型。

除了深度学习以外,李磊将80年代初到现在,历史上其他比较成功的知识表示框架归纳为以下四类:

(1)概率图模型(Probabilistic Graphical Models),它用概率表达物体和变量之间的关系, 刻画世界的不确定性;

(2)核方法(Kernel Method),它先通过比较、计算两个事物的相似度,再来做预测;

(3)稀疏表示,有意义的信号是少的,而大量无意义的噪声是低秩的,例如把商品的卖家关系表示为一个稀疏或低秩矩阵。

(4)树模型,通过树形或者规则森林来判断,更具可解释性。

这几类表示框架的根本数学方法有很大不同。以概率图模型为例,它是基于概率以及概率推理,加一点逻辑(命题逻辑或一阶逻辑)形成的模型;深度学习则是依靠将每个单元加在一起连成一个大系统,虽然这些单元看起来很简单,只能实现初级功能,可一旦系统化之后就能应对复杂的事情。这正是深度学习取得成功的关键所在。

强人工智能远未到来

不过李磊也表示,尽管人工智能在深度学习方面取得了很大成绩,但它自身同样存在局限性。

首先是通用性较差,距离通用智能还有遥远的距离。如前所述,当前人工智能在具体问题上可以达到甚至超越人类的水平,但要执行稍微复杂或通用的任务,就会遇到很多麻烦。

其次,深度学习目前最擅长的问题均为“有监督学习”的问题,严重依赖有标注性的数据,而标注的代价是十分高昂的,这在很多应用环境中都无法满足。

由此,李磊并不担心人工智能会对人类造成威胁。他举例说,人工智能在国际象棋领域早就超越了人类,但人类并没有因此停下学习国际象棋的脚步,专业棋手依然在训练、比赛,人工智能还对他们棋艺的进步提供了帮助。所以他的结论是,将来人类与人工智能的相处模式会是人类更多地让机器为自己服务。

也有声音认为,目前人工智能行业存在“泡沫”。李磊表示,是否存在泡沫,要看对技术的预期是否符合实际能力,看技术是当下可用,还是未来两三年、甚至是更远的将来才会成熟。如果预期不切实际,承诺无法兑现,大量投入无法在产品上产出,就会形成泡沫。李磊认为,当前来看学术界和工业界,不是人工智能行业存在泡沫的问题,而是在认识上有偏窄的危险。人工智能不仅仅是机器学习或者计算机视觉,机器学习也不局限于深度学习。

三个推动机器学习发展的问题

既然当前机器学习存在这些局限,未来该如何取得进一步的突破?对此李磊提出,解决三个问题可以推动机器学习的发展。

第一,发展它的可解释性,这是理论基础,无论机器学习表现得好还是不好,我们要从原理上理解它为什么会有这样的表现,只有这样我们才能从根本上对它进行提高。

第二,希望机器学习能够做更多推理,不止于简单判断。

第三,当前机器学习需要非常多的计算资源来训练,未来要找到把能耗降低的方法。

机器学习在C端的应用条件

在李磊看来,机器学习要想在C端成功落地,需要满足三个条件:首先是使用频率高;其次是使用成本低;此外最重要的一点是人工智能应用辅助的决策本身要比较轻,并且风险要低。

他举例说,现在算法推荐已经成为信息分发领域必备的基础功能之一,之所以能够成功落地应用,主要是能够满足上述三个条件:内容消费的频率非常高、使用成本低,以及在内容推荐上,用户的容错能力比较大,推荐A和推荐B之间,不会产生太大的影响和损失。

但如果是一些非常重要的、耗时长、影响因素复杂的决策,比如买房子,很多人因为不同条件的影响,可能会考虑、等待一两年,甚至更长时间,这种场景光靠大数据或人工智能是不够的。

上一篇下一篇

猜你喜欢

热点阅读