AI Edge: 李开复,社会必须做好来自AI的冲击 | 来测试

2018-03-29  本文已影响51人  坂本龙一

中国 AI 明星说,社会必须做好准备应对前所未有的工作冲击

...风险投资人和前AI研究人员李开复讨论了AI的影响,以及为什么将对世界产生巨大影响...

中国风险投资家李开复接受Edge采访时表示,现在的 AI 系统将对世界经济产生巨大的影响,以致造成像另一次工业革命般的后果。 “未来十五到二十年里我们都将面临一个非常具有挑战性的问题,一半的工作将被机器所取代,人类从来没有见过这样大规模的工作消失。而工业革命造成同样效果却花了更长时间, “ 他说。

他还表示,他担心深度学习可能只是一个小把戏,因为我们不能期望在未来几年会出现其他类似的突破,而是应该在此基础上调整对AI进展的看法。 “你不能继续预测明年会有突破,然后是下一个月,然后下一天,那将是指数级。指数发明的想法本身就是一个荒谬的概念,我认为那些提出这些要求和声称奇点的人,只是基于完全没有工程实际的猜测,“ 他说。

AI 有还是没有

他说,在人工智能时代,像中国和美国这样拥有大量人口和大量人工智能投资的国家已经取得了不错的成绩。 “那些状况不佳的国家可能是人口众多的国家,但没有人工智能,没有技术,没有Google,没有腾讯,没有百度,没有阿里巴巴,没有Facebook,没有亚马逊。这些人基本上只能成为数据,这些数据指向软件在其国家中占主导地位的国家。“

更多We Are Here To Create, A Conversation With Kai-Fu Lee(Edge)

伯克利研究人员用 Soft Q-Learning 让机器人们成为任务解决小能手:

...研究减少了机器人学习新行为所需的时间...

最近,伯克利研究员们想出了如何用 Soft Q-Learning(最近提出的传统 Q-Learning 变体)来让机器人更有效地学习。他们引入了一个新的技巧,可以学习如何从现有的学习策略中编写出新的q函数。例如,训练一个机器人将其手臂移动到具有特定分布的 X 位置,然后到有特定分布的 Y 位置,之后可以创建一个新的策略,能将机械臂移动到 X 和 Y 位置的交叉部分,而不需要在类似数据集上训练。

通常这种学习很难在单一策略中实现,因为它需要进行非常多的探索,以至于大多数算法会花费很长时间进行试错,并且无法完成任务成功。

真实世界

研究人员训练机器人来完成任务,如在特定位置堆叠乐高积木。他们展示了通过分别训练机器人避开其手臂附近的障碍物和堆砌乐高积木,然后结合这两个策略,使得机器人能在避开障碍物的情况下堆积木,即使之前从未接受过这样的训练组合。

为何重要

过去几年 AI 的进步让我们非常善于开发擅长单一任务的系统; 如果能够以组合这些单一能力来产生新的行为的话,那么就能进一步增加 AI 系统的能力,并且使得可以学习一些基本行动,然后将它们链接起来找到更复杂任务的解决方法

更多Composable Deep Reinforcement Learning for RoboticManipulation (Arxiv).

Salesforce 研究人员展示了简化语言建模的价值:

...精心试调后的基于简单 LSTM 或 QRNN 的系统胜过更复杂的系统...

Salesforce 的研究人员已经表明,经过良好调整的基本 AI 组件在很多情况在困难的语言任务上比更复杂的系统取得更好结果。他们的研究表明,基于RNN的系统通过用精心调整的简单组件(如LSTM)或 Salesforce 发明的QRNN来就可以超越更加复杂的模型如 recurrent highway network,hyper network 或通过神经架构搜索找到的一些系统。

这一结果表明,人工智能近期的许多进展可能在某种程度上是虚假的:之前假设某个新模型在某个数据集上取得很好成绩,是因为具有某些新能力,而如今显示经过细心调整和测试的简单组件也能。

结果

研究人员针对 Penn Treebank 和 enwik8 字符级数据集以及单词级 WikiText-103 数据集测试了基于QRNN和LSTM的系统,在 Penn Treebank 和 enwik8 上超越了当前最好的系统,而在WikiText-103上的困惑度也显着的优于 SOTA 系统。

为什么重要

如之前很多研究表明,现有的许多 AI 组件比研究人员想的可能更强大,并且像 GAN 或 DCGAN 这样的老系统可以比复杂的后继系统能更有效地建模数据分布。这并不是说这就应该把后来的一些发当做是无用功,而是提醒研究人员应该花更多的时间来调查和调整现有系统,而不是试图发明不同的“新系统”。

“快速且且精调过的基线是我们研究社群中的重要组成部分,没有这些基线,就失去了准确衡量我们进展的能力。通过扩展现有的基于 LSTM 和 QRNN 的最先进词级语言模型,我们表明,一个良好的调整基线可以在不依赖复杂或专门架构的情况下,在字符级别(Penn Treebank,enwik8)和单词级别(WikiText-103)数据集上实现最先进的结果。“ 他们写道。

更多An Analysis of Neural Language Modeling at MultipleScales (Arxiv).

想要测试你的 AI 能多好的理解语言和图像吗?那来试试 VQA 2.0 吧

...用来测试 AI 系统同时处理语言和图像的新挑战来了...

AI 研究人员认为他们已经开发出可以模拟语言和图像之间关系的模型的,或许会想试试 VQA (视觉问答)挑战的第三次更新。挑战会让模型回答关于图像内容的问题。挑战者将使用VQA数据集的v2.0版本,其中包括更多关于图像的的问题和正确答案。

更多VQA Challenge 2018 launched! (VisualQA.org).

认为 AI 模型对物理有很好的理解?在IntPhys上运行它,准备滴汗吧!

...用我们测试婴儿和生物的方式测试AI系统...

INRIA,Facebook以及CNRS的研究人员发布了IntPhys,这是一种评估AI系统对物理世界进行建模的能力,研究人员称之为“物理合理性测试”。 IntPhys遵循AI的最新趋势,测试系统更严峻的问题,这些问题更贴近人类需要解决的各种问题(请参阅AI2'ARC'用于书面推理的数据集以及DeepMind认知科学启发的'PsychLab'环境)。

它是如何工作的:

IntPhys给人工智能系统提供了使用UnrealEngine4渲染的电影场景,并让他们挑战想出一个场景是否会引出另一场景,从而让他们测试模型内化世界的基本概念的能力,如对象持久性,因果关系等。系统需要为每个场景或场景组合显示每个场景或“场景组合”的“可信度分数”,然后使用它来确定系统是否了解了世界底层动态。

IntPhys基准:

IntPhys的v1版侧重于无监督学习。第一个版本测试系统理解对象持久性的能力。未来版本将包括更多测试,如形状恒定性,时空连续性等。最初的IntPhys发布包含15,000个可能事件的视频,每个视频长达7秒,每秒15fps,共计21小时的视频。它还包含一些附加信息,因此不必尝试纯粹无监督的方式解决任务,包括每个图像的景深数据以及目标实例分割掩码。

基线系统 VS 人类:

研究人员为其他人创建两条基线来评估他们的系统:CNN编码器 - 解码器系统和条件GAN。 “从进行像素级预测的初步工作中表明,我们的模型未能预测令人信服的目标运动,特别是对于丰富背景下的小型目标。因此,我们转而使用目标掩码来更高级地计算预测。”研究人员在他们的系统上测试了人类,发现当场景可见时,人类的平均错误率约为8%,当场景包含部分阻塞时,平均错误率为25%。相比之下,基于神经网络的系统在可见场景中出现31%的错误,在部分被遮挡的场景出现50%的错误。

计算机遇到的问题是:

“在2-4个月时间里,婴儿能够根据持久,固体和时空连续的物体分析视觉输入,6个月时,他们理解稳定性,支持和因果关系的概念,8到10岁几个月后,他们掌握了重力,惯性和碰撞动量守恒的概念,10到12个月内,形状稳定性等等,“研究人员写道。

为什么重要:

像这样的测试会给我们更好的能力,来模拟AI系统执行基本推理行为的能力。并且随着研究人员使用更具挑战性的组件扩展基准,我们将能够更好地解读这些系统实际的能力。随着新组件的增加,“预测任务将变得越来越困难,逐渐达到一岁人类所达到的场景理解水平”,他们写道。

竞争:

AI研究人员可以下载数据集并将他们的系统分数提交给官方IntPhys网站(IntPhys)的在线排行榜。

阅读更多:

IntPhys:IntPhys: A Framework and Benchmark for Visual IntuitivePhysics Reasoning (Arxiv).

人工智能从业人员正在抓住即将到来的信息启示:

...认为 DeepFakes不好。等到 DeepWar...

人工智能社区的成员开始对即将到来的震撼人心的声音发出警报,制作合成图像和视频变得惊人地逼真,惊人地容易。在一篇博客文章中,人工智能从业者表示,随着数据量的增加以及易于访问的AI基础设施(云出租图形处理器)的出现,正在降低制造这种媒体材料的入门门槛,并且人工智能能力的持续进步意味着这些假媒体的质量随着时间的推移正在增加。

我们如何处理这些信息威胁?

我们可以看看社会如何通过高成本地生产高保真副本以及并行开发技术来验证货币材料的真实性,从而难以伪造货币。不幸的是,尽管这可能有助于解决人工智能伪造带来的一些问题,但它并没有解决根本问题:人工智能主要体现在软件而不是硬件上,因此难以插入可检测(非伪造)视觉分辨/音频签名到生成的媒体中,禁止某种DRM-on-steroids。一种解决方案可能是对来自相同域的真实和伪造数据集的训练AI分类器,以便提供在野外发现伪造媒体分类器。

Read more:Commoditisation of AI, digital forgery and the end oftrust: how we can fix it.

上一篇下一篇

猜你喜欢

热点阅读