用时30%，速度快百倍，MIT自动机器学习系统填补数据科学人才空

2017-12-21 本文已影响81人智能观

核心看点：

麻省理工学院和密歇根州立大学的一个称为自动调谐模型（ATM）的自动机器学习平台使用基于云的按需计算来加速数据分析。

ATM提出的解决方案比人类的更好，仅用人类30％的时间，而且速度快100倍。

根据麻省理工学院和密歇根州立大学的一篇新文章，一种新的自动机器学习系统可以分析数据，并提出比人类快100倍的解决方案。这可能有助于企业以更快、更简单的方式利用机器学习的能力，同时也填补了数据科学人才方面的空白。

据TechRepublic的姊妹网站ZDNet报道，该系统的出现可能成为企业采用机器学习的一个转折点，预计到2018年使用量将翻倍。

在寻求问题的解决方案时，数据科学家必须通过巨大的数据集来选择他们认为最有效的建模技术。问题是，有数以百计的技术可供选择，包括神经网络和支持向量机等，选择最好的技术可能意味着数百万美元的广告收入，或者成功发现医疗设备中的缺陷。

麻省理工学院和密歇根州立大学的研究人员上周在IEEE国际大数据会议上发表了一篇名为“自动调谐模型”（ATM）的论文，展示了一个新的自动化系统如何能够比人类更好地选择建模技术。

根据MIT新闻的一篇报道，ATM使用基于云的按需计算来执行高吞吐量的搜索，并为给定的问题找到最佳的建模技术。系统还会调整模型的超参数或指定模型如何训练的值，以获得最佳结果。

研究人员通过协作众包平台open-ml.org（数据科学家经常在该平台上共同解决问题）测试了这个系统对人类的影响。ATM从平台分析了371个数据集。研究人员发现，该系统能够开发出更好的解决方案，仅用人类所需时间的30％。

ATM的运行速度比人类还要快得多：人类的开放平台用户平均需要200天的时间才能提供解决方案，而ATM不到一天的时间，就可以搭建一个性能较好的模型。

密歇根州立大学计算机科学与工程系教授阿伦·罗斯（Arun Ross）和该论文的一位资深作者告诉记者，ATM可以为数据科学家的工作锦上添花，让他们更安心地选择正确的模型。

罗斯告诉记者：“选择实在太多了。如果一位数据科学家选择支持向量机作为建模技术，他可能会想，是否选一个神经网络就能获得更好的准确性？这个问题总是挥之不去。”

ATM通过并行测试成千上万个模型、评估每一个模型以及将更多的计算资源分配给最适合某一问题的模型，来搜索技术。然后，系统显示分布结果，方便研究人员比较不同的方法。

罗斯表示，ATM并不是想要将人类自动化。

研究人员指出，通过自动化精简模型选择过程，数据科学家可以研究更复杂的问题部分。“我们希望我们的系统能让专家们腾出更多的时间用于数据理解、问题制定和特征工程。”麻省理工学院信息与决策系统实验室首席研究科学家Kalyan Veeramachaneni说。

ATM目前作为一种开放源码平台可供企业使用。它可以运行在单个计算机、本地计算集群或云中的按需集群上，并且可以同时处理多个数据集和多个用户需求。

“中小型数据科学团队只需几步就可以建立并生成模型。”Veeramachaneni说。

来源：TechRepublic

作者：Alison DeNisco Rayome

智能观编

—完—

想知道AI加教育领域有哪些最新研究成果？

想要AI领域更多的干货？

想了解更多专家的“智能观”？

请在对话界面点击“找找看”，去获取你想要的内容吧。

声明：

编译文章旨在帮助读者了解行业新思想、新观点及新动态，为原作者观点，不代表智能观观点。