机器学习机器学习与模式识别机器学习

[自翻译][机器学习]机器学习的快乐(与随之的繁重工作)

2015-09-19  本文已影响172人  Propiram

本文首次发表于译言网,翻译自Technet.com,为[机器学习]系列文章之一。
发表地址:http://article.yeeyan.org/view/243697/442207

这篇博客文章由Joseph Sirosh所撰写。

很少有人能够重视机器学习技术(ML)在企业级应用中的巨大潜力。我有幸能够在我第一份工作的仅仅几个月之中,便尝到它潜在益处中的甜头。那是1995年,信用卡发卡机构已经开始采用神经网络模型,来实时监测信用卡欺诈活动。当一个信用卡被使用时,来自销售系统的交易数据会被发送至发卡银行的授权系统当中,在这里神经网络系统对欺诈可能性的概率进行评分。如果概率评分较高,该项交易将会被当场拒绝。我当时是从事建立这种模型的科学家,我的第一个模型交付给了南美的一家银行机构。当这个模型调度后,仅仅在第一天,银行便识别了超过一百万美元的欺诈行为,然而在这之前从未被监察出来。这是一个让人大开眼界的事物。这些年来,我目睹在诸如需求预测、故障和异常检测、广告投放、线上推荐和Cortana虚拟助理这些各种各样的应用中,机器学习技术所带来的巨大价值。通过将机器学习技术嵌入至企业系统中,各机构可以提升客户体验,降低系统性失灵的风险,增加收益并使成本显著的节约。

然而,建立机器学习系统是缓慢、耗时、易错配的一件事。即使我们现在能够分析非常庞大的数据集,并将其调度于非常高的事务处理速率上,仍有几个瓶颈存在:

数据科学家们进行机器学习的实验时,通过编写定制程序和重复无差别的繁重体力活来绕过这些工作限制。但在调度阶段,这会变得更加艰难。在诸如实时欺诈预防或广告投放这样作为关键任务的业务过程中,调度机器学习模型便要求其为复杂精密的工程:

如上这些步骤均耗时且工程量大集中。在基础设施建设和人力双方面都花销不菲。一个机器学习应用的端到端的工程和产品维护,要求一个技能高超的团队,以至于极少能有组织机构可以将其建立和维持。

微软Azure ML(Azure机器学习技术)便是为解决这些问题而设计的:

Azure ML也能够使在云端创建一定规模的产品调度更为简单。预训的机器学习模型能被纳入一个评分工作流之中,并且通过几次单击,便能创建一个新云托管的REST API(含状态传输接口)。这个REST API为响应低延迟而设计。它无需重新实现或移植——一个胜过传统数据分析软件的主要强项。数据来自互联网的各个地方——笔记本电脑、网站、移动设备、可穿戴设备和可连接的各种机器——都能被发送到新建的API(应用程序接口)以返回预测。例如,一个数据科学家能够创建一个监测欺诈的API接口,此接口会将输入交易信息,然后返回输出一个低/中/高风险指标。这样的API接口将“生活”在云端,随时准备着接受来自开发者所选择调用的任何软件。API后端弹性地扩展,这样在事务处理速率飙升时,Azure ML服务便能自动处理负载。事实上,一个数据科学家能够创建和配置的机器学习接口是没有数量限制的——并且完全不依赖于任何工程。对IT和工程而言,使用那些REST API接口来集成一个新机器学习模型变得简单,并且在调度之前来测试并行的多个模型也变得容易,从而在低开销上显著地取得更好的敏捷度。在衡量包括可用性、延迟度和性能这些机制的生产过程中,Azure提供了API接口扩展和管理机制。因此,建立健壮、可用性高、可靠的机器学习系统,并管理其生产调度,对企业而言,是显著地更快、更便宜和更容易的,并伴随着巨大商业利益。

我们相信Azure ML是游戏规则变革者。它使创业公司和大型企业都能获取到机器学习的难以置信的潜力。以前只有最复杂的业务才能获得的功能,创业公司现在就能够同样地使用。更大的企业能够释放在他们大数据中的潜在价值,以大幅度地提高收入和效率。尤其是现在可能实现的迭代和实验速度,将会为快速创新留出余地,为我们周围智能云的互联设备铺平道路。

当我在1995年开始我的职业生涯,需要一个大规模组织来建立和调度信用卡欺诈监测系统。运用像Azure ML这样的工具和借助云计算的力量,一个富有才能的数据科学家凭一己之力便能实现这般壮举。

Joseph
注:本文由微软研究院提供,授权译言进行翻译,非商业转载请注明译者、来源,未经许可不得商业使用。

上一篇下一篇

猜你喜欢

热点阅读