机器学习如何赚钱?- 垂直领域/横向领域应用的商业数据模型
今天介绍从两个角度来介绍机器学习的商业领域的产品应用:
- 横向领域:在不同类型的业务中执行的操作。即涉及营销的一切。
- 垂直领域:在企业内部或供应链或流程中所做的事情。
---
横向应用
几乎每家公司都必须尝试向客户销售更多产品,因此营销很重要。因此,下图每个框都是人们在市场营销中使用机器学习的一些例子:
我们举个例子 - Churn,是公司流失预测,是预测谁将要离开的公司模型。比如一些电信公司试图找出在一家大型手机公司中哪些客户将要离开。这个结论的意义已经不大了,比如说模型结果说杰瑞几乎肯定会在下个月离开,这个结果并不是一个决策建议,因为如果这个人几乎肯定要离开离开,那么公司 HR 就可能没有什么可以做的 - 这个结果发现就已经太晚了。
因此,为了构建一个更好的模型(尤其是商业模型),这里介绍一个有用的小框架。在其中,描述了如何将机器学习模型变成赚钱的东西的经验。分为以下四个步骤:
定义目标
实际上将机器学习项目变成实际有用的东西的出发点是知道,我想要实现什么,这不是那种在ROC曲线下实现高区域或者试图在类之间作区分的目标。而是,例如出售更多书籍的目标,或者我正在努力减少下个月离开的客户数量目标,或者我正在尝试更早地发现肺癌的目标。因此,目标绝对是公司或组织实际想要的东西。没有任何公司或组织由于没有明确的目标,所以无法创建更准确的预测模型。目标是最重要的事情。如果你不知道你建模需要完成的目标,那么你就不可能做得好。
杠杆工具
杠杆工具是公司可以做的事情,而这些事情可以实现目标。让我们以流失人员建模为例。公司可以使用什么杠杆工具来减少离开的客户数量?他们可以打电话给某人并说:“你快乐吗?我们能做什么?“如果他们下个月购买价值20美元的产品,他们可以免费得到附赠的一支笔。或者,公司可以给他们特价。所以这些都是杠杆工具。每当数据科学家工作时,不断回头思考我们想要实现的目标(我们是公司)以及我们如何努力实现,“我们可以做些什么才能实现这一目标“。因此,建立一个模型绝不是一个杠杆工具,但它可以帮助你挑选杠杆工具。
数据
那么接下来的步骤就是,哪些数据可能有助于他们设定实现该目标以及杠杆工具。所以这不是他们在你启动项目时给你的数据。但从第一原则的角度考虑一下 - 我们可用的数据,无论数据库中的数据是什么,我们实际可以使用的数据经常存在约束。因此,我们需要知道我想要实现的目标,该公司实际上可以做些什么来改变结果,以及在做出决策时,他们拥有或可以收集哪些数据。
模型
那么我把它们放在一起的方式就是模型。这不是预测模型意义上的模型,而是仿真模型。因此,我在本文中提出的一个主要例子是,当我花了很多年时间建造一个保险公司改变其价格的时候,这对他们的盈利能力有何影响。因此,通常仿真模型包含许多预测模型。例如,我有一个称为弹性模型的预测模型,该模型针对特定客户说,如果我们向特定产品收取特定价格,那么他们在新业务和一年后都会愿意继续付费的概率是多少(他们续约的概率是多少)。然后还有另一个预测模型,即他们要提出索赔的概率是多少,以及该索赔要多少。然后你可以将这些模型组合在一起,然后预测,如果我们通过将每个人减少10%来改变我们的定价,我们可以通过这些模型运行它,将它们组合成一个模拟然后对我们的整体影响。 10年时间的市场份额是X,我们的成本是Y,我们的利润是Z等等。
垂直领域应用
除了这些基本适用于每家公司的横向应用程序外,还有一大堆专门针对世界各地的应用程序。对于那些最终从事医疗保健的人来说,你们中的一些人将成为这些领域中的一个或多个领域的专家。像再入院风险一样。那么这名患者回到医院的概率是多少。根据管辖区的详细信息,当重新接纳某人时,它可能是医院的灾难。如果您发现该患者再入院的可能性很高,您会怎么做?
同样,预测模型本身也很有用。它建议我们不要把它们送回家,因为它们会回来。但是,如果我们通过模型解释了解其中某些分析特征对结果影响很大,就能解释并且告诉我们他们处于高风险的原因是因为我们没有他们在入院之后作心电图(EKG)。如果没有作EKG,这个病人就很可能继续返回医院,那么我们最好给他作一个心电图。所以这是解释和预测准确性之间的相互作用。
最后给一张商业数据应用全景图。