19、如何使用机器学习结果

2019-02-23 本文已影响22人攻城狮笔记

一旦找到并调整了问题的可行模型，就可以使用该模型了。您可能需要重新审视自己的原因并提醒自己，您需要针对所解决问题的解决方案。

在对结果执行某些操作之前，不会解决此问题。在这篇文章中，您将学习在将原型模型转换为生产系统时回答问题和考虑因素的结果。

结果介绍
照片归属于Phil Sexton，保留了一些权利

根据您要解决的问题类型，结果的呈现方式会有很大差异。利用机器学习成果的结果有两个主要方面：

报告结果

一旦你发现了一个好的模型和一个足够好的结果（或者不是，视情况而定），你将需要总结所学的内容并将其呈现给利益相关者。这可能是您自己，客户或您工作的公司。

使用powerpoint模板并解决下面列出的部分。您可能希望编写一个分页器并将部分部分用作部分标题。即使在您为自己做的小型实验项目（例如教程和比赛）上也要尝试遵循此过程。很容易在项目上花费过多的时间，并且您希望确保捕获您沿途学到的所有伟大的事物。

以下是报告项目结果时可以完成的部分。

您要呈现的受众类型将定义您要详细说明的详细信息量。通过结果报告来完成项目的纪律，即使是小型项目，也会加速您在现场的学习。在这些小型项目中，我强烈建议在博客或社区上分享辅助项目的结果，并获得您可以捕获的反馈，并将其带入您下一个项目的开始。

您已经找到了一个足以解决您希望将其投入生产的问题的模型。对于有趣的项目，这可能是您工作站上的操作安装，一直到将模型集成到现有企业应用程序中。范围很广。在本节中，您将学习操作模型的三个关键方面，您可以在将系统投入生产之前仔细考虑。

您应该仔细考虑的三个方面是算法实现，模型的自动测试以及随时间跟踪模型的性能。这三个问题很可能会影响您选择的模型类型。

您可能正在使用研究库来发现表现最佳的方法。研究库中的算法实现可以很好，但它们也可以针对问题的一般情况而不是您正在使用的特定情况编写。

通过将这样的实现直接投入生产，可以非常认真地考虑您可能创建的依赖关系和技术债务。请考虑查找支持您要使用的方法的生产级库。如果此时切换到生产级别库，则可能必须重复算法调整过程。

您也可以考虑自己实施算法。此选项可能会引入风险，具体取决于您选择的算法的复杂程度以及它使用的实现技巧。即使使用开源代码，也可能存在许多复杂的操作，这些操作可能很难内化并且可靠地重现。

编写自动化测试，验证可以构建模型并重复实现最低级别的性能。还要为任何数据准备步骤编写测试。您可能希望控制每个单元测试运行的算法使用的随机性（随机数种子），以便测试100％可重复。

添加基础设施以监控模型的性能，并在精度降至最低水平以下时发出警报。跟踪可以在单独的环境中实时发生，也可以在重新创建的模型上使用实时数据样本。引发警报可以指示数据中的模型所学习的结构已经改变（概念漂移）并且可能需要更新或调整模型。

有些模型类型可以执行在线学习并自行更新。仔细考虑允许模型在生产环境中自我更新。在某些情况下，管理模型更新过程并切换模型（其内部配置）可能更明智，因为它们经过验证更具性能。

在这篇文章中，您了解到在交付结果之前，项目不会被视为完成。结果可能会呈现给您自己或您的客户，并且在呈现结果时需要遵循最低结构。

在生产环境中使用学习模型时，您还学习了三个问题，特别是算法实现的性质，模型测试和正在进行的跟踪。