预测性维护怎么玩之科普篇

2018-08-14 本文已影响0人 FrankZ2016

引言

预测性维护可以算是智能制造中比较火的应用场景了，其中涉及了以机器学习为核心的众多先进技术。在这里做个科普讲座，希望通过本文能够帮助大家了解设备预测性维护的总体过程和原理。

什么是预测性维护

首先看一下设备维护的四种方式，如下图:

设备维护的发展阶段

在这里，我们所要讨论的预测性维护指的是利用设备运行的状态信息、环境信息等各种数据，主要基于数理统计模型，对故障进行预测。

预测性维护的重要意义在于避免过度维修，节约设备维护成本。

预测性维护的实施步骤

前提条件

要有一定的数据积累。

这里所说的数据积累包括两个方面：数据的种类和数量。

在种类方面，至少要有两类数据才能够进行预测模型的建立和训练，即故障数据以及设备运行的状态数据。在建立和训练模型的过程中，前者是模型的输出，后者是模型的输入。

在数量方面，究竟多少的数据量是足够的呢？

答案可能会让大家失望——在没有建立和测试任何模型之前，是没办法确定最终需要多少数据的，而且在这个阶段几乎也没有太多简单的经验规则可以参考。

因此，对于数据量来说，只能是多多益善。并且，我们能够确定的是，某些数据是需要尽可能多的数据量，比如，设备的故障数据、在设备发生故障之前的一定时间窗口内的设备状态数据（电压、电流、振动等等）。

不同的预测结果及建模方法

预测的结果可以分为以下两种：

离散型的预测结果，即结果为一系列有限的值之一，比如“是”或“否”。例如，在未来的一定时期内，设备是否会发生故障。这里将采用分类模型进行建模。
连续型的预测结果，即结果为一个数值。例如，设备会在未来的什么时间点发生故障，或者说，设备剩余有效使用寿命是多少。这里将采用回归模型进行建模。

相比于回归模型，分类模型虽然给出的预测结果相对简单，只有“是”或“否”，但是所需的数据量也要少一些。

模型的评价指标

对于回归模型，可以采用均方根误差Root Mean Squared Error作为评价指标：

均方根误差

对于分类模型，可以采用准确率(accuracy)，召回率（recall）等作为评价指标，大家可自行百度一下具体定义。

注：准确率描述的是如果这个模型总共做了N次的预测，那么共预测对了多少次，召回率描述的是在实际发生的N次故障中，该模型共预测对了多少次。当然，这两个指标最后都是用比率来显示的。

预测性维护建模的过程

预测性维护的建模过程与一般的预测分析是一样的。

假设我们已经搜集到了一定量的历史数据，包括故障数据以及设备运行状态的数据。下面以回归模型为例，对预测模型的建模步骤进行简要介绍。当然，这部分核心工作就需要我们的数据科学家登场了。

在实际应用的过程中，下图中虚线框中的几个环节会迭代进行，直到获得符合期望目标的预测模型。

建模过程

1 选取模型

数据科学家首先会使用各种算法模型进行尝试，对我们已有的数据进行拟合。在这个阶段，一般会先从简单的模型开始尝试，比如线性模型等，并以此作为与其他模型比较的基线。

这里需要注意的是，“选取模型”、“数据预处理”、“特征工程”、“超参数优化”这四个步骤并不是瀑布式进行的，而是迭代进行的，最初选定的模型也有可能在后期发生改变。

2 数据预处理

这部分工作的目的是，将原始数据转换成模型输入所需要的数据格式，包括对各类数据的度量单位的统一，或一些明显有问题的数据的排除等等。当然，有些预处理工作也可以在模型选择之间进行，比如对误差数据的排除。

3 特征工程

如果我们把模型简单理解为一个函数表达方式y=f(x1、x2、x3.....)的话，那么，特征就是其中的自变量x1，x2......。

特征工程可以理解为对模型输入变量进行处理的过程。这个处理的过程分为两种：

一种是增加特征，也就是在原有的原始变量的基础上，再应用各种方式生成新的自变量，比如x1和x2的平均值。但是，需要注意的是，生成的新的变量一定是在预测性维护的场景中有实际意义的。这就需要相关业务知识做基础了。

另一种是减少特征。例如，应用设备方面的知识，在众多的输入变量中选择出与预测结果有密切关系的自变量。

4 超参数优化

超参数的优化就是对我们所选取的模型的一些参数进行优化，使模型的预测性能指标更精确。

如果说特征工程是对自变量x所做的工作，那么超参数优化就是对函数f做的工作——调整f的各种参数。

5 模型评估

在根据历史数据建立好模型以后，我们需要对该模型进行评估，也就是用另外一些在建模过程中没有使用过的数据进行模型测试，看看预测的效果到底怎么样。这部分测试模型的数据是一般在建立和训练模型之前，从历史数据中划分出的一部分数据，通常叫做测试集数据。

6 模型部署

模型建立好之后需要部署到实际的生产系统中运行，不断地接收从设备层采集到的数据，进行预测分析。

模型的部署涉及到了工业现场的数据采集、企业服务总线等技术。

预测性维护（predictive maintanence）与基于状态维护（condition-based maintenance）的关系

可以将二者相结合，共同发挥作用。

“预测性维护”是基于数理模型的，完全是从数据出发建立模型。而“基于状态维护”是基于设备机理模型的，依靠的是对相关领域知识的理解。因此，两者充分结合，往往能够发挥更好的效果。例如，在特征工程中，往往会利用机理模型，也就是设备的领域知识来产生有实际意义的新特征，加快模型建立与训练的过程。

目前做预测性维护的困难

最大的困难是工业现场数据的缺乏。

建立及训练预测性维护的模型至少需要两类历史数据——故障数据（即计划外停机的数据）以及设备运行状态数据（例如电压、电流之类）。并且这两类数据的数量要足够大，这样训练出的模型才更为准确。

但是很多设备的停机故障发生概率很低，可能一年也没几次，因此，这类数据的收集就需要很长时间。

此外，很多工业现场并没有完善的设备数据采集系统，或者即使有一些SCADA之类的系统，也更多是完成实时状态监控，对于设备运行的状态数据，只保存了很短的时间（如3个月），缺乏设备数据的长期保存。

参考资料

本文参考了书籍《预测分析：R语言实现》，以及一篇文章《Machine Learning Techniques for Predictive Maintenance》。

欢迎转载，转载请注明出处。

如果想获得更多关于智能制造以及物联网方面的文章，关注我的公众号“聊聊智能制造那些事”，查看历史消息即可。