机器学习模型的性能评估方法

2023-03-19  本文已影响0人  数据科学工厂

动动发财的小手,点个赞吧!

部署模型后,监控其性能对于确保 ML 系统的质量起着至关重要的作用。要计算准确度、精确度、召回率或 f1 分数等指标,需要标签。但是,在许多情况下,标签可能不可用、部分可用或延迟提供。在这些情况下,估计模型性能的能力会很有帮助。

在这篇文章中,将讨论在没有真实数据的情况下估计性能的可能方法。

1. NannyML

NannyML 是一个 Python 包,用于检测静默模型故障、估计没有标记数据的部署后性能以及检测数据漂移。目前,NannyML 有两种性能估计方法:Confidence-based Performance Estimation (CBPE) 和 Direct Loss Estimation (DLE)。

2. 基于置信度的性能估计

顾名思义,此方法利用模型预测的置信度分数来执行性能估计。

3. 直接损失估算

这种方法背后的直觉是训练一个额外的 ML 模型,其任务是估计监控模型的损失。额外的模型称为 Nanny 模型,而受监控的模型是 Child 模型。

本文由mdnice多平台发布

上一篇下一篇

猜你喜欢

热点阅读