大模型测试

2024-01-01  本文已影响0人  Jeff_9021

一、性能指标

对于大模型,特别是深度学习模型,需要关注其在硬件资源上的消耗,如内存、计算资源等。

稳健性测试:大模型可能对输入中的小变化非常敏感,因此需要进行对抗性测试,以验证模型在面对恶意输入或轻微扰动时的稳健性。

Performance Testing

确定性能指标

设计一套测试集,评估模型的整体性能指标

        样本数量

          样本多样性

关注响应性能

          回答过程的出字率

          回答完问题的响应时间

          测试系统在并发负载下的性能,确保在高负载时也能正常运行

维护测试集,建立性能基线数据

            使用标准数据集测试,测试模型的准确度

            要基于对Adapter层的认知、以及用户应用场景,构建测试集

            使用了什么算法

            什么样的推理规则

            如何构建提示词

            如何修正LLM的输出

上一篇 下一篇

猜你喜欢

热点阅读