16. 对抗性提示词

2024-02-04  本文已影响0人  求知笔记

对抗性提示词

对抗性提示词允许模型生成抵抗某些类型的攻击或偏见的文本
这种技术可用于训练更为稳健和抵抗某些类型攻击或偏见的模型。

要在ChatGPT中使用对抗性提示,

示例:

示例1:用于文本分类的对抗性
提示任务:生成被分类为特定标签的文本
说明:生成的文本应难以分类为特定标签
提示公式:“生成难以分类为[插入标签]的文本“

上一篇 下一篇

猜你喜欢

热点阅读