主动学习
2022-11-03 本文已影响0人
可能性之兽
主动学习是指通过自动的机器学习算法,从数据集中自动挑选出部分数据请求标签,在统计上也称为查询学习或者最优实验设计。主动学习通过设计合理的查询函数,不断从未标注的数据中挑选出数据加入标注后放入训练集。有效的主动学习数据选择策略可以有效地降低训练的代价并同时提高模型的识别能力。赋予你的模型好奇心,让其有一些如何去学习的智能。
主动学习主要解决的问题是:
标注任务的成本较高
需要多少标注数据才能满足学习任务
主动学习和监督学习、半监督学习的主要区别在监督学习和半监督学习中,人们都是从数据集中随机选取一部分数据进行标注,而主动学习是通过让模型主动去探索未标注的数据,从中选出有代表性的未标注数据提交给专家,然后由专家标注完成以后再放入训练数据集中。