Stratified K-Fold

2020-11-20  本文已影响0人  数科每日

Stratified K-fold 是 K-fold 的一个变体, 用于比例严重失调的的样本。 Stratified k-fold 可以保证每次抽取的样本中,包含各个类型的样本比例一致。 比如:

要训练一个模型,根据一组指标预测病人是否患有某种疾病。 但是在样本中, 患病的比例只有 5%, 也就是说有
95% 的 Negateive 而只有 5% 的 Positive。 这时如果用 Stratified k-fold , 就可以保证每次抽取的样本中, 都有大约5%的Positive样本。 否则, 因为Positive比例太小, 很容易造成每次抽取中包含的阳性样本比例波动过大。

上一篇 下一篇

猜你喜欢

热点阅读