2018-11-09 会议
2018-11-13 本文已影响0人
雨见青城
-
预测区间(Prediction Interval):
给定一个概率,确定预测区间
。该区间有
的概率包含真实值
。预测区间可以反映预测值是否可靠,预测区间越大,该预测值越不可信。
-
计算预测区间有两种方式:
- Conformal Prediction
- Quantile RF
-
Conformal Prediction
-
Assumption: 数据是iid
-
用于衡量预测是否可信,主要利用NonConformity Measure, 简称
-
为计算
, 构建了两个学习器:
-
. 拟合
之间的关系,用
来表示;
-
. 拟合
之间的关系,用于预测给定测试点
的误差,的用
表示。
-
-
其算法步骤如下:
-
从数据集
中,构建训练集
, 校准集
(RF中可用oob instance代替)。
-
用于训练上述提到的
和
-
用于计算
。对于校准集
中的第
个测试点
(
), 计算其NonConformity Score, 如下:
其中,,
。计算每个值,并按照降序排列,从而得到Set
-
给定一个significance level
, 利用某公式确定
。
-
对于新来的测试点
(
), 用
预测得到其
,该测试点的预测区间为:
-
-