MAPIE项目中的ConformalizedQuantileRegressor对称性校正参数解析-CSDN博客

本文链接：https://blog.csdn.net/gitblog_00599/article/details/149014471

MAPIE项目中的ConformalizedQuantileRegressor对称性校正参数解析

引言

在机器学习回归任务中，预测区间(Prediction Intervals)的构建对于量化预测不确定性至关重要。MAPIE(MAPIE: Model Agnostic Prediction Interval Estimator)是一个强大的Python库，它提供了多种方法来构建可靠的预测区间。本文将重点介绍其中的ConformalizedQuantileRegressor(符合分位数回归)及其symmetric_correction参数的作用。

什么是ConformalizedQuantileRegressor

ConformalizedQuantileRegressor是MAPIE中一个重要的回归类，它结合了分位数回归和符合预测(Conformal Prediction)的优点。这种组合方法能够：

适应数据的异方差性(heteroscedasticity)
提供理论保证的覆盖概率
产生更精确的预测区间

symmetric_correction参数详解

symmetric_correction是ConformalizedQuantileRegressor.predict_interval方法中的一个关键参数，它决定了如何计算预测区间：

True(对称校正): 使用相同的残差集合来校正上下界
False(非对称校正): 分别使用不同的残差集合来校正上下界

对称校正的特点

计算效率高
适用于误差分布对称的情况
区间宽度在预测值两侧相同

非对称校正的特点

能更好地捕捉数据中的异方差性
上下界可以有不同的宽度
更灵活地适应真实数据分布

实例分析

我们通过一个合成数据集来展示这两种方法的差异：

# 数据准备
X, y = make_regression(n_samples=1000, n_features=1, noise=20, random_state=1)
X_train, X_conformalize, X_test, y_train, y_conformalize, y_test = train_conformalize_test_split(...)

# 模型初始化
gb_reg = GradientBoostingRegressor(loss="quantile", alpha=0.5)
mapie_qr = ConformalizedQuantileRegressor(estimator=gb_reg, confidence_level=0.8)

# 预测区间计算
y_pred_sym, y_pis_sym = mapie_qr.predict_interval(X_test, symmetric_correction=True)
y_pred_asym, y_pis_asym = mapie_qr.predict_interval(X_test, symmetric_correction=False)