mean_linex_error#

mean_linex_error(y_true, y_pred, a=1.0, b=1.0, horizon_weight=None, multioutput='uniform_average', **kwargs)[source]#

计算平均 Linex 误差。

输出为非负浮点数。最佳值为 0.0。

许多预测损失函数(如 [R604c24f92071-1] 中讨论的那些)假定高估和低估应该受到同等惩罚。然而,这可能与预测使用者面临的实际成本不符。当低估和高估的成本不同时,非对称损失函数非常有用。

Linex 误差函数通过对阈值一侧的误差施加近似线性的惩罚,而对另一侧的误差施加近似指数的惩罚,来解释这种情况。

参数:
y_truepd.Series, pd.DataFrame 或 np.array,形状为 (fh,) 或 (fh, n_outputs),其中 fh 是预测范围

真实(正确)目标值。

y_predpd.Series, pd.DataFrame 或 np.array,形状为 (fh,) 或 (fh, n_outputs),其中 fh 是预测范围

预测值。

aint 或 float

控制高估或低估是受到近似线性还是指数惩罚。如果 a > 0,则负误差(高估)受到近似线性惩罚,正误差(低估)受到近似指数惩罚。如果 a < 0,则反之。

bint 或 float

应用于计算误差的乘法惩罚。

horizon_weightarray-like,形状为 (fh,),默认为 None

预测范围权重。

multioutput{'raw_values', 'uniform_average'} 或 array-like,形状为 (n_outputs,),默认为 'uniform_average'

定义如何聚合多变量(多输出)数据的指标。如果是 array-like,则值用作平均误差的权重。如果是 'raw_values',则对于多输出输入返回完整的误差集。如果是 'uniform_average',则所有输出的误差按均匀权重进行平均。

返回:
asymmetric_lossfloat

对误差施加非对称惩罚的损失。如果 multioutput 是 'raw_values',则为每个输出分别返回非对称损失。如果 multioutput 是 'uniform_average' 或权重 ndarray,则返回所有输出误差的加权平均非对称损失。

说明

根据 [2]_ 中的公式计算为 b * (np.exp(a * error) - a * error - 1),其中 a != 0 且 b > 0。

参考文献

[1]

Hyndman, R. J and Koehler, A. B. (2006). “Another look at measures of forecast accuracy”, International Journal of Forecasting, Volume 22, Issue 4.

[1]

Diebold, Francis X. (2007). “Elements of Forecasting (4th ed.)”, Thomson, South-Western: Ohio, US.

示例

>>> import numpy as np
>>> from sktime.performance_metrics.forecasting import mean_linex_error
>>> y_true = np.array([3, -0.5, 2, 7, 2])
>>> y_pred = np.array([2.5, 0.0, 2, 8, 1.25])
>>> mean_linex_error(y_true, y_pred)  
0.19802627763937575
>>> mean_linex_error(y_true, y_pred, b=2)  
0.3960525552787515
>>> mean_linex_error(y_true, y_pred, a=-1)  
0.2391800623225643
>>> y_true = np.array([[0.5, 1], [-1, 1], [7, -6]])
>>> y_pred = np.array([[0, 2], [-1, 2], [8, -5]])
>>> mean_linex_error(y_true, y_pred)  
0.2700398392309829
>>> mean_linex_error(y_true, y_pred, a=-1)  
0.49660966225813563
>>> mean_linex_error(y_true, y_pred, multioutput='raw_values')  
array([0.17220024, 0.36787944])
>>> mean_linex_error(y_true, y_pred, multioutput=[0.3, 0.7])  
0.30917568000716666