mean_linex_error#

mean_linex_error(y_true, y_pred, a=1.0, b=1.0, horizon_weight=None, multioutput='uniform_average', **kwargs)[source]#

计算平均 Linex 误差。

输出为非负浮点数。最佳值为 0.0。

许多预测损失函数（如 [R604c24f92071-1] 中讨论的那些）假定高估和低估应该受到同等惩罚。然而，这可能与预测使用者面临的实际成本不符。当低估和高估的成本不同时，非对称损失函数非常有用。

Linex 误差函数通过对阈值一侧的误差施加近似线性的惩罚，而对另一侧的误差施加近似指数的惩罚，来解释这种情况。

参数:

y_truepd.Series, pd.DataFrame 或 np.array，形状为 (fh,) 或 (fh, n_outputs)，其中 fh 是预测范围: 真实（正确）目标值。
y_predpd.Series, pd.DataFrame 或 np.array，形状为 (fh,) 或 (fh, n_outputs)，其中 fh 是预测范围: 预测值。
aint 或 float: 控制高估或低估是受到近似线性还是指数惩罚。如果 a > 0，则负误差（高估）受到近似线性惩罚，正误差（低估）受到近似指数惩罚。如果 a < 0，则反之。
bint 或 float: 应用于计算误差的乘法惩罚。
horizon_weightarray-like，形状为 (fh,)，默认为 None: 预测范围权重。
multioutput{'raw_values', 'uniform_average'} 或 array-like，形状为 (n_outputs,)，默认为 'uniform_average': 定义如何聚合多变量（多输出）数据的指标。如果是 array-like，则值用作平均误差的权重。如果是 'raw_values'，则对于多输出输入返回完整的误差集。如果是 'uniform_average'，则所有输出的误差按均匀权重进行平均。

返回:

asymmetric_lossfloat: 对误差施加非对称惩罚的损失。如果 multioutput 是 'raw_values'，则为每个输出分别返回非对称损失。如果 multioutput 是 'uniform_average' 或权重 ndarray，则返回所有输出误差的加权平均非对称损失。

另见

mean_asymmetric_error

说明

根据 [2]_ 中的公式计算为 b * (np.exp(a * error) - a * error - 1)，其中 a != 0 且 b > 0。

参考文献

[1]

Hyndman, R. J and Koehler, A. B. (2006). “Another look at measures of forecast accuracy”, International Journal of Forecasting, Volume 22, Issue 4.

[1]

Diebold, Francis X. (2007). “Elements of Forecasting (4th ed.)”, Thomson, South-Western: Ohio, US.

示例

>>> import numpy as np
>>> from sktime.performance_metrics.forecasting import mean_linex_error
>>> y_true = np.array([3, -0.5, 2, 7, 2])
>>> y_pred = np.array([2.5, 0.0, 2, 8, 1.25])
>>> mean_linex_error(y_true, y_pred)  
0.19802627763937575
>>> mean_linex_error(y_true, y_pred, b=2)  
0.3960525552787515
>>> mean_linex_error(y_true, y_pred, a=-1)  
0.2391800623225643
>>> y_true = np.array([[0.5, 1], [-1, 1], [7, -6]])
>>> y_pred = np.array([[0, 2], [-1, 2], [8, -5]])
>>> mean_linex_error(y_true, y_pred)  
0.2700398392309829
>>> mean_linex_error(y_true, y_pred, a=-1)  
0.49660966225813563
>>> mean_linex_error(y_true, y_pred, multioutput='raw_values')  
array([0.17220024, 0.36787944])
>>> mean_linex_error(y_true, y_pred, multioutput=[0.3, 0.7])  
0.30917568000716666