median_squared_scaled_error#

median_squared_scaled_error(y_true, y_pred, sp=1, horizon_weight=None, multioutput='uniform_average', square_root=False, **kwargs)[source]#

中位数平方缩放误差 (MdSSE) 或均方根中位数平方缩放误差 (RMdSSE)。

如果 square_root 为 False，则计算 MdSSE，否则如果 square_root 为 True，则计算 RMdSSE。MdSSE 和 RMdSSE 的输出都是非负浮点数。最佳值为 0.0。

这是 MdASE 损失指标的平方变体。与 MASE 和其他缩放性能指标一样，这个无标度指标可用于比较单个时间序列之间或不同时间序列之间的预测方法。

该指标也适用于间歇性需求时间序列，因为它不会给出无限或未定义的值，除非训练数据是平坦时间序列。在这种情况下，函数返回一个大值而不是 inf。

适用于具有同质季节周期的多输出（多元）时间序列数据。

参数:

y_truepd.Series, pd.DataFrame 或形状为 (fh,) 或 (fh, n_outputs) 的 np.array，其中 fh 是预测范围: 真实（正确）目标值。
y_predpd.Series, pd.DataFrame 或形状为 (fh,) 或 (fh, n_outputs) 的 np.array，其中 fh 是预测范围: 预测值。
y_trainpd.Series, pd.DataFrame 或形状为 (n_timepoints,) 或 (n_timepoints, n_outputs) 的 np.array，其中 n_timepoints 是时间点数量，default = None: 观察到的训练值。
spint: 训练数据的季节周期性。
horizon_weight形状为 (fh,) 的 array-like，default=None: 预测范围权重。
multioutput{‘raw_values’, ‘uniform_average’} 或形状为 (n_outputs,) 的 array-like，default=’uniform_average’: 定义如何聚合多元（多输出）数据的指标。如果为 array-like，则使用这些值作为权重来平均误差。如果为 ‘raw_values’，则在多输出输入的情况下返回完整的误差集。如果为 ‘uniform_average’，则所有输出的误差以统一权重进行平均。

返回值:

lossfloat: RMdSSE 损失。如果 multioutput 为 ‘raw_values’，则为每个输出单独返回 RMdSSE。如果 multioutput 为 ‘uniform_average’ 或一个权重的 ndarray，则返回所有输出误差的加权平均 RMdSSE。

另请参阅

mean_absolute_scaled_error
median_absolute_scaled_error
mean_squared_scaled_error

参考文献

M5 竞赛指南。

https://mofc.unic.ac.cy/wp-content/uploads/2020/03/M5-Competitors-Guide-Final-10-March-2020.docx

Hyndman, R. J and Koehler, A. B. (2006). “Another look at measures of forecast accuracy”, International Journal of Forecasting, Volume 22, Issue 4.

示例

>>> import numpy as np
>>> from sktime.performance_metrics.forecasting import median_squared_scaled_error
>>> y_train = np.array([5, 0.5, 4, 6, 3, 5, 2])
>>> y_true = np.array([3, -0.5, 2, 7, 2])
>>> y_pred = np.array([2.5, 0.0, 2, 8, 1.25])
>>> median_squared_scaled_error(y_true, y_pred, y_train=y_train, square_root=True)
0.16666666666666666
>>> y_train = np.array([[0.5, 1], [-1, 1], [7, -6]])
>>> y_true = np.array([[0.5, 1], [-1, 1], [7, -6]])
>>> y_pred = np.array([[0, 2], [-1, 2], [8, -5]])
>>> median_squared_scaled_error(y_true, y_pred, y_train=y_train, square_root=True)
0.1472819539849714
>>> median_squared_scaled_error(y_true, y_pred, y_train=y_train,     multioutput='raw_values', square_root=True)
array([0.08687445, 0.20203051])
>>> median_squared_scaled_error(y_true, y_pred, y_train=y_train,     multioutput=[0.3, 0.7], square_root=True)
0.16914781383660782