mean_squared_scaled_error#
- mean_squared_scaled_error(y_true, y_pred, sp=1, horizon_weight=None, multioutput='uniform_average', square_root=False, **kwargs)[source]#
平均平方比例误差 (MSSE) 或均方根比例误差 (RMSSE)。
如果
square_root
为 False,则计算 MSSE;如果square_root
为 True,则计算 RMSSE。MSSE 和 RMSSE 的输出都是非负浮点数。最佳值为 0.0。这是 MASE 损失指标的平方变体。与 MASE 和其他比例性能指标一样,这种无尺度指标可用于比较单个时间序列或不同时间序列上的预测方法。
此指标也适用于间歇性需求时间序列,因为它不会给出无限或未定义的值,除非训练数据是平坦的时间序列。在这种情况下,函数返回一个大值而不是无穷大。
适用于具有同质季节性周期性的多输出(多元)时间序列数据。
- 参数:
- y_truepd.Series, pd.DataFrame 或 np.array,形状为 (fh,) 或 (fh, n_outputs),其中 fh 是预测范围
实际(正确)目标值。
- y_predpd.Series, pd.DataFrame 或 np.array,形状为 (fh,) 或 (fh, n_outputs),其中 fh 是预测范围
预测值。
- y_trainpd.Series, pd.DataFrame 或 np.array,形状为 (n_timepoints,) 或 (n_timepoints, n_outputs),默认 = None
观察到的训练值。
- spint
训练数据的季节性周期。
- horizon_weight类 array,形状为 (fh,),默认=None
预测范围权重。
- multioutput{‘raw_values’, ‘uniform_average’} 或 类 array,形状为 (n_outputs,),默认=’uniform_average’
定义如何聚合多元(多输出)数据的指标。如果是类 array,则值用作平均误差的权重。如果是 ‘raw_values’,则在多输出输入的情况下返回完整的误差集。如果是 ‘uniform_average’,所有输出的误差以均匀权重平均。
- square_rootbool,默认=False
是否取平均平方比例误差的平方根。如果为 True,返回均方根比例误差 (RMSSE)。如果为 False,返回平均平方比例误差 (MSSE)。
- 返回:
- lossfloat
RMSSE 损失。如果 multioutput 是 ‘raw_values’,则为每个输出单独返回 MSSE 或 RMSSE。如果 multioutput 是 ‘uniform_average’ 或一个权重 ndarray,则返回所有输出误差的加权平均 MSSE 或 RMSSE。
参考文献
M5 竞赛指南。
https://mofc.unic.ac.cy/wp-content/uploads/2020/03/M5-Competitors-Guide-Final-10-March-2020.docx
Hyndman, R. J 和 Koehler, A. B. (2006)。“另一种预测准确性衡量方法”,International Journal of Forecasting,第 22 卷,第 4 期。
示例
>>> import numpy as np >>> from sktime.performance_metrics.forecasting import mean_squared_scaled_error >>> y_train = np.array([5, 0.5, 4, 6, 3, 5, 2]) >>> y_true = np.array([3, -0.5, 2, 7, 2]) >>> y_pred = np.array([2.5, 0.0, 2, 8, 1.25]) >>> mean_squared_scaled_error(y_true, y_pred, y_train=y_train, square_root=True) 0.20568833780186058 >>> y_train = np.array([[0.5, 1], [-1, 1], [7, -6]]) >>> y_true = np.array([[0.5, 1], [-1, 1], [7, -6]]) >>> y_pred = np.array([[0, 2], [-1, 2], [8, -5]]) >>> mean_squared_scaled_error(y_true, y_pred, y_train=y_train, square_root=True) 0.15679361328058636 >>> mean_squared_scaled_error(y_true, y_pred, y_train=y_train, multioutput='raw_values', square_root=True) array([0.11215443, 0.20203051]) >>> mean_squared_scaled_error(y_true, y_pred, y_train=y_train, multioutput=[0.3, 0.7], square_root=True) 0.17451891814894502