load_forecastingdata#

load_forecastingdata(name, replace_missing_vals='NAN', value_column_name='series_value', return_type='default_tsf', extract_path=None)[source]#

从 Monash 时间序列预测档案库获取预测数据集。

如果数据集尚未下载,则下载并解压。获取的数据集采用标准 .tsf 格式。有关详细信息,请参阅 https://forecastingdata.org/

参数:
name: str

数据集名称。如果提供了 tsf_all_dataset 中列出的数据集,此函数将首先在 extract_path 中查找,如果不存在,则尝试从 https://forecastingdata.org/ 下载数据,并将其保存到 extract_path。

replace_missing_vals: str, 默认值=”NAN”

一个术语,用于指示返回的 DataFrame 中序列中的缺失值。

value_column_name: str, 默认值=”series_value”

用于指定返回的 DataFrame 中包含序列值的列名的任何首选名称。

return_typestr - “pd_multiindex_hier”, “default_tsf” (默认), 或有效的 sktime

用于指定返回类型的内存数据容器格式的 mtype 字符串:- “pd_multiindex_hier” = sktime 类型为 pd_multiindex_hier 的 pd.DataFrame - “default_tsf” = 忠实反映原始 tsf 格式的容器

实现位于:rakshitha123/TSForecasting blob/master/utils/data_loader.py。

  • 其他有效的 mtype 字符串是 datatypes.MTYPE_REGISTER 中的 Panel 或 Hierarchical mtypes

    datatypes.MTYPE_REGISTER。如果给定了 Panel 或 Hierarchical mtype 字符串,将尝试转换为该 mtype

有关教程和详细规范,请参阅 examples/AA_datatypes_and_datasets.ipynb

extract_pathstr, 可选 (默认=None)

查找数据的路径。如果未提供路径,函数将在 sktime/datasets/data/ 中查找。如果提供了路径,它可以是绝对路径,例如 C:/Temp 或相对路径,例如 Temp 或 ./Temp。

返回:
loaded_data: pd.DataFrame

包含时间序列的转换后的 DataFrame。

metadata: dict

预测问题的元数据。字典键为:“frequency”, “forecast_horizon”, “contain_missing_values”, “contain_equal_length”