load_forecastingdata
#
- load_forecastingdata(name, replace_missing_vals='NAN', value_column_name='series_value', return_type='default_tsf', extract_path=None)[source]#
从 Monash 时间序列预测档案库获取预测数据集。
如果数据集尚未下载,则下载并解压。获取的数据集采用标准 .tsf 格式。有关详细信息,请参阅 https://forecastingdata.org/。
- 参数:
- name: str
数据集名称。如果提供了 tsf_all_dataset 中列出的数据集,此函数将首先在 extract_path 中查找,如果不存在,则尝试从 https://forecastingdata.org/ 下载数据,并将其保存到 extract_path。
- replace_missing_vals: str, 默认值=”NAN”
一个术语,用于指示返回的 DataFrame 中序列中的缺失值。
- value_column_name: str, 默认值=”series_value”
用于指定返回的 DataFrame 中包含序列值的列名的任何首选名称。
- return_typestr - “pd_multiindex_hier”, “default_tsf” (默认), 或有效的 sktime
用于指定返回类型的内存数据容器格式的 mtype 字符串:- “pd_multiindex_hier” = sktime 类型为
pd_multiindex_hier
的 pd.DataFrame - “default_tsf” = 忠实反映原始 tsf 格式的容器实现位于:rakshitha123/TSForecasting blob/master/utils/data_loader.py。
- 其他有效的 mtype 字符串是 datatypes.MTYPE_REGISTER 中的 Panel 或 Hierarchical mtypes
datatypes.MTYPE_REGISTER。如果给定了 Panel 或 Hierarchical mtype 字符串,将尝试转换为该 mtype
有关教程和详细规范,请参阅 examples/AA_datatypes_and_datasets.ipynb
- extract_pathstr, 可选 (默认=None)
查找数据的路径。如果未提供路径,函数将在
sktime/datasets/data/
中查找。如果提供了路径,它可以是绝对路径,例如 C:/Temp 或相对路径,例如 Temp 或 ./Temp。
- 返回:
- loaded_data: pd.DataFrame
包含时间序列的转换后的 DataFrame。
- metadata: dict
预测问题的元数据。字典键为:“frequency”, “forecast_horizon”, “contain_missing_values”, “contain_equal_length”