数据集#

datasets 模块包含

  • 数据集对象,它们是时间序列数据集的内存表示

  • 加载器,它们从互联网上的数据仓库中获取数据集,并将其作为内存中的数据集以 sktime 兼容的格式检索

  • 加载器,用于获取单个数据集,通常用于演示目的

  • 用于教学和演示目的的玩具数据生成器

  • 用于读写时间序列特定文件格式的工具

预测数据集#

Airline()

加载 airline 单变量时间序列数据集 [1]。

Longley([y_name])

加载 Longley 数据集,用于包含外生变量的预测。

Lynx()

加载 Lynx 数据集,用于单变量时间序列预测。

M5Dataset([extract_path])

https://zenodo.org/records/12636070 获取 M5 数据集。

Macroeconomic()

加载 US Macroeconomic 数据集,用于多变量时间序列预测。

ShampooSales()

加载 Shampoo Sales 数据集,用于单变量时间序列预测。

Solar([start, end, normalise, ...])

加载 GB National Solar Estimates 数据集,用于时间序列预测。

USChange()

加载 USChange 数据集,用于预测消费和收入增长率。

分类数据集#

ArrowHead([return_mtype])

ArrowHead 时间序列分类问题。

BasicMotions([return_mtype])

BasicMotions 时间序列分类问题。

GunPoint([return_mtype])

GunPoint 时间序列分类问题。

ItalyPowerDemand([return_mtype])

ItalyPowerDemand 时间序列分类问题。

JapaneseVowels([return_mtype])

JapaneseVowels 时间序列分类问题。

OSULeaf([return_mtype])

OSULeaf 时间序列分类问题。

PLAID([return_mtype])

PLAID 时间序列分类问题。

回归数据集#

Tecator()

加载 Tecator 时间序列回归问题。

加载器#

来自数据集仓库的加载器#

这些加载器访问互联网上的数据集仓库,并从其中获取一个或多个数据集,可以使用字符串指定单个数据集。

这些加载器可用于访问基准测试的参考数据集。

加载和写入数据集的函数。

load_forecastingdata(name[, ...])

从 Monash 时间序列预测存档获取预测数据集。

load_fpp3(dataset[, temp_folder])

从 fpp3 包加载数据集。

load_m5([extract_path, include_events, ...])

https://zenodo.org/records/12636070 获取 M5 数据集。

load_UCR_UEA_dataset(name[, split, ...])

从 UCR UEA 时间序列存档加载数据集。

单个数据集#

这些加载器获取一个常用的单个数据集,通常用于演示目的。

单个时间序列#

加载和写入数据集的函数。

load_airline()

加载 airline 单变量时间序列数据集 [1]。

load_longley([y_name])

加载 Longley 数据集,用于包含外生变量的预测。

load_lynx()

加载 lynx 单变量时间序列数据集,用于预测。

load_macroeconomic()

加载 US Macroeconomic 数据 [R7ccb796becb7-1]

load_shampoo_sales()

加载 shampoo sales 单变量时间序列数据集,用于预测。

load_solar([start, end, normalise, ...])

从 Sheffield Solar PV_Live API 获取英国国家太阳能估算数据。

load_uschange([y_name])

加载 MTS 数据集,用于预测个人消费和收入增长率。

时间序列面板#

加载和写入数据集的函数。

load_acsf1([split, return_X_y, return_type])

加载典型电器功耗数据集。

load_arrow_head([split, return_X_y, return_type])

加载 ArrowHead 时间序列分类问题并返回 X 和 y。

load_basic_motions([split, return_X_y, ...])

加载 BasicMotions 时间序列分类问题并返回 X 和 y。

load_gunpoint([split, return_X_y, return_type])

加载 GunPoint 时间序列分类问题并返回 X 和 y。

load_italy_power_demand([split, return_X_y, ...])

加载 ItalyPowerDemand 时间序列分类问题。

load_japanese_vowels([split, return_X_y, ...])

加载 JapaneseVowels 时间序列分类问题。

load_macroeconomic()

加载 US Macroeconomic 数据 [R7ccb796becb7-1]

load_osuleaf([split, return_X_y, return_type])

加载 OSULeaf 时间序列分类问题并返回 X 和 y。

load_tecator([split, return_X_y, ...])

加载 Tecator 时间序列回归问题并返回 X 和 y。

玩具数据生成器#

分层时间序列数据#

加载和写入数据集的函数。

load_hierarchical_sales_toydata()

返回分层销售玩具数据,用于演示分层预测。

从文件加载和写入文件#

这些工具用于从时间序列特定数据格式加载和写入数据。

注意:对于非时间序列特定格式的加载/写入,请使用常见工具,例如 pandas.read_csv

加载和写入数据集的函数。

load_from_arff_to_dataframe(...[, ...])

将数据从 .arff 文件加载到 Pandas DataFrame 中。

load_from_tsfile(full_file_path_and_name[, ...])

将时间序列 .ts 文件加载到 X 和(可选)y 中。

load_from_tsfile_to_dataframe(...[, ...])

将数据从 .ts 文件加载到 Pandas DataFrame 中。

load_from_ucr_tsv_to_dataframe(...[, ...])

将数据从 .tsv 文件加载到 Pandas DataFrame 中。

load_from_long_to_dataframe(...[, separator])

将数据从长格式文件加载到 Pandas DataFrame 中。

load_tsf_to_dataframe(full_file_path_and_name)

将 .tsf 文件中的内容转换为数据框。

write_panel_to_tsfile(data, path[, target, ...])

将 sktime 多实例数据集以 .ts 格式写入文本文件。

write_dataframe_to_tsfile(data, path[, ...])

将数据框格式的数据集输出到 .ts 文件。

write_ndarray_to_tsfile(data, path[, ...])

将 ndarray 格式的数据集输出到 .ts 文件。

write_tabular_transformation_to_arff(data, ...)

使用表格变换器变换数据集并将结果写入 arff 文件。

write_results_to_uea_format(estimator_name, ...)

以 sktime 使用的标准格式写入实验预测结果。