分割器#

sktime.split 模块包含用于分割和重新采样数据的算法。

可以使用 sktime.registry.all_estimators 工具列出 sktime 中的所有分割器,使用 estimator_types="splitter",可选择按标签过滤。有效标签可以使用 sktime.registry.all_tags 列出。

估计器搜索页面上还可以找到一个带有基于标签搜索的完整表格(在“估计器类型”下拉列表中选择“splitter”)。

分割实用工具#

temporal_train_test_split 是一个快速实用函数,用于将单个时间序列分割成训练集和测试集。

对于对性能评估感兴趣的预测用户,建议使用完整回测而不是单次分割,例如通过 evaluate,详见预测 API 参考

temporal_train_test_split(y[, X, test_size, ...])

将时间序列数据容器分割为单个训练集/测试集。

时间索引分割器#

时间索引分割器按时间顺序分割一个或多个时间序列。它们通常用于预测器的评估和调优。它们具有标签 "split_type"="temporal"

CutoffSplitter(cutoffs[, fh, window_length])

截止窗口分割器。

SingleWindowSplitter(fh[, window_length])

单个窗口分割器。

SlidingWindowSplitter([fh, window_length, ...])

滑动窗口分割器。

ExpandingWindowSplitter([fh, ...])

扩展窗口分割器。

ExpandingCutoffSplitter(cutoff, fh, step_length)

用于时间序列数据的扩展截止分割器。

ExpandingGreedySplitter(test_size[, folds, ...])

逐次从序列末尾切分出测试折叠的分割器。

ExpandingSlidingWindowSplitter([fh, ...])

组合的扩展窗口和滑动窗口分割器。

TemporalTrainTestSplitter([train_size, ...])

基于训练集或测试集样本大小的时间序列训练-测试分割器。

时间索引分割器组合#

以下分割器是可用于创建更复杂基于时间索引的分割策略的组合。

Repeat(splitter[, times, mode, random_repeat])

向分割器添加重复,按元素或按序列。

SameLocSplitter(cv[, y_template])

复制另一个分割器的位置索引的分割器。

TestPlusTrainSplitter(cv)

将训练集添加到测试集的分割器。

实例分割器#

实例分割器按实例索引(即整个序列的标识符)分割面板或分层时间序列。训练集和测试集包含原始面板中的整个序列。实例分割器具有标签 "split_type"="instance"

InstanceSplitter(cv)

将 sklearn 实例分割器应用于时间序列面板的分割器。