分割器#
sktime.split
模块包含用于分割和重新采样数据的算法。
可以使用 sktime.registry.all_estimators
工具列出 sktime
中的所有分割器,使用 estimator_types="splitter"
,可选择按标签过滤。有效标签可以使用 sktime.registry.all_tags
列出。
在估计器搜索页面上还可以找到一个带有基于标签搜索的完整表格(在“估计器类型”下拉列表中选择“splitter”)。
分割实用工具#
temporal_train_test_split
是一个快速实用函数,用于将单个时间序列分割成训练集和测试集。
对于对性能评估感兴趣的预测用户,建议使用完整回测而不是单次分割,例如通过 evaluate
,详见预测 API 参考。
|
将时间序列数据容器分割为单个训练集/测试集。 |
时间索引分割器#
时间索引分割器按时间顺序分割一个或多个时间序列。它们通常用于预测器的评估和调优。它们具有标签 "split_type"="temporal"
。
|
截止窗口分割器。 |
|
单个窗口分割器。 |
|
滑动窗口分割器。 |
|
扩展窗口分割器。 |
|
用于时间序列数据的扩展截止分割器。 |
|
逐次从序列末尾切分出测试折叠的分割器。 |
|
组合的扩展窗口和滑动窗口分割器。 |
|
基于训练集或测试集样本大小的时间序列训练-测试分割器。 |
时间索引分割器组合#
以下分割器是可用于创建更复杂基于时间索引的分割策略的组合。
|
向分割器添加重复,按元素或按序列。 |
|
复制另一个分割器的位置索引的分割器。 |
将训练集添加到测试集的分割器。 |
实例分割器#
实例分割器按实例索引(即整个序列的标识符)分割面板或分层时间序列。训练集和测试集包含原始面板中的整个序列。实例分割器具有标签 "split_type"="instance"
。
|
将 sklearn 实例分割器应用于时间序列面板的分割器。 |