load_basic_motions#

load_basic_motions(split=None, return_X_y=True, return_type=None)[源码]#

加载 BasicMotions 时间序列分类问题并返回 X 和 y。

这是一个等长的多元时间序列分类问题。它加载一个 4 类分类问题,其中样本数量 n = 80(如果 split 为 None)或 40(如果 split 为“train”/“test”),序列长度 m = 100。

参数:
split: None 或以下之一:“TRAIN”, “TEST”,可选 (默认=None)

是否加载问题的训练集或测试集实例。默认情况下,它加载训练集和测试集实例(在一个容器中)。

return_X_y: bool,可选 (默认=True)

如果为 True,则分别返回 (features, target),而不是返回一个包含 features 和 target 列的单个 dataframe。

return_type: 有效的 Panel mtype 字符串 或 None,可选 (默认=None=”nested_univ”)

返回 X 的内存数据格式规范,None = “nested_univ” 类型。字符串可以是任何受支持的 sktime Panel mtype,

mtype 列表请参阅 datatypes.MTYPE_REGISTER,规范请参阅 examples/AA_datatypes_and_datasets.ipynb

常用规范

“nested_univ”: 嵌套的 pd.DataFrame,单元格中包含 pd.Series “numpy3D”/”numpy3d”/”np3D”: 3D np.ndarray(实例,变量,时间索引) “numpy2d”/”np2d”/”numpyflat”: 2D np.ndarray(实例,时间索引) “pd-multiindex”: 带有 2 级(实例,时间)MultiIndex 的 pd.DataFrame

如果数据无法存储在请求的类型中,则会引发异常。

返回:
X: sktime 数据容器,遵循 mtype 规范 return_type

问题的时序数据,包含 n 个实例

y: 长度为 n 的一维 numpy 数组,仅在 return_X_y 为 True 时返回

X 中每个时间序列实例的类标签。如果 return_X_y 为 False,y 会被附加到 X。

抛出:
如果将参数 “numpy2d”/”numpyflat” 作为 return_type 传入,则抛出 ValueError

注意

维度: 多元,6 序列长度: 100 训练集样本: 40 测试集样本: 40 类别数量: 4

该数据是在一个学生项目中生成的,四个学生佩戴智能手表进行了四种活动。手表收集了 3D 加速度计和 3D 陀螺仪数据。它包含四个类别:步行、休息、跑步和羽毛球。参与者被要求总共记录五次运动,数据每十分之一秒采样一次,持续十秒。

数据集详情: http://www.timeseriesclassification.com/description.php?Dataset =BasicMotions