load_arrow_head#

load_arrow_head(split=None, return_X_y=True, return_type=None)[source]#

加载 ArrowHead 时间序列分类问题并返回 X 和 y。

参数:
split: None 或 “TRAIN”, “TEST” 之一, 可选 (默认=None)

是否加载问题的训练集或测试集实例。默认情况下加载所有训练集和测试集实例(在一个容器中)。

return_X_y: bool, 可选 (默认=True)

如果为 True,则分别返回 (features, target),而不是返回一个包含特征和目标列的单一 dataframe。

return_type: 有效的 Panel mtype 字符串 或 None, 可选 (默认=None=”nested_univ”)

返回 X 的内存数据格式规范,None = “nested_univ” 类型。字符串可以是任何支持的 sktime Panel mtype,

mtypes 列表请参见 datatypes.MTYPE_REGISTER,规范请参见 examples/AA_datatypes_and_datasets.ipynb

常用的规范

“nested_univ: 嵌套的 pd.DataFrame,单元格中是 pd.Series “numpy3D”/”numpy3d”/”np3D”: 3D np.ndarray (实例,变量,时间索引) “numpy2d”/”np2d”/”numpyflat”: 2D np.ndarray (实例,时间索引) “pd-multiindex”: 具有 2 级 (实例, 时间) MultiIndex 的 pd.DataFrame

如果数据无法存储在请求的类型中,则会引发异常。

返回:
X: sktime 数据容器,遵循 return_type 的 mtype 规范

问题的时间序列数据,包含 n 个实例

y: 长度为 n 的 1D numpy array,仅在 return_X_y 为 True 时返回

X 中每个时间序列实例的类别标签。如果 return_X_y 为 False,则 y 将追加到 X 中。

注意

维度:单变量 序列长度:251 训练案例:36 测试案例:175 类别数量:3

ArrowHead 数据包含箭头图像的轮廓。投射点的形状使用基于角度的方法转换为时间序列。投射点的分类是人类学中的重要课题。类别基于形状区别,例如箭头中缺口的出现和位置。仓库中的问题是 Ye09shapelets 中使用的长度归一化版本。这三个类别被称为“Avonlea”、“Clovis”和“Mix”。

数据集详情: http://timeseriesclassification.com/description.php ?Dataset=ArrowHead

示例

>>> from sktime.datasets import load_arrow_head
>>> X, y = load_arrow_head()