load_osuleaf#

load_osuleaf(split=None, return_X_y=True, return_type=None)[source]#

加载OSULeaf时间序列分类问题并返回 X 和 y。

参数::
split: None 或 “TRAIN”, “TEST” 之一,可选 (默认=None)

是否加载问题的训练集或测试集实例。默认加载训练集和测试集实例 (在一个容器中)。

return_X_y: bool,可选 (默认=True)

如果为 True,则分别返回 (特征, 目标),而不是包含特征和目标列的单个数据框。

return_type: 有效的 Panel mtype 字符串或 None,可选 (默认=None=”nested_univ”)

返回 X 的内存数据格式规范,None = “nested_univ” 类型。字符串可以是任何受支持的 sktime Panel mtype,

mtype 列表请参阅 datatypes.MTYPE_REGISTER,规范请参阅 examples/AA_datatypes_and_datasets.ipynb

常用规范

“nested_univ”: 嵌套的 pd.DataFrame,单元格为 pd.Series “numpy3D”/”numpy3d”/”np3D”: 三维 np.ndarray (实例,变量,时间索引) “numpy2d”/”np2d”/”numpyflat”: 二维 np.ndarray (实例,时间索引) “pd-multiindex”: 具有双层 (实例,时间) MultiIndex 的 pd.DataFrame

如果数据无法存储到请求的类型中,则会引发异常。

返回值::
X: sktime 数据容器,遵循 mtype 规范 return_type

问题的时序数据,包含 n 个实例

y: 长度为 n 的一维 numpy 数组,仅当 return_X_y 为 True 时返回

X 中每个时间序列实例的类别标签。如果 return_X_y 为 False,则 y 会附加到 X 中。

注释

维度: 单变量 序列长度: 427 训练用例: 200 测试用例: 242 类别数量: 6

OSULeaf数据集包含一维的叶子轮廓。这些序列是通过彩色图像分割和边界提取(逆时针方向)从六个类别的数字化叶子图像中获得的:Acer Circinatum, Acer Glabrum, Acer Macrophyllum, Acer Negundo, Quercus Garryana 和 Quercus Kelloggii,这是 A Grandhi 的硕士论文“基于内容的图像检索:植物物种识别”的一部分。

数据集详情: http://www.timeseriesclassification.com/description.php ?Dataset=OSULeaf

示例

>>> from sktime.datasets import load_osuleaf
>>> X, y = load_osuleaf()