load_tecator
#
- load_tecator(split=None, return_X_y=True, return_type=None, y_dtype='float')[source]#
加载 Tecator 时间序列回归问题并返回 X 和 y。
- 参数:
- split: None 或 “TRAIN”, “TEST” 之一, 可选 (默认=None)
是否加载问题的训练集或测试集实例。默认加载训练集和测试集实例(在一个容器中)。
- return_X_y: bool, 可选 (默认=True)
如果为 True,则单独返回 (特征, 目标),而不是一个包含特征和目标列的单个 DataFrame。
- return_type: 有效的 Panel mtype 字符串或 None, 可选 (默认=None=”nested_univ”)
返回 X 的内存数据格式规范, None = “nested_univ” 类型。字符串可以是任何支持的 sktime Panel mtype,
mtype 列表请参阅 datatypes.MTYPE_REGISTER,规范请参阅 examples/AA_datatypes_and_datasets.ipynb
- 常用规范
“nested_univ: 嵌套的 pd.DataFrame, 单元格中为 pd.Series “numpy3D”/”numpy3d”/”np3D”: 3D np.ndarray (实例, 变量, 时间索引) “numpy2d”/”np2d”/”numpyflat”: 2D np.ndarray (实例, 时间索引) “pd-multiindex”: 带有 2 级 (实例, 时间) MultiIndex 的 pd.DataFrame
如果数据无法存储在请求的类型中,则会引发异常。y_dtype: float, 可选(默认=’float’) 目标变量的数据类型。
- 返回值:
- X: sktime 数据容器, 遵循 mtype 规范
return_type
问题的时序数据, 包含 n 个实例
- y: 长度为 n 的 1D numpy 数组, 仅当 return_X_y 为 True 时返回
X 中每个时序实例的目标值。如果 return_X_y 为 False,则将 y 附加到 X 中。
- X: sktime 数据容器, 遵循 mtype 规范
说明
维度: 单变量 序列长度: 100 训练用例: 172 测试用例: 43
- 此数据集的目的是基于肉类的近红外吸收光谱测量其脂肪含量。
吸收光谱在 850 nm 到 1050 nm 的波长范围内测量。脂肪含量通过标准化学分析方法测量。数据集包含 215 个肉类样本,每个样本有 100 个光谱测量值。更多信息请参见:https://www.openml.org/search?type=data&sort=runs&id=505&status=active
吸收光谱在 850 nm 到 1050 nm 的波长范围内测量。脂肪含量通过标准化学分析方法测量。数据集包含 215 个肉类样本,每个样本有 100 个光谱测量值。更多信息请参阅:https://www.openml.org/search?type=data&sort=runs&id=505&status=active
参考文献
[1] C.Borggaard and H.H.Thodberg, “Optimal Minimal Neural Interpretation of Spectra” , Analytical Chemistry 64 (1992), p 545-551. [2] H.H.Thodberg, “Ace of Bayes: Application of Neural Networks with Pruning” Manuscript 1132, Danish Meat Research Institute (1993), p 1-12.
示例
>>> from sktime.datasets import load_tecator >>> X, y = load_tecator()