添加新数据集#
要将新数据集添加到 sktime 内部数据集仓库中,请按照以下步骤进行
从你的
sktime本地仓库根目录,创建一个<dataset-name>文件夹mkdir ./datasets/data/<dataset-name>在上述目录中,添加你的数据集文件
<dataset-name>.<EXT>,其中<EXT>是文件扩展名支持的文件格式列表可在
sktime/MANIFEST.in文件中找到(例如,.csv,.txt)。如果你的文件格式
<EXT>不在该列表中,只需将其添加到sktime/MANIFEST.in文件中即可
"sktime/MANIFEST.in" ... recursive-include sktime/datasets *.csv ... *.<EXT> ...
在
sktime/datasets/_single_problem_loaders.py中,声明一个load_<dataset-name>(...)函数。你可以参考任何其他已声明的函数作为分类或回归数据集的模板。在
sktime/datasets/__init__.py中,将"load_<dataset-name>"追加到列表__all__中。在
sktime/datasets/setup.py中,将"<dataset-name>"追加到元组included_datasets中。