添加新数据集#
要将新数据集添加到 sktime
内部数据集仓库中,请按照以下步骤进行
从你的
sktime
本地仓库根目录,创建一个<dataset-name>
文件夹mkdir ./datasets/data/<dataset-name>
在上述目录中,添加你的数据集文件
<dataset-name>.<EXT>
,其中<EXT>
是文件扩展名支持的文件格式列表可在
sktime/MANIFEST.in
文件中找到(例如,.csv
,.txt
)。如果你的文件格式
<EXT>
不在该列表中,只需将其添加到sktime/MANIFEST.in
文件中即可
"sktime/MANIFEST.in" ... recursive-include sktime/datasets *.csv ... *.<EXT> ...
在
sktime/datasets/_single_problem_loaders.py
中,声明一个load_<dataset-name>(...)
函数。你可以参考任何其他已声明的函数作为分类或回归数据集的模板。在
sktime/datasets/__init__.py
中,将"load_<dataset-name>"
追加到列表__all__
中。在
sktime/datasets/setup.py
中,将"<dataset-name>"
追加到元组included_datasets
中。