load_and_run_classification_experiment#
- load_and_run_classification_experiment(problem_path, results_path, dataset, classifier, resample_id=0, cls_name=None, overwrite=False, build_train=False, predefined_resample=False)[source]#
加载数据集并运行分类实验。
用于运行基本实验并将结果写入名为 testFold<resampleID>.csv 的文件,如果需要,还写入 trainFold<resampleID>.csv 文件的方法。
- 参数:
- problem_pathstr
问题文件位置,完整路径。
- results_pathstr
结果写入位置。将创建任何所需的目录。
- datasetstr
问题名称。文件必须是 <problem_path>/<dataset>/<dataset>+”_TRAIN.ts”,”_TEST” 文件也一样。
- classifierBaseClassifier
实验中使用的分类器,如果未提供,则使用 cls_name 并以 resample_id 作为种子选择一个分类器。
- cls_namestr, default = None
写入结果时使用的分类器名称。如果未指定,则从分类器本身获取名称。
- resample_idint, default=0
重采样种子。如果设置为 0,则使用文件中的默认训练/测试划分。也用于输出文件名。
- overwritebool, default=False
如果设置为 False,则仅在结果文件不存在时才生成结果。如果设置为 True,则会覆盖已有的任何内容。
- build_trainbool, default=False
是否生成训练文件。如果为 True,则在训练数据上执行 10 折交叉验证并保存。如果分类器可以生成自己的估计结果,则使用这些结果代替。
- predefined_resamplebool, default=False
从文件读取预定义的重采样,而不是执行重采样。如果为 True,文件格式必须在数据集名称末尾包含 resample_id,即 <problem_path>/<dataset>/<dataset>+<resample_id>+”_TRAIN.ts”。