load_and_run_clustering_experiment#
- load_and_run_clustering_experiment(problem_path, results_path, dataset, clusterer, resample_id=0, cls_name=None, overwrite=False, format='.ts', train_file=False)[source]#
运行聚类实验。
运行基本实验并将结果写入名为 testFold<resampleID>.csv 的文件,如果需要,还会写入 trainFold<resampleID>.csv。此版本根据路径从文件加载数据。聚类器始终在
- 参数:
- problem_pathstr
问题文件的位置,完整路径。
- results_pathstr
结果写入的位置。将创建所有必需的目录
- datasetstr
问题的名称。文件必须是 <problem_path>/<dataset>/<dataset>+ “_TRAIN”+格式,以及对应的 “_TEST” 文件。
- clusterer聚类器
- cls_namestr, 默认值 =None
确定写入目录的名称。如果为 None,则设置为 type(clusterer).__name__
- resample_idint, 默认值 = 0
重新采样种子。如果设置为 0,则使用文件中的默认训练/测试分割。也用于输出文件名。
- overwriteboolean, 默认值 = False
如果为 False,则仅在结果文件尚不存在时构建结果。如果为 True,则会覆盖已有的任何内容。
- format: string, 默认值 = “.ts”
有效格式包括 “.ts”, “.arff”, “.tsv” 和 “.long”。有关格式的更多信息,请参阅 examples/loading_data.ipynb
- train_file: boolean, 默认值 = False
是否生成训练文件。如果为 True,则对训练数据执行 10 折交叉验证并保存